世界模型的兴起:人工智能发展的范式转变

1–2 minutes

想象一下,人工智能系统不仅能够处理和生成文本,还能理解并与之互动,共建一个全新的世界。欢迎来到世界模型时代,人工智能正从预测语言模式转向模拟真实世界环境。著名人工智能专家 Yann LeCun 刚刚离开 Meta 公司,斥资 5 亿欧元投资于能够理解物理而非语言的人工智能。他的初创公司 AMI Labs 正在以 30 亿欧元的估值进行融资,目标应用领域包括机器人、自动驾驶汽车和空间推理。

## 世界模型革命

世界模型是一种神经网络,它通过观看视频、处理模拟数据和吸收空间输入来学习物理世界的运作方式。与擅长统计文本模式的语言模型不同,世界模型模拟的是物理过程。关键区别在于其架构,该架构分为三个部分:视觉编码器、循环神经网络和控制器。这种架构的样本效率比传统的强化学习高 50 到 100 倍。

业界精英已从大型语言模型转向世界模型。李飞飞于去年11月推出了一款商业化的世界模型,而General Intuition则获得了1.34亿美元的种子轮融资。谷歌DeepMind于去年8月发布了Genie 3,它能够以每秒24帧的速度,在720p分辨率下,根据文本提示生成交互式3D环境。LeCun的AMI Labs的目标是打造估值达到30亿欧元的AI系统,这些系统能够“理解物理定律、保持持久记忆并规划复杂动作”。

## 2026年展望

LeCun的AMI Labs将由健康科技初创公司Nabla的创始人Alexandre LeBrun担任首席执行官。公司总部将于今年年初在巴黎成立。该公司专注于世界模型,标志着其发展方向与Meta转向基于LLM的模型截然不同。LeCun认为,未来十年属于那些能够模拟世界而非概括世界的系统。李飞飞的World Labs推出的Marble是首款商业化的世界模型产品。它可生成与虚幻引擎和Unity兼容的可下载3D环境,价格从免费起,最高可达每月95美元,包含75代生成权限,并附带商业授权。

## 范式转变已至

四大巨头已进军世界模型领域,资金已锁定。商业产品已面世,API也已开放。World Labs的Marble提供免费的实验版本,而NVIDIA的API目录则提供对世界基础模型的访问。模型上下文协议(Model Context Protocol)拥有10,000个已发布的服务器,可将AI代理连接到外部工具。应用场景正在迅速涌现:机器人团队需要空间规划,自动驾驶汽车工程师需要场景理解,游戏开发者则希望实现程序化3D世界生成。所有这些团队都将在2026年采用世界模型,而不是更晚。LeCun预测,世界模型将在三到五年内主导AI架构。商业产品已面世,资金已锁定。竞争已经打响。

Asset Management AI Betting AI Generative AI GPT Horse Racing Prediction AI Medical AI Perplexity Comet AI Semiconductor AI Sora AI Stable Diffusion UX UI Design AI