世界模型的興起:人工智慧發展的典範轉移

1–2 minutes

想像一下,人工智慧系統不僅能夠處理和生成文本,還能理解並與之互動,共建一個全新的世界。歡迎來到世界模型時代,人工智慧正從預測語言模式轉向模擬真實世界環境。著名人工智慧專家 Yann LeCun 剛離開 Meta 公司,斥資 5 億歐元投資於能夠理解物理而非語言的人工智慧。他的新創公司 AMI Labs 正在以 30 億歐元的估值進行融資,目標應用領域包括機器人、自動駕駛汽車和空間推理。

## 世界模型革命

世界模型是一種神經網絡,它透過觀看影片、處理模擬數據和吸收空間輸入來學習物理世界的運作方式。與擅長統計文本模式的語言模型不同,世界模型模擬的是物理過程。關鍵區別在於其架構,該架構分為三個部分:視覺編碼器、循環神經網路和控制器。這種架構的樣本效率比傳統的強化學習高 50 到 100 倍。

業界菁英已從大型語言模型轉向世界模型。李飛飛於去年11月推出了一款商業化的世界模型,而General Intuition則獲得了1.34億美元的種子輪融資。 GoogleDeepMind於去年8月發布了Genie 3,它能夠以每秒24幀的速度,在720p解析度下,根據文字提示產生互動式3D環境。 LeCun的AMI Labs的目標是打造估值達到30億歐元的AI系統,這些系統能夠「理解物理定律、保持持久記憶並規劃複雜動作」。

## 2026年展望

LeCun的AMI Labs將由健康科技新創公司Nabla的創辦人Alexandre LeBrun擔任執行長。公司總部將於今年初在巴黎成立。該公司專注於世界模型,標誌著其發展方向與Meta轉向基於LLM的模型截然不同。 LeCun認為,未來十年屬於那些能夠模擬世界而非概括世界的系統。李飛飛的World Labs推出的Marble是首款商業化的世界模型產品。它可產生與虛幻引擎和Unity相容的可下載3D環境,價格從免費起,最高可達每月95美元,包含75代生成權限,並附帶商業授權。

## 範式轉移已至

四大巨頭已進軍世界模型領域,資金鎖定。商業產品已面世,API也已開放。 World Labs的Marble提供免費的實驗版本,而NVIDIA的API目錄則提供對世界基礎模型的存取。模型上下文協定(Model Context Protocol)擁有10,000個已發布的伺服器,可將AI代理連接到外部工具。應用場景正在迅速湧現:機器人團隊需要空間規劃,自動駕駛汽車工程師需要場景理解,遊戲開發者則希望實現程式化3D世界生成。所有這些團隊都將在2026年採用世界模型,而不是更晚。 LeCun預測,世界模型將在三到五年內主導AI架構。商業產品已面世,資金鎖定。競爭已經打響。

Asset Management AI Betting AI Generative AI GPT Horse Racing Prediction AI Medical AI Perplexity Comet AI Semiconductor AI Sora AI Stable Diffusion UX UI Design AI