人工智慧 (AI) 領域近日因 OpenAI 與 Cerebras Systems 達成價值 100 億美元的合作協議而沸騰。這項意義重大的交易標誌著 AI 基礎設施的設計和部署方式發生了重大轉變,尤其是在即時對話式 AI 領域。
## AI 推理的新時代
AI 推理的核心是利用預訓練模型產生對使用者輸入的回應。它是語音 AI、詐欺偵測和互動式代理等即時應用的關鍵組成部分。然而,目前基於 GPU 的系統受限於記憶體頻寬瓶頸,導致延遲問題,阻礙了其廣泛應用。
Cerebras 的晶圓級引擎 (WSE-3) 架構旨在正面解決此問題。透過將 90 萬個 AI 核心和 4 兆個電晶體整合到單一矽晶圓上,Cerebras 打造了一個比傳統 GPU 系統快 2.5 到 21 倍的推理平台。 WSE-3 晶片的超大片上 SRAM 容量使其無需外部記憶體,從而降低了延遲,實現了這一目標。
## 100 億美元押注推理
OpenAI 對 Cerebras 的 100 億美元投資不僅是一項策略性投資,更是對人工智慧推理未來的一次押注。透過分散基礎設施風險並優化推理經濟效益,OpenAI 正在為在快速發展的人工智慧領域取得成功做好準備。透過這項交易,OpenAI 將在 2028 年前獲得 750 兆瓦的人工智慧推理運算能力,實現低於 100 毫秒的即時應用延遲。
## 專用架構的崛起
人工智慧晶片市場正在經歷一場重大變革,像 Cerebras 的 WSE-3 這樣的專用架構在推理領域正獲得越來越多的關注。到 2026 年,推理支出將佔人工智慧運算市場的三分之二,預計到 2030 年,這些架構將佔據 15% 至 25% 的市場份額。儘管英偉達仍然是人工智慧晶片領域的領導者,但其 95% 的市場份額在推理領域正面臨著真正的競爭。
總之,OpenAI 與 Cerebras 達成的 100 億美元合作標誌著人工智慧推理進入了一個新時代,其重點在於開發性能提升 250 至 21 倍的專用架構。隨著人工智慧格局的不斷演變,有一點是毋庸置疑的:即時人工智慧的未來正在矽晶片上書寫,而 Cerebras 正處於這場變革的最前沿。




