OpenAI斥资100亿美元打造Cerebras:革新实时人工智能推理

1–2 minutes

人工智能 (AI) 领域近日因 OpenAI 与 Cerebras Systems 达成价值 100 亿美元的合作协议而沸腾。这项意义重大的交易标志着 AI 基础设施的设计和部署方式发生了重大转变,尤其是在实时对话式 AI 领域。

## AI 推理的新时代

AI 推理的核心是利用预训练模型生成对用户输入的响应。它是语音 AI、欺诈检测和交互式代理等实时应用的关键组成部分。然而,目前基于 GPU 的系统受限于内存带宽瓶颈,导致延迟问题,阻碍了其广泛应用。

Cerebras 的晶圆级引擎 (WSE-3) 架构旨在正面解决这一问题。通过将 90 万个 AI 核心和 4 万亿个晶体管集成到单个硅晶圆上,Cerebras 打造了一个比传统 GPU 系统快 2.5 到 21 倍的推理平台。 WSE-3 芯片的超大片上 SRAM 容量使其无需外部存储器,从而降低了延迟,实现了这一目标。

## 100 亿美元押注推理

OpenAI 对 Cerebras 的 100 亿美元投资不仅仅是一项战略投资,更是对人工智能推理未来的一次押注。通过分散基础设施风险并优化推理经济效益,OpenAI 正在为在快速发展的人工智能领域取得成功做好准备。通过这项交易,OpenAI 将在 2028 年前获得 750 兆瓦的人工智能推理计算能力,从而实现低于 100 毫秒的实时应用延迟。

## 专用架构的崛起

人工智能芯片市场正在经历一场重大变革,像 Cerebras 的 WSE-3 这样的专用架构在推理领域正获得越来越多的关注。到 2026 年,推理支出将占人工智能计算市场的三分之二,预计到 2030 年,这些架构将占据 15% 至 25% 的市场份额。尽管英伟达仍然是人工智能芯片领域的领军企业,但其 95% 的市场份额在推理领域正面临着真正的竞争。

总之,OpenAI 与 Cerebras 达成的 100 亿美元合作标志着人工智能推理进入了一个新时代,其重点在于开发性能提升 2.5 至 21 倍的专用架构。随着人工智能格局的不断演变,有一点是毋庸置疑的:实时人工智能的未来正在硅芯片上书写,而 Cerebras 正处于这场变革的最前沿。

Asset Management AI Betting AI Generative AI GPT Horse Racing Prediction AI Medical AI Perplexity Comet AI Semiconductor AI Sora AI Stable Diffusion UX UI Design AI