人工智能竞赛愈演愈烈：谷歌的Gemini 3与xAI的Grok 4.1争夺霸主地位

人工智能世界永不停歇！稍不留神，你可能就会错过一些重大发布。本周，两大科技巨头谷歌和xAI发布了各自的最新人工智能模型，一场争夺人工智能霸主地位的激烈角逐即将上演。让我们一起来看看！

## 谷歌发布Gemini 3

谷歌发布了其人工智能模型的最新版本——Gemini 3，可谓是投下了一颗重磅炸弹。该模型已在谷歌搜索的AI模式、Gemini应用程序和开发者平台上全面推出。谷歌宣称Gemini 3是迄今为止最强大的多模态模型，基于尖端的推理能力构建而成。想象一下更丰富的视觉效果、更深层次的交互以及强大的智能体功能。

基准测试已经显示，Gemini 3的性能超越了其前代产品Gemini 2.5 Pro。它甚至以 1501 Elo 的高分荣登 LMArena 排行榜榜首，展现了其在“人类最后的考试”（Humanity’s Last Exam）和 GPQA Diamond 等测试中所需的卓越推理能力。

谷歌还声称，Gemini 3 能够从简短的提示中准确理解上下文和意图，通过提供简洁直接的回复，扮演“思考伙伴”的角色。功能更强大的“Gemini 3 深度思考”模式专为解决复杂问题而设计，即将面向 Google AI Ultra 订阅用户推出。

## xAI 推出 Grok 4.1

不甘示弱的埃隆·马斯克旗下的 xAI 发布了其人工智能模型的最新版本 Grok 4.1。所有用户现在都可以通过 Grok 网页版、X 以及 iOS/Android 应用使用该版本。

Grok 4.1 旨在“创造性、情感性和协作性互动”方面表现卓越。xAI 在开发过程中着重优化了风格、个性、实用性和一致性。该公司还声称，在64.78%的盲测中，Grok 4.1 的表现优于其前代产品。

“Grok 4.1 Thinking”曾短暂登上 LMArena Text Arena 排行榜榜首，Elo 得分高达 1483 分，之后被谷歌的 Gemini 3 超越。xAI 还声称，Grok 4.1 减少了幻觉的发生。在基准测试中，与 Grok 4 Fast 相比，非推理模式下的幻觉减少了约 65%。

人工智能竞赛愈演愈烈：谷歌的Gemini 3与xAI的Grok 4.1争夺霸主地位

Related posts: