人工智能世界永不停歇!稍不留神,你可能就会错过一些重大发布。本周,两大科技巨头谷歌和xAI发布了各自的最新人工智能模型,一场争夺人工智能霸主地位的激烈角逐即将上演。让我们一起来看看!
## 谷歌发布Gemini 3
谷歌发布了其人工智能模型的最新版本——Gemini 3,可谓是投下了一颗重磅炸弹。该模型已在谷歌搜索的AI模式、Gemini应用程序和开发者平台上全面推出。谷歌宣称Gemini 3是迄今为止最强大的多模态模型,基于尖端的推理能力构建而成。想象一下更丰富的视觉效果、更深层次的交互以及强大的智能体功能。
基准测试已经显示,Gemini 3的性能超越了其前代产品Gemini 2.5 Pro。它甚至以 1501 Elo 的高分荣登 LMArena 排行榜榜首,展现了其在“人类最后的考试”(Humanity’s Last Exam)和 GPQA Diamond 等测试中所需的卓越推理能力。
谷歌还声称,Gemini 3 能够从简短的提示中准确理解上下文和意图,通过提供简洁直接的回复,扮演“思考伙伴”的角色。功能更强大的“Gemini 3 深度思考”模式专为解决复杂问题而设计,即将面向 Google AI Ultra 订阅用户推出。
## xAI 推出 Grok 4.1
不甘示弱的埃隆·马斯克旗下的 xAI 发布了其人工智能模型的最新版本 Grok 4.1。所有用户现在都可以通过 Grok 网页版、X 以及 iOS/Android 应用使用该版本。
Grok 4.1 旨在“创造性、情感性和协作性互动”方面表现卓越。xAI 在开发过程中着重优化了风格、个性、实用性和一致性。该公司还声称,在64.78%的盲测中,Grok 4.1 的表现优于其前代产品。
“Grok 4.1 Thinking”曾短暂登上 LMArena Text Arena 排行榜榜首,Elo 得分高达 1483 分,之后被谷歌的 Gemini 3 超越。xAI 还声称,Grok 4.1 减少了幻觉的发生。在基准测试中,与 Grok 4 Fast 相比,非推理模式下的幻觉减少了约 65%。




