人工智慧競賽愈演愈烈：Google的Gemini 3與xAI的Grok 4.1爭奪霸主地位

人工智慧世界永不停歇！稍不留神，你可能就會錯過一些重大發布。本週，兩大科技巨頭Google和xAI發布了各自的最新人工智慧模型，一場爭奪人工智慧霸主地位的激烈競爭即將上演。讓我們一起來看看！

## 谷歌發布Gemini 3

谷歌發布了其人工智慧模型的最新版本——Gemini 3，可謂是投下了一顆重磅炸彈。該模型已在Google搜尋的AI模式、Gemini應用程式和開發者平台上全面推出。 Google宣稱Gemini 3是迄今為止最強大的多模態模型，基於尖端的推理能力建構而成。想像一下更豐富的視覺效果、更深層的互動以及強大的智能體功能。

基準測試已經顯示，Gemini 3的性能超越了其前代產品Gemini 2.5 Pro。它甚至以 1501 Elo 的高分榮登 LMArena 排行榜榜首，展現了其在“人類最後的考試”（Humanity’s Last Exam）和 GPQA Diamond 等測試中所需的卓越推理能力。

谷歌還聲稱，Gemini 3 能夠從簡短的提示中準確理解上下文和意圖，透過提供簡潔直接的回复，扮演「思考夥伴」的角色。更強大的「Gemini 3 深度思考」模式專為解決複雜問題而設計，即將推出 Google AI Ultra 訂閱用戶。

## xAI 推出 Grok 4.1

不甘示弱的伊隆馬斯克旗下的 xAI 發布了其人工智慧模型的最新版本 Grok 4.1。所有用戶現在都可以透過 Grok 網頁版、X 以及 iOS/Android 應用程式使用該版本。

Grok 4.1 旨在「創造性、情感性和協作性互動」方面表現卓越。 xAI 在開發過程中著重優化了風格、個性、實用性和一致性。該公司還聲稱，在64.78%的盲測中，Grok 4.1 的表現優於其前代產品。

「Grok 4.1 Thinking」曾短暫登上 LMArena Text Arena 排行榜榜首，Elo 得分高達 1483 分，之後被谷歌的 Gemini 3 超越。 xAI 也聲稱，Grok 4.1 減少了幻覺的發生。在基準測試中，與 Grok 4 Fast 相比，非推理模式下的幻覺減少了約 65%。

人工智慧競賽愈演愈烈：Google的Gemini 3與xAI的Grok 4.1爭奪霸主地位

Related posts: