人工智慧競賽愈演愈烈:Google的Gemini 3與xAI的Grok 4.1爭奪霸主地位

1–2 minutes

人工智慧世界永不停歇!稍不留神,你可能就會錯過一些重大發布。本週,兩大科技巨頭Google和xAI發布了各自的最新人工智慧模型,一場爭奪人工智慧霸主地位的激烈競爭即將上演。讓我們一起來看看!

## 谷歌發布Gemini 3

谷歌發布了其人工智慧模型的最新版本——Gemini 3,可謂是投下了一顆重磅炸彈。該模型已在Google搜尋的AI模式、Gemini應用程式和開發者平台上全面推出。 Google宣稱Gemini 3是迄今為止最強大的多模態模型,基於尖端的推理能力建構而成。想像一下更豐富的視覺效果、更深層的互動以及強大的智能體功能。

基準測試已經顯示,Gemini 3的性能超越了其前代產品Gemini 2.5 Pro。它甚至以 1501 Elo 的高分榮登 LMArena 排行榜榜首,展現了其在“人類最後的考試”(Humanity’s Last Exam)和 GPQA Diamond 等測試中所需的卓越推理能力。

谷歌還聲稱,Gemini 3 能夠從簡短的提示中準確理解上下文和意圖,透過提供簡潔直接的回复,扮演「思考夥伴」的角色。更強大的「Gemini 3 深度思考」模式專為解決複雜問題而設計,即將推出 Google AI Ultra 訂閱用戶。

## xAI 推出 Grok 4.1

不甘示弱的伊隆馬斯克旗下的 xAI 發布了其人工智慧模型的最新版本 Grok 4.1。所有用戶現在都可以透過 Grok 網頁版、X 以及 iOS/Android 應用程式使用該版本。

Grok 4.1 旨在「創造性、情感性和協作性互動」方面表現卓越。 xAI 在開發過程中著重優化了風格、個性、實用性和一致性。該公司還聲稱,在64.78%的盲測中,Grok 4.1 的表現優於其前代產品。

「Grok 4.1 Thinking」曾短暫登上 LMArena Text Arena 排行榜榜首,Elo 得分高達 1483 分,之後被谷歌的 Gemini 3 超越。 xAI 也聲稱,Grok 4.1 減少了幻覺的發生。在基準測試中,與 Grok 4 Fast 相比,非推理模式下的幻覺減少了約 65%。

Asset Management AI Betting AI Generative AI GPT Medical AI Perplexity Comet AI Semiconductor AI Sora AI Stable Diffusion UX UI Design AI