AI競争が激化：GoogleのGemini 3とxAIのGrok 4.1の覇権争い

AIの世界は眠らない！もしあなたが瞬きをしていたなら、いくつかの重要な発表を見逃していたかもしれません。今週、二大テクノロジー企業であるGoogleとxAIが最新のAIモデルを発表し、人工知能（AI）の覇権をめぐる白熱の対決の火蓋を切りました。さあ、見ていきましょう！

## Google、Gemini 3を発表

Googleは、AIモデルの最新版となるGemini 3を発表し、衝撃的なニュースを放ちました。これは、Google検索のAIモード、Geminiアプリ、そして開発者プラットフォームに展開されます。Googleは、Gemini 3を最先端の推論機能に基づき構築された、これまでで最も強力なマルチモーダルモデルだと宣伝しています。より豊かなビジュアル、より深いインタラクション、そして強力なエージェント機能を想像してみてください。

ベンチマークでは、Gemini 3が既に前身のGemini 2.5 Proを上回っていることが示されています。 LMArenaのリーダーボードでは1501 Eloスコアでトップに立ち、Humanity’s Last ExamやGPQA Diamondなどの試験で求められる高度な推論能力を披露しました。

Googleはまた、Gemini 3は短いプロンプトからでも文脈と意図を正確に理解し、簡潔で直接的な回答を提供することで「思考パートナー」として機能すると主張しています。複雑な問題解決向けに設計された、さらに強力な「Gemini 3 Deep Think」モードは、Google AI Ultraサブスクリプションメンバー向けにまもなく提供されます。

## xAIがGrok 4.1で反撃

負けじと、イーロン・マスクのxAIはAIモデルの最新バージョンであるGrok 4.1を発表しました。これは、GrokのWeb版、X、iOS/Androidアプリですべてのユーザーが利用できるようになりました。

Grok 4.1は、「創造的、感情的、そして協調的なインタラクション」において卓越した成果を上げることを目指しています。xAIは、開発段階において、スタイル、個性、有用性、そして整合性の最適化を重視しました。同社はまた、Grok 4.1がブラインドテストの64.78%で旧モデルよりも優れていると主張しています。

「Grok 4.1 Thinking」は、LMArena Text Arenaのリーダーボードで1483 Eloのスコアで一時的にトップの座を獲得しましたが、その後GoogleのGemini 3に追い抜かれました。xAIはまた、Grok 4.1の幻覚現象を軽減したと主張しています。ベンチマークテストでは、非推論モードではGrok 4 Fastと比較して約65%の幻覚現象の軽減を達成しました。

AI競争が激化：GoogleのGemini 3とxAIのGrok 4.1の覇権争い

Related posts: