AI 세계는 잠들지 않습니다! 눈 깜빡할 사이에 중요한 발표들을 놓쳤을지도 모릅니다. 이번 주, 두 거대 기술 기업인 구글과 xAI가 최신 AI 모델을 공개하며 인공지능 패권을 놓고 치열한 경쟁을 예고했습니다. 자세히 살펴보겠습니다!
## 구글, 제미니 3 출시
구글은 최신 AI 모델인 제미니 3를 발표하며 큰 화제를 모았습니다. 제미니 3는 구글 검색의 AI 모드, 제미니 앱, 그리고 개발자 플랫폼에 순차적으로 적용될 예정입니다. 구글은 제미니 3를 최첨단 추론 기술을 기반으로 구축된, 지금까지 출시된 모델 중 가장 강력한 멀티모달 모델이라고 강조합니다. 더욱 풍부한 시각적 요소, 심층적인 상호작용, 그리고 강력한 에이전트 기능을 기대할 수 있습니다.
벤치마크 테스트 결과, 제미니 3는 이미 이전 버전인 제미니 2.5 Pro를 능가하는 성능을 보여주고 있습니다. 심지어 LMArena 리더보드에서 1501 Elo 점수로 1위를 차지하며, 인류 최후의 시험(Humanity’s Last Exam)이나 GPQA Diamond와 같은 테스트에 필요한 고급 추론 능력을 입증했습니다.
구글은 또한 Gemini 3가 짧은 프롬프트에서도 문맥과 의도를 정확하게 파악하여 간결하고 직접적인 답변을 제공하는 “사고 파트너” 역할을 할 수 있다고 주장합니다. 복잡한 문제 해결을 위해 설계된 더욱 강력한 “Gemini 3 Deep Think” 모드는 Google AI Ultra 구독자에게 곧 제공될 예정입니다.
## xAI, Grok 4.1로 반격에 나서다
일론 머스크의 xAI도 이에 질세라 최신 AI 모델인 Grok 4.1을 공개했습니다. Grok 웹 버전, X, iOS/Android 앱에서 지금 바로 이용할 수 있습니다.
Grok 4.1은 “창의적이고 감성적이며 협력적인 상호작용”에 탁월하도록 설계되었습니다. xAI는 개발 과정에서 스타일, 개성, 유용성, 그리고 조화에 중점을 두었습니다. 또한, 이 회사는 블라인드 테스트에서 Grok 4.1이 이전 모델보다 64.78% 더 선호되었다고 주장합니다.
“Grok 4.1 Thinking”은 LMArena Text Arena 리더보드에서 1483 Elo 점수로 잠시 1위를 차지했지만, 이후 Google의 Gemini 3에 추월당했습니다. xAI는 Grok 4.1에서 환각 현상을 줄였다고도 밝혔습니다. 비추론 모드는 벤치마크 테스트에서 Grok 4 Fast에 비해 환각 현상이 약 65% 감소했습니다.




