오픈AI, 실리콘 밸리에서 음성 제어 미래를 향해 스크린을 버리다

1–2 minutes

OpenAI는 오디오 AI에 막대한 투자를 하고 있으며, 이는 단순히 ChatGPT의 음질을 개선하는 데 그치지 않습니다. The Information의 새로운 보도에 따르면, OpenAI는 지난 두 달 동안 여러 엔지니어링, 제품 및 연구 팀을 통합하여 오디오 모델을 전면 개편했으며, 이는 약 1년 후 출시 예정인 오디오 중심의 개인용 기기 개발을 위한 준비 작업입니다.

이러한 움직임은 전체 기술 산업이 나아가고 있는 방향, 즉 화면이 배경 소음이 되고 오디오가 중심이 되는 미래를 반영합니다. 스마트 스피커 덕분에 음성 비서는 이미 미국 가정의 3분의 1 이상에서 필수품이 되었습니다. Meta는 최근 Ray-Ban 스마트 안경에 5개의 마이크 어레이를 사용하여 시끄러운 방에서도 대화를 들을 수 있도록 돕는 기능을 출시했는데, 이는 본질적으로 얼굴을 방향성 청취 장치로 활용하는 것입니다. 한편, Google은 6월부터 검색 결과를 대화형 요약으로 변환하는 “오디오 개요” 실험을 시작했으며, Tesla는 xAI의 챗봇 Grok을 차량에 통합하여 내비게이션부터 실내 온도 조절까지 모든 것을 자연스러운 대화로 처리하는 대화형 음성 비서를 구현하고 있습니다.

이러한 투자를 하는 것은 거대 기술 기업만이 아닙니다. 다양한 스타트업들이 같은 확신을 가지고 등장했지만, 성공 여부는 제각각입니다. 휴메인 AI 핀(Humane AI Pin) 개발사는 화면 없는 웨어러블 기기에 수억 달러를 쏟아부었지만, 오히려 실패 사례로 남았습니다. 프렌드 AI 펜던트(Friend AI pendant)는 사용자의 일상을 기록하고 동반자 역할을 한다고 주장했지만, 개인정보 침해 우려와 존재론적 불안감을 동시에 불러일으켰습니다. 그리고 샌드바(Sandbar)와 페블(Pebble) 창립자 에릭 미기코프스키(Eric Migicovsky)가 이끄는 회사를 포함해 최소 두 곳의 회사가 2026년 출시 예정인 AI 반지를 개발 중입니다. 이 반지는 착용자가 말 그대로 손에 말을 걸 수 있게 해줍니다.

## 미래는 음성 제어다

형태는 다를 수 있지만, 핵심은 같습니다. 바로 음성이 미래의 인터페이스라는 것입니다. 집, 차, 심지어 얼굴까지 모든 공간이 제어 표면이 되어가고 있습니다. OpenAI의 새로운 오디오 모델은 2026년 초 출시 예정으로, 더욱 자연스러운 소리를 내고, 실제 대화 상대처럼 말 중간에 끼어들기를 잘 처리하며, 심지어 사용자가 말하는 동안에도 말을 할 수 있다고 합니다. 이는 현재 모델들이 할 수 없는 기능입니다. 또한, OpenAI는 안경이나 스크린 없는 스마트 스피커와 같은, 단순한 도구가 아닌 동반자처럼 작동하는 다양한 기기들을 구상하고 있다고 합니다.

이러한 움직임은 그리 놀라운 일이 아닙니다. The Information에 따르면, 지난 5월 OpenAI가 65억 달러에 그의 회사 io를 인수하면서 하드웨어 개발에 합류한 전 애플 디자인 책임자 조니 아이브는 기기 중독을 줄이는 것을 최우선 과제로 삼고 있으며, 오디오 우선 디자인을 통해 과거 소비자 기기의 “잘못된 점”을 바로잡을 기회로 보고 있습니다.

Asset Management AI Betting AI Generative AI GPT Horse Racing Prediction AI Medical AI Perplexity Comet AI Semiconductor AI Sora AI Stable Diffusion UX UI Design AI