OpenAIはオーディオAIに大きく賭けており、その狙いはChatGPTの音質向上だけにとどまりません。The Informationの最新報道によると、同社は過去2ヶ月間に複数のエンジニアリング、製品、研究チームを統合し、オーディオモデルの刷新を進めてきました。これはすべて、約1年後に発売予定のオーディオ重視のパーソナルデバイスに向けた準備です。
この動きは、テクノロジー業界全体が向かう方向性を反映しています。それは、画面がバックグラウンドノイズとなり、オーディオが中心となる未来です。スマートスピーカーの普及により、音声アシスタントはすでに米国の家庭の3分の1以上に普及しています。Metaは、Ray-Banスマートグラス向けに、5つのマイクアレイを使用して騒がしい部屋でも会話を聞き取れる機能を発表しました。これは、いわば顔を指向性のあるリスニングデバイスに変えるようなものです。一方、Googleは6月に検索結果を会話形式の要約に変換する「Audio Overviews」の実験を開始し、TeslaはxAIのチャットボットGrokを自社の車両に搭載し、ナビゲーションから空調制御まであらゆる機能を自然な対話で処理する会話型音声アシスタントを開発しています。
この賭けに出ているのは、テクノロジーの巨人だけではありません。成功の度合いは様々ですが、同じ信念を持つ様々なスタートアップ企業が登場しています。Humane AI Pinのメーカーは、スクリーンレスウェアラブルが教訓となる前に数億ドルを費やしました。Friend AIペンダントは、ユーザーの生活を記録し、仲間を提供すると謳うネックレスで、プライバシーへの懸念と実存的な不安を等しく引き起こしました。そして現在、SandbarとPebble創業者のEric Migicovsky氏が率いる企業を含む少なくとも2社が、2026年の発売予定のAIリングを開発中です。装着者は文字通り手に話しかけることができます。
## 未来は音声制御
フォームファクターは異なりますが、テーマは同じです。オーディオは未来のインターフェースです。あらゆる空間 ― 自宅、車、そして顔さえも ― がコントロールサーフェスになりつつあります。 OpenAIの新しい音声モデルは2026年初頭にリリース予定で、より自然な音声で、まるで実際の会話相手のように割り込みに対応し、さらには現在のモデルでは不可能な、ユーザーが話している最中にも音声を発する機能を持つと報じられています。同社はまた、メガネ型やスクリーンレス型スマートスピーカーなど、ツールというよりは仲間のようなデバイスファミリーも構想していると言われています。
これらはどれもさほど驚くようなものではありません。The Informationが報じているように、5月にAppleが自身の会社ioを65億ドルで買収したことでOpenAIのハードウェア事業に加わった元Appleデザイン責任者のジョニー・アイブ氏は、デバイス依存の軽減を最優先事項としており、音声重視の設計を過去の消費者向けガジェットの「欠点を正す」チャンスと捉えています。




