Google が新型スマートスピーカー発表——6年ぶり、Gemini 搭載で自然対話が可能に、価格は $99.99
6年ぶりに Google がスマートスピーカーの新作 「Google Home Speaker」を発表。価格は $99.99。従来の「OK Google」コマンド型から脱却し、Gemini を搭載することで自然言語対話が可能に。6月25日より米国で販売開始。
続きを読む6年ぶりに Google がスマートスピーカーの新作 「Google Home Speaker」を発表。価格は $99.99。従来の「OK Google」コマンド型から脱却し、Gemini を搭載することで自然言語対話が可能に。6月25日より米国で販売開始。
続きを読む中国・香港・シンガポール拠点の研究チームが Apache 2.0 で公開した新音声モデル Audio-Interaction。Qwen2.5-Omni-3B ベースで、従来の音声AIと異なり「0.4秒ごとに応答するか沈黙するかを判定」しながらリアルタイムで翻訳・文字起こしに対応。開発者が GitHub から即座に利用可能。
続きを読むOpenAI は音声クローニングスタートアップ Weights.gg を買収。セレブの声を複製するツールを開発してきた同社のチームは、ChatGPT や開発者向け API に音声技術を統合する予定です。
続きを読むWispr などのAI音声ディクテーションツールの普及により、オフィスの音声環境が急速に変わりつつある。スタートアップからエンタープライズまで、職場での仕事スタイルと社員間コミュニケーションが『音声優先』へシフト。夫婦間の違和感から経営層の懸念まで、その影響は多方面に及んでいる。
続きを読むParloa が OpenAI のモデルを活用し、スケーラブルな音声駆動型 AI カスタマーサービスエージェントを構築。設計・シミュレーション・デプロイを可能にし、企業向けの信頼できるリアルタイムインタラクションを実現。
続きを読むOpenAIが3つの新音声モデルを発表。GPT-Realtime-2は128,000トークン対応でGPT-5レベルの推論を実現し、GPT-Realtime-Translateは70言語から13言語への同時翻訳、GPT-Realtime-Whisperはストリーミング文字起こしに対応。すべてRealtime APIを通じて利用可能。
続きを読むOpenAIが音声AIの技術的基盤を刷新しました。WebRTCスタックの再構築により、低レイテンシーでシームレスな会話ターンテイキングが実現され、グローバルスケールでの配信が可能になりました。
続きを読むKnownがサンフランシスコの試験で報告した音声AIは、紹介の約80%が実デートに至ったとされる有望な結果を示しましたが、対象人数や期間など詳細は未公開で、今後の透明なデータ公開と再現性の検証が期待されています。
続きを読む