音声AI

記事数: 8 件

2026年6月18日

Google が新型スマートスピーカー発表——6年ぶり、Gemini 搭載で自然対話が可能に、価格は $99.99

6年ぶりに Google がスマートスピーカーの新作「Google Home Speaker」を発表。価格は $99.99。従来の「OK Google」コマンド型から脱却し、Gemini を搭載することで自然言語対話が可能に。6月25日より米国で販売開始。

Google Gemini スマートスピーカー音声AI 新製品

Qwen チームが開発した Audio-Interaction、常時リスニング型音声AIで0.4秒ごとに応答判定

LLM・生成AI

2026年6月6日

Qwen チームが開発した Audio-Interaction、常時リスニング型音声AIで0.4秒ごとに応答判定

中国・香港・シンガポール拠点の研究チームが Apache 2.0 で公開した新音声モデル Audio-Interaction。Qwen2.5-Omni-3B ベースで、従来の音声AIと異なり「0.4秒ごとに応答するか沈黙するかを判定」しながらリアルタイムで翻訳・文字起こしに対応。開発者が GitHub から即座に利用可能。

音声AI Qwen オープンソースリアルタイム処理

OpenAI、セレブ音声クローンの Weights.gg を買収―スタンドアロン製品は未定

ビジネス

2026年5月16日

OpenAI、セレブ音声クローンの Weights.gg を買収―スタンドアロン製品は未定

OpenAI は音声クローニングスタートアップ Weights.gg を買収。セレブの声を複製するツールを開発してきた同社のチームは、ChatGPT や開発者向け API に音声技術を統合する予定です。

OpenAI M&A 音声AI Weights.gg

テクノロジー

2026年5月11日

AI音声ディクテーションが職場コミュニケーションを根本的に変える——オフィスは『囁きに満ちた場所』へ

Wispr などのAI音声ディクテーションツールの普及により、オフィスの音声環境が急速に変わりつつある。スタートアップからエンタープライズまで、職場での仕事スタイルと社員間コミュニケーションが『音声優先』へシフト。夫婦間の違和感から経営層の懸念まで、その影響は多方面に及んでいる。

音声AI 職場コミュニケーションディクテーション働き方オフィス

Parloa、OpenAI モデルで音声AI カスタマーサービスエージェント構築

テクノロジー

2026年5月8日

Parloa、OpenAI モデルで音声AI カスタマーサービスエージェント構築

Parloa が OpenAI のモデルを活用し、スケーラブルな音声駆動型 AI カスタマーサービスエージェントを構築。設計・シミュレーション・デプロイを可能にし、企業向けの信頼できるリアルタイムインタラクションを実現。

Parloa OpenAI AIエージェントカスタマーサービス音声AI

OpenAI、GPT-Realtime-2で音声AI革新——70言語リアルタイム翻訳、GPT-5レベルの推論能力を搭載

LLM・生成AI

2026年5月8日

OpenAI、GPT-Realtime-2で音声AI革新——70言語リアルタイム翻訳、GPT-5レベルの推論能力を搭載

OpenAIが3つの新音声モデルを発表。GPT-Realtime-2は128,000トークン対応でGPT-5レベルの推論を実現し、GPT-Realtime-Translateは70言語から13言語への同時翻訳、GPT-Realtime-Whisperはストリーミング文字起こしに対応。すべてRealtime APIを通じて利用可能。

OpenAI 音声AI GPT-5 翻訳推論