タグ一覧に戻る

音声AI

記事数: 8
Google が新型スマートスピーカー発表——6年ぶり、Gemini 搭載で自然対話が可能に、価格は $99.99

Google が新型スマートスピーカー発表——6年ぶり、Gemini 搭載で自然対話が可能に、価格は $99.99

6年ぶりに Google がスマートスピーカーの新作 「Google Home Speaker」を発表。価格は $99.99。従来の「OK Google」コマンド型から脱却し、Gemini を搭載することで自然言語対話が可能に。6月25日より米国で販売開始。

続きを読む
Qwen チームが開発した Audio-Interaction、常時リスニング型音声AIで0.4秒ごとに応答判定

Qwen チームが開発した Audio-Interaction、常時リスニング型音声AIで0.4秒ごとに応答判定

中国・香港・シンガポール拠点の研究チームが Apache 2.0 で公開した新音声モデル Audio-Interaction。Qwen2.5-Omni-3B ベースで、従来の音声AIと異なり「0.4秒ごとに応答するか沈黙するかを判定」しながらリアルタイムで翻訳・文字起こしに対応。開発者が GitHub から即座に利用可能。

続きを読む

AI音声ディクテーションが職場コミュニケーションを根本的に変える——オフィスは『囁きに満ちた場所』へ

Wispr などのAI音声ディクテーションツールの普及により、オフィスの音声環境が急速に変わりつつある。スタートアップからエンタープライズまで、職場での仕事スタイルと社員間コミュニケーションが『音声優先』へシフト。夫婦間の違和感から経営層の懸念まで、その影響は多方面に及んでいる。

続きを読む
Parloa、OpenAI モデルで音声AI カスタマーサービスエージェント構築

Parloa、OpenAI モデルで音声AI カスタマーサービスエージェント構築

Parloa が OpenAI のモデルを活用し、スケーラブルな音声駆動型 AI カスタマーサービスエージェントを構築。設計・シミュレーション・デプロイを可能にし、企業向けの信頼できるリアルタイムインタラクションを実現。

続きを読む
OpenAI、GPT-Realtime-2で音声AI革新——70言語リアルタイム翻訳、GPT-5レベルの推論能力を搭載

OpenAI、GPT-Realtime-2で音声AI革新——70言語リアルタイム翻訳、GPT-5レベルの推論能力を搭載

OpenAIが3つの新音声モデルを発表。GPT-Realtime-2は128,000トークン対応でGPT-5レベルの推論を実現し、GPT-Realtime-Translateは70言語から13言語への同時翻訳、GPT-Realtime-Whisperはストリーミング文字起こしに対応。すべてRealtime APIを通じて利用可能。

続きを読む