xAI、Custom Voices で独自音声クローン機能をリリース——1分の録音で AI 音声生成

2026年5月2日 22:11

Photo by Nastasya Slastnyh on Unsplash

💡

xAI が新機能「Custom Voices」を公開。ユーザーが約1分間の音声を録音するだけで、AI が個人専用のボイスクローンを作成。テキスト音声変換やボイスエージェント API と統合可能で、開発者エコシステムを強化。

xAI は新しい「Custom Voices（カスタムボイス）」機能を発表しました。ユーザーが約1分間の音声を記録するだけで、AI が個人専用のボイスクローンを生成。それを自社の音声 API やボイスエージェント機能で利用できます。

Custom Voices の仕組み

この機能は Speech-to-Text、Text-to-Speech API に統合されるもので、ユーザーは xAI コンソール経由で自然音声を記録します。最短で 2 分以内に音声モデルが準備完了となり、すぐに利用開始が可能です。

現在、xAI は 28 言語対応の 80 以上のプリセット音声を用意しています。クローン音声を使用するための追加費用は発生しません。

セキュリティと詐称防止

xAI は 2 段階認証プロセスを実装しています。まずユーザーが「パスフレーズを読み上げ」、リアルタイムで確認を受けます。その後、システムが 2 つの録音を比較して、同一人物であることを検証します。xAI 側の説明によれば、既存の録音や他人の声をクローンすることは不可能な設計とのことです。

戦略的背景——API エコシステムの拡大

Custom Voices は、先月リリースの Grok 4.3（大幅な値下げと改良）と並行する戦略の一環です。xAI は Grok Speech-to-Text・Text-to-Speech API に続いて、音声機能を段階的に拡張。開発者が自社アプリケーションに組み込める API 層を強化し、Grok エコシステムへの依存度を高める狙いがあります。

この展開は、OpenAI や Anthropic が提供する音声機能への直接的な対抗手段でもあります。特に低価格化を武器に、スタートアップやインディデベロッパーの取り込みを加速させる戦略が透けて見えます。

記事をシェア

参考ソース

★ 注目 The Decoder

LLM・生成AIの記事

「Count Anything」——Tsinghua が物体カウント AI モデルをリリース、エラー率を 50% 削減

LLM・生成AI

2026年6月14日

「Count Anything」——Tsinghua が物体カウント AI モデルをリリース、エラー率を 50% 削減

Tsinghua University が開発した「Count Anything」は、群衆や医療スキャン、衛星画像など様々なイメージで物体をカウントできる初の AI モデル。従来システムと比べエラー率を半減。

Google の Gemini-SQL2、テキスト to SQL ベンチマークで業界トップ——GPT-5.5・Claude を 8 ポイント上回る

LLM・生成AI

2026年6月14日

Google の Gemini-SQL2、テキスト to SQL ベンチマークで業界トップ——GPT-5.5・Claude を 8 ポイント上回る

Google Research が発表した Gemini-SQL2 は、自然言語をデータベースクエリに変換するシステム。BIRD ベンチマークで 80.04% の精度を達成し、OpenAI の GPT-5.5（約 72.8%）と Anthropic の Claude Opus 4.6（約 70.9%）を上回った。

Moonshot Kimi K2.7 Code、オープンモデルで西側の 12 倍安い――エージェント最適化で Claude を上回る

LLM・生成AI

2026年6月13日

Moonshot Kimi K2.7 Code、オープンモデルで西側の 12 倍安い――エージェント最適化で Claude を上回る

Moonshot AI がリリースした 1 兆パラメータのオープンモデル Kimi K2.7 Code は、出力価格で Fable 5 の 12 倍安いプライシングを実現。MCPMark エージェント向けベンチマークでは Claude Opus 4.8 を上回り、エージェント・ワークフロー構築に最適化された実用的な選択肢として登場。

xAI エンジニアが AI安全性懸念で解雇、SpaceX IPO 直前の訴訟

xAI の元エンジニア Devin Kim が、Grok の差別的出力と危険情報拡散を警告した直後に解雇されたと主張。SpaceX の史上最大級の IPO タイミングでの訴訟は、安全性と企業成長のジレンマを露呈させた。

突然の Grok Imagine レート制限縮小、SuperGrok Heavy + Grok Build でどこまでできるのか試してみた

テクノロジー

2026年5月15日

突然の Grok Imagine レート制限縮小、SuperGrok Heavy + Grok Build でどこまでできるのか試してみた

2026年5月、Grok Imagine の動画生成制限が突然激減し、SuperGrok 加入者ですら 1 日 20 件前後に絞られた。クォータを計画的に使う方法、代替サービスへの移行、xAI API 直接利用まで制限を回避する実践的な方法と、いつ元に戻るのかの見通しを探る。また Grok Build の 11 スキルとスラッシュコマンド体系も詳解する。

LLM・生成AI

2026年5月2日