Google DeepMind が Gemini モデルの標準インターフェースを大きく変更する。従来の「generateContent API」に代わり、「Interactions API」がデフォルトインターフェースとなる。この移行は開発者にとって実装上の必須対応となり、新しいスキーマ設計により大幅なパフォーマンス向上とコスト削減を実現する見通しだ。

何が変わるのか

最大の変更点は API の基本構造である。従来の generateContent API は「user」「model」といったロール(役割)ベースの構造を採用していたが、Interactions API は「typed steps」という新しいスキーマに移行する。これにより、ユーザー入力から関数呼び出し、エージェントの実行までのすべてのアクションが、より明確かつ型安全に定義されるようになる。

Google は「Interactions API は新しい時代のエージェントの舞台を整える」と述べており、将来リリースされるすべての新機能はこの API 経由でのみ提供される予定だ。つまり、generateContent API にとどまった開発者は、新機能にアクセスできなくなる可能性がある。

開発者向けのメリット

新 API の導入により、複数の実質的な利益が生まれる。

コスト削減と速度最適化: Interactions API は Flex モードでの利用時にコストが 50% 削減でき、Priority モードでは速度が最適化される。API 呼び出しの回数削減と効率化により、スケール運用での経済効果は顕著になるだろう。

新機能へのアクセス: API の標準化により、以下の機能が統一されたインターフェース経由で利用可能になる。

  • Managed Agents(独立した Linux サンドボックス環境)
  • 長時間実行タスク向けのバックグラウンド実行
  • Google Search および Google Maps との連携ツールチェーン
  • 画像・音声・音楽の生成機能

業界と開発者への影響

この移行戦略は、Google が Gemini エコシステムを段階的に統一・最適化していく意図を示しており、OpenAI の API 進化戦略と同様のパターンだ。開発者は早期に Interactions API への移行を検討する必要があり、既存実装との互換性確認が急務となる。同時に、API の統一により、マルチモーダル AI(テキスト・音声・画像の統合処理)の実装ハードルが大きく下がることが予想される。