Gemini 3.5 Flash:フロンティアモデルの性能・低コスト・高速化を実現

Google が発表した Gemini 3.5 Flash は、4 ヶ月前の Gemini 3.1 Pro をほぼすべてのベンチマークで上回りながら、価格は 3 分の 1 から 2 分の 1、実行速度は 4 倍以上という異例の仕様です。最適化版は 12 倍高速。これにより、開発者やエンタープライズユーザーは「これまで高性能モデルは高コスト」という前提を覆す選択肢を得たことになります。

Google の CEO Sundar Pichai によれば、Flash と Pro を組み合わせることで、企業が工数の 80% を Flash に振り向けた場合、年間 10 億ドル以上の節約が可能になるとのこと。これは単なる「安いモデル」ではなく、経営判断レベルの効率化を意味します。

Gemini Omni:マルチモーダル生成の新体験

後継モデル Veo に代わる Omni は、従来のビデオ生成ツール(Sora や Veo)とは設計が異なります。画像・テキスト・音声・動画をすべての入出力形式に対応し、生成結果を再び入力として使う「ループバック編集」が可能です。つまり、ユーザーが生成した動画をアップロードして、キャラクターを差し替えたり、スタイルを編集したりできるわけです。

すべての生成コンテンツには Google の SynthID ウォーターマークが付与され、「どの素材が AI で作られたか」を検証可能な状態で提供されます。

Gemini Spark:24/7 自律実行型エージェント

Spark は Google クラウド上で常時稼働する個人用エージェント。ユーザーのデバイスがオフのときも独立して動作し、Gmail・Docs・Workspace 製品と連携します。初週はテスターに限定公開、翌週から月額 $100 の Ultra 契約者向けに米国でベータ提供予定です。

これはユーザーが明示的に指示しなくても、バックグラウンドで継続的に行動するエージェント、つまり「寝ている間も働く AI」の到来を示唆しています。

検索の再設計:リンク一覧から「AI が代わりに調べる」へ

Google は 25 年間変わらなかった検索ボックスを全面刷新。従来の「キーワード入力 → リンク一覧」から、会話型のクエリーに対応し、AI が自動的に複数ソースを検索・統合・要約する UIへと転換します。Gemini 3.5 Flash が基盤となり、テキスト・画像・音声の複合入力にも対応。この変更により、従来のパブリッシャーへのトラフィック減少が加速する可能性も指摘されています。

開発ツールの民主化:AI Studio で Android アプリ自動生成

Kotlin・Jetpack Compose ベースの AI Studio により、ノンプログラマーでも Web ブラウザ内だけで Android ネイティブアプリを数分で生成できるようになります。GPS・Bluetooth・NFC などのハードウェアセンサー統合にも対応し、生成したアプリはブラウザ内エミュレーターでプレビュー、USB 経由でデバイスインストール、Google Play Console への自動アップロードも可能。

Cursor、Replit、Claude Code など既存のコーディング支援ツールとの競争が本格化する局面です。

Antigravity 2.0:$100/月の AI Ultra 契約

Google は新しい課金層「AI Ultra」を $100 月額で導入。これまで最高峰だった層の価格が $200 に引き下げられており、より多くの利用者が高性能モデルにアクセスできる施策となっています。

業界への影響:「会話ツール」から「自律ツール」へのシフト

Google I/O 2026 の総体的な意味は明確です。AI はもはや質問に答えるだけの存在ではなく、数時間単位での独立した実行・判断・報告を行うエージェント化したということです。

Spark の 24/7 稼働、Flash の低コスト・高速化、Omni の編集可能なマルチモーダル出力、検索の自動化—これらはすべて「ユーザーが指示しなくても AI が主体的に価値を生み出す」という新しい時代への転換を示しています。

開発者にとっては API・IDE・OS 統合が深まり、使い手にとっては毎日の作業フローが刻々と AI に置き換わる経験になるでしょう。「敵わない」と感じるより、新しい道具としてどう使うかを問い直す時期に入ったと言えます。

アップデート:Gemini 3.5 Flash 実行コスト分析——Pro より 75% 高い設定に

Google I/O 発表後の詳細分析により、Gemini 3.5 Flash の API 価格設定の全貌が明らかになりました。入力 token 当たり $0.50 から $1.50、出力 token $3.00 から $9.00 へ値上げされ、token 単価では 3 倍になっています。

ただし、より重要なのは 実運用でのトータルコストです。特にエージェント(自動実行タスク)での利用では、Gemini 3.5 Flash が複数の推論ステップを必要とするため、より高価な Gemini 3.1 Pro と比較して 75% 高いコストがかかることが判明しました。つまり、単価が安いという発表の一方で、実際の利用では「複数ステップ推論が必要 = token 消費量多 = 総コスト増」という矛盾が生じています。

性能面では、ベンチマーク全体知能指数で 55 ポイント(前世代比 +9)、マルチモーダル(MMMU-Pro)で 84% を記録する一方、hallucination rate は 61% で業界最低レベル。プログラミング能力では GPT-5.5(59)や Claude Opus 4.7(53)に後れを取っています(Flash は 45 ポイント)。

これは開発者にとって、「高速・低価格」という打ち出し文句の背景に、フロンティアモデルとしての限界性能と、複雑なエージェントタスクでは予想外の高コスト化というリスクが隠れていることを意味します。