Google、Pixel上の Gemini Nano を50%高速化——「Frozen Multi-Token Prediction」で次世代オンデバイスAIを実現

2026年6月27日 04:11

💡

Google AI が新技術「Frozen Multi-Token Prediction（FMTP）」を発表。既存 Gemini Nano モデルの重みを固定し軽量な変換器を追加することで、Pixel 9/10 上での処理速度を50%以上高速化。メモリ効率も大幅改善。

Google AI が 2026年6月、オンデバイスAI推論の効率化に向けた新しい軽量アーキテクチャ「Frozen Multi-Token Prediction（FMTP）」を発表しました。既に Pixel 9・Pixel 10 シリーズに段階的にロールアウト中です。

Frozen Multi-Token Prediction とは

FMTP は、既に展開されている Gemini Nano モデルの重み（パラメータ）を固定したまま、軽量な「Multi-Token Prediction ヘッド（MTP ヘッド）」という変換器層を追加する方式です。

従来のスペキュラティブデコーディングは、別個の小規模ドラフタモデルを必要としていましたが、FMTP はメインモデルの最終層の活性化状態を再利用することで、追加モデル不要で 複数トークンを同時に予測 できます。

この仕組みにより：

後方互換性を完全に維持しながら高速化
メモリ消費を最小化（新規ドラフタモデルが不要）
段階的なアップグレードが可能

Pixel デバイスでの具体的な成果

速度の向上

指標	改善度
総処理速度	50% 以上のスピードアップ（Pixel 9デバイス）
平均トークン予測数	約2トークンの追加予測を実現
特定タスク（構文解析）	55% のトークン受け入れ改善

メモリ効率化

FMTP 方式は、従来のスタンドアロンドラフタモデル（別チップ推論）と比較して 130MB のメモリ削減 を実現。これにより、Pixel の限定的なオンボードメモリでより多くの AI 機能をサポート可能に。

一般ユーザーへの実際の影響

実装済み Pixel AI 機能での改善例：

通知要約（Magic Eraser など）：「かなり高速化」され、リアルタイム処理が向上
プルーフリード（文章チェック）機能：応答遅延が短縮、ユーザー体験向上
バッテリー消費：処理効率向上により電力消費が削減
プライバシー保護：推論全体がデバイス上で完結するため機密性を維持

現在、これらの改善は Pixel 9・Pixel 10 シリーズに既にロールアウトされており、ユーザーは追加設定なしで体感できます。

技術的背景：オンデバイスAI競争の加速

スマートフォンメーカーにとって「デバイス上で最適化されたAI推論」は重要な競争領域に。Apple の A シリーズチップ向けの Neural Engine、Samsung の NPU 最適化と並び、Google も Pixel 特化型の推論パイプラインを強化しています。

FMTP はその最新成果であり、限定的なメモリ・電力リソースで最大の性能を引き出す エンジニアリングの粋を示しています。

展開予定

Pixel 9 シリーズ：既にロールアウト中
Pixel 10 シリーズ：6月27日以降のアップデートで段階的展開
その他 Android デバイス：Google との提携メーカーを対象に順次展開予定

記事をシェア

参考ソース

★ 注目 Google AI Blog

テクノロジーの記事

Databricks元AI責任者が設立したUnconventional AI、消費電力を最大1000倍削減する革新的な画像生成モデル「Un-0」を発表

テクノロジー

2026年6月26日

Databricks元AI責任者が設立したUnconventional AI、消費電力を最大1000倍削減する革新的な画像生成モデル「Un-0」を発表

Naveen Rao氏率いるUnconventional AIが、従来のAIシステムとは全く異なるオシレーター基盤アーキテクチャを採用した画像生成モデル「Un-0」を発表。AI推論の消費電力を最大1000倍削減することを目指す革新的なアプローチが、業界内で注目を集めています。

Notion、メールアプリを廃止——AI エージェント中心のワークスペースへシフト

テクノロジー

2026年6月26日

Notion、メールアプリを廃止——AI エージェント中心のワークスペースへシフト

Notion が Skiff ライクのメールアプリを廃止し、AI エージェントを使用したインボックス管理に一本化。プロダクト戦略を大きく転換し、エージェントベースの作業自動化に経営リソースを集中させます。

Qualcomm がデータセンター市場に参入、AI 最適化チップ「Dragonfly C1000」を発表

テクノロジー

2026年6月26日

Qualcomm がデータセンター市場に参入、AI 最適化チップ「Dragonfly C1000」を発表

Qualcomm が新型プロセッサ「Dragonfly C1000」でデータセンター市場に本格進出。Meta は 2028年から採用予定。同時に Modular を約40億ドルで買収し、AI インフラの競争図式が大きく変わる。

Google、Gemini 3.5 Flash に「Computer Use」を統合——OSWorld 78.4で GPT-5.5 と肩を並べる

Google が Gemini 3.5 Flash にコンピュータ操作機能を直接統合。ソフトウェアテストやオフィス自動化を実行するエージェント構築が可能に。OSWorld ベンチマークで 78.4 スコアを記録。

Google が Gemini の新 API インターフェース「Interactions API」をデフォルト化、開発者実装が必須へ

テクノロジー

2026年6月23日

Google が Gemini の新 API インターフェース「Interactions API」をデフォルト化、開発者実装が必須へ

Google DeepMind が Gemini モデルのデフォルトインターフェースを generateContent API から Interactions API に変更。新スキーマ導入でコスト削減・速度最適化を実現し、今後の新機能はこの API 経由のみリリース予定。

Google Docs で Gemini AI を OFF にできるように、ユーザーがプライバシーコントロールを獲得

LLM・生成AI

2026年6月18日

Google Docs で Gemini AI を OFF にできるように、ユーザーがプライバシーコントロールを獲得

Google Docs ユーザーが「write with Gemini」ポップアップを無効化できるようになりました。ドキュメント単位あるいはワークスペース全体で、スマート機能を制御可能に。

Claude Opus 4.7、MirrorCodeベンチマークでAI最強の再実装スキルを実証——ソースなしで16000行Go再構築

Epoch AIとMETRが開発したMirrorCodeベンチマークで、Claude Opus 4.7が56%の解決率で最高性能を達成。元のコードなしで複雑なプログラムを再実装するAIの能力が、開発者ワークフローを大きく変える可能性を示しました。

Claude AI開発コーディングベンチマークプログラミング

NYT、Microsoftが『著作権侵害スーパーコンピュータ』構築と主張——SCOTUS判決後の新戦略で業界激震

政策・規制

2026年6月27日

NYT、Microsoftが『著作権侵害スーパーコンピュータ』構築と主張——SCOTUS判決後の新戦略で業界激震

ニューヨーク・タイムズがMicrosoftを新たに非難。SCOTUS（最高裁）のソニー事件判決後、OpenAIの学習を支える基盤そのものが著作権侵害の道具だったと主張する法的戦略シフトです。AI企業のインフラ責任が問われるターニングポイント。

著作権 Microsoft OpenAI 法律規制動向

AI スタートアップ Lindy、Claude から Deepseek へ全面移行——経費削減で「生存戦略」

ビジネス

2026年6月27日

AI スタートアップ Lindy、Claude から Deepseek へ全面移行——経費削減で「生存戦略」

AI スタートアップ Lindy が Anthropic の Claude から中国製 LLM の Deepseek へ全面移行。AI コストが人件費を上回る状況から脱却するための経営判断。

Anthropic Claude Deepseek スタートアップ AI コスト

OpenAI の IPO が 2027 年へ延期——Altman、$1 兆評価で譲らず

ビジネス

2026年6月27日

OpenAI の IPO が 2027 年へ延期——Altman、$1 兆評価で譲らず

OpenAI の上場計画が 2027 年へ延期される見通し。CEO Altman は $1 兆の企業価値評価を下限とする強気姿勢。技術市場の不安定性と投資家の慎重さが背景。

OpenAI IPO Altman 企業価値 VC

Anthropic、AI 時代に junior engineers 不要、「Returns on Intuition」で経験エンジニアの価値が劇的上昇

ビジネス

2026年6月26日

Anthropic、AI 時代に junior engineers 不要、「Returns on Intuition」で経験エンジニアの価値が劇的上昇

Anthropic の共同設立者 Jack Clark が、AI による自動化で junior engineers が不要になったと述べ、同時に経済への大きな警告を発した。GDP 成長と失業が同時に起きる可能性を指摘。

Anthropic AI 雇用経済ジョブマーケット

Linux Foundation と 20 社、AI による攻撃に先制対応する Akrites イニシアティブを発表・オープンソース脆弱性の協調修正体制

セキュリティ

2026年6月26日

Linux Foundation と 20 社、AI による攻撃に先制対応する Akrites イニシアティブを発表・オープンソース脆弱性の協調修正体制

Linux Foundation が主導し Amazon、Anthropic、Google、IBM、Microsoft、OpenAI、NVIDIA など 20 社が参加。AI ツールが悪用する前にオープンソースの脆弱性を発見・修正する Akrites プログラムを開始

Linux Foundation オープンソースセキュリティ脆弱性管理 AI セキュリティ

すべての記事を見る

Google、Pixel上の Gemini Nano を50%高速化——「Frozen Multi-Token Prediction」で次世代オンデバイスAIを実現

Frozen Multi-Token Prediction とは

Pixel デバイスでの具体的な成果

速度の向上

メモリ効率化

一般ユーザーへの実際の影響

技術的背景：オンデバイスAI競争の加速

展開予定

記事をシェア

タグ

参考ソース

OpenAI の IPO が 2027 年へ延期——Altman、$1 兆評価で譲らず

NYT、Microsoftが『著作権侵害スーパーコンピュータ』構築と主張——SCOTUS判決後の新戦略で業界激震

テクノロジーの記事

関連タグの記事

最新記事