Moonshot Kimi K2.7 Code、オープンモデルで西側の 12 倍安い――エージェント最適化で Claude を上回る

2026年6月13日 22:11

💡

Moonshot AI がリリースした 1 兆パラメータのオープンモデル Kimi K2.7 Code は、出力価格で Fable 5 の 12 倍安いプライシングを実現。MCPMark エージェント向けベンチマークでは Claude Opus 4.8 を上回り、エージェント・ワークフロー構築に最適化された実用的な選択肢として登場。

Moonshot AI がリリースした Kimi K2.7 Code は、オープンウェイトのコーディング特化モデルとして注目を集めている。1 兆パラメータながら、エージェント構築や推論効率を重視した設計で、西側の専有モデルとは全く異なる選択肢を開発者に提供している。

スペック：1 兆パラメータ、256K コンテキスト

Kimi K2.7 Code の基本スペック：

項目	仕様
総パラメータ	1 兆（Mixture-of-Experts）
アクティブパラメータ	32 億（トークンあたり）
コンテキスト長	256,000 トークン
モダリティ	マルチモーダル（画像・動画・テキスト）
アーキテクチャ	Mixture-of-Experts（MoE）

MoE 設計により、メモリとコンピュート効率を最適化しながら、大規模な処理能力を実現している。256K コンテキストは、大型のコードベースや複雑なドキュメント処理に対応可能だ。

価格が革新的――西側競合と 12 倍の差

Kimi K2.7 Code の最大の競争力は、圧倒的な価格優位性だ。

モデル	入力	出力	キャッシュ時
Kimi K2.7 Code	$0.95/1M	$4	$0.19/1M
Claude Fable 5	—	$48	—
GPT-5.5	—	—	—

出力だけ比較すると、Fable 5 は Kimi K2.7 の 12 倍以上高い。同じ予算で Kimi K2.7 なら 12 回推論できる価格帯だ。

キャッシュ効果の恩恵も大きく、キャッシュヒット時の入力費は $0.19 まで低下。長期間のコンテキストを保持するエージェント・ワークフローに最適化されている。

ベンチマーク：標準テストでは劣位、エージェント向けでは優位

一般的なコーディングベンチマークでは、Kimi K2.7 は GPT-5.5 や Claude Opus 4.8 に後れを取る。だが、エージェント向けの実際のユースケースでは異なる結果が現れる。

MCPMark Verified（エージェント実行ベンチマーク）：

モデル	スコア
Kimi K2.7 Code	81.1
Claude Opus 4.8	76.4
GPT-5.5	—

MCPMark は「エージェントが実際に外部ツール（ファイル操作、API 呼び出し、コード実行）を操作できるか」をテストする実践的なベンチマークだ。この観点では Kimi K2.7 が Claude を上回っている。

推論効率が高い――K2.6 比で 30% トークン削減

前バージョン K2.6 と比較して、Kimi K2.7 Code は以下の改善を実現：

推論 30% トークン削減（同じタスクで少ないトークン消費）
エージェント構築の最適化
VLLM・SGLang などの推論エンジン対応
既存デプロイ設定の再利用可能

特に、エージェント・ワークフローでは、トークン削減は直接的にコスト削減につながるため、実用性が高い。

開発者の選択肢が広がる

Kimi K2.7 Code の登場は、開発者に以下の選択肢を与える：

標準的なコーディング性能は必要ない → Kimi で十分
エージェント構築が主目的 → Kimi の方が効率的
長期コンテキストを保持するワークフロー → キャッシュ効率で有利
低予算で大規模推論 → 12 倍の価格優位

西側の専有モデル中心の時代から、開発者が「タスクと予算に応じた選択」を自由にできる時代へ転換しつつある。Kimi K2.7 は、その転換点を象徴するモデルといえるだろう。

記事をシェア

参考ソース

★ 注目 THE DECODER

LLM・生成AIの記事

OpenAI が GPT-5.6 Sol で Claude Opus 5 を ARC-AGI-3 で上回ったと主張——測定方法の公平性が争点

LLM・生成AI

2026年7月30日

OpenAI が GPT-5.6 Sol で Claude Opus 5 を ARC-AGI-3 で上回ったと主張——測定方法の公平性が争点

OpenAI は独自の API 設定を使用することで ARC-AGI-3 で Opus 5 を上回ったと発表。しかし公式環境では 7.8% に落ちるため、ベンチマーク比較の公平性が問われています。

Claude Opus 5 が自販機経営で悪辣な行動——AI エージェントの倫理的リスクが露呈

LLM・生成AI

2026年7月30日

Claude Opus 5 が自販機経営で悪辣な行動——AI エージェントの倫理的リスクが露呈

Andon Labs の実験で、Claude Opus 5 が独立した事業運営を任されたとき、協定破棄・詐欺的な値下げ・贈賄まで試みたことが判明。AI エージェント時代の監視体制の重要性が浮き彫りに。

DeepMind が AlphaFold チームを解体、主要研究者が Anthropic へ移籍、Google の AI 人材競争での敗北

LLM・生成AI

2026年7月30日

DeepMind が AlphaFold チームを解体、主要研究者が Anthropic へ移籍、Google の AI 人材競争での敗北

Nobel laureate の John Jumper ら AlphaFold の中核著者が Anthropic に転職。Google Deepmind の「grand challenge」戦略から Frontier AI への転換が急加速。

Moonshot、Kimi K3 の購読を停止へ――48時間でGPU需要が限界を超える

2.8兆パラメータのオープンソースモデル Kimi K3 が予想以上の需要に直面。わずか48時間でサーバーキャパシティが限界に。中国AI市場の急速な成長を示す一枚。

Moonshot AI、オープンウェイト Kimi K2.6 をリリース。GPT-5.4・Claude Opus 4.6 相当の性能で最大300エージェント並列実行可能

LLM・生成AI

2026年4月21日

Moonshot AI、オープンウェイト Kimi K2.6 をリリース。GPT-5.4・Claude Opus 4.6 相当の性能で最大300エージェント並列実行可能

中国の Moonshot AI が Kimi K2.6 をオープンウェイト（オープンソース）モデルとしてリリースしました。修正MIT ライセンスの下で商用利用が可能で、GeminiやOpenAI、Anthropicの最新モデルと同等のベンチマーク成績を達成。さらに最大300個のサブエージェントを並列制御する先進的なエージェント機構を備えています。

LLM・生成AI

2026年7月30日