Moonshot AI がリリースした Kimi K2.7 Code は、オープンウェイトのコーディング特化モデルとして注目を集めている。1 兆パラメータながら、エージェント構築や推論効率を重視した設計で、西側の専有モデルとは全く異なる選択肢を開発者に提供している。

スペック:1 兆パラメータ、256K コンテキスト

Kimi K2.7 Code の基本スペック:

項目仕様
総パラメータ1 兆(Mixture-of-Experts)
アクティブパラメータ32 億(トークンあたり)
コンテキスト長256,000 トークン
モダリティマルチモーダル(画像・動画・テキスト)
アーキテクチャMixture-of-Experts(MoE)

MoE 設計により、メモリとコンピュート効率を最適化しながら、大規模な処理能力を実現している。256K コンテキストは、大型のコードベースや複雑なドキュメント処理に対応可能だ。

価格が革新的――西側競合と 12 倍の差

Kimi K2.7 Code の最大の競争力は、圧倒的な価格優位性だ。

モデル入力出力キャッシュ時
Kimi K2.7 Code$0.95/1M$4$0.19/1M
Claude Fable 5$48
GPT-5.5

出力だけ比較すると、Fable 5 は Kimi K2.7 の 12 倍以上高い。同じ予算で Kimi K2.7 なら 12 回推論できる価格帯だ。

キャッシュ効果の恩恵も大きく、キャッシュヒット時の入力費は $0.19 まで低下。長期間のコンテキストを保持するエージェント・ワークフローに最適化されている。

ベンチマーク:標準テストでは劣位、エージェント向けでは優位

一般的なコーディングベンチマークでは、Kimi K2.7 は GPT-5.5 や Claude Opus 4.8 に後れを取る。だが、エージェント向けの実際のユースケースでは異なる結果が現れる。

MCPMark Verified(エージェント実行ベンチマーク):

モデルスコア
Kimi K2.7 Code81.1
Claude Opus 4.876.4
GPT-5.5

MCPMark は「エージェントが実際に外部ツール(ファイル操作、API 呼び出し、コード実行)を操作できるか」をテストする実践的なベンチマークだ。この観点では Kimi K2.7 が Claude を上回っている。

推論効率が高い――K2.6 比で 30% トークン削減

前バージョン K2.6 と比較して、Kimi K2.7 Code は以下の改善を実現:

  • 推論 30% トークン削減(同じタスクで少ないトークン消費)
  • エージェント構築の最適化
  • VLLM・SGLang などの推論エンジン対応
  • 既存デプロイ設定の再利用可能

特に、エージェント・ワークフローでは、トークン削減は直接的にコスト削減につながるため、実用性が高い。

開発者の選択肢が広がる

Kimi K2.7 Code の登場は、開発者に以下の選択肢を与える:

  1. 標準的なコーディング性能は必要ない → Kimi で十分
  2. エージェント構築が主目的 → Kimi の方が効率的
  3. 長期コンテキストを保持するワークフロー → キャッシュ効率で有利
  4. 低予算で大規模推論 → 12 倍の価格優位

西側の専有モデル中心の時代から、開発者が「タスクと予算に応じた選択」を自由にできる時代へ転換しつつある。Kimi K2.7 は、その転換点を象徴するモデルといえるだろう。