Moonshot Kimi K2.7 Code、オープンモデルで西側の 12 倍安い――エージェント最適化で Claude を上回る
Moonshot AI がリリースした 1 兆パラメータのオープンモデル Kimi K2.7 Code は、出力価格で Fable 5 の 12 倍安いプライシングを実現。MCPMark エージェント向けベンチマークでは Claude Opus 4.8 を上回り、エージェント・ワークフロー構築に最適化された実用的な選択肢として登場。
Moonshot AI がリリースした Kimi K2.7 Code は、オープンウェイトのコーディング特化モデルとして注目を集めている。1 兆パラメータながら、エージェント構築や推論効率を重視した設計で、西側の専有モデルとは全く異なる選択肢を開発者に提供している。
スペック:1 兆パラメータ、256K コンテキスト
Kimi K2.7 Code の基本スペック:
| 項目 | 仕様 |
|---|---|
| 総パラメータ | 1 兆(Mixture-of-Experts) |
| アクティブパラメータ | 32 億(トークンあたり) |
| コンテキスト長 | 256,000 トークン |
| モダリティ | マルチモーダル(画像・動画・テキスト) |
| アーキテクチャ | Mixture-of-Experts(MoE) |
MoE 設計により、メモリとコンピュート効率を最適化しながら、大規模な処理能力を実現している。256K コンテキストは、大型のコードベースや複雑なドキュメント処理に対応可能だ。
価格が革新的――西側競合と 12 倍の差
Kimi K2.7 Code の最大の競争力は、圧倒的な価格優位性だ。
| モデル | 入力 | 出力 | キャッシュ時 |
|---|---|---|---|
| Kimi K2.7 Code | $0.95/1M | $4 | $0.19/1M |
| Claude Fable 5 | — | $48 | — |
| GPT-5.5 | — | — | — |
出力だけ比較すると、Fable 5 は Kimi K2.7 の 12 倍以上高い。同じ予算で Kimi K2.7 なら 12 回推論できる価格帯だ。
キャッシュ効果の恩恵も大きく、キャッシュヒット時の入力費は $0.19 まで低下。長期間のコンテキストを保持するエージェント・ワークフローに最適化されている。
ベンチマーク:標準テストでは劣位、エージェント向けでは優位
一般的なコーディングベンチマークでは、Kimi K2.7 は GPT-5.5 や Claude Opus 4.8 に後れを取る。だが、エージェント向けの実際のユースケースでは異なる結果が現れる。
MCPMark Verified(エージェント実行ベンチマーク):
| モデル | スコア |
|---|---|
| Kimi K2.7 Code | 81.1 |
| Claude Opus 4.8 | 76.4 |
| GPT-5.5 | — |
MCPMark は「エージェントが実際に外部ツール(ファイル操作、API 呼び出し、コード実行)を操作できるか」をテストする実践的なベンチマークだ。この観点では Kimi K2.7 が Claude を上回っている。
推論効率が高い――K2.6 比で 30% トークン削減
前バージョン K2.6 と比較して、Kimi K2.7 Code は以下の改善を実現:
- 推論 30% トークン削減(同じタスクで少ないトークン消費)
- エージェント構築の最適化
- VLLM・SGLang などの推論エンジン対応
- 既存デプロイ設定の再利用可能
特に、エージェント・ワークフローでは、トークン削減は直接的にコスト削減につながるため、実用性が高い。
開発者の選択肢が広がる
Kimi K2.7 Code の登場は、開発者に以下の選択肢を与える:
- 標準的なコーディング性能は必要ない → Kimi で十分
- エージェント構築が主目的 → Kimi の方が効率的
- 長期コンテキストを保持するワークフロー → キャッシュ効率で有利
- 低予算で大規模推論 → 12 倍の価格優位
西側の専有モデル中心の時代から、開発者が「タスクと予算に応じた選択」を自由にできる時代へ転換しつつある。Kimi K2.7 は、その転換点を象徴するモデルといえるだろう。