Microsoft SkillOpt、Markdown ファイルで AI エージェントを自動最適化――GPT-5.5 で 23 ポイント向上
Microsoft と中国の大学が共同開発した SkillOpt は、Markdown ファイルに記述されたスキル文書を「訓練可能なパラメータ」として扱い、自動最適化する手法。Codex や Claude Code など複数の環境に転移可能で、開発者が手軽に AI エージェントの性能を高められる実用的な技術。
Microsoft と中国の 3 つの大学(清華大学、浙江大学、香港科学技術大学)が共同開発した「SkillOpt」は、AI エージェントの性能を Markdown ファイルだけで自動最適化する革新的な手法だ。推論段階ではファイルを渡すだけで OK という実用性の高さから、開発者の間で大きな関心を集めている。
Markdown が「訓練可能な重み」に変わる仕組み
従来、AI モデルの性能を高めるには大規模な再訓練(ファインチューニング)やプロンプト・エンジニアリングが必要だった。SkillOpt はこのアプローチを根本的に転換する。
基本的な流れ:
- エージェント実行ログから反復パターンを自動検出
- 別の言語モデルが「Markdown ファイルへの編集案」を提案(追加、削除、置換)
- 編集案を受け入れるか検証セットで実験
- 受理された編集を積み重ねる
最終的に得られるのは、わずか 300~2,000 トークンの短い Markdown ファイルだ。従来のパラメータ調整と異なり、人間が読んで理解できる形式で保存される。
GPT-5.5 で実測値 23 ポイント向上
テストは 6 つのベンチマークで実施された:
| タスク | 改善幅 | 備考 |
|---|---|---|
| スプレッドシート編集 | +最大 | 形式要件が厳密なタスク |
| 検索 | ++ | 情報抽出タスク |
| 文書分析 | ++ | テキスト処理 |
| 数学 | ++ | 推論タスク |
| 具体的行動 | + | エージェント実行 |
| 平均向上度 | +23 ポイント | GPT-5.5 実測値 |
全ての比較対象システムに対して同等またはそれ以上のパフォーマンスを実現した。
転移可能性が高い――Codex・Claude Code でも有効
SkillOpt の最大の強みは、あるモデルで訓練されたスキルが別のモデル・別の環境で機能することだ。
実験では以下を確認:
- GPT-5.5 で訓練したスキル → Claude Opus 4.8 で活用可能
- より小さなモデル(Qwen3.5-4B)でも一貫した改善を達成
- OpenAI Codex、Claude Code など異なるエージェント環境での再訓練なしの適用
推論時には「Markdown ファイルを渡すだけ」で済むため、運用の複雑さも増さない。
開発者が「今日から試せる」実用性
4 エポックの学習で、わずか 1~4 件の編集で改善が実現する。生成されたルールは「経験あるプラクティショナーが書き留めた」ようにリーダブルで、タスク固有の細部ではなく、手順的な改善が蓄積される構造だ。
タスク形式が複雑なほど改善幅が大きい傾向も見られ、現実の企業向けエージェント構築に向く技術といえる。AI エージェント時代に開発者が「モデル固有の特性に依存しない」ノウハウを Markdown で共有・再利用できる時代が訪れつつある。