Microsoft と中国の 3 つの大学(清華大学、浙江大学、香港科学技術大学)が共同開発した「SkillOpt」は、AI エージェントの性能を Markdown ファイルだけで自動最適化する革新的な手法だ。推論段階ではファイルを渡すだけで OK という実用性の高さから、開発者の間で大きな関心を集めている。

Markdown が「訓練可能な重み」に変わる仕組み

従来、AI モデルの性能を高めるには大規模な再訓練(ファインチューニング)やプロンプト・エンジニアリングが必要だった。SkillOpt はこのアプローチを根本的に転換する。

基本的な流れ

  1. エージェント実行ログから反復パターンを自動検出
  2. 別の言語モデルが「Markdown ファイルへの編集案」を提案(追加、削除、置換)
  3. 編集案を受け入れるか検証セットで実験
  4. 受理された編集を積み重ねる

最終的に得られるのは、わずか 300~2,000 トークンの短い Markdown ファイルだ。従来のパラメータ調整と異なり、人間が読んで理解できる形式で保存される。

GPT-5.5 で実測値 23 ポイント向上

テストは 6 つのベンチマークで実施された:

タスク改善幅備考
スプレッドシート編集+最大形式要件が厳密なタスク
検索++情報抽出タスク
文書分析++テキスト処理
数学++推論タスク
具体的行動+エージェント実行
平均向上度+23 ポイントGPT-5.5 実測値

全ての比較対象システムに対して同等またはそれ以上のパフォーマンスを実現した。

転移可能性が高い――Codex・Claude Code でも有効

SkillOpt の最大の強みは、あるモデルで訓練されたスキルが別のモデル・別の環境で機能することだ。

実験では以下を確認:

  • GPT-5.5 で訓練したスキル → Claude Opus 4.8 で活用可能
  • より小さなモデル(Qwen3.5-4B)でも一貫した改善を達成
  • OpenAI Codex、Claude Code など異なるエージェント環境での再訓練なしの適用

推論時には「Markdown ファイルを渡すだけ」で済むため、運用の複雑さも増さない。

開発者が「今日から試せる」実用性

4 エポックの学習で、わずか 1~4 件の編集で改善が実現する。生成されたルールは「経験あるプラクティショナーが書き留めた」ようにリーダブルで、タスク固有の細部ではなく、手順的な改善が蓄積される構造だ。

タスク形式が複雑なほど改善幅が大きい傾向も見られ、現実の企業向けエージェント構築に向く技術といえる。AI エージェント時代に開発者が「モデル固有の特性に依存しない」ノウハウを Markdown で共有・再利用できる時代が訪れつつある。