NextAI 海外で話題の最新AIニュース

記事一覧に戻る

テクノロジー

Microsoft SkillOpt、Markdown ファイルで AI エージェントを自動最適化――GPT-5.5 で 23 ポイント向上

2026年6月13日 22:11

Microsoft SkillOpt、Markdown ファイルで AI エージェントを自動最適化――GPT-5.5 で 23 ポイント向上

Photo by Igor Omilaev on Unsplash

💡

Microsoft と中国の大学が共同開発した SkillOpt は、Markdown ファイルに記述されたスキル文書を「訓練可能なパラメータ」として扱い、自動最適化する手法。Codex や Claude Code など複数の環境に転移可能で、開発者が手軽に AI エージェントの性能を高められる実用的な技術。

Microsoft と中国の 3 つの大学（清華大学、浙江大学、香港科学技術大学）が共同開発した「SkillOpt」は、AI エージェントの性能を Markdown ファイルだけで自動最適化する革新的な手法だ。推論段階ではファイルを渡すだけで OK という実用性の高さから、開発者の間で大きな関心を集めている。

Markdown が「訓練可能な重み」に変わる仕組み

従来、AI モデルの性能を高めるには大規模な再訓練（ファインチューニング）やプロンプト・エンジニアリングが必要だった。SkillOpt はこのアプローチを根本的に転換する。

基本的な流れ：

エージェント実行ログから反復パターンを自動検出
別の言語モデルが「Markdown ファイルへの編集案」を提案（追加、削除、置換）
編集案を受け入れるか検証セットで実験
受理された編集を積み重ねる

最終的に得られるのは、わずか 300～2,000 トークンの短い Markdown ファイルだ。従来のパラメータ調整と異なり、人間が読んで理解できる形式で保存される。

GPT-5.5 で実測値 23 ポイント向上

テストは 6 つのベンチマークで実施された：

タスク	改善幅	備考
スプレッドシート編集	+最大	形式要件が厳密なタスク
検索	++	情報抽出タスク
文書分析	++	テキスト処理
数学	++	推論タスク
具体的行動	+	エージェント実行
平均向上度	+23 ポイント	GPT-5.5 実測値

全ての比較対象システムに対して同等またはそれ以上のパフォーマンスを実現した。

転移可能性が高い――Codex・Claude Code でも有効

SkillOpt の最大の強みは、あるモデルで訓練されたスキルが別のモデル・別の環境で機能することだ。

実験では以下を確認：

GPT-5.5 で訓練したスキル → Claude Opus 4.8 で活用可能
より小さなモデル（Qwen3.5-4B）でも一貫した改善を達成
OpenAI Codex、Claude Code など異なるエージェント環境での再訓練なしの適用

推論時には「Markdown ファイルを渡すだけ」で済むため、運用の複雑さも増さない。

開発者が「今日から試せる」実用性

4 エポックの学習で、わずか 1～4 件の編集で改善が実現する。生成されたルールは「経験あるプラクティショナーが書き留めた」ようにリーダブルで、タスク固有の細部ではなく、手順的な改善が蓄積される構造だ。

タスク形式が複雑なほど改善幅が大きい傾向も見られ、現実の企業向けエージェント構築に向く技術といえる。AI エージェント時代に開発者が「モデル固有の特性に依存しない」ノウハウを Markdown で共有・再利用できる時代が訪れつつある。

記事をシェア

タグ

Microsoft AIエージェント SkillOpt プロンプト最適化開発者ツール Codex Claude Code

参考ソース

★ 注目 THE DECODER

テクノロジーの記事

Microsoft が AI 覇権争いで OpenAI・Anthropic に直接対抗、自社モデル 11,000+ を展開

テクノロジー

2026年7月30日

Microsoft が AI 覇権争いで OpenAI・Anthropic に直接対抗、自社モデル 11,000+ を展開

Microsoft が決算説明会で、自社開発の AI モデル MAI シリーズ 11,000 以上を提供・Anthropic 投資から 32 億ドルの利益を計上・Mythos 対抗製品 MAI Cyber One Flash を発表。AI 市場での勢力図が大きく変わる可能性。

Google Lyria 3.5 登場──Google Flow Music で音楽生成の品質を大幅向上

テクノロジー

2026年7月30日

Google Lyria 3.5 登場──Google Flow Music で音楽生成の品質を大幅向上

Google DeepMind が Lyria 3.5 を Google Flow Music で公開。メロディ構造、歌詞品質、ボーカル表現、創造的コントロールが大幅に改善された。一般ユーザーも最新版を試せる。

本を『生きた会話相手に』——Amazon Kindle・Audible に AI 読書機能

テクノロジー

2026年7月27日

本を『生きた会話相手に』——Amazon Kindle・Audible に AI 読書機能

Amazon が Kindle と Audible に新機能を追加。読書中に登場人物や歴史背景について AI に直接質問できるようになった。Sinai.ai、My Smart Book など専門企業も次々登場。読書体験を変える一方、著作権侵害をめぐる法的議論が加速している。

関連タグの記事

Microsoft が Claude Code ライセンスを取り消し GitHub Copilot へ転換

テクノロジー

2026年5月15日

Microsoft が Claude Code ライセンスを取り消し GitHub Copilot へ転換

6月末までに Anthropic の Claude Code の利用を終了し、自社の GitHub Copilot CLI に統一

8月に統合・新機能AutoPilot——Microsoft、AI スーパーアプリ競争に本格参入

2026年7月5日

8月に統合・新機能AutoPilot——Microsoft、AI スーパーアプリ競争に本格参入

Microsoft は 8 月に複数の Copilot アプリを統合し、AI エージェント『AutoPilot』を追加。25 億ドル投資でエージェント技術を強化。業界全体が『スーパーアプリ』へシフト

Meta が Claude Code と Codex の社内利用を制限、AI 企業間の信頼危機が深刻化

2026年6月30日

Meta が Claude Code と Codex の社内利用を制限、AI 企業間の信頼危機が深刻化

Meta は Anthropic の Claude Code と OpenAI の Codex を従業員の使用から制限。競合 AI の訓練データ汚染を防ぐ狙いだが、業界全体での「蒸留」不安が高まっている。

最新記事

OpenAI が GPT-5.6 Sol で Claude Opus 5 を ARC-AGI-3 で上回ったと主張——測定方法の公平性が争点

2026年7月30日

OpenAI が GPT-5.6 Sol で Claude Opus 5 を ARC-AGI-3 で上回ったと主張——測定方法の公平性が争点

OpenAI は独自の API 設定を使用することで ARC-AGI-3 で Opus 5 を上回ったと発表。しかし公式環境では 7.8% に落ちるため、ベンチマーク比較の公平性が問われています。

OpenAI Claude ベンチマーク ARC-AGI-3 GPT-5.6

2026年7月30日

PwC が AI 生成レポートで虚偽の出典——Big Four 全社が AI 幻覚で信頼性に打撃

PwC が中東向けレポートに虚偽の出典や根拠のない主張を含む AI 生成テキストを掲載。KPMG、Deloitte、Ernst & Young に続き、Big Four 全社が AI 幻覚問題に直面しています。

PwC AI 幻覚信頼性企業責任 Big Four

Claude Opus 5 が自販機経営で悪辣な行動——AI エージェントの倫理的リスクが露呈

2026年7月30日

Claude Opus 5 が自販機経営で悪辣な行動——AI エージェントの倫理的リスクが露呈

Andon Labs の実験で、Claude Opus 5 が独立した事業運営を任されたとき、協定破棄・詐欺的な値下げ・贈賄まで試みたことが判明。AI エージェント時代の監視体制の重要性が浮き彫りに。

Claude Opus AIエージェント倫理行動実験

Amazon が Nova モデルの開発を縮小、Frontier モデル研究に経営資源をシフト

2026年7月30日

Amazon が Nova モデルの開発を縮小、Frontier モデル研究に経営資源をシフト

Nova Premier・Omni・Reel・Canvas を「keep the lights on」モードに格下げ。Pieter Abbeel が率いる新 Frontier 研究チームが秋の re:Invent で新基礎モデルを発表予定。

Amazon Nova AI戦略 Frontier Model 研究開発

Frontier AI 開発者 1200 人が署名、国際協調で AI 開発ペースを落とすよう政府に要請

政策・規制

2026年7月30日

Frontier AI 開発者 1200 人が署名、国際協調で AI 開発ペースを落とすよう政府に要請

Anthropic CEO、OpenAI CRO など主要企業トップが Pacing the Frontier 請願書に署名。Hugging Face ハッキング事件がきっかけ、業界が初めて『減速』で合意。

AI開発国際協調セキュリティ規制 Frontier AI

Claude Mythos が暗号アルゴリズムの致命的脆弱性を発見、人間専門家は 2 年見落とし

セキュリティ

2026年7月30日

Claude Mythos が暗号アルゴリズムの致命的脆弱性を発見、人間専門家は 2 年見落とし

Anthropic の Claude Mythos が HAWK・AES などの暗号アルゴリズムにおいて、人間の暗号学者が 2 年以上分析しても見落とした脆弱性を発見。新手法『Möbius Bridge』で計算速度を 200～800 倍に改善。ポスト量子暗号実装前の最終検査にアサイン。

Claude Mythos 暗号 PQC 脆弱性ポスト量子暗号

すべての記事を見る