Alibaba Qwen3.6-27B、15倍大きな前バージョンを圧倒――パラメータ効率で新基準
Alibaba が27億パラメータの Qwen3.6-27B をリリース。SWE-bench Verified で 77.2 を達成し、15倍の規模を持つ前バージョン Qwen3.5-397B を上回る。密度型アーキテクチャで展開効率と性能の両立を実現。
続きを読むAlibaba が27億パラメータの Qwen3.6-27B をリリース。SWE-bench Verified で 77.2 を達成し、15倍の規模を持つ前バージョン Qwen3.5-397B を上回る。密度型アーキテクチャで展開効率と性能の両立を実現。
続きを読むGoogleがAnthropicのコーディング能力の遅れに危機感。Brin共同創業者がDeepMind内に専門チーム立ち上げ、内部開発者向けツール追跡ツール『Jetski』で進捗を監視。エージェント実行能力向上に注力。
続きを読むClaude Opus 4.7 は SWE-bench Pro コーディングベンチマークで 64.3% を獲得し、OpenAI の GPT-5.4(57.7%)を上回った。Anthropic は同時にサイバーセキュリティ機能を意図的に縮小したセキュリティ検証プログラムも開始した。
続きを読む