Sina の VibeThinker-3B が示唆:推論は圧縮可能、知識は圧縮不可
Sina Weibo が公開した 30 億パラメータの VibeThinker-3B は、数学・コーディングで 200~333 倍大きいモデル(DeepSeek V3.2、Kimi K2.5)と互角のスコア。一方、事実知識の問題では大規模モデルに大きく劣後。研究から浮かぶのは、論理的推論は小型モデルに圧縮可能だが、事実知識は圧縮困難という知見。
続きを読むSina Weibo が公開した 30 億パラメータの VibeThinker-3B は、数学・コーディングで 200~333 倍大きいモデル(DeepSeek V3.2、Kimi K2.5)と互角のスコア。一方、事実知識の問題では大規模モデルに大きく劣後。研究から浮かぶのは、論理的推論は小型モデルに圧縮可能だが、事実知識は圧縮困難という知見。
続きを読む中国・香港・シンガポール拠点の研究チームが Apache 2.0 で公開した新音声モデル Audio-Interaction。Qwen2.5-Omni-3B ベースで、従来の音声AIと異なり「0.4秒ごとに応答するか沈黙するかを判定」しながらリアルタイムで翻訳・文字起こしに対応。開発者が GitHub から即座に利用可能。
続きを読むAlibabのQwen3.7-Plusがマルチモーダル自律エージェントとして登場。画面認識、GUI操作、コード生成を統合し、デモで1000回のエージェント呼び出しで英語学習アプリを自動開発。GPT-5.4やOpus 4.6を上回る結果。
続きを読むAlibaba が27億パラメータの Qwen3.6-27B をリリース。SWE-bench Verified で 77.2 を達成し、15倍の規模を持つ前バージョン Qwen3.5-397B を上回る。密度型アーキテクチャで展開効率と性能の両立を実現。
続きを読むAlibaba の新型オープンソースモデル Qwen3.6-35B は、わずか 3 つのパラメータのみを活用しながら、Google Gemma 4 を SWE-bench で 73.4% vs 52.0% で上回る。オープンソース LLM の競争が激化。
続きを読むAlibaba の Qwen チームが開発した HopChain は、視覚言語モデルが複数ステップの推論で失敗する問題に対応。多段階の画像質問を自動生成し、ベンチマーク24個中20個で性能向上を実現した。
続きを読むAlibabaのQwenチームが提案した、各生成ステップに重みを付ける新しい報酬設計は、長い思考過程を誘導して推論の深さを高める可能性があり、今後の公開データと検証が注目されます。
続きを読むAlibabaの内部再編がQwenのコア人材離脱と重なり、再編後の体制安定化と人材確保が開発の鍵になりますが、新たな連携や採用で盛り返す可能性も高く、公式発表を注視しましょう。
続きを読むAlibabaのQwen開発を率いた技術トップの退任が報じられ、公式説明は未発表ながらも開発体制の見直しや協業強化、透明性向上に向けた変化が期待されています。
続きを読む2026年にQwenが市場で注目を集める可能性が高まっています。GPT-5と並ぶ選択肢に備え、企業や技術者は小規模検証と並列評価で段階的に準備を進めることをお勧めします。
続きを読むQwenの最新アップデートは、ポートレートや集合写真で人物の識別性を安定させる新機能を追加し、照明やアングルの制御も改善されて編集結果の信頼性が高まります。
続きを読むAlibabaのQwenチームが報じた新機能は、テキストだけで自然な音声を生成し、3秒のサンプルから声を再現できる可能性を示しており、利用時は同意やライセンス確認が重要です。
続きを読む