StiefelとMuonで巨大モデルを安定化
Stiefel(直交制約)とMuon(更新量を整える正規化)を組み合わせる新設計は、巨大モデルの数値安定性と性能向上を両立する可能性があり、実装工夫で実用化が期待されます。
続きを読む全2306件の記事から 1312-1334件目を表示中
Stiefel(直交制約)とMuon(更新量を整える正規化)を組み合わせる新設計は、巨大モデルの数値安定性と性能向上を両立する可能性があり、実装工夫で実用化が期待されます。
続きを読むLoRAは条件次第でFullFTに迫る性能を示します。データ量とLoRAの容量、全層適用の可否が鍵で、実務では容量見積りとランク設計を重視すると効果的です。
続きを読むTinkerの公開によりQwen-235Bなどの大規模モデルがワンクリックに近い手軽さで微調整できるようになり、分散トレーニング管理を提供側が担い、LoRAで計算資源を共有してコストを抑えつつ研究や実験が加速すると期待され、オンボーディングは本日開始予定で主要大学や研究所が既に試験導入している点も注目です。
続きを読むOn-Policy蒸留は、小型モデルを低コストで実戦投入するための実践手法です。教師との逆KLを利用した密な報酬設計で安定的に性能向上を狙えます。AIME'24などのベンチで有望な結果が出ており、LoRA併用でさらにコスト削減が可能です。
続きを読むTinkerが教育と研究向けの助成を開始し、授業向けに学生一人あたり「0クレジット」配布、金額表記が欠けたResearch Grantsの開始もありつつ、スタンフォードやCMUでの活用事例が示すように教育と研究の連携が一層進みそうです。
続きを読むThinking MachinesのTinker募集は、研究者とビルダーが自由にモデルを訓練し成果を公開する舞台を提供し、write-upやオープンソース公開を通じて透明性と再現性に基づく堅実なAI研究文化の拡大を促し、参加希望はtinker@thinkingmachines.aiへご連絡ください。
続きを読むTinkerのGA公開で誰でも利用可能になり、長推論に強いKimi K2や視覚入力Qwen3-VLが加わって、開発効率と実務適用の幅が一気に広がります。
続きを読むベルリンで橋付近の火災が原因とみられる停電が発生し、最大で3万5千戸と1,900事業所が影響を受ける可能性があり、復旧には数日を要する見込みです。公式情報の確認と備えの見直しが重要です。
続きを読む英国の専門家デイビッド・ダルリンプルの指摘を踏まえて、急速に進化するAIに対し、政府や企業、国際社会が連携し、技術的検証や法整備、運用上のリスク管理を同時に進める現実的な安全対策を速やかに整える重要性をわかりやすく解説します。
続きを読むAnthropic社長ダニエラ・アモデイの見解をもとに、AIの指数成長と人材や組織の制約を整理しました。成長の可能性と現実的な注意点を両方踏まえ、企業と個人が取るべき視点をやさしく解説します。
続きを読むニューヨーク大学(NYU)の36名対象実験では、1人42セントの音声AI口頭試験が学生の理解と教員の授業設計の改善点を明らかにし、透明性と運用ルール整備がAI活用の前向きな一歩になることを示しました。
続きを読む米国11州でAIデータセンター計画の約3分の2が阻止・遅延の局面に入り、環境や地域の不安が表面化している今、企業と自治体が透明性を高め継続的に対話することが投資と地域共生の道を拓く鍵です
続きを読む最新研究は大型言語モデル(例:ChatGPT)の高い問題解決力とともに、解法の根拠をより明確に示す説明性強化の必要性と改善の道筋を教育現場や企業に示しています。
続きを読むジェフ・ベゾス氏が2025年6〜7月に約2,500万株を売却した事実をもとに、株高と個人の現金化の関係や市場への影響をわかりやすく整理し、投資家が参考にできる今後の注目点を提示します。
続きを読む光の力で計算する光学AIは省エネや高速化の期待が高い一方、理論と実験にズレが生じます。現場データを取り込むモデルフリーの強化学習は、そのギャップを縮める有力な手段であり、段階的な検証とハード・ソフト協調の設計が実用化の鍵になります。
続きを読むマドゥーロ拘束後、TikTokやInstagram、XでAI生成映像と旧映像が組み合わされた偽情報が拡散しています。Wiredの指摘も踏まえ、混乱を避けるための具体的な確認手順とプラットフォームへの改善点をわかりやすくご案内します。
続きを読むByteDanceのStoryMemは、キャラクターと背景の見た目を“記憶”してAI映像の外観の一貫性を高める仕組みです。今後は実用事例と定量評価の公開が注目点になります。
続きを読むYann LeCunがMetaを退社して独立起業へ動いたと報じられ、Zuckerbergの反応やベンチマーク疑惑、AI部門の人材動向が業界の焦点となり今後の競争と協業に期待が高まっています。
続きを読むAnthropicのClaude CodeがGoogleの上級エンジニアから高く評価され、「1時間で1年分の成果」を示唆する報告と実務的なワークフローのヒントが公開され、開発現場の生産性向上に期待が高まっています。
続きを読むColossusを象徴とする事例は、AIの大規模計算がエネルギーと水の需要に影響する現実を示しており、透明性と第三者検証を進めれば技術発展と気候保護の両立が期待できます。
続きを読むOpenAIの共同創業者グレッグ・ブロックマン氏が2500万ドルを政治系スーパーパックに寄付したことが、AI規制の議論を活性化しています。寄付の背景と今後の規制案を冷静に見極め、技術革新と倫理・安全性の両立を期待しましょう。
続きを読む2021年以降、韓国発ノーコード機械学習ツールは工場・医療・造船などで導入が進み、現場の負担を軽減しつつ実務活用を後押しする存在として注目されています。
続きを読む