未ラベル動画が拓くAI訓練の未来
MetaのFAIRとNYUが未ラベル動画を用いゼロからマルチモーダルAIを訓練したと報じられています。テキスト依存の限界を超え、データ多様化とコスト削減が期待される一方、評価指標や倫理・法の整備が重要になる点が示唆されています。
続きを読むMetaのFAIRとNYUが未ラベル動画を用いゼロからマルチモーダルAIを訓練したと報じられています。テキスト依存の限界を超え、データ多様化とコスト削減が期待される一方、評価指標や倫理・法の整備が重要になる点が示唆されています。
続きを読むAeneasはテキストと画像を同時に扱うマルチモーダルAIで、176,000件超の碑文データを活用し、確率的年代推定と研究者との協働で解読を高速化します。
続きを読むDeepEyesV2は画像解析に加え、ウェブ検索やコード実行など外部ツールを巧みに使うことで最新性と正確性を高め、単なるモデル肥大化とは異なる実用的なAI設計を示しています。
続きを読む