Luxが拓くデスクトップ新時代
OpenAGIのLuxはスクリーンショットを理解しSlackやExcelなどネイティブアプリまで自動操作する先進的なエージェントで、SDK公開とIntelとの協業により現場導入が一層期待されます。
続きを読む10件の記事が見つかりました
OpenAGIのLuxはスクリーンショットを理解しSlackやExcelなどネイティブアプリまで自動操作する先進的なエージェントで、SDK公開とIntelとの協業により現場導入が一層期待されます。
続きを読むFara-7Bは視覚入力だけで家庭用デバイスをローカル制御する小型AIの試みで、低遅延やプライバシー保護が期待されますが認識精度や互換性、更新運用の改善が実用化の鍵であるため、THE DECODERの報道を基に整理した本稿を参考に、今後の公式発表やデモにご注目ください。
続きを読む標準的な映像だけでピアノ演奏中の手の筋活動を高精度に推定する技術が登場し、教育やリハーサル、研究、機器設計など幅広い分野で非接触の新たな解析手法を提供すると期待され、実運用に向けた倫理や公平性の検討も進みつつあります。
続きを読むGoogleのNano Banana ProはGemini 3を核に、高解像度化と編集機能、ウェブ検索連携でAI画像の精度と実用性を高めます。クリエイターや企業は制作効率と出典確認の恩恵を受けつつ、導入時は著作権や誤情報対策を検討する価値があります。
続きを読むGoogleのGemini 3は、検索やアプリを横断して作業を自動化する新世代のAIで、Visual LayoutやDynamic View、Gemini Agentを通じてエコシステム統合と開発効率を高め、企業の生産性向上に貢献する可能性があります。
続きを読むAlphaEarth Foundationsが提案する約1.4兆の埋め込みとGoogle Earth EngineのSatellite Embeddingは、10×10m単位で地球を統一表現し保全や農業モニタリングをより迅速で高精度に進める可能性を示しています。
続きを読むGoogle Geminiが複数の参照画像でAI動画生成の制御力を高める機能を導入し、クリエイターの表現精度や企業の制作効率が向上する一方、著作権やプライバシー、悪用対策の整備が急務となります
続きを読むBaiduのERNIE 5.0はネイティブなマルチモーダル設計と商用+オープンの二刀流戦略でGPT系に挑みますが、企業は性能・価格・ライセンスを自社データで検証し、用途に応じたハイブリッド運用を検討する必要があります。
続きを読むBaiduの新マルチモーダルAI「ERNIE-4.5-VL-28B」は28Bだが入力ごとに約3Bだけ活性化するMoE設計で、Apache 2.0で公開され80GB GPU運用を想定しますが独立検証が必須です。
続きを読む