タグ一覧に戻る

LLM

記事数: 54
AI 訓練の「メモリ壁」を Ethernet ベースの拡張技術で突破、韓国 ETRI が OmniXtend 開発

AI 訓練の「メモリ壁」を Ethernet ベースの拡張技術で突破、韓国 ETRI が OmniXtend 開発

大規模 AI 訓練を阻害する「メモリ壁」問題を解決する技術が登場。韓国の電子通信研究院(ETRI)が開発した OmniXtend は、Ethernet を メモリ相互接続ファブリックとして活用し、分散デバイス間でのメモリ共有を実現。LLM 推論性能を 2 倍以上改善します。

続きを読む
Cursor Composer 2.5が高性能・低コストを実現、Opus 4.7・GPT-5.5と同等ベンチマークを達成

Cursor Composer 2.5が高性能・低コストを実現、Opus 4.7・GPT-5.5と同等ベンチマークを達成

Cursor が新モデル Composer 2.5 をリリース。Opus 4.7 と GPT-5.5 と同等のベンチマーク結果を実現しながら、価格は $0.50/$2.50/100万トークンと大幅に低廉。開発者が高品質モデルをより手軽に利用できる環境が整いました。

続きを読む
Amazon SageMaker、AI エージェント搭載の自動ファインチューニング――企業の LLM カスタマイズを大幅簡素化

Amazon SageMaker、AI エージェント搭載の自動ファインチューニング――企業の LLM カスタマイズを大幅簡素化

Amazon が SageMaker AI に agentic fine-tuning 機能を追加。開発者が自然言語で指示すると、データ準備からモデル評価・デプロイまでの全プロセスを自動化。Llama・Qwen・Deepseek・Nova など主要オープンモデルに対応

続きを読む
Mistral の Le Chat、イラン戦争に関する偽情報を60%の頻度で拡散――NewsGuard 監査が明かす LLM の脆弱性

Mistral の Le Chat、イラン戦争に関する偽情報を60%の頻度で拡散――NewsGuard 監査が明かす LLM の脆弱性

ファクトチェック機関 NewsGuard が Mistral の チャットボット「Le Chat」を監査し、イラン関連の国家支援偽情報に対する深刻な脆弱性を発見。誘導プロンプトで60%、悪意あるプロンプトで80%のエラー率を記録。

続きを読む
「タルキー」の異なる未来像――1930年までの知識で学習したLLMが予測する2026年

「タルキー」の異なる未来像――1930年までの知識で学習したLLMが予測する2026年

13Bパラメータの言語モデル『Talkie』は、1931年以降の出版物を一切学習せずに学習されたユニークなLLM。蒸気船とロボット技術の将来像、そして第二次世界大戦の不可視性を描く、時間軸を逆行する知識構造の実験から見えるもの。

続きを読む

投資銀行 500 人が AI 出力を本番評価:ゼロ件が『そのまま送付可能』

投資銀行マン 500 人による実務レビューで、最高性能の GPT-5.4 でも 0 件が クライアント送付可。修正の出発点として使用可能は 16% のみ。Claude Opus 4.6、Gemini でも同様傾向。AI が高性能化する一方、実務信頼性の課題が明らかに。

続きを読む
Moonshot AI、オープンウェイト Kimi K2.6 をリリース。GPT-5.4・Claude Opus 4.6 相当の性能で最大300エージェント並列実行可能

Moonshot AI、オープンウェイト Kimi K2.6 をリリース。GPT-5.4・Claude Opus 4.6 相当の性能で最大300エージェント並列実行可能

中国の Moonshot AI が Kimi K2.6 をオープンウェイト(オープンソース)モデルとしてリリースしました。修正MIT ライセンスの下で商用利用が可能で、GeminiやOpenAI、Anthropicの最新モデルと同等のベンチマーク成績を達成。さらに最大300個のサブエージェントを並列制御する先進的なエージェント機構を備えています。

続きを読む
Arcee:従業員26人のスタートアップが高性能オープンソース LLM で頭角を現す

Arcee:従業員26人のスタートアップが高性能オープンソース LLM で頭角を現す

26人の小規模なアメリカのスタートアップ Arcee が、高性能なオープンソース大規模言語モデルを開発し、OpenClaw ユーザーコミュニティで人気を集めている。大手企業との競争の中で、専門性と効率性で存在感を示している。

続きを読む
【ChatGPT 5.2 最新情報】リリース前夜のOpenAI「コードレッド」とGoogle Gemini 3への対抗策

【ChatGPT 5.2 最新情報】リリース前夜のOpenAI「コードレッド」とGoogle Gemini 3への対抗策

OpenAIはGoogleのGemini 3に対抗し、「コードレッド」を宣言。12月9日前後にChatGPT 5.2をリリース予定。応答速度・安定性の向上、パーソナライズ機能強化、ハルシネーション65〜80%削減が特徴。先行提供はPlus/Proユーザー向け。AI競争激化の中、ユーザー体験の向上と収益化が狙い。正式リリース後、さらなる進化が期待される。

続きを読む
Google、開発者向けに最新AIモデル「Gemini 3」を公開 AI StudioとVertex AIでプレビュー提供開始

Google、開発者向けに最新AIモデル「Gemini 3」を公開 AI StudioとVertex AIでプレビュー提供開始

Googleが公開した最新AI「Gemini 3」は、1Mトークン長文理解とマルチモーダル、エージェント的自動コーディングを一体化した“開発者向けモンスターLLM”。AI Studioで無料試用し、そのままVertex AIで本番投入も可能です。既存LLMと何が違い、どんなアプリを一気に現実にできるのか、具体例とAPIの勘所を解説します。

続きを読む
ChatGPTに「グループチャット」登場──AIと人が同じルームで協働する時代へ

ChatGPTに「グループチャット」登場──AIと人が同じルームで協働する時代へ

OpenAIがChatGPTに新機能「グループチャット」を公開した。最大20人が同じルームに入り、ChatGPTを含めた全員で計画立案や議論、資料共有ができる。GPT-5.1 Autoによる高度な文脈理解で、必要なときにだけ発言する“空気の読めるAIメンバー”として機能。個人メモリは使用されず、プライバシーも分離。日常の相談からチームのブレストまで、AIと人が同じ空間で協働する新しいコミュニケーション形態が始まった。

続きを読む
出典公開でLLM評価が変わる理由――驚きの実態

出典公開でLLM評価が変わる理由――驚きの実態

出典を明かすとLLMの評価が左右される報告が出ました。文脈変化や学習データの偏り、アノテーション由来のバイアスが疑われ、教育や採用で公平性が損なわれる恐れがあるため、ブラインド評価や外部監査、判断に人間を残すハイブリッド運用が重要であり、早急な対応が求められます。

続きを読む