LLM・生成AIの記事一覧

Anthropic が Claude Opus 5 を発表――Opus 4.8 の2倍超える性能、価格据え置き

LLM・生成AI

LLM・生成AI

2026年6月19日

医療診断AI、医師と同等の精度を実現も課題は明白――Nature論文が可能性と限界を示唆

Nature誌の新研究により、AIシステムが複数の疾患診断で医師より正確な判断を下すことが検証されました。一方で、モデルの世代が進むと優位性が消える課題も明らかに。OpenAIの小児遺伝子疾患診断の実装事例と共に、医療AI実装の現実を報告します。

AI診断医療 Nature論文精度検証遺伝子診断

Google Docs で Gemini AI を OFF にできるように、ユーザーがプライバシーコントロールを獲得

LLM・生成AI

2026年6月18日

Google Docs で Gemini AI を OFF にできるように、ユーザーがプライバシーコントロールを獲得

Anthropic Claude nonprofit AI教育フェローシップ

Anthropic Claude Fable 5 を公開、Mythos クラスを開発者向けに提供

LLM・生成AI

更新 2026年6月11日

Anthropic Claude Fable 5 を公開、Mythos クラスを開発者向けに提供

音声AI Qwen オープンソースリアルタイム処理

Alibaba Qwen3.7-Plus が11時間で10,000行コード自動生成——ビジュアルGUI操作から完全なアプリまで

LLM・生成AI

2026年6月6日

Alibaba Qwen3.7-Plus が11時間で10,000行コード自動生成——ビジュアルGUI操作から完全なアプリまで

AlibabのQwen3.7-Plusがマルチモーダル自律エージェントとして登場。画面認識、GUI操作、コード生成を統合し、デモで1000回のエージェント呼び出しで英語学習アプリを自動開発。GPT-5.4やOpus 4.6を上回る結果。

Alibaba Qwen AIエージェントマルチモーダル自律型AI

Anthropic は Claude がコード 90% 以上を執筆していることを開示、グローバル AI 開発の一時停止を提案

LLM・生成AI

2026年6月6日

Anthropic は Claude がコード 90% 以上を執筆していることを開示、グローバル AI 開発の一時停止を提案

Anthropic が新たな内部データを公表。Claude がエンジニアリング全体のコード 90% 以上を担当し、エンジニアの生産性が 2024 年比で 8 倍に加速。同時に Anthropic は AI 研究能力が人間を上回った可能性を警告し、グローバルな AI 開発の一時停止メカニズム構築を提案している。

Anthropic Claude AI開発 AI安全性 AIエージェント

Claude Opus 4.8 完全ガイド：誠実性4倍向上、並列エージェント、エフォートコントロールの使い方

LLM・生成AI

2026年6月6日

Claude Opus 4.8 完全ガイド：誠実性4倍向上、並列エージェント、エフォートコントロールの使い方

Anthropic が 2026 年 5 月にリリースした Claude Opus 4.8 は、嘘・でたらめが前バージョン比で約4倍減少した高誠実モデルだ。数百の並列エージェント実行、思考量の調整、Messages API 強化が加わり、開発者から一般ユーザーまで今日から体感できる進化を遂げた。

Claude Anthropic Claude Opus 4.8 AIエージェント Claude Code

Claude Mythos がエルデシュ予想を「シンプルな証明」で解く——AI 数学能力の新マイルストーン

LLM・生成AI

2026年5月27日

Claude Mythos がエルデシュ予想を「シンプルな証明」で解く——AI 数学能力の新マイルストーン

OpenAI ChatGPT PowerPoint Microsoft Office プレゼンテーション

OpenAI が Mac 向け Appshots 機能を発表、ウィンドウ内容を Codex に直接送信可能に

LLM・生成AI

2026年5月23日

OpenAI が Mac 向け Appshots 機能を発表、ウィンドウ内容を Codex に直接送信可能に

Google Gemini AI 購読価格設定使用量ベース課金

LLM・生成AI

2026年5月20日

LLM が Turing test に初めて合格——UC San Diego が実証、人間と見分けられないレベルに到達

UC San Diego の研究チームが、現代の LLM が Turing test（人間と機械を会話で区別できるか判定する古典的テスト）に初めて合格することを実証。人間の会話能力の模倣が「思いのほか完全」になっていることが科学的に確認される。

Turing test LLM 性能対話型AI UC San Diego

Andrej Karpathy が Anthropic に参画——LLM プレトレーニング研究を主導

LLM・生成AI

2026年5月20日

Andrej Karpathy が Anthropic に参画——LLM プレトレーニング研究を主導

xAI、Custom Voices で独自音声クローン機能をリリース——1分の録音で AI 音声生成

LLM・生成AI

2026年5月2日

xAI、Custom Voices で独自音声クローン機能をリリース——1分の録音で AI 音声生成

GLM-5.1 ZhipuAI オープンソース AIエージェントコーディングAI

OllamaでGemma 4を独自評価——日本語・多言語コード・Claude Code代替の実力と限界

LLM・生成AI

2026年4月8日

OllamaでGemma 4を独自評価——日本語・多言語コード・Claude Code代替の実力と限界

M4 Pro MacでOllama経由のGemma 4（8B Q4_K_M）を実際に動かし、日本語応答・Python／TypeScript／Rust／SQLのコード生成・英日プロンプトの精度差・バグ修正能力を独自評価した。Claude Sonnetとの格差も率直に比較する。

Gemma 4 Ollama ローカルLLM コード生成 LLMベンチマーク

Anthropic、Claude Mythos Preview 正式発表——防御的サイバーセキュリティに特化した AI モデル

LLM・生成AI

2026年4月8日

Anthropic、Claude Mythos Preview 正式発表——防御的サイバーセキュリティに特化した AI モデル

Anthropic が新モデル「Claude Mythos Preview」を正式発表。企業と政府機関の限定グループと協力して、AI を活用した防御的セキュリティワークに取り組む。

Anthropic Claude AI Security LLM セキュリティ

Microsoft、Harrier 埋め込みモデルをオープンソース化 100言語対応

LLM・生成AI

2026年4月8日

Microsoft、Harrier 埋め込みモデルをオープンソース化 100言語対応

Microsoft の Bing チームが、多言語対応の埋め込みモデル『Harrier』をオープンソース化。27億パラメータの大型モデルで、MTEB v2 ベンチマークでトップ成績（78%）を記録。MIT ライセンスで Hugging Face で公開される。

Microsoft Embedding オープンソースベンチマーク

LLM・生成AI

2026年4月8日

Google AI Overviews の精度問題、約10%が不正確分析報告

Google の検索統合 AI「AI Overviews」の精度分析により、約10%の回答が不正確であることが判明。1日数百万件の誤ステートメントが生じている可能性がある。

Google AI Overviews 検索エンジン信頼性

Meta が新 AI モデルを部分的にオープンソース化へ、Llama とは別路線で公開方針

LLM・生成AI

2026年4月8日

Meta が新 AI モデルを部分的にオープンソース化へ、Llama とは別路線で公開方針

Meta が新しい AI モデルの一部をオープンソースとして公開する計画をAxiosが報じた。Scale AI 創業者 Alexandr Wang の主導で開発され、プロプライエタリ部分は維持する方針。最大規模のモデルは非公開の予定。

Meta オープンソース LLM LLaMA

Jeff Bezos の Project Prometheus、xAI 共同創業者 Kyle Kosic を採用

LLM・生成AI

2026年4月8日

Jeff Bezos の Project Prometheus、xAI 共同創業者 Kyle Kosic を採用

Bezos の AI スタートアップ Project Prometheus が xAI 共同創業者で元 OpenAI 幹部の Kyle Kosic を採用。インフラ構築で Colossus スーパーコンピュータをリードした人物だ。

Bezos Project Prometheus xAI AIインフラ

LLM・生成AI

2026年4月7日

Meta が AI トークン消費リーダーボードで社内競争を展開

Meta は社内で従業員の AI トークン消費を競わせるリーダーボードを運用中。トークン消費量が多いほど報酬を得られる仕組みだが、実際の生産性との相関性が疑問視されている。

Meta AI LLM 企業文化

Anthropic が Google・Broadcom と複数ギガワット TPU 契約

LLM・生成AI

2026年4月7日

Anthropic が Google・Broadcom と複数ギガワット TPU 契約

Anthropic が Google と Broadcom との契約により複数ギガワットの TPU コンピューティング容量を確保した。2027 年から米国で稼動予定で、急速に成長する需要に対応するもの。同社の年間売上は 300 億ドルに達している。

AIインフラ TPU AI計算

LLM・生成AI

2026年4月7日

OpenAI の安全性離脱危機、Sam Altman の「ビブス」で説明される

ChatGPT 大規模言語モデル一次情報比較検証

LLM

2026年3月28日

GeminiでChatGPTとClaudeの記憶を簡単移行

GoogleのGemini最新アップデートは、ChatGPTやClaudeの会話履歴や設定をプロンプトの工夫で簡単にエクスポートできる可能性を示し、移行の選択肢を広げます。

Gemini 大規模言語モデル記憶移行企業導入プライバシー

LLM

2026年3月26日

TurboQuantでLLMの記憶を6倍圧縮？真相

Googleの研究提案TurboQuantは、LLMの作業メモリを大幅に減らす可能性を示しています。現状は研究段階ですが、検証が進めばクラウドや端末運用に影響する期待が持てます。

TurboQuant メモリ圧縮研究段階

LLM

2026年3月25日

Gemini搭載で変わるテレビの未来

GoogleのGemini統合で、Google TVは映像以上の情報端末になります。視覚的回答や深掘り、スポーツ要約などで視聴中に知りたい情報を手軽に得られる可能性を優しく解説します。

Gemini 大規模言語モデルテレビ企業導入

LLM

2026年3月23日

AIで変わる法務現場の未来と実務の現実

AIは法務の事務作業を効率化し契約レビューや判例検索の補助で実務の質を高める道具であり、検証とガバナンスを組み合わせた導入が進めば法務サービスは確実に進化します。

法務AI 契約書レビュー判例検索ガバナンス

LLM

2026年3月22日

考える回数と記憶を両立する新Transformer

ドイツの研究チームが提案した新しいTransformerは、推論の段階数を自律決定し外部記憶を活用して数学問題で大規模モデルを上回る成果を示し、推論と知識統合の新たな可能性を開く一方、実用化には検証とコスト最適化が必要です

外部記憶推論段階自動決定 Transformer設計自然言語処理推論コスト

LLM

2026年3月22日

AI要約で学びが速く、説得力も増す理由

LLM

LLM

2026年2月6日

GPT-5.3-Codexが拓く長期開発像

GPT-5.3-Codexはコーディング性能と一般推論を高い水準で両立するCodex-nativeエージェントで、長期現場の作業効率と意思決定を改善します。

Codex-native 大規模言語モデルコード生成AI 長期開発支援

LLM

2026年2月5日

医師とChatGPTが支えた治療の決断

息子のがん治療の準備で、家族は医師の診断を土台にChatGPTを補助ツールとして活用し、質問整理や治療選択の見通しを高めつつ、AIは補助で最終判断は医師が行うという適切な役割分担が確認されました。

ChatGPT 大規模言語モデル医療活用プライバシー

LLM

2026年2月2日

AIの内なる対話が学習を加速する理由

自己対話（AIが自分と内省的に対話して推論を検証する仕組み）は、学習速度や多タスク適応力を高める可能性があり、実務導入には透明性の担保、再現性の検証、段階的な展開と人間との協働設計が不可欠です。

自己対話大規模言語モデル多段階推論実務適用倫理・ガイドライン

LLM

2026年1月30日

Gemini最新3機能で日常が変わる

GoogleのGeminiは、個人の声を再現するクローン、入力から即座に仮想世界を生成するProject Genie、そしてMapsとの対話連携という三つの新機能で日常の情報体験を大きく進化させようとしており、利便性と同時にプライバシーや安定性への配慮が重要です。

Gemini 音声合成マルチモーダル仮想空間生成

LLM

2026年1月29日

ChromeとGemini3で旅手配が自動化