NextAI 海外で話題の最新AIニュース

タグ一覧に戻る

コーディング

記事数: 7 件

Zhipu AI が GLM-5.2 をオープンソース公開：コーディング性能で Claude Opus に1点差

更新 2026年7月9日

Zhipu AI が GLM-5.2 をオープンソース公開：コーディング性能で Claude Opus に1点差

中国の Zhipu AI が100万トークンコンテキストを持つ GLM-5.2 をMITライセンスで公開。FrontierSWEベンチマークで74.4%を達成し、Anthropicの最新モデルに1ポイント差という競争力を持つ。「計算効率を2.9倍削減」した独自技術で、オープンソースモデルとしての地位を確立。

オープンソースモデル ZhipuAI コーディング中国AI

続きを読む

Zhipu AI が ZCode IDE をリリース――Claude Code や OpenAI Codex に対抗する廉価な開発環境

2026年7月7日

Zhipu AI が ZCode IDE をリリース――Claude Code や OpenAI Codex に対抗する廉価な開発環境

中国の Zhipu AI が、GLM-5.2 を基盤とした開発者向け IDE「ZCode」をリリース。ファイルアクセス、ターミナル出力、ブラウザコンテキスト、Git 連携を単一ワークフローで統合。無料 5 日間トライアル（日額 500 万トークン）で今すぐ試用可能。Claude Code や OpenAI Codex の直接的な競争相手として登場。

開発ツール ZhipuAI IDE GLM-5.2 コーディング

続きを読む

Base44 が独自AI モデル「Base1」をロールアウト、開発者コストを大幅削減

2026年6月30日

Base44 が独自AI モデル「Base1」をロールアウト、開発者コストを大幅削減

Wix傘下のコーディングプラットフォーム Base44 が自社開発のLLM「Base1」をリリース。数千万件のユーザーデータから訓練され、低レイテンシ・低コストでフロンティアモデル超越を目指す。

Base44 AI model LLM コーディング Wix

続きを読む

Claude Opus 4.7、MirrorCodeベンチマークでAI最強の再実装スキルを実証——ソースなしで16000行Go再構築

2026年6月27日

Claude Opus 4.7、MirrorCodeベンチマークでAI最強の再実装スキルを実証——ソースなしで16000行Go再構築

Epoch AIとMETRが開発したMirrorCodeベンチマークで、Claude Opus 4.7が56%の解決率で最高性能を達成。元のコードなしで複雑なプログラムを再実装するAIの能力が、開発者ワークフローを大きく変える可能性を示しました。

Claude AI開発コーディングベンチマークプログラミング

続きを読む

Alibaba Qwen3.6-27B、15倍大きな前バージョンを圧倒――パラメータ効率で新基準

2026年4月25日

Alibaba Qwen3.6-27B、15倍大きな前バージョンを圧倒――パラメータ効率で新基準

Alibaba が27億パラメータの Qwen3.6-27B をリリース。SWE-bench Verified で 77.2 を達成し、15倍の規模を持つ前バージョン Qwen3.5-397B を上回る。密度型アーキテクチャで展開効率と性能の両立を実現。

Alibaba Qwen 小規模モデルベンチマークパラメータ効率

続きを読む

Google、Anthropicの「コーディングギャップ」に対抗——Sergey Brin直指揮、「Jetski」内部ツール導入で全Geminiエンジニアに義務化

テクノロジー

2026年4月21日

Google、Anthropicの「コーディングギャップ」に対抗——Sergey Brin直指揮、「Jetski」内部ツール導入で全Geminiエンジニアに義務化

GoogleがAnthropicのコーディング能力の遅れに危機感。Brin共同創業者がDeepMind内に専門チーム立ち上げ、内部開発者向けツール追跡ツール『Jetski』で進捗を監視。エージェント実行能力向上に注力。

Google Anthropic AI コーディング Gemini

続きを読む

Anthropic が Claude Opus 4.7 をリリース、コーディングで 64.3% を達成し OpenAI を上回る

2026年4月17日

Anthropic が Claude Opus 4.7 をリリース、コーディングで 64.3% を達成し OpenAI を上回る

Claude Opus 4.7 は SWE-bench Pro コーディングベンチマークで 64.3% を獲得し、OpenAI の GPT-5.4（57.7%）を上回った。Anthropic は同時にサイバーセキュリティ機能を意図的に縮小したセキュリティ検証プログラムも開始した。

Anthropic Claude LLM コーディング

続きを読む