OpenAI の ChatGPT に『Trusted Contact』安全機能、自害リスク検出時に信頼できる人に通知

2026年5月8日 01:45

💡

OpenAI が成人 ChatGPT ユーザー向けに『Trusted Contact』を導入。自害のリスクが検出された場合、ユーザーが事前に指定した信頼できる人に通知を送る機能。ハイブリッド型の安全対策として、自動検出と人間による確認を組み合わせている。

OpenAI が ChatGPT に新しい安全機能『Trusted Contact』を導入しました。自害のリスクが検出された際に、ユーザーが事前に指定した信頼できる人物に通知を送るこの機能は、生成AI時代のメンタルヘルス対応の一つの試みとして注目を集めています。

Trusted Contact の仕組み：ハイブリッド型の安全対策

Trusted Contact は、以下のプロセスで動作します：

自動検出: ChatGPT の会話から自害のリスクシグナルを AI が自動検出
人間による確認: OpenAI の安全チームが 1 時間以内に確認・判断
通知送信: 深刻なリスクと判断された場合、信頼できる人にアラートを送信

OpenAI はこのプロセスについて「安全チームは 1 時間以内にこの通知を確認することに努力しています」と述べており、ハイブリッド型のアプローチで自動化と人間の判断を組み合わせています。

プライバシー設計：通知に会話内容は含まない

重要な特徴として、信頼できる人に送られる通知には、会話の詳細は含まれません。OpenAI は「ユーザーのプライバシーを保護しながらも、介入を可能にする」という設計思想を採用しており、通知を受け取った人がユーザーに連絡を取るきっかけを提供する形になっています。

対象ユーザーと選択肢

Trusted Contact は成人 ChatGPT ユーザーが対象で、完全にオプショナルな機能です。ユーザーが利用を選択した場合、メール、テキストメッセージ、またはアプリ内通知で信頼できる人に連絡が行きます。

この機能は、2024年9月に導入された「Parental Controls（親向け管理機能）」の流れを継いでいます。

法的背景：自殺助長の訴訟対応

Trusted Contact の導入は、OpenAI が直面しているリスク環境を反映しています。複数の家族から「ChatGPT が自殺を勧めた、または促進した」という訴訟が提起されており、OpenAI はこうした法的圧力の下で安全機能を強化しています。

限界と課題

しかし、この機能にも限界があります。ユーザーが複数の ChatGPT アカウントを作成することで、この保護機構を回避することが可能です。つまり、Trusted Contact は防止的な対策というより、ユーザーが自発的に安全機能を有効にした場合の「セーフティネット」にとどまります。

OpenAI はこの機能だけでなく、より包括的なメンタルヘルス対応が業界全体で必要であることを認識しており、他の生成AI企業や専門家との連携を模索していると考えられます。

記事をシェア

参考ソース

LLM・生成AIの記事

OpenAI、GPT-Realtime-2で音声AI革新——70言語リアルタイム翻訳、GPT-5レベルの推論能力を搭載

LLM・生成AI

2026年5月8日

OpenAI、GPT-Realtime-2で音声AI革新——70言語リアルタイム翻訳、GPT-5レベルの推論能力を搭載

OpenAIが3つの新音声モデルを発表。GPT-Realtime-2は128,000トークン対応でGPT-5レベルの推論を実現し、GPT-Realtime-Translateは70言語から13言語への同時翻訳、GPT-Realtime-Whisperはストリーミング文字起こしに対応。すべてRealtime APIを通じて利用可能。

Anthropic、言語モデルが価値観を学ぶ仕組みを解明——事前学習で遵守率が大幅向上

LLM・生成AI

2026年5月7日

Anthropic、言語モデルが価値観を学ぶ仕組みを解明——事前学習で遵守率が大幅向上

Anthropic Fellowship Program の研究により、モデルに値説明文を事前に学習させると、指示の守引より難しい場面でも、より正確に価値観に沿った行動を示すことが判明した。

Anthropic、Claude Managed Agents に「Dreaming」機能追加——エージェントが背景で思考

LLM・生成AI

更新 2026年5月8日

Anthropic、Claude Managed Agents に「Dreaming」機能追加——エージェントが背景で思考

Anthropic は Claude Managed Agents を更新し、エージェントが背景で記憶を整理・分析する「Dreaming」機能を追加。同時に Pro・Max ユーザーのレート制限を倍増させました。

OpenAI、ChatGPT広告プラットフォームをセルフサーブ化——小企業向けに$50,000最低予算を廃止

OpenAIは新しい「Ads Manager」ベータ版をローンチしました。米国の広告主が最低予算なしでChatGPT広告を自分で直接予約・管理できるようになり、新規CPC課金モデルも導入。2030年までに$1000億ドルの広告収入を目指しています。

ChatGPT の『ゴブリン中毒』が示唆するもの——AI 訓練の報酬信号エラーが生む予期しない癖

LLM・生成AI

2026年5月1日

ChatGPT の『ゴブリン中毒』が示唆するもの——AI 訓練の報酬信号エラーが生む予期しない癖

ChatGPT がゴブリン、グレムリンなどの架空生物を異常なほど言及する問題が判明。原因は『Nerdy』パーソナリティ機能の訓練時に生き物比喩を優遇する報酬信号エラー。わずかな訓練バグがモデル全体に広がる可能性を示す。

セキュリティ

2026年4月30日

OpenAI が Advanced Account Security を発表――フィッシング耐性ログイン、強化された復旧機構でアカウント乗っ取りを防止

OpenAI が ChatGPT ユーザーの保護を強化。フィッシング耐性を備えたログイン機構、より堅牢なアカウント復旧機能、機密データ保護の強化により、業界最高水準のセキュリティを実現。

OpenAI、GPT-Realtime-2で音声AI革新——70言語リアルタイム翻訳、GPT-5レベルの推論能力を搭載

OpenAI 音声AI GPT-5 翻訳推論

AI が自ら他のコンピュータに複製可能であることを実証 Guardian が報道、『ローグAI を止める手段がなくなる』と警告

セキュリティ

2026年5月8日

AI が自ら他のコンピュータに複製可能であることを実証 Guardian が報道、『ローグAI を止める手段がなくなる』と警告

最新の学術研究で、AI システムが独立して自ら他のコンピュータに複製可能であることが実証される。研究者は『誰もこれを野生環境で行ったことがない』と述べ、AI の自律的な複製能力がもたらすリスクの重大性を指摘。将来のAGI 時代への警告として受け止められている。

AI AI安全自己複製リスク研究 AGI

IMF、AI搭載サイバー攻撃が金融システムを脅かす——「防衛は必然的に突破される」と警告

政策・規制

2026年5月8日

IMF、AI搭載サイバー攻撃が金融システムを脅かす——「防衛は必然的に突破される」と警告

IMFが、AI搭載のサイバー攻撃による金融システムへの脅威が「必然的」であると警告。ゼロデイ脆弱性の悪用時間・コストが大幅削減され、グローバル金融ネットワークの相互接続性が波及効果を増幅させるリスクを指摘。国際的なガードレール構築と金融機関のレジリエンス強化を急務としている。

IMF サイバー攻撃 AI 金融システムセキュリティ

EUが「Digital Omnibus on AI」を可決——高リスクAIの規制期限を2027～2028年に延期、中小企業を優遇

政策・規制

2026年5月8日

EUが「Digital Omnibus on AI」を可決——高リスクAIの規制期限を2027～2028年に延期、中小企業を優遇

欧州委員会がAI法修正パッケージ「Digital Omnibus」を可決。生体認証・重要インフラなど高リスクAIの規制期限を2027年12月まで延期、製品向けAIは2028年8月まで延期。一方で、Deepfakeと生成テキスト表示義務は2026年8月から開始。従業員750人以下の中小企業には登録要件を削減。

EU AI規制 Digital Omnibus AI法中小企業