AIチャットボットのがん相談は危険か、研究と医療現場の限界検証

はじめに

「医師に聞く前に、まずAIへ聞く」という行動は、すでに珍しくありません。KFFが2026年3月に公表した調査では、米国の成人の32%が過去1年にAIチャットボットを健康情報や助言のために使ったと回答しました。AIは検索より対話しやすく、診療時間外でも使えるため、受診前の不安を受け止める入口になっています。

ただし、がんのように診断名、病期、治療順序、副作用管理が複雑に絡む領域では、便利さだけで判断するのは危険です。Pew Research Centerの2026年調査でも、健康情報をAIチャットボットから得る人は便利さを高く評価する一方、正確性の評価は低く割れました。つまり、使われているから信頼されているのではなく、使いやすいから先に開かれている面が大きいのです。

この論点は、単なる「AIは嘘をつく」という話ではありません。医療へのアクセス不安、情報過多、短い外来が重なり、患者がAIを主治医の代替に近い形で使ってしまう構造が背景にあります。本稿では、公開情報だけを用い、どこまで使え、どこから危険域に入るのかを整理します。

患者がAIに向かう構造

受診前の空白と費用不安

KFFの2026年調査は、AI利用の広がりをかなり具体的に示しています。過去1年にAIを健康情報や助言に使った人は32%で、身体の健康に関する利用が29%、メンタルヘルス関連が16%でした。さらに、AIを健康目的で使う人の5人に1人は、医療へのアクセスの難しさや費用負担を理由に挙げています。AI利用は好奇心だけでなく、医療システム側の摩擦の裏返しでもあります。

Pewの2026年4月調査でも、AIチャットボットから健康情報を「少なくともときどき得る」と答えた成人は22%に達しました。とくに18〜29歳では32%で、無保険者は保険加入者より利用しやすい傾向があると整理されています。受診予約、自己負担、通院時間、説明の難解さといった障壁があるほど、24時間開いている対話型ツールの吸引力は強まります。

WHOが2024年に発表したデジタル健康プロモーター「S.A.R.A.H.」も、この需要を反映しています。S.A.R.A.H.は生成AIを活用し、8言語で24時間対応し、がんを含む主要疾患の危険因子や生活習慣について案内するとされました。ここから見えるのは、国際機関も「対話型AIで健康情報アクセスを広げる」という方向性自体は否定していないことです。問題は、どの範囲までを安全に任せるかです。

便利さ先行の情報行動

Pewの同調査で特徴的なのは、AIチャットボット利用者が評価する順番です。健康情報をAIから得る利用者の48%は「非常に便利」だと答え、41%は「とても理解しやすい」と評価しました。一方で、正確だと強く評価したのは18%にとどまり、23%は「あまり正確ではない、または全く正確ではない」と答えています。便利さと理解しやすさが、正確性より先に立っている構図です。

KFFの2024年調査も同じ方向を示します。米国成人の56%は、AIチャットボットの情報で何が真実で何が誤りか見分ける自信がないと答えました。それでも17%は、健康情報や助言のためにAIチャットボットを少なくとも月1回使うと回答しています。つまり、多くの人は「見分ける自信がない」と感じながらも、日常的には使っているのです。

このねじれは、医療情報の消費行動が「信頼できるものを選ぶ」よりも、「すぐ読めるものに先に触れる」へ変わっていることを示します。AIは、問い返しができ、専門用語を砕き、待ち時間がありません。その利便性は本物ですが、利便性と安全性は同義ではありません。がん領域では、この違いが治療時期や治療選択に直結します。

研究が示す精度と限界

一般質問で見える有用性

AIチャットボットが一律に無価値というわけではありません。JAMA Oncologyに掲載された2023年の研究では、皮膚がん、肺がん、乳がん、大腸がん、前立腺がんに関する上位検索質問について、4種類のチャットボットの回答100件を評価しました。結果は、文章の質を示すDISCERN中央値が5点満点中5点で、明確な誤情報は確認されませんでした。概説レベルの説明なら、一定の有用性はあります。

ただし、同じ研究は限界も明確に示しました。理解しやすさの中央値は66.7%で中程度、行動可能性は20.0%で低く、文章は大学レベルの読解難度でした。要するに、一般論の説明はできても、患者が次に何を確認し、何を医師に持ち込むべきかまでは導きにくいのです。読めることと、判断に使えることは別問題です。

別の2024年研究では、無料版と有料版のチャットボットを比べ、やさしい言葉で書くように促すプロンプトを加えると、情報の質はほぼ変えずに可読性と行動可能性が改善しました。これは、AIの性能差だけでなく、質問の仕方と出力設計が患者体験を大きく左右することを示しています。一般向けのAIは、病期や既往歴などの文脈を十分限定しないまま、もっともらしい補完をしやすいのです。

治療提案で残る非整合

NCIが2023年に紹介したJAMA Oncologyの別研究は、より重要な警告を出しました。乳がん、肺がん、前立腺がんの26種類の診断設定について、ChatGPT 3.5に104件の治療質問を与えたところ、102件中98%で少なくとも1つは臨床ガイドラインと整合する推奨が含まれていました。ここだけを見ると優秀に見えます。

しかし実際には、102件のうち35件、つまり34.3%で、ガイドラインに合致しない治療推奨も同時に含まれていました。さらに13件、13%では、推奨治療に存在しない内容や意味の通らない内容が混ざる「幻覚」も確認されました。最も危険なのは、正しい要素と誤った要素が同じ回答の中に自然に同居することです。患者には一見して見分けにくく、専門家でも判定が割れる場面がありました。

2024年にPubMedで公開された泌尿器がんの研究では、ChatGPT-4は3.5より改善し、NCCNガイドラインとの整合率が76.8%対49.1%でした。改善は確かですが、なお約4分の1は整合しない余地が残るとも読めます。モデル世代が上がれば自動的に臨床で使える、という単純な話ではありません。

2025年のがん検診に関する研究でも、ChatGPTの回答は60評価項目中71.7%が完全整合でしたが、23.3%は非整合または欠落で、15%に幻覚が見られました。高齢層を想定した質問ほど非整合が目立ったという結果は、年齢や個別条件が絡むほど弱点が広がる可能性を示します。検診や治療の意思決定は、まさにその個別条件の塊です。

がん領域でリスクが跳ね上がる理由

時間との競争

がん情報が他の健康相談より危ういのは、判断の遅れや取り違えのコストが高いからです。NCIが紹介した2017年の大規模研究では、2004年から2013年の1.68百万件の非転移性がん患者データから、初期治療として標準治療を拒否し代替療法を選んだ281人を分析しました。乳がんと大腸がんでは、中央値5年の追跡で死亡リスクがほぼ5倍に上ったと報告されています。

この研究はAIそのものを対象にしたものではありません。それでも示唆は明快です。早期がんでは、治療の窓が閉じる前に標準治療へつなぐことが極めて重要であり、判断の寄り道はそのまま予後悪化につながりうるという点です。NCIも、治癒を目指せる時期を逃すとその窓は再び開かないと説明しています。

生成AIが危険なのは、患者を即座に誤治療へ導くからではなく、「少し様子を見てもよい」といった遅延の物語を、もっともらしい文章で補強しうるからです。がん医療では、露骨な誤答より、この静かな先延ばしのほうが現実には起こりやすいです。

代替療法と誤情報の増幅

ACSは2026年の記事で、米国では推計70%が健康情報をインターネットで探し、がんは検索されやすい主題のひとつだと紹介しました。同時に、オンラインのがん情報には個人的体験や販売目的の売り込みが多く、科学的根拠を伴わないものが少なくないと警告しています。とくに、標準治療を避けるよう促す助言、恐怖や緊急性をあおる語り口、出典のない断言は赤信号です。

同じACS記事では、医療処置に関するSNS投稿の少なくとも3分の1に誤りまたは有害な情報が含まれるとされ、がん誤情報は正確な情報より28倍共有されやすい研究も紹介されています。これは、AIが何もないところから誤情報を作るというより、すでに汚れた情報環境を要約し、再包装し、会話形式で再流通させる危険を示します。

AIの出力が厄介なのは、検索結果のように複数のリンクが並ぶのではなく、ひとつのまとまった答えとして提示される点です。利用者は裏取り前に納得しやすく、反対意見や不確実性も見えにくくなります。

さらに、一般向けのAIチャットボットと、規制下の医療AIは区別しなければなりません。FDAのAI対応医療機器リストは、市販承認や認可を受けた機器を透明化するためのもので、2026年時点では将来の更新でLLMベース機能も識別しやすくする方針を示しています。裏返せば、私たちが日常的に触れる汎用チャットボットは、そのままFDAが安全性と有効性を審査した医療機器ではない場合が大半です。

注意点・展望

読者がまず押さえるべきなのは、AIを「診断」や「治療判断」の代行に使わないことです。使うなら、受診前の質問整理、専門用語の言い換え、診察後の説明の復習、医師に確認したい論点の洗い出しまでに限定すべきです。AIに答えを決めさせるのではなく、医師に持ち込むメモを整える道具として使うほうが安全です。

その際は、出典提示を必ず求め、出典が公的機関、学会、査読論文かを確認し、回答に「標準治療をやめる」「受診を急がなくてよい」といった含意があれば、その時点で自己判断を止めるべきです。FDAが整理するように、臨床判断支援の世界では、推奨の根拠を人間が理解でき、利用者がそれに依存しすぎない設計が重視されます。汎用AIはそこがまだ弱いのです。

今後の展望としては、無制限の汎用対話より、範囲を絞った支援ツールのほうが先に定着する可能性が高いです。NCIでも、新規がん患者の受診準備を支えるメニューベースのチャットボット試験や、遺伝情報説明を補う会話支援の試験が進められてきました。安全な方向は、何でも答えるAIではなく、役割、根拠、監督者を限定したAIです。

まとめ

がん情報におけるAIチャットボットの問題は、単純な正誤判定よりも深いところにあります。人々はアクセス不安と情報過多のなかで、正確だからではなく、速くて話しやすいからAIを開きます。ところが研究では、一般質問の概説には役立つ一方、治療や検診の助言では非整合や幻覚がなお残り、しかも正しい情報に紛れて提示されることが確認されています。

したがって、現時点での現実的な結論は明確です。AIは、がん患者や家族が診療に備える補助輪にはなりえますが、主治医の代替にはなりません。特に、治療開始の遅れ、標準治療からの逸脱、代替療法への傾斜を正当化する用途では使うべきではありません。便利さを入口にしつつ、最終判断は必ず医療チームへ戻すことが、いま最も重要な使い方です。

参考資料:

NewsAngle

AIチャットボットのがん相談は危険か、研究と医療現場の限界検証

はじめに

患者がAIに向かう構造

受診前の空白と費用不安

便利さ先行の情報行動

研究が示す精度と限界

一般質問で見える有用性

治療提案で残る非整合

がん領域でリスクが跳ね上がる理由

時間との競争

代替療法と誤情報の増幅

注意点・展望

まとめ

関連記事

慢性疾患の人がAI医療相談へ向かう理由と安全な使い方の境界線

Mythos衝撃が変えたサイバーセキュリティの常識

メリーランド州の食品AI監視価格禁止が映す米国物価とデータ不安

AIで宿題作文は崩壊教室でよみがえる書く力評価再設計の構図

AI投資1300億ドル突破、巨大IT4社が止まれない理由とは

最新ニュース

経口中絶薬の郵送禁止判決が全米に波紋

Mythos衝撃が変えたサイバーセキュリティの常識

スピリット航空が運航停止　米格安航空の終焉と業界への波紋

米大麻産業に歴史的転機　トランプ政権の規制緩和と税制優遇の全貌

対EU自動車関税25%へ引き上げ　米欧ターンベリー合意崩壊の危機

はじめに

患者がAIに向かう構造

受診前の空白と費用不安

便利さ先行の情報行動

研究が示す精度と限界

一般質問で見える有用性

治療提案で残る非整合

がん領域でリスクが跳ね上がる理由

時間との競争

代替療法と誤情報の増幅

注意点・展望

まとめ

関連記事

慢性疾患の人がAI医療相談へ向かう理由と安全な使い方の境界線

Mythos衝撃が変えたサイバーセキュリティの常識

メリーランド州の食品AI監視価格禁止が映す米国物価とデータ不安

AIで宿題作文は崩壊 教室でよみがえる書く力評価再設計の構図

AI投資1300億ドル突破、巨大IT4社が止まれない理由とは

最新ニュース

経口中絶薬の郵送禁止判決が全米に波紋

Mythos衝撃が変えたサイバーセキュリティの常識

スピリット航空が運航停止 米格安航空の終焉と業界への波紋

米大麻産業に歴史的転機 トランプ政権の規制緩和と税制優遇の全貌

対EU自動車関税25%へ引き上げ 米欧ターンベリー合意崩壊の危機

AIで宿題作文は崩壊教室でよみがえる書く力評価再設計の構図

スピリット航空が運航停止　米格安航空の終焉と業界への波紋

米大麻産業に歴史的転機　トランプ政権の規制緩和と税制優遇の全貌

対EU自動車関税25%へ引き上げ　米欧ターンベリー合意崩壊の危機