AIチャットボットのがん相談は危険か、研究と医療現場の限界検証
はじめに
「医師に聞く前に、まずAIへ聞く」という行動は、すでに珍しくありません。KFFが2026年3月に公表した調査では、米国の成人の32%が過去1年にAIチャットボットを健康情報や助言のために使ったと回答しました。AIは検索より対話しやすく、診療時間外でも使えるため、受診前の不安を受け止める入口になっています。
ただし、がんのように診断名、病期、治療順序、副作用管理が複雑に絡む領域では、便利さだけで判断するのは危険です。Pew Research Centerの2026年調査でも、健康情報をAIチャットボットから得る人は便利さを高く評価する一方、正確性の評価は低く割れました。つまり、使われているから信頼されているのではなく、使いやすいから先に開かれている面が大きいのです。
この論点は、単なる「AIは嘘をつく」という話ではありません。医療へのアクセス不安、情報過多、短い外来が重なり、患者がAIを主治医の代替に近い形で使ってしまう構造が背景にあります。本稿では、公開情報だけを用い、どこまで使え、どこから危険域に入るのかを整理します。
患者がAIに向かう構造
受診前の空白と費用不安
KFFの2026年調査は、AI利用の広がりをかなり具体的に示しています。過去1年にAIを健康情報や助言に使った人は32%で、身体の健康に関する利用が29%、メンタルヘルス関連が16%でした。さらに、AIを健康目的で使う人の5人に1人は、医療へのアクセスの難しさや費用負担を理由に挙げています。AI利用は好奇心だけでなく、医療システム側の摩擦の裏返しでもあります。
Pewの2026年4月調査でも、AIチャットボットから健康情報を「少なくともときどき得る」と答えた成人は22%に達しました。とくに18〜29歳では32%で、無保険者は保険加入者より利用しやすい傾向があると整理されています。受診予約、自己負担、通院時間、説明の難解さといった障壁があるほど、24時間開いている対話型ツールの吸引力は強まります。
WHOが2024年に発表したデジタル健康プロモーター「S.A.R.A.H.」も、この需要を反映しています。S.A.R.A.H.は生成AIを活用し、8言語で24時間対応し、がんを含む主要疾患の危険因子や生活習慣について案内するとされました。ここから見えるのは、国際機関も「対話型AIで健康情報アクセスを広げる」という方向性自体は否定していないことです。問題は、どの範囲までを安全に任せるかです。
便利さ先行の情報行動
Pewの同調査で特徴的なのは、AIチャットボット利用者が評価する順番です。健康情報をAIから得る利用者の48%は「非常に便利」だと答え、41%は「とても理解しやすい」と評価しました。一方で、正確だと強く評価したのは18%にとどまり、23%は「あまり正確ではない、または全く正確ではない」と答えています。便利さと理解しやすさが、正確性より先に立っている構図です。
KFFの2024年調査も同じ方向を示します。米国成人の56%は、AIチャットボットの情報で何が真実で何が誤りか見分ける自信がないと答えました。それでも17%は、健康情報や助言のためにAIチャットボットを少なくとも月1回使うと回答しています。つまり、多くの人は「見分ける自信がない」と感じながらも、日常的には使っているのです。
このねじれは、医療情報の消費行動が「信頼できるものを選ぶ」よりも、「すぐ読めるものに先に触れる」へ変わっていることを示します。AIは、問い返しができ、専門用語を砕き、待ち時間がありません。その利便性は本物ですが、利便性と安全性は同義ではありません。がん領域では、この違いが治療時期や治療選択に直結します。
研究が示す精度と限界
一般質問で見える有用性
AIチャットボットが一律に無価値というわけではありません。JAMA Oncologyに掲載された2023年の研究では、皮膚がん、肺がん、乳がん、大腸がん、前立腺がんに関する上位検索質問について、4種類のチャットボットの回答100件を評価しました。結果は、文章の質を示すDISCERN中央値が5点満点中5点で、明確な誤情報は確認されませんでした。概説レベルの説明なら、一定の有用性はあります。
ただし、同じ研究は限界も明確に示しました。理解しやすさの中央値は66.7%で中程度、行動可能性は20.0%で低く、文章は大学レベルの読解難度でした。要するに、一般論の説明はできても、患者が次に何を確認し、何を医師に持ち込むべきかまでは導きにくいのです。読めることと、判断に使えることは別問題です。
別の2024年研究では、無料版と有料版のチャットボットを比べ、やさしい言葉で書くように促すプロンプトを加えると、情報の質はほぼ変えずに可読性と行動可能性が改善しました。これは、AIの性能差だけでなく、質問の仕方と出力設計が患者体験を大きく左右することを示しています。一般向けのAIは、病期や既往歴などの文脈を十分限定しないまま、もっともらしい補完をしやすいのです。
治療提案で残る非整合
NCIが2023年に紹介したJAMA Oncologyの別研究は、より重要な警告を出しました。乳がん、肺がん、前立腺がんの26種類の診断設定について、ChatGPT 3.5に104件の治療質問を与えたところ、102件中98%で少なくとも1つは臨床ガイドラインと整合する推奨が含まれていました。ここだけを見ると優秀に見えます。
しかし実際には、102件のうち35件、つまり34.3%で、ガイドラインに合致しない治療推奨も同時に含まれていました。さらに13件、13%では、推奨治療に存在しない内容や意味の通らない内容が混ざる「幻覚」も確認されました。最も危険なのは、正しい要素と誤った要素が同じ回答の中に自然に同居することです。患者には一見して見分けにくく、専門家でも判定が割れる場面がありました。
2024年にPubMedで公開された泌尿器がんの研究では、ChatGPT-4は3.5より改善し、NCCNガイドラインとの整合率が76.8%対49.1%でした。改善は確かですが、なお約4分の1は整合しない余地が残るとも読めます。モデル世代が上がれば自動的に臨床で使える、という単純な話ではありません。
2025年のがん検診に関する研究でも、ChatGPTの回答は60評価項目中71.7%が完全整合でしたが、23.3%は非整合または欠落で、15%に幻覚が見られました。高齢層を想定した質問ほど非整合が目立ったという結果は、年齢や個別条件が絡むほど弱点が広がる可能性を示します。検診や治療の意思決定は、まさにその個別条件の塊です。
がん領域でリスクが跳ね上がる理由
時間との競争
がん情報が他の健康相談より危ういのは、判断の遅れや取り違えのコストが高いからです。NCIが紹介した2017年の大規模研究では、2004年から2013年の1.68百万件の非転移性がん患者データから、初期治療として標準治療を拒否し代替療法を選んだ281人を分析しました。乳がんと大腸がんでは、中央値5年の追跡で死亡リスクがほぼ5倍に上ったと報告されています。
この研究はAIそのものを対象にしたものではありません。それでも示唆は明快です。早期がんでは、治療の窓が閉じる前に標準治療へつなぐことが極めて重要であり、判断の寄り道はそのまま予後悪化につながりうるという点です。NCIも、治癒を目指せる時期を逃すとその窓は再び開かないと説明しています。
生成AIが危険なのは、患者を即座に誤治療へ導くからではなく、「少し様子を見てもよい」といった遅延の物語を、もっともらしい文章で補強しうるからです。がん医療では、露骨な誤答より、この静かな先延ばしのほうが現実には起こりやすいです。
代替療法と誤情報の増幅
ACSは2026年の記事で、米国では推計70%が健康情報をインターネットで探し、がんは検索されやすい主題のひとつだと紹介しました。同時に、オンラインのがん情報には個人的体験や販売目的の売り込みが多く、科学的根拠を伴わないものが少なくないと警告しています。とくに、標準治療を避けるよう促す助言、恐怖や緊急性をあおる語り口、出典のない断言は赤信号です。
同じACS記事では、医療処置に関するSNS投稿の少なくとも3分の1に誤りまたは有害な情報が含まれるとされ、がん誤情報は正確な情報より28倍共有されやすい研究も紹介されています。これは、AIが何もないところから誤情報を作るというより、すでに汚れた情報環境を要約し、再包装し、会話形式で再流通させる危険を示します。
AIの出力が厄介なのは、検索結果のように複数のリンクが並ぶのではなく、ひとつのまとまった答えとして提示される点です。利用者は裏取り前に納得しやすく、反対意見や不確実性も見えにくくなります。
さらに、一般向けのAIチャットボットと、規制下の医療AIは区別しなければなりません。FDAのAI対応医療機器リストは、市販承認や認可を受けた機器を透明化するためのもので、2026年時点では将来の更新でLLMベース機能も識別しやすくする方針を示しています。裏返せば、私たちが日常的に触れる汎用チャットボットは、そのままFDAが安全性と有効性を審査した医療機器ではない場合が大半です。
注意点・展望
読者がまず押さえるべきなのは、AIを「診断」や「治療判断」の代行に使わないことです。使うなら、受診前の質問整理、専門用語の言い換え、診察後の説明の復習、医師に確認したい論点の洗い出しまでに限定すべきです。AIに答えを決めさせるのではなく、医師に持ち込むメモを整える道具として使うほうが安全です。
その際は、出典提示を必ず求め、出典が公的機関、学会、査読論文かを確認し、回答に「標準治療をやめる」「受診を急がなくてよい」といった含意があれば、その時点で自己判断を止めるべきです。FDAが整理するように、臨床判断支援の世界では、推奨の根拠を人間が理解でき、利用者がそれに依存しすぎない設計が重視されます。汎用AIはそこがまだ弱いのです。
今後の展望としては、無制限の汎用対話より、範囲を絞った支援ツールのほうが先に定着する可能性が高いです。NCIでも、新規がん患者の受診準備を支えるメニューベースのチャットボット試験や、遺伝情報説明を補う会話支援の試験が進められてきました。安全な方向は、何でも答えるAIではなく、役割、根拠、監督者を限定したAIです。
まとめ
がん情報におけるAIチャットボットの問題は、単純な正誤判定よりも深いところにあります。人々はアクセス不安と情報過多のなかで、正確だからではなく、速くて話しやすいからAIを開きます。ところが研究では、一般質問の概説には役立つ一方、治療や検診の助言では非整合や幻覚がなお残り、しかも正しい情報に紛れて提示されることが確認されています。
したがって、現時点での現実的な結論は明確です。AIは、がん患者や家族が診療に備える補助輪にはなりえますが、主治医の代替にはなりません。特に、治療開始の遅れ、標準治療からの逸脱、代替療法への傾斜を正当化する用途では使うべきではありません。便利さを入口にしつつ、最終判断は必ず医療チームへ戻すことが、いま最も重要な使い方です。
参考資料:
- Can Artificial Intelligence–Driven Chatbots Correctly Answer Questions about Cancer? - NCI
- Assessment of Artificial Intelligence Chatbot Responses to Top Searched Queries About Cancer - JAMA Oncology
- Are AI chatbots concordant with evidence-based cancer screening recommendations? - PubMed
- ChatGPT v4 outperforming v3.5 on cancer treatment recommendations in quality, clinical guideline, and expert opinion concordance - PubMed
- Improving readability and quality of cancer information generated by large language models - PubMed
- New KFF Tracking Poll on Health Information and Trust Finds One in Three Adults Have Used AI Chatbots for Health Advice - KFF
- KFF Health Misinformation Tracking Poll: Artificial Intelligence and Health Information - KFF
- Users of social media and AI chatbots for health information are more likely to say they are convenient than accurate - Pew Research Center
- WHO unveils a digital health promoter harnessing generative AI for public health - WHO
- Ethics and governance of artificial intelligence for health: Guidance on large multi-modal models - WHO
- How to Find Cancer Information You Can Trust - American Cancer Society
- Forgoing Conventional Cancer Treatments for Alternative Medicine Increases Risk of Death - NCI
- Artificial Intelligence-Enabled Medical Devices - FDA
- Clinical Decision Support Software Frequently Asked Questions (FAQs) - FDA
テクノロジー・サイエンス
宇宙開発・AI・バイオテクノロジーなど最先端の科学技術を、社会的インパクトの視点から読み解く。技術と倫理の交差点を追い続ける。
関連記事
慢性疾患の人がAI医療相談へ向かう理由と安全な使い方の境界線
慢性疾患患者に広がるAI相談の背景、受診難と医療不信、誤診・個人情報流出リスクの全体像
OpenAIとAnthropic、米AI規制を動かすロビー攻防
OpenAIとAnthropicがワシントンで拠点、人材、資金を増やし、AI規制の主導権を争う構図が鮮明になった。ロビー費、データセンター政策、州規制、軍事利用をめぐる対立を手がかりに、米国のAI政策が企業の計算資源、著作権戦略、安全基準、政府調達の変化とどう結びつくのか、制度設計の焦点を読み解く。
OpenAI死亡訴訟が問うAIチャットボット製品安全責任の行方
ChatGPT利用者の死亡をめぐる複数訴訟は、AIの発言内容ではなく設計欠陥や警告不足を問う製品安全型の戦略へ移っています。Raine訴訟、7件の追加訴訟、Character.AI判決、California SB243、FTC調査から、生成AI企業の責任境界と未成年保護、安全設計の実務課題を読み解く。
がん患者に広がるイベルメクチン処方急増と著名人発信の危うい影響
俳優メル・ギブソンのポッドキャスト発言後、がん患者のイベルメクチンと駆虫薬処方が2.6倍に増えた研究が公表された。臨床根拠が乏しい治療説はなぜ広がるのか。フェンベンダゾールの肝障害リスク、標準治療を遅らせる危険、著名人発信が医療選択を動かす仕組みを、米国の公衆衛生とカルチャーの交差点から丁寧に解説。
AIゼロデイ悪用未遂、Google報告が迫る防御戦略刷新の急務
Googleの脅威分析部門が、AIで発見・武器化されたとみられるゼロデイ悪用未遂を公表した。2FAを迂回する論理欠陥は修正済みだが、攻撃者がLLMで脆弱性探索を量産する時代の到来を示す。M-TrendsやAnthropicの事例も踏まえ、ID基盤の再点検、パッチ、AI防御の実務対応まで詳しく解説する。
最新ニュース
中国レアアース規制が握るトランプ対中外交の主導権争いと新焦点
中国がレアアース輸出許可を外交カード化し、トランプ政権の対中交渉と米国防産業を揺さぶっています。4月規制、10月拡大策、11月停止の残存リスクを整理し、IEAや米政府資料が示す供給集中の実態、米中首脳会談で問われる取引の限界、日本・欧州の脆弱性、半導体、EV、航空防衛をまたぐ影響と今後の焦点を読み解く。
ゴールデンドーム1.2兆ドル試算が問う宇宙ミサイル防衛の現実
CBOがゴールデンドーム型ミサイル防衛の20年費用を1.2兆ドルと試算。宇宙配備迎撃体が総額の6割を占める構造を軸に、米国防予算、核抑止、中国・ロシア対応、同盟国への影響、議会審査の焦点を整理。政府側1,850億ドル説明との隔たりから、米国の宇宙防衛構想の現実性とリスクを技術・財政・戦略面から読み解く。
OpenAIとAnthropic、米AI規制を動かすロビー攻防
OpenAIとAnthropicがワシントンで拠点、人材、資金を増やし、AI規制の主導権を争う構図が鮮明になった。ロビー費、データセンター政策、州規制、軍事利用をめぐる対立を手がかりに、米国のAI政策が企業の計算資源、著作権戦略、安全基準、政府調達の変化とどう結びつくのか、制度設計の焦点を読み解く。
Polymarket疑惑が映す予測市場の内部情報規制の新局面
Polymarketで相次ぐ長期薄商い市場の高精度な賭けは、予測市場を価格発見の道具から内部情報取引の舞台へ変えつつあります。米軍作戦、イラン戦争、暗号資産関連の事例、CFTCの法執行と議会規制を整理し、匿名ウォレットの透明性と限界、投資家が読むべき市場シグナルの危うさを金融規制の次の争点として解説。
米国学力低下の深層、世代を超える成績後退と格差拡大の重い実像
2024年NAEPと2026年Education Scorecardは、米国の読解・数学低迷がコロナ禍だけでなく2013年前後から続く学習後退であることを示す。慢性欠席率28%、10代の常時オンライン化、連邦支援後の学校区差、科学的読解指導の広がりを軸に、格差を再生産する構造と課題の現在地を読み解く。