NIH巨大医療データベースが開く精密医療と情報保護の新たな課題
巨大医療データ統合が意味する研究基盤
米国立衛生研究所(NIH)のAll of Us Research Programは、精密医療を「一部の患者に限られた先端医療」から「大規模データで検証できる研究基盤」へ押し広げる試みです。ゲノム、電子カルテ、生活習慣、身体計測、ウェアラブル機器の情報を同じ環境で扱える点が特徴です。
重要なのは、単に参加者数が大きいことではありません。病気の診断名、薬剤、検査値、日々の活動量や睡眠、遺伝的背景を結び、疾患の発症前後を時間軸で追えることです。治療が誰に効き、誰に副作用が出やすいのかを探る研究に、従来より細かな解像度を与えます。
ただし、医療データが大きくなるほど、研究の力と個人情報保護の緊張も高まります。本稿では、All of Usの技術的な設計、既存の巨大バイオバンクとの違い、そしてゲノム時代の倫理的な課題を整理します。
ゲノムと電子カルテを結ぶAll of Usの設計
臨床グレード配列とOMOP標準化
All of Usが注目される第一の理由は、ゲノム情報を単独で置かず、臨床記録と接続している点です。Natureに掲載された2024年のプログラム論文では、当時の公開データとして245,388人分の臨床グレード全ゲノム配列、312,925人分のゲノムワイドジェノタイピング、413,000人超の参加者データが示されました。電子カルテは287,000人超に紐づき、50を超える医療提供組織から集められています。
この規模で多施設の電子カルテを扱うには、病名や検査値の表記ゆれをそろえる必要があります。All of Us Research Hubは、電子カルテをOMOP Common Data Modelで標準化すると説明しています。OMOPは観察研究データを共通構造に置き換える枠組みで、複数施設にまたがる条件抽出や患者群比較を行いやすくします。
ゲノム側でも、短鎖全ゲノム配列、長鎖全ゲノム配列、構造変異、ジェノタイピングアレイなどがControlled Tierで扱われます。2024年論文では、全ゲノム配列データから10億超の遺伝的変異が同定され、そのうち2億7500万超が従来報告されていない変異とされました。希少変異と疾患の関係を探るうえで、この多様な変異カタログは大きな価値を持ちます。
ウェアラブルが埋める診察室外の空白
電子カルテは強力ですが、診察室で観測された出来事に偏ります。血圧や血糖、薬剤処方、診断名は残っても、日常の歩数、心拍、睡眠の乱れ、活動量の急な低下は抜け落ちやすい情報です。All of UsはFitbitなどのウェアラブル機器から、心拍、身体活動、睡眠に関するデータを取り込める設計を採っています。
この「診察室外のデータ」は、予測研究の質を変える可能性があります。2025年に公開された未査読のプレプリントでは、All of Usの電子カルテとウェアラブル情報を組み合わせることで、10の臨床アウトカム予測における平均AUROCが電子カルテ単独より8.5%改善したと報告されました。糖尿病、高血圧、うつ病などで、生活行動の信号が臨床記録を補う構図です。
別の2026年プレプリントでは、All of Usの電子カルテとFitbitデータを用い、うつ病診断前の活動量変化を解析しています。対象は4,104人で、診断の数カ月前から歩数や中高強度身体活動が低下する傾向が示されました。未査読段階の研究であり、臨床実装には慎重な検証が必要ですが、日常データが疾患の早期シグナルになり得ることを示す例です。
巨大バイオバンク競争で際立つ多様性
UK Biobankとの違い
巨大ゲノムデータといえば、英国のUK Biobankが代表例です。UK Biobankは公式サイトで、全ゲノムデータ、全エクソーム、ジェノタイピングのいずれも50万人分を利用可能と説明しており、全ゲノムデータセットの規模では世界最大級です。研究資源としての成熟度も高く、創薬や疾患リスク解析に広く使われています。
一方、All of Usの強みは、米国の多様な参加者を前提に、ゲノム、電子カルテ、身体計測、調査票、ウェアラブルを統合する設計にあります。2024年論文では、ゲノムデータを持つ参加者の77%が生物医学研究で歴史的に過小代表だったコミュニティに属し、46%が過小代表の人種・民族的少数派だと示されました。欧州系に偏りがちなゲノム研究の限界を補う意味があります。
精密医療では、集団の偏りがそのまま医療格差につながります。欧州系データで作られた多遺伝子リスクスコアは、別の祖先集団では性能が落ちることがあります。All of Usは、遺伝的背景、社会的要因、医療アクセス、生活行動を横断して分析できるため、リスク予測や薬剤反応をより幅広い集団で検証する基盤になります。
研究アクセスを広げるデータパスポート
All of Usのもう一つの特徴は、データを研究者の手元へ配るのではなく、Researcher Workbenchというクラウド環境の中で解析させることです。Public Tierでは集計データを誰でも見られます。Registered Tierでは電子カルテ、調査票、身体計測、ウェアラブルの個人レベルデータを扱えます。Controlled Tierではゲノムデータや詳細な日付情報など、より機微性の高いデータが追加されます。
アクセス方式は、研究計画ごとに毎回承認を待つ従来型とは異なります。Nature論文は、認証された研究者が研修や規約同意を終えると「データパスポート」によってワークスペースを作れる仕組みを紹介しています。2023年8月時点で556機関が契約を持ち、5,000人超の承認済み研究者が4,400件超のプロジェクトに取り組んでいたとされます。
この設計は、計算環境を持つ大規模研究機関だけに有利な構造を弱めます。論文では、2023年の表現型・ゲノムデータが4.75ペタバイト規模に達すると見込まれ、中央クラウドで一元管理することで各機関が重複保存する場合より大幅にコストを抑えられると説明しています。研究アクセスの民主化と、データの持ち出し制限を両立させる狙いです。
再識別と差別リスクを抑える制度設計
All of Usは、直接識別子の削除、暗号化、研究者登録、倫理研修、二要素認証、行動規範、利用監査を組み合わせています。Researcher Workbenchの説明では、日付を1日から365日の範囲で後ろにずらし、89歳超の参加者データを除くなど、再識別を抑える加工も示されています。20人未満の小さなセルを公開しない統計ルールも重要です。
それでも、ゲノムデータは本質的に匿名化しにくい情報です。本人だけでなく血縁者に関する手がかりを含み、外部データとの突合でリスクが高まります。AI解析の発達により、断片的な生活データ、地域情報、希少疾患情報を組み合わせた推定も容易になります。安全性は一度設計して終わりではなく、攻撃手法の変化に合わせて更新されるべきものです。
差別リスクも残ります。米国のGINAは、遺伝情報による健康保険と雇用上の差別を禁じています。しかし、NHGRIはGINAが生命保険、障害保険、介護保険を対象外とすること、15人未満の雇用主や軍の一部に限界があることを説明しています。巨大医療データベースの社会的受容は、研究倫理だけでなく、保険・雇用・家族関係まで含む制度設計に左右されます。
また、多様性を掲げる研究ほど、コミュニティへの影響に敏感である必要があります。All of Usのデータ利用ポリシーは、スティグマを生む研究を禁じ、アメリカ先住民・アラスカ先住民に関する研究には追加的な配慮を求めています。研究成果が特定集団への偏見を強めるなら、科学的発見は社会的信頼を失います。
医療AI時代に読者が注視すべき論点
All of Usは、ゲノム医療と医療AIが次に向かう方向を示しています。答えは「データを大きくする」だけではありません。多様な参加者、標準化された電子カルテ、診察室外のウェアラブル情報、クラウド上の安全な解析環境をどう組み合わせるかが核心です。
今後注視すべき点は三つあります。第一に、新しい予測モデルが実際の診療でどれだけ再現するか。第二に、参加者へ返される遺伝情報が医療アクセスの改善につながるか。第三に、再識別や差別の懸念に制度が追いつくかです。巨大医療データベースの価値は、研究成果の数だけでなく、参加者との信頼を維持できるかで決まります。
日本でも医療データ連携やゲノム医療基盤の整備は避けて通れません。All of Usの教訓は、科学技術の問題に見えて、実際には社会契約の問題でもあるという点です。研究者、医療者、政策担当者、そしてデータを提供する市民が、便益とリスクを同じテーブルで検証し続ける必要があります。
参考資料:
- All of Us Research Hub
- About the Research Hub
- Data Snapshots - All of Us Research Hub
- Data Access Tiers - All of Us Research Hub
- Data Sources - All of Us Research Hub
- Data Methods - All of Us Research Hub
- Researcher Workbench - All of Us Research Hub
- Privacy & Security Protocols - All of Us Research Hub
- Genomic data in the All of Us Research Program - Nature
- Beyond the Clinic: A Large-Scale Evaluation of Augmenting EHR with Wearable Data for Diverse Health Prediction - arXiv
- Physical Activity Trajectories Preceding Incident Major Depressive Disorder Diagnosis Using Consumer Wearable Devices in the All of Us Research Program - arXiv
- Genetic data - UK Biobank
- 100,000 Genomes Project - Genomics England
- Genetic Discrimination - National Human Genome Research Institute
- FACT SHEET: President Obama’s Precision Medicine Initiative - White House Archives
テクノロジー・サイエンス
宇宙開発・AI・バイオテクノロジーなど最先端の科学技術を、社会的インパクトの視点から読み解く。技術と倫理の交差点を追い続ける。
関連記事
医師が見るウェアラブル健康データ、心拍と睡眠の実践的な読み方
Apple Watchなどのウェアラブルは、心拍・心電図・睡眠・血糖を日々記録できます。医師が診療で本当に使いやすいデータ、誤判定やプライバシーの落とし穴、受診前に整理すべき共有方法をFDA資料やCDC統計、米国の健康政策論争から読み解き、通知を診断と誤解しないための安全で実践的な共有と使い方を解説。
ALS新薬トフェルセン、SOD1型で長期呼吸・筋力改善の可能性
FDA承認済みのALS治療薬トフェルセンはSOD1変異という約2%の患者に限られる一方、JAMA Neurologyの長期解析や症例報告では呼吸機能・筋力の改善例も示された。神経変性を測るNfL、遺伝子検査、月1回の髄注、費用と安全性、ATLAS試験が問う発症前介入まで、精密医療としての意義を解説。
最新ニュース
カリフォルニア開票遅延、40百万ドル投資で州政が信頼回復を急ぐ
カリフォルニア州が開票遅延対策に40百万ドルを投じる。郵便投票の大量利用、7日間の到着猶予、署名確認と22日間の修正期間が遅さを生む一方、接戦州下院選や知事選の結果遅延はトランプ氏らの不正言説を招く。予算の内訳、郡の現場負担、投票アクセスと迅速性を両立させる11月中間選挙前の制度設計の焦点を読み解く。
フロリダ死刑急増、デサンティス政治が映す米国司法の深い制度断層
死刑執行が全米で長期的に減る一方、フロリダ州では2025年に19件、2026年も6月25日時点で9件と突出しています。陪審基準を8対4へ緩めた州法、デサンティス知事の犯罪対策政治、最高裁判例への挑戦、冤罪リスクが重なる構図を、米国司法と選挙政治、州権限争い、連邦最高裁の行方から制度の深層を読み解く。
ホルムズ海峡通航料案、オマーン仲介とイラン支配の攻防を読み解く
米イラン戦争後のホルムズ海峡で、オマーンが通航料ではなく航行支援サービス料を軸にした管理案を探る。イランの支配欲、海洋法上の通過通航権、原油・LNG輸送の回復、アジア市場への波及を整理し、停戦履行と海峡管理をめぐる再交渉の焦点、湾岸諸国と日本のエネルギー安全保障への影響と市場リスクの盲点を読み解く。
最高裁が独立機関解任を容認、FRB例外が映す金融市場の防波堤
米最高裁は6対3でFTC委員の解任制限を違憲とし、1935年判例を退けて独立機関への大統領支配を広げた。一方、5対4でFRB理事リサ・クック氏の即時解任は認めず、中央銀行の独立性を例外扱いした。トランプ政権の人事権拡大が金融政策、規制行政、米国債市場、企業の投資判断に中長期的に及ぼすリスクを読み解く。
AI社員が職場を変える生産性神話と隠れた副作用の最新深層分析
米国では従業員の50%が仕事でAIを使い、MicrosoftやMcKinseyは「AI社員」時代を描きます。一方、NBERやGallupは組織全体の生産性転換が限定的だと示します。監督労働、再作業、スキル空洞化、雇用リスクまで、AIエージェント導入が職場にもたらす副作用を科学技術と労働設計の視点で解説。