[Medical Data Science 100 : S17] 「見る」と「行う」は天と地ほど違う:介入とdo演算子で因果の扉を開ける

学習のポイント

データを見るだけの「観察」では、交絡によって真の因果関係は見えません。本章では、「もし介入したら」という因果の問いに答えるための強力な言語「do演算子」の概念と、それを用いて観察データから真の効果を計算するまでの思考プロセスを学びます。

🧐 観察 vs 介入 🧑‍⚕️
相関と因果の壁

データを見るだけの「観察」では、交絡(例:患者の重症度)により見せかけの相関に騙されます。私たちが知りたいのは、治療などの「介入」がもたらす真の因果効果です。

✂️ do演算子という革命
因果への「外科手術」

「もし介入したら」を数学で表現する強力なツール。因果グラフ上で交絡の原因となるパスを仮想的に断ち切り、純粋な効果を抽出します。これはRCTの設計思想そのものです。

📜 識別 → 🧮 推定
因果推論の鉄則

①理論的に因果効果が計算可能か(識別)を確認し、②可能なら調整化公式などを使い計算(推定)します。
数式: P(Y | do(X)) = Σz P(Y | X, Z)P(Z)

臨床現場の「気づき」からすべては始まる

「この新しい治療薬を使った患者さん、なんだか経過が良い気がするな…」。

日々の診療で電子カルテを眺めていると、ふとそんなパターンに気づくことはありませんか? 私たちは毎日、膨大なデータを「見て」います。患者さんの年齢、性別、基礎疾患、そしてどんな治療を受けて、どんな結果になったか。そのデータの中から、私たちは無意識のうちに「AをしたらBが起きた」という関連を見つけ出そうとしています。

この直感や気づきは、新しい発見の第一歩であり、非常に価値のあるものです。しかし、この「気づき」をそのまま「この薬には効果がある」という結論に結びつけてしまうことには、大きな危険が伴います。

なぜ「観察」だけでは不十分なのか?交絡という名の霧

なぜ危険なのでしょうか? それは、私たちがデータで見ているものが、単なる「相関」であって、真の「因果」ではない可能性が高いからです。

例えば、新しい心不全治療薬を考えてみましょう。この薬を使った患者群(A群)と、従来の薬を使った患者群(B群)を比較したところ、A群のほうが予後が良かったとします。この時、私たちは「新しい薬は効果的だ!」と結論づけるべきでしょうか。

ここで一歩立ち止まって、A群の患者さんの背景を詳しく見てみます。すると、A群の患者さんはB群に比べて、平均年齢が若く、腎機能が保たれており、治療へのアドヒアランス(服薬遵守率)も高い傾向があった、なんてことがよくあります。

つまり、

  • 年齢が若いから、予後が良い
  • 腎機能が良いから、予後が良い
  • アドヒアランスが高いから、予後が良い

といった、薬以外の要因(交絡因子)が、”予後が良い”という結果を生み出している可能性を否定できないのです。ハーバード大学のHernánとRobinsがその著書『Causal Inference: What If』で繰り返し強調しているように、このような交絡が存在する観察研究では、治療と結果の間に見られる関連性が、治療そのものの効果なのか、あるいは単に患者背景の違いによるものなのかを区別できません (Hernán & Robins, 2020)。

交絡の構造:見せかけの相関が生まれる仕組み
患者背景
(年齢, 腎機能など)
新薬の選択
予後の改善
(本当の効果?)
この図は、交絡がいかに私たちの判断を誤らせるかを示しています。良好な「患者背景」が、「新薬の選択」(より新しい治療に積極的であるなど)と「予後の改善」の両方に矢印を向けています。このため、たとえ新薬から予後への直接的な矢印(本当の効果)が全くなかったとしても、私たちは「患者背景」という共通の原因を通じて、二つの間に見せかけの相関を観測してしまうのです。

私たちが本当に知りたいこと:「もし、介入『したら』?」

私たちが臨床現場で下す判断は、「過去のデータを見たらどうだったか?」という後ろ向きの問いへの答えではありません。私たちが本当に知りたいのは、「これから目の前の患者さんに、この薬を処方『したら』どうなるか?」という、未来に向けた前向きな問いへの答えのはずです。

これは、データをただ「見る (Seeing)」だけでは決して答えが出ない問いです。なぜなら、それは「もし、私たちが現実に介入『したら (Doing)』どうなるか?」という因果関係そのものを問うているからです。

この「見る(観察)」と「行う(介入)」の間に横たわる深い溝を科学的に乗り越え、交絡の霧を晴らして物事の真の因果関係に迫るための強力な言語とツール。それが、今回から学んでいく「介入(Intervention)」という概念と、それを数学的に表現する「do演算子(do-operator)」なのです。さあ、準備はよろしいでしょうか?

私たちが本当に知りたいこと:「もし、介入『したら』?」 🧐 見る (Seeing) – 観察・過去のデータ – 「過去のデータを見たら どうだったか?」 後ろ向きの問い 交絡の霧 🧑‍⚕️ 行う (Doing) – 介入・未来への問い – 「この薬を処方『したら』 どうなるか?」 前向きの問い 🎯 真の因果関係に迫る 介入 & do演算子 「見る」と「行う」の間にある深い溝を 科学的に乗り越えるための言語とツール

目次

観察(Seeing)から介入(Doing)へ:天気予報士と雨乞いの違い

「見る」ことと「行う」ことの本質的な違いを、身近な例え話でもう少し深く掘り下げてみましょう。この違いを理解することが、因果推論の入り口に立つ上で最も重要なステップの一つです。

天気予報士の世界観:相関に基づく「予測」

ここに、非常に優秀な天気予報士がいます。彼の仕事は、手元にあるデータ、特に気圧計の値を「見る」ことで、未来の天気を予測することです。

彼は、「気圧計の針が低い値を示している(A)ならば、高い確率で雨が降る(B)」という経験則を知っています。これは、AとBの間に強い相関(Association)があることを示しており、条件付き確率 \( P(B | A) \) を計算して予測モデルを立てているわけです。これは、データを「見る」ことで未来を予測する、純粋な観察の世界です。

では、この世界の因果構造はどのようになっているのでしょうか?DAGで描くと、以下のようになります。

天気予報士の世界観:相関に基づく「予測」 【天気予報士の世界の因果グラフ】
(観測不能な)
大気の圧力
気圧計の値
雨が降る
この図の核心は、「大気の圧力」という共通原因(Common Cause)の存在です。
大気の圧力が低下するから、気圧計の値が下がります。
大気の圧力が低下するから、雨が降ります。
気圧計の値と雨の間には直接の因果関係(矢印)はありません。しかし、共通の原因が存在するため、片方を観測すればもう片方を高い精度で予測できる、という「見せかけの相関」が生まれるのです。

この構造が分かっていれば、もし私たちが気圧計の針を無理やり手で「低い」位置に動かしても、雨が降らない理由は明らかですよね。私たちは因果の流れの末端にある「結果」の一つをいじっているだけで、大元の原因である「大気の圧力」には何の影響も与えていないからです。

雨乞いの世界観:因果への期待を込めた「介入」

一方で、古代の人々が行っていた「雨乞いの儀式」は全く異なる思想に基づいています。彼らの目的は、天気を予測することではなく、儀式という行為を「行う」ことで、雨を降らせるという結果を能動的にもたらすことです。

彼らが信じていた(あるいは、期待していた)因果構造は、極めてシンプルです。

【雨乞いの儀式が信じる因果グラフ】
雨乞いの儀式
雨が降る
図の解説:
この図には、自分たちの行動が直接的に結果を生み出す、という強い因果の仮説が表現されています。彼らは、この矢印の存在を信じて、介入(Intervention)を行っていたわけです。これが「行う」の世界観です。

医療における私たちの役割:科学的な”雨乞い”の実践者

さて、これを私たちの医療現場に置き換えてみましょう。

  • 診断・予後予測: 患者さんの症状や検査データを「見て」、病名を特定したり、将来の状態を予測したりするのは、天気予報士の役割に似ています。そこでは、相関関係の知識が非常に重要になります。
  • 治療: 一方で、診断が下った後、薬を投与したり手術を行ったりするのは、まさしく雨乞い師の役割です。私たちは、治療という「介入」を通じて、患者さんの回復という結果を意図的に引き起こそうとしています。

もちろん、私たちは古代の雨乞い師とは決定的に違う点があります。それは、自分たちの介入(治療)と結果(回復)の間にある因果の矢印が本物かどうかを、科学的な手法、すなわちランダム化比較試験(RCT)などで徹底的に検証することです。

この「もし、この治療を行ったらどうなるか?」という因果的な問いを、勘や経験だけでなく、数学という客観的な言語で厳密に議論するために登場したのが、ジュディア・パール(Judea Pearl)が提唱したdo演算子なのです (Pearl, 2009)。それは、私たちの”科学的な雨乞い”の効果を正しく評価するための、不可欠な羅針盤となります。

医療における私たちの役割:科学的な”雨乞い”の実践者 「見る」世界:予測
症状・検査データ
相関
病名・予後予測
do( ) 「行う」世界:介入
治療(介入)
因果
回復
診断・予後予測は、症状やデータを「見て」行う天気予報士の役割に似ています。一方で、治療という「介入」は、意図的に結果を引き起こそうとする科学的な雨乞い師の役割です。

私たちは、介入と結果の間の因果の矢印が本物かを、ランダム化比較試験(RCT)などで徹底的に検証します。「もし、この治療を行ったらどうなるか?」という因果的な問いを数学的に議論するため、ジュディア・パールは do演算子 を提唱しました。

do演算子:因果の流れを操作する「理想の実験」の設計図

さて、観察データに潜む「交絡」という霧を晴らすための道具が「do演算子」です。これは、UCLAのジュディア・パール教授が考案した、因果推論の世界における画期的な発明と言えるでしょう (Pearl, 2009)。

一見するとただの数学記号ですが、その本質は「理想の実験を頭の中で設計するための言語」です。その違いを、確率の表記からじっくりと紐解いていきましょう。

「条件付き確率」と「介入確率」:似て非なる二つの世界

私たちは普段、\( P(Y|X) \) のような「条件付き確率」を目にすることが多いです。これは「観察の世界」の話です。

  • \( P(Y | X=1) \) : 条件付き確率 (観察の世界)
    • 読み方: 「X=1であった、という条件のもとで Yが起きる確率」
    • やっていること: 手元にある巨大なデータセットから、「X=1」というタグが付いている人たちだけを絞り込み(フィルタリング)、その小さな集団の中でYが起きた割合を計算しています。
    • 思考プロセス: 「データを見る」という受動的な行為です。「薬を飲んだ人たちは、どうだったかな?」と過去を振り返っている状態ですね。

これに対して、do演算子を使った \( P(Y | do(X)) \) は「介入確率」と呼ばれ、「仮説の世界」の話をします。

  • \( P(Y | do(X=1)) \) : 介入確率 (仮説の世界)
    • 読み方: 「X=1になるように介入したときに Yが起きる確率」
    • やっていること: 現実のデータがどうであれ、「もし、集団の全員に強制的にX=1という操作をしたら、世界はどう変わるか?」という新しい世界をシミュレーションしています。
    • 思考プロセス: 「介入を行う」という能動的な行為です。「これから薬を全員に飲ませたら、どうなるだろう?」と未来を予測しようとする状態です。

このdoが持つ最大の力は、因果関係の図(DAG)において「ある事象が起こる原因への矢印を、意図的にすべて断ち切る」点にあります。この強力な操作は、グラフの構造そのものに手を加えることから「グラフの外科手術(Graph Surgery)」と表現されることもあります。

「条件付き確率」と「介入確率」:似て非なる二つの世界 観察の世界 P(Y | X=1)
読み方:
「X=1であった」という条件のもとで、Yが起きる確率
やっていること:
データ全体から「X=1」の人だけを絞り込み、その集団でのYの割合を計算する。
思考プロセス:
「データを見る」受動的な行為。「薬を飲んだ人たちは、どうだったかな?」と過去を振り返る。
仮説の世界 P(Y | do(X=1)) Z X
読み方:
「X=1になるように」介入したときに、Yが起きる確率
やっていること:
「もし全員に強制的にX=1の操作をしたら?」という新しい世界をシミュレーションする。
思考プロセス:
「介入を行う」能動的な行為。「これから薬を全員に飲ませたら、どうなるだろう?」と未来を予測する。
do演算子が持つ最大の力は、因果関係の図(DAG)において「ある事象が起こる原因への矢印を、意図的にすべて断ち切る」点にあります。
この強力な操作は、グラフの構造そのものに手を加えることから「グラフの外科手術(Graph Surgery)」と表現されることもあります。

DAGの外科手術:交絡という病巣を切り取る

先ほどの心不全治療薬の例を、もう一度DAGで見てみましょう。この図には、交絡を引き起こしている根本原因、すなわち「バックドア・パス」が存在します。「薬の服用(X)」からスタートして矢印を遡り(\(X \leftarrow Z\))、そこから矢印を辿って「回復(Y)」に至る(\(Z \rightarrow Y\))という、裏口のような経路(\(X \leftarrow Z \rightarrow Y\))のことです。

【図1:観察の世界の因果グラフとバックドア・パス】

【図1:観察の世界の因果グラフとバックドア・パス】
健康状態 (Z)
薬の服用 (X)
回復 (Y)
バックドア・パス (交絡の原因)
この状態で、単純に「薬を飲んだ人」のデータだけを見ると(P(Y | X=1))、私たちは「X → Y」という直接の効果(知りたいこと)と、「X ← Z → Y」というバックドア・パスからの影響(邪魔なもの)を区別できません。二つの流れがごちゃ混ぜになってしまっているのです。

図1の解説:
この状態で、単純に「薬を飲んだ人」のデータだけを見ると(\( P(Y | X=1) \))、私たちは「\(X \rightarrow Y\)」という直接の効果(知りたいこと)と、「\(X \leftarrow Z \rightarrow Y\)」というバックドア・パスからの影響(邪魔なもの)を区別できません。二つの流れがごちゃ混ぜになってしまっているのです。

そこでdo(X=1)という「外科手術」を行います。これは「患者さんの健康状態(Z)がどうであれ、全員に薬を服用させる」という強制的な操作を意味します。その結果、何が起きるでしょうか?

患者さん自身の健康状態が、薬を飲むかどうかの決定に影響を与えることはなくなります。つまり、「健康状態が良いから薬を飲む」という因果の矢印(\(Z \rightarrow X\))が跡形もなく消え去るのです。

【図2:介入(do)後の世界の因果グラフ】

【図2:介入(do)後の世界の因果グラフ】
健康状態 (Z)
薬の服用 (X)
回復 (Y)
(※ Z→Xの矢印が切除され、バックドア・パスが消滅)
見事にバックドア・パスが閉鎖されましたね。この「手術後のグラフ」の世界では、「X」に影響を与えるのは私たちの「介入」の意志だけであり、他のいかなる変数からも影響を受けません。

図2の解説:
見事にバックドア・パスが閉鎖されましたね。この「手術後のグラフ」の世界では、「X」に影響を与えるのは私たちの「介入」の意志だけであり、他のいかなる変数からも影響を受けません。

この状態でXとYの関係を計算すれば、それは交絡因子Zの影響を受けない、純粋な因果効果 \( P(Y | do(X=1)) \) となるのです。

do演算子の正体:それはRCTの設計思想そのもの

「全員に強制的に薬を服用させる、なんて非現実的じゃないか」と感じたかもしれません。しかし、これこそが、私たちが医学研究で最も信頼を置くランダム化比較試験(RCT)がやっていることそのものなのです。

RCTでは、患者さんを治療群と対照群にランダムに割り付けますよね。この「ランダム化」という行為が、まさにdo演算子による外科手術と同じ役割を果たしています。

なぜなら、コインを投げて治療法を決める(ランダム化する)ということは、患者さんの年齢、性別、重症度、併存疾患といったあらゆる背景因子(Z)と、実際に受ける治療(X)との間の関連を、確率的に断ち切る行為だからです。重症な患者さんだから治療群に、ということは起こりえず、治療の割り付けは完全に偶然に支配されます。

つまり、RCTとは、現実世界でdo演算子を物理的に実行するための、最も強力な方法論なのです (Hernán & Robins, 2020)。

do演算子は、単に頭の中で実験を考えるためのツールではありません。それは、信頼性の高い研究(例えばRCT)をどのようにデザインすべきか、そして、RCTが実施不可能な場合に、観察データからどこまで因果関係に迫れるかを考えるための、普遍的な「言語」と「羅針盤」を提供してくれるのです。

do演算子の正体:それはRCTの設計思想そのもの 1. 観察される世界 (相関) 👥 背景因子 (Z) 💊 治療 (X) 📈 結果 (Y)
重症度など(Z)が治療選択(X)に影響し、真の因果関係(X→Y)が隠れてしまいます (交絡)。
交絡パス
2. 介入後の世界 (因果) 👥 背景因子 (Z) 💊 治療 (X) 📈 結果 (Y) ✂️ do(X) / RCT
ランダム化でZ→Xの関連を断絶。これにより、治療(X)から結果(Y)への純粋な因果効果が測定可能に。
純粋な因果効果
🧭
RCTのような信頼性の高い研究をデザインするための「羅針盤」
🗣️
観察データから因果関係に迫るための普遍的な「言語」

計算の前提条件:「識別可能性」という鍵

「理想のカレー」を作るための絶対条件 🍛

「観察データから、どうやって介入の効果を計算するの?」という問いの答えは、「識別可能性 (Identifiability)」という条件をクリアできるかにかかっています。これは、統計的な計算を始めるの、いわば「作戦会議」のステップです。

例え話で理解していきましょう。あなたは「理想のカレー」のレシピ(つまり、知りたい真の因果効果の計算式)を持っています。そのレシピには、手に入りやすいジャガイモや人参と一緒に、「幸福の谷でしか採れない、幻のスパイス」が必要だと書かれています。

あなたのキッチン(手元のデータ)には、ジャガイモも人参もありますが、「幻のスパイス」はもちろんありません。

この状況を因果推論に当てはめてみましょう。

  • 理想のカレーを作ろうと、あるもので代用する:
    幻のスパイスがないままカレーを作ると、出来上がったものは一見カレーに見えるかもしれません。しかし、その味は本来のレシピとは程遠い、全くの別物です。これは、測定できていない交絡因子(幻のスパイス)を無視して計算した、バイアスのかかった見せかけの関連性に相当します。
  • 「理想のカレーは作れない」と認める:
    「幻のスパイスがないのだから、このレシピのカレーは作れない」と判断するのが、科学的に誠実な態度です。これが「因果効果は、このデータからは識別不能である」と結論づけることにあたります。

識別可能性とは、この作戦会議の段階で、「私たちのキッチンにある食材だけで、レシピ通りの料理が本当に作れるのか?」を厳密に検証するプロセスなのです。

「幻のスパイス」の正体:測定できない交絡因子

では、この「幻のスパイス」は、現実の医療研究では何にあたるのでしょうか? それは多くの場合、測定できない交絡因子 (Unmeasured Confounder) です。

例えば、ある治療法 X と回復 Y の関係を見たいとします。しかし、データには現れない、以下のような因子が影響しているかもしれません。

  • 患者さんの「治療への意欲」や「生活習慣」
  • ご家族のサポート体制
  • 主治医の経験に基づく暗黙の判断

これらの因子 U (Unmeasured) が、治療法 X の選択と、回復 Y の両方に影響を与えている状況を考えてみましょう。

患者の意欲 (U) 治療法 (X) 回復 (Y)

このとき、U が作り出す X ← U → Y という因果の裏道(バックドア・パス)が存在します。しかし、私たちは U を測定できていないため、この裏道を統計的に閉じることができません。「レシピに必要なスパイスが、キッチンにない」状態です。

このような状況では、X から Y への真の因果効果は識別不能となります。

因果推論の鉄則:まず「設計(識別)」し、次に「計算(推定)」する

現代の因果推論では、信頼できる結論を得るために「まず識別、次に推定 (First Identification, then Estimation)」という2段階のプロセスが鉄則とされています(Pearl, 2009)。これは、分析の信頼性を担保するための、科学的に誠実な作法です。

ステップ1:識別 (Identification) — 研究者による知的な「捜査」と「作戦立案」 🤔

統計ソフトを立ち上げる前に行う、最も重要な理論と思考のステップ。それが「識別」です。この段階の主役は、AIや計算機ではなく、人間である研究者自身です。そのプロセスは、専門家としての知識を駆使する捜査官の活動によく似ています。

具体的に何をするのか?

  • 因果の地図を描く (DAGの構築): まず研究者は、自らの専門知識(例:医学的・生物学的な知見)を用いて、考えられる変数間の因果関係を「地図」として描き出します。これがDAG(有向非巡回グラフ)です。この地図は、データを見る前に「この世界は、こうなっているはずだ」という研究者の科学的仮説を表明したものです。
  • 「本道」と「裏道」を探す (パスの分析): 次に、その地図上で、私たちが知りたい治療(原因X)から回復(結果Y)への因果の「本道」 (X → Y)を特定します。同時に、交絡によって生まれる見せかけの相関の「裏道」(バックドア・パス)(例:X ← Z → Y)もすべて洗い出します。
  • 「裏道」を封鎖できるか判断する (識別可能性の判断): 最後に、特定した全ての「裏道」を、手持ちのデータ(地図に載っている観測済みの変数)で完全に封鎖できるか、作戦を立てます。

識別可能 ✅: すべての裏道を封鎖するために必要な変数(例:Z)が、すべてデータセットに記録されている場合。このとき、研究者は「よし、この交絡は調整できる。因果効果を計算するための作戦(レシピ)が立てられる!」と判断します。この作戦書(レシピ)こそが、専門用語でいう推定対象(Estimand)、すなわち「何を計算すべきか」を定義した数式です。

識別不能 ❌: 封鎖すべき裏道に、データとして記録されていない変数(未測定の交絡因子U)が存在する場合。研究者は「ダメだ、この裏道は封鎖できない。有効な作戦は立てられない…」と判断します。これが「識別不能」であり、このままでは真の因果効果は計算できない、という結論になります。

ステップ2:推定 (Estimation) — 「作戦」を実行し、数値を手に入れる 📈

ステップ1で作戦立案(識別)が無事に完了した場合にのみ、私たちは次の計算ステップに進みます。

ここでの主役は、データと統計モデルです。研究者は、ステップ1で確立した作戦書(Estimand)に従って、実際のデータを用いて統計的調理を行います。その結果として得られる「治療効果はXX%向上した」という具体的な数値と、その不確実性(信頼区間)が、推定量(Estimate)です。

この「まず識別、次に推定」という慎重なアプローチこそが、「とりあえず手元の変数で分析する」という危険な落とし穴から私たちを救い、分析結果に科学的な信頼性を与えるための、極めて重要な作法なのです。


因果推論の鉄則:まず「識別」、次に「推定」 「識別可能」なら ステップ1:識別 (Identification) 🤔📜 レシピの検証段階 これは実際のデータを投入する前の 理論的なステップです。 因果グラフを元に、知りたい因果効果を 手持ちの変数だけで計算できる数式に 書き換えられるかを判断します。 ステップ2:推定 (Estimation) 🍳📊 実際の調理段階 ステップ1で「作れる!」と判断できた 場合にのみ、実際のデータをその数式に 当てはめて、因果効果の数値を 計算します。 この「まず識別、次に推定」という慎重なアプローチこそが、因果推論を単なるデータ分析から、 より信頼性の高い科学的探求へと引き上げる、非常に重要な作法なのです。

RCTと観察研究:前提条件の違い

この「識別可能性」というレンズを通してRCTと観察研究を改めて比較すると、その違いが一層明確になります。

特徴観察研究 (Observational Study)ランダム化比較試験 (RCT)
ゴールデータから「関連」を見つける「因果効果」を直接的に推定する
交絡制御未知・未測定の交絡バイアスが残り得るランダム化により、観測・未観測を問わず交絡を原理的に制御
識別可能性強い仮定(例:全ての交絡因子を測定済み)のもとで、バックドア基準などを満たせば識別可能研究デザインそのものによって、因果効果が識別可能であることが保証されている
計算方法識別後、調整化公式などのdo-calculusを用いて推定原則、単純な群間比較で因果効果を推定できる

この「識別可能性」という厳しい関門をクリアしているという仮定の上に立って初めて、私たちは観察データから因果を探る次なるステップへと進むことができるのです。

do-calculusへの入り口:「調整」という操作で仮想的なRCTを創り出す

さて、因果の地図(DAG)を描き、それを使って「因果効果は、手元のデータから計算できる!(識別可能だ!)」という確信が得られたなら、いよいよ待ちに待った計算のステップ、すなわち推定へと進みます。ここからは、理論の世界から一歩踏み出して、実際のデータに触れていくことになります。

そのための最も基本的かつ強力な道具が、調整化公式(Adjustment Formula)です。これは、観察研究のデータから、まるでランダム化比較試験(RCT)を行ったかのような状況を擬似的に作り出す、いわば因果推論における最初の「魔法の呪文」のようなものだと考えてみてください。

考え方は驚くほど直感的です。「もし、比較したいグループ間の背景因子(交絡因子)の偏りを、統計的に平らにならすことができたら、残った差は真の介入効果と言えるのではないか?」というアイデアに基づいています。つまり、交絡因子の影響を公平に取り除いた、仮想的な理想集団(pseudo-population)をデータ上で創り出し、その集団で介入の効果を測る、というアプローチを取るのです。

調整化公式:do演算子を外すための数学的処方箋

この「背景を平らにならす」という操作を数学的に表現したのが、以下の調整化公式です。UCLAのジュディア・パール教授がその記念碑的著作『Causality』で示した、因果推論の根幹をなす式の一つです (Pearl, 2009)。

\[ P(Y=y \mid do(X=x)) = \sum_{z} P(Y=y \mid X=x, Z=z)P(Z=z) \]

一見すると少し複雑に見えるかもしれませんが、一つ一つのパーツを分解すれば、その意味は明確です。この式は、「もし全員に介入 \(X=x\) をしたらどうなるか?(左辺)」という因果の問いの答えを、「手元にある観察データ(右辺)だけを使って計算するための処方箋」なのです。

  • \(P(Y=y \mid do(X=x))\): 私たちが本当に知りたい介入効果です。「もし集団全員に介入 \(x\) (例:新薬の投与)を強制的に行った場合、結果 \(Y\) が \(y\) (例:回復)になる確率はどれくらいか?」を意味します。左辺には do が入っているので、これはまだ観察データからは直接計算できません。
  • \(\sum_{z}\): これは「すべての \(z\) のパターンについて足し合わせる」という意味の総和記号です。交絡因子 \(Z\) (例:重症度)が「軽症」「重症」というカテゴリを持つなら、軽症の場合と重症の場合、それぞれについて計算して最後に合計します。
  • \(P(Y=y \mid X=x, Z=z)\): この部分が調整の「核」です。これは「交絡因子 \(Z\) の値が特定の \(z\) である集団に限定した中で、介入 \(X=x\) を受けた人が、結果 \(Y=y\) となった条件付き確率」を意味します。例えば、「軽症患者グループの中だけで見たときの、新薬の回復率」といった具合です。\(Z\) の値を固定することで、その層の中では \(Z\) による交絡の影響がなくなるため、これは純粋な「関連」を捉えていると期待できます。
  • \(P(Z=z)\): これは「集団全体における、交絡因子 \(Z\) が \(z\) である人の割合」です。例えば、「データ全体の中で、軽症患者が占める割合」を意味します。これは、各層の重要度に応じた「重み」として機能します。

つまり、この公式がやっていることは、

  1. まず、交絡因子 \(Z\) でデータを小さなグループ(層)に分ける(例:軽症グループ、重症グループ)。
  2. それぞれの層の中で、介入 \(X\) と結果 \(Y\) の純粋な関係(層別効果)を計算する (\(P(Y \mid X, Z=z)\))。
  3. 計算した各層の効果を、集団全体でその層が占める割合 (\(P(Z=z)\)) で重み付けして、平均を取る。

このステップによって、特定の層に偏って行われていた介入(例:軽症者に新薬が使われやすい)というバイアスが補正され、あたかも各層にバランス良く介入が行われたかのような、仮想的な集団での効果を推定できるのです。

do-calculus:調整化が効かない、より複雑な状況への挑戦

調整化公式は、バックドア基準を満たすすべての交絡因子 \(Z\) を観測できている、という理想的な状況で非常に強力です。しかし、現実の研究では、もっと複雑で厄介な因果グラフに直面することも少なくありません。

例えば、

  • どうしても測定できない交絡因子がある場合はどうするか?
  • 交絡因子だけでなく、介入と結果の間をつなぐ因子(媒介因子)も考慮したい場合は?
  • バックドア・パスは閉じられないが、別の経路(フロントドア・パス)なら使える場合は?

こうした、単純な調整化だけでは太刀打ちできない問題に対応するために、パールは do 演算子を観測可能な数量に変換するための、より一般的で強力なルール体系として do-calculus を構築しました (Pearl, 1995; Pearl, 2009)。

do-calculus は、いわば因果推論の「文法体系」のようなものです。DAGの構造だけを頼りに、do が含まれた「介入の世界」の確率表現を、do を含まない「観察の世界」の確率表現へと書き換えて良いかどうかを判断するための、たった3つの変換ルールから成り立っています。これらのルールを巧みに組み合わせることで、私たちは調整化公式が使えないような難問にも挑むことができるようになります。

その3つのルールやdo-calculus の詳細は、今後、S17.xのサブシリーズで解説していきます。

数値例で体験する:交絡が隠した薬の本当の効果

ある新しい治療薬の効果を評価する、1000人の患者データがあるとします。

  • 治療 (X): 新薬 (X=1) / 従来薬 (X=0)
  • 結果 (Y): 回復 (Y=1) / 非回復 (Y=0)
  • 交絡因子 (Z): 軽症 (Z=1) / 重症 (Z=0)

まず、単純に薬の種類と回復率の関係を見てみましょう。

回復 (Y=1)非回復 (Y=0)合計回復率
新薬 (X=1)150人250人400人37.5%
従来薬 (X=0)270人330人600人45.0%

この表だけを見ると、新薬の回復率(37.5%)は従来薬(45.0%)より低く、まるで「新薬は効果がない、むしろ有害だ」とさえ見えてしまいます。しかし、本当にそうでしょうか?

ここで、交絡因子である「重症度(Z)」で患者を層別化してみましょう。

1. 軽症 (Z=1) の患者グループ (全体で600人)

回復 (Y=1)非回復 (Y=0)合計回復率
新薬 (X=1)120人80人200人60%
従来薬 (X=0)200人200人400人50%

2. 重症 (Z=0) の患者グループ (全体で400人)

回復 (Y=1)非回復 (Y=0)合計回復率
新薬 (X=1)30人170人200人15%
従来薬 (X=0)70人130人200人35%

驚いたことに、軽症グループでも、重症グループでも、新薬の回復率は従来薬を上回っています。これが有名なシンプソンのパラドックスです。全体で見たときと、層別で見たときで結論が逆転してしまう現象ですね。

なぜこんなことが起きたかというと、重症患者(もともと回復しにくい)には安全のため従来薬が多く使われ、軽症患者(もともと回復しやすい)には新薬が試される傾向があった、という交絡があったからです。

調整化公式で、交絡のバイアスを取り除く

ここで、調整化公式の出番です。この公式は、層別で見た「真の効果」を、集団全体の構成比で公平に重み付けし、バイアスを取り除いた真の因果効果をあぶり出します。

\[ P(Y=1|do(X=1)) = \sum_{z} P(Y=1|X=1, Z=z)P(Z=z) \]

この数式の各パーツに、先ほどの数値を当てはめてみましょう。

  1. \( P(Y=1|X=1, Z=1) \) (軽症層での新薬回復率):
    • 軽症グループで新薬を使った人の回復率は 60% (0.6) でした。
  2. \( P(Y=1|X=1, Z=0) \) (重症層での新薬回復率):
    • 重症グループで新薬を使った人の回復率は 15% (0.15) でした。
  3. \( P(Z=1) \) (集団全体での軽症者の割合):
    • 全1000人中、軽症者は600人なので、その割合は 60% (0.6) です。
  4. \( P(Z=0) \) (集団全体での重症者の割合):
    • 全1000人中、重症者は400人なので、その割合は 40% (0.4) です。

これらを公式に代入します。

\[ P(Y=1|do(X=1)) = (0.6 \times 0.6) + (0.15 \times 0.4) \]

\[ = 0.36 + 0.06 = 0.42 \]

計算の結果、42% という値が出てきました。これが、交絡の影響を取り除いた「もし、集団の全員に新薬を投与したら」という介入を行った場合の、真の回復率の推定値です。

最初の単純比較(37.5%)とは全く違う、そして従来薬の回復率(45.0%)とも異なる、薬本来の効果が見えてきましたね。(同様に従来薬の因果効果を計算すると38%となり、新薬の方が優れていることが分かります)

このように、調整化公式は、観察データしか手元にない場合でも、識別可能性の条件さえ満たせば、あたかも理想的な実験を行ったかのような結果を私たちに示してくれます (Pearl, 2009)。これは、因果推論における非常に力強い一歩なのです。


まとめ:因果の問いに答えるための「言語」を手に入れる

今回は、臨床現場での素朴な「気づき」から出発し、「見る(Seeing)」ことと「行う(Doing)」ことの間に横たわる、決定的かつ深い溝について探求してきました。そして、その溝を科学の力で乗り越えるための、新しい「言語」と「思考の道具」を手に入れました。

今回の旅で得られた、最も重要な学びを振り返ってみましょう。

  • 「予測」と「介入」は根本的に違う 🔍
    私たちは、天気予報士のようにデータを見て関連性から未来を予測する(\( P(Y|X) \))だけでなく、科学的な”雨乞い師”として、介入によって未来を変える(\( P(Y|do(X)) \))ことを目指しています。この二つを明確に区別することが、因果推論のすべての始まりです。
  • do演算子は「理想の実験」の設計図 📝
    do演算子は、交絡因子から治療への矢印を断ち切る「グラフの外科手術」を思考実験として可能にします。これは、現実世界におけるランダム化比較試験(RCT)の設計思想そのものであり、「もし〜だったら?」という因果の問いを数学的に厳密に定義するための、強力な言語となります。
  • 「識別」なくして「推定」なし 🍽️
    観察データから因果効果を計算するには、まず「識別可能性」という関門を突破しなければなりません。これは、手元の材料(データ)で目的の料理(因果効果)が作れるかを理論的に確認するステップです。「バックドア基準」などの条件を満たし、識別可能であると分かって初めて、私たちは「調整化公式」のような具体的なレシピを使って、実際の数値を推定することができるのです。

do演算子とそれを取り巻く概念は、単なる難解な数学記号ではありません。それは、私たちが日常的に頭の中で行っている「もし、あの時こうしていたら?」という反実仮想の思考に、科学的な厳密さと再現性を与えてくれる「因果的思考の文法」なのです。

この新しい言語を手にしたことで、私たちはもう、相関と因果の霧の中で道に迷うことはありません。自信を持って「なぜ」を問い、データから真の効果を導き出すための羅針盤を得たのですから。

次回からは、この強力な基盤の上に、さらに多様な因果推論のテクニックを築き上げていきましょう。


参考文献

  • Pearl, J. (2009). Causality: Models, Reasoning, and Inference (2nd ed.). Cambridge University Press.
  • Pearl, J., Glymour, M., & Jewell, N.P. (2016). Causal Inference in Statistics: A Primer. Wiley.
  • Hernán, M.A., & Robins, J.M. (2020). Causal Inference: What If. Chapman & Hall/CRC.
  • Greenland, S., Pearl, J., & Robins, J.M. (1999). Causal diagrams for epidemiologic research. Epidemiology, 10(1), 37–48.
  • VanderWeele, T.J. (2015). Explanation in Causal Inference: Methods for Mediation and Interaction. Oxford University Press.
  • Shrier, I., & Platt, R.W. (2008). Reducing bias through directed acyclic graphs. BMC Medical Research Methodology, 8(1), 70.

ご利用規約(免責事項)

当サイト(以下「本サイト」といいます)をご利用になる前に、本ご利用規約(以下「本規約」といいます)をよくお読みください。本サイトを利用された時点で、利用者は本規約の全ての条項に同意したものとみなします。

第1条(目的と情報の性質)

  1. 本サイトは、医療分野におけるAI技術に関する一般的な情報提供および技術的な学習機会の提供を唯一の目的とします。
  2. 本サイトで提供されるすべてのコンテンツ(文章、図表、コード、データセットの紹介等を含みますが、これらに限定されません)は、一般的な学習参考用であり、いかなる場合も医学的な助言、診断、治療、またはこれらに準ずる行為(以下「医行為等」といいます)を提供するものではありません。
  3. 本サイトのコンテンツは、特定の製品、技術、または治療法の有効性、安全性を保証、推奨、または広告・販売促進するものではありません。紹介する技術には研究開発段階のものが含まれており、その臨床応用には、さらなる研究と国内外の規制当局による正式な承認が別途必要です。
  4. 本サイトは、情報提供を目的としたものであり、特定の治療法を推奨するものではありません。健康に関するご懸念やご相談は、必ず専門の医療機関にご相談ください。

第2条(法令等の遵守)
利用者は、本サイトの利用にあたり、医師法、医薬品、医療機器等の品質、有効性及び安全性の確保等に関する法律(薬機法)、個人情報の保護に関する法律、医療法、医療広告ガイドライン、その他関連する国内外の全ての法令、条例、規則、および各省庁・学会等が定める最新のガイドライン等を、自らの責任において遵守するものとします。これらの適用判断についても、利用者が自ら関係各所に確認するものとし、本サイトは一切の責任を負いません。

第3条(医療行為における責任)

  1. 本サイトで紹介するAI技術・手法は、あくまで研究段階の技術的解説であり、実際の臨床現場での診断・治療を代替、補助、または推奨するものでは一切ありません。
  2. 医行為等に関する最終的な判断、決定、およびそれに伴う一切の責任は、必ず法律上その資格を認められた医療専門家(医師、歯科医師等)が負うものとします。AIによる出力を、資格を有する専門家による独立した検証および判断を経ずに利用することを固く禁じます。
  3. 本サイトの情報に基づくいかなる行為によって利用者または第三者に損害が生じた場合も、本サイト運営者は一切の責任を負いません。実際の臨床判断に際しては、必ず担当の医療専門家にご相談ください。本サイトの利用によって、利用者と本サイト運営者の間に、医師と患者の関係、またはその他いかなる専門的な関係も成立するものではありません。

第4条(情報の正確性・完全性・有用性)

  1. 本サイトは、掲載する情報(数値、事例、ソースコード、ライブラリのバージョン等)の正確性、完全性、網羅性、有用性、特定目的への適合性、その他一切の事項について、何ら保証するものではありません。
  2. 掲載情報は執筆時点のものであり、予告なく変更または削除されることがあります。また、技術の進展、ライブラリの更新等により、情報は古くなる可能性があります。利用者は、必ず自身で公式ドキュメント等の最新情報を確認し、自らの責任で情報を利用するものとします。

第5条(AI生成コンテンツに関する注意事項)
本サイトのコンテンツには、AIによる提案を基に作成された部分が含まれる場合がありますが、公開にあたっては人間による監修・編集を経ています。利用者が生成AI等を用いる際は、ハルシネーション(事実に基づかない情報の生成)やバイアスのリスクが内在することを十分に理解し、その出力を鵜呑みにすることなく、必ず専門家による検証を行うものとします。

第6条(知的財産権)

  1. 本サイトを構成するすべてのコンテンツに関する著作権、商標権、その他一切の知的財産権は、本サイト運営者または正当な権利を有する第三者に帰属します。
  2. 本サイトのコンテンツを引用、転載、複製、改変、その他の二次利用を行う場合は、著作権法その他関連法規を遵守し、必ず出典を明記するとともに、権利者の許諾を得るなど、適切な手続きを自らの責任で行うものとします。

第7条(プライバシー・倫理)
本サイトで紹介または言及されるデータセット等を利用する場合、利用者は当該データセットに付随するライセンス条件および研究倫理指針を厳格に遵守し、個人情報の匿名化や同意取得の確認など、適用される法規制に基づき必要とされるすべての措置を、自らの責任において講じるものとします。

第8条(利用環境)
本サイトで紹介するソースコードやライブラリは、執筆時点で特定のバージョンおよび実行環境(OS、ハードウェア、依存パッケージ等)を前提としています。利用者の環境における動作を保証するものではなく、互換性の問題等に起因するいかなる不利益・損害についても、本サイト運営者は責任を負いません。

第9条(免責事項)

  1. 本サイト運営者は、利用者が本サイトを利用したこと、または利用できなかったことによって生じる一切の損害(直接損害、間接損害、付随的損害、特別損害、懲罰的損害、逸失利益、データの消失、プログラムの毀損等を含みますが、これらに限定されません)について、その原因の如何を問わず、一切の法的責任を負わないものとします。
  2. 本サイトの利用は、学習および研究目的に限定されるものとし、それ以外の目的での利用はご遠慮ください。
  3. 本サイトの利用に関連して、利用者と第三者との間で紛争が生じた場合、利用者は自らの費用と責任においてこれを解決するものとし、本サイト運営者に一切の迷惑または損害を与えないものとします。
  4. 本サイト運営者は、いつでも予告なく本サイトの運営を中断、中止、または内容を変更できるものとし、これによって利用者に生じたいかなる損害についても責任を負いません。

第10条(規約の変更)
本サイト運営者は、必要と判断した場合、利用者の承諾を得ることなく、いつでも本規約を変更することができます。変更後の規約は、本サイト上に掲載された時点で効力を生じるものとし、利用者は変更後の規約に拘束されるものとします。

第11条(準拠法および合意管轄)
本規約の解釈にあたっては、日本法を準拠法とします。本サイトの利用および本規約に関連して生じる一切の紛争については、東京地方裁判所を第一審の専属的合意管轄裁判所とします。


For J³, may joy follow you.

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

医師・医学博士・AI研究者・連続起業家
元厚生労働省幹部・ハーバード大学理学修士・ケンブリッジ大学MBA・コロンビア大学行政修士(経済)
岡山大学医学部卒業後、内科・地域医療に従事。厚生労働省で複数室長(医療情報・救急災害・国際展開等)を歴任し、内閣官房・内閣府・文部科学省でも医療政策に携わる。
退官後は、日本大手IT企業や英国VCで新規事業開発・投資を担当し、複数の医療スタートアップを創業。現在は医療AI・デジタル医療機器の開発に取り組むとともに、東京都港区で内科クリニックを開業。
複数大学で教授として教育・研究活動に従事し、医療関係者向け医療AIラボ「Medical AI Nexus」、医療メディア「The Health Choice | 健康の選択」を主宰。
ケンブリッジ大学Associate・社会医学系指導医・専門医・The Royal Society of Medicine Fellow

目次