[Medical Data Science 100 : S15] 物事の「仕組み」を図で描く:ジュディア・パールと構造的因果モデル(SCM)

学習のポイント

「相関」と「因果」を見分けるための強力な思考ツール、DAGとSCMを学びましょう。これらのツールを使えば、複雑なデータの中から真の関係性を見抜き、より良い意思決定を行うための「因果の地図」を描けるようになります。

🤔 見せかけの相関
なぜ因果推論が必要か?

「アイスクリームが売れると溺死者が増える」という相関は有名です。もちろん、アイスが原因ではありません。裏には「気温」という共通の原因(交絡因子)が隠れています。臨床現場もこうした見せかけの相関で溢れています。

🗺️ DAG (有向非巡回グラフ)
因果関係の「見取り図」

頭の中にある因果の仮説を「点(変数)」と「矢印(→)」で描く共通言語です。複雑な関係性を可視化し、交絡などのバイアスの構造を一目で理解できるようにします。これにより、分析前に思考を整理できます。

⚙️ SCM (構造的因果モデル)
因果の「物理法則」

DAGで描いた見取り図の裏側にある「仕組み」を、具体的な方程式で記述するモデルです。「もし介入したらどうなるか?」といったシミュレーションを可能にし、因果効果の大きさを定量的に推定する強力なエンジンとなります。

Step 1: 構造を可視化 🗺️ DAG Step 2: 法則を数式化 ⚙️ SCM Step 3: 問いに答える 「介入効果は?」 「もし~だったら?」(反実仮想) 💡 真の因果効果の推定

「アイスクリームが売れると、溺死者が増える」🍦➡️🌊。

この奇妙な相関関係は、因果推論を学ぶ際に誰もが一度は耳にする、あまりにも有名な例え話です (Pearl & Mackenzie, 2018)。もちろん、アイスクリームが人を溺れさせるわけではないことは、私たちの直感ですぐにわかります。その裏には「気温の上昇」という、両者を同時に動かす共通の原因(交絡因子)が隠れているだけですよね。

しかし、この話は笑い話では終わりません。私たちの臨床現場は、これよりも遥かに複雑な「見せかけの相関」で溢れています。

「新しい治療薬を使った患者群は、予後が悪いように見える…」
「特定の生活習慣を持つ人々は、ある疾患の罹患率が低い…」

そのデータを見て、私たちは瞬時に問いを立てます。「それは、本当にその薬のせいだろうか?」「その生活習慣が本当に健康をもたらしているのだろうか?」「もしかしたら、患者の年齢、重症度、社会的背景といった、目に見えない要因が結果を歪めているだけではないか?」

こうした問いが頭の中を駆け巡り、何が原因で、何が結果で、何が交絡なのか、思考がごちゃごちゃになってしまう…。そんな経験は、きっと誰にでもあるはずです。

もし、その頭の中の複雑な絡まりを解きほぐし、誰が見ても同じように理解できる、一枚のクリアな「因果の地図」に描き出す方法があるとしたら、素晴らしいと思いませんか?

実は、あるんです。

それを可能にするのが、今回ご紹介する構造的因果モデル(Structural Causal Model, SCM)と、それを視覚的に表現するDAG(有向非巡回グラフ)という、現代の因果推論における超強力なツールなのです。さあ、一緒にその使い方を学んでいきましょう。


目次

ヒーロー登場!ジュディア・パールと「因果の設計図」

さて、ここからが本題です。これまで統計学の世界では、「相関は因果を意味しない」という言葉が、まるで鉄の掟のように君臨していました。統計学の父とも呼ばれるカール・ピアソン以来、多くの統計家はデータから「因果」を語ることに非常に慎重だったんです。データが示すのはあくまで関連性であり、その背後にある「なぜ?」に踏み込むのは科学の領域ではない、と。なんだか、少しもどかしい感じがしますよね。

この長年の停滞に風穴を開け、因果推論の世界に革命をもたらしたのが、今回ご紹介するジュディア・パール(Judea Pearl)です。

彼のバックグラウンドが面白いところで、彼は伝統的な統計学者ではなく、人工知能(AI)の研究者でした。パールは考えました。「人間に近いAI、つまり本当に『考える』機械を作るには、単に関連性を学習するだけでは不十分だ。人間のように、物事の因果関係を理解し、『もし、こうしたら、どうなるだろう?』と予測できる能力が必要不可欠だ」と。

例えば、私たちが「部屋のスイッチを押せば、電気がつく」と理解しているのは、スイッチと点灯の間に「因果関係」を見出しているからです。この当たり前の思考を、どうすればAIに教えられるか?この問いこそが、彼の革命の出発点でした。

そこで彼が編み出したのが、私たちの頭の中にある因果の直感を、誰でも共有できる「言葉」と「図」で表現する統一的なフレームワークでした。それが、構造的因果モデル(SCM)と、それを視覚化したDAG(有向非巡回グラフ)です。

  • DAGは、いわば因果関係の「見取り図」です。どの要因が、どの要因に影響を与えているのか、その構造を矢印でシンプルに描き出します。これにより、複雑な関係性も一目瞭然になります。
  • SCMは、その見取り図の裏側にある「物理法則」のような数式です。DAGが「何と何が繋がっているか」を示すのに対し、SCMは「どのように繋がっているか」を具体的に記述します。
ヒーロー登場!ジュディア・パールと「因果の設計図」 統計学の壁 ⛓️ 相関 ≠ 因果
「相関は因果を意味しない」
鉄の掟の前で、思考は停止…
従来の考え:
データが示すのはあくまで関連性。「なぜ?」に踏み込むのは科学の領域ではない、と考えられていた。
🦸 ジュディア・パール (AI研究者 🤖)
「考えるAIには
因果の理解が必要だ!」
因果の設計図 DAG (見取り図) 🗺️
要因間の因果関係を
矢印でシンプルに可視化
👆 スイッチ 💡 電灯 SCM (物理法則) 📐
関係性を数式で具体的に記述
電灯 := f(スイッチ)

この功績は、「確率的および因果的推論のための計算論を発展させたことによる、人工知能への根源的な貢献」として認められ、彼は2011年に計算機科学のノーベル賞とも言われるチューリング賞を受賞しました。

パールが提唱したSCMとDAGは、まさに「物事の因果関係を書き出すための設計図」なんです (Pearl, 2009)。この設計図があれば、複雑に絡み合った要因たちの関係性が整理され、「どこに介入すれば、望む結果が得られるのか?」という、因果関係の核心に迫る問いに答えるための道筋が見えてきます (Pearl & Mackenzie, 2018)。

さあ、前置きが長くなりましたが、このパワフルな設計図の描き方を、さっそく学んでいきましょう!


DAG:因果関係を「絵」にする魔法 🗺️

さて、いよいよ因果関係の「設計図」の描き方を学びます。その名もDAG(ダグ)。これは有向非巡回グラフ(Directed Acyclic Graph)の略語で、なんだか難しそうな名前ですが、安心してください。ルールは驚くほどシンプルで、一度理解すれば、臨床研究の論文を読むときや、ご自身の研究計画を立てるときの見通しが、劇的に良くなるはずです。

DAGは、私たちの頭の中にある「この変数が、あれに影響しているはずだ」という因果に関する仮説(assumptions)を、視覚的に表現するための共通言語です。まずは、その文法の基本から見ていきましょう。

DAGを構成する2つの要素:ノードとエッジ

DAGは、2種類のパーツでできています。

  • ノード(Nodes): 「点」で表され、私たちの関心事である変数(要因)が入ります。例えば、「喫煙」「年齢」「肺がんの発症」といった、物語の登場人物だと考えてください。
  • エッジ(Edges): 「矢印(→)」で表され、ノード間をつなぎます。これは、ある登場人物から別の登場人物への直接的な影響、つまり因果関係を示します。

DAGの絶対的なルール:「有向」かつ「非巡回」

そして、この登場人物と矢印で物語を描く上で、守らなければならない重要なルールが2つあります。それが「有向」と「非巡回」です。

1. 有向(Directed):矢印の向きがすべてを決める

DAGの矢印は、単なる線ではありません。必ず原因から結果に向かう、一方通行の道です。A → B と描いたなら、それは「AがBの原因である」という強い仮説を表明したことになります。逆は真ならず、です。

例えば、「降水量 → 地面の濡れ」は正しい因果の向きですよね。しかし、「地面の濡れ → 降水量」という逆の矢印は描けません。地面が濡れているからといって、それが原因で雨が降ることはないからです。この時間の流れに逆らわない、厳格な方向性こそが、DAGの「有向性」の核心です。

2. 非巡回(Acyclic):タイムトラベルは禁止

「非巡回」とは、矢印をたどっていったときに、出発点に絶対に戻ってこない(ループがない)ということです。

これはDAGではありません(巡回グラフ) A B C D A → B → C → D → A … と巡回しているため、 DAGではありません。

なぜループが禁止なのか?それは、因果関係が基本的には時間の流れに沿って進むからです。AがBの原因で、BがCの原因で、CがAの原因…というのは、「自分自身が自分の祖父である」と語るようなもので、論理的な矛盾をはらんでいます。DAGの世界では、このような因果のタイムトラベルは許されません

(もちろん、臨床現場ではフィードバックループのような現象もありますが、その場合は時間をずらした変数(例:今日の血圧 → 明日の治療 → 明日の血圧)を考えることで、非巡回性を維持します。)

臨床例でDAGの威力を体感する

言葉の定義だけではピンとこないかもしれませんので、具体的な臨床例でDAGを描いてみましょう。以前も少し触れた「運動習慣」と「心疾患リスク」の関係です。

  • X: 運動習慣
  • Y: 心疾患リスク
  • Z: 年齢

この3つの変数の関係性をDAGで表現してみます。まず、運動習慣(X)は心疾患リスク(Y)を下げると考えられますね。なので、X → Y という矢印が描けます。

しかし、ここで立ち止まって考えてみましょう。年齢(Z)という要因はどうでしょうか?一般的に、年齢が上がると運動習慣(X)は減る傾向にあり、同時に心疾患リスク(Y)は直接的に上がります。これを図にすると、以下のようになります。

DAG (有向非巡回グラフ) の一例 Z (年齢) X (運動習慣) Y (心疾患リスク) 矢印が一方向に流れており、どこから出発しても 元の場所に戻ってくることがないため、これはDAGです。

この図が、DAGの真骨頂です。この図を描いたことで、私たちは以下の仮説を明確にしました。

  1. 年齢は、運動習慣に影響を与える。
  2. 年齢は、心疾患リスクにも直接影響を与える。
  3. 運動習慣は、心疾患リスクに影響を与える。

そして、この図は「運動習慣と心疾患リスクの間に観測される関連性の一部は、共通の原因である年齢によって見せかけ上、作り出されている可能性がある」ということを雄弁に物語っています。このように、2つの変数(XとY)の共通の原因となっている変数(Z)を交絡因子(Confounder)と呼びます。

観察研究で「運動している人の方が心疾患が少ない」というデータがあったとしても、それが本当に運動の効果なのか、単に「若い人が多くて、その人たちが元々心疾患リスクが低いだけ」なのか、データだけでは区別がつきません。DAGは、このようなバイアスの構造を可視化し、分析の際にどの交絡因子を考慮すべきかを教えてくれる、強力な羅針盤となるのです (Greenland et al., 1999)。

✍️ ちょっと練習問題

では、少し練習してみましょう。以下のシナリオをDAGで描いてみてください。

「ある降圧薬(A)は、心血管イベント(B)を抑制すると期待されている。しかし、この薬は腎機能が悪い患者(C)には禁忌であるため、処方されない。そして、腎機能が悪いこと自体が、心血管イベントの強いリスク因子である。」

…いかがでしょうか?答えはこんな感じになります。

DAG (有向非巡回グラフ) の一例 C (腎機能) A (降圧薬) B (心血管イベント) これもDAGの一種です。CはAとBの共通原因であり、 このような変数は「交絡因子」と呼ばれます。

この場合、腎機能(C)が交絡因子になっていることがわかりますね。単純にこの薬を飲んだ人と飲まなかった人を比較すると、飲まなかった群には元々腎機能が悪くイベントリスクが高い人が集まるため、薬の効果を正しく評価できなさそうだ、ということが図から読み取れます。


SCM:因果の「仕組み」を数式で語る ⚙️

さて、DAGという因果の「見取り図」の描き方をマスターしたところで、次はその中身、つまりどういう仕組みで物事が決まるのかという、より深いレベルに踏み込んでいきましょう。そのための道具が、構造的因果モデル(Structural Causal Model, SCM)です。

先ほどのDAGが家の「間取り図」だとしたら、SCMは「この壁は鉄筋コンクリート製で、厚さは20cm」「この部屋の温度は、窓の大きさとエアコンの設定温度で決まる」といった、具体的な仕様や物理法則まで書き込んだ「設計仕様書」にあたります。DAGが因果の骨格(構造)を定性的に示すのに対し、SCMはその骨格の上で、各変数がどのように決まるのかを定量的に、つまり方程式を使って記述するのです。

なぜこの「設計仕様書」が必要なのでしょうか?それは、SCMがあれば「もし壁の厚さを半分にしたら、部屋の温度はどうなる?」といった介入(Intervention)の効果をシミュレーションしたり、「もし昨日エアコンをつけていたら、今日の室温は何度だっただろう?」という反実仮想(Counterfactual)を計算したりすることが可能になるからです。まさに、因果推論の核心に迫るためのエンジンと言えます。

SCM:因果の「仕組み」を数式で語る ⚙️ より深いレベルへ DAG: 因果の見取り図 📜 DAGが家の「間取り図」だとしたら、 因果の骨格(構造)を定性的に示す。 SCM: 設計仕様書 📝 温度 = f (窓, エアコン) SCMは具体的な仕様や物理法則まで 書き込んだ「設計仕様書」。 各変数を方程式で記述する。 SCMで可能になること 🎛️ 介入 (Intervention) 「もし壁の厚さを半分にしたら、 部屋の温度はどうなる?」といった 効果をシミュレーション可能。 🕰️ 反実仮想 (Counterfactual) 「もし昨日エアコンをつけていたら、 今日の室温は何度だっただろう?」 という反実仮想を計算可能。 因果推論の核心に迫るためのエンジン

SCMを構成する登場人物たち

SCMという世界を理解するために、改めて2種類の変数(登場人物)を整理しておきましょう。

  • 内生変数(Endogenous Variables): モデルの「内」で、他の変数から因果的な影響を受ける変数です。DAGで言えば、矢印の先端になっている(矢印を1本以上受けている)ノードがこれにあたります。これから私たちが、その決まり方を方程式で説明しようとする主役たちです。
  • 外生変数(Exogenous Variables): モデルの「外」からやってくる、影響を与えるだけで受けない変数です。DAGでは矢印の根元にしかならない(矢印を全く受けていない)ノードです。これらは、モデルの出発点であり、それ以上さかのぼって原因を分析しない「所与の事実」や、説明しきれない「偶然」や「ノイズ」(誤差項)などを担います。
SCMを構成する登場人物たち 内生変数 (Endogenous) 🎯 モデルの「内」で決まる主役 X Y 📥 矢印の先端になる
モデルの「内」で、他の変数から因果的な影響を受ける変数。DAGでは矢印を1本以上受けているノードが該当します。
🎭 説明されるべき主役
その値がどう決まるのかを、方程式で説明しようとする対象です。
外生変数 (Exogenous) 🎲 モデルの「外」から来る前提条件 U X 📤 矢印の根元にしかならない
モデルの「外」から来て、影響を与えるだけで受けない変数。DAGでは矢印の根元にしかならないノードです。
🌌 出発点・ノイズの役割
モデルの出発点であり、原因を遡らない「所与の事実」や説明しきれない「偶然のノイズ」を担います。

より具体的な臨床例でSCMを組み立てる

先ほど練習問題で使った、より現実に近いDAGを例に、SCMを実際に組み立ててみましょう。このステップを体験すれば、SCMが何をしているのか、きっと腹落ちするはずです。

Step 1: DAGで因果構造を再確認する

お題は、年齢、運動習慣、そして心疾患リスクの関係でしたね。

DAG (有向非巡回グラフ) の一例 Z (年齢) X (運動習慣) Y (心疾患リスク) 矢印が一方向に流れており、どこから出発しても 元の場所に戻ってくることがないため、これはDAGです。

Step 2: 内生変数と外生変数を特定する

  • 内生変数(矢印を受けている): 運動習慣\(X\)、心疾患リスク\(Y\)
  • 外生変数(矢印を受けていない): 年齢\(Z\)

…おっと、忘れてはいけないのが、「説明しきれないノイズ」です。運動習慣は年齢だけで100%決まるわけではありませんし、心疾患リスクも年齢と運動だけで決まるわけではありませんよね。そこで、それぞれの内生変数に対して、説明しきれない要因をまとめた外生変数(誤差項)を導入します。ここでは \( U_X \) と \( U_Y \) と名付けましょう。

Step 3: 内生変数ごとに方程式を立てる

SCMでは、内生変数ひとつひとつに、専用の方程式を割り当てます。これが「構造方程式」と呼ばれるものです。

① 「運動習慣 \(X\)」 の方程式
DAGを見ると、運動習慣\(X\)は、年齢\(Z\)から矢印を受けています。そして、それ以外の要因(個人の意志、環境など)を \( U_X \) とします。よって、\(X\)が決まる仕組みは以下の方程式で表現できます。

\[ X := f_X(Z, U_X) \]

これは「運動習慣\(X\)は、年齢\(Z\)と、その他の要因\( U_X \)によって、何らかの関数 \( f_X \) に従って決まる」という因果メカニズムを表現しています。

② 「心疾患リスク \(Y\)」 の方程式
次に、心疾患リスク\(Y\)のDAGを見てみましょう。\(Y\)は、年齢\(Z\)と運動習慣\(X\)の両方から矢印を受けていますね。そして、それ以外の要因(遺伝、食生活など)を \( U_Y \) とします。

\[ Y := f_Y(Z, X, U_Y) \]

これも同様に、「心疾患リスク\(Y\)は、年齢\(Z\)と運動習慣\(X\)、そしてその他の要因\( U_Y \)によって、関数 \( f_Y \) という仕組みで決まる」という意味になります。

この2本の方程式の「セット」こそが、このDAGに対応するSCMです。

\[ \begin{cases} X := f_X(Z, U_X) \\ Y := f_Y(Z, X, U_Y) \end{cases} \]

この \(f\) という関数が具体的にどんな形(例えば線形回帰のような \(Y = aZ + bX + U_Y\) なのか、もっと複雑な非線形な形なのか)かは、私たちがデータやドメイン知識に基づいて仮定します。しかし、SCMの重要な点は、このように因果の仕組みを一つの方程式ではなく、連立方程式として捉えることで、変数間の相互作用をシステムとして記述できる点にあります。

そして、非常に重要な仮定として、通常は外生変数である誤差項( \( U_X \) と \( U_Y \) )は互いに独立である、つまり無関係であると仮定します。もしこれらが独立でない場合、それは「観測できていない、\(X\)と\(Y\)の共通原因(隠れた交絡因子)」が存在することを示唆し、DAGに点線で \( U_X \leftrightarrow U_Y \) のような線を描き加える必要があります。

このように、SCMはDAGという視覚的な地図を、計算可能な厳密な言語へと翻訳してくれる、強力なツールなのです。

DAGとSCM:最強タッグの役割分担 🗺️ & ⚙️

ここまで、DAGとSCMという2つの強力なツールを見てきました。これらは対立するものではなく、因果推論という旅における「地図」と「GPSナビ」のような、互いに補完し合う最強のタッグだと考えてみてください。

DAGは因果の「静的な地図」

DAGは、因果の全体像を俯瞰するための「地図」です。この地図を見れば、どの街(変数)がどの道(矢印)で繋がっているのか、どの街が交通の要所(交絡因子)になっているのか、その構造が一目瞭然です。私たちはこの地図を使って、目的地(結果)に至るための最適なルート(分析戦略)を考えたり、危険な道(バイアス)を避けたりする方法を定性的に計画することができます。

この地図がなければ、私たちは因果の森で迷子になってしまうでしょう。どの変数を調整すれば良いのか、どの変数を調整してはいけないのか(これは次回以降に学びます)、その判断はDAGという構造の理解があって初めて可能になるのです。

SCMは因果の「動的なGPSナビ」

一方、SCMは、その地図の上で動く「GPSナビ」や「物理シミュレーター」に相当します。このナビには、それぞれの道の具体的な情報(=方程式)がインプットされています。「この道の制限速度は時速60kmで、現在は渋滞している(\( Y = 2X + U_Y \))」といった具合です。

このGPSナビを使えば、私たちは一歩進んだ問いに答えることができます。

  • 介入効果の推定: 「もし、この道を時速80kmで走ったら(=介入)、目的地には何分で着きますか?」
  • 反実仮想の計算: 「もし、10分前に出発していたら、今頃どこにいましたか?」

これらは、地図を眺めているだけでは答えが出ない、定量的な問いです。具体的な数式(メカニズム)を持つSCMだからこそ、こうしたシミュレーションが可能になるのです。

SCMは因果の「動的なGPSナビ」 ⬇️ 🗺️ DAG: 静的な地図
因果の構造(どの道が繋がっているか)はわかりますが、地図を眺めているだけでは、定量的な問いに答えられません。
🤔 「もし、速度を上げたら…?」 🧐 「もし、違う道を選んでいたら…?」
🛰️ SCM: 動的なGPSナビ 📱 数式(メカニズム) 介入効果の推定 🚀
「もし時速80kmで走ったら?」
→ 到着は15分後です。
反実仮想の計算
「もし10分前に出発していたら?」
→ 今頃A地点を通過していました。
具体的な数式(メカニズム)を持つSCMだからこそ、こうしたシミュレーションが可能になります。
Y = 2X + UY

まとめの比較表

この「地図とナビ」のイメージを念頭に、改めて両者の役割を表で整理してみましょう。

特徴DAG (有向非巡回グラフ)SCM (構造的因果モデル)
役割の比喩因果の地図 🗺️因果のGPSナビ ⚙️
表現形式図(グラフ)方程式のセット
主な役割因果構造を「見える化」し、思考を整理する因果メカニズムを「数式化」し、計算を可能にする
得意なこと交絡、媒介、衝突といったバイアスの構造を特定する介入効果の量的推定や「もしも」の世界(反実仮想)をシミュレーションする
問いのレベル「何と何が関係しているか?」
(定性的・構造的)
「Aをxだけ変えたら、Bはどれだけ変わるか?」
(定量的・機能的)

このように、まずはDAGという地図を正確に描いて因果の全体構造を把握し、その地図に基づいてSCMというナビを構築して具体的な数値を計算する。この2段階のアプローチこそが、現代の因果推論の王道なのです。


なぜこれが臨床を変えるのか?DAGが医療従事者にもたらす3つの価値

「なんだか小難しそうだな…」「日常の診療でこんな図を描く暇はないよ」と感じた方もいるかもしれません。おっしゃる通り、これは決して簡単な概念ではありません。ですが、このDAGとSCMという考え方は、単なる統計学の小難しい理論ではなく、私たち医療従事者が日々直面する複雑な問題の解像度を上げ、より良い意思決定を導くための、非常に強力な「思考の道具」になるのです。

具体的に、この「因果の地図」が私たちの臨床や研究にどのような価値をもたらすのか、3つのポイントに絞ってご紹介します。

DAGが医療従事者にもたらす3つの価値 🧭 価値1:研究デザインの 「羅針盤」

思考を導き、計画の質を高める

研究開始前に、収集すべきデータや潜在的な交絡因子を体系的に洗い出し、「重要なデータを取り忘れた」という事態を防ぎます。

✅ デザイン設計

  • 収集必須な変数
  • 交絡因子の特定
  • バイアス構造の予測
🗣️ 価値2:チーム医療の 「共通言語」

暗黙知を「見える化」する

個人の経験や勘を、誰もが客観的に検討できる「因果の地図」に変換。チームの意思決定を透明で論理的にします。

👨‍⚕️ 👩‍💻 X Y
🔬 価値3:論文吟味の 「解像度」

論文の前提構造を見抜く

「調整した」事実だけでなく、その調整が因果構造上妥当か、未測定の交絡はないかなど、論文の奥に潜む仮説を構造的に評価できます。

因果の構造を可視化し、客観的な言葉で語るための必須リテラシー

価値1:研究デザインの「羅針盤」になる 🧭

優れた臨床研究は、データを取り始める前の「デザイン(設計)」の段階でその質がほぼ決まります。ここでDAGは、私たちの思考を導く「羅針盤」の役割を果たします。

例えば、「新しいSGLT2阻害薬が心不全入院を減らすか」を観察研究で検証したいとします。その際、私たちはまず「この薬を処方される患者と、されない患者は、どんな背景が違うだろうか?」と考えますよね。年齢、性別、腎機能、糖尿病の重症度、併用薬、社会経済的背景…。

これらの要因をDAGとして描き出すことで、研究を始める前に、「どの変数が交絡因子になりそうか」「どのデータを必ず収集しなければならないか」を体系的に洗い出すことができます。これにより、「データを集めたはいいが、重要な交絡因子を取り忘れていた…」という悲劇を防ぐことができるのです。

ハーバード大学のMiguel Hernánらが提唱するTarget Trialの概念では、観察研究をあたかも理想的なランダム化比較試験(RCT)に近づけるための思考実験を行いますが、その設計においても、因果構造をDAGで明示することが根幹にあります (Hernán & Robins, 2020)。

価値2:チーム医療の「共通言語」になる 🗣️

臨床研究やカンファレンスでは、医師、看護師、薬剤師、データサイエンティストなど、様々な専門家が協力します。しかし、それぞれの頭の中にある「因果のイメージ」は、微妙に異なっているかもしれません。

  • 医師A: 「やっぱり年齢が一番の交絡因子だよ」
  • 医師B: 「いや、併存疾患の影響も無視できないはずだ」
  • データサイエンティスト: 「統計的にはBMIも関連が強いですが、これは調整すべきでしょうか?」

このような議論は、主観のぶつかり合いになりがちです。しかし、そこでDAGをホワイトボードに描き出せば、議論は劇的に変わります。

「先生方の意見をまとめると、因果構造はこのようになりますね。このDAGを見ると、年齢と併存疾患は確かに交絡因子ですが、BMIは治療選択とアウトカムの中間にある『媒介因子』の可能性があるので、これを調整すると逆にバイアスが生じるかもしれません。」

このように、DAGは個人の経験や勘といった暗黙知を、誰もが客観的に検討できる「共通言語」へと変換してくれます。これにより、チームの意思決定はより透明で論理的なものになるのです (Shrier & Platt, 2008)。

価値3:論文の批判的吟味の「解像度」を上げる 🔬

明日からすぐに役立つ最大のメリットは、論文を読むときの「眼」が変わることかもしれません。EBMを実践する上で、論文の批判的吟味は欠かせませんが、DAGを知ることで、その解像度が格段に上がります。

ある観察研究の論文を読んだとき、これまでは「多変量解析で調整しているから、まあ大丈夫だろう」と漠然と考えていたかもしれません。しかし、DAGを知っていれば、こう考えられるようになります。

「この研究の著者たちは、治療、アウトカム、そして共変量の間に、どのような因果の『地図』を想定しているのだろうか?」「彼らが調整した変数は、本当に交絡因子だけだろうか?もしかして、調整してはいけない『合流点バイアス』を引き起こす変数を調整してしまっていないか?」「この地図には描かれていない、重要な『測定されていない交絡因子』は存在しないだろうか?」

このように、論文の奥に潜む「因果に関する仮説」を読み解き、その妥当性を構造的に評価できるようになる。これこそ、DAGがもたらす最も知的で実践的な恩恵の一つだと私は思います (Greenland et al., 1999)。

漠然とした経験や勘だけに頼るのではなく、因果の構造を可視化し、客観的な言葉で語る。SCMとDAGは、それを可能にするための、現代の医療従事者にとって不可欠なリテラシーなのです。


まとめ:因果の「地図とコンパス」を手に入れよう

今回は、私たちの頭の中にある漠然とした「因果のイメージ」を、客観的で操作可能な形に落とし込むための、強力なツールセットについて学んできました。

かつて私たちは、「相関は因果ではない」という標語の前で立ち尽くすしかありませんでした。しかし、もう違います。ジュディア・パールがもたらした革命によって、私たちは因果関係を科学的に議論するための「言葉」を手に入れたのです。

  • まずDAGという「因果の解剖図」を描き、現実世界の複雑な関係性を、その骨格から明らかにします。これにより、バイアスの源泉となる交絡などの構造を「見える化」しました。
  • 次にSCMという「地図を支配する物理法則」を導入し、その構造の上で各変数がどのように決まるのかを、方程式という厳密な言語で記述しました。

これらのツールの最大の価値は、私たちに「自らの仮説を明確に表明すること」を促す点にあります。何が原因で、何が結果で、何が交絡しているのか。その曖昧さを許さない明晰な思考こそが、質の高い臨床研究とEBMの実践につながります。

さて、これでようやく因果推論のスタートラインに立ちました。私たちは今、因果関係という未知の大海を航海するための「地図」と「コンパス」を手に入れた状態です。

次回は、いよいよこの地図の読み解き方、つまり航海術を学びます。因果の流れを読み解くための具体的な文法である「d分離」、そして交絡という厄介な嵐を避けるための航路を見つけ出す「バックドア基準」という概念に踏み込んでいきます。どうぞお楽しみに!

参考文献

  • Greenland, S., Pearl, J. & Robins, J.M. (1999). Causal diagrams for epidemiologic research. Epidemiology, 10(1), pp.37-48.
  • Hernán, M. A., & Robins, J. M. (2020). Causal Inference: What If. Boca Raton: Chapman & Hall/CRC.
  • Imbens, G.W. & Rubin, D.B. (2015). Causal Inference in Statistics, Social, and Biomedical Sciences. Cambridge University Press.
  • Pearl, J. (2009). Causality: Models, Reasoning, and Inference (2nd ed.). Cambridge University Press.
  • Pearl, J. & Mackenzie, D. (2018). The Book of Why: The New Science of Cause and Effect. Basic Books.
  • Shrier, I. & Platt, R.W. (2008). Reducing bias through directed acyclic graphs. BMC Medical Research Methodology, 8(1), p.70.
  • VanderWeele, T.J. (2015). Explanation in Causal Inference: Methods for Mediation and Interaction. Oxford University Press.

ご利用規約(免責事項)

当サイト(以下「本サイト」といいます)をご利用になる前に、本ご利用規約(以下「本規約」といいます)をよくお読みください。本サイトを利用された時点で、利用者は本規約の全ての条項に同意したものとみなします。

第1条(目的と情報の性質)

  1. 本サイトは、医療分野におけるAI技術に関する一般的な情報提供および技術的な学習機会の提供を唯一の目的とします。
  2. 本サイトで提供されるすべてのコンテンツ(文章、図表、コード、データセットの紹介等を含みますが、これらに限定されません)は、一般的な学習参考用であり、いかなる場合も医学的な助言、診断、治療、またはこれらに準ずる行為(以下「医行為等」といいます)を提供するものではありません。
  3. 本サイトのコンテンツは、特定の製品、技術、または治療法の有効性、安全性を保証、推奨、または広告・販売促進するものではありません。紹介する技術には研究開発段階のものが含まれており、その臨床応用には、さらなる研究と国内外の規制当局による正式な承認が別途必要です。
  4. 本サイトは、情報提供を目的としたものであり、特定の治療法を推奨するものではありません。健康に関するご懸念やご相談は、必ず専門の医療機関にご相談ください。

第2条(法令等の遵守)
利用者は、本サイトの利用にあたり、医師法、医薬品、医療機器等の品質、有効性及び安全性の確保等に関する法律(薬機法)、個人情報の保護に関する法律、医療法、医療広告ガイドライン、その他関連する国内外の全ての法令、条例、規則、および各省庁・学会等が定める最新のガイドライン等を、自らの責任において遵守するものとします。これらの適用判断についても、利用者が自ら関係各所に確認するものとし、本サイトは一切の責任を負いません。

第3条(医療行為における責任)

  1. 本サイトで紹介するAI技術・手法は、あくまで研究段階の技術的解説であり、実際の臨床現場での診断・治療を代替、補助、または推奨するものでは一切ありません。
  2. 医行為等に関する最終的な判断、決定、およびそれに伴う一切の責任は、必ず法律上その資格を認められた医療専門家(医師、歯科医師等)が負うものとします。AIによる出力を、資格を有する専門家による独立した検証および判断を経ずに利用することを固く禁じます。
  3. 本サイトの情報に基づくいかなる行為によって利用者または第三者に損害が生じた場合も、本サイト運営者は一切の責任を負いません。実際の臨床判断に際しては、必ず担当の医療専門家にご相談ください。本サイトの利用によって、利用者と本サイト運営者の間に、医師と患者の関係、またはその他いかなる専門的な関係も成立するものではありません。

第4条(情報の正確性・完全性・有用性)

  1. 本サイトは、掲載する情報(数値、事例、ソースコード、ライブラリのバージョン等)の正確性、完全性、網羅性、有用性、特定目的への適合性、その他一切の事項について、何ら保証するものではありません。
  2. 掲載情報は執筆時点のものであり、予告なく変更または削除されることがあります。また、技術の進展、ライブラリの更新等により、情報は古くなる可能性があります。利用者は、必ず自身で公式ドキュメント等の最新情報を確認し、自らの責任で情報を利用するものとします。

第5条(AI生成コンテンツに関する注意事項)
本サイトのコンテンツには、AIによる提案を基に作成された部分が含まれる場合がありますが、公開にあたっては人間による監修・編集を経ています。利用者が生成AI等を用いる際は、ハルシネーション(事実に基づかない情報の生成)やバイアスのリスクが内在することを十分に理解し、その出力を鵜呑みにすることなく、必ず専門家による検証を行うものとします。

第6条(知的財産権)

  1. 本サイトを構成するすべてのコンテンツに関する著作権、商標権、その他一切の知的財産権は、本サイト運営者または正当な権利を有する第三者に帰属します。
  2. 本サイトのコンテンツを引用、転載、複製、改変、その他の二次利用を行う場合は、著作権法その他関連法規を遵守し、必ず出典を明記するとともに、権利者の許諾を得るなど、適切な手続きを自らの責任で行うものとします。

第7条(プライバシー・倫理)
本サイトで紹介または言及されるデータセット等を利用する場合、利用者は当該データセットに付随するライセンス条件および研究倫理指針を厳格に遵守し、個人情報の匿名化や同意取得の確認など、適用される法規制に基づき必要とされるすべての措置を、自らの責任において講じるものとします。

第8条(利用環境)
本サイトで紹介するソースコードやライブラリは、執筆時点で特定のバージョンおよび実行環境(OS、ハードウェア、依存パッケージ等)を前提としています。利用者の環境における動作を保証するものではなく、互換性の問題等に起因するいかなる不利益・損害についても、本サイト運営者は責任を負いません。

第9条(免責事項)

  1. 本サイト運営者は、利用者が本サイトを利用したこと、または利用できなかったことによって生じる一切の損害(直接損害、間接損害、付随的損害、特別損害、懲罰的損害、逸失利益、データの消失、プログラムの毀損等を含みますが、これらに限定されません)について、その原因の如何を問わず、一切の法的責任を負わないものとします。
  2. 本サイトの利用は、学習および研究目的に限定されるものとし、それ以外の目的での利用はご遠慮ください。
  3. 本サイトの利用に関連して、利用者と第三者との間で紛争が生じた場合、利用者は自らの費用と責任においてこれを解決するものとし、本サイト運営者に一切の迷惑または損害を与えないものとします。
  4. 本サイト運営者は、いつでも予告なく本サイトの運営を中断、中止、または内容を変更できるものとし、これによって利用者に生じたいかなる損害についても責任を負いません。

第10条(規約の変更)
本サイト運営者は、必要と判断した場合、利用者の承諾を得ることなく、いつでも本規約を変更することができます。変更後の規約は、本サイト上に掲載された時点で効力を生じるものとし、利用者は変更後の規約に拘束されるものとします。

第11条(準拠法および合意管轄)
本規約の解釈にあたっては、日本法を準拠法とします。本サイトの利用および本規約に関連して生じる一切の紛争については、東京地方裁判所を第一審の専属的合意管轄裁判所とします。


For J³, may joy follow you.

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

医師・医学博士・AI研究者・連続起業家
元厚生労働省幹部・ハーバード大学理学修士・ケンブリッジ大学MBA・コロンビア大学行政修士(経済)
岡山大学医学部卒業後、内科・地域医療に従事。厚生労働省で複数室長(医療情報・救急災害・国際展開等)を歴任し、内閣官房・内閣府・文部科学省でも医療政策に携わる。
退官後は、日本大手IT企業や英国VCで新規事業開発・投資を担当し、複数の医療スタートアップを創業。現在は医療AI・デジタル医療機器の開発に取り組むとともに、東京都港区で内科クリニックを開業。
複数大学で教授として教育・研究活動に従事し、医療関係者向け医療AIラボ「Medical AI Nexus」、医療メディア「The Health Choice | 健康の選択」を主宰。
ケンブリッジ大学Associate・社会医学系指導医・専門医・The Royal Society of Medicine Fellow

目次