臨床の現場で、ふとこんな風に考えることはありませんか?
「もし、あの患者さんにもう一つの治療法を試せていたら、今頃どうなっていただろう?」
「この新しい薬を使わなかった世界線では、患者さんのQOLはもっと高かったのかもしれない…」
こうした、私たちが日常的に抱く「もしも」という問いは、決して後ろ向きな後悔や、単なる空想で終わるものではありません。むしろ、より良い医療を目指すための、非常に重要な出発点なんです。
そして統計学の世界には、この「もし、あの時…」という問いに、データという客観的な証拠をもって科学的に迫るための強力な学問分野があります。それが「因果推論」です。これは、複雑に絡み合った情報から原因と結果のつながりを論理的に解き明かすための、いわば思考のOSをアップデートするようなものだと思ってください。
この因果推論という壮大な旅を進める上で、私たちはまず、羅針盤となる2つの重要な概念を手にします。それが「ポテンシャルアウトカム(Potential Outcome)」と「反実仮想(Counterfactual)」です。
少し難しく聞こえるかもしれませんが、大丈夫です。ごく簡単に言えば、ポテンシャルアウトカムは「起こり得たかもしれない全ての未来を並べた、神の視点の設計図」。そして、反実仮想は「現実の選択をした瞬間に観測できなくなった、幻の片割れ」を指します。
なんだかSF映画のプロットのようにも聞こえますよね。でも、これは紛れもなく、私たちの思考をクリアにし、データからより深い洞察を得るための、数学的にしっかりと定義された思考のフレームワークなのです。 さあ、日々の臨床データを新たな視点で読み解くための、このエキサイティングな思考の旅へ、ご一緒に出発しましょう。
ポテンシャルアウトカム:「あり得たかもしれない未来」の設計図
目の前に、高血圧に悩む患者さん、Aさんがいると想像してみてください。私たちは、新しく開発された降圧薬の効果を確かめたい、と考えています。
この時、Aさんの未来には、大きく分けて2つの「あり得たかもしれない」シナリオが存在します。まるで、物語の分岐点のように。
- 新薬を服用した場合の、1年後のAさんの血圧
- 新薬を服用しなかった場合の、1年後のAさんの血圧
もちろん、現実世界のAさんは、どちらか一方の未来しか経験できません。私たちが薬を処方すればシナリオ1が現実となり、シナリオ2は「もしも」の話になります。処方しなければその逆ですね。
しかし、ここが因果推論の面白いところです。私たちは思考実験として、この両方の未来が「潜在的に」同時に存在している、と考えます。これがポテンシャルアウトカム(Potential Outcome)、日本語では「潜在的結果」という考え方の核心です。このパワフルな概念は、統計学者のドナルド・ルービンが提唱した「ルービン因果モデル(Rubin Causal Model, RCM)」の根幹をなし、現代の因果推論の基礎を築きました (Rubin, 1974)。
もちろん、実際の臨床はもっと複雑です。「Aさんの食事や運動習慣、併用薬が変わったらどうなる?」という声が聞こえてきそうです。そうした様々な要因(交絡因子と呼びます)が結果に影響を与えるのは事実です。ですが、まずは思考をクリアにするために、一度それらの要因は横に置いておき、「新薬の有無だけが未来を分ける」というシンプルな世界で考えてみましょう。
この考え方を、一枚の地図のように図で整理してみます。
この図が示していることを、少し丁寧に読み解いていきましょう。
- スタート地点(患者 Aさん): 私たちの思考は、ある特定の個人
i(今回はAさん)から始まります。 - 運命の分岐点: ここで「新薬を服用するか、しないか」という選択が行われ、Aさんの未来は2つのパラレルワールド(世界線)に分岐すると考えます。
- 2つの世界線: 「世界線1」は新薬を服用した未来、「世界線2」は服用しなかった未来です。重要なのは、Aさんという同一人物が、それぞれの世界線を旅すると想像することです。
- ポテンシャルアウトカム: それぞれの世界線の最終地点にあるのが、潜在的な結果です。これを数式で、より厳密に表現してみましょう。
私たちは、それぞれの世界線で観測されるであろう結果を、次のような記号で表します。
- \(Y_i(1)\): 個人 \(i\) が介入(新薬の服用)を受けた場合の潜在的な結果(Outcome)
- \(Y_i(0)\): 個人 \(i\) が介入を受けなかった場合の潜在的な結果(Outcome)
この記号のルールは簡単です。
- \(Y\) は、私たちが注目している結果(Outcome)、今回は「血圧」を指します。
- 添え字の \(i\) は、対象となる個人(individual)を識別するための名札のようなものです。
- カッコの中の (1) は介入を受けたこと(treatment=1)、(0) は受けなかったこと(control=0)を示しています。
つまり、\(Y_i(1)\) と \(Y_i(0)\) というペアは、「もしAさんが薬を飲んだら血圧はこうなる」「もし飲まなかったらこうなる」という、Aさんという個人に対して「潜在的に」用意されている未来の完全な設計図なのです。 このシンプルな記法が、複雑な因果関係を解き明かすための第一歩となります。
因果推論の根本問題と「反実仮想」という幻
さて、ポテンシャルアウトカムという「設計図」が手に入ったところで、次はいよいよ本題である薬の「本当の効果」を考えていきましょう。
Aさん個人にとっての薬の効果を知るには、何を計算すればよいでしょうか?答えはシンプルですね。「薬を飲んだ場合の血圧」と「薬を飲まなかった場合の血圧」の差を見ればよいはずです。この個人レベルでの真の因果効果を、私たちは「個人処置効果(Individual Treatment Effect, ITE)」と呼びます。
数式で書くと、非常に直感的です。
\[ITE_i = Y_i(1) – Y_i(0)\]
この式が言っているのは、「個人\(i\)の、介入ありの時の結果から、介入なしの時の結果を引き算したもの」という、ごく当たり前のことです。
もし私たちが神の視点を持っていて、Aさんの両方の未来を知っていたとしましょう。例えば、\(Y_i(1) = 130 \text{ mmHg}\)(服用した場合)と \(Y_i(0) = 150 \text{ mmHg}\)(服用しなかった場合)の両方の値が見えていたなら、ITEは \(130 – 150 = -20 \text{ mmHg}\) だ、と自信を持って断言できます。
しかし、ご存知の通り、私たちは神様ではありません。現実世界でAさんが新薬を「服用する」という選択をした瞬間、私たちは \(Y_i(1)\) の値を観測できますが、その代償として \(Y_i(0)\) という「もしも」の結果を知る可能性は永遠に失われてしまいます。
この状況を、データの欠損として捉えてみましょう。Aさんが新薬を服用した世界では、Aさんのデータはこのようになります。
このように、個人レベルの因果効果(ITE)を正確に計算するために必要なポテンシャルアウトカムの片方が、原理的に必ず欠損してしまうという問題。これを、統計学者のポール・ホランドは、その名も「因果推論の根本問題(Fundamental Problem of Causal Inference)」と名付けました (Holland, 1986)。 これは因果推論を学ぶ上で、誰もが最初に直面する、避けては通れない壁なのです。
そして、この観測できなかった方のポテンシャルアウトカム、つまり「事実に反する、もしもの結果」こそが、反実仮想(Counterfactual)です。「事実に反する仮想」、文字通りの意味ですね。私たちが治療の真の効果を追い求める旅は、この観測できない幻の片割れ(カウンターファクチュアル)と、どう向き合っていくか、という旅でもあるのです。
解決への道筋:個人の「なぜ」から集団の「どれくらい」へ
「結局、個人の真の効果は分からないのか…」と、ここで少しがっかりされたかもしれませんね。その通りです。Aさん個人のITEを寸分違わず知ることは、因果推論の根本問題がある以上、不可能なのです。
しかし、ここで諦めてしまうのは早すぎます。ここからが、因果推論の真骨頂であり、統計学の面白いところなんです。視点を「たった一人の個人」から「特徴の似た人々の集団」へとズームアウトすることで、この根本問題を華麗に回避する道筋が見えてきます。
個々の患者さんのITEは分からなくても、同じような特徴を持つ患者さんの集団で、平均的にどれくらいの効果があるのかなら、精度高く推定できるのではないでしょうか?
そこで登場するのが、因果推論における最も重要な指標の一つ、「平均処置効果(Average Treatment Effect, ATE)」です。 これは、その名の通り、集団全体におけるITEの平均値を表します。
\[ATE = E[Y_i(1) – Y_i(0)]\]
この数式を少し分解してみましょう。
- \(Y_i(1) – Y_i(0)\) の部分は、先ほど見た、個人\(i\)のITEそのものですね。
- \(E[\cdot]\) は「期待値(Expectation)」を表す記号で、ここでは集団全体で「平均をとる」操作だと思ってください。
つまりATEとは、集団に含まれる一人ひとりの(観測できない)ITEを全部足し合わせて、その人数で割ったもの、すなわちITEの平均値を意味します。
「でも、個人のITEが分からないのに、その平均値が分かるなんておかしくない?」と思われたかもしれません。非常に鋭い指摘です。ここで、平均(期待値)が持つ素晴らしい性質が役に立ちます。期待値は、足し算や引き算を分解することができるのです(期待値の線形性)。
\[ATE = E[Y_i(1) – Y_i(0)] = E[Y_i(1)] – E[Y_i(0)]\]
この式変形が示しているのは、「(ITEという)差の平均」は「(それぞれのポテンシャルアウトカムの)平均の差」に等しいということです。これは革命的な転換です!
なぜなら、私たちはもはや観測不能な個人のITEを追い求める必要がなくなったからです。代わりに、
- \(E[Y_i(1)]\): もし集団全員が治療を受けたら、結果の平均はどうなるか?
- \(E[Y_i(0)]\): もし集団全員が治療を受けなかったら、結果の平均はどうなるか?
この2つの「平均値」を推定できれば、その差を取ることでATEが計算できる、ということになります。一人の人間で両方の世界を観測することは不可能でしたが、たくさんの人を集めて、あるグループには治療を、別のグループには非治療を割り付ければ、この2つの平均値の近似値を得ることができそうですよね?
そして、この \(E[Y_i(1)]\) と \(E[Y_i(0)]\) を、バイアスなく正確に推定するための人類の最高傑作とも言える方法が、皆さんもご存知のランダム化比較試験(RCT)なのです。また、RCTが実施できない観察研究においても、今回学んだポテンシャルアウトカムの考え方を土台にして、どうにかしてATEに迫ろうとする様々な統計手法が開発されてきました。 その話は、また今後の旅で詳しく見ていくことにしましょう。
まとめ:見えない「もしも」を科学する思考法
今回のポイントを、新しい仲間も加えて整理しましょう。
| 用語 | 意味 | 問いのレベル |
|---|---|---|
| ポテンシャルアウトカム | 介入「あり」「なし」両方の、潜在的に起こり得た結果の設計図。\( Y_i(1), Y_i(0) \)。 | 個人 |
| 反実仮想 | 実際に観測された事実とは反対の、観測できなかった「もしも」の結果。 | 個人 |
| 個人処置効果 (ITE) | 個人の真の因果効果。\( ITE_i = Y_i(1) – Y_i(0) \)。直接観測は不可能。 | 個人 |
| 平均処置効果 (ATE) | 集団全体での処置効果の平均。\( ATE = E[Y_i(1) – Y_i(0)] \)。推定の主な目標。 | 集団 |
「もしも」の世界を想像し、ポテンシャルアウトカムという設計図を描き、観測不能な反実仮想という壁を認識した上で、集団の力(ATE)を借りて真実に迫ろうと試みる。これが因果推論の醍醐味であり、科学的な意思決定の第一歩なのです。
次のセッションでは、このATEを推定するための「ゴールドスタンダード」であるランダム化比較試験(RCT)が、なぜそれほど強力なのかを解き明かしていきます。
参考文献
- Splawa-Neyman, J. (1923/1990). On the application of probability theory to agricultural experiments. Statistical Science, 5(4), 465–472. (English translation of the 1923 paper)
- Rubin, D. B. (1974). Estimating causal effects of treatments in randomized and nonrandomized studies. Journal of Educational Psychology, 66(5), 688–701.
- Holland, P. W. (1986). Statistics and causal inference. Journal of the American Statistical Association, 81(396), 945–960.
- Rosenbaum, P. R., & Rubin, D. B. (1983). The central role of the propensity score in observational studies for causal effects. Biometrika, 70(1), 41–55.
- Rosenbaum, P. R., & Rubin, D. B. (1984). Reducing bias in observational studies using subclassification on the propensity score. Journal of the American Statistical Association, 79(387), 516–524.
- Robins, J. M. (1986). A new approach to causal inference in mortality studies with a sustained exposure period—application of the g-formula. Mathematical Modelling, 7(9–12), 1393–1512.
- Robins, J. M., Hernán, M. A., & Brumback, B. (2000). Marginal structural models and causal inference in epidemiology. Epidemiology, 11(5), 550–560.
- Imbens, G. W., & Wooldridge, J. M. (2009). Recent developments in the econometrics of program evaluation. Journal of Economic Literature, 47(1), 5–86.
- Stuart, E. A. (2010). Matching methods for causal inference: A review and a look forward. Statistical Science, 25(1), 1–21.
- Austin, P. C. (2011). An introduction to propensity score methods for reducing the effects of confounding in observational studies. Multivariate Behavioral Research, 46(3), 399–424.
ご利用規約(免責事項)
当サイト(以下「本サイト」といいます)をご利用になる前に、本ご利用規約(以下「本規約」といいます)をよくお読みください。本サイトを利用された時点で、利用者は本規約の全ての条項に同意したものとみなします。
第1条(目的と情報の性質)
- 本サイトは、医療分野におけるAI技術に関する一般的な情報提供および技術的な学習機会の提供を唯一の目的とします。
- 本サイトで提供されるすべてのコンテンツ(文章、図表、コード、データセットの紹介等を含みますが、これらに限定されません)は、一般的な学習参考用であり、いかなる場合も医学的な助言、診断、治療、またはこれらに準ずる行為(以下「医行為等」といいます)を提供するものではありません。
- 本サイトのコンテンツは、特定の製品、技術、または治療法の有効性、安全性を保証、推奨、または広告・販売促進するものではありません。紹介する技術には研究開発段階のものが含まれており、その臨床応用には、さらなる研究と国内外の規制当局による正式な承認が別途必要です。
- 本サイトは、情報提供を目的としたものであり、特定の治療法を推奨するものではありません。健康に関するご懸念やご相談は、必ず専門の医療機関にご相談ください。
第2条(法令等の遵守)
利用者は、本サイトの利用にあたり、医師法、医薬品、医療機器等の品質、有効性及び安全性の確保等に関する法律(薬機法)、個人情報の保護に関する法律、医療法、医療広告ガイドライン、その他関連する国内外の全ての法令、条例、規則、および各省庁・学会等が定める最新のガイドライン等を、自らの責任において遵守するものとします。これらの適用判断についても、利用者が自ら関係各所に確認するものとし、本サイトは一切の責任を負いません。
第3条(医療行為における責任)
- 本サイトで紹介するAI技術・手法は、あくまで研究段階の技術的解説であり、実際の臨床現場での診断・治療を代替、補助、または推奨するものでは一切ありません。
- 医行為等に関する最終的な判断、決定、およびそれに伴う一切の責任は、必ず法律上その資格を認められた医療専門家(医師、歯科医師等)が負うものとします。AIによる出力を、資格を有する専門家による独立した検証および判断を経ずに利用することを固く禁じます。
- 本サイトの情報に基づくいかなる行為によって利用者または第三者に損害が生じた場合も、本サイト運営者は一切の責任を負いません。実際の臨床判断に際しては、必ず担当の医療専門家にご相談ください。本サイトの利用によって、利用者と本サイト運営者の間に、医師と患者の関係、またはその他いかなる専門的な関係も成立するものではありません。
第4条(情報の正確性・完全性・有用性)
- 本サイトは、掲載する情報(数値、事例、ソースコード、ライブラリのバージョン等)の正確性、完全性、網羅性、有用性、特定目的への適合性、その他一切の事項について、何ら保証するものではありません。
- 掲載情報は執筆時点のものであり、予告なく変更または削除されることがあります。また、技術の進展、ライブラリの更新等により、情報は古くなる可能性があります。利用者は、必ず自身で公式ドキュメント等の最新情報を確認し、自らの責任で情報を利用するものとします。
第5条(AI生成コンテンツに関する注意事項)
本サイトのコンテンツには、AIによる提案を基に作成された部分が含まれる場合がありますが、公開にあたっては人間による監修・編集を経ています。利用者が生成AI等を用いる際は、ハルシネーション(事実に基づかない情報の生成)やバイアスのリスクが内在することを十分に理解し、その出力を鵜呑みにすることなく、必ず専門家による検証を行うものとします。
第6条(知的財産権)
- 本サイトを構成するすべてのコンテンツに関する著作権、商標権、その他一切の知的財産権は、本サイト運営者または正当な権利を有する第三者に帰属します。
- 本サイトのコンテンツを引用、転載、複製、改変、その他の二次利用を行う場合は、著作権法その他関連法規を遵守し、必ず出典を明記するとともに、権利者の許諾を得るなど、適切な手続きを自らの責任で行うものとします。
第7条(プライバシー・倫理)
本サイトで紹介または言及されるデータセット等を利用する場合、利用者は当該データセットに付随するライセンス条件および研究倫理指針を厳格に遵守し、個人情報の匿名化や同意取得の確認など、適用される法規制に基づき必要とされるすべての措置を、自らの責任において講じるものとします。
第8条(利用環境)
本サイトで紹介するソースコードやライブラリは、執筆時点で特定のバージョンおよび実行環境(OS、ハードウェア、依存パッケージ等)を前提としています。利用者の環境における動作を保証するものではなく、互換性の問題等に起因するいかなる不利益・損害についても、本サイト運営者は責任を負いません。
第9条(免責事項)
- 本サイト運営者は、利用者が本サイトを利用したこと、または利用できなかったことによって生じる一切の損害(直接損害、間接損害、付随的損害、特別損害、懲罰的損害、逸失利益、データの消失、プログラムの毀損等を含みますが、これらに限定されません)について、その原因の如何を問わず、一切の法的責任を負わないものとします。
- 本サイトの利用は、学習および研究目的に限定されるものとし、それ以外の目的での利用はご遠慮ください。
- 本サイトの利用に関連して、利用者と第三者との間で紛争が生じた場合、利用者は自らの費用と責任においてこれを解決するものとし、本サイト運営者に一切の迷惑または損害を与えないものとします。
- 本サイト運営者は、いつでも予告なく本サイトの運営を中断、中止、または内容を変更できるものとし、これによって利用者に生じたいかなる損害についても責任を負いません。
第10条(規約の変更)
本サイト運営者は、必要と判断した場合、利用者の承諾を得ることなく、いつでも本規約を変更することができます。変更後の規約は、本サイト上に掲載された時点で効力を生じるものとし、利用者は変更後の規約に拘束されるものとします。
第11条(準拠法および合意管轄)
本規約の解釈にあたっては、日本法を準拠法とします。本サイトの利用および本規約に関連して生じる一切の紛争については、東京地方裁判所を第一審の専属的合意管轄裁判所とします。
For J³, may joy follow you.

