医療は情報という証拠品に溢れています。統計学、疫学、因果推論という「科学の探偵術」を身につけることで、データに隠された物語を読み解き、霧を晴らしてより良い判断を下すためのスキルを学びます。
個々のデータを集め、集団全体の傾向を掴む技術。記述統計でデータの特徴を要約し、推測統計でサンプルから全体を推論します。「偶然か否か」を判断する客観的な裏付けを与えます。
「誰が、どこで、いつ」病気になるかを調査し、原因を探る学問です。エビデンスのピラミッドに基づき、RCTやコホート研究など、信頼性の高い研究デザインを用いて証拠を構築します。
見せかけの関係(相関)と真の因果関係を区別する思考法。交絡因子という見えない犯人を見つけ出し、「もしも…」の世界を考えることで、介入の真の効果を推定します。
私たちの周りには、日々、膨大な情報が溢れています。新しい治療法に関する論文、電子カルテに蓄積されるデータ、ウェアラブルデバイスが計測する生体信号…。これらはまるで、解決を待つ難事件の現場に残された、無数の証拠品のようです。
「この新しい治療法は、本当に目の前の患者さんにとって最善なのだろうか?」
「この研究結果は、どこまで信じていいんだろう?」
こんな風に、迷いや疑問を感じたことはありませんか? まるで深い霧の中、手探りで進んでいるような感覚かもしれません。その霧を晴らし、データという証拠品から「真実」の輪郭を浮かび上がらせる強力なツール、それこそが「科学」という名の探偵術なのです。
このセッションでは、私たち医療者が名探偵になるための必須スキルを学びます。統計学、疫学、そして因果推論。これらは決して難しい暗号ではありません。データに隠された物語を読み解き、より良い医療を実践するための、心強い相棒です。さあ、一緒に探偵術の世界へ足を踏み入れてみましょう!
道具①:データの「声」を聴く技術 – 統計学
最初の探偵道具は「統計学」です。これを一言でたとえるなら、「大勢の人の声を聴くための、巨大な集音器」でしょうか。これは単なる比喩ではなく、データから意味のあるパターンを抽出するという統計モデルの本質を捉えた考え方でもあります (Freedman, 2005)。
一人ひとりの患者さんのデータは、ささやくような小さな声かもしれません。しかし、この集音器を通せば、多くの声が重なり合い、集団全体の明確な傾向、つまり「声の総意」が聴こえてきます。統計学は、無数のささやきの中から意味のあるパターンを見つけ出す技術なんです。
データの特徴を掴む「記述統計」
まず基本となるのが、データを要約してそのプロフィールを描き出す「記述統計」です。これは、クラスの集合写真を見て「平均身長はこれくらいで、一番背が高い人と低い人の差はこれくらい」と特徴を掴むようなもの。平均値や中央値、標準偏差といった指標を使って、データ全体の姿をざっくりと把握します。
一部から全体を言い当てる「推測統計」
統計学の真骨頂は、ここから。手元にある限られたデータ(サンプル)から、その背後にある巨大な集団(母集団)の性質を言い当てる「推測統計」です。
これは、大きな鍋で作ったスープの味見に似ています。おたまですくった一杯のスープを飲むだけで、鍋全体の味付けがどうなっているかを推測しますよね? それと同じで、例えば100人の患者さんへの投薬結果から、「この薬は日本人全体に対しても効果があるはずだ」と結論を導くわけです。
この「推測」の信頼性を担保するのが、仮説検定や信頼区間といった考え方です。「この薬の効果は、単なる偶然ではない」と判断するための指標(p値)や、「本当の効果は、おそらくこの範囲にあるだろう」という幅(信頼区間)を示すことで、結論に客観的な裏付けを与えます。ただし、特にp値の解釈については統計学の世界でも長年議論があり、その数値だけを盲信するのではなく、効果の大きさや研究の背景と合わせて総合的に判断することが極めて重要だとされています (Wasserstein et al., 2019)。
例えば、2つの薬の効果を比べるt検定の数式を見てみましょう。難しく見えるかもしれませんが、やっていることはシンプルです。
\[ t = \dfrac{\bar{X}_1 – \bar{X}_2}{\sqrt{\dfrac{s_1^2}{n_1} + \dfrac{s_2^2}{n_2}}} \]
この式の本質は、こうです。
- 分子 \((\bar{X}_1 – \bar{X}_2)\):これは2つのグループの「平均値の差」です。つまり、「観測された効果の大きさ」そのものを表しています。
- 分母 \((\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}})\):これはデータの「ばらつき」を反映しています。つまり、「偶然によって起こりうる差の大きさ」を示唆します。
要するに、t検定とは「観測された効果の大きさは、偶然の範囲と比べてどれくらい大きいのか?」を数値化しているに過ぎないのです。この比率が大きければ大きいほど、「これは偶然じゃなさそうだ!」と判断できるわけですね。
道具②:病気の「地図」を描く技術 – 疫学
次の道具は「疫学」です。これはまさに、「病気の発生源を突き止める、探偵の捜査地図」です。
19世紀のロンドンで、コレラが大流行したときの話は有名です。医師ジョン・スノウは、患者の発生場所を地図に一つひとつプロットしていきました。すると、特定の井戸の周辺に患者が集中していることが判明。彼はその井戸の使用を禁じ、見事に流行を食い止めました (Snow, 1855)。
このように、疫学は「誰が、どこで、いつ」病気になっているのかを徹底的に調査し、その原因やリスク因子を突き止める学問です。喫煙が肺がんのリスクを高めることを明らかにしたのも (Doll and Hill, 1950)、現代疫学の偉大な功績の一つです。
エビデンスのピラミッド:最強の証拠はどれ? – 研究デザイン
疫学調査には、その目的や状況に応じて様々な「研究デザイン」があります。そして、得られるエビデンス(科学的根拠)の信頼度には序列があるんです。これを「エビデンスのピラミッド」と呼びます。
いくつか代表的なものを覗いてみましょう。
- ランダム化比較試験 (RCT): 科学的根拠の信頼性が最も高いと広く認められる研究デザインです。研究に参加した患者さんを、コイン投げのようにランダム(無作為)に2つのグループに分け、一方には新しい治療法を、もう一方には従来の治療法(または偽薬)を行います。これにより、治療法以外の条件が公平になり、純粋な治療効果を比較できます。研究報告の際には国際的なガイドラインであるCONSORT声明に準拠することが推奨されます (Schulz et al., 2010)。
- コホート研究: これは「追跡調査」です。例えば、喫煙するグループとしないグループを何十年にもわたって追いかけ、どちらのグループがより多く肺がんになるかを観察します。原因(喫煙)から結果(肺がん)へと、時間の流れに沿って調査するのが特徴です。米国のフラミンガム市で心疾患のリスク因子を明らかにするために長年続けられている「フラミンガム心臓研究」が非常に有名です (Mahmood et al., 2014)。
- 症例対照研究: こちらは「振り返り調査」。まず肺がんになった患者さん(症例)を集め、それから年齢や性別などの条件が似た健康な人(対照)を集めます。そして、両方のグループに過去の生活習慣(喫煙歴など)を尋ね、病気の原因を探ります。時間を遡るように調査するのが特徴です。
コホート研究や症例対照研究のような観察研究を報告する際には、STROBE声明というガイドラインが国際的に用いられています (von Elm et al., 2007)。
道具③:「原因と結果」の鎖を見つける技術 – 因果推論
さて、最後の道具が「因果推論」です。これは、探偵術の中でも最も高度で、しかし最も重要なスキルかもしれません。「絡まった糸を解きほぐし、本物の糸を手繰り寄せる魔法」とでも言いましょうか。
ここに、こんなデータがあったとします。「コーヒーをよく飲む人ほど、肺がんになりやすい」。このデータだけを見て、「コーヒーが肺がんの原因だ!」と結論づけるのは、早計な素人探偵です。名探偵はこう考えます。「待てよ、コーヒーをよく飲む人は、タバコもよく吸う傾向があるんじゃないか?」と。
この場合、喫煙という第三の因子が、コーヒー(見せかけの原因)と肺がん(結果)の両方に関係しています。このような存在を「交絡因子」と呼びます。因果推論は、こうした交絡という名の犯人を見つけ出し、見せかけの関係(相関)と、本当の「原因と結果」(因果)の鎖を見分けるための思考法と技術の総称です。
見えない敵:「交絡」という名の犯人
交絡は、私たちの判断を誤らせる厄介な存在です。有名な例に「アイスクリームの売上が増えると、水難事故も増える」というものがあります。もちろん、アイスクリームが人を溺れさせるわけではありません。気温の上昇という交絡因子が、アイスの売上と海水浴客(→水難事故)の両方を増やしているだけなのです。
こうした関係性を整理し、思考をクリアにするために、DAG (有向非巡回グラフ) という図を使ったりします。これは、変数間の因果関係を矢印で結んだ、いわば「人間関係ならぬ、変数関係の相関図」です (Pearl, 2009)。
この図は、「喫煙が肺がんの原因」であり、かつ「喫煙がコーヒー摂取の原因(喫煙者はコーヒーも好みやすい)」であることを示しています。これを見れば、コーヒーと肺がんの間に直接の矢印がないため、両者の関係は見せかけ(交絡によるもの)かもしれない、と直感的に理解できます。
もしも…の世界を考える:反実仮想
因果推論の核心には、「反実仮想 (Counterfactual)」という考え方があります。これは、「もし、あの時、現実に起きたこととは違う行動をとっていたら、どんな結果になっていただろうか?」と、あり得たかもしれない”もしも”の世界を想像することです。
「この患者さんにA薬を投与した結果、血圧は10下がった。もしも、この同じ患者さんに、同じタイミングでB薬を投与していたら、血圧はどうなっていたか?」
もちろん、一人の人間で両方を試すことはできません。だからこそ、疫学の研究デザインや統計学の力を借りて、グループ間で比較することで、この「もしも」の世界を擬似的に作り出し、介入の真の因果効果を推定しようとするのです (Hernán and Robins, 2020)。
注意点:データという証言に潜む「バイアス」という罠
どんなに優れた探偵道具を持っていても、注意すべき罠があります。それが「バイアス」です。疫学の世界では、真の値からの体系的なズレと定義されますが (Rothman, Greenland and Lash, 2008)、たとえるなら「対象物が歪んで見える、特殊なメガネ」のこと、と考えると分かりやすいかもしれません。このメガネをかけていることに気づかないと、データという証拠を正しく見ることができず、真実とはかけ離れた結論にたどり着いてしまいます。
- 選択バイアス: そもそも調査に参加する人々に偏りがあるケースです。例えば、病院の待合室で健康に関するアンケートを実施したら、何らかの不調を抱えている人の意見に偏ってしまうかもしれません。
- 情報バイアス(想起バイアスなど): データの収集方法に問題があるケースです。病気になった人は、健康な人よりも「あの時のあれが原因だったかも…」と過去の生活習慣をより詳細に、あるいは過剰に思い出そうとする傾向があり、これが結果を歪めることがあります。
選択バイアスや情報バイアスをはじめ、バイアスには数多くの種類が知られており、優れた研究とは、こうしたバイアスという罠をいかに巧みに避け、あるいはその影響を分析段階で補正しているかなのです (Rothman, Greenland and Lash, 2008)。論文を読むときは、「この研究にはどんなバイアスが潜んでいる可能性があるだろう?」と批判的に吟味する視点(批判的吟味)が、名探偵には不可欠です。
まとめ:科学というコンパスを手に、医療の未来へ
今回ご紹介した、統計学、疫学、因果推論、そしてバイアスへの注意。これらは、情報という大海原を航海するための、信頼できるコンパスです。このコンパスがあれば、私たちはデータに振り回されるのではなく、データを乗りこなし、目の前の患者さんにとっての最善は何かを、より確かな根拠を持って判断できるようになります。
そして、この科学的思考の土台は、これから私たちが学んでいくAIの世界でも、全く同じように重要になります。AIは強力なツールですが、それを正しく使いこなすのは、科学の原則を理解した私たち人間の役割なのです。
さあ、探偵術の基本は身につきました。次は、いよいよアイデアを「形」にする魔法、プログラミングの世界へと進んでいきましょう。
参考文献
- Snow, J. (1855) On the Mode of Communication of Cholera. 2nd edn. London: John Churchill. Link 【NO-DOI】
- Doll, R. and Hill, A.B. (1950) ‘Smoking and Carcinoma of the Lung’, BMJ, 2(4682), pp. 739–748. doi:10.1136/bmj.2.4682.739 PMID:14772469
- 厚生労働省 (2017) 人を対象とする医学系研究に関する倫理指針【日本語】. Link 【NO-DOI】
- Schulz, K.F., Altman, D.G. and Moher, D. for the CONSORT Group (2010) ‘CONSORT 2010 Statement: updated guidelines for reporting parallel group randomised trials’, BMJ, 340, p. c332. doi:10.1136/bmj.c332 PMID:20332509
- von Elm, E., Altman, D.G., Egger, M., Pocock, S.J., Gøtzsche, P.C. and Vandenbroucke, J.P. for the STROBE Initiative (2007) ‘The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE) statement: guidelines for reporting observational studies’, The Lancet, 370(9596), pp. 1453–1457. doi:10.1016/S0140-6736(07)61602-X PMID:18064739
- Wasserstein, R.L., Schirm, A.L. and Lazar, N.A. (2019) ‘Moving to a World Beyond “p<0.05”’, The American Statistician, 73(sup1), pp. 1–19. doi:10.1080/00031305.2019.1583913
- Mahmood, S.S., Levy, D., Vasan, R.S. and Wang, T.J. (2014) ‘The Framingham Heart Study and the Epidemiology of Cardiovascular Diseases: A Historical Perspective’, The Lancet, 383(9921), pp. 999–1008. doi:10.1016/S0140-6736(13)61752-3 PMID:24011311
- Pearl, J. (2009) Causality: Models, Reasoning and Inference. 2nd edn. Cambridge: Cambridge University Press. 【NO-DOI】
- Hernán, M.A. and Robins, J.M. (2020) Causal Inference: What If. Boca Raton: Chapman & Hall/CRC. Link 【NO-DOI】
- Rothman, K.J., Greenland, S. and Lash, T.L. (2008) Modern epidemiology. 3rd edn. Philadelphia: Lippincott Williams & Wilkins. 【NO-DOI】
- Freedman, D.A. (2005) Statistical Models: Theory and Practice. Cambridge: Cambridge University Press. 【NO-DOI】
※本記事は情報提供を目的としたものであり、特定の治療法を推奨するものではありません。健康に関するご懸念やご相談は、必ず専門の医療機関にご相談ください。
ご利用規約(免責事項)
当サイト(以下「本サイト」といいます)をご利用になる前に、本ご利用規約(以下「本規約」といいます)をよくお読みください。本サイトを利用された時点で、利用者は本規約の全ての条項に同意したものとみなします。
第1条(目的と情報の性質)
- 本サイトは、医療分野におけるAI技術に関する一般的な情報提供および技術的な学習機会の提供を唯一の目的とします。
- 本サイトで提供されるすべてのコンテンツ(文章、図表、コード、データセットの紹介等を含みますが、これらに限定されません)は、一般的な学習参考用であり、いかなる場合も医学的な助言、診断、治療、またはこれらに準ずる行為(以下「医行為等」といいます)を提供するものではありません。
- 本サイトのコンテンツは、特定の製品、技術、または治療法の有効性、安全性を保証、推奨、または広告・販売促進するものではありません。紹介する技術には研究開発段階のものが含まれており、その臨床応用には、さらなる研究と国内外の規制当局による正式な承認が別途必要です。
- 本サイトは、情報提供を目的としたものであり、特定の治療法を推奨するものではありません。健康に関するご懸念やご相談は、必ず専門の医療機関にご相談ください。
第2条(法令等の遵守)
利用者は、本サイトの利用にあたり、医師法、医薬品、医療機器等の品質、有効性及び安全性の確保等に関する法律(薬機法)、個人情報の保護に関する法律、医療法、医療広告ガイドライン、その他関連する国内外の全ての法令、条例、規則、および各省庁・学会等が定める最新のガイドライン等を、自らの責任において遵守するものとします。これらの適用判断についても、利用者が自ら関係各所に確認するものとし、本サイトは一切の責任を負いません。
第3条(医療行為における責任)
- 本サイトで紹介するAI技術・手法は、あくまで研究段階の技術的解説であり、実際の臨床現場での診断・治療を代替、補助、または推奨するものでは一切ありません。
- 医行為等に関する最終的な判断、決定、およびそれに伴う一切の責任は、必ず法律上その資格を認められた医療専門家(医師、歯科医師等)が負うものとします。AIによる出力を、資格を有する専門家による独立した検証および判断を経ずに利用することを固く禁じます。
- 本サイトの情報に基づくいかなる行為によって利用者または第三者に損害が生じた場合も、本サイト運営者は一切の責任を負いません。実際の臨床判断に際しては、必ず担当の医療専門家にご相談ください。本サイトの利用によって、利用者と本サイト運営者の間に、医師と患者の関係、またはその他いかなる専門的な関係も成立するものではありません。
第4条(情報の正確性・完全性・有用性)
- 本サイトは、掲載する情報(数値、事例、ソースコード、ライブラリのバージョン等)の正確性、完全性、網羅性、有用性、特定目的への適合性、その他一切の事項について、何ら保証するものではありません。
- 掲載情報は執筆時点のものであり、予告なく変更または削除されることがあります。また、技術の進展、ライブラリの更新等により、情報は古くなる可能性があります。利用者は、必ず自身で公式ドキュメント等の最新情報を確認し、自らの責任で情報を利用するものとします。
第5条(AI生成コンテンツに関する注意事項)
本サイトのコンテンツには、AIによる提案を基に作成された部分が含まれる場合がありますが、公開にあたっては人間による監修・編集を経ています。利用者が生成AI等を用いる際は、ハルシネーション(事実に基づかない情報の生成)やバイアスのリスクが内在することを十分に理解し、その出力を鵜呑みにすることなく、必ず専門家による検証を行うものとします。
第6条(知的財産権)
- 本サイトを構成するすべてのコンテンツに関する著作権、商標権、その他一切の知的財産権は、本サイト運営者または正当な権利を有する第三者に帰属します。
- 本サイトのコンテンツを引用、転載、複製、改変、その他の二次利用を行う場合は、著作権法その他関連法規を遵守し、必ず出典を明記するとともに、権利者の許諾を得るなど、適切な手続きを自らの責任で行うものとします。
第7条(プライバシー・倫理)
本サイトで紹介または言及されるデータセット等を利用する場合、利用者は当該データセットに付随するライセンス条件および研究倫理指針を厳格に遵守し、個人情報の匿名化や同意取得の確認など、適用される法規制に基づき必要とされるすべての措置を、自らの責任において講じるものとします。
第8条(利用環境)
本サイトで紹介するソースコードやライブラリは、執筆時点で特定のバージョンおよび実行環境(OS、ハードウェア、依存パッケージ等)を前提としています。利用者の環境における動作を保証するものではなく、互換性の問題等に起因するいかなる不利益・損害についても、本サイト運営者は責任を負いません。
第9条(免責事項)
- 本サイト運営者は、利用者が本サイトを利用したこと、または利用できなかったことによって生じる一切の損害(直接損害、間接損害、付随的損害、特別損害、懲罰的損害、逸失利益、データの消失、プログラムの毀損等を含みますが、これらに限定されません)について、その原因の如何を問わず、一切の法的責任を負わないものとします。
- 本サイトの利用は、学習および研究目的に限定されるものとし、それ以外の目的での利用はご遠慮ください。
- 本サイトの利用に関連して、利用者と第三者との間で紛争が生じた場合、利用者は自らの費用と責任においてこれを解決するものとし、本サイト運営者に一切の迷惑または損害を与えないものとします。
- 本サイト運営者は、いつでも予告なく本サイトの運営を中断、中止、または内容を変更できるものとし、これによって利用者に生じたいかなる損害についても責任を負いません。
第10条(規約の変更)
本サイト運営者は、必要と判断した場合、利用者の承諾を得ることなく、いつでも本規約を変更することができます。変更後の規約は、本サイト上に掲載された時点で効力を生じるものとし、利用者は変更後の規約に拘束されるものとします。
第11条(準拠法および合意管轄)
本規約の解釈にあたっては、日本法を準拠法とします。本サイトの利用および本規約に関連して生じる一切の紛争については、東京地方裁判所を第一審の専属的合意管轄裁判所とします。
For J³, may joy follow you.

