[Medical Data Science 100 : S4] 「偶然」を科学する:不確実性と賢く付き合うための確率論

学習のポイント

医療現場の不確実性と向き合うため、ギャンブルから生まれた「確率論」の基本を学びます。未来を予測する3つの神器「確率変数」「確率分布」「期待値」の概念を理解し、偶然を科学的に扱う第一歩を踏み出しましょう。

📦 確率変数
未来の結果を入れる箱

まだ結果が決まっていない事象(サイコロの目、患者の体温など)の数値を一時的に入れておくための「箱」です。

種類: 🔢離散型 (整数など数えられる値) と 📏連続型 (身長など途切れない値) があります。

📜 確率分布
結果の出やすさの設計図

確率変数の「箱」に入る各結果が、どれくらいの確率で起こるかを示したルールブック(設計図)です。

例: 公平なサイコロなら、1〜6の目が出る確率は全て同じ1/6。このルール全体が確率分布です。

🎯 期待値
結果の平均的な見込み

ある事象を何度も繰り返したとき、結果が平均してどの値になるかを示す予測値です。

計算式: Σ{(各結果) × (その確率)}。治療法の効果比較など、客観的な意思決定に役立ちます。


医療の現場は、常に「不確実性」との戦いだと思いませんか?「この患者さんの症状は、本当に典型的な疾患によるものだろうか?」「この新しい治療法は、目の前の患者さんにどれくらい効果があるんだろう?」「この検査結果が陽性だったけど、本当に病気だと言い切れるのか?」…。私たちは日々、100%確実な答えがない中で、最善の意思決定を下すことを求められています。

これまでは、そうした不確実性に対して、個人の「経験」や「勘」を頼りに立ち向かってきました。もちろん、それらは非常に価値のあるものです。しかし、もし、この捉えどころのない「偶然」や「不確実性」というものを、客観的な「数字」で捉え、もっと賢く付き合う方法があるとしたら…?

実は、そのための強力なツールが、今から300年以上も前に生まれました。面白いことに、その起源は崇高な科学研究ではなく、なんと「ギャンブルの勝ち方」に関する、あるフランスの貴族の悩みだったと言われています。その悩みに答える形で、天才数学者ブレーズ・パスカルとピエール・ド・フェルマーが交わした手紙のやり取り、そこから「確率論(Probability Theory)」という学問の基礎が築かれました(Hacking, 1975)。

今日は、この「偶然」を科学するための学問、確率論の世界へ足を踏み入れてみましょう。一見すると難しそうな数式が出てくるかもしれませんが、大丈夫です。その根底にある考え方は、私たちの日常感覚に非常に近い、とても面白いものなんです。


目次

確率論の3種の神器①:確率変数 ― “未来の結果”を入れる魔法の箱

確率論の世界を冒険するために、まず手に入れたい最初の神器が「確率変数(Random Variable)」です。名前だけ聞くと少し難しそうですが、これは単なる「箱」だと考えてみてください。

どんな箱かというと、「まだ結果は決まっていないけれど、これから起こる何かの結果(数値)を入れるための箱」です。

例えば、サイコロを一つ振る、という行為を考えてみましょう。振る前は、どの目が出るか分かりませんよね?でも、「1から6のどれかの数字が出る」ということは分かっています。このとき、確率変数というのは、「サイコロを振ったときに出る目」という結果を、とりあえず入れておくためのプレースホルダー、つまり「箱」の役割を果たすのです。

医療の現場に置き換えてみると、確率変数の「箱」は至る所にあります。

  • 「次に来院する患者さんの体温」を入れる箱
  • 「ある新薬を100人に投与したとき、効果があった人数」を入れる箱
  • 「今日の救急外来の受診者数」を入れる箱

これらは全て、実際に事が起こるまで具体的な数値は分かりませんが、どんな値を取りうるかを事前に考えることができます。この「結果を入れるための箱」を数学的に扱うための概念が、確率変数なんです。

確率論の3種の神器①:確率変数 “未来の結果”を入れる魔法の箱 🎲 確率的な事象 (まだ結果は不明) X 確率変数 (箱) (結果を入れる場所)

「まだ結果は決まっていないけれど、これから起こる何かの結果(数値)を入れるための箱」のこと。

医療現場での例 🌡️

「次に来院する患者さんの体温」を入れる箱

💊

「新薬で効果があった人数」を入れる箱

🚑

「今日の救急外来の受診者数」を入れる箱

離散型と連続型:箱の中身はどんな数字?

この確率変数の箱、実は中に入れられる数字の性質によって、大きく2種類に分けられます。

① 離散確率変数 (Discrete Random Variable)
サイコロの目のように、「1, 2, 3…」と、とびとびの値しか取らないものです。数えられるもの、と言い換えてもいいかもしれません。「外来患者の人数」や「副作用が出た人数」などがこれにあたります。小数点はなく、5.5人といった値は取りませんよね。

② 連続確率変数 (Continuous Random Variable)
身長や体重、血圧のように、理論上はどんな細かい値でも取りうるものです。例えば、血圧が120.1 mmHgでも、120.11 mmHgでもありえます。このように、値が連続的につながっているものが連続確率変数です。検査値の多くは、こちらに分類されることが多いですね。

離散型と連続型:箱の中身はどんな数字? 1 2 3 ① 離散確率変数 Discrete Random Variable 🔢 とびとびの値(整数など)

サイコロの目のように、数えられる値しか取りません。5.5人といった値は取りません。

🎲 具体例 ・サイコロの目 (1, 2, 3…) ・外来患者の人数 ・副作用が出た人数
② 連続確率変数 Continuous Random Variable 📏 途切れなく連続した値

身長や体重のように、理論上どんな細かい値でも取りえます。値が連続的につながっています。

🩺 具体例 ・身長 (170.1cm, 170.11cm…) ・体重、血圧 ・多くの検査値

この2つの区別は、後で出てくる「確率分布」の形を考える上でとても重要になるので、「数えられるもの」と「連続的なもの」というイメージだけ、頭の片隅に置いておいてください。


確率論の3種の神器②:確率分布 ― “結果の出やすさ”を示す設計図

さて、結果を入れる「箱(確率変数)」は手に入れました。でも、ただの箱だけでは、次に何が起こるかを予測するには力不足です。サイコロの例で言えば、そのサイコロが普通のサイコロなのか、それとも特定の目が出やすいイカサマのサイコロなのか、知りたいですよね?

そこで登場するのが、2つ目の神器「確率分布(Probability Distribution)」です。これは、先ほどの確率変数の箱に、「それぞれの結果が、どれくらいの確率で入るか」という情報を示した「設計図」や「取扱説明書」のようなものです。

例えば、イカサマのない公平なサイコロの「設計図」は、次のようになります。

【サイコロの確率分布(設計図)】

サイコロの確率分布 🎲 公正な6面サイコロの各目が出る確率は、すべて等しく 1/6 です。 出る目 (X = 1) 1/6 (約 16.7%) 出る目 (X = 2) 1/6 (約 16.7%) 出る目 (X = 3) 1/6 (約 16.7%) 出る目 (X = 4) 1/6 (約 16.7%) 出る目 (X = 5) 1/6 (約 16.7%) 出る目 (X = 6) 1/6 (約 16.7%) 合計確率 Σ P(X) 1 (100%)

この表が、サイコロという確率的な現象の全てを記述しています。全ての可能性をリストアップし、それぞれの確率が示され、確率の合計は必ず1(100%)になります。これが確率分布の基本です。

医療の例で考えてみましょう。ある疾患の有病率が10%だとします。無作為に選んだ一人の人がその疾患を持っているかどうかを確率変数(持っていれば1, 持っていなければ0)で考えると、その「設計図」は以下のようになります。

  • 結果が「1 (疾患あり)」になる確率:0.1 (10%)
  • 結果が「0 (疾患なし)」になる確率:0.9 (90%)

このように、確率分布は不確実な現象の「本体」や「構造」を明らかにしてくれる、非常にパワフルな地図なんです。


確率論の3種の神器③:期待値 ― “平均的にどうなるか”を示す未来予測

「箱(確率変数)」と「設計図(確率分布)」が揃いました。最後の神器は、これらを使って未来を予測するためのツール、「期待値(Expected Value)」です。

期待値とは、一言でいえば「その試行をものすごくたくさん繰り返したときに、得られる結果の平均値」のことです。くじ引きの例が分かりやすいかもしれません。「このくじは、平均すると一回あたりいくら儲かる(あるいは損する)んだろう?」という、まさにその「期待できる値」が期待値です。

期待値はどうやって計算するの?

期待値は、「設計図(確率分布)」があれば、簡単な計算で求められます。計算式は以下の通りです。

\[ E(X) = \sum_{i} x_i P(X=x_i) \]

一見すると難しそうですが、分解してみれば簡単です。

  • \( E(X) \): 確率変数Xの期待値(Expected Value)のこと。
  • \( x_i \): 確率変数が取りうる、それぞれの結果(サイコロなら1, 2, …, 6)。
  • \( P(X=x_i) \): その結果 \( x_i \) が起こる確率(サイコロなら全て1/6)。
  • \( \sum \): これは「全部足し合わせなさい」という記号(シグマ)です。

要するに、期待値は「(結果)×(その確率)」というペアを、全ての可能性について計算し、最後にそれらを全部足し合わせたもの、なんです。

先ほどの公平なサイコロで、実際に計算してみましょう。

\[ E(X) = (1 \times \frac{1}{6}) + (2 \times \frac{1}{6}) + (3 \times \frac{1}{6}) + (4 \times \frac{1}{6}) + (5 \times \frac{1}{6}) + (6 \times \frac{1}{6}) \]

\[ E(X) = \frac{1+2+3+4+5+6}{6} = \frac{21}{6} = 3.5 \]

面白いことに、期待値は3.5となりました。サイコロには3.5の目はありませんが、これは「もしサイコロを何千回、何万回と振り続けたら、出る目の平均は限りなく3.5に近づいていく」ということを意味しています。これが期待値の力です。

この考え方は、治療効果の評価などにも応用できます。例えば、ある治療法Aについて、以下のようなデータ(確率分布)があったとします。

  • 80%の確率で、症状が10ポイント改善する。
  • 20%の確率で、症状は全く改善しない(0ポイント)。

この治療Aの期待値は、

\[ E(\text{治療A}) = (10 \text{ポイント} \times 0.8) + (0 \text{ポイント} \times 0.2) = 8 + 0 = 8 \text{ポイント} \]

と計算できます。これは、この治療を多くの人に施した場合、「平均して一人あたり8ポイントの改善が見込める」と解釈できます。複数の治療法を比較検討する際に、こうした期待値という客観的な指標が、私たちの意思決定を大きく助けてくれるのです。

🔮 期待値 E(X) “平均的にどうなるか”を示す未来予測のツール 期待値の計算方法 E(X) = Σ 結果 (x) × 確率 (P) 「結果 × 確率」のペアを、全ての可能性について足し合わせます。 例1:サイコロの出る目の期待値 1 × 1/6 2 × 1/6 3 × 1/6 4 × 1/6 5 × 1/6 6 × 1/6 + + + + + E(X) = (1+2+3+4+5+6) / 6 = 21 / 6 = 3.5 サイコロを何度も振ると、出る目の平均は3.5に近づきます。 例2:治療効果の期待値 😊 10ポイント改善 確率 80% (0.8) 10 × 0.8 = 8 😐 0ポイント改善 確率 20% (0.2) 0 × 0.2 = 0 + 治療Aの期待値 = 8 + 0 8 ポイント 平均して1人あたり8ポイントの改善が見込めます。

まとめ:確率論は、不確実な未来を旅するためのコンパス

今回は、不確実な世界と賢く付き合うための「確率論」という言語の、最も基本的な単語を3つ学びました。

  1. 確率変数:未来の不確実な結果を入れるための「箱」。
  2. 確率分布:その箱に、各結果がどれくらいの割合で入るかを示した「設計図」。
  3. 期待値:「設計図」から計算できる、結果の「平均的な見込み」。

これらの概念は、統計学のあらゆる手法の根幹をなす、非常に重要な土台です。そして、確率論の本当の面白さは、ここから始まります。例えば、新しい検査データという情報が手に入ったとき、この「確率」をより精度の高いものに更新していくにはどうすれば良いのか?その答えが、次にお話しする「ベイズの定理」へと繋がっていくのです。不確実な未来という海を旅するためのコンパスとして、ぜひ確率論を使いこなしていきましょう。


参考文献

  • Hacking, I. (1975). The Emergence of Probability: A Philosophical Study of Early Ideas about Probability, Induction and Statistical Inference. Cambridge University Press.
  • Jaynes, E. T. (2003). Probability Theory: The Logic of Science. Cambridge University Press.
  • Ross, S. M. (2014). A First Course in Probability. 9th ed. Pearson.

ご利用規約(免責事項)

当サイト(以下「本サイト」といいます)をご利用になる前に、本ご利用規約(以下「本規約」といいます)をよくお読みください。本サイトを利用された時点で、利用者は本規約の全ての条項に同意したものとみなします。

第1条(目的と情報の性質)

  1. 本サイトは、医療分野におけるAI技術に関する一般的な情報提供および技術的な学習機会の提供を唯一の目的とします。
  2. 本サイトで提供されるすべてのコンテンツ(文章、図表、コード、データセットの紹介等を含みますが、これらに限定されません)は、一般的な学習参考用であり、いかなる場合も医学的な助言、診断、治療、またはこれらに準ずる行為(以下「医行為等」といいます)を提供するものではありません。
  3. 本サイトのコンテンツは、特定の製品、技術、または治療法の有効性、安全性を保証、推奨、または広告・販売促進するものではありません。紹介する技術には研究開発段階のものが含まれており、その臨床応用には、さらなる研究と国内外の規制当局による正式な承認が別途必要です。
  4. 本サイトは、情報提供を目的としたものであり、特定の治療法を推奨するものではありません。健康に関するご懸念やご相談は、必ず専門の医療機関にご相談ください。

第2条(法令等の遵守)
利用者は、本サイトの利用にあたり、医師法、医薬品、医療機器等の品質、有効性及び安全性の確保等に関する法律(薬機法)、個人情報の保護に関する法律、医療法、医療広告ガイドライン、その他関連する国内外の全ての法令、条例、規則、および各省庁・学会等が定める最新のガイドライン等を、自らの責任において遵守するものとします。これらの適用判断についても、利用者が自ら関係各所に確認するものとし、本サイトは一切の責任を負いません。

第3条(医療行為における責任)

  1. 本サイトで紹介するAI技術・手法は、あくまで研究段階の技術的解説であり、実際の臨床現場での診断・治療を代替、補助、または推奨するものでは一切ありません。
  2. 医行為等に関する最終的な判断、決定、およびそれに伴う一切の責任は、必ず法律上その資格を認められた医療専門家(医師、歯科医師等)が負うものとします。AIによる出力を、資格を有する専門家による独立した検証および判断を経ずに利用することを固く禁じます。
  3. 本サイトの情報に基づくいかなる行為によって利用者または第三者に損害が生じた場合も、本サイト運営者は一切の責任を負いません。実際の臨床判断に際しては、必ず担当の医療専門家にご相談ください。本サイトの利用によって、利用者と本サイト運営者の間に、医師と患者の関係、またはその他いかなる専門的な関係も成立するものではありません。

第4条(情報の正確性・完全性・有用性)

  1. 本サイトは、掲載する情報(数値、事例、ソースコード、ライブラリのバージョン等)の正確性、完全性、網羅性、有用性、特定目的への適合性、その他一切の事項について、何ら保証するものではありません。
  2. 掲載情報は執筆時点のものであり、予告なく変更または削除されることがあります。また、技術の進展、ライブラリの更新等により、情報は古くなる可能性があります。利用者は、必ず自身で公式ドキュメント等の最新情報を確認し、自らの責任で情報を利用するものとします。

第5条(AI生成コンテンツに関する注意事項)
本サイトのコンテンツには、AIによる提案を基に作成された部分が含まれる場合がありますが、公開にあたっては人間による監修・編集を経ています。利用者が生成AI等を用いる際は、ハルシネーション(事実に基づかない情報の生成)やバイアスのリスクが内在することを十分に理解し、その出力を鵜呑みにすることなく、必ず専門家による検証を行うものとします。

第6条(知的財産権)

  1. 本サイトを構成するすべてのコンテンツに関する著作権、商標権、その他一切の知的財産権は、本サイト運営者または正当な権利を有する第三者に帰属します。
  2. 本サイトのコンテンツを引用、転載、複製、改変、その他の二次利用を行う場合は、著作権法その他関連法規を遵守し、必ず出典を明記するとともに、権利者の許諾を得るなど、適切な手続きを自らの責任で行うものとします。

第7条(プライバシー・倫理)
本サイトで紹介または言及されるデータセット等を利用する場合、利用者は当該データセットに付随するライセンス条件および研究倫理指針を厳格に遵守し、個人情報の匿名化や同意取得の確認など、適用される法規制に基づき必要とされるすべての措置を、自らの責任において講じるものとします。

第8条(利用環境)
本サイトで紹介するソースコードやライブラリは、執筆時点で特定のバージョンおよび実行環境(OS、ハードウェア、依存パッケージ等)を前提としています。利用者の環境における動作を保証するものではなく、互換性の問題等に起因するいかなる不利益・損害についても、本サイト運営者は責任を負いません。

第9条(免責事項)

  1. 本サイト運営者は、利用者が本サイトを利用したこと、または利用できなかったことによって生じる一切の損害(直接損害、間接損害、付随的損害、特別損害、懲罰的損害、逸失利益、データの消失、プログラムの毀損等を含みますが、これらに限定されません)について、その原因の如何を問わず、一切の法的責任を負わないものとします。
  2. 本サイトの利用は、学習および研究目的に限定されるものとし、それ以外の目的での利用はご遠慮ください。
  3. 本サイトの利用に関連して、利用者と第三者との間で紛争が生じた場合、利用者は自らの費用と責任においてこれを解決するものとし、本サイト運営者に一切の迷惑または損害を与えないものとします。
  4. 本サイト運営者は、いつでも予告なく本サイトの運営を中断、中止、または内容を変更できるものとし、これによって利用者に生じたいかなる損害についても責任を負いません。

第10条(規約の変更)
本サイト運営者は、必要と判断した場合、利用者の承諾を得ることなく、いつでも本規約を変更することができます。変更後の規約は、本サイト上に掲載された時点で効力を生じるものとし、利用者は変更後の規約に拘束されるものとします。

第11条(準拠法および合意管轄)
本規約の解釈にあたっては、日本法を準拠法とします。本サイトの利用および本規約に関連して生じる一切の紛争については、東京地方裁判所を第一審の専属的合意管轄裁判所とします。


For J³, may joy follow you.

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

医師・医学博士・AI研究者・連続起業家
元厚生労働省幹部・ハーバード大学理学修士・ケンブリッジ大学MBA・コロンビア大学行政修士(経済)
岡山大学医学部卒業後、内科・地域医療に従事。厚生労働省で複数室長(医療情報・救急災害・国際展開等)を歴任し、内閣官房・内閣府・文部科学省でも医療政策に携わる。
退官後は、日本大手IT企業や英国VCで新規事業開発・投資を担当し、複数の医療スタートアップを創業。現在は医療AI・デジタル医療機器の開発に取り組むとともに、東京都港区で内科クリニックを開業。
複数大学で教授として教育・研究活動に従事し、医療関係者向け医療AIラボ「Medical AI Nexus」、医療メディア「The Health Choice | 健康の選択」を主宰。
ケンブリッジ大学Associate・社会医学系指導医・専門医・The Royal Society of Medicine Fellow

目次