AIは魔法ではなく、論理的な「数学」の組み合わせで動いています。
本章では、医療AIを安全に使いこなすために知っておきたい、5つの数学分野の役割を直感的に学びます。
複雑な医療データを「ベクトル」や「行列」に整理整頓する技術。AIが世界を計算可能な形として認識するための基礎言語です。
微分で「間違いを減らす方向」を知り、最適化理論で制約の中で「ベストな答え」を探し出します。AIの成長エンジンです。
「95%の確率」といった不確実性を扱い、情報の「価値」を測定します。AIの信頼性を支えるモノサシとなります。
「AIって、なんだか魔法みたいだな」と感じたことはありませんか?レントゲン写真から病変を見つけ出したり、膨大な論文を瞬時に要約したり。その裏側では、一体どんなことが起きているのでしょうか。
実は、AIを動かしているのは魔法のように見える仕組みではなく、「数学」という名の極めて論理的な設計図です(Goodfellow et al., 2016)。医療従事者である私たちがAIを安全に、そして賢く使いこなすためには、この設計図の基本的な考え方を知っておくことが、とても大きな力になります。「AIがなぜこの判断をしたのか?」その根拠の一端を理解できると、AIを単なる道具としてではなく、信頼できるパートナーとして迎え入れることができるようになるはずです。
とはいえ、「数学」と聞くと、ちょっと身構えてしまいますよね。ご安心ください。このシリーズの第0部では、複雑な数式を暗記するのではなく、「それぞれの数学が、AIの世界でどんな役割を果たしているのか?」という“考え方”の骨格を、身近な例え話を交えながら、直感的に理解することを目指します。
今回は、AIという壮大な建物を支える5本の柱、「線形代数」「微分」「確率・統計」「最適化理論」「情報理論」という設計図を一緒に見ていきましょう。さあ、AIの心臓部を巡る冒険の始まりです!
線形代数:医療AIがデータを整理する「魔法の整理箱」
突然ですが、一人の患者さんの情報を思い浮かべてみてください。年齢、性別、身長、体重、血圧、心拍数、血液検査の様々な数値…。これらの情報は、カルテの中にバラバラに記録されているかもしれません。コンピュータ、特にAIがこれらの情報を効率的に扱うには、まずデータをきれいに「整理整頓」してあげる必要があります。
ここで登場するのが線形代数です。その本質は「数字をきれいに並べて、まとめて扱うための道具」であり、AIがデータを扱う上での共通言語のようなものです(Strang, 2016)。まるで、散らかった情報を種類ごとに仕分ける、魔法の整理箱だと考えてみてください。
ベクトルと行列:情報のカードとリスト
線形代数では、数字の組を「ベクトル」や「行列」という形で扱います。
- ベクトル:一列に並んだ数字の組です。先ほどの患者さんの情報(年齢, 血圧, 血糖値, …)を一つの箱に詰めて、
[58, 125, 110, ...]のように並べたものがベクトルです。これは、いわば「一人の患者さんの情報カード」のようなものですね。 - 行列:ベクトルをさらに縦に並べたものです。患者さんA、B、C…の情報カード(ベクトル)を重ねてリストにしたものが、行列です。これは「患者さん名簿全体」に相当します。
そして、驚くべきことに、私たちの目に見えている画像も、AIにとっては巨大な数字の集まり、つまり行列(あるいは、それをさらに重ねた「テンソル」)に過ぎません。例えば、モノクロのCT画像は、各ピクセルの明るさを0から255の数値で表した、巨大な数字のマス目(行列)としてコンピュータに認識されているのです(Bishop, 2006)。
医療AIでどう役立つのか?
線形代数を使ってデータをベクトルや行列に変換することで、AIは以下のようなことができるようになります。
- 情報の集約:患者さんの膨大な検査データを、一つのベクトルとしてコンパクトに表現できます。
- 関係性の計算:ベクトル同士の計算(内積など)をすることで、「患者Aさんと患者Bさんの状態は、どれくらい似ているか?」といった、データ間の類似度を計算できます。こうした類似性の計算は、将来のリスク予測モデルを構築する際の参考にはなりますが、それ自体が因果関係を直接示すものではない点には注意が必要です(Pearl, 2009)。
- 画像処理:CTやMRIの画像データを行列として扱うことで、画像の拡大・縮小、回転、そしてAIによる特徴抽出(畳み込み演算)といった高度な処理が可能になります。
線形代数は、いわばAIが世界を認識するための「言語」のようなもの。この言語があるからこそ、AIは複雑な医療データを効率的に処理し、その中に隠されたパターンを見つけ出すことができるのです。

微分:医療AIが「学習」するためのコンパス
AIは、最初から賢いわけではありません。生まれたてのAIは、まるで新人研修医のように、たくさんのデータから「間違い」を繰り返しながら少しずつ成長していきます。この「間違いから学ぶ」プロセス、つまりAIの「学習」の心臓部で活躍するのが微分です。
AIの学習を、山頂から谷底を目指すハイキングに例えてみましょう。AIの目的は、予測の「間違い(誤差)」が最も小さくなる地点、つまり谷底にたどり着くことです。しかし、深い霧の中で、どちらに進めば谷底に近づけるのか分かりません。そんな時、あなたならどうしますか?
おそらく、足元の地面の「傾き」を調べるのではないでしょうか。一番急な下り坂になっている方向に一歩進めば、効率よく谷底に近づけそうですよね。
微分とは、まさにこの「ある瞬間の、ごくわずかな変化の割合=傾き」を計算するための道具です。AIは微分を使って、どうすれば間違いを減らせるかの「最適な方向」を見つけ出しているのです。
勾配降下法:間違いを最小にするためのナビゲーション
AIの学習では、「勾配降下法(こうばいこうかほう)」という手法が中心的な役割を果たします。これは、先ほどのハイキングの例えそのものです。

- AIが予測を立てる。(例:「この画像は肺炎の可能性が高い」)
- 正解と比べて「間違いの大きさ(損失関数)」を計算する。
- 微分を使って、その間違いを「どの方向に進めば最も減らせるか(勾配)」を計算する。
- 計算した勾配の方向に、AIの内部パラメータ(判断基準のようなもの)をほんの少しだけ更新する。
- このプロセスを、何万回、何億回と繰り返す。
数式で表現すると、AIのパラメータ(\(\theta\))を更新するルールは以下のようになります。なんだか難しそうに見えますが、やっていることは単純です。
\[ \theta_{\text{new}} = \theta_{\text{old}} – \eta \nabla L(\theta_{\text{old}}) \]
- \(\theta_{\text{new}}\):更新後の新しいパラメータ
- \(\theta_{\text{old}}\):現在のパラメータ
- \(\eta\):学習率と呼ばれるもので、ハイキングでいう「一歩の大きさ」。大きすぎると谷を飛び越えてしまい、小さすぎると学習がなかなか進みません。
- \(\nabla L(\theta_{\text{old}})\):損失関数(間違いの大きさ)を微分して計算した「勾配」。これが「傾きが最も急な下り坂の方向」を示します。
つまりこの数式は、「現在の場所から、一番効率よく間違いが減る方向に、ちょっとだけ進む」という操作を表現しているだけなのです。
医療AIでどう役立つのか?
微分がなければ、AIは学習することができません。AIがレントゲン画像から肺炎の兆候を学習したり、心電図の波形から不整脈のパターンを学んだりできるのは、すべてこの「微分」を使って間違いを修正し続ける能力があるからです。ディープラーニングの根幹をなす「誤差逆伝播法(Backpropagation)」も、微分の連鎖律という性質を巧みに利用したアルゴリズムです(Rumelhart et al., 1986; Goodfellow et al., 2016)。
微分は、AIにとって自らを改善し続けるための、まさに「学習のコンパス」と言えるでしょう。
確率・統計:医療AIと「不確実性」との付き合い方
医療の世界は、不確実性に満ちています。「この治療法は、80%の患者さんには有効ですが、20%の患者さんには効果がありません」「この検査が陽性でも、本当に病気である確率は95%です」。私たちは日常的に、白か黒かではない「確からしさ」の中で意思決定をしています。
AIも同様です。AIの予測は、決して「100%絶対」ではありません。そこで、この「不確実性を数学的に扱う」ために不可欠なのが、確率・統計の考え方です(Murphy, 2012)。
確率・統計は、AIにとっての「優秀な天気予報士」のようなもの。「明日は晴れです」と断言するのではなく、「降水確率は10%です」と伝えることで、私たちはより良い判断(傘を持っていくかどうか)ができますよね。AIもまた、確率を使って予測の「自信度」を表現するのです。
ベイズの定理:新しい情報で「確信」を更新する
確率論の中でも特に重要なのが「ベイズの定理」です。これは、新しい情報を手に入れたときに、元の予測の確からしさを更新するための強力なツールです。これは、臨床診断における思考プロセスと非常によく似ています(Gigerenzer and Edwards, 2003)。
例えば、ある疾患の有病率(事前確率)を知っている医師が、患者さんの検査結果(新しい情報)を見て、その患者さんが本当にその疾患である確率(事後確率)を頭の中で更新する。この思考プロセスは、ベイズの定理で数学的に表現できます。
\[ P(A \mid B) = \dfrac{P(B \mid A) P(A)}{P(B)} \]
- \(P(A \mid B)\):検査結果Bが陽性だったときに、本当に病気Aである確率(知りたいこと:事後確率)
- \(P(B \mid A)\):本当に病気Aである人が、検査で陽性Bになる確率(検査の感度)
- \(P(A)\):その病気Aの一般的な有病率(事前確率)
- \(P(B)\):検査結果Bが陽性になる確率(全体のうち、どれくらいの人が陽性になるか)
この定理は、AIが新しいデータを取り込みながら、継続的に賢くなっていく仕組みの基礎にもなっています。
医療AIでどう役立つのか?
- 予測の信頼性評価:AIが「この画像は95%の確率で悪性腫瘍です」と出力する。この「95%」という数字は、確率・統計のモデルに基づいて計算されており、医師が最終判断を下すための重要な情報となります。
- モデルの性能比較:2つの異なるAIモデルのどちらが優れているかを判断するために、感度、特異度、ROC曲線といった統計的な指標が用いられます(James et al., 2013)。
- 因果推論:「この治療法は本当に効果があったのか?」という問いに答えるためには、単なる相関関係だけでなく、交絡因子などを統計的に調整する因果推論の技術が不可欠です(Pearl, 2009)。
確率・統計は、データに潜む不確実性を飼いならし、AIの予測に「信頼性」というお墨付きを与えるための、不可欠な科学なのです。
最適化理論:医療AIが「ベストな答え」を見つける技術
臨床現場は、常に「最適化問題」に満ちています。例えば、放射線治療を計画する際、「腫瘍には最大量の放射線を照射し、かつ、周囲の正常な臓器へのダメージは最小限に抑える」という目標を立てます。このとき、ビームの角度、強度、照射時間など、無数にあるパラメータの組み合わせの中から、最も効果的で安全な「ベストな解」を見つけ出す必要があります(Bortfeld, 2006)。
このような、「ある制約条件の下で、特定の目的を最大化(または最小化)する解を見つけ出す」ための数学が、最適化理論です。
最適化理論は、まるで「高性能なカーナビ」のようなものです。目的地(目的)を設定すると、時間優先、料金優先、距離優先といった様々な条件(制約条件)を考慮しながら、膨大なルートの中から最適な経路(解)を探索してくれます。
実は、先ほど「微分」のセクションで紹介した勾配降下法も、最適化理論の一部です。あれは、「間違い(損失関数)を最小化する」という目的を達成するための、最も基本的な最適化アルゴリズムの一つだったのです。
医療AIでどう役立つのか?
- AIモデルの学習:AIの学習プロセスそのものが、「予測誤差を最小化するパラメータを見つける」という巨大な最適化問題です。Adamなど、勾配降下法を改良した様々な最適化アルゴリズムが学習効率を高めています(Goodfellow et al., 2016)。
- 治療計画の最適化:放射線治療計画のように、複数のトレードオフ(効果と副作用など)が存在する中で、最も望ましい治療プランをコンピュータが探索する際に活用されます。
- 創薬:新しい薬剤を開発する際、目標とする効果を持ち、かつ副作用が少ない化合物の構造を、膨大な候補の中から探索するプロセスに応用されています。
- リソース配分:病院内のベッド数、看護師のシフト、手術室のスケジュールなど、限られた医療リソースを最も効率的に配分するための計画立案にも、最適化理論の考え方が使われています。
最適化理論は、AIに「賢く学ぶ」方法を教えるだけでなく、臨床現場の複雑な意思決定を支援し、医療の質と効率を向上させるための強力なエンジンとなります。
情報理論:医療AIと情報の「価値」を測るモノサシ
最後の設計図は、少し変わった視点を持つ情報理論です。これは、「情報の『価値』や『量』を数学的に定義する」ための学問であり、1948年にクロード・シャノンによって基礎が築かれました(Shannon, 1948)。
例えば、「太陽は東から昇る」という情報と、「明日の東京は雪が降る」という情報では、どちらがより「価値」があると感じますか? おそらく後者でしょう。なぜなら、後者の方が「珍しい(確率が低い)」からです。情報理論では、このように「発生確率が低い事象ほど、情報量は大きい」と考えます。
この考え方を応用したのが「エントロピー」という指標です。エントロピーは、一言でいうと「物事のごちゃごちゃ度合い」や「不確かさの大きさ」を表します。全員が「はい」と答える質問よりも、「はい」と「いいえ」が半々になる質問の方が、結果が不確かで、エントロピーが高い、ということになります。
決定木と情報量
情報理論の考え方は、AIのアルゴリズムである「決定木」で非常にうまく活用されています。決定木は、まるで経験豊富な医師が鑑別診断を進めるように、「はい/いいえ」で答えられる質問を繰り返すことで、最終的な結論にたどり着きます(Hastie et al., 2009)。
このとき、AIは「次にどの質問をすれば、最も効率的に診断を絞り込めるか?」を考えます。その判断基準こそが、エントロピーです。AIは、「この質問をすると、データのごちゃごちゃ度(エントロピー)が最も小さくなる」という質問を毎回選んでいくのです。これにより、無駄な質問をせずに、最短ルートで結論にたどり着こうとします。
医療AIでどう役立つのか?
- 特徴量の選択:AIが学習する際、膨大なデータの中から「どの情報が予測に最も重要か」を見極めるために、情報理論の指標が使われます。
- モデルの学習:AIの学習目標としてよく使われる「交差エントロピー誤差」は、AIの予測した確率分布と、実際の正解の確率分布が「どれだけズレているか」を測る、情報理論由来の指標です。
- データ圧縮:医療画像などの巨大なデータを、品質をあまり損なわずに圧縮する技術にも、情報理論の考え方が応用されています。
情報理論は、AIに「どの情報に注目すべきか」を教え、効率的な学習と判断を促すための、知的なガイドラインの役割を果たしているのです。
まとめ:数学はAIを動かすオーケストラ
ここまで、AIを支える5つの主要な数学分野を見てきました。それぞれが異なる役割を担っていることが、お分かりいただけたでしょうか。
- 線形代数が、バラバラの医療データを「ベクトル」や「行列」という美しい楽譜に書き起こし、
- 微分が、間違いを修正するための「学習の指揮棒」を振り、
- 確率・統計が、予測の不確かさに「95%の信頼度」というハーモニーを加え、
- 最適化理論が、無数の選択肢の中から「最も美しいメロディ(最適解)」を探し出し、
- 情報理論が、どの音符(情報)が「最も重要か」を教えてくれる。
これらが見事に連携することで、AIという壮大なオーケストラは、私たちの想像を超えるような素晴らしい演奏(予測や判断)を可能にするのです。
もちろん、今日お話しした内容は、それぞれの分野のほんの入り口に過ぎません。しかし、この「設計図」の全体像を知っておくことで、これからAIについて学ぶ旅が、よりエキサイティングで実り多いものになるはずです。このシリーズでは、それぞれのテーマを深く探求していきます。一緒に、AIの奥深い世界を冒険していきましょう!
参考文献
- Shannon, C.E. (1948). A Mathematical Theory of Communication. Bell System Technical Journal, 27(3), pp.379–423. doi:10.1002/j.1538-7305.1948.tb01338.x【NO-PMID】
- Rumelhart, D.E., Hinton, G.E. and Williams, R.J. (1986). Learning representations by back-propagating errors. Nature, 323(6088), pp.533–536. doi:10.1038/323533a0 PMID:3773739
- 厚生労働省 (2023). 医療情報システムの安全管理に関するガイドライン 第6.0版. [online] Available at: https://www.mhlw.go.jp/stf/shingi/0000516275_00006.html 【NO-DOI】【NO-PMID】
- Bortfeld, T. (2006). IMRT: a review and preview. Physics in Medicine and Biology, 51(13), pp.R363–R379. doi:10.1088/0031-9155/51/13/R21 PMID:16790916
- Gigerenzer, G. and Edwards, A. (2003). Simple tools for understanding risks: from innumeracy to insight. BMJ, 327(7417), pp.741–744. doi:10.1136/bmj.327.7417.741 PMID:14512488
- Goodfellow, I., Bengio, Y. and Courville, A. (2016). Deep Learning. MIT Press. 【NO-DOI】【NO-PMID】
- Strang, G. (2016). Introduction to Linear Algebra. 5th ed. Wellesley-Cambridge Press. 【NO-DOI】【NO-PMID】
- James, G., Witten, D., Hastie, T. and Tibshirani, R. (2013). An Introduction to Statistical Learning: with Applications in R. Springer. doi:10.1007/978-1-4614-7138-7【NO-PMID】
- Murphy, K.P. (2012). Machine Learning: A Probabilistic Perspective. MIT Press. 【NO-DOI】【NO-PMID】
- Hastie, T., Tibshirani, R. and Friedman, J. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd ed. Springer. doi:10.1007/978-0-387-84858-7【NO-PMID】
- Koller, D. and Friedman, N. (2009). Probabilistic Graphical Models: Principles and Techniques. MIT Press. 【NO-DOI】【NO-PMID】
- Pearl, J. (2009). Causality: Models, Reasoning, and Inference. 2nd ed. Cambridge University Press. 【NO-DOI】【NO-PMID】
- Bishop, C.M. (2006). Pattern Recognition and Machine Learning. Springer. 【NO-DOI】【NO-PMID】
※本記事は情報提供を目的としたものであり、特定の治療法を推奨するものではありません。健康に関するご懸念やご相談は、必ず専門の医療機関にご相談ください。
ご利用規約(免責事項)
当サイト(以下「本サイト」といいます)をご利用になる前に、本ご利用規約(以下「本規約」といいます)をよくお読みください。本サイトを利用された時点で、利用者は本規約の全ての条項に同意したものとみなします。
第1条(目的と情報の性質)
- 本サイトは、医療分野におけるAI技術に関する一般的な情報提供および技術的な学習機会の提供を唯一の目的とします。
- 本サイトで提供されるすべてのコンテンツ(文章、図表、コード、データセットの紹介等を含みますが、これらに限定されません)は、一般的な学習参考用であり、いかなる場合も医学的な助言、診断、治療、またはこれらに準ずる行為(以下「医行為等」といいます)を提供するものではありません。
- 本サイトのコンテンツは、特定の製品、技術、または治療法の有効性、安全性を保証、推奨、または広告・販売促進するものではありません。紹介する技術には研究開発段階のものが含まれており、その臨床応用には、さらなる研究と国内外の規制当局による正式な承認が別途必要です。
- 本サイトは、情報提供を目的としたものであり、特定の治療法を推奨するものではありません。健康に関するご懸念やご相談は、必ず専門の医療機関にご相談ください。
第2条(法令等の遵守)
利用者は、本サイトの利用にあたり、医師法、医薬品、医療機器等の品質、有効性及び安全性の確保等に関する法律(薬機法)、個人情報の保護に関する法律、医療法、医療広告ガイドライン、その他関連する国内外の全ての法令、条例、規則、および各省庁・学会等が定める最新のガイドライン等を、自らの責任において遵守するものとします。これらの適用判断についても、利用者が自ら関係各所に確認するものとし、本サイトは一切の責任を負いません。
第3条(医療行為における責任)
- 本サイトで紹介するAI技術・手法は、あくまで研究段階の技術的解説であり、実際の臨床現場での診断・治療を代替、補助、または推奨するものでは一切ありません。
- 医行為等に関する最終的な判断、決定、およびそれに伴う一切の責任は、必ず法律上その資格を認められた医療専門家(医師、歯科医師等)が負うものとします。AIによる出力を、資格を有する専門家による独立した検証および判断を経ずに利用することを固く禁じます。
- 本サイトの情報に基づくいかなる行為によって利用者または第三者に損害が生じた場合も、本サイト運営者は一切の責任を負いません。実際の臨床判断に際しては、必ず担当の医療専門家にご相談ください。本サイトの利用によって、利用者と本サイト運営者の間に、医師と患者の関係、またはその他いかなる専門的な関係も成立するものではありません。
第4条(情報の正確性・完全性・有用性)
- 本サイトは、掲載する情報(数値、事例、ソースコード、ライブラリのバージョン等)の正確性、完全性、網羅性、有用性、特定目的への適合性、その他一切の事項について、何ら保証するものではありません。
- 掲載情報は執筆時点のものであり、予告なく変更または削除されることがあります。また、技術の進展、ライブラリの更新等により、情報は古くなる可能性があります。利用者は、必ず自身で公式ドキュメント等の最新情報を確認し、自らの責任で情報を利用するものとします。
第5条(AI生成コンテンツに関する注意事項)
本サイトのコンテンツには、AIによる提案を基に作成された部分が含まれる場合がありますが、公開にあたっては人間による監修・編集を経ています。利用者が生成AI等を用いる際は、ハルシネーション(事実に基づかない情報の生成)やバイアスのリスクが内在することを十分に理解し、その出力を鵜呑みにすることなく、必ず専門家による検証を行うものとします。
第6条(知的財産権)
- 本サイトを構成するすべてのコンテンツに関する著作権、商標権、その他一切の知的財産権は、本サイト運営者または正当な権利を有する第三者に帰属します。
- 本サイトのコンテンツを引用、転載、複製、改変、その他の二次利用を行う場合は、著作権法その他関連法規を遵守し、必ず出典を明記するとともに、権利者の許諾を得るなど、適切な手続きを自らの責任で行うものとします。
第7条(プライバシー・倫理)
本サイトで紹介または言及されるデータセット等を利用する場合、利用者は当該データセットに付随するライセンス条件および研究倫理指針を厳格に遵守し、個人情報の匿名化や同意取得の確認など、適用される法規制に基づき必要とされるすべての措置を、自らの責任において講じるものとします。
第8条(利用環境)
本サイトで紹介するソースコードやライブラリは、執筆時点で特定のバージョンおよび実行環境(OS、ハードウェア、依存パッケージ等)を前提としています。利用者の環境における動作を保証するものではなく、互換性の問題等に起因するいかなる不利益・損害についても、本サイト運営者は責任を負いません。
第9条(免責事項)
- 本サイト運営者は、利用者が本サイトを利用したこと、または利用できなかったことによって生じる一切の損害(直接損害、間接損害、付随的損害、特別損害、懲罰的損害、逸失利益、データの消失、プログラムの毀損等を含みますが、これらに限定されません)について、その原因の如何を問わず、一切の法的責任を負わないものとします。
- 本サイトの利用は、学習および研究目的に限定されるものとし、それ以外の目的での利用はご遠慮ください。
- 本サイトの利用に関連して、利用者と第三者との間で紛争が生じた場合、利用者は自らの費用と責任においてこれを解決するものとし、本サイト運営者に一切の迷惑または損害を与えないものとします。
- 本サイト運営者は、いつでも予告なく本サイトの運営を中断、中止、または内容を変更できるものとし、これによって利用者に生じたいかなる損害についても責任を負いません。
第10条(規約の変更)
本サイト運営者は、必要と判断した場合、利用者の承諾を得ることなく、いつでも本規約を変更することができます。変更後の規約は、本サイト上に掲載された時点で効力を生じるものとし、利用者は変更後の規約に拘束されるものとします。
第11条(準拠法および合意管轄)
本規約の解釈にあたっては、日本法を準拠法とします。本サイトの利用および本規約に関連して生じる一切の紛争については、東京地方裁判所を第一審の専属的合意管轄裁判所とします。
For J³, may joy follow you.

