
AIは本当に新しい技術なのか
多くの人にとって、AIという言葉は最近登場した未来の技術のように思えるかもしれません。しかし実際には、医療の現場では既に何十年も前からAI技術が活用されています。もし今日、診療に携わった医師であれば、おそらく医療領域のAI研究から得られたエビデンスに基づいて診断や治療方針の意思決定をしたはずです。どういうことか、ここから詳しく見ていきましょう!
医学研究の中に見るAI
フラミンガム研究の例
内科系の医師であれば、Framingham Heart Study(フラミンガム研究)という名前を一度は耳にしたことがあるでしょう。この研究は、現在も続いている世界で最も有名なコホート研究の一つです。1948年にアメリカ・マサチューセッツ州のフラミンガム市で開始され、心血管疾患に関する長期的な疫学研究として進められています。初期には約5,000人の住民が参加し、子どもや孫の世代を対象にした追加調査も行われ、現在では1万人を超える大規模研究へと発展しました。心血管疾患のみならず、多様な疾患のリスク要因を明らかにしてきたことでも知られています。
https://www.heart.org/en/news/2018/10/10/framingham-the-study-and-the-town-that-changed-the-health-of-a-generation
研究で用いられた統計手法とAI
このフラミンガム研究では、喫煙などの特定のリスク要因が心血管疾患のような疾患発生にどれほど影響を与えるかを示すオッズ比などを求めるロジスティック回帰や、生存分析のためのコックス比例ハザードモデルなどの統計手法が用いられてきました。
実は、フラミンガム研究のように統計モデルを医療現場で活用すること自体、現代的な視点から見ると“AIの活用”における非常に重要な先例と言えます。
ロジスティック回帰と機械学習の関係
ロジスティック回帰とは?
医学論文を何本か読むとほぼ必ず出会うロジスティック回帰分析という手法。これは実は、機械学習に分類される手法の一種です。ロジスティック回帰とは、一言でいうと「ある事象が起こる確率」を予測する数学モデル。入力として複数の因子(例:年齢、血圧など)を受け取り、それらの組み合わせからアウトカム(例:病気になる・ならない)を確率で出力します。

フラミンガム研究が行われていた当時、この手法はまだ新しく、計算機で実用的に扱えるようになったばかりでした。そのため、当時の研究者たちが行ったロジスティック回帰分析は、現代のAI技術の基礎を築いたものとして大きな意義を持っています。現在も多くの医学研究で利用され、そこから得られるエビデンスに基づいて日々、私たち医師は診療を行っています。
強み:シンプルさと解釈のしやすさ
ロジスティック回帰の最大の強みは、シンプルさと解釈のしやすさです。各リスク因子に重み(回帰係数)が割り振られ、例えば「年齢が○歳上がるとリスクが△%上がる」という具合に結果を説明できます。

医療者にとってはブラックボックスではなく、「なぜその予測になるか」を比較的理解しやすいことが重要です。そのため、ロジスティック回帰は現在でも医学論文や臨床研究で頻繁に使われています。フラミンガム研究から得られた成果は世界中で心臓病予防に活かされ、リスクスコアはがん発症リスクや手術後合併症リスクなど他の領域にも応用されました。こうしたデータ駆動型医療の流れは、まさにAIの原点とも言えるでしょう。
ロジスティック回帰で使われる「ロジスティック関数」はS字カーブ(シグモイド曲線)を描きます。このカーブは単純な直線ではなく、変化の仕方が一定ではありません。これを「非線形性」といい、リスクの増え方が単純な比例関係にならないことを意味します。線形回帰ではこうした複雑な関係を表現するのが難しいですが、ロジスティック回帰はこの非線形性のおかげで、より現実的な予測が可能になります。
この「非線形性」、つまり「原因と結果の関係がまっすぐな比例ではないこと」と、それがAIにおいて非常に重要なポイントになることについては、次回以降詳しく説明します。今回は数式やグラフの説明を最小限にして、直感的に理解しやすい例やAIとの関係について考えていきましょう。
【参考】ところで、回帰分析ってなに?
そもそも「回帰分析」ってなにというご質問もあるでしょう。下段に、統計学の基礎的な解説をしましたので、興味のある方はご覧ください。
ロジスティック回帰とAI──実は同じ仕組み?
人工ニューロン=パーセプトロン=ロジスティック回帰
まずはこちらをご覧ください。皆さんがご存知の「ニューロン」です。図のように、入力された信号は樹状突起を通じてニューロンに届き、軸索を通って出力されます。この仕組みが私たちの脳内での情報伝達を支えているわけです。

実は、ロジスティック回帰の仕組みは、AIで使われる動物の脳内での情報伝達を模した人工ニューロン、すなわちパーセプトロンそのものなのです。
フラミンガム研究の予測モデルとパーセプトロン:深層学習の関係
ロジスティック回帰分析は、医学研究において特にオッズ比(各要因の影響度)を求めるために頻繁に使用される統計手法です。例えば、先述のように、フラミンガム研究では、年齢・性別・喫煙習慣・高血圧・糖尿病などのリスク因子を入力データとし、心血管疾患の発症確率(0〜100%)を予測するためにロジスティック回帰が用いられています。
このロジスティック回帰の仕組みは、機械学習の一種である人工ニューロン(パーセプトロン)の基本的な構造と共通しています。ロジスティック回帰では、各入力変数(例:年齢、性別、喫煙の有無など)に対して重み(回帰係数)を掛け、その合計を求めた後、シグモイド関数(または他の活性化関数)で変換することで、0〜1の範囲で「事象が起こる確率」を出力します。

深層学習(ディープラーニング)は、この機械学習であるロジスティック回帰の概念を拡張したものと考えることができます。単一のロジスティック回帰モデルは1つのニューロンに相当し、多層ニューラルネットワーク(ディープニューラルネットワーク)は多数のニューロン(パーセプトロン)が階層的につながることで、より複雑なデータ処理や予測が可能になるのです。
深層学習においても、各層のニューロンは入力データを受け取り、それぞれの重み付けを適用してロジスティック関数のような活性化関数を通し、次の層に出力します。ロジスティック回帰ではひとつのニューロンしか扱いませんが、ニューラルネットワークではこれを多層に重ねることで、より複雑な特徴を学習し、高度な予測や分類を行うことが可能になります。
ニューラルネットワークと深層学習の原点
ニューラルネットワーク=人口ニューロンの集合体
以下の図は、人工知能といえばこの図!というほど有名なニューラルネットワークの模式図です。これは脳の神経細胞(ニューロン)の働きを模倣し、先述の人工ニューロン(ロジスティック回帰(厳密には、ロジスティック関数以外の他の活性化関数がよく使われます))を無数に繋ぎ合わせたもの。こうして多層化したものが深層学習(ディープラーニング)の基盤となっています。

- 医学研究でよく使われていたロジスティック回帰分析は、ひとつの人工ニューロンに相当する。
- 人工ニューロン(ロジスティック回帰)を多数組み合わせたネットワークがニューラルネットワークであり、これが深層学習のパワーの源。
脳のニューロン数とAIのパラメーター数
実際、脳もAIも、無数のニューロンを組み合わせて非常に複雑なネットワークを構築しています。成人の人間の脳には約860億個のニューロンがあり、それぞれが数千から数万のシナプスを通じて他のニューロンと接続していると言われています。大脳皮質だけで約150兆個のシナプスが存在するという見方もあります。
https://bionumbers.hms.harvard.edu/bionumber.aspx?id=112056&s=n&v=2
一方、AIにおいては、これに相当するのが「パラメーター」です。例えばGPT-3.5には約1750億のパラメーターが存在し、GPT-4ではさらに膨大な数が使われています。これらのパラメーターに情報が保存され、AIがデータを理解し、複雑な問題を解決する力を生み出し、数が増えれば増えるほど、より多様で高度なタスクが処理可能になります。

シンギュラリティとAGI──脳を超えるAIは誕生するのか
AIが人間の能力を超えることをシンギュラリティと呼びます。もし人間の脳のニューロンやシナプスの数と、AIのパラメーター数が同じ水準となり、さらにそのネットワークを最適化できたなら、私たち人類は本当に「人間の脳」を再現した汎用人工知能(AGI)を作れるかもしれません。もちろん、数が同じになっても知能を再現できるかどうかは今後の研究次第ですが、そこに至るまでの道のりは医療の現場にも大きな影響を与えるでしょう。
次回以降予告──深層学習の核心へ
次回以降では、一つのニューロンによる機械学習と、ニューロンを組み合わせてニューラルネットワークにした深層学習について、その違いを知るところから理解を深めていきます。深層学習における重要なキーワードとして以下を挙げておきます。
- 深層化:多層にわたるネットワークが情報を処理することで、複雑なパターンを捉える。
- 非線形性:つまり『真っ直ぐ(比例)ではない原因と結果の関係性』が複雑な特徴を学習可能にする。
これらの特徴は人間の脳にも見られる特徴であり、今のAIの基礎となっています。次回はこのあたりをさらに深掘りして解説していきましょう。
結び
フラミンガム研究をはじめとする医学研究におけるロジスティック回帰の活用が、実は医療AIの黎明期からの重要な一歩だったこと。そして、それらの研究成果が現代のニューラルネットワークや深層学習につながっていること。こうした背景を知ると、私たちはすでに長い間、「AIとともに医療を前進させてきた」のだと改めて気づかされます。
次回も、さらに踏み込んだ「機械学習」と「深層学習」の違いや魅力について学んでいきましょう。
それでは、また次回お会いしましょう!
参考
1. 回帰分析って何だろう?
- 回帰分析(Regression Analysis) は、「ある結果(アウトカム)」を、「複数の原因や予測因子(説明変数)」から予測・説明するための統計手法です。
- 医療や臨床研究でいえば、「年齢」「BMI」「血圧」「喫煙の有無」などを使って、「心血管疾患が起こるかどうか」「血圧の数値がどのくらいか」といったアウトカムを予測するのに用いられます。
2. 線形回帰分析とは?
2.1 基本イメージ
- 線形回帰分析(Linear Regression) は、説明変数と目的変数が“直線的”な関係であると仮定する手法です。
- 目的変数が「連続値(例:血圧、体重、血糖値など)」のときに使われることが多いです。

2.2 単回帰分析と重回帰分析
- 単回帰分析(Simple Linear Regression)
- 説明変数が1つだけ。
- 例:「年齢 (X)」から「収縮期血圧 (Y)」を予測する。
- 重回帰分析(Multiple Regression Analysis)
- 説明変数が複数ある場合。
- 例:「年齢、BMI、喫煙の有無、コレステロール値」などを使って「収縮期血圧 (Y)」を予測する。

3. ロジスティック回帰分析とは?
3.1 ロジスティック回帰の用途
- 目的変数が「二値(0/1)」のときに使います。
- 例:「疾患あり (1) / なし (0)」「手術成功 (1) / 失敗 (0)」など。
- 線形回帰をそのまま使うと、予測値が0〜1の範囲を超えてしまい、確率として扱いづらくなるため、ロジスティック関数を使って0〜1の範囲におさめます。

4. まとめ
- 回帰分析は、「予測」や「因果関係の探索」に広く使われる重要な統計手法。
- 線形回帰分析
- 目的変数が連続値の場合に使う。
- 「単回帰」から「重回帰」へと、より多くの説明変数を取り込める。
- ロジスティック回帰分析
- 目的変数が「0/1」の二値の場合に使う。
- オッズ比を用いて解釈し、最終的に発症確率として結果を示せる。
コメント