正解ラベルを持たないデータから、隠れた病態(フェノタイプ)や構造を発見する「教師なし学習」。
クラスタリングや次元削減といった手法を通じ、人間の先入観を超えた新しい医学的知見を導き出すアプローチとその限界を学びます。
既存の診断名(ラベル)に縛られず、データ自体の類似性から患者をグループ化(K-Means等)します。これにより、隠れた「サブタイプ(フェノタイプ)」や病態の異質性を浮き彫りにします。
数千項目の検査値など、人間には理解不能な「高次元データ」を、情報のロスを抑えつつ2次元の地図へ圧縮・翻訳します(PCA, UMAP)。データの全体像を可視化する技術です。
AIが見つけたグループや異常はあくまで「計算結果」です。それが医学的に意味があるか、治療を変えるべきかを判断し検証するのは、私たち人間の役割です。AIは「答え」ではなく「問い」をくれます。
臨床の現場に立っていると、ふと「違和感」を覚える瞬間がないでしょうか。
例えば、「敗血症」という一つの診断名がついている患者さんたち。ある人は急速にショック状態に陥り、ある人は腎機能だけが悪化し、またある人は凝固異常が前面に出る。ガイドライン上は同じ治療アルゴリズムに乗っていても、目の前の患者さんの病態は、まるで別物のように感じられる――。
この医師としての直感、いわゆる「クリニカル・ゲシュタルト」は、実はデータサイエンスの世界でいう「教師なし学習(Unsupervised Learning)」に近い発想です。つまり、あらかじめ正解ラベルを与えられなくても、複数の情報を頭の中で組み合わせて「この患者さんは似たタイプだ」「このケースは少し違う」とグループ分けしている、という点で共通しています(Jentzer et al., 2022)。
第31.3回では、正解(教師ラベル)のないデータから、AIの力を使って隠れた構造を発見する旅に出かけます。それは、既存の医学分類という「色眼鏡」を外し、データそのものが語る「潜在的な患者サブグループ(フェノタイプ)」に耳を傾けるプロセスです。ここで得られるフェノタイプは、あくまで仮説生成の出発点であり、臨床的な意味づけや検証は、私たち医療者と研究者の役割として残されています(Prescott and Calfee, 2017)。
1. 「正解」のない教室で学ぶ:教師なし学習の本質
機械学習の世界には、大きく分けて2つの「学び方」があります。正解(診断名や予後)をあらかじめ教え込んで予測させる「教師あり学習」と、正解を渡さずにデータそのものの構造を見つけさせる「教師なし学習」です。
この違いを、「図書館での本の整理」に例えてみましょう。
- 教師あり学習(既知の分類):
「これは循環器の本」「これは呼吸器の本」というラベルが貼られた本を大量に渡され、その特徴を学びます。その結果、新しい本が来たときに「これは循環器の本ですね」と予測できるようになります。既存のルールを効率よく適用するのに向いています。 - 教師なし学習(未知の探索):
表紙もタイトルも読めない、未知の言語で書かれた本が山積みにされている状況を想像してください。正解ラベルはありません。しかし、装丁の色、紙の質感、文字の配列パターンなどを分析することで、「このグループは紙質が似ている」「この本だけインクの色が異質だ」といった構造を見つけ出し、分類することは可能です。
医療において、なぜこの「教師なし学習」が重要なのでしょうか?
それは、現在の私たちが使っている疾患分類(ICD-10など)が、必ずしも病気の生物学的な本質(エンドタイプ)を完全に反映していない可能性があるからです(Bos et al., 2017)。
例えば「心不全」や「敗血症」という診断名は、実は様々な原因や病態が混ざり合った「大きな袋」かもしれません。教師なし学習を使うことで、人間の先入観(既存の診断ラベル)に縛られることなく、データ駆動で「実はここに別のサブタイプがあるのではないか?」という新しい疾患概念を提唱できる可能性を秘めているのです(Zhang et al., 2018)。
2. 患者層別化(クラスタリング):似たもの同士を集める
データ解析における最も基本的、かつ強力なアプローチの一つが「クラスタリング(Clustering)」です。
これは、検査値、バイタルサイン、年齢、既往歴といった多次元のデータ空間において、「距離が近い(=特徴が似ている)」患者さん同士を自動的にグループ化する技術です。人間が頭の中で行う「この患者さんは、あの時の症例と似ているな」という感覚を、数学的に厳密に行うものと言えます。
K-Means法:重心を探す旅
クラスタリングの中で最もシンプルで、世界中で使われているアルゴリズムが「K-Means(K平均法)」です。
数学的には、このアルゴリズムは何をしているのでしょうか? 実は、以下の数式で表される「不満の総量(目的関数 \( J \))」を最小化しようとしています。
\[ J = \sum_{k=1}^{K} \sum_{x \in C_k} || x – \mu_k ||^2 \]
この式は一見複雑に見えますが、意味はシンプルです。
- \( K \):グループの数(例:3つ)
- \( x \):患者さんのデータ(位置)
- \( \mu_k \):そのグループのリーダー(重心)の位置
- \( || x – \mu_k ||^2 \):患者さんとリーダーとの「距離」の2乗
つまり、「全員が、自分のグループのリーダーとできるだけ近くにいる状態」を目指して、リーダーの位置を調整し続けているのです。
臨床的意義:敗血症の再定義
この技術は、現代医学の常識を覆しつつあります。Seymourら (2019) は、Sepsis-3の定義を満たす患者群に対してクラスタリングを行い、4つの臨床的フェノタイプ(α, β, γ, δ)を同定しました。
- α型:最も一般的で、昇圧剤の使用が少ないタイプ
- β型:高齢で慢性疾患が多く、腎機能障害が目立つタイプ
- γ型:炎症反応が強く、低アルブミン血症や体温上昇が見られるタイプ
- δ型:肝機能障害と凝固異常が著しいタイプ
重要なのは、シミュレーション解析において、「フェノタイプによって治療効果の現れ方が異なる可能性」が示されたことです。例えば、ある輸液療法はα型には有効でも、δ型には有害かもしれないのです。従来の重症度スコアだけでは見えにくかったこの「異質性」を可視化したことは、画期的な成果と言えます。ただし、これらはあくまで仮説生成的な結果であり、前向き臨床試験による検証が今後の課題として残されています(Seymour et al., 2019)。
階層的クラスタリング:系統樹を描く
K-Meansの弱点は、最初に「いくつのグループに分けるか(K)」を人間が決める必要がある点です。それを解決するのが「階層的クラスタリング」です。
これは、最も似ている2人をペアにし、次はペア同士をくっつけて……とボトムアップに繰り返し、最終的に全員が繋がる大きな樹形図(デンドログラム)を作成する方法です。生物の進化系統樹のような図ができあがります。
この方法の利点は、データの全体像を可視化してから、「ここで枝を切れば3つのグループになるな」と、後から分類数を決められる点にあります。
3. 次元削減:複雑なデータを「地図」にする
現代の医療データは、まさに「次元の呪い(Curse of Dimensionality)」と戦っています。
「次元」といっても、SF映画の話ではありません。データサイエンスにおいて、変数の数のことを「次元」と呼びます。例えば、一般的な血液検査だけでも数十項目、ゲノムデータに至っては数万項目もの変数(次元)が存在します。しかし、私たち人間が直感的に理解できるのは、縦・横・高さの「3次元」までです。数万次元のデータをそのまま眺めても、そこにある法則や関係性を理解することは不可能です。
そこで必要となるのが、情報のロスを最小限に抑えつつ、高次元のデータを人間が理解できる2次元や3次元にギュッと圧縮する技術、「次元削減(Dimensionality Reduction)」です。これは、複雑な迷宮のようなデータの世界に、私たち人間が読める「地図」を描く作業と言えます。
主成分分析 (PCA):影絵の美学
次元削減の最も古典的かつ基本的な手法が「主成分分析(PCA: Principal Component Analysis)」です。
PCAのアプローチを直感的に理解するには、「影絵」を想像してみてください。
あなたの手元に、複雑な形をした立体オブジェクト(高次元のデータ)があるとします。このオブジェクトの形を、壁に映った「影(2次元)」だけで他人に伝えたいとき、あなたはどうするでしょうか? おそらく、オブジェクトをくるくると回して、「その形の特徴が最もよく表れる角度」を探すはずです。
PCAがやっているのは、まさにこれと同じです。
- 仕組み:データのばらつき(分散)が最も大きくなる方向を見つけ出し、そこに新しい軸(主成分)を通します。
- 数理的な裏側:データの「分散共分散行列」の固有値問題を解き、固有値が大きい順に第1主成分(PC1)、第2主成分(PC2)…と採用していきます。
医療における意義:
これにより、例えば数百項目ある血液検査データを、「全身の炎症レベルを表す軸(PC1)」と「栄養状態を表す軸(PC2)」のような、少数の合成変数に要約することができます。無数の検査値に溺れることなく、患者さんの全体像を把握するのに役立ちます。
t-SNEとUMAP:多様体を広げる
しかし、PCAには弱点があります。それは「直線的な関係(線形)」しか捉えられないことです。ところが、生命現象の多くは複雑で、直線では表せない「非線形」な構造をしています。
そこで登場するのが、t-SNE(ティー・スニー)やUMAP(ユーマップ)といった「多様体学習(Manifold Learning)」と呼ばれる手法です。
これを理解するには、「くしゃくしゃに丸めた紙」を想像してください。
- PCAのアプローチ:丸まった紙に光を当てて影を見ます。これでは、紙に描かれた絵や文字のつながりは分かりません。
- 多様体学習のアプローチ:丸まった紙を、破れないように丁寧に広げて(展開して)、机の上に平らにします。こうすることで初めて、本来の模様(データの構造)が見えてきます。
臨床・研究での応用:
この技術は現在、シングルセルRNA解析(scRNA-seq)などの最先端研究でデファクトスタンダード(事実上の標準)となっています。数万個の細胞の一つ一つが持つ遺伝子発現パターンを解析し、「この細胞集団は免疫細胞だ」「こっちはがん細胞だ」と分類して可視化する際に、UMAPなどが広く用いられています(Becht et al., 2019)。
ただし、注意点もあります。t-SNEやUMAPは非常に強力ですが、設定するパラメータ(ハイパーパラメータ)によって、出来上がる地図の形が大きく変わることがあります。「図がきれいに分かれたから正解」と思い込まず、その背後にある数理的な意味を理解して使う慎重さが求められます(Oskolkov, 2022)。
4. 異常検知:サイレント・キラーを見逃さない
教師なし学習には、クラスタリングや次元削減と並んで、もう一つ極めて重要な応用分野があります。それが「異常検知(Anomaly Detection)」です。
これは、大量のデータの中から、「普段のパターン(正常)」とは異なる「外れ値(異常)」を見つけ出す技術です。
臨床現場で、熟練の医師や看護師が患者さんの様子を見て、「バイタルサインは基準値内だけど、なんとなく顔色が悪い」「何かがおかしい気がする」と直感的に異変を察知することがあります。異常検知は、まさにこの「プロフェッショナルの直感(クリニカル・ゲシュタルト)」を、データと数理モデルを使って形式化しようとする試みと言えます。
「正常」を学ぶことで、「異常」を知る
なぜ、これが「教師なし学習」なのでしょうか?
「教師あり学習」で病気を診断しようとすると、「これが心筋梗塞の波形」「これが脳卒中の波形」といった膨大な「異常データのサンプル」が必要になります。しかし、病気や事故はいつ、どのような形で起こるか予測できません。未知のトラブルや、極めて稀な症例のデータを事前に集めることは困難です。
そこで異常検知では、逆のアプローチをとります。
- 学習フェーズ:ひたすら「正常な状態(健康な時のデータ、正常稼働時のログ)」だけをAIに学ばせます。「これが普通の状態だ」と徹底的に覚え込ませるのです。
- 検知フェーズ:新しいデータが入ってきたとき、「学習した『普通』からどれくらい離れているか?」を計算します。このズレが大きければ、「何か変だ(異常)」と警報を鳴らすのです。
医療における3つの防衛ライン
この技術は、医療の安全を守るための様々な場面で応用が研究されています(Chandola, Banerjee and Kumar, 2009; Muralitharan et al., 2021; Cerqueira et al., 2023)。
- ICUでの急変予兆検知:
心停止や敗血症性ショックなどの致死的なイベントが起こる数時間前には、心拍変動や血圧に微細な変化(ゆらぎ)が生じることがあります。人間には気づけないレベルの「いつもと違う」変化をAIが捉えることで、早期介入のチャンスを作ります。 - 医療機器の故障検知:
MRIやCTなどの高度医療機器が故障して止まれば、診療に多大な影響が出ます。機器のセンサーデータから「異音」や「温度上昇」の予兆を検知し、完全に壊れる前にメンテナンスを行う「予知保全」に役立てられています。 - 医療セキュリティ:
電子カルテシステムへのアクセスログを監視し、「普段はアクセスしない深夜帯に大量のデータをダウンロードしている」といった不審な動きを検知することで、不正アクセスやサイバー攻撃から患者データを守ります。
研究段階から臨床実装へ
ただし、現時点においてこれらの技術は、あくまで「既存のモニタリングや臨床判断を補完する研究・開発段階のツール」であるという理解が重要です。
AIが「異常だ」と叫んでも、それが単なるノイズ(電極外れなど)である場合もあれば、臨床的に意味のない変動である場合もあります(偽陽性)。「オオカミ少年」になって現場を混乱させないためには、さらなる精度の向上と検証が必要です。
また、実際に診断や治療の補助として医療現場に導入するためには、「プログラム医療機器(SaMD: Software as a Medical Device)」としての厳格な規制承認プロセスを経る必要があります。AIは魔法の杖ではなく、厳密な検証を経て初めて信頼できるパートナーとなるのです。
5. 教師なし学習の限界と注意点
ここまで教師なし学習の可能性について語ってきましたが、最後に重要な釘を刺しておかなければなりません。それは、「AIは決して、何でも真実を教えてくれる魔法の箱ではない」ということです。
教師なし学習は、データの中に潜むパターンを見つける強力なツールですが、その使い道を誤ると、全く無意味な、あるいは誤った結論を導き出す危険性があります。臨床研究や実装において、必ず押さえておくべき4つの限界と注意点を整理します。
- データの質とバイアス(Garbage In, Garbage Out):
データ解析には「ゴミを入れれば、ゴミが出てくる」という大原則があります。もし入力データに偏り(単一施設の患者さんだけ、特定の重症度だけなど)があったり、測定誤差や欠損が多かったりすれば、AIは「偏った誤った地図」を正確に描き出してしまいます。出力されたクラスタが、病気の本質ではなく、単なる「データの質の悪さ」を反映しているだけということもあり得ます。 - クラスタ数や手法選択の「恣意性」:
「患者さんをいくつのグループに分けるのが正解か?」という問いに、数学的な絶対解はありません。K-Meansで「3つ」と設定すれば3つに、「5つ」と設定すれば5つに分かれます。距離の測り方やアルゴリズムの選択によっても結果は変わります。解析者のさじ加減(恣意性)が入り込む余地があることを常に意識する必要があります。 - 可視化の「見かけ」に惑わされない:
t-SNEやUMAPで描かれたカラフルで美しい2次元マップを見ると、つい「これが真実だ!」と信じ込みたくなります。しかし、これらの図の形状は、設定する「ハイパーパラメータ」によって大きく変わります。図はあくまで人間が直感的に理解するための補助線であり、統計的な定量的評価も必ず併用しなければなりません。 - フェノタイプはあくまで「仮説生成」:
これが最も重要です。AIが見つけた「新しい敗血症のタイプ」は、その時点では単なる「計算結果」に過ぎません。それが生物学的に妥当な裏付け(バイオマーカーなど)を持ち、臨床的に意味がある(治療方針を変える価値がある)かどうかは、別の独立したデータセットや、前向きな臨床試験によって検証されて初めて「医学的エビデンス」になります。
教師なし学習は、私たちに「答え」を教えるものではなく、「検証すべき新しい仮説」を提案してくれるパートナーであると捉えるのが適切です。
まとめ:データという原石から「意味」を削り出す
教師なし学習は、私たちに「正解」を教えてくれる魔法の杖ではありません。しかし、それは膨大で複雑なデータという「原石」の中に潜む、目に見えない「構造」や「地図」を浮かび上がらせてくれる強力なライトです。
AIがK-Means法で患者さんを「グループA」「グループB」に分けたとしても、そこに自動的にラベルがつくわけではありません。「グループAは炎症反応が強く、予後が悪いタイプだ」「グループBは腎機能低下が主体のタイプだ」と解釈し、医学的な意味(名前)を与えて命を吹き込むのは、私たち医療者の役割です。
一見カオスに見える無機質な数値の羅列から、データサイエンスというレンズを通すことで、これまで見えていなかった新しい疾患の姿が鮮やかに浮かび上がってくる――。
それこそが、AI時代の医学研究における最大の醍醐味であり、臨床医としての「眼」とデータサイエンティストとしての「技」が交差する最もエキサイティングな瞬間ではないでしょうか。
※本記事は情報提供を目的としたものであり、特定の治療法を推奨するものではありません。健康に関するご懸念やご相談は、必ず専門の医療機関にご相談ください。
参考文献
- Seymour, C.W. et al. (2019) ‘Derivation, validation, and potential treatment implications of novel clinical phenotypes for sepsis’, JAMA, 321(20), pp. 2003–2017.
- Becht, E. et al. (2019) ‘Dimensionality reduction for visualizing single-cell data using UMAP’, Nature Biotechnology, 37, pp. 38–44.
- Chandola, V., Banerjee, A. and Kumar, V. (2009) ‘Anomaly detection: A survey’, ACM Computing Surveys, 41(3), Article 15.
- Bos, L.D.J. et al. (2017) ‘Identification and validation of distinct biological phenotypes in acute respiratory distress syndrome’, Thorax, 72(10), pp. 876–883.
- Prescott, H.C. and Calfee, C.S. (2017) ‘Toward smarter lumping and smarter splitting: rethinking strategies for sepsis and acute respiratory distress syndrome clinical trial design’, American Journal of Respiratory and Critical Care Medicine, 196(11), pp. 1380–1383.
- Zhang, Z. et al. (2018) ‘Identification of subclasses of sepsis that showed different clinical outcomes and responses to fluid resuscitation: a latent profile analysis’, Critical Care, 22(1), Article 347.
- Muralitharan, S. et al. (2021) ‘Machine learning–based early warning systems for clinical deterioration: Systematic scoping review’, JMIR Medical Informatics, 9(1), e23421.
- Jentzer, J.C. et al. (2022) ‘Machine learning approaches for phenotyping in critical care’, Current Treatment Options in Cardiovascular Medicine, 24, pp. 377–395.
- Oskolkov, N. (2022) ‘Dimensionality reduction for visualizing single-cell data using UMAP’, in: Dimensionality Reduction. Cham: Springer, pp. 197–221.
- Cerqueira, V. et al. (2023) ‘Early anomaly detection in time series: A hierarchical approach for predicting critical health episodes’, Machine Learning, 112, pp. 2657–2681.
ご利用規約(免責事項)
当サイト(以下「本サイト」といいます)をご利用になる前に、本ご利用規約(以下「本規約」といいます)をよくお読みください。本サイトを利用された時点で、利用者は本規約の全ての条項に同意したものとみなします。
第1条(目的と情報の性質)
- 本サイトは、医療分野におけるAI技術に関する一般的な情報提供および技術的な学習機会の提供を唯一の目的とします。
- 本サイトで提供されるすべてのコンテンツ(文章、図表、コード、データセットの紹介等を含みますが、これらに限定されません)は、一般的な学習参考用であり、いかなる場合も医学的な助言、診断、治療、またはこれらに準ずる行為(以下「医行為等」といいます)を提供するものではありません。
- 本サイトのコンテンツは、特定の製品、技術、または治療法の有効性、安全性を保証、推奨、または広告・販売促進するものではありません。紹介する技術には研究開発段階のものが含まれており、その臨床応用には、さらなる研究と国内外の規制当局による正式な承認が別途必要です。
- 本サイトは、情報提供を目的としたものであり、特定の治療法を推奨するものではありません。健康に関するご懸念やご相談は、必ず専門の医療機関にご相談ください。
第2条(法令等の遵守)
利用者は、本サイトの利用にあたり、医師法、医薬品、医療機器等の品質、有効性及び安全性の確保等に関する法律(薬機法)、個人情報の保護に関する法律、医療法、医療広告ガイドライン、その他関連する国内外の全ての法令、条例、規則、および各省庁・学会等が定める最新のガイドライン等を、自らの責任において遵守するものとします。これらの適用判断についても、利用者が自ら関係各所に確認するものとし、本サイトは一切の責任を負いません。
第3条(医療行為における責任)
- 本サイトで紹介するAI技術・手法は、あくまで研究段階の技術的解説であり、実際の臨床現場での診断・治療を代替、補助、または推奨するものでは一切ありません。
- 医行為等に関する最終的な判断、決定、およびそれに伴う一切の責任は、必ず法律上その資格を認められた医療専門家(医師、歯科医師等)が負うものとします。AIによる出力を、資格を有する専門家による独立した検証および判断を経ずに利用することを固く禁じます。
- 本サイトの情報に基づくいかなる行為によって利用者または第三者に損害が生じた場合も、本サイト運営者は一切の責任を負いません。実際の臨床判断に際しては、必ず担当の医療専門家にご相談ください。本サイトの利用によって、利用者と本サイト運営者の間に、医師と患者の関係、またはその他いかなる専門的な関係も成立するものではありません。
第4条(情報の正確性・完全性・有用性)
- 本サイトは、掲載する情報(数値、事例、ソースコード、ライブラリのバージョン等)の正確性、完全性、網羅性、有用性、特定目的への適合性、その他一切の事項について、何ら保証するものではありません。
- 掲載情報は執筆時点のものであり、予告なく変更または削除されることがあります。また、技術の進展、ライブラリの更新等により、情報は古くなる可能性があります。利用者は、必ず自身で公式ドキュメント等の最新情報を確認し、自らの責任で情報を利用するものとします。
第5条(AI生成コンテンツに関する注意事項)
本サイトのコンテンツには、AIによる提案を基に作成された部分が含まれる場合がありますが、公開にあたっては人間による監修・編集を経ています。利用者が生成AI等を用いる際は、ハルシネーション(事実に基づかない情報の生成)やバイアスのリスクが内在することを十分に理解し、その出力を鵜呑みにすることなく、必ず専門家による検証を行うものとします。
第6条(知的財産権)
- 本サイトを構成するすべてのコンテンツに関する著作権、商標権、その他一切の知的財産権は、本サイト運営者または正当な権利を有する第三者に帰属します。
- 本サイトのコンテンツを引用、転載、複製、改変、その他の二次利用を行う場合は、著作権法その他関連法規を遵守し、必ず出典を明記するとともに、権利者の許諾を得るなど、適切な手続きを自らの責任で行うものとします。
第7条(プライバシー・倫理)
本サイトで紹介または言及されるデータセット等を利用する場合、利用者は当該データセットに付随するライセンス条件および研究倫理指針を厳格に遵守し、個人情報の匿名化や同意取得の確認など、適用される法規制に基づき必要とされるすべての措置を、自らの責任において講じるものとします。
第8条(利用環境)
本サイトで紹介するソースコードやライブラリは、執筆時点で特定のバージョンおよび実行環境(OS、ハードウェア、依存パッケージ等)を前提としています。利用者の環境における動作を保証するものではなく、互換性の問題等に起因するいかなる不利益・損害についても、本サイト運営者は責任を負いません。
第9条(免責事項)
- 本サイト運営者は、利用者が本サイトを利用したこと、または利用できなかったことによって生じる一切の損害(直接損害、間接損害、付随的損害、特別損害、懲罰的損害、逸失利益、データの消失、プログラムの毀損等を含みますが、これらに限定されません)について、その原因の如何を問わず、一切の法的責任を負わないものとします。
- 本サイトの利用は、学習および研究目的に限定されるものとし、それ以外の目的での利用はご遠慮ください。
- 本サイトの利用に関連して、利用者と第三者との間で紛争が生じた場合、利用者は自らの費用と責任においてこれを解決するものとし、本サイト運営者に一切の迷惑または損害を与えないものとします。
- 本サイト運営者は、いつでも予告なく本サイトの運営を中断、中止、または内容を変更できるものとし、これによって利用者に生じたいかなる損害についても責任を負いません。
第10条(規約の変更)
本サイト運営者は、必要と判断した場合、利用者の承諾を得ることなく、いつでも本規約を変更することができます。変更後の規約は、本サイト上に掲載された時点で効力を生じるものとし、利用者は変更後の規約に拘束されるものとします。
第11条(準拠法および合意管轄)
本規約の解釈にあたっては、日本法を準拠法とします。本サイトの利用および本規約に関連して生じる一切の紛争については、東京地方裁判所を第一審の専属的合意管轄裁判所とします。
For J³, may joy follow you.

