[Series S] 📊 Medical Data Science 100 : 医療AI時代のデータサイエンス大全:統計・疫学・因果推論・データサイエンス100講

📊 [Series S] Medical Data Science 100 : コース概要

データから「真実」を導く科学。
統計学の基礎から、因果推論、疫学研究デザインまで。AI時代だからこそ重要性を増す「データの偏りを見抜き、正しい知見を導き出す力」を養います。

[Series S] Medical Data Science 100 統計学・疫学・因果推論を極める、医療データサイエンス大全 📊 対象者 (Target) Clinicians & Researchers • 統計に「苦手意識」がある医療従事者 • 臨床研究を始めたい/質を高めたい方 • 学会発表・論文執筆を目指す方 🔰 前提知識 (Prerequisites) From Zero to Evidence • 統計学の事前知識は一切不要 • 「p値とは何か?」から直感的に解説 • 数式よりも「考え方」と「実践」を重視 💡 得られる知識 (Skills) Statistics & Causal Inference • 記述/推測統計、仮説検定、回帰分析 • 因果推論 (傾向スコア/操作変数法) • 臨床研究デザインとバイアス制御 🎓 到達目標 (Goals) Publication-Ready Analysis • 適切な統計手法を自分で選択できる • 査読に耐えうる解析結果を出力できる • データを「エビデンス」に昇華できる © Medical AI Nexus | Medical Data Science 100
目次

[Series S] Medical Data Science 100 : コースの全体像

📊 [Series S] Medical Data Science 100 医療AI時代のデータサイエンス大全:統計・疫学・因果推論・100講 S0-S9 第0部:やさしく始める統計学入門 🔰 記述統計 / 確率分布 / 検定 / 推定 / 信頼区間 平均・分散・SD / ベイズの定理 / p値の誤解 / 中心極限定理 Matplotlib・Seabornによる可視化 / 正規分布・t分布 S10-S19 第I部:相関から因果へ 🧠 因果推論の基礎思考 ・相関 vs 因果 / 見せかけの相関 ・反実仮想 / ポテンシャルアウトカム ・DAG (因果グラフ) / バックドア基準 S20-S29 第II部:臨床疫学研究 🏥 研究デザインとバイアス ・RCT vs 観察研究 / コホート / 症例対照 ・リスク比 / オッズ比 / 感度・特異度 ・システマティックレビュー / メタ解析 S30-S39 第III部:統計モデリング 📉 回帰分析の実践 ・重回帰 / ロジスティック回帰 / GLM ・生存時間分析 (KM法, Cox比例ハザード) ・ベイズ統計 / 階層ベイズ / 縦断データ ・競合リスク / 欠測データ処理 S40-S49 第IV部:因果推論ツール 🛠️ バイアス調整の技術 ・Target Trial Emulation ・傾向スコア (Matching, IPTW) ・操作変数 (IV) / 回帰不連続 (RD) ・差分の差分 (DiD) / 媒介分析 S50-S59 第V部:因果推論とML 🤖 機械学習の融合 ・Double Machine Learning (DML) ・Meta-learners (S/T/X/R-learners) ・Causal Forest / 個別化医療 (CATE) S60-S69 第VI部:因果探索 🗺️ 構造発見アルゴリズム ・PCアルゴリズム / LiNGAM ・マルコフ同値クラス / d分離 ・メンデルランダム化 (MR) S70-S79 第VII部:Deep Learning 🕸️ 深層因果表現学習 ・因果表現学習 / Disentanglement ・Causal VAE / GAN / 反実仮想生成 ・不変リスク最小化 (IRM) S80-S89 第VIII部:LLM & 経済 💬 大規模言語モデルと評価 ・Chain-of-Thought / Causal Reasoning ・医療経済学 (CEA, QALY, ICER) ・再現可能性 / 研究倫理 / 規制(FDA) S90-S99 第IX部:叡智の統合と社会実装 🏛️ 歴史・哲学から実社会での運用まで ・Fisher vs Neyman vs Pearl / 因果推論の歴史 ・サンプルサイズ設計 / Estimand / 臨床試験デザイン ・実装科学 / 健康公平性 / ELSI ・Capstone:リアルワールドデータ統合ケーススタディ © 2025 Medical Data Science 100 Course Map

第0部:やさしく始める統計学入門


ID タイトル 概要・キーワード
S0 第0回:ようこそ統計学の世界へ!AI時代の最強の「共通言語」を学ぶ理由 記述統計, 推測統計, データリテラシー, AI, 機械学習, 医療統計学の役割, エビデンスに基づく医療(EBM)
S1 第1回:データの個性を知る第一歩:平均値や中央値はどう使い分ける? 平均値(mean), 中央値(median), 最頻値(mode), 外れ値, ロバスト統計, トリム平均, 幾何平均, 調和平均
S2 第2回:データはどれくらい散らかってる?分散と標準偏差で見る「ばらつき」の物語 散布度, 分散(variance), 標準偏差(SD), 範囲(range), 四分位範囲(IQR), 変動係数(CV), 箱ひげ図, データ分布
S3 第3回:一目で伝わるグラフの魔法:MatplotlibとSeabornでデータを可視化しよう データ可視化, ヒストグラム, 散布図, 棒グラフ, 折れ線グラフ, 箱ひげ図, バイオリンプロット, EDA
S4 第4回:「偶然」を科学する:不確実性と賢く付き合うための確率論 確率, 確率変数, 確率分布, 期待値, 分散, 共分散, 結合確率, 条件付き確率, 全確率の法則, 大数の法則
S5 第5回:「検査で陽性=病気」は本当?ベイズの定理で確率を更新する技術 ベイズの定理, 事前確率, 事後確率, 尤度, 感度, 特異度, 陽性的中率, 陰性的中率, ベイズ更新
S6 第6回:世の中の現象をモデル化する!正規分布・二項分布・ポアソン分布 連続分布, 離散分布, 正規分布, 標準正規分布, 二項分布, ポアソン分布, カイ二乗分布, t分布, F分布
S7 第7回:「どんなデータも平均すると正規分布?」中心極限定理という美しい魔法 中心極限定理(CLT), 標本分布, 標本平均, 標準誤差(SE), 大数の法則, 正規近似
S8 第8回:推定値は「点」より「幅」で語れ!95%信頼区間の本当の意味 点推定, 区間推定, 推定量, 母数, 標本, 信頼区間(CI), 自由度, t分布, 正規近似, 標準誤差
S9 第9回:p値は「万能薬」じゃない!統計的仮説検定の正しい使い方とよくある誤解 帰無仮説(H0), 対立仮説(H1), p値, 有意水準(α), 第1種の過誤, 第2種の過誤, 検出力(1–β), 有意差と臨床的意義
S0-9 第0部:やさしく始める統計学入門
INTRODUCTION 統計学の世界へようこそ (S0) AI時代の共通言語/EBM 記述統計と推測統計の全体像 🌏 ▼ DATA DESCRIPTION Representative Value データの「中心」を知る (S1) 平均値・中央値・最頻値 外れ値とロバスト統計 🎯 Dispersion データの「ばらつき」 (S2) 分散・標準偏差(SD) 四分位範囲(IQR)・変動係数 🌊 Visualization データの可視化技術 (S3) ヒストグラム・箱ひげ図・散布図 Matplotlib/SeabornによるEDA 📊 ▼ PROBABILITY MODEL Randomness 「偶然」を科学する (S4) 確率変数・期待値・条件付き確率 不確実性とリスクの定量化 🎲 Bayesian Logic ベイズの定理と確率更新 (S5) 事前確率・事後確率・尤度 「検査陽性」の真の意味 🔍 Distributions 現象を記述する「分布」 (S6) 正規分布・二項分布・ポアソン分布 t分布・F分布への布石 🔔 THE BRIDGE 中心極限定理 (S7) 標本平均が正規分布に従う魔法 標準誤差(SE)と推定の基礎 ▼ STATISTICAL INFERENCE Estimation 95%信頼区間 (S8) 真値は「点」ではなく「幅」にある 標本から母集団を捉える技術 🔭 Testing 統計的仮説検定 (S9) p値、有意水準、αエラーとβエラー 「差がある」と結論づけるルール ⚖️

第I部:相関から因果へ飛躍する思考法


ID タイトル 概要・キーワード
S10 第10回:「アイスが売れると溺死者が増える?」相関と因果を見分ける思考法 相関関係, 因果関係, 交絡(confounding), 交絡因子, 見せかけの相関, 第3の変数
S11 第11回:AIの予測は完璧、でも「なぜ?」には答えられない:予測モデルの限界 予測, 介入, 説明変数, 目的変数, モデル解釈可能性, i.i.d.仮定, 決定木, ブラックボックス
S12 第12回:「もし、あの時…」を科学する:反実仮想とポテンシャルアウトカム 反実仮想(counterfactual), ポテンシャルアウトカム, ネイマン–ルービンモデル, 個人処置効果(ITE)
S13 第13回:「薬の効果はどれくらい?」ATE, ATT, ATCで因果効果を定義する ATE, ATT, ATC, 推定対象(estimand), 因果効果の解釈
S14 第14回:因果推論を可能にする3つの約束:観察データから「本当の効果」を見抜くための必須条件 交換可能性, ポジティビティ, 整合性, SUTVA, 未測定交絡
S15 第15回:物事の「仕組み」を図で描く:ジュディア・パールと構造的因果モデル(SCM) DAG, SCM, 内生変数, 外生変数, 構造方程式, do演算子
S16 第16回:因果の”流れ”を読み解く地図の文法:d分離とバックドア基準で交絡を断ち切る d分離(d-separation), バックドアパス, フロントドアパス, 合流バイアス, 経路分析
S17 第17回:「見る」と「行う」は天と地ほど違う:介入とdo演算子で因果の扉を開ける 介入(Intervention), do演算子, do-calculus, Pearlの定理
S18 第18回:2大流派の融合:DAGとポテンシャルアウトカムの良いとこ取り、そしてSWIGsへ SWIGs(単一世界介入グラフ), フレームワークの使い分け, DAG拡張, 潜在変数, counterfactual graph
S19 第19回:AIはどこまで賢くなれるか?パールの「因果のはしご」が示す未来 関連(Association), 介入(Intervention), 反実仮想(Counterfactuals), 強いAI, AGI
S10-19 第I部:相関から因果へ飛躍する思考法
第I部:相関から因果へ飛躍する思考法 🍦 相関と因果を見分ける思考法 (S10) 相関関係 vs 因果関係 / 交絡(confounding) / 交絡因子 見せかけの相関 / 第3の変数 🤖 予測モデルの限界:「なぜ」に答える (S11) 予測 vs 介入 / i.i.d.仮定 / ブラックボックス問題 説明変数と目的変数の関係性 🎭 反実仮想の世界 (S12) 「もしあの時…」を科学する ・ポテンシャルアウトカム ・ネイマン–ルービンモデル ・個人処置効果(ITE) 💊 因果効果の定義 (S13) ・ATE (平均処置効果) ・ATT / ATC ・推定対象 (Estimand) ⚖️ 3つの約束(仮定) (S14) 観察データから真実を知る条件 1. 交換可能性 (Exchangeability) 2. ポジティビティ (Positivity) 3. 整合性 / SUTVA 🕸️ 構造的因果モデル (S15) 仕組みを図で描く ・DAG (有向非巡回グラフ) ・SCM / 構造方程式 ・内生変数と外生変数 🔍 因果の地図の読み方 (S16) ・d分離 (d-separation) ・バックドア基準 ・合流点バイアス 介入とdo演算子 (S17) 「見る」と「行う」は違う ・Intervention (介入) ・do-calculus ・Pearlの定理 🔗 2大流派の融合:DAGとPOの統合 (S18) SWIGs (単一世界介入グラフ) / フレームワークの使い分け DAGによる潜在変数の可視化と反実仮想の接続 🪜 未来へ:パールの「因果のはしご」 (S19) 1. 関連(Seeing) → 2. 介入(Doing) → 3. 反実仮想(Imagining) 「強いAI」へのロードマップ

第II部:臨床研究のための疫学と研究デザイン (S20–S29)


ID タイトル 概要・キーワード
S20 第20回:疫学とは何か?疾病頻度を測る 疫学, 曝露, アウトカム, 罹患率, 有病率, 累積罹患率, 発生密度
S21 第21回:リスク比、オッズ比、リスク差って何?論文の数字に騙されないための必須知識 リスク比, オッズ比, リスク差, 寄与危険割合, 2×2表
S22 第22回:研究デザインの全体像~臨床の疑問を解決する「探偵」の手法を学ぼう~ 横断研究, 症例対照研究, コホート研究, 前向き研究, 後ろ向き研究, エコロジカル研究
S23 第23回:研究の質を揺るがす「バイアスの罠」:臨床研究の落とし穴を見抜く探偵術 系統誤差, 選択バイアス, 情報バイアス, リコールバイアス, ミス分類, 交絡, 内的妥当性, 外的妥当性
S24 第24回:コーヒーを飲むと肺がんになる?データに潜む「交絡」という名の犯人と対処法 交絡因子, 層別化解析, マッチング, 制限, Mantel–Haenszel法
S25 第25回:その検査、「陽性」の本当の意味は?臨床判断を劇的に変える「診断の探偵道具」を使いこなす 2×2分割表, 感度, 特異度, 偽陽性, 偽陰性, 陽性的中率(PPV), 陰性的中率(NPV), ROC曲線, AUC
S26 第26回:臨床研究における科学的証拠の探求:ランダム化比較試験(RCT)のデザインとバリエーション RCT, 並行群間比較, クロスオーバー試験, 要因デザイン, クラスタRCT, ランダム化, 割付方法
S27 第27回:臨床試験の”設計図”を読み解く:Estimandという新しい羅針盤 研究プロトコル, 盲検化, ITT解析, Per Protocol解析, Estimand, ICH E9(R1), 適応デザイン
S28 第28回:森の木々から森全体を見る技術〜システマティックレビューとメタアナリシス〜 メタ解析, システマティックレビュー, フォレストプロット, 出版バイアス, PRISMA
S29 第29回:臨床ガイドライン、どう読む? EBM時代の「羅針盤」を読み解く冒険へ! 診療ガイドライン, エビデンスレベル, 推奨グレード, GRADEシステム, エビデンスピラミッド
S29.1 複雑標本調査, 層化, 多段抽出, サンプルウェイト, 設計効果, 分散推定
S20-29 第II部:臨床研究のための疫学と研究デザイン (S20–S29)
▼ MEASUREMENT FUNDAMENTALS Frequency 疫学とは何か? (S20) 罹患率・有病率・発生密度 📉 Association リスク比・オッズ比・リスク差 (S21) 「比較」のための指標 2×2表と寄与危険割合 ▼ OBSERVATIONAL STUDY Study Designs 研究デザインの全体像 (S22) 横断・症例対照・コホート研究 前向き vs 後ろ向き 🗺️ Bias 研究の質を揺るがすバイアス (S23) 選択バイアス・情報バイアス 内的妥当性と外的妥当性 🕶️ Confounding 「交絡」という名の犯人 (S24) 層別化解析・マッチング・制限 見せかけの因果関係を見抜く ▼ INTERVENTION & DIAGNOSIS Diagnosis 診断の探偵道具 (S25) 感度・特異度・ROC曲線 「陽性」の重みを知る尤度比 🩺 The Gold Standard ランダム化比較試験(RCT) (S26) 因果推論の最強デザイン ランダム化・割付のバリエーション 💊 Protocol & Estimand 臨床試験の設計図 (S27) Estimand (ICH E9 R1) ITT解析と盲検化の重要性 📐 ▼ EVIDENCE SYNTHESIS Meta-Analysis 森を見て木々を見る (S28) システマティックレビュー フォレストプロットと出版バイアス 🌳 GUIDELINES 臨床ガイドライン (S29) GRADEシステム・推奨グレード EBMの実践と羅針盤 🧭 Advanced Topic 複雑標本調査とサーベイデータ (S29.1) 層化・多段抽出・重み付け NHANES等の大規模データ解析 📋

第III部:医療統計モデリングの実践 (S30–S39)


ID タイトル 概要・キーワード
S30 第30回:統計検定はじめの一歩:パラメトリック vs ノンパラメトリック、いつどっちを使う? 対応のない/あるt検定, Welchのt検定, Mann–Whitney U検定, Wilcoxon符号付順位検定, カイ二乗検定, 正規性/等分散性検定
S31 第31回:複数の要因を同時に見る分析手法:重回帰分析をマスターしよう 重回帰分析, 偏回帰係数, 決定係数(R²), 多重共線性, ダミー変数, 交互作用項, F検定, モデル選択
S31.1 一元/二元配置ANOVA, 反復測定ANOVA, 多重比較(Tukey/Dunnett), ANCOVA, ノンパラ代替
S31.2 多変量分散分析, Wilksのλ, 多重比較の多変量拡張, 共変量調整(MANCOVA)
S31.3 主成分分析(PCA), 探索的因子分析(EFA), 確証的因子分析(CFA), 適合度, 偏最小二乗回帰(PLS)
S32 第32回:統計モデルの「健康診断」:そのモデル、本当に信頼できますか? 残差分析, QQプロット, 多重共線性(VIF), AIC/BIC, クロスバリデーション, 正則化回帰(Ridge/Lasso)
S32.1 Bland–Altmanプロット, 一致限界(LoA), 級内相関係数(ICC), κ係数, 繰り返し測定のばらつき
S32.2 M推定, ロバスト回帰, 分位点回帰, ヘテロスケダスティシティへの耐性, 外れ値対応
S32.3 制限付き三次スプライン(RCS), 分数多項式, 一般化加法モデル(GAM), 用量反応の曲線化
S33 第33回:「発症するか否か」を予測する標準的なツール:ロジスティック回帰分析へようこそ ロジスティック回帰, オッズ比(OR), 尤度比検定, 分類, カットオフ値, ROC曲線, 感度/特異度
S33.1 ログビノミアル回帰, 修正Poisson回帰, ORとRRの解釈の違い
S33.2 マッチド症例対照, McNemar検定, 条件付きロジスティック回帰, 層別解析
S33.3 順序ロジット(比例オッズ), Brant検定, 多項ロジット, 重症度スコアへの応用
S34 第34回:AIドクターの成績表?〜ロジスティック回帰の評価、オッズ比からROC曲線まで〜 Hosmer–Lemeshow検定, AUC, 混同行列, F1スコア, C-statistic, キャリブレーション, NRI/IDI
S35 第35回:「いつ、何が起こるか」を科学する:生存時間分析への招待状 生存時間データ, イベント, 打ち切り, 生存関数, ハザード関数, Kaplan–Meier推定, ハザード比
S35.1 Kaplan–Meier, Greenwood公式, ログランク検定, 中央生存期間, 層別ログランク, 低イベント率
S35.2 Cox比例ハザード, 部分尤度, 比例ハザード性, ties処理, ペナルティ付きCox(Ridge/Lasso)
S35.3 累積ハザード関数, Nelson–Aalen推定, 遅延エントリー, KMとの対応
S35.4 生命表, 区間別リスク集合, 均等発生仮定, 長期追跡データ・検診データ
S35.5 Schoenfeld残差, 時間依存性共変量, 拡張Coxモデル, 時間分割
S35.6 RMST, PH仮定不要, RMTL, IPCWによる調整
S36 第36回:未来を予測する「育てゲー」? 医療データサイエンスの新常識、ベイズ統計学へようこそ! ベイズ基礎, MCMC, 収束診断(R̂), モデル比較(LOO/WAIC), Stan/PyMC
S36.1 階層ベイズ(GLMM), ランダム効果, 部分プーリング, 収束診断
S36.2 ネットワークメタ解析, SUCRA, PRISMA-NMA, ベイズ可視化
S36.3 Coxのベイズ化, AFTモデル, RMSTのベイズ推定
S36.4 ベイズ意思決定, 期待効用, Bayesian DCA, EVPI
S37 第37回:生存時間分析の「落とし穴」に挑む:競合リスクと多状態モデルで、もっと現実に近い未来を予測しよう 競合リスク(Fine–Grayモデル), 累積発生関数(CIF), 多状態モデル, illness–deathモデル
S38 第38回:がん再発や喘息発作は一度きりじゃない!「何度も起こるイベント」を追いかける縦断的分析の世界 再発イベント(Andersen–Gill), フレイルティモデル, ジョイントモデリング, ランドマーキング
S38.1 指数/ワイブル/対数正規分布, AFTモデル, AIC/BICによる選択
S38.2 Royston–Parmarモデル, 制限付き三次スプライン, 期間比とハザード比の同時推定
S38.3 cureモデル, 相対生存(エクセスハザード), 背景死亡率
S38.4 区間打ち切り, Turnbull推定, 検診間隔と発見バイアス
S39 第39回:回帰モデルの“統一理論”!一般化線形モデル(GLM)で医療データ解析の世界を広げよう 一般化線形モデル(GLM), 確率分布/リンク関数, ポアソン/負の二項回帰, ゼロ過剰モデル
S39.1 混合効果モデル(LMM/GLMM), ランダム効果, 反復測定MMRM, 共分散構造
S39.2 一般化推定方程式(GEE), マージナルモデル, ロバスト標準誤差, QIC
S39.3 固定効果/ランダム効果モデル, Hausman検定, 二方向固定効果
S39.4 ARIMA, 季節ARIMA, 中断時系列分析(ITS), 単位根検定
S39.5 SEM, パス解析, 確証的因子分析(CFA), 適合度指標, 潜在成長曲線
S39.6 VAR, グレンジャー因果, コインテグレーション, 誤差修正モデル
S39.7 状態空間表現, カルマンフィルタ, 局所レベル/トレンド, ARIMAX
S39.8 MoranのI, 空間ラグ(SAR)/誤差(SEM)/Durbin(SDM)モデル
S39.9 SAE, 階層ベイズ, CAR/ICAR, 地域指標の推定
S39.10 標本ウェイト, 層化, クラスター設計, ウェイト付きGLM/GEE
S39.11 時間依存C統計/ROC, 統合Brierスコア, サバイバル・キャリブレーション
S39.12 多母集団CFA, 潜在クラス/遷移分析, 成長混合モデル
S39.13 MSM, IPTW, 安定化重み, 時間依存共変量
S30-39 第III部:医療統計モデリングの実践 (S30–S39)
Series S: Medical Data Science 第III部:医療統計モデリングの実践 From Basic Tests to Generalized Linear Models & Bayesian Methods PHASE 1: 線形の世界 🔰 S30 統計検定はじめの一歩 パラメトリック vs ノンパラメトリック / t検定 / Mann–Whitney U / χ²検定 正規性・等分散性・検出力の概念 📈 S31 重回帰と分散分析のマスター S31: 重回帰分析 決定係数, 多重共線性, 交互作用項 S31.1-2: ANOVA/MANOVA 反復測定, 多重比較, 球面性 S31.3: 次元削減 PCA, 因子分析(EFA/CFA), 因子負荷量 🩺 S32 モデル診断と信頼性 残差分析, VIF, モデル選択(AIC/BIC), クロスバリデーション S32.1: 一致性 (Bland-Altman, ICC) / S32.2: ロバスト回帰 S32.3: 非線形性 (スプライン, GAM) Discrete / Categorical Time-to-Event ⚖️ S33 ロジスティック回帰 ・オッズ比(OR), 最尤法, 分類 ・S33.1: リスク比(RR)の直接推定 ・S33.2: 条件付きロジスティック(マッチド) ・S33.3: 順序ロジット / 多項ロジット 🎯 S34 予測性能の評価 ・ROC曲線, AUC, C-statistic ・感度, 特異度, Precision, Recall ・キャリブレーション, NRI, IDI S35 生存時間分析の全貌 観察 (S35/35.1) Kaplan-Meier, ログランク検定 モデリング (S35.2/35.5) Cox比例ハザード, 比例ハザード性の検証 発展 (S35.3/35.4/35.6) Nelson-Aalen, 生命表, RMST 🔄 S37/S38 複雑なイベント構造 S37: 競合リスク & 多状態 Fine-Grayモデル, CIF, Multi-state S38: 再発 & フレイルティ Andersen-Gill, Joint Model, Cureモデル 🎲 S36 ベイズ統計学へのパラダイムシフト 基礎理論 (MCMC) 事前分布・事後分布, HMC/NUTS 収束診断(Rhat), モデル比較(WAIC/LOO) Bayesian Applications GLMM (階層ベイズ), NMA (NWメタ解析) Bayesian Survival, 意思決定分析(DCA) PHASE 4: 統一理論と無限の拡張 (GLM++) S39: 一般化線形モデル (GLM) 回帰分析の「統一理論」フレームワーク 確率分布族 (正規/二項/Poisson/Gamma) × リンク関数 A. 縦断データ・階層構造 S39.1: 混合効果モデル ・GLMM (一般化線形混合) ・ランダム効果 vs 固定効果 ・級内相関係数(ICC) S39.2: GEE ・一般化推定方程式 ・作業相関行列, QIC ・集団平均(Marginal)モデル S39.3: パネルデータ分析 ・固定効果(FE)モデル ・Hausman検定 ・時間不変交絡の制御 S39.10: 複雑標本 ・層化・クラスタ抽出 ・サンプリングウェイト ・デザイン効果(DEFF) B. 時系列・構造方程式 S39.4: 時系列の基礎 ・ARIMAモデル ・中断時系列分析 (ITS) ・自己相関と定常性 S39.5/12: SEM ・パス解析, 潜在変数 ・CFA (確証的因子分析) ・潜在成長曲線モデル ・多母集団同時分析 S39.6: 多変量時系列 ・VAR (ベクトル自己回帰) ・Granger因果性 ・コインテグレーション S39.7: 状態空間モデル ・カルマンフィルタ ・構造時系列モデル ・動的線形モデル(DLM) S39.11: 時間依存予測 ・Time-dependent ROC ・動的予測モデル ・ランドマーキング法 C. 空間・因果推論 S39.8: 空間計量経済学 ・Moran’s I (空間相関) ・空間ラグ/誤差モデル ・地理的加重回帰(GWR) S39.9: 小地域推定(SAE) ・階層ベイズ空間モデル ・CAR / ICAR モデル ・空間スムージング S39.13: 高度因果推論 ・MSM (周辺構造モデル) ・時間依存性交絡の制御 ・IPTW (逆確率重み付け)
  • 第31回:S31:複数の要因を同時に見る分析手法:重回帰分析をマスターしよう
    └ 重回帰分析, 偏回帰係数, 標準化偏回帰係数, 最小二乗法, 決定係数(R²), 自由度調整済みR², 多重共線性, ダミー変数, 交互作用項, カテゴリ変数のコーディング, F検定, モデル選択
    • 第31.1回:S31.1:平均の差をグループ間で比べる:分散分析(ANOVA/ANCOVA)
      └ 一元配置ANOVA, 二元配置ANOVA, 交互作用と単純主効果, 反復測定ANOVA, 球面性(Mauchly検定), Greenhouse–Geisser/Huynh–Feldt補正, 多重比較(Tukey, Dunnett, Bonferroni, Holm), 効果量(η², 部分η²), ANCOVA(ベースライン調整), ノンパラ代替(Kruskal–Wallis, Friedman)
    • 第31.2回:S31.2:多エンドポイントを同時に扱う:MANOVA/MANCOVA
      └ 多変量分散分析, Wilksのλ, PillaiのTrace, Hotelling–Lawley, Royの最大根, BoxのM検定, 多重比較の多変量拡張, 共変量調整(MANCOVA)
    • 第31.3回:S31.3:次元削減と因子分析の基礎:PCA/EFA/CFA/PLS
      └ 主成分分析(PCA), 特異値分解(SVD), 探索的因子分析(EFA), 回転法(バリマックス/プロマックス), 因子負荷量, スクリープロット, 確証的因子分析(CFA), モデル適合(CFI/TLI/RMSEA/SRMR), 偏最小二乗回帰(PLS), 尺度信頼性(α係数)
  • 第32回:S32:統計モデルの「健康診断」:そのモデル、本当に信頼できますか?
    └ 残差分析, 残差プロット, QQプロット, Cook’s distance, DFBETA, 多重共線性(VIF), モデル診断, AIC, BIC, クロスバリデーション, 正則化回帰(Ridge, Lasso), 尤度比検定, Wald検定, Score検定
    • 第32.1回:S32.1:測定の一致性・再現性を評価する
      └ Bland–Altmanプロット, 一致限界(LoA), 系統誤差/比例誤差, 級内相関係数(ICC), 測定者間/内再現性, κ係数(重み付きκ), 繰り返し測定のばらつき評価
    • 第32.2回:S32.2:外れ値とロバスト推定・分位点回帰
      └ M推定(Huber/Tukey), ロバスト回帰, 分位点回帰(中央値/上位分位), ヘテロスケダスティシティへの耐性, 臨床データの外れ値対応
    • 第32.3回:S32.3:非線形性に向き合う:スプラインとGAM
      └ 制限付き三次スプライン(RCS), 分数多項式, 交互作用の可視化, 一般化加法モデル(GAM), 平滑化パラメータ, 過学習の制御, 用量反応・年齢効果の曲線化
  • 第33回:S33:「発症するか否か」を予測する標準的なツール:ロジスティック回帰分析へようこそ
    └ ロジスティック回帰, ロジット変換, オッズ, オッズ比(OR), 最尤法(MLE), Wald検定, 尤度比検定, スコア検定, 分類, 判別, カットオフ値, ROC曲線, 感度, 特異度
    • 第33.1回:S33.1:リスク比(RR)を直接推定する回帰モデル
      └ ログビノミアル回帰, 修正Poisson回帰(クラスタロバストSE), 収束問題への対処, ORとRRの解釈の違い, 臨床意思決定でのRR
    • 第33.2回:S33.2:マッチドデザインと条件付きロジスティック回帰
      └ マッチド症例対照, McNemar検定(対応二値), 条件付きロジスティック回帰, 層別(ストラタ)解析, 層別ORの統合
    • 第33.3回:S33.3:順序尺度・多カテゴリの回帰
      └ 順序ロジット(比例オッズ), 比例オッズ仮定の診断(Brant検定), 部分比例オッズモデル, 多項ロジット(名義), 相対リスク比の解釈, 重症度スコア/グレードへの応用
  • 第35回:S35:「いつ、何が起こるか」を科学する:生存時間分析への招待状
    └ 生存時間データ, イベント, 打ち切り(censoring), 生存関数, ハザード関数, 累積ハザード, Kaplan–Meier推定, 中央生存期間, 時点生存率, ハザード比
    • 第35.1回:S35.1:生存曲線を描いて比較する:Kaplan–Meier法とログランク検定
      └ Kaplan–Meier推定量(積率法), 生存曲線(survival curve), 信頼区間(Greenwoodの公式), 同時信頼帯(Hall–Wellner/Equal-precision), 生存時間の中央値(median survival time), 時点生存率(任意時点の生存確率), 分位点(四分位/任意分位)の推定, 分位点の不確実性(再標本化/Greenwood近似), ログランク検定(Log-rank), 一般化Wilcoxon(Wilcoxon), Tarone–Ware, Peto–Peto, 層別ログランク, 打ち切り・遅延エントリー下での実装, 低イベント率時の挙動とサンプルサイズ直観, ソフトウェア実装(R: survival, Python: lifelines)
    • 第35.2回:S35.2:生存に影響する因子を探る:Cox比例ハザードモデル
      └ Cox比例ハザードモデル, ハザード比(HR), 部分尤度(partial likelihood), ベースラインハザード, 比例ハザード性の仮定, 偏回帰係数の解釈, 信頼区間, Wald検定, 尤度比検定, スコア検定, ties処理(Efron/Breslow/Exact), ペナルティ付きCox(Ridge/Lasso), 区間打ち切り/遅延エントリーへの対応, 予後因子の可視化(フォレストプロット)
    • 第35.3回:S35.3:リスクの累積像を掴む:累積ハザード関数とNelson–Aalen推定
      └ 累積ハザード関数(cumulative hazard; H(t)), H(t)とS(t)の関係(S(t)=exp{−H(t)}), Nelson–Aalen推定量(逐次和), 分散推定と信頼区間, 累積ハザードプロットと解釈, 小数イベント領域での安定性, 遅延エントリー(左切断)・打ち切り下での推定, KMとの対応関係と使い分け, 可視化(累積ハザードの平滑化/スプライン補助)
    • 第35.4回:S35.4:区間データを扱う基礎:生命表(アクチュアリアル法)の実務
      └ 生命表(Actuarial/Life table)の枠組み, 区間別リスク集合と人数(lx, dx, qx, px), 区間内打ち切りの取り扱い(均等発生仮定), 区間生存率の合成, 区間別死亡密度/ハザードの近似, 生存時間の要約統計(平均/中央値の区間近似), 標準誤差(Chiang近似), 区間幅選択と情報損失のトレードオフ, 長期追跡データ・検診データでの適用, 可視化(区間KM/生命表の比較)
    • 35.5回:S35.5:Coxモデルの信頼性を問う:比例ハザード性の診断と対処法
      └ 比例ハザード性の診断, シェーンフェルド残差(Schoenfeld), Grambsch–Therneau検定, ログ–ログプロット, 時間依存性共変量(time-dependent covariates), 拡張Coxモデル, 層別Cox(stratified Cox), 時間分割(time-splitting), 期間毎のハザード比, 時間変化効果のスプライン表現
    • 第35.6回:S35.6:ハザード比が使えない時の代替案:制限付き平均生存時間(RMST)
      └ 制限付き平均生存時間(RMST), RMSTの差, RMSTの比, RMTL, KM曲線下の面積, 臨床的解釈, PH仮定不要, 追跡期間設定, 感度分析, IPCWによる調整, 競合リスク下のRMSTの留意点
  • 第36回:S36:未来を予測する「育てゲー」? 医療データサイエンスの新常識、ベイズ統計学へようこそ!
    └ ベイズの基礎(事前・事後、尤度、事後予測), 事前分布設計(weakly/regularizing/情報事前), パラメータ化の落とし穴(centered / non-centered), MCMC(HMC/NUTS), 収束診断(R̂, ESS), 事後チェック(PPC), モデル比較(LOO/WAIC/stacking)
    • 第36.1回:S36.1:Bayesian GLM/GLMM(医療データの階層構造)
      └ GLMのベイズ化(ロジスティック/ポアソン/ガンマ), 階層ベイズ(GLMM), ランダム効果, 部分プーリング, 群間差の安定推定, Stan/brms/PyMC実装, 収束診断, 事前感度
    • 第36.2回:S36.2:Bayesianメタ解析とネットワークメタ解析(NMA)
      └ ランダム効果メタ(τの事前, half-normal/half-Cauchy), ネットワークメタ解析(共通比較, ループ整合性, SUCRA), PRISMA-NMA, ベイズ可視化(森林・ランクリッジ)
    • 第36.3回:S36.3:Bayesianサバイバル(PH/AFT と RMST)
      └ Coxのベイズ化(部分尤度近似, piecewise exponential, spline baseline), AFT(log-normal, log-logistic, Weibull), RMSTのベイズ推定(事後分布による区間推定, クロッシング曲線対応)
    • 第36.4回:S36.4:Bayesian意思決定と DCA 拡張(ライト版)
      └ ベイズ意思決定(損失関数, 期待効用, 閾値最適化), Bayesian Decision Curve Analysis(Net Benefitの不確実性, 事後予測DCA), EVPI/EVPPI
  • 第38回:S38:がん再発や喘息発作は一度きりじゃない!「何度も起こるイベント」を追いかける縦断的分析の世界 | 縦断的イベント分析:再発事象・フレイルティ・ジョイントモデル
    └ 再発イベント(Andersen–Gill; AG), Prentice–Williams–Peterson(PWP), Wei–Lin–Weissfeld(WLW), gap-time vs total-time, フレイルティモデル(共有/ガンマ/対数正規), 異質性(heterogeneity), ジョイントモデリング(joint modeling), shared random effects/連立モデル, 縦断データと生存データの統合, ランドマーキング(landmarking), 動的予測(dynpred)
    • 第38.1回:S38.1:パラメトリック生存モデル:分布を仮定するアプロー
      └ パラメトリック生存モデル, 指数分布, ワイブル分布, 対数正規分布, 対数ロジスティック分布, ゴンペルツ分布, 加速故障時間(AFT)モデル, 期間比(time ratio), 比例ハザード(PH)モデルとの関係, モデル選択(AIC/BIC), 基底ハザードの形状, 打ち切り/区間打ち切り/左切断への適用
    • 第38.2回:S38.2:柔軟なモデリング:フレキシブルパラメトリック生存モデル
      └ Royston–Parmarモデル, 制限付き三次スプライン(restricted cubic splines), 基底ハザードの柔軟なモデリング, 比例ハザード仮定の緩和, 時間依存効果の可視化, 期間比とハザード比の同時推定, stpm2等の実装の要点
    • 第38.3回:S38.3:治癒(寛解)を考える:cureモデルと相対生存
      └ cureモデル(混合/非混合), cure fraction, 予後層別化, 相対生存(エクセスハザード), Pohar-Perme推定, 背景死亡率の取り込み, がん登録データでの応用
    • 第38.4回:S38.4:区間打ち切りと検診データの解析
      └ 区間打ち切り(interval censoring), Turnbull推定, IC-Cox/IC-パラメトリック, 検診間隔と発見バイアス, 実装と可視化
  • 第39回:S39:回帰モデルの“統一理論”!一般化線形モデル(GLM)で医療データ解析の世界を広げよう
    └ 一般化線形モデル(GLM), 確率分布(正規/二項/ポアソン/ガンマ), リンク関数(identity/logit/log/inverse), ポアソン回帰, オフセット項, 過分散(overdispersion), 負の二項回帰, ゼロ過剰モデル(ZIP/ZINB), ハードルモデル, 準尤度(Quasi-likelihood; QL)
    • 第39.1回:S39.1:縦断データと階層構造の分析(1):混合効果モデル
      └ 混合効果モデル(mixed-effects models), 線形混合モデル(LMM), 一般化線形混合モデル(GLMM), ランダム効果(切片/傾き), 固定効果, 分散成分, REML/ML, 級内相関係数(ICC), 反復測定のMMRM, 共分散構造(CS/AR(1)/UN), Kenward–Roger近似, Satterthwaite近似
    • 第39.2回:S39.2:縦断データと階層構造の分析(2):GEEとマージナルモデル
      └ 一般化推定方程式(GEE), マージナルモデル(人口平均モデル), 作業相関行列(独立/交換可能/AR(1)), ロバスト標準誤差(サンドイッチ推定量), QIC, 個体内相関, クラスタ化データ, GEEとGLMMの使い分け
    • 第39.3回:S39.3:パネルデータ分析の基礎:固定効果モデルとランダム効果モデル
      └ パネルデータ, 固定効果(FE)モデル, within推定量, ランダム効果(RE)モデル, between推定量, Hausman検定, 二方向固定効果(個体/時点), 時間不変交絡因子の制御, クラスターロバスト標準誤差, 条件付きロジット/ポアソン(FE)
    • 第39.4回:S39.4:時系列データのモデリング:ARIMAと中断時系列分析
      └ 自己回帰(AR), 移動平均(MA), ARIMAモデル, 差分, 定常性, 単位根検定(ADF/PP), ACF/PACF, 季節ARIMA(SARIMA), 中断時系列分析(ITS), セグメント化回帰(切片/傾き変化), 自己相関対処(GLS/Newey–West), 政策評価
    • 第39.5回:S39.5:構造方程式モデリング(SEM):パス解析から潜在変数へ
      └ 構造方程式モデリング(SEM), パス解析, 観測変数/潜在変数, 測定モデル, 構造モデル, 適合度指標(CFI/TLI/RMSEA/SRMR), 確証的因子分析(CFA), 潜在成長曲線モデル, 測定不変性(多母集団), 間接効果のブートストラップ
    • 第39.6回:S39.6:多変量時系列:VAR/VECMとコインテグレーション
      └ VAR, グレンジャー因果, コインテグレーション(Engle–Granger/Johansen), 誤差修正モデル(VECM), インパルス応答, 分散分解, 構造VARの基礎
    • 第39.7回:S39.7:状態空間モデルとカルマンフィルタ
      └ 状態空間表現, カルマンフィルタ/スムーザ, 局所レベル/トレンド, ダイナミック回帰, 欠測・不規則間隔時系列への対応, ARIMAX, 予測と平滑化
    • 第39.8回:S39.8:空間・社会疫学の回帰モデル(基礎)
      └ MoranのI/LISA, 空間ラグ(SAR)モデル, 空間誤差(SEM)モデル, 空間Durbin(SDM)モデル, 近接/距離行列, コンテクスト効果, 空間パネルの導入
    • 第39.9回:S39.9:小地域統計と階層ベイズ
      └ Small Area Estimation(SAE), 部分プーリング, 階層ベイズ, CAR/ICAR, 事前分布, ベイズ信用区間, 地域指標(貧困/デプリベーション)の推定
    • 第39.10回:S39.10:複雑標本データの設計と解析
      └ 標本ウェイト, 層化, クラスター設計, デザイン効果(DEFF), ウェイト付きGLM, ウェイト付きGEE, 総計推定, 推計の一般化可能性, 代表的データ(DHS/NHANES)への適用
    • 第39.11回:S39.11:予測モデルの妥当性評価(時間情報を含む)
      └ 時間依存C統計(Harrell’s C/Uno’s C), 時間依存ROC, Brierスコア, 統合Brierスコア(IBS), サバイバル・キャリブレーション, ブートストラップ, 交差検証
    • 第39.12回:S39.12:SEM応用(多母集団・縦断・混合)
      └ 多母集団CFAの測定不変性, 潜在クラス/混合モデリング, 潜在遷移分析, 成長混合モデル, 横断・縦断の統合
    • 第39.13回:S39.13:MSM(周辺構造モデル)プレビュー:時間依存交絡への橋渡し
      └ MSM, 逆確率重み付け(IPTW), 安定化重み, 疑似母集団, ポジティビティ, 重みの診断, 時間依存共変量, バイアスと感度分析

第IV部:因果推論の必須ツール (S40–S49)


ID タイトル 概要・キーワード
S40 第40回:RWDで“理想のRCT”を再現する:Target Trial Emulation入門 ターゲットトライアル設計, time zeroの整合, 不死時間バイアス(immortal time), 介入戦略の明確化, RWDでの模擬RCT
S40.1 インシデント/プレバレントユーザー, レングスバイアス, 左右検閲, レイテンシの扱い, index date alignment
S40.2 追跡と打ち切り, 競合リスク取り扱い, MSM/離脱重み付け, time-varying exposure
S40.3 バランス診断, 感度分析(negative/positive control), プロトコル逸脱, 疑似ランダム化チェック
S41 第41回:【因果推論の実践】研究計画の羅針盤!サンプルサイズと検出力入門 効果量定義(ATE/ATT/RR/HR/RMST差), 有意水準/検出力, 事象数基準(Cox), 2群比較・連続/二値
S41.1 有効サンプルサイズ(ESS), デザイン効果, 重みトリミングの影響
S41.2 クラスタ相関, パネル長, ステガード導入
S41.3 弱いIV時の有効効果量, ローカル平均処置効果(LATE)の分散
S41.4 G-computationデータ生成, パラメトリック/半パラ, ベイズ的パワー
S41.5 中間解析, 停止規則, α消費, DSMBの設計ポイント
S42 第42回:「混ぜこぜ」のデータを解きほぐす!交絡調整の基本と回帰分析の賢い使い方 交絡調整の基本(線形/ロジスティック/Cox), モデル誤特定, 非線形/交互作用, 変数選択の罠
S42.1 classical/BERN型, 回帰希釈, 差分バイアス
S42.2 回帰較正(regression calibration), SIMEX, ベイズ階層MEモデル
S42.3 サンドイッチSE, リンク関数ミス指定, 分位点回帰, doubly-robust回帰
S42.4 E-value, bias factor, トラジェクトリ差, プラセボアウトカム
S43 第43回:傾向スコア・マッチング入門:不揃いなデータから「真の効果」を見抜く統計学の知恵 PS推定(ロジスティック, GBM), マッチング(最近傍/半径/カリパ/最適), マッチング比, 置換の有無
S43.1 層別化, 調整, inverse odds of sampling weights, overlap weighting, entropy balancing
S43.2 SMD, eCDF, Love plot, overlap/トリミング, caliperの選び方
S43.3 L1/L2正則化, BART/Random Forest, CBPS, 共変量バランス最適化
S43.4 欠測, 外挿禁止, positivity違反, rare treatment
S44 第44回:IPTWとMSM:時間経過に伴う因果関係を捉える統計的アプローチ 安定化重み(SW), 介入/打ち切り重み, 重みの推定・トリミング, MSMの係数解釈(マージナル効果)
S44.1 治療履歴, time-varying confounding, MSM vs 調整回帰の差
S44.2 極端重み, 有効サンプルサイズ, バランスチェック, truncation/penalization
S44.3 marginal structural Cox, 多値/連続処置, 動的治療ポリシー
S45 第45回:差分の差分法(DID)と合成コントロール法:政策評価の鉄板ツールを医療データで使いこなす 平行トレンド仮定, 2×2 DiDの直観, 固定効果, クラスタロバストSE
S45.1 Callaway–Sant’Anna, Sun–Abraham, Bacon分解, ネガティブ重み問題
S45.2 先見効果(anticipation), 前後動学, プロットの読み方
S45.3 ドナー選択, 重み学習, placebos, augmented SCM
S45.4 ランダマイズドプレースボ, リード/ラグ偽回帰, バランスチェック
S46 第46回:操作変数と回帰不連続~交絡を乗り越える因果推論の有力なアプローチ~ IVの3要件(関連性/独立/除外制約), LATE, モノトニシティ, 2SLS, first-stage診断(F統計)
S46.1 LIML, Anderson–Rubin, CLRテスト, 多IV/過識別
S46.2 業務慣行/距離/制度改変をIVとして, バリデーション戦略
S46.3 sharp/fuzzy, ローカル線形回帰, バンド幅選択(IK/CCT), 高次多項の注意
S46.4 McCrary密度テスト, 共変量連続性, ドーナツRD, マニュピレーション
S46.5 running変数が時間/勾配のケース
S47 第47回:時間依存交絡~臨床データに潜む「動的な罠」を見破る思考法 治療と交絡のフィードバック, ナイーブ解析(時変交絡未調整)の偏り, selection bias(生存者バイアス)
S47.1 DAGでのtime-varyingノード, レンチキュラー図, G-methodsの位置づけ
S47.2 時間分割, time-dependent Cox, MSM, SNMの比較と選択
S47.3 positivity, 累積重みの不安定化, トリミング/正則化, 代替仕様のロバスト性
S48 第48回:時間依存交絡に挑む3つのアプローチ:g-methodsと動的治療戦略を徹底比較 g-formula(G計算), g-estimation(SNM), IPW(MSM)— 三本柱の比較
S48.1 逐次回帰, シミュレーション(“介入下”アウトカム生成), ロングデータ構築
S48.2 rank-preserving SNM, 加法/乗法スケール, 打ち切り調整
S48.3 しきい値ポリシー, Q-learning/A-learning, 最適政策, SMART試験設計
S48.4 計算資源, モデルミス指定, 高次元・非線形化(ML併用:BART/SL)
S49 第49回:媒介分析:『なぜこの治療は効くのか?』その問いに答えるための因果メカニズム解剖学 直接効果/間接効果, natural direct/indirect effect, identification assumptions, 無媒介交絡
S49.1 多重媒介/並列・直列, 連続/二値媒介, 交互作用付き, 反事実に基づく分解
S49.2 打ち切り/競合リスク下の媒介, RMSTベースの媒介効果
S49.3 未測定媒介交絡, ρ法/プロビットリンクによる感度, bounding
S49.4 interventional indirect/direct effect(policy-relevant mediation)
S40-49 第IV部:因果推論の必須ツール (S40–S49)
PHASE 0: BLUEPRINT Target Trial Emulation (S40) RWDで理想のRCTを再現する設計図Time Zero・クローン化・ITT解析 🎯 サンプルサイズと検出力 (S41) 有意差を出せるか?事前の計画効果量・シミュレーション設計 🔋 Q. 交絡因子は全て測定済み? YES (Adjustment) BASIC ADJUSTMENT 交絡調整と回帰分析 (S42) 多変量解析の基本とモデル誤特定E-valueによる感度分析 📉 傾向スコア・マッチング (S43) 「比較可能性」を作り出すPS推定・マッチング・重み付けバランス診断 (Love plot) ⚖️ Time-Varying? ADVANCED: TIME-DEPENDENT ⚠️ 時間依存性交絡 (S47) 「治療→交絡→次の治療」のループ通常の回帰ではバイアスが生じるDAGによる構造理解 🕸️ IPTWとMSM (S44) 重み付けで仮想的なRCTを作る安定化重み・周辺構造モデル G-methods (S48) 因果推論の最高峰アプローチG計算・G推定・動的治療戦略AI/強化学習との融合 ⚙️ NO (Natural Exp.) NATURAL EXPERIMENTS DiDと合成コントロール (S45) 「時間の変化」と「比較群」を利用平行トレンド仮定Staggered Adoption (導入時期のズレ)イベントスタディ 📊 操作変数(IV)とRD (S46) 「外生的な割り当て」を利用LATE (局所平均処置効果)Fuzzy RD / Sharp RDバンド幅の選択 🔗 INSIGHT & MECHANISM 媒介分析 (S49) 効果のブラックボックスを開ける直接効果(DE)と間接効果(IE)の分解因果メカニズムの解明 🧩
  • 第40回:S40:RWDで“理想のRCT”を再現する:Target Trial Emulation入門
    └ ターゲットトライアル設計, time zeroの整合, 不死時間バイアス(immortal time), 介入戦略の明確化, 適格基準, 追跡開始/終了, アウトカム定義, 解析計画, アドヒアランス, インテンション/Per-protocolの整合化, クローン化+人工打ち切り(censoring by design), 重み付け/調整, RWDでの模擬RCT
    • 第40.1回:S40.1:設計の落とし穴と賢い回避術
      └ インシデント/プレバレントユーザー, レングスバイアス, 左右検閲, レイテンシの扱い, 介入開始遅延, index date alignment, multiple eligibility
    • 第40.2回:S40.2:生存時間とTTE:打ち切り・競合リスクを味方に
      └ 追跡と打ち切り, 競合リスク取り扱い, MSM/離脱重み付け, time-varying exposure
    • 第40.3回:S40.3:TTEの妥当性を検証するチェックリスト
      └ バランス診断, 感度分析(negative/positive control), プロトコル逸脱, 疑似ランダム化チェック
  • 第41回:S41:【因果推論の実践】研究計画の羅針盤!サンプルサイズと検出力入門
    └ 効果量定義(ATE/ATT/RR/HR/RMST差), 有意水準/検出力, 事象数基準(Cox), 2群比較・連続/二値, 欠測と打ち切りの反映
    • 第41.1回:S41.1:重み付け・マッチング時の“効く”検出力設計
      └ 有効サンプルサイズ(ESS), デザイン効果, 重みトリミングの影響
    • 第41.2回:S41.2:DiDとイベントスタディのパワー設計
      └ クラスタ相関, パネル長, ステガード導入
    • 第41.3回:S41.3:IV/RDの検出力:弱いIVとLATEの不確実性
      └ 弱いIV時の有効効果量, ローカル平均処置効果(LATE)の分散
    • 第41.4回:S41.4:シミュレーションで攻める設計戦略
      └ G-computationデータ生成, パラメトリック/半パラ, ベイズ的パワー
    • 第41.5回:S41.5:群逐次・順応デザインの要点
      └ 中間解析, 停止規則, α消費, DSMBの設計ポイント
  • 第42回:S42:「混ぜこぜ」のデータを解きほぐす!交絡調整の基本と回帰分析の賢い使い方
    └ 交絡調整の基本(線形/ロジスティック/Cox), モデル誤特定, 非線形/交互作用, 変数選択の罠
    • 第42.1回:S42.1:測定誤差がもたらす歪みを見抜く
      └ classical/BERN型, 回帰希釈, 差分バイアス
    • 第42.2回:S42.2:SIMEXと回帰較正で誤差に強く
      └ 回帰較正(regression calibration), SIMEX, ベイズ階層MEモデル, バリデーション/リライアビリティサブスタディ設計
    • 第42.3回:S42.3:ロバスト化でモデル誤特定に備える
      └ サンドイッチSE, リンク関数ミス指定, 分位点回帰, doubly-robust回帰
    • 第42.4回:S42.4:未測定交絡の感度分析を組み込む
      └ E-value, bias factor, トラジェクトリ差, プラセボアウトカム/エクスポージャ
  • 第43回:S43:傾向スコア・マッチング入門:不揃いなデータから「真の効果」を見抜く統計学の知恵
    └ PS推定(ロジスティック, GBM, スーパラーナー), マッチング(最近傍/半径/カリパ/最適), マッチング比, 置換の有無
    • 第43.1回:S43.1:PSの拡張:重み・層別・バランス最適化
      └ 層別化, 調整, inverse odds of sampling weights, overlap weighting, entropy balancing
    • 第43.2回:S43.2:診断と可視化で“効いているか”を確認
      └ SMD, eCDF, Love plot, overlap/トリミング, caliperの選び方
    • 第43.3回:S43.3:高次元・機械学習PSの実践ポイント
      └ L1/L2正則化, BART/Random Forest, CBPS, 共変量バランス最適化
    • 第43.4回:S43.4:実務で遭遇する地雷と対処法
      └ 欠測, 外挿禁止, positivity違反, rare treatment
  • 第44回:S44:IPTWとMSM:時間経過に伴う因果関係を捉える統計的アプローチ
    └ 安定化重み(SW), 介入/打ち切り重み, 重みの推定・トリミング, 疑似母集団, MSMの係数解釈(マージナル効果)
    • 第44.1回:S44.1:時間依存共変量に挑む
      └ 治療履歴, time-varying confounding(過去治療が交絡に影響), MSM vs 調整回帰の差
    • 第44.2回:S44.2:重みの健全性を診断する
      └ 極端重み, 有効サンプルサイズ, バランスチェック, truncation/penalization
    • 第44.3回:S44.3:多値・連続処置や動的ポリシーへ拡張
      └ marginal structural Cox, 多値/連続処置, 動的治療ポリシー
  • 第45回:S45:差分の差分法(DID)と合成コントロール法:政策評価の鉄板ツールを医療データで使いこなす
    └ 平行トレンド仮定, 2×2 DiDの直観, 固定効果, クラスタロバストSE
    • 第45.1回:S45.1:staggered adoptionの最新アプローチ
      └ Callaway–Sant’Anna, Sun–Abraham, Bacon分解, ネガティブ重み問題
    • 第45.2回:S45.2:イベントスタディで動学を読む
      └ 先見効果(anticipation), 前後動学, プロットの読み方
    • 第45.3回:S45.3:合成コントロールを設計・検証する
      └ ドナー選択, 重み学習, placebos, augmented SCM
    • 第45.4回:S45.4:偽薬検定と感度分析で信頼性を高める
      └ ランダマイズドプレースボ, リード/ラグ偽回帰, バランスチェック
  • 第46回:S46:操作変数と回帰不連続~交絡を乗り越える因果推論の有力なアプローチ~
    └ IVの3要件(関連性/独立/除外制約), LATE, モノトニシティ, 2SLS, first-stage診断(F統計)
    • 第46.1回:S46.1:弱いIVへの頑健な推定
      └ LIML, Anderson–Rubin, CLRテスト, 多IV/過識別
    • 第46.2回:S46.2:現場で使えるIV設計のヒント
      └ 業務慣行/距離/制度改変をIVとして, バリデーション戦略
    • 第46.3回:S46.3:RD設計の勘所:sharp/fuzzyと帯域選択
      └ sharp/fuzzy, ローカル線形回帰, バンド幅選択(IK/CCT), 高次多項の注意
    • 第46.4回:S46.4:RDの信頼性チェックを徹底
      └ McCrary密度テスト, 共変量連続性, ドーナツRD, マニュピレーション
    • 第46.5回:S46.5:時間RD・キンクRDの応用
      └ running変数が時間/勾配のケース
  • 第47回:S47:時間依存交絡~臨床データに潜む「動的な罠」を見破る思考法
    └ 治療と交絡のフィードバック, ナイーブ解析(時変交絡未調整)の偏り, selection bias(生存者バイアス)
    • 第47.1回:S47.1:DAGで構造化して理解する
      └ DAGでのtime-varyingノード, レンチキュラー図, G-methodsの位置づけ
    • 第47.2回:S47.2:実装アプローチを比較して選ぶ
      └ 時間分割, time-dependent Cox, MSM, SNMの比較と選択
    • 第47.3回:S47.3:診断と感度分析で頑健性を担保
      └ positivity, 累積重みの不安定化, トリミング/正則化, 代替仕様のロバスト性
  • 第48回:S48:時間依存交絡に挑む3つのアプローチ:g-methodsと動的治療戦略を徹底比較
    └ g-formula(G計算), g-estimation(SNM), IPW(MSM)— 三本柱の比較
    • 第48.1回:S48.1:パラメトリックg-formulaで“介入下”を再現
      └ 逐次回帰, シミュレーション(“介入下”アウトカム生成), ロングデータ構築
    • 第48.2回:S48.2:SNMのg-estimationを使いこなす
      └ rank-preserving SNM, 加法/乗法スケール, 打ち切り調整
    • 第48.3回:S48.3:Q/A-learningで最適治療を設計
      └ しきい値ポリシー, Q-learning/A-learning, 最適政策, SMART試験設計
    • 第48.4回:S48.4:現実的制約とML併用の勘所
      └ 計算資源, モデルミス指定, 高次元・非線形化(ML併用:BART/SL)
  • 第49回:S49:媒介分析:『なぜこの治療は効くのか?』その問いに答えるための因果メカニズム解剖学
    └ 直接効果/間接効果, natural direct/indirect effect, 交互作用ありの4分解, identification assumptions(順序無作為化, 一貫性, positivity, 無媒介交絡/無曝露誘発媒介‐アウトカム交絡)
    • 第49.1回:S49.1:実務で使える分解と設計
      └ 多重媒介/並列・直列, 連続/二値媒介, 交互作用付き, 反事実に基づく分解
    • 第49.2回:S49.2:サバイバル媒介の特有論点
      └ 打ち切り/競合リスク下の媒介, RMSTベースの媒介効果
    • 第49.3回:S49.3:未測定媒介交絡の感度分析
      └ 未測定媒介交絡, ρ法/プロビットリンクによる感度, bounding
    • 第49.4回:S49.4:ポリシーに効くインターベンショナル効果
      └ interventional indirect/direct effect(policy-relevant mediation)

第V部:AI時代の因果推論と機械学習 (S50–S59)


ID タイトル 概要・キーワード
S50 第50回:なぜビッグデータだけではダメなのか?AIを惑わす「次元の呪い」 次元の呪い, 高次元データ(p>>n), スパース性, 過学習, 頑健性の低下
S50.1 偽りの相関(spurious correlation), 推定量の分散増大, 計算コスト
S50.2 Lasso/Elastic Net, Post-double-selection Lasso, Stability selection
S50.3 傾向スコア・条件付きアウトカムのノンパラ推定, 誤特定によるバイアス
S51 第51回:AIは予測のエキスパート!でも因果関係は苦手? 予測 vs 因果推定, ブラックボックス問題, 正則化バイアス, 選択バイアス
S51.1 L1/L2正則化の縮小効果, 交絡因子の過小評価, 変数選択の不安定性
S51.2 GBDT/NNの内部共変量調整, SHAP/LIMEの限界(相関 vs 因果)
S51.3 ターゲットリーケージ, 不適切なデータ分割, 生存者バイアス
S52 第52回:予測モデルを因果推論マシンに!Double Machine Learning革命 Double Machine Learning (DML), Neyman直交性, Cross-fitting, 二重頑健性
S52.1 厄介なパラメータ推定誤差の影響排除, モーメント条件, ロバスト性
S52.2 サンプル分割による役割分担, K-fold cross-fitting, 過学習バイアス除去
S52.3 DML-IV, Interactive DML(異質性), GATEs, 潜在的な落とし穴
S53 第53回:Pythonで因果推論を始めよう!EconML・CausalML・DoWhy入門 EconML, CausalML, DoWhy, 因果グラフ, モデル実装, 結果解釈
S53.1 構造化(DAG), 識別, 推定, 頑健性検証(Refuters), 解釈
S53.2 DML, DRLearner, CausalForestDML, 適切なモデル選択
S53.3 信頼区間, CATE可視化, cate_interpreter, ポリシー決定
S54 第54回:手持ちのAIを因果推論ツールに!Meta-learnersという魔法 Meta-learners, HTE, S/T/X/R/DR-learner, モデル比較
S54.1 GBDT/RF/LASSO, ベース学習器の影響, ハイパーパラメータチューニング
S54.2 正則化バイアス(S), 誤差増幅(T), 2段階推定(X), 残差回帰(R), 二重頑健性(DR)
S54.3 サンプルサイズや傾向スコアに応じた使い分け, モデルアンサンブル
S55 第55回:「誰に」「どの治療が」効く?個別化医療への扉、CATE CATE, 異質性処置効果(HTE), 個別化処置ルール(ITR), ポリシー評価
S55.1 Uplift Curve, Qini係数, AUUC, Calibration, 擬似アウトカム
S55.2 Variable Importance, Partial Dependence Plots, SHAP
S55.3 治療割り当てルール, Value最大化, オフポリシー評価(OPE)
S56 第56回:森を育てて個人差を見抜く!決定木の進化形、因果フォレスト 因果フォレスト(Causal Forest), GRF, Honest estimation, 頑健性
S56.1 分岐ルール(異質性最大化), Honest-splitting, CATE推定
S56.2 GRFの理論的保証, 信頼区間, Centering, 仮説検定
S56.3 ハイパーパラメータ, Double centeringの解釈, 異質性変数の重要度
S57 第57回:リアルワールドデータの切り札!自分自身と比べる自己対照デザイン SCCS, ケースクロスオーバー, 新規使用者デザイン, 不死時間バイアス
S57.1 SCCSの仮定, イベント依存の打ち切り, 急性イベントへの適用
S57.2 新規使用者 vs 有病者, 健康使用者バイアス, 適切な対照群選択
S57.3 Immortal time bias, タイムゼロの定義, クローニング
S58 第58回:データはいつも完璧じゃない!欠測データと上手に付き合う方法 欠測メカニズム(MCAR/MAR/MNAR), 多重代入法(MICE), IPW, 感度分析
S58.1 連鎖方程式, 代入モデル, 収束診断, Rubinのルール
S58.2 IPCW, 欠測傾向スコア, 重みの安定化
S58.3 識別不可能問題, パターンミクスチャモデル, 感度分析(tipping-point)
S59 第59回:因果推論の「哲学」と「技術」:識別と推定を区別しよう 識別(Identification) vs 推定(Estimation), 交換可能性, 頑健性チェック
S59.1 バックドア基準, フロントドア基準, 操作変数(IV), RD, DiD
S59.2 一致性, 不偏性, 有効性, 頑健な標準誤差, ブートストラップ
S59.3 感度分析(E-value, Rosenbaum bounds), 頑健性チェック
S50-59 第V部:AI時代の因果推論と機械学習 (S50–S59)
Series S: Medical Data Science 第V部:AI時代の因果推論と機械学習 Causal Inference meets Machine Learning (S50–S59) PHASE 1: AIの罠と次元の呪い 📉 S50 Curse of Dimensionality ・高次元データ (p >> n) ・スパース性と距離の陳腐化 ・偽りの相関 (Spurious correlation) ・変数選択のジレンマ (S50.2) (Prediction vs Causal) ・Nuisance Parameterの推定問題 🤖 S51 Prediction vs Causal ・予測性能 ≠ 因果推論の正しさ ・正則化バイアス (Regularization) (係数を0に潰す弊害) ・交絡の増幅 (Conf. Amplification) ・Black boxの解釈性 (S51.2) ・Target Leakage (S51.3) ! PHASE 2: 融合技術 (The Bridge) ⚔️ S52 Double Machine Learning (DML) Theory (S52/S52.1) ・部分線形モデル (Partial Linear) ・Neyman Orthogonality (直交性) ・二重頑健性 (Doubly Robust) Practice (S52.2) ・Cross-fitting (交差適合) ・過学習バイアスの除去 ・Nuisance ParamのML推定 S53: Python Ecosystem 🐍 EconML 🏗️ DoWhy ⚡ CausalML PHASE 3: 個別化医療 (Heterogeneity) 🧙‍♂️ S54 Meta-learners MLモデルを部品として利用 Learner Types: ・S-learner (Single) ・T-learner (Two) ・X-learner (Cross) ・R-learner (Robinson) ・DR-learner (Doubly Robust) S54.3: 最適なLearnerの選択 👤 S55 CATE & ITR ・CATE (条件付き平均処置効果) ・HTE (異質性処置効果) ・サブグループ解析の問題点 Evaluation (S55.1): ・Uplift Curve / Qini係数 ・Transformed Outcome Policy (S55.3): ・ITR (個別化処置ルール) ・Off-policy Evaluation 🌲 S56 Causal Forests & GRF Algorithm (S56.1) ・異質性を最大化する分割ルール ・Honest Estimation (サンプル分割) ・Adaptive Neighborhood Inference (S56.2-3) ・点推定 + 信頼区間 (CI) ・Variable Importance (重要度) ・GRF (Generalized Random Forests) PHASE 4: リアルワールドの複雑性 🔄 S57 Self-Controlled Designs 自己対照:時間不変交絡の制御 ・SCCS (Self-controlled case series) / Case-crossover ・New-user design vs Prevalent user ・Immortal time bias (不死時間バイアス) の回避 🧩 S58 Missing Data 欠測メカニズムと対処 ・MCAR / MAR / MNAR ・MICE (多重代入法) / Rubin’s Rules ・IPCW (逆確率重み付け) / 感度分析 🦉 S59 Identification vs Estimation Identification (識別) ・仮定ベース: 計算可能か? ・Backdoor / IV / RD / DiD ・感度分析 (E-value) Estimation (推定) ・統計手法: どう計算するか? ・Consistency / Efficiency ・Robust SE / Bootstrap
  • 第50回:S50:なぜビッグデータだけではダメなのか?AIを惑わす「次元の呪い」
    └ 次元の呪い(Curse of Dimensionality), 高次元データ(p>>n), データスパース性, 距離尺度の陳腐化, モデルの過学習と汎化性能, 非線形性の課題, 交互作用の爆発, モデル誤特定(model misspecification), 頑健性の低下, nuisance parameter(厄介なパラメータ)の推定問題, 変数選択の難しさ, 高次元空間における直観の落とし穴
    • 第50.1回:S50.1:データが多すぎても困る?高次元データがもたらす挑戦
      └ 偽りの相関(spurious correlation)の増加, 推定量の分散増大と不安定化, 計算コストの指数的増加, メモリ制約, 可視化による直観的理解の困難さ, 高次元空間での幾何学的性質の変化
    • 第50.2回:S50.2:「予測」と「因果」で違う?ベストな変数選択のジレンマ
      └ 予測のための変数選択 vs 因果推論のための変数選択, Lasso/Elastic Netによるバイアス, Post-double-selection Lasso, 交絡因子と予後因子・操作変数の区別, 安定的な変数選択手法(stability selection)
    • 第50.3回:S50.3:分析の「ノイズ」?厄介なパラメータの呪縛
      └ 傾向スコア・条件付きアウトカム平均のノンパラメトリック推定の困難さ, 誤特定によるバイアスの伝播, 因果パラメータ推定への影響, なぜ古典的なGLMでは不十分なのか
  • 第51回:S51:AIは予測のエキスパート!でも因果関係は苦手?
    └ 予測(prediction)と因果推定(causal estimation)の目的の違い, 相関ベースの予測モデル, 解釈性のブラックボックス問題, 正則化バイアス(regularization bias), Lasso/Ridgeによる因果係数の歪み, ナイーブな変数選択による交絡の増幅(confounding amplification), 予後因子と交絡因子の混同, selection bias(選択バイアス)の悪化, ナイーブなサブグループ解析の罠(data dredging)
    • 第51.1回:S51.1:モデルをシンプルに!でも真実を見失う?正則化の罠
      └ L1/L2正則化が係数をゼロ方向に縮小させる効果, 真の交絡因子の係数まで過小評価されるリスク, 変数選択の不安定性, 予測精度とパラメータ推定の不偏性のトレードオフ
    • 第51.2回:S51.2:AIの頭の中は?ブラックボックスモデルと交絡の謎
      └ 勾配ブースティングやニューラルネットワーク内部で共変量がどのように調整されているかの不明瞭さ, SHAP/LIME等の解釈手法の限界(相関は示すが因果は示さない), モデルの仮定の検証困難性
    • 第51.3回:S51.3:見えないところに罠がある!データ処理に潜むバイアス
      └ ターゲットリーケージ(未来情報の利用), 不適切なデータ分割(クロスバリデーションでの時系列・クラスタ構造の無視), 生存者バイアスを悪化させるモデリング
  • 第52回:S52:予測モデルを因果推論マシンに!Double Machine Learning革命
    └ Double Machine Learning (DML)の理論, 部分線形モデル(partially linear model), Neyman直交性(orthogonality), 直交スコア(orthogonal score), 厄介なパラメータ(nuisance parameters)の機械学習による推定, cross-fitting(交差適合)による過学習バイアスの除去, 二重頑健性(doubly robust), DMLの適用条件と限界, ATE/LATEの推定
    • 第52.1回:S52.1:DMLの心臓部!Neyman直交性ってなんだ?
      └ なぜ直交性が重要なのか?, 厄介なパラメータの推定誤差が、主要な因果パラメータの推定に一次の影響を与えなくなる仕組み, モーメント条件の構築, ロバスト性の理論的背景
    • 第52.2回:S52.2:カンニングはダメ!Cross-fittingという賢い盾
      └ ナイーブDMLのバイアス, サンプル分割による役割分担(nuisance推定用 vs main parameter推定用), K-fold cross-fittingの具体的な手順, 推定の安定化とバイアス除去
    • 第52.3回:S52.3:DMLはもっと進化する!応用範囲と今後の可能性
      └ DML-IV(操作変数法への応用), Interactive DML(処置効果の異質性), DML for GATEs(Group Average Treatment Effects), 潜在的な落とし穴とデバッグ
  • 第53回:S53:Pythonで因果推論を始めよう!EconML・CausalML・DoWhy入門
    └ Pythonエコシステム(Pandas, Scikit-learn), 主要因果推論ライブラリ(EconML, CausalML, DoWhy), DoWhyによる因果グラフ定義・識別・推定のフロー, EconMLのDML実装(e.g., LinearDML, CausalForestDML), CausalMLのMeta-Learners実装, 実装コード例(データ準備, モデルフィッティング, 効果推定), 結果の解釈(点推定値, 標準誤差, 信頼区間), 可視化(効果の分布, 特徴量の重要度)
    • 第53.1回:S53.1:迷わずできる!因果推論プロジェクト実践フロー
      └ 1. DAGで問題を構造化(DoWhy), 2. 因果効果を識別, 3. 推定器を選択し実装(EconML/CausalML), 4. 推定値の頑健性を検証(DoWhyのRefuters), 5. 結果の解釈と報告
    • 第53.2回:S53.2:どれを使う?EconMLの主要な推定器を使いこなす
      └ DML系(ATE/LATEのロバスト推定), DRLearner (CATEの二重頑健推定), CausalForestDML (CATEのノンパラ推定), それぞれのモデルの仮定と適切な使用場面
    • 第53.3回:S53.3:数字だけじゃない!効果の不確実性と個人差を読み解く
      └ effect_inferenceによる信頼区間とp値の計算, CATEの可視化, cate_interpreterによる異質性要因の特定(SHAP利用), ポリシー決定のための示唆を得る方法
  • 第54回:S54:手持ちのAIを因果推論ツールに!Meta-learnersという魔法
    └ Meta-learnersの概念, 異質性処置効果(HTE)のモデリング, S-learner(Single-learner)とそのバイアス, T-learner(Two-learner)の問題点, X-learner(Cross-learner)による改善, R-learner(Robinson-learner)と直交化の思想, DR-learner(Doubly Robust learner), 各learnerの長所・短所と比較, 実装上の注意点
    • 第54.1回:S54.1:どのAIを選ぶ?ベース学習器の選択とチューニング
      └ 任意の機械学習モデル(勾配ブースティング, ランダムフォレスト, LASSO等)を部品として利用, ベース学習器の性能がMeta-learnerの性能に与える影響, 適切なハイパーパラメータチューニングの重要性
    • 第54.2回:S54.2:Learnerたちの個性と弱点!動作原理を徹底解剖
      └ S-learnerの正則化バイアス, T-learnerの誤差増幅問題, X-learnerの2段階推定によるバイアス補正, R-learnerの残差回帰による直交化, DR-learnerの二重頑健性
    • 第54.3回:S54.3:ケースバイケース!最適なLearnerを選ぶための実践ガイド
      └ 傾向スコアが極端な場合のT-learnerの問題点, 片群のサンプルサイズが小さい場合のX-learnerの有効性, 理論的堅牢性を求めるならR/DR-learner, モデルの組み合わせ方
  • 第55回:S55:「誰に」「どの治療が」効く?個別化医療への扉、CATE
    └ 条件付き平均処置効果(CATE)の定義と解釈, 平均処置効果(ATE)との違い, 異質性処置効果(HTE), サブグループ解析の統計ematic問題点(多重比較, 検出力不足), CATEの推定戦略(Meta-learners, Causal Forest), 個別化処置ルール(Individualized Treatment Rules; ITR), ポリシー評価(policy evaluation), アップリフトモデリング, 決定木によるルールの可視化
    • 第55.1回:S55.1:このCATEモデルは信頼できる?性能評価のテクニック
      └ Ground truthがない問題, Uplift Curve, Qini係数, AUUC(Area Under the Uplift Curve), 予測値の四分位ごとの平均効果(CATE calibration), 擬似アウトカム(Transformed Outcome)を用いた評価
    • 第55.2回:S55.2:効果の個人差はなぜ生まれる?異質性の源泉を探る
      └ Causal ForestのVariable Importance, 部分従属プロット(Partial Dependence Plots)の因果版, SHAP値による貢献度分析, 決定木によるルールの抽出
    • 第55.3回:S55.3:データから最適解を導く!CATEから治療方針(ITR)へ
      └ CATE推定値に基づく治療割り当てルール(e.g., CATE(X) > c なら治療), 期待アウトカムを最大化するValueの計算, 予算やキャパシティ制約下での最適化, オフポリシー評価(Off-policy evaluation)
  • 第56回:S56:森を育てて個人差を見抜く!決定木の進化形、因果フォレスト
    └ 因果フォレスト(Causal Forest), 一般化ランダムフォレスト(Generalized Random Forests; GRF), honest estimation(正直な推定)とサンプル分割, adaptive neighborhood(適応的近傍)による類似個体の定義, CATEの非線形・高次元モデリング, 処置効果の異質性を説明する共変量の特定(variable importance), 頑健性と信頼区間推定, 実装とチューニングのポイント
    • 第56.1回:S56.1:因果フォレストの中身を覗いてみよう!アルゴリズム詳細
      └ 因果木の分岐ルール(予測誤差ではなく、処置効果の異質性を最大化), Honest-splittingの役割(構造決定と推定の分離), 近傍(neighborhood)の重み付けとCATE推定
    • 第56.2回:S56.2:ただの予測じゃない!信頼できる推論のための理論的背景
      └ GRFの理論的保証, CATE推定値の信頼区間を計算する方法, 中心化(centering)の役割, 統計的仮説検定への応用(e.g., ATE=0, HTE=0)
    • 第56.3回:S56.3:因果フォレストを使いこなす!チューニングと解釈のコツ
      └ 主要ハイパーパラメータ(min.node.size, mtry), 傾向スコアの推定( W.hat ), アウトカムモデルの推定( Y.hat )の重要性, double centeringの解釈, 異質性変数の重要度プロット
  • 第57回:S57:リアルワールドデータの切り札!自分自身と比べる自己対照デザイン
    └ 自己対照ケースシリーズ(self-controlled case series; SCCS), ケースクロスオーバーデザイン, シーケンス対称性分析(sequence symmetry analysis; SSA), 時間依存交絡への頑健性, 新規使用者デザイン(New-user design)とactive comparatorによる選択バイアス・健康使用者バイアスの軽減, リスクウィンドウ(risk window)設定の重要性と感度分析, 不死時間バイアス(immortal time bias), 感受性低下(depletion of susceptibles)
    • 第57.1回:S57.1:万能ではない!自己対照デザインの仮定と限界
      └ SCCSの仮定(イベント発生が将来の曝露に影響しない), イベント依存の打ち切り, リスク期間外でのイベント発生率一定の仮定, 適用可能なアウトカム(急性イベント)とそうでないもの
    • 第57.2回:S57.2:誰と比べるかが重要!コホート研究におけるバイアスとの戦い
      └ 新規使用者vs有病者(prevalent user)デザイン, レングスバイアス, 健康使用者バイアス, 交絡 by indication, Active comparator/Negative controlの賢い選び方
    • 第57.3回:S57.3:時間のマジックに騙されるな!不死時間バイアスとその対処法
      └ immortal time biasの発生パターン(e.g., 曝露定義の誤り), タイムゼロの厳密な定義, time-on-treatment分析, クローニングによる対処法
  • 第58回:S58:データはいつも完璧じゃない!欠測データと上手に付き合う方法
    └ 欠測メカニズム(MCAR, MAR, MNAR)の分類と仮定, 完全ケース分析(complete-case analysis)のバイアス, 多重代入法(Multiple Imputation by Chained Equations; MICE), MICEの3ステップ(imputation, analysis, pooling), Rubinのルール, 欠測変数の予測モデル構築, 逆確率重み付け(IPW), MNARに対する感度分析, selection model, パターンミクスチャモデル(pattern-mixture model)
    • 第58.1回:S58.1:失われたデータを復元!多重代入(MICE)実践ガイド
      └ 連鎖方程式の仕組み, 代入モデルの指定(PMM, logreg, polyreg), 収束診断(トレースプロット), 代入回数(m)の決定, パッシブ代入, Rubinのルールによる統合
    • 第58.2回:S58.2:重み付けで解決!IPCW/IPMWアプローチ
      └ Inverse Probability of Censoring/Missingness Weighting, 欠測傾向スコアの推定, 重みの安定化とトリミング, 多重代入法との比較
    • 第58.3回:S58.3:「わからない」とどう向き合う?MNARという未知との遭遇
      └ 識別不可能な問題, 選択モデルとパターンミクスチャモデルの仮定の違い, tipping-point analysis, 欠測メカニズムのパラメータを変化させた感度分析の重要性
  • 第59回:S59:因果推論の「哲学」と「技術」:識別と推定を区別しよう
    └ 因果推論の2ステップ, 識別(Identification): 因果効果が観測データから原理的に計算可能かという問い(仮定ベース), 推定(Estimation): 識別された量を有限データからどう計算するかという問い(統計手法ベース), 識別可能性のための仮定(交換可能性, ポジティビティ等), 感度分析(sensitivity analysis)による仮定の頑健性チェック, E-value, 頑健性チェック(robustness check)による推定手法の安定性評価, 操作変数法における過剰識別検定(overidentification test)
    • 第59.1回:S59.1:因果関係を見つけ出す!識別戦略ツールボックス
      └ バックドア基準, フロントドア基準, 操作変数(IV), 回帰不連続(RD), 差分の差分(DiD), これらがどのように未測定交絡を乗り越え、因果効果を識別可能にするかの理論的整理
    • 第59.2回:S59.2:数字に変換する技術!推定量とその性質
      └ 一致性(consistency), 不偏性(unbiasedness), 有効性(efficiency), 推定量の漸近分布と大標本理論, 頑健な標準誤差(sandwich estimator), ブートストラップ
    • 第59.3回:S59.3:結果の信頼性を高める!感度分析と頑健性チェック
      └ 感度分析:識別仮定(e.g., 未測定交絡)がどの程度破られたら結論が覆るか(E-value, Rosenbaum bounds), 頑健性チェック:推定方法(e.g., 異なるMLモデル、異なる共変量セット)を変えても結果が安定しているか

第VI部:因果構造の発見 (S60–S69)


ID タイトル 概要・キーワード
S60 第60回:データから因果の地図を描く!因果発見への招待状 因果発見, 構造学習, DAG, 仮説生成
S60.1 因果推論(仮説検証型) vs 因果発見(仮説生成型), 応用分野(ゲノム科学, 社会科学)
S60.2 制約ベース, スコアベース, 関数型因果モデル, 長所と短所
S61 第61回:因果グラフを読み解くルールブック:マルコフ条件と忠実性 Causal Markov condition, faithfulness, d分離, conditional independence
S61.1 ローカルマルコフ性, DAGが持つ統計的独立性, 親・子・非子孫の関係
S61.2 独立性は因果構造に由来するという仮定, 忠実性が破れる例(打ち消し合い)
S61.3 d分離の3つのルール(チェーン, フォーク, コライダー), グラフィカルな独立性判定
S62 第62回:同じデータでも複数の「正解」が?マルコフ同値の不思議 Markov equivalence class, CPDAG, v-structure, d-separation
S62.1 異なるDAGが同じ条件付き独立性を持つ, 観測データからの識別限界
S62.2 X -> Y <- Z, 選択バイアス, 矢印の向き特定の唯一の手がかり
S62.3 Completed Partially Directed Acyclic Graph, 向きが決まる辺と決まらない辺
S63 第63回:「この繋がりは本物?」制約ベースの因果発見アプローチ PCアルゴリズム, 条件付き独立性検定, スケルトン推定, 向き付けルール
S63.1 完全グラフから辺を削除していくプロセス, 条件付き独立性検定
S63.2 v-structure特定, Meekのルールによる矛盾のない向き付け
S64 第64回:PCアルゴリズムを動かしてみよう!実装と実践のコツ g-square test, Fisher’s Z test, pcalg, Tetrad, 実装上の注意
S64.1 カイ二乗検定, G検定, FisherのZ変換, ノンパラメトリック検定
S64.2 R(`pcalg`), Python(`causallearn`), GUI(`Tetrad`), 実行例
S64.3 有意水準αの選択, 多重検定問題, 検出力不足, 高次元データ
S65 第65回:一番フィットするグラフはどれ?スコアベースの因果発見 スコア関数(AIC, BIC, BDeu), 探索アルゴリズム, ヒルクライミング
S65.1 適合度と複雑さのトレードオフ, BIC/AIC, ベイズ的アプローチ(BDeu)
S65.2 ヒルクライミング, 局所最適解, ランダムリスタート
S66 第66回:賢く探索する!GESアルゴリズムのスマートな戦略 GES, greedy equivalence search, computational complexity
S66.1 マルコフ同値クラス空間の探索, 前向き探索・後ろ向き探索
S67 第67回:非ガウスデータが鍵?LiNGAMモデルで矢印の向きを決める LiNGAM, ICA, 非ガウス性, 独立成分分析
S67.1 データ生成過程に関数形を仮定, 同値クラスの解消
S67.2 非ガウス性誤差項の仮定, ICAによる識別
S68 第68回:因果発見は万能じゃない!その限界と注意点 サンプルサイズ, スケーラビリティ, 未測定交絡, 測定誤差
S68.1 検定力不足, 弱い因果関係の見逃し, パラメータ依存
S68.2 Causal Sufficiency, 未測定交絡リスク, FCIアルゴリズム
S68.3 測定誤差, 選択バイアス, Acyclic仮定の限界(フィードバック)
S68.4 Mendelian Randomization, 遺伝子バリアント, 操作変数
S68.4.1 遺伝子型をIVとして利用, IVの3つのコア仮定
S68.4.2 Pleiotropy, MR-Egger回帰, 頑健性チェック
S69 第69回:「真実」の発見器ではなく、「仮説」の生成器として使う 探索的分析, 実験計画, ドメイン知識との融合
S69.1 plausible な因果関係のリストアップ, 未知の関連性の発見
S69.2 ドメイン知識に基づく制約, 人間とAIの協働
S69.3 A/Bテスト計画, 介入戦略の立案
S60-69 第VI部:因果構造の発見 (S60–S69)
データから因果の地図を描く (S60) 因果発見 vs 因果推論 / 3つのアプローチ DAG探索・仮説生成・構造学習 因果グラフのルールブック (S61) 📌 マルコフ条件:親を知れば子は独立 📌 忠実性:データは構造を反映する 📌 d分離:情報の流れをグラフィカルに判定 識別の限界と等価性 (S62) 🧪 マルコフ同値クラス:区別できないDAG ⚡ v-structure (コライダー):向き決定の鍵 🗺️ CPDAG:未確定の辺を含む要約グラフ 3つのアプローチ 制約ベース探索 (S63) PCアルゴリズム ・条件付き独立性検定 ・スケルトン探索→向き付け 実装と検定 (S64) pcalg / Tetrad ・離散:G検定 / カイ二乗 ・連続:Fisher’s Z (偏相関) ⚠️ 多重検定・計算量の壁 スコアベース探索 (S65) 最適化問題として解く ・スコア:BIC / AIC / BDeu ・探索:ヒルクライミング 効率的な探索 (S66) GESアルゴリズム ・Greedy Equivalence Search ・同値クラス空間を探索 ・局所解回避と一貫性 関数モデル (S67) LiNGAM ・非ガウス性 × 線形モデル ・ICA(独立成分分析) ✨ 矢印の向きを一意に特定 (同値クラスの解消) 因果発見の壁と拡張 (S68) ⚠️ 主な課題 ・未測定交絡因子(隠れた共通原因) ・サンプルサイズ不足と検出力 ・選択バイアスと測定誤差 🧬 メンデルランダム化 (MR) ・遺伝子バリアントを操作変数(IV)に ・交絡の影響を受けずに因果を推定 ・Pleiotropy(多面発現)への対処 結論:仮説生成エンジンとしての活用 (S69) 「真実」の発見ではなく、有望な「候補」のリストアップ ドメイン知識との融合 ➡ 実験計画・介入へ
  • 第60回:S60:データから因果の地図を描く!因果発見への招待状
    └ 因果発見, 構造学習, DAG, 仮説生成
    • 第60.1回:S60.1:「効果を見る」から「構造を探る」へ!因果推論との違い
      └ 因果推論(仮説検証型)vs 因果発見(仮説生成型), 既知のDAG vs 未知のDAG, なぜ構造を知りたいのか?, 応用分野(ゲノム科学, 経済学, 社会科学)
    • 第60.2回:S60.2:因果発見の3つのアプローチ:制約・スコア・関数モデル
      └ 制約ベース(Conditional Independenceベース), スコアベース(最適化問題として解く), 関数型因果モデル(データ生成過程の形を仮定), それぞれの長所と短所
  • 第61回:S61:因果グラフを読み解くルールブック:マルコフ条件と忠実性
    └ Causal Markov condition, faithfulness, d分離, conditional independence
    • 第61.1回:S61.1:親を見れば子はわかる?因果的マルコフ条件
      └ ローカルマルコフ性, DAGが持つ統計的独立性の構造, 「親ノードが与えられれば、その子は非子孫ノードから独立する」という直観
    • 第61.2回:S61.2:データはウソをつかない?忠実性という重要な約束
      └ データに現れる独立性は、すべて因果構造に由来するという仮定, 忠実性が破れる例(効果の打ち消し合い), なぜこの仮定が必要なのか
    • 第61.3回:S61.3:情報の流れを断ち切る!d分離で独立性を判定する
      └ d分離(d-separation)の3つのルール(チェーン, フォーク, 合流点/コライダー), DAGから条件付き独立性を読み解くためのグラフィカルな手法
  • 第62回:S62:同じデータでも複数の「正解」が?マルコフ同値の不思議
    └ Markov equivalence class, CPDAG, v-structure, d-separation
    • 第62.1回:S62.1:観測だけでは区別できない因果グラフたち:マルコフ同値クラス
      └ 異なるDAGが同じ条件付き独立性の集合を意味する, 観測データから一意にDAGを決められない限界, スケルトンとv-structureの重要性
    • 第62.2回:S62.2:矢印の向きを決めるカギ!v-structure(コライダー)
      └ X -> Y <- Z, 共通の結果を持つ構造, 条件付けによって独立でなくなる(選択バイアス), 矢印の向きを特定するための唯一の手がかり
    • 第62.3回:S62.3:白黒つけられない関係を示す地図:CPDAG
      └ Completed Partially Directed Acyclic Graph, 同値クラスを表現するグラフ, 向きが決まる辺(強制的)と決まらない辺(可逆的)
  • 第63回:S63:「この繋がりは本物?」制約ベースの因果発見アプローチ
    └ PCアルゴリズム, 条件付き独立性検定, スケルトン推定, 向き付けルール
    • 第63.1回:S63.1:PCアルゴリズムの探偵術(1):骨格(スケルトン)を見つける
      └ 完全グラフからスタート, 条件付き独立性検定を繰り返し、独立な変数間の辺を削除していくプロセス, 検定の順序(0次、1次、…)
    • 第63.2回:S63.2:PCアルゴリズムの探偵術(2):矢印の向きを決める
      └ 骨格からv-structureを特定, Meekのルールを用いて、矛盾が生じないように他の辺の向きを可能な限り決定していくプロセス
  • 第64回:S64:PCアルゴリズムを動かしてみよう!実装と実践のコツ
    └ g-square test, Fisher’s Z test, pcalg, Tetrad, 実装上の注意
    • 第64.1回:S64.1:武器を選ぶ!どの条件付き独立性検定を使うか?
      └ 離散データのためのカイ二乗検定・G検定, 連続データのためのFisherのZ変換(偏相関検定), ノンパラメトリックな検定手法
    • 第64.2回:S64.2:PythonとRで因果発見!ライブラリを使ってみる
      └ Rの`pcalg`パッケージ, Pythonの`causallearn`, GUIツール`Tetrad`の紹介, 基本的なコードと実行例
    • 第64.3回:S64.3:実践上の落とし穴:頑健な結果を得るための注意点
      └ 有意水準αの選択問題, 多重検定問題, 検定の検出力不足, 高次元データでの計算量, 結果の不安定性
  • 第65回:S65:一番フィットするグラフはどれ?スコアベースの因果発見
    └ スコア関数(AIC, BIC, BDeu), 探索アルゴリズム, ヒルクライミング, 探索空間
    • 第65.1回:S65.1:グラフに「成績」をつける!スコア関数の役割
      └ データへの適合度とモデルの複雑さのトレードオフ, BIC/AICによるペナルティ付き尤度, ベイズ的アプローチ(BDeuスコア)
    • 第65.2回:S65.2:膨大なグラフ空間を旅する!探索アルゴリズム
      └ 全てのDAGを調べるのは不可能, 貪欲法(Greedy search)としてのヒルクライミング, 局所最適解に陥る問題と対処法(ランダムリスタートなど)
  • 第66回:S66:賢く探索する!GESアルゴリズムのスマートな戦略
    └ GES, greedy equivalence search, computational complexity, 実装
    • 第66.1回:S66.1:GESアルゴリズムの仕組み:貪欲な同値クラス探索
      └ 個別のDAGではなく、マルコフ同値クラスの空間を探索する効率性, 前向き探索(辺の追加)と後ろ向き探索(辺の削除)の2段階プロセス
  • 第67回:S67:非ガウスデータが鍵?LiNGAMモデルで矢印の向きを決める
    └ Linear non-Gaussian acyclic model, ICA, 非ガウス性, 独立成分分析
    • 第67.1回:S67.1:独立性の仮定を超える!関数型因果モデル(FCM)
      └ データ生成過程に特定の関数形(例:線形関係)を仮定するアプローチ, なぜ関数形を仮定すると同値クラスを解消できるのか?
    • 第67.2回:S67.2:LiNGAMの魔法:非ガウス性と独立成分分析(ICA)
      └ 誤差項が正規分布に従わない」という仮定の重要性, 観測変数を独立な成分(誤差項)に分解するICAの技術, 全ての矢印の向きを一意に識別
  • 第68回:S68:因果発見は万能じゃない!その限界と注意点
    └ サンプルサイズ, スケーラビリティ, 頑健性, 未測定交絡, 測定誤差
    • 第68.1回:S68.1:統計的な壁:サンプルサイズと検定の信頼性
      └ 十分なサンプルサイズがないと検定が機能しない, 弱い因果関係の見逃し, アルゴリズムのパラメータ選択への敏感さ
    • 第68.2回:S68.2:最大の壁:測定されていない交絡因子(Causal Sufficiencyの仮定)
      └ 「分析に必要な変数は全てデータに含まれている」という強い仮定, 未測定交絡があると構造が完全に見誤るリスク, FCIアルゴリズムなどの対処法
    • 第68.3回:S68.3:その他の課題:測定誤差、選択バイアス、フィードバックループ
      └ 変数の測定誤差による影響, 選択バイアスがコライダーのように振る舞う問題, 非巡回(Acyclic)仮定の限界(フィードバックループの存在)
    • 第68.4回:S68.4:遺伝子を「操作変数」に!未測定交絡を乗り越えるメンデルランダム化
      └ Mendelian Randomization, 遺伝子バリアント, 弱いIV, 多重遺伝子, pleiotropy, MR-Egger
      • 第68.4.1回:S68.4.1:生まれつきのランダム化?メンデルランダム化(MR)の基本
        └ 遺伝子型を操作変数(IV)として利用する発想, 交絡に強い因果効果推定, IVの3つのコア仮定(関連性、独立性、除外制約)
      • 第68.4.2回:S68.4.2:MRの落とし穴:水平的多面発現(Pleiotropy)との戦い
        └ 遺伝子が複数の経路でアウトカムに影響する問題, 除外制約の違反, MR-Egger回帰や重み付きメディアン法による頑健性チェック
  • 第69回:S69:「真実」の発見器ではなく、「仮説」の生成器として使う
    └ 探索的分析, 実験計画, ドメイン知識との融合
    • 第69.1回:S69.1:因果発見の賢い使い方:仮説生成エンジンとして
      └ 「唯一の正しい答え」を求めない, データが示唆する plausible な因果関係のリストアップ, 未知の関連性の発見
    • 第69.2回:S69.2:専門家の知識とデータを融合させる
      └ ドメイン知識(先行研究や理論)に基づいて辺を制約(禁止・強制), 結果の妥当性を専門家が評価するプロセス, 人間とAIの協働
    • 第69.3回:S69.3:次のアクションへ繋げる:実験計画と介入戦略
      └ 発見された因果仮説を検証するためのA/Bテストや実験を計画, 介入効果が大きいと予測される変数の特定

第VII部:深層学習と因果推論 (S70–S79)


ID タイトル 概要・キーワード
S70 第70回:AIは「なぜ」を理解できるか?深層学習と因果推論の出会い 高次元データ, 非構造化データ, 画像, テキスト
S70.1 従来の統計手法の限界, 複雑な非線形関係のモデリング, 表現学習の力
S70.2 エンコーディング, CNN/RNN/Transformerの活用, マルチモーダルデータ
S70.3 傾向スコアや条件付きアウトカムの推定, Double ML, DR-Learner
S71 第71回:データの本質を捉える技術:表現学習の基礎 Autoencoder, VAE, GAN, representation learning
S71.1 エンコーダとデコーダ, 情報のボトルネック, 次元削減, Denoising Autoencoder
S71.2 変分オートエンコーダ, 潜在変数の分布学習, ELBO(エビデンス下界)
S71.3 生成器(Generator)と識別器(Discriminator), ミニマックスゲーム, モード崩壊
S72 第72回:絡み合った要因を解きほぐす!因果表現学習 Causal representation learning, disentanglement, independent causal mechanisms
S72.1 予測に有用な表現 vs 因果的に意味のある表現, ロバストな特徴量
S72.2 潜在空間で意味のある軸を分離, β-VAE, 介入の基盤となる表現
S72.3 因果メカニズムはモジュール的, 互いに独立して変更可能, 再利用性
S73 第73回:未知のデータに適応するAIへ!分布外汎化(OOD)への挑戦 domain adaptation, invariant risk minimization(IRM), robustness
S73.1 i.i.d.仮定の崩壊, 偽りの相関(spurious correlation), 性能劣化
S73.2 Invariant Risk Minimization, 因果関係に紐づく不変な予測器
S74 第74回:「もしも」の世界を生成する!生成モデルと因果推論 causal GAN, causal VAE, counterfactual generation
S74.1 「もし治療を受けていなかったら」の画像生成, GAN/VAE, 反実仮想推論
S74.2 Causal GAN / Causal VAE, SCM(構造的因果モデル)を生成過程に統合
S75 第75回:AIの頭の中で介入実験!潜在空間シミュレーション latent space, intervention, counterfactuals, style transfer
S75.1 低次元の潜在空間, 潜在ベクトルに対する演算とその解釈
S75.2 潜在変数の操作による介入, 画像の属性変更, Style Transfer
S76 第76回:ゲノム解析から個別化医療まで!ヘルスケアへの応用 drug discovery, 個別化医療, 遺伝子データ
S76.1 遺伝子発現データからの薬剤効果予測, 新規化合物生成, 適応発見
S76.2 個人の遺伝子情報に基づいた治療効果(CATE)の予測, 治療法選択支援
S77 第77回:AIは公平か?アルゴリズミック・フェアネスとバイアス fairness, counterfactual fairness, bias quantification, 公平性の指標
S77.1 Statistical Parity, Equal Opportunity, 公平性指標のトレードオフ
S77.2 「もし属性が違っていたら」の反実仮想, 介入によるバイアス除去
S78 第78回:残された課題と未来への展望:因果DLのフロンティア scalability, 理論保証, 時間的データ, 強化学習融合
S78.1 大規模モデル, 計算コスト, 統計学的理論保証とのギャップ, 信頼性
S78.2 時系列・縦断データ, 動的な介入計画, 時間依存交絡因子
S78.3 動的治療計画(DTR), オフポリシー評価, 因果的強化学習
S78.4 disease mapping, CAR/ICAR, Scan statistic, distributed lag models
S79 第79回:AIが真の知性を獲得する日:Causal Deep Learningの最終ビジョン System 2 deep learning, world models, 人間レベルAI
S79.1 深層学習の限界, 因果推論による論理的思考能力の付与
S79.2 環境の因果構造シミュレーション, 計画, 反実仮想, 創造性
S70-79 第VII部:深層学習と因果推論 (S70–S79)
Deep Learning & Causal Inference 第VII部:深層学習と因果推論 (S70–S79) FOUNDATIONS Deep Learning × Causal (S70) 非構造化データの活用 • 画像・テキストからの交絡調整 • 高次元データの表現能力 Representation Learning (S71) データの本質的特徴を抽出 • Autoencoder / VAE (情報圧縮) • GAN (データ生成) CORE LOGIC Causal Representation Learning (S72) Disentanglement 絡み合った要因の分離 🔗 Independent Mechanisms 独立した因果モジュール OOD Generalization (S73) 分布外汎化とロバスト性 環境が変化しても変わらない「不変の因果関係 (Invariant)」の学習 SIMULATION Causal Generative Models (S74) 反実仮想 (Counterfactuals) の生成 「もし治療しなかったら?」を可視化 Causal GAN / Causal VAE Latent Space Simulation (S75) 潜在空間での介入 (Intervention) 低次元空間での `do` 演算 Style Transferによる属性操作 IMPACT Healthcare (S76) 創薬・ゲノム・個別化医療 • 遺伝子データからの効果予測 • 新規化合物生成 Fairness (S77) アルゴリズムの公平性 • Counterfactual Fairness • 属性によるバイアスの除去 FUTURE Frontiers (S78) • 理論保証とスケーラビリティ • 時系列データ・強化学習との融合 The Vision (S79) • System 2 Deep Learning (論理的思考) • World Models (世界モデル) Toward Human-Level AI 🚀
  • 第70回:S70:AIは「なぜ」を理解できるか?深層学習と因果推論の出会い
    └ 高次元データ, 非構造化データ, 画像, テキスト
    • 第70.1回:S70.1:なぜ今、深層学習と因果推論か?
      └ 従来の統計手法の限界, 複雑な非線形関係のモデリング, 表現学習の力, 因果推論に深層学習を用いる動機
    • 第70.2回:S70.2:画像やテキストを「原因」や「交絡」として扱う
      └ 非構造化データを説明変数や交絡因子にするためのエンコーディング, CNN/RNN/Transformerの活用, マルチモーダルデータへの応用
    • 第70.3回:S70.3:深層学習を「部品」として使う:強力なNuisance推定器
      └ 傾向スコアや条件付きアウトカムをニューラルネットで推定, Double MLやDR-Learnerとの組み合わせ, 精度向上と頑健性
  • 第71回:S71:データの本質を捉える技術:表現学習の基礎
    └ Autoencoder, VAE, GAN, representation learning
    • 第71.1回:S71.1:情報を圧縮し復元するオートエンコーダ
      └ エンコーダとデコーダ, 情報のボトルネック, 次元削減と特徴抽出, Denoising Autoencoder
    • 第71.2回:S71.2:データを生成するVAE:潜在空間の確率的モデリング
      └ 変分オートエンコーダ, 潜在変数の分布学習, データの生成と補間, ELBO(エビデンス下界)
    • 第71.3回:S71.3:偽物と本物を見破る競争!敵対的生成ネットワーク(GAN)
      └ 生成器(Generator)と識別器(Discriminator)のミニマックスゲーム, 高品質なデータ生成, 学習の不安定性とモード崩壊
  • 第72回:S72:絡み合った要因を解きほぐす!因果表現学習
    └ Causal representation learning, disentanglement, independent causal mechanisms
    • 第72.1回:S72.1:「良い表現」とは何か?相関から因果的特徴へ
      └ 予測に有用な表現 vs 因果的に意味のある表現, 変化に強いロバストな特徴量の獲得
    • 第72.2回:S72.2:Disentanglement:データ生成の独立した要因を分離する
      └ 潜在空間で意味のある軸(例:顔画像における髪の色、表情)を分離, β-VAE, 介入の基盤となる表現
    • 第72.3回:S72.3:独立因果メカニズム(ICM)の原則
      └ 因果メカニズムはモジュール的で、互いに独立して変更可能であるという仮説, 学習されたメカニズムの再利用性
  • 第73回:S73:未知のデータに適応するAIへ!分布外汎化(OOD)への挑戦
    └ domain adaptation, invariant risk minimization(IRM), robustness
    • 第73.1回:S73.1:学習時と実践時でデータ分布が違う!OOD問題
      └ i.i.d.仮定の崩壊, 偽りの相関(spurious correlation)に騙されるモデル, 病院間差・デバイス差による性能劣化
    • 第73.2回:S73.2:環境が変わっても不変な関係性を見つける:IRM
      └ Invariant Risk Minimization, 複数の環境データから、因果関係に紐づく不変な予測器を学習するアプローチ
  • 第74回:S74:「もしも」の世界を生成する!生成モデルと因果推論
    └ causal GAN, causal VAE, counterfactual generation
    • 第74.1回:S74.1:反実仮想(カウンターファクチュアル)を生成する
      └ 「もし治療を受けていなかったら」の画像を生成, GAN/VAEを用いた反実仮想推論, 観測されていない結果の推定
    • 第74.2回:S74.2:因果グラフを組み込んだ生成モデル
      └ Causal GAN / Causal VAE, SCM(構造的因果モデル)を生成過程に統合, 構造に基づいたデータ生成と介入シミュレーション
  • 第75回:S75:AIの頭の中で介入実験!潜在空間シミュレーション
    └ latent space, intervention, counterfactuals, style transfer
    • 第75.1回:S75.1:意味が凝縮された空間「潜在空間」を操作する
      └ 表現学習によって得られた低次元の潜在空間, 潜在ベクトルに対する演算とその解釈
    • 第75.2回:S75.2:潜在空間での`do`演算:介入効果のシミュレーション
      └ 潜在変数を直接操作することによる介入, 画像の属性変更(例:髪の色を変える)とStyle Transfer
  • 第76回:S76:ゲノム解析から個別化医療まで!ヘルスケアへの応用
    └ drug discovery, 個別化医療, 遺伝子データ
    • 第76.1回:S76.1:創薬とリパーパシングへの応用
      └ 遺伝子発現データからの薬剤効果予測, 新規化合物生成, 既存薬の新たな適応発見
    • 第76.2回:S76.2:ゲノムデータと因果推論による個別化医療
      └ 個人の遺伝子情報に基づいた治療効果(CATE)の予測, 最適な治療法の選択支援
  • 第77回:S77:AIは公平か?アルゴリズミック・フェアネスとバイアス
    └ fairness, counterfactual fairness, bias quantification, 公平性の指標
    • 第77.1回:S77.1:「公平性」の多様な定義とトレードオフ
      └ Statistical Parity, Equal Opportunity, Predictive Parityなど, 複数の公平性指標間の両立不可能性
    • 第77.2回:S77.2:因果推論に基づく公平性:カウンターファクチュアル・フェアネス
      └ 「もし属性(性別、人種など)が違っていたら、予測結果は同じだったか?」, 介入によるバイアスの除去
  • 第78回:S78:残された課題と未来への展望:因果DLのフロンティア
    └ scalability, 理論保証, 時間的データ, 強化学習融合
    • 第78.1回:S78.1:フロンティア(1):スケーラビリティと理論保証
      └ 大規模モデルへの適用, 計算コスト, 伝統的な統計学が持つ理論的保証とのギャップ, 解釈可能性と信頼性
    • 第78.2回:S78.2:フロンティア(2):時間と共に変化する因果関係を捉える
      └ 時系列データ・縦断データへの応用, 動的な介入計画, 時間依存交絡因子への深層学習の適用
    • 第78.3回:S78.3:フロンティア(3):強化学習との融合
      └ 動的治療計画(DTR)の最適化, オフポリシー評価, 因果的強化学習
    • 第78.4回:S78.4:フロンティア(4):空間・環境データへの挑戦
      └ disease mapping, CAR/ICAR, Kulldorff’s scan statistic, distributed lag models
  • 第79回:S79:AIが真の知性を獲得する日:Causal Deep Learningの最終ビジョン
    └ System 2 deep learning, world models, 人間レベルAI
    • 第79.1回:S79.1:直感的な「システム1」から論理的な「システム2」へ
      └ 現在の深層学習の限界(相関ベースのパターン認識), 因果推論による論理的思考能力の付与
    • 第79.2回:S79.2:世界の仕組みを内包する「ワールドモデル」
      └ 環境の因果構造を学習し、内部でシミュレーションする能力, 計画、反実仮想、創造性の基盤

第VIII部:大規模言語モデルと因果性 (S80–S89)


ID タイトル 概要・キーワード
S80 第80回:大規模言語モデル(LLM)は「原因」を理解できるか? LLM, foundation model, scaling law, causal reasoning
S80.1 Transformerアーキテクチャ, 自己注意機構(Self-attention), 大規模データによる事前学習, ファインチューニング
S80.2 パラメータ数・データ量と性能のべき乗則, 創発的能力(emergent abilities), In-context learning
S80.3 テキストデータに潜在する因果知識, 相関からの因果推論の限界, 「オウム」か「理解者」か
S81 第81回:LLMに「考えさせながら」答えさせる技術:Chain-of-Thought CoT, prompt engineering, few-shot, causal QA
S81.1 Zero-shot / Few-shot prompting, 指示チューニング, パラメータ効率的ファインチューニング(PEFT)
S81.2 CoTプロンプティングの仕組み, 中間的な推論ステップを生成させる効果, Self-consistency
S81.3 DAGの構築, 交絡因子の特定, 調整変数の選択などをLLMに解かせる試み, Causal Question Answering
S82 第82回:LLMの因果推論能力を測定する「ものさし」 CausalQA, ベンチマーク, spurious correlation, 評価指標
S82.1 既存ベンチマークの限界, CausalQAデータセット, 偽の相関(spurious correlation)テスト
S83 第83回:LLMの思考回路を覗く:因果的な解釈可能性 interpretability, probing, mechanistic interpretability, knowledge localization
S83.1 モデルの隠れ層の活性値, 特定の情報(例:因果関係)を読み解く線形プローブ
S83.2 モデルのホワイトボックス化, 特定の計算を実行する「回路(circuit)」の特定
S84 第84回:物事の本質を捉える因果的抽象化 causal abstraction, 回路分析, model editing, 知識ニューロン
S84.1 ミクロな物理法則からマクロな心理学的法則まで, 適切な抽象化レベルで因果を捉える
S84.2 ファインチューニングなしでの知識注入・修正, 知識ニューロンの特定
S85 第85回:医療の費用対効果を科学する:医療経済学入門 I QALY, ICER, CEA, CUA, CBA, WTP
S85.1 reliability, validity, Cronbach’s α, IRT, Raschモデル, MCID, QoL尺度
S85.2 質調整生存年(QALY), 効用値(utility weight)の測定方法(TTO, SG, EQ-5D)
S85.3 増分費用効果比(ICER), 費用効果分析(CEA)/費用効用分析(CUA), 支払意思額(WTP)
S86 第86回:未来を予測し最適な意思決定を導く:医療経済学入門 II decision analysis, Markovモデル, microsimulation, PSA
S86.1 意思決定分析, 状態遷移のモデリング, サイクル毎のコストとQALY, 割引率
S86.2 決定的感度分析(トルネードダイアグラム), 確率的感度分析(PSA), 費用効果受容性曲線(CEAC)
S87 第87回:追加情報はいくらの価値があるか?価値の情報分析 EVPI, EVPPI, expected value of information, 不確実性評価
S87.1 追加研究の価値の上限, 意思決定の改善価値評価
S87.2 特定のパラメータ不確実性の解消価値, 研究デザインの最適化
S88 第88回:その結果は信頼できるか?再現可能性の危機と統計的基盤 preregistration, SAP, bootstrap, permutation test, FDR, reproducibility crisis
S88.1 科学の再現性問題, p値の誤用, data dredging, publication bias
S88.2 研究の事前登録(preregistration), 統計解析計画書(SAP), オープンサイエンス
S88.3 ブートストラップ法, 順列検定(permutation test), 多重比較と偽発見率(FDR)制御
S89 第89回:医療AIを取り巻くルールと倫理:規制・標準・法律 PMDA, FDA, EMA, EQUATOR, CONSORT, TRIPOD, APPI, GDPR, HIPAA
S89.1 PMDA(日本), FDA(米国), EMA(欧州)の役割, プログラム医療機器(SaMD)
S89.2 CONSORT, STROBE, TRIPOD, STARD, 研究の透明性を高めるガイドライン
S89.3 CDISC, OMOP CDM, HL7 FHIR, APPI, GDPR, HIPAA
S80-89 第VIII部:大規模言語モデルと因果性 (S80–S89)
  • 第80回:S80:大規模言語モデル(LLM)は「原因」を理解できるか?
    └ LLM, foundation model, scaling law, causal reasoning
    • 第80.1回:S80.1:LLMと基盤モデル:何が新しいのか?
      └ Transformerアーキテクチャ, 自己注意機構(Self-attention), 大規模データによる事前学習, ファインチューニング
    • 第80.2回:S80.2:スケールが知性を生む?スケーリング則の衝撃
      └ パラメータ数・データ量と性能のべき乗則, 創発的能力(emergent abilities), In-context learning
    • 第80.3回:S80.3:LLMは因果を語れるか?その可能性と根本的課題
      └ テキストデータに潜在する因果知識, 相関からの因果推論の限界, 「オウム」か「理解者」か
  • 第81回:S81:LLMに「考えさせながら」答えさせる技術:Chain-of-Thought
    └ CoT, prompt engineering, few-shot, causal QA
    • 第81.1回:S81.1:プロンプトエンジニアリング入門
      └ Zero-shot / Few-shot prompting, 指示チューニング(Instruction Tuning), パラメータ効率的ファインチューニング(PEFT)
    • 第81.2回:S81.2:思考の連鎖(Chain-of-Thought)で推論能力を引き出す
      └ CoTプロンプティングの仕組み, 中間的な推論ステップを生成させる効果, Self-consistency
    • 第81.3回:S81.3:CoTを因果推論へ応用する
      └ DAGの構築, 交絡因子の特定, 調整変数の選択などをLLMに解かせる試み, Causal Question Answering
  • 第82回:S82:LLMの因果推論能力を測定する「ものさし」
    └ CausalQA, ベンチマーク, spurious correlation, 評価指標
    • 第82.1回:S82.1:LLMの因果推論能力評価ベンチマーク
      └ 既存ベンチマークの限界, 因果関係に特化した質問応答データセット(CausalQA), 偽の相関(spurious correlation)に騙されないかのテスト
  • 第83回:S83:LLMの思考回路を覗く:因果的な解釈可能性
    └ interpretability, probing, mechanistic interpretability, knowledge localization
    • 第83.1回:S83.1:プロービング:LLMの内部表現に知識は存在するか?
      └ モデルの隠れ層の活性値から特定の情報(例:因果関係)を読み解く線形プローブ
    • 第83.2回:S83.2:メカニスティック解釈可能性:モデルの動作アルゴリズムを解明する
      └ モデルをホワイトボックス化し、特定の計算を実行する「回路(circuit)」を特定する試み
  • 第84回:S84:物事の本質を捉える因果的抽象化
    └ causal abstraction, 回路分析, model editing, 知識ニューロン
    • 第84.1回:S84.1:因果的抽象化:異なる詳細レベルでの因果モデル
      └ ミクロな物理法則からマクロな心理学的法則まで、適切な抽象化レベルで因果を捉える
    • 第84.2回:S84.2:モデル編集:LLMの知識を直接書き換える
      └ ファインチューニングなしで、特定の知識(例:「AはBの原因である」)をモデルに注入または修正する技術
  • 第85回:S85:医療の費用対効果を科学する:医療経済学入門 I
    └ QALY, ICER, CEA(cost-effectiveness analysis), CUA, CBA, WTP
    • 第85.1回:S85.1:「QOL」や「痛み」をどう測る?心理測定と患者報告アウトカム
      └ reliability, validity, Cronbach’s α, IRT, Raschモデル, MCID, QoL尺度
    • 第85.2回:S85.2:生存期間と生活の質を統合する指標:QALY
      └ 質調整生存年(Quality-Adjusted Life Year), 効用値(utility weight)の測定方法(TTO, SG, EQ-5D)
    • 第85.3回:S85.3:費用対効果の判断基準:ICERと閾値
      └ 増分費用効果比(Incremental Cost-Effectiveness Ratio), 費用効果分析(CEA)/費用効用分析(CUA), 支払意思額(WTP)
  • 第86回:S86:未来を予測し最適な意思決定を導く:医療経済学入門 II
    └ decision analysis, Markovモデル, microsimulation, PSA, probabilistic sensitivity analysis
    • 第86.1回:S86.1:意思決定の地図:デシジョンツリーとマルコフモデル
      └ 意思決定分析, 状態遷移のモデリング, サイクル毎のコストとQALYの計算, 割引率
    • 第86.2回:S86.2:不確実性とどう向き合うか?感度分析の世界
      └ 決定的感度分析(トルネードダイアグラム), 確率的感度分析(Probabilistic Sensitivity Analysis; PSA), 費用効果受容性曲線(CEAC)
  • 第87回:S87:追加情報はいくらの価値があるか?価値の情報分析
    └ EVPI, EVPPI, expected value of information, 不確実性評価
    • 第87.1回:S87.1:完全情報の期待価値(EVPI):不確実性の金銭的価値
      └ 「もし神様が正解を教えてくれたら」意思決定の結果はどれだけ改善するか?, 追加研究の価値の上限
    • 第87.2回:S87.2:部分完全情報の期待価値(EVPPI):どの研究に投資すべきか?
      └ 特定のパラメータの不確実性をなくすことの価値, 研究デザインの最適化
  • 第88回:S88:その結果は信頼できるか?再現可能性の危機と統計的基盤
    └ preregistration, SAP, bootstrap, permutation test, FDR, reproducibility crisis
    • 第88.1回:S88.1:再現可能性の危機とp-hacking
      └ 科学における再現性の問題, p値の誤用, data dredging, publication bias
    • 第88.2回:S88.2:信頼できる科学のための処方箋
      └ 研究の事前登録(preregistration), 統計解析計画書(SAP)の重要性, オープンサイエンス
    • 第88.3回:S88.3:p値を超えて:頑健な統計的推論
      └ ブートストラップ法, 順列検定(permutation test), 多重比較と偽発見率(FDR)の制御
  • 第89回:S89:医療AIを取り巻くルールと倫理:規制・標準・法律
    └ PMDA, FDA, EMA, EQUATOR, CONSORT, TRIPOD, STARD, CDISC, OMOP, FHIR, APPI, GDPR, HIPAA
    • 第89.1回:S89.1:医薬品・医療機器の番人:日米欧の規制当局
      └ PMDA(日本), FDA(米国), EMA(欧州)の役割と審査プロセス, プログラム医療機器(SaMD)
    • 第89.2回:S89.2:研究報告の羅針盤:EQUATORネットワーク
      └ CONSORT(RCT), STROBE(観察研究), TRIPOD(予測モデル), STARD(診断精度), 研究の透明性を高めるためのガイドライン
    • 第89.3回:S89.3:データの標準化とプライバシー保護
      └ CDISC, OMOP CDM, HL7 FHIRによるデータ相互運用性, APPI(個人情報保護法), GDPR, HIPAAによるプライバシー規制
Part VIII: LLM & Causality 大規模言語モデル・医療経済・科学的信頼性 🤖 LLMと因果性 (S80) • スケーリング則 (Scaling Law) • 創発的能力 (Emergent) • In-context Learning • 相関 vs 因果の壁 🧠 Chain-of-Thought (S81) • プロンプトエンジニアリング • Zero-shot / Few-shot • CoTによる因果推論 • DAG構築への応用 📏 因果推論能力の評価 (S82) • CausalQAベンチマーク • 偽の相関 (Spurious) • 頑健性 (Robustness) 検証 🔬 解釈可能性と因果的抽象化 (S83-84) 内部メカニズムの解明 • プロービング / 回路分析 • メカニスティック解釈 知識の抽象化と編集 • モデル編集 (Model Editing) • 知識ニューロンの特定 MEDICAL ECONOMICS & DECISION ⚖️ 医療経済学 I: 基礎評価 (S85) • QALY (質調整生存年) • ICER (増分費用効果比) • 費用対効果分析 (CEA / CUA) • 患者報告アウトカム (PRO) 🌳 医療経済学 II: モデル解析 (S86) • 決定木 / マルコフモデル • 感度分析 (決定論的 / 確率的) • PSA (確率的感度分析) • 不確実性の評価と意思決定 💎 情報の価値分析 (VOI) (S87) • EVPI (完全情報の期待価値) • EVPPI (部分情報の価値) SCIENTIFIC INTEGRITY & RULES 🛡️ 再現性の危機と統計的信頼性 (S88) • p-hacking / データドレッジング • 事前登録とSAP (統計解析計画) • 頑健な統計 (ブートストラップ法等) • FDR (偽発見率) の制御 📜 規制・標準・倫理 (S89) • 規制当局: PMDA / FDA / EMA • 報告ガイドライン (CONSORT等) • データ標準 (CDISC / FHIR / OMOP) • プライバシー規制 (GDPR / APPI)

第IX部:叡智の統合:理論の礎から社会実装の最前線へ (S90–S99)


ID タイトル 概要・キーワード
S90 第90回:なぜ「原因」を問うのか?因果推論の思想と歴史的源流 因果推論の哲学, Humeの懐疑論, counterfactuals, interventionism, Fisherのランダム化, Neymanの潜在アウトカム, Pearlの構造モデル
S90.1 R.A. Fisherのランダム化実験, J. Neymanの信頼区間と潜在アウトカムモデル, 両者の思想的対立
S90.2 Pearlの構造的因果モデル(SCM)・DAG, Rubinの潜在アウトカムモデル, 方法論的な違いと共通点
S91 第91回:研究の設計図を描く:サンプルサイズと検出力分析の実践 サンプルサイズ, 効果量, 検出力, 有意水準, 第2種の過誤, 群逐次デザイン, 中間解析
S91.1 傾向スコア分析後の有効サンプルサイズ(ESS), 打ち切り・欠測考慮, シミュレーション(G*Power)
S92 第92回:「偶然の発見」に騙されないために:多重性の制御と統計的頑健性 多重比較, FWER, FDR, Bonferroni, Holm, Benjamini-Hochberg, ブートストラップ
S92.1 複数エンドポイント, 中間解析におけるα消費, 階層的検定(hierarchical testing)
S93 第93回:臨床試験の解釈を深化させるEstimandと非劣性試験 非劣性試験, Estimand(推定対象), ICH E9(R1), Intercurrent Events, ITT/Per Protocol
S94 第94回:複雑なイベントの軌跡を追う:アドバンスド生存時間分析 競合リスク(Fine-Gray), 多状態モデル, フレイルティモデル, ジョイントモデリング(縦断+生存)
S95 第95回:AIによる逐次最適化:因果推論と強化学習の融合 動的治療計画(DTRs), SMART, オフポリシー評価, Q-learning, A-learning
S95.1 不完全情報下の最適方策, 診断と治療の同時最適化, 深層強化学習(MuZero等)
S96 第96回:エビデンスの統合と評価:メタ解析と予測モデルバリデーション ネットワークメタ解析(NMA), TRIPOD/PROBAST, 決定曲線分析(DCA), Net Benefit
S97 第97回:高次元バイオメディカルデータへの挑戦 オミクス解析, メンデルランダム化(MR), Causal NLP, Causal Computer Vision
S97.1 高次元変数選択, 遺伝子-環境相互作用, エピジェネティクス, 複雑な遺伝交絡
S97.2 臨床テキスト・画像のバイアス除去, 反実仮想生成, 説明可能性向上
S98 第98回:研究から社会へ:実装科学・医療倫理・健康公平性 実装科学, Health equity, SDOH, 分配的正義, AIの説明責任
S98.1 Counterfactual fairness, 社会的背景(SDOH)考慮, AIと健康格差
S98.2 AIの責任所在, 医療従事者の自律性, インフォームドコンセント
S99 第99回:Capstone:実データで辿る医療データサイエンスの全行程 データエンジニアリング, MLOps, NDB/DPC, OMOP/FHIR, 統合ケーススタディ
S99.1 データパイプライン, バージョン管理(DVC), Docker, CI/CD, 監視
S99.2 NDB, DPC, レセプト, 電子カルテ構造, OMOP CDM変換
S99.3 Clinical Question設定, Target Trial Emulation, 解析, 解釈, 社会発信シミュレーション
S90-99 第IX部:叡智の統合:理論の礎から社会実装の最前線へ (S90–S99)
  • 第90回:S90:なぜ「原因」を問うのか?因果推論の思想と歴史的源流
    └ 因果推論の哲学, Humeの懐疑論, counterfactuals, interventionism, Fisherのランダム化, Neymanの潜在アウトカム, Pearlの構造モデル, RubinとPearlの論争
    • 第90.1回:S90.1:近代統計学の父フィッシャー vs ネイマン:二つの潮流の誕生
      └ R.A. Fisherのランダム化実験と仮説検定, J. Neymanの信頼区間と潜在アウトカムモデル(Neyman-Rubinモデル)の原型, 両者の思想的対立と現代への影響
    • 第90.2回:S90.2:ジュディア・パール vs ドナルド・ルービン:現代因果推論の論争
      └ Pearlの構造的因果モデル(SCM)・DAGと、Rubinの潜在アウトカムモデルの思想的・方法論的な違いと共通点, 哲学的背景とどちらのフレームワークをいつ使うべきか
  • 第91回:S91:研究の設計図を描く:サンプルサイズと検出力分析の実践
    └ サンプルサイズ, 効果量(effect size), 検出力(power), 有意水準(α), 第2種の過誤(β), Cox回帰の事象数, 非劣性・同等性試験の設計, 群逐次デザイン, 中間解析, DSMB
    • 第91.1回:S91.1:観察研究におけるサンプルサイズ設計の特有な課題
      └ 傾向スコア分析後の有効サンプルサイズ(ESS), 打ち切りや欠測を考慮した設計, シミュレーションに基づく検出力計算(G*Power, PASS)
  • 第92回:S92:「偶然の発見」に騙されないために:多重性の制御と統計的頑健性
    └ 多重比較, 家族内誤差率(FWER), 偽発見率(FDR), Bonferroni, Holm, Benjamini-Hochberg, 順序検定(gatekeeping), p値を超えて(ブートストラップ, 順列検定)
    • 第92.1回:S92.1:臨床試験における多重性の戦略的制御
      └ 複数のエンドポイント、サブグループ解析、中間解析におけるα消費, 階層的検定(hierarchical testing), 臨床的意義に基づいた戦略
  • 第93回:S93:臨床試験の解釈を深化させるEstimandと非劣性試験
    └ 非劣性試験(non-inferiority), 同等性試験(equivalence), マージン設定, ITT/Per Protocol, Estimand(推定対象), ICH E9(R1), Intercurrent Events, 治療戦略, CONSORT
  • 第94回:S94:複雑なイベントの軌跡を追う:アドバンスド生存時間分析
    └ 競合リスク(Fine-Gray), 多状態モデル(illness-death), 再発事象(Andersen-Gill), フレイルティモデル, ジョイントモデリング(縦断データ+生存), 動的予測
  • 第95回:S95:AIによる逐次最適化:因果推論と強化学習の融合
    └ 動的治療計画(DTRs), 逐次多重割り付けランダム化試験(SMART), オフポリシー評価(Off-Policy Evaluation), Q-learning, A-learning, 医療現場での逐次意思決定(ICU管理など)
    • 第95.1回:S95.1:部分観測マルコフ決定過程(POMDP)と医療応用
      └ 不完全な情報下での最適方策の学習, 診断と治療の同時最適化, 最新の深層強化学習モデル(MuZero等)の展望
  • 第96回:S96:エビデンスの統合と評価:メタ解析と予測モデルバリデーション
    └ ネットワークメタ解析(NMA), 診断精度メタ解析(DTA), TRIPOD/PROBAST声明, 内部・外部妥当性評価, 決定曲線分析(DCA), Net Benefit
  • 第97回:S97:高次元バイオメディカルデータへの挑戦
    └ オミクス解析(ゲノム・プロテオーム), マルチモーダル時系列, メンデルランダム化(MR)の応用と限界, Causal NLP, Causal Computer Vision
    • 第97.1回:S97.1:オミクスデータと因果推論
      └ 高次元変数選択, 遺伝子-環境相互作用, エピジェネティクス, 複雑な遺伝交絡を伴うMR
    • 第97.2回:S97.2:Causal NLP/CV:テキスト・画像データからバイアスを除去する
      └ 臨床テキストや医療画像に含まれる潜在的バイアスの特定と除去, 反実仮想生成による説明可能性の向上
  • 第98回:S98:研究から社会へ:実装科学・医療倫理・健康公平性
    └ 実装科学, evidence-to-policy gap, Health equity, Social determinants of health(SDOH), 分配的正義, AIの説明責任, 法的責任
    • 第98.1回:S98.1:健康格差とアルゴリズムの公平性
      └ Counterfactual fairnessの実装, 社会的背景(SDOH)を考慮したモデル構築, AIが健康格差を助長しないための戦略
    • 第98.2回:S98.2:医療AIの倫理・法・社会的課題(ELSI)
      └ AIによる診断・治療方針決定の責任の所在, 医療従事者の自律性との関係, 患者への説明と同意
  • 第99回:S99:Capstone:実データで辿る医療データサイエンスの全行程
    └ データエンジニアリング, MLOps, NDB/DPC/レセプトデータ, OMOP/FHIR, 統合ケーススタディ
    • 第99.1回:S99.1:モデルを実世界で動かす:データエンジニアリングとMLOps
      └ データパイプライン構築, モデルのバージョン管理(Git/DVC), コンテナ化(Docker), CI/CD, 本番環境でのモデル監視と再学習
    • 第99.2回:S99.2:日本のリアルワールドデータ実践ナビ
      └ NDB, DPC, レセプト, 電子カルテデータの構造と特有の課題(欠測、符号化、検査データ統合の難しさ), OMOP CDMへの変換
    • 第99.3回:S99.3:統合ケーススタディ:構想から論文発表・政策提言まで
      └ 臨床的疑問(Clinical Question)の設定から、Target Trial Emulationによる研究計画、データハンドリング、解析、そして結果の解釈と社会への発信までをシミュレーション
叡智の統合:理論から実装へ 第IX部:S90–S99 哲学と歴史 因果推論の思想と歴史的源流 (S90) Fisher vs Neyman ランダム化検定 vs 潜在アウトカム ⚔️ Pearl vs Rubin 構造的因果モデル(SCM) vs PO なぜ「原因」を問うのか? 研究デザイン サンプルサイズと検出力 (S91) • 効果量・検出力・有意水準 • 群逐次デザインと中間解析 多重性の制御 (S92) • 偶然の発見に騙されない (FDR) • 階層的検定とゲートキーピング Estimandと非劣性試験 (S93) • 何を推定するか? (ICH E9 R1) • 非劣性マージンとITT/PP解析 発展的な生存時間分析 (S94) • 複雑なイベント軌跡を追う • 競合リスク、再発、多状態モデル フロンティア 因果強化学習 (S95) 🤖 動的治療計画 (DTRs) AIによる逐次最適化 高次元・オミクス (S97) 🧬 ゲノム・マルチモーダル バイアスの除去 エビデンスの統合 (S96) メタ解析 (NMA, DTA) 予測モデル検証 (TRIPOD, PROBAST) 社会実装 実装科学と倫理・公平性 (S98) 研究から社会へ:Evidence-to-Policy Gap 健康公平性・AIの法的責任 (ELSI) 統合演習:リアルワールドデータサイエンス (S99) MLOps & DE パイプライン・Docker 日本のRWD NDB/DPC/レセプト 政策提言

ご利用規約(免責事項)

当サイト(以下「本サイト」といいます)をご利用になる前に、本ご利用規約(以下「本規約」といいます)をよくお読みください。本サイトを利用された時点で、利用者は本規約の全ての条項に同意したものとみなします。

第1条(目的と情報の性質)

  1. 本サイトは、医療分野におけるAI技術に関する一般的な情報提供および技術的な学習機会の提供を唯一の目的とします。
  2. 本サイトで提供されるすべてのコンテンツ(文章、図表、コード、データセットの紹介等を含みますが、これらに限定されません)は、一般的な学習参考用であり、いかなる場合も医学的な助言、診断、治療、またはこれらに準ずる行為(以下「医行為等」といいます)を提供するものではありません。
  3. 本サイトのコンテンツは、特定の製品、技術、または治療法の有効性、安全性を保証、推奨、または広告・販売促進するものではありません。紹介する技術には研究開発段階のものが含まれており、その臨床応用には、さらなる研究と国内外の規制当局による正式な承認が別途必要です。
  4. 本サイトは、情報提供を目的としたものであり、特定の治療法を推奨するものではありません。健康に関するご懸念やご相談は、必ず専門の医療機関にご相談ください。

第2条(法令等の遵守)
利用者は、本サイトの利用にあたり、医師法、医薬品、医療機器等の品質、有効性及び安全性の確保等に関する法律(薬機法)、個人情報の保護に関する法律、医療法、医療広告ガイドライン、その他関連する国内外の全ての法令、条例、規則、および各省庁・学会等が定める最新のガイドライン等を、自らの責任において遵守するものとします。これらの適用判断についても、利用者が自ら関係各所に確認するものとし、本サイトは一切の責任を負いません。

第3条(医療行為における責任)

  1. 本サイトで紹介するAI技術・手法は、あくまで研究段階の技術的解説であり、実際の臨床現場での診断・治療を代替、補助、または推奨するものでは一切ありません。
  2. 医行為等に関する最終的な判断、決定、およびそれに伴う一切の責任は、必ず法律上その資格を認められた医療専門家(医師、歯科医師等)が負うものとします。AIによる出力を、資格を有する専門家による独立した検証および判断を経ずに利用することを固く禁じます。
  3. 本サイトの情報に基づくいかなる行為によって利用者または第三者に損害が生じた場合も、本サイト運営者は一切の責任を負いません。実際の臨床判断に際しては、必ず担当の医療専門家にご相談ください。本サイトの利用によって、利用者と本サイト運営者の間に、医師と患者の関係、またはその他いかなる専門的な関係も成立するものではありません。

第4条(情報の正確性・完全性・有用性)

  1. 本サイトは、掲載する情報(数値、事例、ソースコード、ライブラリのバージョン等)の正確性、完全性、網羅性、有用性、特定目的への適合性、その他一切の事項について、何ら保証するものではありません。
  2. 掲載情報は執筆時点のものであり、予告なく変更または削除されることがあります。また、技術の進展、ライブラリの更新等により、情報は古くなる可能性があります。利用者は、必ず自身で公式ドキュメント等の最新情報を確認し、自らの責任で情報を利用するものとします。

第5条(AI生成コンテンツに関する注意事項)
本サイトのコンテンツには、AIによる提案を基に作成された部分が含まれる場合がありますが、公開にあたっては人間による監修・編集を経ています。利用者が生成AI等を用いる際は、ハルシネーション(事実に基づかない情報の生成)やバイアスのリスクが内在することを十分に理解し、その出力を鵜呑みにすることなく、必ず専門家による検証を行うものとします。

第6条(知的財産権)

  1. 本サイトを構成するすべてのコンテンツに関する著作権、商標権、その他一切の知的財産権は、本サイト運営者または正当な権利を有する第三者に帰属します。
  2. 本サイトのコンテンツを引用、転載、複製、改変、その他の二次利用を行う場合は、著作権法その他関連法規を遵守し、必ず出典を明記するとともに、権利者の許諾を得るなど、適切な手続きを自らの責任で行うものとします。

第7条(プライバシー・倫理)
本サイトで紹介または言及されるデータセット等を利用する場合、利用者は当該データセットに付随するライセンス条件および研究倫理指針を厳格に遵守し、個人情報の匿名化や同意取得の確認など、適用される法規制に基づき必要とされるすべての措置を、自らの責任において講じるものとします。

第8条(利用環境)
本サイトで紹介するソースコードやライブラリは、執筆時点で特定のバージョンおよび実行環境(OS、ハードウェア、依存パッケージ等)を前提としています。利用者の環境における動作を保証するものではなく、互換性の問題等に起因するいかなる不利益・損害についても、本サイト運営者は責任を負いません。

第9条(免責事項)

  1. 本サイト運営者は、利用者が本サイトを利用したこと、または利用できなかったことによって生じる一切の損害(直接損害、間接損害、付随的損害、特別損害、懲罰的損害、逸失利益、データの消失、プログラムの毀損等を含みますが、これらに限定されません)について、その原因の如何を問わず、一切の法的責任を負わないものとします。
  2. 本サイトの利用は、学習および研究目的に限定されるものとし、それ以外の目的での利用はご遠慮ください。
  3. 本サイトの利用に関連して、利用者と第三者との間で紛争が生じた場合、利用者は自らの費用と責任においてこれを解決するものとし、本サイト運営者に一切の迷惑または損害を与えないものとします。
  4. 本サイト運営者は、いつでも予告なく本サイトの運営を中断、中止、または内容を変更できるものとし、これによって利用者に生じたいかなる損害についても責任を負いません。

第10条(規約の変更)
本サイト運営者は、必要と判断した場合、利用者の承諾を得ることなく、いつでも本規約を変更することができます。変更後の規約は、本サイト上に掲載された時点で効力を生じるものとし、利用者は変更後の規約に拘束されるものとします。

第11条(準拠法および合意管轄)
本規約の解釈にあたっては、日本法を準拠法とします。本サイトの利用および本規約に関連して生じる一切の紛争については、東京地方裁判所を第一審の専属的合意管轄裁判所とします。


For J³, may joy follow you.

目次