[Math for Medical AI: M2.1] 線形代数の第一歩:スカラー、ベクトル、行列でデータをかたどる

線形代数の基本:データの「かたち」

AIを支える数学「線形代数」の基本は、スカラー・ベクトル・行列という3つのデータの「かたち」を理解することから始まります。これらが何を表し、どう違うのかを直感的なイメージで掴みましょう。

スカラー (Scalar)
0次元:点としての情報

大きさだけを持つ単一の数値です。「体温: 37.5℃」のように、それ自体で完結する最小のデータ単位で、AIが扱う情報の「レンガ」にあたります。

ベクトル (Vector)
1次元:プロフィールとしての情報

複数の数値を順序よく並べたリストです。「[年齢, 身長, 体重]」のように、1つの対象に関する多面的な情報をまとめた「プロフィール」を表現します。

行列 (Matrix)
2次元:データセットとしての情報

ベクトルをさらに集め、縦横に並べた表形式のデータです。患者名簿やレントゲン画像のように、複数の対象の情報を一度に扱う「データセット」そのものです。

データの階層構造イメージ
データ構造の基本要素 スカラーから行列へ:AI・機械学習で使われるデータの形 スカラー (Scalar) 37.5 ・次元を持たない単一の数値 ・大きさだけを持つ、情報の  最小単位。 ・0次元のデータ。 医療データの例 ある瞬間の体温、 特定の検査結果(血糖値など)。 ベクトル (Vector) 58 171 65 ・スカラーが順序を持って  並んだ数値のリスト ・各要素は特定の意味を持つ。 ・1次元のデータ。 医療データの例 一人の患者プロファイル [年齢, 身長, 体重]。 行列 (Matrix) ・ベクトルが並んだ数値の表 ・行と列の2つの軸を持つ。 ・2次元のデータ。 医療データの例 複数患者のデータセット、 レントゲン画像全体など。 集まる 集まる
この章の学習目標前提となる知識
スカラー、ベクトル、行列の定義とそれぞれの違いを説明できる。 各データ形式が医療現場(患者情報、画像など)でどう使われるか具体例を理解する。 AIがデータを数学的な「形」として扱うことの重要性を理解する。AIとデータの基本的な関係
AIがデータを基に学習することを知っていれば十分です。
身の回りのデータ表現
Excelの表やリストなど、基本的なデータ整理のイメージがあれば大丈夫です。

AIを支える数学の中核、線形代数の世界へようこそ。この分野は、AIがどのようにして複雑なデータを「かたち」として認識し、処理するのかを理解するための基礎となります。まるで粘土で作品を作る前に、基本的な形(球、棒、板)を知る必要があるように、AIもデータを扱うための基本的な「型」を持っています。

それが、スカラー、ベクトル、行列の3つです。

今回の講座では、これら3つのデータ形式がそれぞれ何を表し、どのように異なり、そして医療データの世界でいかに活用されているのかを、直感的なイメージと共に解き明かしていきます。


目次

1. 点としての情報「スカラー」

最もシンプルで、最も基本的なデータの単位がスカラー (Scalar) です。これは、単一の数値を意味します。

  • 定義: 大きさのみを持ち、方向を持たない量。0次元のデータ。
  • イメージ: 地図上の「標高」や、温度計の「一つの目盛り」のような、単独で完結する値。

医療現場では、日々スカラーデータに触れています。

  • ある瞬間の患者の体温: 37.5
  • 特定の検査項目一つの結果: 血中ナトリウム濃度 140 (mEq/L)
  • AI創薬における分子の結合エネルギー: -9.8 (kcal/mol)

スカラーは、それ自体が文脈を持つというよりは、後述するベクトルや行列を構成するための、最小の「レンガ」のような存在です。


2. プロファイルとしての情報「ベクトル」

ベクトル (Vector) は、複数のスカラーを特定の順序で並べたリストです。1次元のデータ配列と考えることができます。

  • 定義: 大きさと「向き」を持つ量。複数の要素がひとまとまりになった、1次元のデータ。
  • イメージ: ある対象の「プロファイル」や「状態」。各要素は、その対象の異なる側面を表します。

ベクトルは、単一の対象に関する多面的な情報を表現するのに最適です。

  • 医療における例:
    • 一人の患者さんの基本情報: [年齢, 身長, 体重, 収縮期血圧] というベクトルは、[58, 171, 65, 128] のように表現でき、これ全体で一人の患者さんを表します。各数値の「順序」が重要で、1番目は必ず年齢、2番目は身長…というルールがあります。
    • 一個のピクセルの色情報: カラー画像の一つのピクセルは、[赤の強度, 緑の強度, 青の強度] という3つの数値を持つベクトル(例: [210, 180, 170])で表現されます。
    • 一個の単語の意味: 近年の自然言語処理では、単語の意味を数百次元のベクトルとして表現します(単語埋め込み)。

重要なのは、ベクトルが多次元空間における「一点」または「矢印」として解釈できることです。これにより、患者Aと患者Bの「状態の近さ」を、ベクトル間の距離として数値的に評価することが可能になります。


3. データセットとしての情報「行列」

行列 (Matrix) は、それらのベクトルをさらに複数集め、縦横に整然と並べた2次元の表です。

  • 定義: 数値を長方形に配置した、2次元のデータ。ベクトルの集まり。
  • イメージ: 患者名簿やExcelシートのような、複数の対象(行)と複数の特徴(列)から成るデータセット全体。

行列は、複数の対象のプロファイル(ベクトル)を一度に表現するのに非常に強力なツールです。

  • 医療における例:
    • 臨床試験の患者コホート: 100人の被験者(行)それぞれについて、50項目の臨床データ(列)を記録した場合、それは 100 × 50 の行列となります。この行列一つで、試験全体のデータセットを表すことができます。
    • モノクロ医用画像: 512×512ピクセルのX線写真は、各ピクセルの輝度値(スカラー)を並べた 512 × 512 の行列そのものです。
    • 複数患者の時系列データ: 10人の患者の心電図データをそれぞれ1000時点分記録した場合、10 × 1000 の行列として、全患者の心電図の推移をまとめて扱うことができます。

これら3つの関係は、スカラー < ベクトル < 行列 という階層構造になっていると理解すると分かりやすいでしょう。

データ構造次元説明医療での例
スカラー0次元単一の数値38.5 (体温)
ベクトル1次元数値の順序付きリスト[58, 171, 65] (一人の患者情報)
行列2次元数値の表 (ベクトルの集まり)患者100人分のデータ、レントゲン画像

まとめ:データ表現の基本単位を理解する

今回は、線形代数の探検における最初のステップとして、3つの基本的なデータ構造を学びました。

  • スカラー: 一つの値(例:ある検査値)。
  • ベクトル: 関連する値のリスト(例:一人の患者の全データ)。
  • 行列: ベクトルの集まり(例:患者集団の全データ、一枚の画像)。

AIがデータを「処理」するとは、これらのスカラー、ベクトル、行列に対して数学的な操作(演算)を加えることに他なりません。まずは、AIが扱うデータの「形」をしっかりと理解することが、その先の複雑なアルゴリズムを読み解くための揺るぎない土台となります。

次回は、これらの行列に対して具体的にどのような計算ができるのか、「0.2.2: 行列の基本的な演算」について学んでいきます。


ご利用規約(免責事項)

当サイト(以下「本サイト」といいます)をご利用になる前に、本ご利用規約(以下「本規約」といいます)をよくお読みください。本サイトを利用された時点で、利用者は本規約の全ての条項に同意したものとみなします。

第1条(目的と情報の性質)

  1. 本サイトは、医療分野におけるAI技術に関する一般的な情報提供および技術的な学習機会の提供を唯一の目的とします。
  2. 本サイトで提供されるすべてのコンテンツ(文章、図表、コード、データセットの紹介等を含みますが、これらに限定されません)は、一般的な学習参考用であり、いかなる場合も医学的な助言、診断、治療、またはこれらに準ずる行為(以下「医行為等」といいます)を提供するものではありません。
  3. 本サイトのコンテンツは、特定の製品、技術、または治療法の有効性、安全性を保証、推奨、または広告・販売促進するものではありません。紹介する技術には研究開発段階のものが含まれており、その臨床応用には、さらなる研究と国内外の規制当局による正式な承認が別途必要です。
  4. 本サイトは、情報提供を目的としたものであり、特定の治療法を推奨するものではありません。健康に関するご懸念やご相談は、必ず専門の医療機関にご相談ください。

第2条(法令等の遵守)
利用者は、本サイトの利用にあたり、医師法、医薬品、医療機器等の品質、有効性及び安全性の確保等に関する法律(薬機法)、個人情報の保護に関する法律、医療法、医療広告ガイドライン、その他関連する国内外の全ての法令、条例、規則、および各省庁・学会等が定める最新のガイドライン等を、自らの責任において遵守するものとします。これらの適用判断についても、利用者が自ら関係各所に確認するものとし、本サイトは一切の責任を負いません。

第3条(医療行為における責任)

  1. 本サイトで紹介するAI技術・手法は、あくまで研究段階の技術的解説であり、実際の臨床現場での診断・治療を代替、補助、または推奨するものでは一切ありません。
  2. 医行為等に関する最終的な判断、決定、およびそれに伴う一切の責任は、必ず法律上その資格を認められた医療専門家(医師、歯科医師等)が負うものとします。AIによる出力を、資格を有する専門家による独立した検証および判断を経ずに利用することを固く禁じます。
  3. 本サイトの情報に基づくいかなる行為によって利用者または第三者に損害が生じた場合も、本サイト運営者は一切の責任を負いません。実際の臨床判断に際しては、必ず担当の医療専門家にご相談ください。本サイトの利用によって、利用者と本サイト運営者の間に、医師と患者の関係、またはその他いかなる専門的な関係も成立するものではありません。

第4条(情報の正確性・完全性・有用性)

  1. 本サイトは、掲載する情報(数値、事例、ソースコード、ライブラリのバージョン等)の正確性、完全性、網羅性、有用性、特定目的への適合性、その他一切の事項について、何ら保証するものではありません。
  2. 掲載情報は執筆時点のものであり、予告なく変更または削除されることがあります。また、技術の進展、ライブラリの更新等により、情報は古くなる可能性があります。利用者は、必ず自身で公式ドキュメント等の最新情報を確認し、自らの責任で情報を利用するものとします。

第5条(AI生成コンテンツに関する注意事項)
本サイトのコンテンツには、AIによる提案を基に作成された部分が含まれる場合がありますが、公開にあたっては人間による監修・編集を経ています。利用者が生成AI等を用いる際は、ハルシネーション(事実に基づかない情報の生成)やバイアスのリスクが内在することを十分に理解し、その出力を鵜呑みにすることなく、必ず専門家による検証を行うものとします。

第6条(知的財産権)

  1. 本サイトを構成するすべてのコンテンツに関する著作権、商標権、その他一切の知的財産権は、本サイト運営者または正当な権利を有する第三者に帰属します。
  2. 本サイトのコンテンツを引用、転載、複製、改変、その他の二次利用を行う場合は、著作権法その他関連法規を遵守し、必ず出典を明記するとともに、権利者の許諾を得るなど、適切な手続きを自らの責任で行うものとします。

第7条(プライバシー・倫理)
本サイトで紹介または言及されるデータセット等を利用する場合、利用者は当該データセットに付随するライセンス条件および研究倫理指針を厳格に遵守し、個人情報の匿名化や同意取得の確認など、適用される法規制に基づき必要とされるすべての措置を、自らの責任において講じるものとします。

第8条(利用環境)
本サイトで紹介するソースコードやライブラリは、執筆時点で特定のバージョンおよび実行環境(OS、ハードウェア、依存パッケージ等)を前提としています。利用者の環境における動作を保証するものではなく、互換性の問題等に起因するいかなる不利益・損害についても、本サイト運営者は責任を負いません。

第9条(免責事項)

  1. 本サイト運営者は、利用者が本サイトを利用したこと、または利用できなかったことによって生じる一切の損害(直接損害、間接損害、付随的損害、特別損害、懲罰的損害、逸失利益、データの消失、プログラムの毀損等を含みますが、これらに限定されません)について、その原因の如何を問わず、一切の法的責任を負わないものとします。
  2. 本サイトの利用は、学習および研究目的に限定されるものとし、それ以外の目的での利用はご遠慮ください。
  3. 本サイトの利用に関連して、利用者と第三者との間で紛争が生じた場合、利用者は自らの費用と責任においてこれを解決するものとし、本サイト運営者に一切の迷惑または損害を与えないものとします。
  4. 本サイト運営者は、いつでも予告なく本サイトの運営を中断、中止、または内容を変更できるものとし、これによって利用者に生じたいかなる損害についても責任を負いません。

第10条(規約の変更)
本サイト運営者は、必要と判断した場合、利用者の承諾を得ることなく、いつでも本規約を変更することができます。変更後の規約は、本サイト上に掲載された時点で効力を生じるものとし、利用者は変更後の規約に拘束されるものとします。

第11条(準拠法および合意管轄)
本規約の解釈にあたっては、日本法を準拠法とします。本サイトの利用および本規約に関連して生じる一切の紛争については、東京地方裁判所を第一審の専属的合意管轄裁判所とします。


For J³, may joy follow you.

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

医師・医学博士・AI研究者・連続起業家
元厚生労働省幹部・ハーバード大学理学修士・ケンブリッジ大学MBA・コロンビア大学行政修士(経済)
岡山大学医学部卒業後、内科・地域医療に従事。厚生労働省で複数室長(医療情報・救急災害・国際展開等)を歴任し、内閣官房・内閣府・文部科学省でも医療政策に携わる。
退官後は、日本大手IT企業や英国VCで新規事業開発・投資を担当し、複数の医療スタートアップを創業。現在は医療AI・デジタル医療機器の開発に取り組むとともに、東京都港区で内科クリニックを開業。
複数大学で教授として教育・研究活動に従事し、医療関係者向け医療AIラボ「Medical AI Nexus」、医療メディア「The Health Choice | 健康の選択」を主宰。
ケンブリッジ大学Associate・社会医学系指導医・専門医・The Royal Society of Medicine Fellow

目次