
「AIは、レントゲン写真をどうやって見ているのでしょうか?」
最近よく聞きますよね、AI診断。
お医者さんがレントゲン写真を光にかざして、「うーん、ここに影があるねぇ…」とか言うて。あの、命を預かる男の背中みたいなかっこいいやつ。
あれをAIにもやらせようって話なんですけどね。
普通に考えたら、AIも僕らと同じように「あ、肺が綺麗やな」とか「心臓ちょっと疲れてるな」とか、そういう「いたわり」の目で見てると思うやないですか。
……あるかぁ!
そんなもん、ファンタジーや。ディズニーの見過ぎや。
あいつらね、「絵」なんか1ミリも見てへんのですわ。
あいつらの無機質な目には、肺も心臓も、愛する我が子の笑顔すら映ってない。
じゃあ何が見えてるか言いましょか?
「無限のエクセル」です。
ゾッとするでしょ?
あいつらの正体、ただの「表計算ソフトの悪魔」なんですよ。
「うわ〜、ここの『255』から『0』への急降下、統計的に有意な差ですねぇ! 素晴らしいデータ分布です!」
……いや、楽しみ方、独特すぎん?
友達なくすで、ほんま。

1. ズームイン!画像の正体は「方眼紙」である
ちょっと想像してみてください。 あなたがAIロボットと、ええ感じのステーキハウスに行ったとするやん。 目の前にジュウジュウ言うてる最高級のステーキが出てきて、「見てみぃこの肉汁の輝き……まさに『食の芸術品』やでぇ……」ってウットリしたとします。
そしたらそいつ、急に目が「ピピピッ…」って光って、真顔でこう言い放つんです。
「画像解析モード……エッジ検出処理中。表面テクスチャの自己相関関数を解析……RGBヒストグラムの赤チャンネル『20』付近に集中。異常なし。」
……どうします?
「飯ぐらい普通に食わせんかいッ!!!」
なるでしょ。机ドォォオン!!叩くわ。 「ヒストグラム」とか「セグメンテーション」とかないんか! 情緒どこ置いてきたんや! 工場のラインに忘れてきたんか! こっちは「味」を楽しもうとしてんのに、お前はずっと「検品」しとんのかと。

でもね、残念ながらAIってこれなんですよ。
画像を極限まで拡大したら、小さな四角いマス目(ピクセル)になりますよね。
AIにとって、そのマス目は「色」ちゃうねん。「数字」やねん。
ここではわかりやすく「8ビット・グレースケール」の例で言いますけど、要は「0(真っ黒)」から「255(真っ白)」までの数字が、ただただ無機質に並んでるだけ。
言うたら、レントゲン写真は「数字が並んだだけの、巨大な座席表」なんですよ。
僕らが「肺が白いな…病気かな?」ってドキドキしてる横で、AIは淡々と出席確認してるだけなんです。
「はい、席番A-1には『0(黒)』さんが座ってますね〜。よし。」
「お、席番C-5界隈、やたら『255(白)』さんが密集してますね〜。密ですよ〜。」
……それだけ。
もうね、感情もへったくれもない。
「病気を見つける」いうより、「数字の点呼をとってる」だけなんですわ。

2. カラー画像は「光のサンドイッチ」

ほな、カラー写真はどないなんねんって話ですよ。
「色があるんやから、さすがにきれいやなとか情緒あるやろ」思うでしょ?
……おめでたい頭やな。
甘いわ。練乳直で吸うとんか。
あいつらにとってのカラー画像は、「光の3枚おろし」や。
「赤(R)」「緑(G)」「青(B)」の3枚の数字シートを、感情無用でスパパーン!と切り分けて見てるだけ。
言うたらね、ハンバーガーショップ行って、普通やったら「わぁ美味しそう!ガブッ!」ていくとこやんか。
AIくんはちゃうんですよ。
トレー受け取った瞬間に、マイ・ピンセット取り出して、
「上のパン、排除。レタス、緑色成分抽出。パティ、赤色成分計測……」
って、机の上に具材を等間隔に並べ始めるんです。
で、最後に一言。
「よし、データ収集完了。」
……食えやッ!!!
何してんねん! 口の中でハーモニー楽しめや!
店長呼んでこい! 厨房のおっちゃん泣いとるわ!
塩まけ塩! 「二度と来んな!」言われるわ!
でもね、これがAIの流儀なんです。
人間が「綺麗な紫色の細胞やなぁ」って感動してる時、あいつらは裏で平然と「解体ショー」やってますねん。
3. AIはどうやって「数字」から「診断」するのか?
ここが今回のハイライトです。
「画像がエクセルなんはわかった。でも、その無味乾燥な数字の羅列から、どうやって『がん』とか見つけんねん」と。
お前、数字見て「うーん、この『255』の並び……悪性ですねぇ」とか言うたら、ただの詐欺師やないかと。
でもね、AIはそれをやるんです。
その秘密兵器が、「フィルター(畳み込み)」と「落差(ギャップ)」です。
ステップ1:段差でコケる(エッジ検出)

AIは画像を「見て」ません。
「フィルター」っていう小さな虫眼鏡を持って、画像の上を這いつくばって移動してるんです。
例えば、あるCT画像の一行がこうなってたとします。
... 10, 10, 10, 12, 【200】, 205, 200 ...
(黒: 平和) (白: 崖)
数字が「10」くらいの時は、平和な道が続いてるんです。
でも突然、「200」っていう壁が現れる。
ここでAIは、単純な計算(引き算みたいなもん)をしながら進んでます。
「10ひく10は……ゼロ。ふーん、平坦やな」
「10ひく12は……まあ誤差やな」
ところが、「12」から「200」に変わった瞬間。
「200ひく12は……188ッ!!!!痛っ!!!」
ってなるんです。
これ、完全に「夜道でマンホールに落ちた時のリアクション」です。
AIはこの「痛っ!」ってなった場所(数値が跳ね上がった場所)だけを、ものすごい執念で地図に書き込んでいきます。
「ここ段差あり。ここも段差あり。」
これが専門用語でいう「エッジ検出」です。
やってること、「道路の凹凸だけを血眼で探してる、神経質な現場監督」と一緒ですわ。
「あーここ2ミリ浮いてる! やり直し!」みたいな。
ステップ2:部品を組み立てる(形の構築)

次に、AIは見つけた「段差(エッジ)」という名の部品を拾い集めます。
「お、ここに『縦の段差』落ちてたわ」
「あ、こっちには『横の段差』あったわ」
で、それをどうするか。
なんと、接着剤でくっつけよるんです。
「縦の棒と横の棒くっつけたら……おっ、『角(かど)』できたやん!」
「この角とあの角くっつけたら……『四角』できたやん!」
「カーブ繋げたら……『円』になったで!」
……暇か。
河原で石積み上げてる子供か。
でも、あいつらはこの地味な作業を何億回も繰り返して、点から線へ、線から形へと、どんどんでかい構造物を作り上げていくんです。
ステップ3:そして伝説へ(診断)

最終段階です。
出来上がった形を見て、AIは冷徹に判断を下します。
例えば「すりガラス陰影(GGO)」を見つける時、人間みたいに「なんかモヤっとしてるなぁ」なんて情緒は一切ありません。
「背景の黒『0』に対して、グレー『50〜100』のピクセルが散乱。かつ、その境界線の段差(勾配)がなだらかである確率……94.8%。」
「結論:これ、がんの疑いあり。」
……怖っ!!
名探偵コ○ンくんも裸足で逃げ出す推理力。
「犯人は……この数値配列の中にいる!」言うて。
AIは、数万枚のレントゲン写真を使って、
「がんの画像は、こういう数字の並び方をしてる」
っていうクセ(統計的な偏り)を、死ぬ気で丸暗記してるんです。
医者が「経験と勘」でやってることを、あいつらは「圧倒的な計算量と、段差への異常な執着」でやってのける。
結論:AIにとって「見る」とは?
猫や肺を探してるんちゃいます。
あいつらは、「数字の並びがおかしい場所」を、マンホールの穴に落ちながら探してるだけなんです。
4. 結論:愛が重すぎる「不器用な守護神」
まぁ、散々いじってきましたけどね。
結局、AIって「究極の数字フェチ」であり、「最強の仕事人」なんですよ。
AIは、人間が見落としてまうような小さな変化を、ずっと数字見つめて探してくれてるんです。
文句も言わずにね。
そう考えたら、こいつの無機質な目も、ちょっとだけ頼もしく見えてきませんか?
「しゃあないなぁ、お前はずっと計算しとき」って。
まぁ、デートには絶対連れて行きたないけどな。
ほな、また。

参考文献
- Bushberg, J.T., Seibert, J.A., Leidholdt, E.M. and Boone, J.M. (2012). The Essential Physics of Medical Imaging. 3rd ed. Philadelphia: Lippincott Williams & Wilkins. Official URL
- LeCun, Y., Bengio, Y. and Hinton, G. (2015). Deep learning. Nature, 521(7553), pp.436–444. doi:10.1038/nature14539 PMID:26017442
- Litjens, G., Kooi, T., Bejnordi, B.E., Setio, A.A.A., Ciompi, F., Ghafoorian, M., van der Laak, J.A.W.M. and van Ginneken, B. (2017). A survey on deep learning in medical image analysis. Medical Image Analysis, 42, pp.60–88. doi:10.1016/j.media.2017.07.005 PMID:28778026
- Finlayson, S.G., Bowers, J.D., Ito, J., Zittrain, J.L., Beam, A.L. and Kohane, I.S. (2019). Adversarial attacks on medical machine learning. Science, 363(6433), pp.1287–1289. doi:10.1126/science.aaw4399 PMID:30898923
- Goodfellow, I.J., Shlens, J. and Szegedy, C. (2015). Explaining and harnessing adversarial examples. International Conference on Learning Representations (ICLR). Stable URL [Preprint]
※本記事は情報提供を目的としたものであり、特定の治療法や医療機器、ソフトウェアの利用を推奨するものではありません。健康状態や治療方針に関する判断は、必ず担当の医師など専門の医療機関にご相談ください。
ご利用規約(免責事項)
当サイト(以下「本サイト」といいます)をご利用になる前に、本ご利用規約(以下「本規約」といいます)をよくお読みください。本サイトを利用された時点で、利用者は本規約の全ての条項に同意したものとみなします。
第1条(目的と情報の性質)
- 本サイトは、医療分野におけるAI技術に関する一般的な情報提供および技術的な学習機会の提供を唯一の目的とします。
- 本サイトで提供されるすべてのコンテンツ(文章、図表、コード、データセットの紹介等を含みますが、これらに限定されません)は、一般的な学習参考用であり、いかなる場合も医学的な助言、診断、治療、またはこれらに準ずる行為(以下「医行為等」といいます)を提供するものではありません。
- 本サイトのコンテンツは、特定の製品、技術、または治療法の有効性、安全性を保証、推奨、または広告・販売促進するものではありません。紹介する技術には研究開発段階のものが含まれており、その臨床応用には、さらなる研究と国内外の規制当局による正式な承認が別途必要です。
- 本サイトは、情報提供を目的としたものであり、特定の治療法を推奨するものではありません。健康に関するご懸念やご相談は、必ず専門の医療機関にご相談ください。
第2条(法令等の遵守)
利用者は、本サイトの利用にあたり、医師法、医薬品、医療機器等の品質、有効性及び安全性の確保等に関する法律(薬機法)、個人情報の保護に関する法律、医療法、医療広告ガイドライン、その他関連する国内外の全ての法令、条例、規則、および各省庁・学会等が定める最新のガイドライン等を、自らの責任において遵守するものとします。これらの適用判断についても、利用者が自ら関係各所に確認するものとし、本サイトは一切の責任を負いません。
第3条(医療行為における責任)
- 本サイトで紹介するAI技術・手法は、あくまで研究段階の技術的解説であり、実際の臨床現場での診断・治療を代替、補助、または推奨するものでは一切ありません。
- 医行為等に関する最終的な判断、決定、およびそれに伴う一切の責任は、必ず法律上その資格を認められた医療専門家(医師、歯科医師等)が負うものとします。AIによる出力を、資格を有する専門家による独立した検証および判断を経ずに利用することを固く禁じます。
- 本サイトの情報に基づくいかなる行為によって利用者または第三者に損害が生じた場合も、本サイト運営者は一切の責任を負いません。実際の臨床判断に際しては、必ず担当の医療専門家にご相談ください。本サイトの利用によって、利用者と本サイト運営者の間に、医師と患者の関係、またはその他いかなる専門的な関係も成立するものではありません。
第4条(情報の正確性・完全性・有用性)
- 本サイトは、掲載する情報(数値、事例、ソースコード、ライブラリのバージョン等)の正確性、完全性、網羅性、有用性、特定目的への適合性、その他一切の事項について、何ら保証するものではありません。
- 掲載情報は執筆時点のものであり、予告なく変更または削除されることがあります。また、技術の進展、ライブラリの更新等により、情報は古くなる可能性があります。利用者は、必ず自身で公式ドキュメント等の最新情報を確認し、自らの責任で情報を利用するものとします。
第5条(AI生成コンテンツに関する注意事項)
本サイトのコンテンツには、AIによる提案を基に作成された部分が含まれる場合がありますが、公開にあたっては人間による監修・編集を経ています。利用者が生成AI等を用いる際は、ハルシネーション(事実に基づかない情報の生成)やバイアスのリスクが内在することを十分に理解し、その出力を鵜呑みにすることなく、必ず専門家による検証を行うものとします。
第6条(知的財産権)
- 本サイトを構成するすべてのコンテンツに関する著作権、商標権、その他一切の知的財産権は、本サイト運営者または正当な権利を有する第三者に帰属します。
- 本サイトのコンテンツを引用、転載、複製、改変、その他の二次利用を行う場合は、著作権法その他関連法規を遵守し、必ず出典を明記するとともに、権利者の許諾を得るなど、適切な手続きを自らの責任で行うものとします。
第7条(プライバシー・倫理)
本サイトで紹介または言及されるデータセット等を利用する場合、利用者は当該データセットに付随するライセンス条件および研究倫理指針を厳格に遵守し、個人情報の匿名化や同意取得の確認など、適用される法規制に基づき必要とされるすべての措置を、自らの責任において講じるものとします。
第8条(利用環境)
本サイトで紹介するソースコードやライブラリは、執筆時点で特定のバージョンおよび実行環境(OS、ハードウェア、依存パッケージ等)を前提としています。利用者の環境における動作を保証するものではなく、互換性の問題等に起因するいかなる不利益・損害についても、本サイト運営者は責任を負いません。
第9条(免責事項)
- 本サイト運営者は、利用者が本サイトを利用したこと、または利用できなかったことによって生じる一切の損害(直接損害、間接損害、付随的損害、特別損害、懲罰的損害、逸失利益、データの消失、プログラムの毀損等を含みますが、これらに限定されません)について、その原因の如何を問わず、一切の法的責任を負わないものとします。
- 本サイトの利用は、学習および研究目的に限定されるものとし、それ以外の目的での利用はご遠慮ください。
- 本サイトの利用に関連して、利用者と第三者との間で紛争が生じた場合、利用者は自らの費用と責任においてこれを解決するものとし、本サイト運営者に一切の迷惑または損害を与えないものとします。
- 本サイト運営者は、いつでも予告なく本サイトの運営を中断、中止、または内容を変更できるものとし、これによって利用者に生じたいかなる損害についても責任を負いません。
第10条(規約の変更)
本サイト運営者は、必要と判断した場合、利用者の承諾を得ることなく、いつでも本規約を変更することができます。変更後の規約は、本サイト上に掲載された時点で効力を生じるものとし、利用者は変更後の規約に拘束されるものとします。
第11条(準拠法および合意管轄)
本規約の解釈にあたっては、日本法を準拠法とします。本サイトの利用および本規約に関連して生じる一切の紛争については、東京地方裁判所を第一審の専属的合意管轄裁判所とします。
For J³, may joy follow you.

