[Frontier Insights] Googleのオープンモデル医療AI「MedGemma」とは?性能から使い方まで専門家が徹底解説

医療現場は、日々膨大な情報であふれています。カルテの記録、最新の論文、そして山のような検査画像…。これらすべてを人間だけで処理し、最適な判断を下し続けるのは、本当に大変なことだと思いませんか?もし、優秀なアシスタントが隣にいて、情報の整理や下準備を手伝ってくれたら…そんな未来を大きく近づける可能性を秘めた技術が、Googleから発表されました。

その名も「MedGemma」。Googleが開発した、医療分野に特化したオープンなAIモデル群です。これが単なる「賢いAI」というだけでなく、私たち医療者や開発者が、より安全で高機能なAIツールを自分たちの手で作り上げるための「土台」を提供してくれる、という点が非常に画期的なんです。

この記事では、AI開発にも携わる現役医師の視点から、このMedGemmaが一体何者で、私たちの臨床や研究にどんな革命をもたらす可能性があるのか、基本からじっくりと、そしてどこよりも分かりやすく解説していきます。

参考記事

  • タイトル: MedGemma: Our most capable open models for health AI development
  • 発行元: Google Research
  • 発行日: 2025年7月9日
  • URL: https://research.google/blog/medgemma-our-most-capable-open-models-for-health-ai-development/

本稿中の画像・図表は、特段の断りがない限り引用元記事・公式資料に基づく引用です。各権利は原権利者に帰属します。

記載情報は 発行日時点 で公開・確認できた内容に基づきます。最新かつ正確な情報は 必ず公式発表・公式サイト・一次資料 をご参照ください。

本文には筆者の解釈・要約が含まれ、誤りや不正確な点が含まれる可能性 があります。重要事項は 原典の直接確認 を推奨します。

記事内の商標・サービス名・製品名は、各社の登録商標または商標です。

目次

MedGemmaがもたらす3つの重要なポイント

まずは、このMedGemmaがなぜこれほど注目されているのか、大切なポイントを3つに絞ってご紹介します。

  • 医療に特化した「マルチモーダル」AI: テキスト情報だけでなく、レントゲン写真や病理画像といった多様な医療画像を理解し、それらを統合してテキストで回答を生成できる、まさに医療現場向けの能力を持っています。
  • 「オープンモデル」であることの価値: 誰でもモデルをダウンロードして利用できるため、プライバシーが重要な医療データを外部に出すことなく、手元の環境で安全にAIを開発・運用できます。API形式のAIと違い、モデルが突然変更される心配もありません。
  • 開発の「土台」としての高い柔軟性: MedGemmaは完成品ではなく、あくまで高性能な「出発点」。各医療機関や開発者が、特定の目的(例えば、特定のがんの画像診断支援など)に合わせて追加学習(ファインチューニング)させることで、その性能をさらに高めることができます。

MedGemmaファミリーの全体像:何がどう違うのか?

MedGemmaは一つのモデルではなく、いくつかのモデルが集まった「ファミリー」と考えると分かりやすいです。一体どんな仲間たちがいて、それぞれ何が得意なのでしょうか。その全体像を見ていきましょう。

図1: MedGemmaファミリーの構成要素とデータの流れ。左から入力される様々な医療データ(皮膚科画像、病理画像、眼科画像、FHIR形式の電子カルテ、医療テキスト)が、それぞれのタスクに特化したモデル(MedSigLIP、MedGemma)で処理され、右側のようなアウトプット(画像分類、レポート生成など)を生み出す様子が示されています。(出典: MedGemma: Our most capable open models for health AI development)

この図、少し複雑に見えるかもしれませんが、要点はシンプルです。大きく分けて「画像担当」と「総合担当」の2種類がいる、とイメージしてください。

画像担当:職人肌の画像エンコーダー「MedSigLIP」

まず、図の右上、画像からの矢印を受け取っているのが「MedSigLIP(メド・シグリップ)」です。これは画像認識に特化した、いわば「画像分類の職人」です。レントゲン、皮膚科、病理、眼科など、多種多様な医療画像をテキスト情報と結びつける訓練を受けており、画像から特徴を捉えるのが非常に得意です。

MedSigLIPが得意なのは、分類(Classification)や検索(Retrieval)といった、構造化された答えを出すタスクです。例えば、「この画像はがんですか、正常ですか?」と分類したり、「この画像と似た症例の画像を探して」といった検索タスクで真価を発揮します。

総合担当:対話もできるジェネレーター「MedGemma」

次に、図の中央に大きく陣取るのが、主役の「MedGemma」です。こちらは、先ほどのMedSigLIPが捉えた画像の特徴と、テキスト情報を統合し、自由な文章(フリーテキスト)を生成することができます。レポート作成や、画像を見ながらの質疑応答(Visual Question Answering)など、より対話的で複雑なタスクを担当します。

MedGemmaには、主に2つのサイズがあります。

  • MedGemma 4B: 40億パラメータを持つ軽量版。スマートフォンなど、計算資源が限られた環境でも動作する可能性があります。レポート生成や画像に対する質疑応答などをこなします。
  • MedGemma 27B: 270億パラメータを持つ高性能版。テキストのみを扱うモデルと、画像も扱えるマルチモーダルモデルがあります。特に電子カルテ(EHR)の解釈など、より複雑なタスクに対応できるのが特徴です。

このように、専門家であるMedSigLIPが画像から情報を抽出し、それをMedGemmaがテキスト情報と合わせて解釈し、言葉にする、という見事な連携プレーを行っているわけです。

その実力は?客観的データで見るMedGemmaの性能

さて、その仕組みがわかったところで、一番気になるのは「で、実際のところ、どれくらい賢いの?」という点ですよね。幸い、Googleはいくつかの客観的な評価データを公開してくれています。

コストパフォーマンスに優れた知識と推論能力

まず見ていただきたいのが、米国の医師国家試験を模したベンチマーク「MedQA」のスコアと、モデルの利用コストを比較したグラフです。

図2: MedQAスコアと100万トークンあたりのコストの比較。縦軸がスコア(高いほど良い)、横軸がコスト(右に行くほど高い)を示します。MedGemma-27Bは、非常に低コストな領域にありながら、多くの大規模モデルに匹敵する高いスコアを達成しており、コストパフォーマンスが極めて高いことが分かります。(出典: MedGemma: Our most capable open models for health AI development)

このグラフの左上に位置する「MedGemma-27B」に注目してください。これは、非常に低いコスト(グラフの左側)でありながら、非常に高い正答率(グラフの上側)を達成していることを意味します。例えば、右上にいる「DeepSeek R1」という非常に高性能なモデルと比較しても、スコアは肉薄しているのに、コストは約10分の1程度に抑えられています。これは驚異的なコストパフォーマンスだと言えるでしょう。

実際の放射線科医も認めるレポート生成能力

次に、より臨床に近い評価です。MedGemma 4Bに胸部X線写真のレポートを生成させ、その内容を米国の放射線科専門医が評価した結果がこちらです。

図3: MedGemmaが生成した胸部X線レポートの品質評価。青色が「AIが優れている」、薄い灰色が「どちらのレポートも正しい結論に至る」を示します。全体(ALL)で見ると、これらを合わせた約81%のケースで、元の放射線科医のレポートと比較して、患者の管理方針に影響を与えないレベルの精度を持つと判断されました。(出典: MedGemma: Our most capable open models for health AI development)

このグラフが示しているのは、生成されたレポートの実に81%が「元のレポートと同様に、正しい患者管理につながる」と専門医に評価されたということです。中には「AIの方がより詳細だった」あるいは「元のレポートが見逃した所見を指摘した」というケースまでありました。もちろん、まだAIが重要な所見を見逃すケース(ピンクや赤の部分)も存在するため、このまま臨床応用できるわけではありません。しかし、出発点としてのモデルがこれだけの能力を持っていることは、大きな可能性を感じさせます。

応用例:MedGemmaは現場でどう役立つのか?

では、これらのモデルは具体的にどのような場面で活躍するのでしょうか。論文で紹介されているいくつかの例を見てみましょう。

1. 放射線画像の読影支援

上図の左: 胸部X線写真に対するMedGemmaの応答例。「この胸部X線を簡潔に説明して」というプロンプトに対し、MedGemmaは「左側に大きな気胸があり、胸腔ドレーンが留置されている」など的確な所見を述べています。元の放射線科医のレポートと比較しても、重要なポイントを捉えていることがわかります。(出典: MedGemma: Our most capable open models for health AI development)

これは、放射線科医が読影レポートを作成する際の「下書き」をAIが作成してくれるようなユースケースです。所見の拾い上げや定型文の作成をAIに任せることで、医師はより複雑な判断や最終確認に集中できるかもしれません。

2. 皮膚科・病理診断の補助

上図: 皮膚病変(左)と病理組織像(右)に対するMedGemmaの応答例。皮膚病変の画像から「基底細胞癌(BCC)」の可能性を指摘し、次のステップとして皮膚科医への相談を提案しています。また、病理組織像からは「高悪性度の浸潤癌」という、悪性度や増殖能の高さを示唆する重要な所見を述べており、専門家のような応答が可能であることが示されています。(出典: MedGemma: Our most capable open models for health AI development)

これらの例は、専門的な画像から示唆される疾患を挙げたり、所見を言語化したりする能力を示しています。専門医の目が届きにくい地域や、初期スクリーニングの場面での活用が期待されます。

3. 事前問診の効率化

患者が来院する前に、AIアシスタントが対話形式で主訴や症状を詳しく聞き取ります。これにより、医師は診察前に患者の情報を整理でき、よりスムーズで質の高い診察につながります。(出典: MedGemma: Our most capable open models for health AI development)

これは、外来業務の効率化に直結する非常に実用的な応用例だと思います。医師だけでなく、看護師や医療事務スタッフの負担軽減にもつながるかもしれません。

技術的制約と乗り越えるべき課題

これほど有望なMedGemmaですが、もちろん課題もあります。Googleも論文の中で明確に述べている通り、MedGemmaは「そのまま臨床現場で使える完成品」では決してありません。

  • あくまで「出発点」: これらのモデルは、AI開発のための高性能な「部品」や「素材」です。実際に医療機器やサービスとして利用するには、各開発者が目的のタスクに合わせてファインチューニング(追加学習)を行い、厳密な性能評価と検証を行う必要があります。
  • 精度の限界: 先ほどのX線レポートの評価でも見たように、AIが重要な所見を見逃す可能性は常に存在します。生成されたアウトプットは必ず人間(専門家)が検証し、最終的な判断を下す必要があります。
  • 公平性とバイアス: AIは学習したデータに偏りがあると、特定の性別や人種に対して不正確な結果を出す可能性があります。多様なデータセットで公平性を検証し、バイアスを軽減する取り組みが不可欠です。

これらの課題を理解した上で、責任ある形で開発を進めていくことが、私たち医療AIに携わる者に求められています。

今後の展望:オープンモデルが切り拓く医療AIの未来

MedGemmaの登場は、医療AI開発の世界に大きな変化をもたらす可能性があります。

これまで、最先端のAIモデルは一部の巨大テック企業がAPIとして提供するものが主流でした。それはそれで手軽に利用できるメリットがありましたが、プライバシーの問題や、モデルの内部がブラックボックスであること、そして突然の仕様変更リスクなど、特に医療分野で利用するにはいくつかのハードルがありました。

MedGemmaのような高性能なオープンモデルが普及することで、世界中の大学、研究機関、病院、そしてスタートアップ企業が、より自由に、安全に、そして安定した環境で、次世代の医療AIツールを開発できるようになります。まさに、イノベーションの民主化と言えるかもしれません。

台湾の病院が中国語の文献整理に活用したり、インドの企業が臨床ガイドラインに沿った提案の生成に利用したりと、すでに世界中でその活用事例が生まれています。日本でも、このMedGemmaを土台として、私たちの医療現場に本当に役立つ、ユニークなアプリケーションが生まれてくることを、私はとても楽しみにしています。

まとめ

今回は、Googleから発表された医療特化AIモデル「MedGemma」について解説しました。

一番大事なポイントを一言でまとめるなら、「MedGemmaは、プライバシーを守りながら誰もが高性能な医療AIを開発できる『オープンな土台』を提供してくれる画期的なツールである」ということになるでしょう。

この記事を読んでくださったあなたの立場によって、次に取るべきアクションは変わってくるかもしれません。

  • AI開発に興味のある研究者・開発者の方へ: Hugging Faceで公開されているモデルや、GitHubのサンプルノートブックにぜひ触れてみてください。この新しい「素材」を使って、どんな未来の医療が描けるか、試行錯誤を始める絶好の機会です。
  • 臨床現場で働く医療従事者の方へ: 「AIがすぐに診断してくれる」というわけではないことを理解しつつも、このような技術がレポート作成の補助や情報整理といった形で、日々の業務を助けてくれる未来がすぐそこまで来ていることを知っていただければと思います。
  • 病院や企業の管理者の方へ: AI導入を検討する際、外部のAPIサービスを利用するだけでなく、こうしたオープンモデルを自院の環境で安全に活用するという選択肢があることを、ぜひ覚えておいてください。

MedGemmaはまだ生まれたばかりの技術ですが、その可能性は無限大です。この新しいツールが、私たちの手によって、より安全で質の高い医療の実現に貢献していくことを心から願っています。

参考文献

  • Golden, D. and Pilgrim, R. (2025) ‘MedGemma: Our most capable open models for health AI development’, Google Research Blog, 9 July. Available at: https://research.google/blog/medgemma-our-most-capable-open-models-for-health-ai-development/ (Accessed: 22 September 2025).

ご利用規約(免責事項)

当サイト(以下「本サイト」といいます)をご利用になる前に、本ご利用規約(以下「本規約」といいます)をよくお読みください。本サイトを利用された時点で、利用者は本規約の全ての条項に同意したものとみなします。

第1条(目的と情報の性質)

  1. 本サイトは、医療分野におけるAI技術に関する一般的な情報提供および技術的な学習機会の提供を唯一の目的とします。
  2. 本サイトで提供されるすべてのコンテンツ(文章、図表、コード、データセットの紹介等を含みますが、これらに限定されません)は、一般的な学習参考用であり、いかなる場合も医学的な助言、診断、治療、またはこれらに準ずる行為(以下「医行為等」といいます)を提供するものではありません。
  3. 本サイトのコンテンツは、特定の製品、技術、または治療法の有効性、安全性を保証、推奨、または広告・販売促進するものではありません。紹介する技術には研究開発段階のものが含まれており、その臨床応用には、さらなる研究と国内外の規制当局による正式な承認が別途必要です。
  4. 本サイトは、情報提供を目的としたものであり、特定の治療法を推奨するものではありません。健康に関するご懸念やご相談は、必ず専門の医療機関にご相談ください。

第2条(法令等の遵守)
利用者は、本サイトの利用にあたり、医師法、医薬品、医療機器等の品質、有効性及び安全性の確保等に関する法律(薬機法)、個人情報の保護に関する法律、医療法、医療広告ガイドライン、その他関連する国内外の全ての法令、条例、規則、および各省庁・学会等が定める最新のガイドライン等を、自らの責任において遵守するものとします。これらの適用判断についても、利用者が自ら関係各所に確認するものとし、本サイトは一切の責任を負いません。

第3条(医療行為における責任)

  1. 本サイトで紹介するAI技術・手法は、あくまで研究段階の技術的解説であり、実際の臨床現場での診断・治療を代替、補助、または推奨するものでは一切ありません。
  2. 医行為等に関する最終的な判断、決定、およびそれに伴う一切の責任は、必ず法律上その資格を認められた医療専門家(医師、歯科医師等)が負うものとします。AIによる出力を、資格を有する専門家による独立した検証および判断を経ずに利用することを固く禁じます。
  3. 本サイトの情報に基づくいかなる行為によって利用者または第三者に損害が生じた場合も、本サイト運営者は一切の責任を負いません。実際の臨床判断に際しては、必ず担当の医療専門家にご相談ください。本サイトの利用によって、利用者と本サイト運営者の間に、医師と患者の関係、またはその他いかなる専門的な関係も成立するものではありません。

第4条(情報の正確性・完全性・有用性)

  1. 本サイトは、掲載する情報(数値、事例、ソースコード、ライブラリのバージョン等)の正確性、完全性、網羅性、有用性、特定目的への適合性、その他一切の事項について、何ら保証するものではありません。
  2. 掲載情報は執筆時点のものであり、予告なく変更または削除されることがあります。また、技術の進展、ライブラリの更新等により、情報は古くなる可能性があります。利用者は、必ず自身で公式ドキュメント等の最新情報を確認し、自らの責任で情報を利用するものとします。

第5条(AI生成コンテンツに関する注意事項)
本サイトのコンテンツには、AIによる提案を基に作成された部分が含まれる場合がありますが、公開にあたっては人間による監修・編集を経ています。利用者が生成AI等を用いる際は、ハルシネーション(事実に基づかない情報の生成)やバイアスのリスクが内在することを十分に理解し、その出力を鵜呑みにすることなく、必ず専門家による検証を行うものとします。

第6条(知的財産権)

  1. 本サイトを構成するすべてのコンテンツに関する著作権、商標権、その他一切の知的財産権は、本サイト運営者または正当な権利を有する第三者に帰属します。
  2. 本サイトのコンテンツを引用、転載、複製、改変、その他の二次利用を行う場合は、著作権法その他関連法規を遵守し、必ず出典を明記するとともに、権利者の許諾を得るなど、適切な手続きを自らの責任で行うものとします。

第7条(プライバシー・倫理)
本サイトで紹介または言及されるデータセット等を利用する場合、利用者は当該データセットに付随するライセンス条件および研究倫理指針を厳格に遵守し、個人情報の匿名化や同意取得の確認など、適用される法規制に基づき必要とされるすべての措置を、自らの責任において講じるものとします。

第8条(利用環境)
本サイトで紹介するソースコードやライブラリは、執筆時点で特定のバージョンおよび実行環境(OS、ハードウェア、依存パッケージ等)を前提としています。利用者の環境における動作を保証するものではなく、互換性の問題等に起因するいかなる不利益・損害についても、本サイト運営者は責任を負いません。

第9条(免責事項)

  1. 本サイト運営者は、利用者が本サイトを利用したこと、または利用できなかったことによって生じる一切の損害(直接損害、間接損害、付随的損害、特別損害、懲罰的損害、逸失利益、データの消失、プログラムの毀損等を含みますが、これらに限定されません)について、その原因の如何を問わず、一切の法的責任を負わないものとします。
  2. 本サイトの利用は、学習および研究目的に限定されるものとし、それ以外の目的での利用はご遠慮ください。
  3. 本サイトの利用に関連して、利用者と第三者との間で紛争が生じた場合、利用者は自らの費用と責任においてこれを解決するものとし、本サイト運営者に一切の迷惑または損害を与えないものとします。
  4. 本サイト運営者は、いつでも予告なく本サイトの運営を中断、中止、または内容を変更できるものとし、これによって利用者に生じたいかなる損害についても責任を負いません。

第10条(規約の変更)
本サイト運営者は、必要と判断した場合、利用者の承諾を得ることなく、いつでも本規約を変更することができます。変更後の規約は、本サイト上に掲載された時点で効力を生じるものとし、利用者は変更後の規約に拘束されるものとします。

第11条(準拠法および合意管轄)
本規約の解釈にあたっては、日本法を準拠法とします。本サイトの利用および本規約に関連して生じる一切の紛争については、東京地方裁判所を第一審の専属的合意管轄裁判所とします。


For J³, may joy follow you.

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

医師・医学博士・AI研究者・連続起業家
元厚生労働省幹部・ハーバード大学理学修士・ケンブリッジ大学MBA・コロンビア大学行政修士(経済)
岡山大学医学部卒業後、内科・地域医療に従事。厚生労働省で複数室長(医療情報・救急災害・国際展開等)を歴任し、内閣官房・内閣府・文部科学省でも医療政策に携わる。
退官後は、日本大手IT企業や英国VCで新規事業開発・投資を担当し、複数の医療スタートアップを創業。現在は医療AI・デジタル医療機器の開発に取り組むとともに、東京都港区で内科クリニックを開業。
複数大学で教授として教育・研究活動に従事し、医療関係者向け医療AIラボ「Medical AI Nexus」、医療メディア「The Health Choice | 健康の選択」を主宰。
ケンブリッジ大学Associate・社会医学系指導医・専門医・The Royal Society of Medicine Fellow

目次