🧑‍⚕️

医療業界で突然LLMを使ってくれと言われたら

に公開

はじめに

「うちの病院でも生成AIを活用したい」
「電子カルテの要約をAIでできないか」

医療機関のDX推進担当者や、外部のシステム開発者がこのような相談を受けることが増えています。しかし医療分野でLLMを活用する場合、一般的なWebサービスとは異なる厳格なデータの要件があります。

本記事では、2025年12月時点で日本国内の医療機関がLLMを本番利用する際に知っておくべき、規制要件とクラウドプロバイダーの選択肢について、網羅的に解説します。

ちなみに私は元医師で、現在株式会社LivetoonでCTOとしてAI開発をしている長嶋と申します。
また東大病院循環器内科にも所属しており、医療AI開発に携わっております。

https://x.com/longislandtea3

※筆者注: 情報は2025年12月時点のものであり、今後変更される可能性があります。またベンダー側のドキュメントも新旧入り乱れており、下記情報が完璧に正確である保証はいたしません。実装時には自身で確認することを推奨します。

1. 3省2ガイドラインとは?

概要

医療業界でLLMを利用する前に、まず理解すべきなのが3省2ガイドラインです。

項目 内容
正式名称 厚生労働省「医療情報システムの安全管理に関するガイドライン」+ 経済産業省・総務省「医療情報を取り扱う情報システム・サービスの提供事業者における安全管理ガイドライン」
最新版 厚労省 第6.0版(2023年5月)、経産省・総務省 第2.0版(2024年12月)
対象 医療機関(病院・クリニック等)と、システム・サービス提供事業者の両方

なぜ厳しいのか?

医療情報は要配慮個人情報に該当し、病歴・診療履歴などの高度な機微情報が含まれます。
一般的な個人情報よりも厳格な管理が求められる理由は以下の3点です。

  1. 患者の生命に直結する:誤った情報管理は生死に関わる可能性がある
  2. 漏洩時の被害が甚大:病歴情報の流出は回復不可能な損害を与える
  3. 法令遵守義務:医師法・個人情報保護法・e-文書法など複数の法令が絡む

LLM利用における実務的影響

3省2ガイドラインに準拠するためには、LLMの推論処理において以下が重要になります。

要件 具体的内容
データの国内保存 患者データが日本国外のサーバーに保存されないこと
データの国内処理 推論処理自体も日本国内のリージョンで完結すること
外部委託時の責任分界 クラウドベンダーとの責任範囲を明確化すること
監査対応 ログの保存・追跡が可能であること

2. 2025年12月時点のクラウドプロバイダー比較

各社の日本リージョン対応状況サマリー

項目 Google Cloud Microsoft Azure AWS Bedrock
日本リージョンで使えるモデル Gemini 2.5 Pro / Flash GPT-4o Claude Sonnet 4.5
最新モデル Gemini 3.0 Pro GPT-5 Claude Opus 4.5
最新モデルの日本対応 ❌ グローバルのみ ❌ グローバルのみ ⚠️ 日本国内分散(東京+大阪)
データ主権の保証 ✅ Gemini 2.5は完全国内 ✅ GPT-4oは完全国内 ✅ CRIS利用で国内完結

まずは結論

筆者の個人的な推奨:
医療機関でLLMを使うなら、AWS Bedrock + Claude Sonnet 4.5(日本国内CRIS)が現時点でベストな選択肢だと考えています。

理由は3つ:

  1. 固定費なしの従量課金で日本国内完結 → 小規模から始めやすい
  2. 推論プロファイルIDを変えるだけで実装完了 → 導入コストが低い
  3. 東京・大阪の自動冗長化が標準装備 → DR対策も同時に達成

Google CloudのGSU(最低$2,000/月〜)やAzureのZDR申請プロセスと比較すると、運用も実装コストも圧倒的にシンプルです。しかもClaude Sonnet 4.5はコーディングや複雑な推論タスクで非常に優秀なモデルなので、性能面でも妥協なし。

「まずは試してみたい」という場合には、迷わずAWS Bedrockをお勧めします!

3. Google Cloud Vertex AI

日本リージョンで利用可能なモデル

Gemini 2.5 Pro / Flash / Flash-Lite は、東京リージョン(asia-northeast1)で完全な可用性が確認されています。

モデル 特徴 日本リージョン 用途
Gemini 2.5 Pro 100万トークンのロングコンテキスト、マルチモーダル対応 ✅ 利用可能 長文医療文書の要約、マニュアル解析
Gemini 2.5 Flash 低遅延・低コスト ✅ 利用可能 リアルタイム応答が必要なシステム
Gemini 2.5 Flash-Lite 最軽量・最安価 ✅ 利用可能 簡単な分類・タグ付けタスク
Gemini 3.0 Pro 最新の推論能力 ❌ プレビュー段階(グローバル)

💰 【重要】日本リージョン固定にはGSU(固定費)が必須

結論から言うと、「日本リージョンでデータを処理したい(Regional)」だけだとしても、「Provisioned Throughput(GSU)」という固定費契約が必須となります。

なぜ従量課金(Pay-as-you-go)ではダメなのか?

Google Cloudでは、課金形態によって「データ処理場所(リージョン)」を指定できるかどうかが決まっています。

利用形態 リージョン指定 データの処理場所 医療用途・データ主権
Pay-as-you-go
(通常の従量課金)
不可 グローバル
(世界中の空きリソースで処理)
不適合
(国内処理を保証できない)
Provisioned Throughput
(GSU / スループット予約)
可能 指定リージョン
(東京リージョンに固定可能)
適合
(国内完結が可能)

つまり、以下のセット販売であると理解してください。

「データ主権(Regional)」と「固定費(Provisioned)」はセット

💰 GSU(Provisioned Throughput)の価格体系

GSUとは?

GSU(Generative AI Scale Unit)は、Vertex AIで専用のスループット帯域を確保するための購入単位です。

利用形態 リージョン指定 医療用途
Pay-as-you-go(従量課金) ❌ グローバルのみ ❌ 不適合
Provisioned Throughput(GSU) ✅ リージョン指定可能 ✅ 適合

Pay-as-you-go(従量課金)モデルでは、他のユーザーとGPUを共有し、リクエストはグローバルにルーティングされます。日本リージョンでのデータ処理を保証するためには、GSUの購入が必須です。

価格表

コミットメント期間 月額単価(1 GSU) 割引率 備考
1週間 約$700/週 短期検証向け
1ヶ月 $2,700/月 基準価格 最小構成で月額約40万円
3ヶ月 $2,400/月 約11%OFF 四半期プロジェクト向け
1年 $2,000/月 約26%OFF 本番ワークロード推奨

GSUのバーンダウン(消費)メカニズム

GSUは「リクエスト数」ではなく、「トークン/秒」のスループット容量を提供します。入出力の種類によって消費レートが異なる点に注意が必要です。

入出力タイプ 消費レート 説明
テキスト入力 1:1 1トークン入力 = 1トークン分消費
テキスト出力 1:4 1トークン出力 = 4トークン分消費(生成は計算コスト大)
音声入力 1:7 マルチモーダル入力は高負荷
キャッシュ済入力 1:0.1 コンテキストキャッシュ活用で劇的にコスト削減可能

Gemini 2.5のGSU要件

モデル 1 GSUあたりの処理能力 最小購入単位
Gemini 2.5 Flash 約3,360トークン/秒 1 GSU
Gemini 2.5 Pro 約800文字/秒 5 GSU
Gemini 2.5 Flash-Lite 約5,000トークン/秒 1 GSU

4. Microsoft Azure OpenAI Service

日本リージョンで利用可能なモデル

モデル デプロイメントタイプ 日本東リージョン データ処理場所
GPT-4o-mini Standard ⚠️ 一部制限あり 日本国内で完結
GPT-5 Global Standard ❌ 不可 米国/欧州のみ
GPT-5-chat Global Standard ❌ 不可 米国/欧州のみ

GPT-4oとGPT-5の決定的な違い

2025年後半にリリースされたGPT-5シリーズは、その巨大な計算リソース要件により、「Global Standard」デプロイメントでのみ提供されています。

特性 GPT-4o (Standard) GPT-5 (Global Standard)
日本リージョン ✅ Japan East ❌ なし
データ処理場所 日本国内で完結 米国東部2 or スウェーデン中部
医療用途 ✅ 適合 ⚠️ ZDR適用が必要

Global Standardデプロイメントの問題点

「Global Standard」とは、特定のGPUクラスターに紐付かない論理的なデプロイメントです。トラフィックは世界中のAzureデータセンターのうち、その時点で空き容量がある場所に動的にルーティングされます。

つまり、日本からGPT-5を呼び出しても、推論処理は米国や欧州のデータセンターで実行される可能性が高いです。

Zero Data Retention (ZDR) による対策

GPT-5を医療用途で使いたい場合、Zero Data Retention(ZDR)ポリシーの適用を検討できます。

項目 内容
ZDRとは Microsoftがプロンプト・生成結果を一切保存しないことをコミット
通常のデータ保持 不正利用監視のため最大30日間保持
ZDR適用後 推論完了直後にメモリ上から破棄
適用プロセス Modified Access Reviewへの申請・承認が必要

厚労省Q&Aによる公式見解(令和7年5月)

「医療情報システムの安全管理に関するガイドライン 第6.0版」に関するQ&Aにおいて、以下の見解が示されています。

企Q-26: 生成AIサービスのプロンプトとして医療情報を入力する場合、入力情報が「AIの学習等のために保存されないこと」が、契約等において担保されていれば、生成AIサービスのサーバが国内法の適用を受けている必要はないと考えて良いか?

A: よい。(中略)医療情報が保存されないことが、契約等において担保されている場合は国内法の適用を受けていないサーバを利用可能です。

つまり、ZDRを適用してデータが保存されないことが契約で担保されていれば、GPT-5(Global Standard)も3省2ガイドライン上は利用可能ということになります。

5. AWS Bedrock(Anthropic Claude)

Cross-Region Inference (CRIS) とは

AWS BedrockはCross-Region Inference (CRIS) という独自のアーキテクチャにより、日本国内でのデータ完結と高可用性を両立しています。

特性 説明
仕組み 東京リージョンへのリクエストを、必要に応じて大阪リージョンに自動ルーティング
データ主権 日本国内(東京・大阪)のみで処理が完結
可用性 災害対策(DR)としても機能
課金体系 従量課金(オンデマンド)、固定費の購入不要
追加コスト グローバル推論と比較して +10%

日本リージョンで利用可能なモデル

モデル 日本国内CRIS 特徴
Claude Sonnet 4.5 ✅ 利用可能 推論能力と速度のバランスに優れる
Claude Haiku 4.5 ✅ 利用可能 高速・低コスト
Claude Opus 4.5 ❌ グローバルのみ 最高性能だが日本国内完結不可

価格体系(CRIS利用時)

日本国内クロスリージョン推論は従量課金(オンデマンド)ベースで利用できます。Google CloudのようなProvisioned Throughput(GSU)の購入は不要で、推論プロファイルIDを指定するだけで日本国内に限定した推論が可能です。

グローバル推論と比較して10%上乗せの料金設定になっています。

モデル 入力価格(1Mトークン) 出力価格(1Mトークン) 備考
Claude Sonnet 4.5(グローバル) $3.00 $15.00 地理的制限なし
Claude Sonnet 4.5(日本CRIS) $3.30 $16.50 +10%
Claude Haiku 4.5(グローバル) $1.00 $5.00 地理的制限なし
Claude Haiku 4.5(日本CRIS) $1.10 $5.50 +10%

実装方法

日本国内CRISの利用は非常にシンプルです。

# 推論プロファイルIDを指定するだけ
model_id = "jp.anthropic.claude-sonnet-4-5-20250929-v1:0"  # 日本国内CRIS
# model_id = "anthropic.claude-sonnet-4-5-20250929-v1:0"  # グローバル(従来)
項目 設定内容
Claude Sonnet 4.5 jp.anthropic.claude-sonnet-4-5-20250929-v1:0
Claude Haiku 4.5 jp.anthropic.claude-haiku-4-5-20251001-v1:0
IAM権限 推論プロファイルとデスティネーションリージョン(東京・大阪)のモデルへのアクセス権限

6. 総合比較表

モデル性能 vs データ主権のトレードオフ

優先事項 推奨プロバイダー 推奨モデル 月額コスト目安
データ主権最優先(医療・金融) AWS Bedrock Claude Sonnet 4.5 (CRIS) 従量課金(+10%)
データ主権最優先(シンプル構成) Azure OpenAI GPT-4o (Standard) 従量課金
データ主権最優先(Google志向) Vertex AI Gemini 2.5 Pro $2,700/GSU〜(必須)
最先端モデルが必須(研究開発) Azure OpenAI GPT-5(ZDR適用必須) ZDRで対応可?

詳細比較表

項目 Google Vertex AI Microsoft Azure AWS Bedrock
日本対応モデル Gemini 2.5 Pro/Flash GPT-4o Claude Sonnet 4.5
最新モデル Gemini 3.0 Pro GPT-5 Claude Opus 4.5
最新モデルの日本対応 ⚠️ Sonnetは対応
データ主権保証 ✅ asia-northeast1 ✅ Japan East ✅ CRIS(Japan)
最小固定費 $2,700/月〜(必須) 構成による なし(従量課金)

コスト比較シミュレーション

月間100万トークン処理の場合(入出力各50万トークン)

プロバイダー モデル 入力コスト 出力コスト 月額合計
AWS Bedrock Claude Sonnet 4.5 (CRIS) $1.65 $8.25 約$10
Azure GPT-4o (Standard) $1.25 $5.00 約$6
Vertex AI Gemini 2.5 Pro (参考値)※ $0.63 $2.50 約$3
Vertex AI Gemini 2.5 Flash (参考値)※ $0.04 $0.08 約$0.12

7. 医療機関向け確認事項

実装時のチェックリスト

規制対応

  • 3省2ガイドラインの要件を確認
  • クラウドベンダーとの責任分界点を契約で明確化
  • 院内情報セキュリティ部門の承認取得

データ保護

  • 患者データの匿名化・仮名化処理を中間サーバーで実施
  • 日本リージョン完結のサービスを選択

監査・運用

  • ログの保存期間・監査対応を設計
  • インシデント対応手順を策定

8. まとめ

2025年12月時点で、医療機関がLLMを本番利用する場合の選択肢は以下のようにまとめられます。

状況 推奨選択肢
3省2ガイドライン完全準拠が必須 AWS Bedrock + Claude Sonnet 4.5(日本国内CRIS)
シンプルに始めたい Azure OpenAI + GPT-4o(Japan East Standard)
Googleエコシステムを活用したい Vertex AI + Gemini 2.5 Pro(GSU必須)
最先端モデルが必須(研究開発) Azure OpenAI + GPT-5(ZDR適用で法的に利用可)

最終的な判断基準

重要なのは、最新モデルを使えるかではなく、患者データを守りながら実用的な価値を出せるかです。

令和7年5月の厚労省Q&Aにより、ZDR(データ保存なし)が契約で担保されていれば、GPT-5のような国外サーバーのモデルも法的には利用可能となりました。ただし現状このQ&Aの解釈も割れますし、ZDRの申請プロセスや契約上の担保が必要なため、運用がシンプルな日本リージョン完結のモデル(GPT-4o、Claude Sonnet 4.5、Gemini 2.5 Pro)から始めることをお勧めします

データ主権を確保しながら、段階的にAI活用を進めていくことが、医療機関にとって最も現実的なアプローチです。

参考リンク

Discussion