🧑‍⚕️

医療業界で突然LLMを使ってくれと言われたら

だいち

2025/12/19に公開

 はじめに「うちの病院でも生成AIを活用したい」

「電子カルテの要約をAIでできないか」
医療機関のDX推進担当者や、外部のシステム開発者がこのような相談を受けることが増えています。しかし医療分野でLLMを活用する場合、一般的なWebサービスとは異なる厳格なデータの要件があります。
本記事では、2025年12月時点で日本国内の医療機関がLLMを本番利用する際に知っておくべき、規制要件とクラウドプロバイダーの選択肢について、網羅的に解説します。
ちなみに私は元医師で、現在株式会社LivetoonでCTOとしてAI開発をしている長嶋と申します。

また東大病院循環器内科にも所属しており、医療AI開発に携わっております。
https://x.com/longislandtea3
※筆者注: 情報は2025年12月時点のものであり、今後変更される可能性があります。またベンダー側のドキュメントも新旧入り乱れており、下記情報が完璧に正確である保証はいたしません。実装時には自身で確認することを推奨します。

 1. 3省2ガイドラインとは？
 概要医療業界でLLMを利用する前に、まず理解すべきなのが3省2ガイドラインです。


項目
内容


正式名称
厚生労働省「医療情報システムの安全管理に関するガイドライン」＋ 経済産業省・総務省「医療情報を取り扱う情報システム・サービスの提供事業者における安全管理ガイドライン」

最新版
厚労省 第6.0版（2023年5月）、経産省・総務省 第2.0版（2024年12月）

対象
医療機関（病院・クリニック等）と、システム・サービス提供事業者の両方


 なぜ厳しいのか？医療情報は要配慮個人情報に該当し、病歴・診療履歴などの高度な機微情報が含まれます。

一般的な個人情報よりも厳格な管理が求められる理由は以下の3点です。

患者の生命に直結する：誤った情報管理は生死に関わる可能性がある

漏洩時の被害が甚大：病歴情報の流出は回復不可能な損害を与える

法令遵守義務：医師法・個人情報保護法・e-文書法など複数の法令が絡む

 LLM利用における実務的影響3省2ガイドラインに準拠するためには、LLMの推論処理において以下が重要になります。


要件
具体的内容


データの国内保存
患者データが日本国外のサーバーに保存されないこと

データの国内処理
推論処理自体も日本国内のリージョンで完結すること

外部委託時の責任分界
クラウドベンダーとの責任範囲を明確化すること

監査対応
ログの保存・追跡が可能であること

!重要: 多くのLLM APIは「グローバル提供」であり、推論データがどの国で処理されるか保証されていません。

医療情報を扱う場合、日本リージョンでの処理完結が保証されたサービスを選択する必要があります。

 2. 2025年12月時点のクラウドプロバイダー比較
 各社の日本リージョン対応状況サマリー

項目
Google Cloud
Microsoft Azure
AWS Bedrock


日本リージョンで使えるモデル
Gemini 2.5 Pro / Flash
GPT-4o
Claude Sonnet 4.5

最新モデル
Gemini 3.0 Pro
GPT-5
Claude Opus 4.5

最新モデルの日本対応
❌ グローバルのみ
❌ グローバルのみ
⚠️ 日本国内分散（東京+大阪）

データ主権の保証
✅ Gemini 2.5は完全国内
✅ GPT-4oは完全国内
✅ CRIS利用で国内完結


 まずは結論筆者の個人的な推奨:

医療機関でLLMを使うなら、AWS Bedrock + Claude Sonnet 4.5（日本国内CRIS）が現時点でベストな選択肢だと考えています。
理由は3つ：

固定費なしの従量課金で日本国内完結 → 小規模から始めやすい

推論プロファイルIDを変えるだけで実装完了 → 導入コストが低い

東京・大阪の自動冗長化が標準装備 → DR対策も同時に達成
Google CloudのGSU（最低$2,000/月〜）やAzureのZDR申請プロセスと比較すると、運用も実装コストも圧倒的にシンプルです。しかもClaude Sonnet 4.5はコーディングや複雑な推論タスクで非常に優秀なモデルなので、性能面でも妥協なし。
「まずは試してみたい」という場合には、迷わずAWS Bedrockをお勧めします！

 3. Google Cloud Vertex AI
 日本リージョンで利用可能なモデルGemini 2.5 Pro / Flash / Flash-Lite は、東京リージョン（asia-northeast1）で完全な可用性が確認されています。


モデル
特徴
日本リージョン
用途


Gemini 2.5 Pro
100万トークンのロングコンテキスト、マルチモーダル対応
✅ 利用可能
長文医療文書の要約、マニュアル解析

Gemini 2.5 Flash
低遅延・低コスト
✅ 利用可能
リアルタイム応答が必要なシステム

Gemini 2.5 Flash-Lite
最軽量・最安価
✅ 利用可能
簡単な分類・タグ付けタスク

Gemini 3.0 Pro
最新の推論能力
❌ プレビュー段階（グローバル）
—

!注意: Gemini 3.0は2025年11月にプレビュー公開されましたが、日本リージョンでのローカルデプロイメントはまだ提供されていません。医療用途ではGemini 2.5 Proが現時点での最適解です。

 💰 【重要】日本リージョン固定にはGSU（固定費）が必須!ここがGoogle Cloud Vertex AIの最大の注意点であり、他ベンダーと大きく異なる部分です。
結論から言うと、「日本リージョンでデータを処理したい（Regional）」だけだとしても、「Provisioned Throughput（GSU）」という固定費契約が必須となります。

 なぜ従量課金（Pay-as-you-go）ではダメなのか？Google Cloudでは、課金形態によって「データ処理場所（リージョン）」を指定できるかどうかが決まっています。


利用形態
リージョン指定
データの処理場所
医療用途・データ主権



Pay-as-you-go
（通常の従量課金）
❌ 不可


グローバル
（世界中の空きリソースで処理）
❌ 不適合
（国内処理を保証できない）


Provisioned Throughput
（GSU / スループット予約）
✅ 可能


指定リージョン
（東京リージョンに固定可能）
✅ 適合
（国内完結が可能）

つまり、以下のセット販売であると理解してください。
「データ主権（Regional）」と「固定費（Provisioned）」はセット

 💰 GSU（Provisioned Throughput）の価格体系
 GSUとは？GSU（Generative AI Scale Unit）は、Vertex AIで専用のスループット帯域を確保するための購入単位です。


利用形態
リージョン指定
医療用途


Pay-as-you-go（従量課金）
❌ グローバルのみ
❌ 不適合

Provisioned Throughput（GSU）
✅ リージョン指定可能
✅ 適合

Pay-as-you-go（従量課金）モデルでは、他のユーザーとGPUを共有し、リクエストはグローバルにルーティングされます。日本リージョンでのデータ処理を保証するためには、GSUの購入が必須です。

 価格表

コミットメント期間
月額単価（1 GSU）
割引率
備考


1週間
約$700/週
—
短期検証向け

1ヶ月
$2,700/月
基準価格
最小構成で月額約40万円

3ヶ月
$2,400/月
約11%OFF
四半期プロジェクト向け

1年
$2,000/月
約26%OFF
本番ワークロード推奨


 GSUのバーンダウン（消費）メカニズムGSUは「リクエスト数」ではなく、「トークン/秒」のスループット容量を提供します。入出力の種類によって消費レートが異なる点に注意が必要です。


入出力タイプ
消費レート
説明


テキスト入力
1:1
1トークン入力 = 1トークン分消費

テキスト出力
1:4
1トークン出力 = 4トークン分消費（生成は計算コスト大）

音声入力
1:7
マルチモーダル入力は高負荷

キャッシュ済入力
1:0.1
コンテキストキャッシュ活用で劇的にコスト削減可能


 Gemini 2.5のGSU要件

モデル
1 GSUあたりの処理能力
最小購入単位


Gemini 2.5 Flash
約3,360トークン/秒
1 GSU

Gemini 2.5 Pro
約800文字/秒
5 GSU

Gemini 2.5 Flash-Lite
約5,000トークン/秒
1 GSU

!結論としてはGeminiをこの形で使う場合GSUの契約が必須なので、初期費用として最低でも＄2,000〜＄2,700が発生することに注意してください。

 4. Microsoft Azure OpenAI Service
 日本リージョンで利用可能なモデル

モデル
デプロイメントタイプ
日本東リージョン
データ処理場所


GPT-4o-mini
Standard
⚠️ 一部制限あり
日本国内で完結

GPT-5
Global Standard
❌ 不可
米国/欧州のみ

GPT-5-chat
Global Standard
❌ 不可
米国/欧州のみ


 GPT-4oとGPT-5の決定的な違い2025年後半にリリースされたGPT-5シリーズは、その巨大な計算リソース要件により、「Global Standard」デプロイメントでのみ提供されています。


特性
GPT-4o (Standard)
GPT-5 (Global Standard)


日本リージョン
✅ Japan East
❌ なし

データ処理場所
日本国内で完結
米国東部2 or スウェーデン中部

医療用途
✅ 適合
⚠️ ZDR適用が必要


 Global Standardデプロイメントの問題点「Global Standard」とは、特定のGPUクラスターに紐付かない論理的なデプロイメントです。トラフィックは世界中のAzureデータセンターのうち、その時点で空き容量がある場所に動的にルーティングされます。
つまり、日本からGPT-5を呼び出しても、推論処理は米国や欧州のデータセンターで実行される可能性が高いです。

 Zero Data Retention (ZDR) による対策GPT-5を医療用途で使いたい場合、Zero Data Retention（ZDR）ポリシーの適用を検討できます。


項目
内容


ZDRとは
Microsoftがプロンプト・生成結果を一切保存しないことをコミット

通常のデータ保持
不正利用監視のため最大30日間保持

ZDR適用後
推論完了直後にメモリ上から破棄

適用プロセス
Modified Access Reviewへの申請・承認が必要


 厚労省Q&Aによる公式見解（令和7年5月）「医療情報システムの安全管理に関するガイドライン 第6.0版」に関するＱ＆Ａにおいて、以下の見解が示されています。
企Ｑ－26: 生成AIサービスのプロンプトとして医療情報を入力する場合、入力情報が「AIの学習等のために保存されないこと」が、契約等において担保されていれば、生成AIサービスのサーバが国内法の適用を受けている必要はないと考えて良いか？
A: よい。（中略）医療情報が保存されないことが、契約等において担保されている場合は国内法の適用を受けていないサーバを利用可能です。
つまり、ZDRを適用してデータが保存されないことが契約で担保されていれば、GPT-5（Global Standard）も3省2ガイドライン上は利用可能ということになります。
!現実的な選択: 上記Q&Aにより、ZDR適用のGPT-5は法的には利用可能と解釈することもできます。ただし以下の点を考慮する必要があります：

ZDRの申請・承認プロセスが必要（即座には利用開始できない）

契約上の担保を明確に文書化する必要がある
データは物理的には国外で処理される（心理的・政治的リスク）
これらの運用負荷を考えると、日本リージョンで完結するGPT-4oの方がシンプルで安全です。GPT-5の性能が本当に必要な場合のみ、ZDR適用を検討することをお勧めします。

 5. AWS Bedrock（Anthropic Claude）
 Cross-Region Inference (CRIS) とはAWS BedrockはCross-Region Inference (CRIS) という独自のアーキテクチャにより、日本国内でのデータ完結と高可用性を両立しています。


特性
説明


仕組み
東京リージョンへのリクエストを、必要に応じて大阪リージョンに自動ルーティング

データ主権
日本国内（東京・大阪）のみで処理が完結

可用性
災害対策（DR）としても機能

課金体系

従量課金（オンデマンド）、固定費の購入不要

追加コスト
グローバル推論と比較して +10%



 日本リージョンで利用可能なモデル

モデル
日本国内CRIS
特徴


Claude Sonnet 4.5
✅ 利用可能
推論能力と速度のバランスに優れる

Claude Haiku 4.5
✅ 利用可能
高速・低コスト

Claude Opus 4.5
❌ グローバルのみ
最高性能だが日本国内完結不可


 価格体系（CRIS利用時）日本国内クロスリージョン推論は従量課金（オンデマンド）ベースで利用できます。Google CloudのようなProvisioned Throughput（GSU）の購入は不要で、推論プロファイルIDを指定するだけで日本国内に限定した推論が可能です。
グローバル推論と比較して10%上乗せの料金設定になっています。


モデル
入力価格（1Mトークン）
出力価格（1Mトークン）
備考


Claude Sonnet 4.5（グローバル）
$3.00
$15.00
地理的制限なし

Claude Sonnet 4.5（日本CRIS）
$3.30
$16.50
+10%

Claude Haiku 4.5（グローバル）
$1.00
$5.00
地理的制限なし

Claude Haiku 4.5（日本CRIS）
$1.10
$5.50
+10%


 実装方法日本国内CRISの利用は非常にシンプルです。
# 推論プロファイルIDを指定するだけ
model_id = "jp.anthropic.claude-sonnet-4-5-20250929-v1:0"  # 日本国内CRIS
# model_id = "anthropic.claude-sonnet-4-5-20250929-v1:0"  # グローバル（従来）


項目
設定内容


Claude Sonnet 4.5
jp.anthropic.claude-sonnet-4-5-20250929-v1:0

Claude Haiku 4.5
jp.anthropic.claude-haiku-4-5-20251001-v1:0

IAM権限
推論プロファイルとデスティネーションリージョン（東京・大阪）のモデルへのアクセス権限

!AWSの優位性:

従量課金で日本国内完結 - Google CloudはGSU購入（最低$2,000/月〜）が必須だが、AWSは従量課金のまま日本国内CRISが利用可能

最新モデルの日本対応 - Azure（GPT-5）やGoogle Cloud（Gemini 3.0）が最新モデルをグローバルのみで提供する中、AWSはClaude Sonnet 4.5を日本国内完結で提供

自動冗長化 - 東京・大阪間の自動ルーティングはDR（災害対策）としても機能

 6. 総合比較表
 モデル性能 vs データ主権のトレードオフ

優先事項
推奨プロバイダー
推奨モデル
月額コスト目安



データ主権最優先（医療・金融）
AWS Bedrock
Claude Sonnet 4.5 (CRIS)
従量課金（+10%）


データ主権最優先（シンプル構成）
Azure OpenAI
GPT-4o (Standard)
従量課金


データ主権最優先（Google志向）
Vertex AI
Gemini 2.5 Pro
$2,700/GSU〜（必須）

最先端モデルが必須（研究開発）
Azure OpenAI
GPT-5（ZDR適用必須）
ZDRで対応可？


 詳細比較表

項目
Google Vertex AI
Microsoft Azure
AWS Bedrock


日本対応モデル
Gemini 2.5 Pro/Flash
GPT-4o
Claude Sonnet 4.5

最新モデル
Gemini 3.0 Pro
GPT-5
Claude Opus 4.5

最新モデルの日本対応
❌
❌
⚠️ Sonnetは対応

データ主権保証
✅ asia-northeast1
✅ Japan East
✅ CRIS(Japan)

最小固定費
$2,700/月〜（必須）
構成による
なし（従量課金）


 コスト比較シミュレーション
 月間100万トークン処理の場合（入出力各50万トークン）

プロバイダー
モデル
入力コスト
出力コスト
月額合計


AWS Bedrock
Claude Sonnet 4.5 (CRIS)
$1.65
$8.25
約$10

Azure
GPT-4o (Standard)
$1.25
$5.00
約$6

Vertex AI
Gemini 2.5 Pro (参考値)※
$0.63
$2.50
約$3

Vertex AI
Gemini 2.5 Flash (参考値)※
$0.04
$0.08
約$0.12

!※Google Cloud Vertex AIの注意点: 上記の従量課金価格はグローバルエンドポイント利用時の参考値です。日本リージョン限定で利用する場合はGSU（Provisioned Throughput）の購入が必須となり、最低でも月額$2,000以上の固定費が発生します。医療用途ではこの固定費が前提となります。

 7. 医療機関向け確認事項
 実装時のチェックリスト
 規制対応
 3省2ガイドラインの要件を確認

 クラウドベンダーとの責任分界点を契約で明確化

 院内情報セキュリティ部門の承認取得

 データ保護
 患者データの匿名化・仮名化処理を中間サーバーで実施

 日本リージョン完結のサービスを選択

 監査・運用
 ログの保存期間・監査対応を設計

 インシデント対応手順を策定

 8. まとめ2025年12月時点で、医療機関がLLMを本番利用する場合の選択肢は以下のようにまとめられます。


状況
推奨選択肢


3省2ガイドライン完全準拠が必須
AWS Bedrock + Claude Sonnet 4.5（日本国内CRIS）

シンプルに始めたい
Azure OpenAI + GPT-4o（Japan East Standard）

Googleエコシステムを活用したい
Vertex AI + Gemini 2.5 Pro（GSU必須）

最先端モデルが必須（研究開発）
Azure OpenAI + GPT-5（ZDR適用で法的に利用可）


 最終的な判断基準重要なのは、最新モデルを使えるかではなく、患者データを守りながら実用的な価値を出せるかです。
令和7年5月の厚労省Q&Aにより、ZDR（データ保存なし）が契約で担保されていれば、GPT-5のような国外サーバーのモデルも法的には利用可能となりました。ただし現状このQ&Aの解釈も割れますし、ZDRの申請プロセスや契約上の担保が必要なため、運用がシンプルな日本リージョン完結のモデル（GPT-4o、Claude Sonnet 4.5、Gemini 2.5 Pro）から始めることをお勧めします。
データ主権を確保しながら、段階的にAI活用を進めていくことが、医療機関にとって最も現実的なアプローチです。
!筆者の個人的な推奨:

最初にも書いた通り、医療機関でLLMを使うなら、AWS Bedrock + Claude Sonnet 4.5（日本国内CRIS）が現時点でベストな選択肢だと考えています。
理由は3つ：

固定費なしの従量課金で日本国内完結 → 小規模から始めやすい

推論プロファイルIDを変えるだけで実装完了 → 導入コストが低い

東京・大阪の自動冗長化が標準装備 → DR対策も同時に達成
Google CloudのGSU（最低$2,000/月〜）やAzureのZDR申請プロセスと比較すると、運用も実装コストも圧倒的にシンプルです。しかもClaude Sonnet 4.5はコーディングや複雑な推論タスクで非常に優秀なモデルなので、性能面でも妥協なし。
「まずは試してみたい」という医療機関には、迷わずAWS Bedrockをお勧めします！

 参考リンク厚生労働省：医療情報システムの安全管理に関するガイドライン 第6.0版
厚生労働省：「医療情報システムの安全管理に関するガイドライン 第6.0版」に関するＱ＆Ａ（令和7年5月）
経済産業省・総務省：医療情報を取り扱う情報システム・サービスの提供事業者における安全管理ガイドライン
AWS Blog: Amazon Bedrock で日本国内に閉じた Claude 4.5 の推論が可能に
Google Cloud: Provisioned Throughput Documentation
Microsoft Learn: Azure OpenAI Service Models

項目	内容
正式名称	厚生労働省「医療情報システムの安全管理に関するガイドライン」＋経済産業省・総務省「医療情報を取り扱う情報システム・サービスの提供事業者における安全管理ガイドライン」
最新版	厚労省第6.0版（2023年5月）、経産省・総務省第2.0版（2024年12月）
対象	医療機関（病院・クリニック等）と、システム・サービス提供事業者の両方

要件	具体的内容
データの国内保存	患者データが日本国外のサーバーに保存されないこと
データの国内処理	推論処理自体も日本国内のリージョンで完結すること
外部委託時の責任分界	クラウドベンダーとの責任範囲を明確化すること
監査対応	ログの保存・追跡が可能であること

項目	Google Cloud	Microsoft Azure	AWS Bedrock
日本リージョンで使えるモデル	Gemini 2.5 Pro / Flash	GPT-4o	Claude Sonnet 4.5
最新モデル	Gemini 3.0 Pro	GPT-5	Claude Opus 4.5
最新モデルの日本対応	❌ グローバルのみ	❌ グローバルのみ	⚠️ 日本国内分散（東京+大阪）
データ主権の保証	✅ Gemini 2.5は完全国内	✅ GPT-4oは完全国内	✅ CRIS利用で国内完結

モデル	特徴	日本リージョン	用途
Gemini 2.5 Pro	100万トークンのロングコンテキスト、マルチモーダル対応	✅ 利用可能	長文医療文書の要約、マニュアル解析
Gemini 2.5 Flash	低遅延・低コスト	✅ 利用可能	リアルタイム応答が必要なシステム
Gemini 2.5 Flash-Lite	最軽量・最安価	✅ 利用可能	簡単な分類・タグ付けタスク
Gemini 3.0 Pro	最新の推論能力	❌ プレビュー段階（グローバル）	—

利用形態	リージョン指定	データの処理場所	医療用途・データ主権
Pay-as-you-go （通常の従量課金）	❌ 不可	グローバル（世界中の空きリソースで処理）	❌ 不適合（国内処理を保証できない）
Provisioned Throughput （GSU / スループット予約）	✅ 可能	指定リージョン（東京リージョンに固定可能）	✅ 適合（国内完結が可能）

利用形態	リージョン指定	医療用途
Pay-as-you-go（従量課金）	❌ グローバルのみ	❌ 不適合
Provisioned Throughput（GSU）	✅ リージョン指定可能	✅ 適合

コミットメント期間	月額単価（1 GSU）	割引率	備考
1週間	約$700/週	—	短期検証向け
1ヶ月	$2,700/月	基準価格	最小構成で月額約40万円
3ヶ月	$2,400/月	約11%OFF	四半期プロジェクト向け
1年	$2,000/月	約26%OFF	本番ワークロード推奨

入出力タイプ	消費レート	説明
テキスト入力	1:1	1トークン入力 = 1トークン分消費
テキスト出力	1:4	1トークン出力 = 4トークン分消費（生成は計算コスト大）
音声入力	1:7	マルチモーダル入力は高負荷
キャッシュ済入力	1:0.1	コンテキストキャッシュ活用で劇的にコスト削減可能

モデル	1 GSUあたりの処理能力	最小購入単位
Gemini 2.5 Flash	約3,360トークン/秒	1 GSU
Gemini 2.5 Pro	約800文字/秒	5 GSU
Gemini 2.5 Flash-Lite	約5,000トークン/秒	1 GSU

モデル	デプロイメントタイプ	日本東リージョン	データ処理場所
GPT-4o-mini	Standard	⚠️ 一部制限あり	日本国内で完結
GPT-5	Global Standard	❌ 不可	米国/欧州のみ
GPT-5-chat	Global Standard	❌ 不可	米国/欧州のみ

特性	GPT-4o (Standard)	GPT-5 (Global Standard)
日本リージョン	✅ Japan East	❌ なし
データ処理場所	日本国内で完結	米国東部2 or スウェーデン中部
医療用途	✅ 適合	⚠️ ZDR適用が必要

項目	内容
ZDRとは	Microsoftがプロンプト・生成結果を一切保存しないことをコミット
通常のデータ保持	不正利用監視のため最大30日間保持
ZDR適用後	推論完了直後にメモリ上から破棄
適用プロセス	Modified Access Reviewへの申請・承認が必要

特性	説明
仕組み	東京リージョンへのリクエストを、必要に応じて大阪リージョンに自動ルーティング
データ主権	日本国内（東京・大阪）のみで処理が完結
可用性	災害対策（DR）としても機能
課金体系	従量課金（オンデマンド）、固定費の購入不要
追加コスト	グローバル推論と比較して +10%

モデル	日本国内CRIS	特徴
Claude Sonnet 4.5	✅ 利用可能	推論能力と速度のバランスに優れる
Claude Haiku 4.5	✅ 利用可能	高速・低コスト
Claude Opus 4.5	❌ グローバルのみ	最高性能だが日本国内完結不可

モデル	入力価格（1Mトークン）	出力価格（1Mトークン）	備考
Claude Sonnet 4.5（グローバル）	$3.00	$15.00	地理的制限なし
Claude Sonnet 4.5（日本CRIS）	$3.30	$16.50	+10%
Claude Haiku 4.5（グローバル）	$1.00	$5.00	地理的制限なし
Claude Haiku 4.5（日本CRIS）	$1.10	$5.50	+10%

項目	設定内容
Claude Sonnet 4.5	`jp.anthropic.claude-sonnet-4-5-20250929-v1:0`
Claude Haiku 4.5	`jp.anthropic.claude-haiku-4-5-20251001-v1:0`
IAM権限	推論プロファイルとデスティネーションリージョン（東京・大阪）のモデルへのアクセス権限

優先事項	推奨プロバイダー	推奨モデル	月額コスト目安
データ主権最優先（医療・金融）	AWS Bedrock	Claude Sonnet 4.5 (CRIS)	従量課金（+10%）
データ主権最優先（シンプル構成）	Azure OpenAI	GPT-4o (Standard)	従量課金
データ主権最優先（Google志向）	Vertex AI	Gemini 2.5 Pro	$2,700/GSU〜（必須）
最先端モデルが必須（研究開発）	Azure OpenAI	GPT-5（ZDR適用必須）	ZDRで対応可？

項目	Google Vertex AI	Microsoft Azure	AWS Bedrock
日本対応モデル	Gemini 2.5 Pro/Flash	GPT-4o	Claude Sonnet 4.5
最新モデル	Gemini 3.0 Pro	GPT-5	Claude Opus 4.5
最新モデルの日本対応	❌	❌	⚠️ Sonnetは対応
データ主権保証	✅ asia-northeast1	✅ Japan East	✅ CRIS(Japan)
最小固定費	$2,700/月〜（必須）	構成による	なし（従量課金）

プロバイダー	モデル	入力コスト	出力コスト	月額合計
AWS Bedrock	Claude Sonnet 4.5 (CRIS)	$1.65	$8.25	約$10
Azure	GPT-4o (Standard)	$1.25	$5.00	約$6
Vertex AI	Gemini 2.5 Pro (参考値)※	$0.63	$2.50	約$3
Vertex AI	Gemini 2.5 Flash (参考値)※	$0.04	$0.08	約$0.12

状況	推奨選択肢
3省2ガイドライン完全準拠が必須	AWS Bedrock + Claude Sonnet 4.5（日本国内CRIS）
シンプルに始めたい	Azure OpenAI + GPT-4o（Japan East Standard）
Googleエコシステムを活用したい	Vertex AI + Gemini 2.5 Pro（GSU必須）
最先端モデルが必須（研究開発）	Azure OpenAI + GPT-5（ZDR適用で法的に利用可）

Livetoon Inc.Publication

はじめに

1. 3省2ガイドラインとは？

概要

なぜ厳しいのか？

LLM利用における実務的影響

2. 2025年12月時点のクラウドプロバイダー比較

各社の日本リージョン対応状況サマリー

まずは結論

3. Google Cloud Vertex AI

日本リージョンで利用可能なモデル

💰 【重要】日本リージョン固定にはGSU（固定費）が必須

なぜ従量課金（Pay-as-you-go）ではダメなのか？

💰 GSU（Provisioned Throughput）の価格体系

GSUとは？

価格表

GSUのバーンダウン（消費）メカニズム

Gemini 2.5のGSU要件

4. Microsoft Azure OpenAI Service

日本リージョンで利用可能なモデル

GPT-4oとGPT-5の決定的な違い

Global Standardデプロイメントの問題点

Zero Data Retention (ZDR) による対策

厚労省Q&Aによる公式見解（令和7年5月）

5. AWS Bedrock（Anthropic Claude）

Cross-Region Inference (CRIS) とは

日本リージョンで利用可能なモデル

価格体系（CRIS利用時）

実装方法

6. 総合比較表

モデル性能 vs データ主権のトレードオフ

詳細比較表

コスト比較シミュレーション

月間100万トークン処理の場合（入出力各50万トークン）

7. 医療機関向け確認事項

実装時のチェックリスト

規制対応

データ保護

監査・運用

8. まとめ

最終的な判断基準

参考リンク

Discussion