はじめての Google Cloud:AIを日本国内だけで安全に使うためのやさしい設定ガイド(カルテメイト対応)
📚 この連載の記事一覧
- 医療AIを使う前に知るべき大前提:“リージョン”と個人情報保護の基本ガイド
- 医療AIを安全に導入!Azure OpenAIで始めるカルテ作成と音声認識のやさしい設定ガイド
- はじめての Google Cloud:AIを日本国内だけで安全に使うためのやさしい設定ガイド
- 完全ローカル運用で安心!WhisperとLM Studioを使った音声認識&AI活用入門
この記事は「医療×AI」連載の第3回です。
第1回では「ChatGPTにカルテを送ると危ないよ」という話をしました。
第2回では「Azureを使った日本リージョンでのカルテメイト設定方法」を解説。
今回は Google Cloud Platform(GCP) を使って、
診療内容の文章生成や音声の文字起こしを日本国内で安全に行う方法 を解説します。
1. Google Cloud Platformってなに?Geminiと何が違うの?
❌ Geminiは“個人むけ”
-
Gemini をブラウザやアプリからそのまま使うと、入力した内容(カルテや録音)が
アメリカのサーバーに送られる可能性があります。 -
しかも、場合によっては学習に使われることもあります。
-
また、Gemini無料枠のAPIは学習に使用されることが明言されています。
✅ Google Cloud Platformは“業務むけ”
-
Google Cloud(略してGCP)は、企業や向けに作られたサービスです。
-
東京にあるデータセンターだけを使う設定ができ、
医療データを日本国内で完結させることができます。 -
学習用データとして使われることもありません(設定でOFFにできます)。
2. 登録と最初の設定
ステップ① Google Cloudに登録
-
Googleアカウント(Gmailなどで使用しているものです)でログイン
-
「新しいプロジェクトを作成」ボタンを押し、名前をつける(例:clinic-ai)
-
クレジットカードを登録(無料枠あり・実際に使わなければ請求なし)
ステップ② 必要なAI機能を「有効」にする
Google Cloud では、使うAI機能を「ON」にする必要があります。
- 左上のメニュー(3本線) →「APIとサービス」→「ライブラリ」へ
- 検索ボックスに
Vertex AI API
と入力 → 「有効にする」ボタンをクリック
- 同様に
Cloud Speech-to-Text API
も検索 → 有効にする
3. 合鍵を作ろう(サービスアカウント)
カルテメイトがGoogleのAIに接続するための“鍵”を作成します。
ステップ③ サービスアカウントを作る
-
左上メニュー →「IAMと管理」→「サービスアカウント」
-
「サービスアカウントを作成」ボタンをクリック
-
サービスアカウントID:
clinic-access
(自由) -
権限を選ぶ画面で:
- 「ロールを追加」→「Vertex AI ユーザー」
- 再度追加 →「Cloud Speech クライアント」
*わかりにくいですが、こうすることで、このアカウントでVertexAI(gemini)と音声認識が使える権限が付与されます。
- 作成したサービスアカウントをクリックして、「鍵」タブから「新しい鍵を作成」→「JSON形式」を選択
- ダウンロードされた
.json
ファイルが認証情報となります。安全な場所に保管しておきましょう。
📌 弊アプリカルテメイトでも、このJSONファイルを使用します。
📥 JSONファイルの保存場所と注意点
-
サービスアカウントを作成したあとの最後の画面で
「キーを作成」→「JSON形式」を選ぶと、ファイルがダウンロードされます。 -
このとき保存された
.json
ファイルが、カルテメイトで連携するために必要な「鍵」です。 -
再発行は可能ですが、安全な場所にバックアップして保管しておきましょう。
5. 音声認識(Speech-to-Text)を日本で使う設定
ステップ⑥ 認識ツールを作る
-
ホーム画面検索欄から、「認識ツール」を検索してクリック
-
「+作成」ボタンをクリック
-
入力例:
設定項目 | 入力例 |
---|---|
名前 |
clinic-voice (自由) |
ロケーションタイプ | リージョン |
リージョン |
asia-northeast1 (東京) |
モデル | short |
言語コード |
ja-JP (日本語) |
カルテメイトを使用する場合はモデルはshortを推奨します
(内部的に30〜60秒のチャンクに区切って文字起こし処理をしています)
6. カルテメイトを使った設定例(Vertex AI活用時の参考)
ここでは、Google Cloudで構築したAI環境をどのように既存のアプリケーションで活用できるかの一例として、Windowsアプリ「カルテメイト」を用いた設定方法を紹介します。
● 文章生成に使う設定
設定項目 | 入力内容 |
---|---|
使用するLLM |
Google Vertex AI を選択 |
サービスアカウント連携 | 「JSONファイルを選ぶ」ボタンから、先ほどダウンロードした .json ファイルを選択 |
🔐 残念ながら、2025年現在、Gemini 2.0以降のシリーズは日本リージョンで使用できません。
また、1.5シリーズも、以前から使用しているプロジェクトでないと使用できません。
Vertex AI モデルIDの欄にモデルIDが表示されない場合は、LLMにVertexAIを使用することはできません。
● 音声認識(文字起こし)に使う設定
設定項目 | 入力内容 |
---|---|
音声認識エンジン |
Google Speech-to-Text v2 を選択 |
サービスアカウント連携 | 「JSONファイルを選ぶ」ボタンから、同じ .json ファイルを選択(または別のファイルでも可) |
🔐 Google STT v2 や Vertex AI では必ず JSON ファイルでのサービスアカウント連携を行ってください。
7. よくある疑問
Q. 会話を文字起こしして、その後カルテを作成させるとしたら、どのぐらいのコストがかかある?
診察録音を Google Speech-to-Text v2 で文字起こしし、Gemini 1.5 Flash を使ってカルテ作成と紹介状作成を行う場合の費用の目安を計算してみました。
■ 音声認識(STT)— Google Speech-to-Text v2
項目 | 内容 |
---|---|
処理方式 | 音声ファイルをまとめて変換(バッチも可能) |
単価 | 約 US $0.016 / 分($0.96 / 時間) ※ログONなら $0.012 / 分まで割引可 |
試算例 | 60件 × 10分 = 600分 → $9.60/日 |
月額目安 | 22営業日 × $9.60 ≒ $211.20(約 ¥32,700) |
■ LLM処理 — Gemini 1.5 Flash を使ったカルテ+紹介状作成
処理内容 | 件数/日 | 入出力token数 | 単価 | 小計 |
---|---|---|---|---|
カルテ作成(全件) | 60件 | 入1200 + 出400 = 1600 tokens | $0.00009 + $0.00012 = $0.00021/件 | $0.0126/日 |
紹介状(10人分) | 10件 | 入600 + 出500 = 1100 tokens | $0.000066 + $0.00015 = $0.000216/件 | $0.00216/日 |
Gemini Flash 単価:入力 $0.075/M tokens、出力 $0.30/M tokens
■ 合計費用の目安
項目 | コスト(USD) |
---|---|
STT(音声認識) | $9.60/日 |
カルテ作成(全件) | $0.0126/日 |
紹介状作成(一部) | $0.00216/日 |
合計 | 約 $9.61/日 ≒ ¥1,490/日 |
✅ 患者1人あたり 約5円 の追加コストで、音声文字起こし+カルテ+紹介状の自動化が実現できます。
8. まとめ
-
Google Cloud でも 「日本リージョン」に指定すれば安心してAIが使える
-
残念ながらGeminiシリーズは日本リージョンで(ほとんどの人は)使用できない
9. 次回予告
次回は 「クラウドを使わず、すべてローカルで完結」 する方法を紹介します!
→ Whisper や LM Studio を組み合わせて、完全にオフラインでもAIが使える構成をご紹介。
補足:カルテメイトについて
記事内で例示した「カルテメイト」は、音声認識とカルテ作成を支援するWindowsアプリケーションの一例です。
Vertex AIやGoogle Speech-to-Textなど、Google Cloud上で構築した機能と連携することが可能です。
興味のある方は「カルテメイト」でWindowsストアを検索してみてください。
ご意見・ご相談はこちらへ
X (旧Twitter) @medrecmate へお気軽にDMどうぞ 📨
Discussion