Vertex AIの料金まとめ
(2023/12/03時点)
Vertex AIの機能ごとや、周辺機能の料金を調べてまとめてみる。
以前調べた時と変わっている部分がありそうなので、インフラの再考のために。
※自分の使わなさそうな機能はこの記事では書かない。
生成AI
画像
- 画像生成・編集: $0.02 / 1枚(1024x1024)
- Fine-turn: カスタムトレーニングと同料金
- マルチモーダル埋め込み: $0.0001 / 画像(サイズ不明)
自然言語
- PaLM2: 入力/出力 $0.0005 - $0.0010 / 1,000文字
- Gecko埋め込み: $0.0001 / 1,000文字
- コード生成・チャット・補完: $0.0005 / 1,000文字
※ 課金単位はトークンではなくUTF-8コードポイントらしい。
Vertex AI の生成生成サポートは、入力 1,000 文字(プロンプト)と出力 1,000 文字(レスポンス)ごとに課金されます。文字数は UTF-8 コードポイントでカウントされ、空白文字はカウントから除外されます。プレビュー段階では、料金が 100% 割引されます。予測リクエストで応答がフィルタリングされた場合、課金対象は入力のみとなります。各請求期間の最後に、1 セント($0.01)未満の小数部分は、1 セントに切り上げられます。
AutoML
データ形式毎に料金が大きく異なる。
AutoMLは個人利用などでは少し危険で、オンライン予測は基本的にインスタンスをずっと立てっぱなしにされるため、予測した分だけ課金されるわけではなくインスタンスが立っている時間で課金される。(前に画像系のAutoMLでとんでもない額の請求されているQiitaの記事を見た気がする...)
以下全て1ノード時間ごとの料金。
- 画像(分類・オブジェクト検出)
- トレーニング: $3.465
- デプロイ&予測: $1.375 - $2.002
- 動画(分類・オブジェクトトラッキング)
- トレーニング: $3.234 - $3.300
- デプロイ&予測: $0.462 - $0.550
- 表形式(分類・回帰)
- トレーニング: $21.252
- 予測: 40 n1-highmem-8($0.54)
- テキスト
- トレーニング: $3.30
- デプロイ: $0.05
- 予測(デプロイとは別料金): $5.00 / 1,000テキストレコード
テキストレコードは1,000文字までのブロックのこと。
Vertex AutoML テキスト予測リクエストの料金は、分析のために送信したテキスト レコードの数に基づいて計算されます。テキスト レコードとは、最大 1,000 文字までの Unicode 文字(空白文字や、HTML / XML タグなどのマークアップを含む)からなる書式なしテキストです。
時間単位だと表形式が突出して高価となっているが、おそらくモデルが軽いのでトレーニングに時間がかからないためと予想。(他のデータ形式は基本的に大きいモデルが必要なはず)
Vertex AI Pipelines
パイプライン実行ごとに$0.03のみ課金される。
※ただし、実行に必要なリソース料金は別。
Vertex AI Feature Store
Feature storeは表形式のデータなどに主に使われる特徴量のストレージで、特徴としては、オフライン(学習・バッチ推論時)・オンライン(リアルタイム予測時)でストレージが分かれていて、必要となるパフォーマンスに最適なリソースを配置することが出来る。また、コード側ではオフライン・オンラインで特に差異がないので開発もしやすいもの。
- オフラインストレージ: $0.023 / GB month
- オンラインストレージ: $0.25 / GB month
- オンラインサービング: $0.94 / 1ノード時間
- バッチエクスポート: $0.005 / GB
- ストリーミングインポート: $0.10 / GB
オンラインサービングはおそらくリアルタイム予測時のストアとして立たせるインスタンスの料金だと思う。オフライン時はそのコストはかからない模様。
Vertex ML Metadata
課金対象はストレージのみで、1GBあたり月額$10となる。(計算はMB単位)
Vertex AI TensorBoard
課金対象はログと指標のデータのみで、こちらも1GBあたり月額$10となる。
Vertex AI Vizier
Vertex AI内のブラックボックス最適化サービスで、ランダムサーチ、グリッドサーチを利用するトライアルは月に100回まで無料、それを超えると1回につき$1かかる。
Vertex AI Matching Engine
Vertex AI内のベクトル検索(近似最近傍探索)のサービスで、主にインスタンスのノード時間、インデックスの作成・更新に料金がかかる。インデックスは作成・更新で1GBあたり$3.00、ストリーミングアップデートで1GBあたり$0.45となる。
料金は秒間クエリ数やデータ数、次元数(データサイズ)などに依存するため計算がちょっと複雑で、例を見るのが間隔が分かりそう。
エンベディング数/ベクター | 次元数 | 秒間クエリ数(QPS) | マシンタイプ | ノード | 月額利用料金 |
---|---|---|---|---|---|
200 万回 | 128 | 100 | e2-standard-2 | 1 | $68 |
2,000 万 | 256 | 1,000 | e2-standard-16 | 1 | $547 |
2,000 万 | 256 | 3,000 | e2-standard-16 | 3 | $1,642 |
1 億個 | 256 | 500 人 | e2-highmem-16 | 2 | $1,477 |
10 億 | 100 | 500 人 | e2-highmem-16 | 8 | $5,910 |
上記に加えて作成料金(データサイズ(GB) x $3.00 x 更新回数)がかかる。
Vertex AI Model Registry
モデルの登録には料金がかからない。
料金がかかるのはデプロイ(オンライン予測)とバッチ予測の時のみ。
Vertex AI Model Monitoring
このサービスではVertex AIのモデルの入出力データの監視などを行えるため、機械学習プロジェクトでよくあるトレーニング/サービングスキューを検出したりすることができる。
課金対象は基本的には分析されるデータで、1GBあたり$3.50かかる。
Vertex AI Workbench
Vertex AI内のJupyter notebookをベースとした環境で、インスタンス、マネージドノートブック、ユーザ管理ノートブックの3種類がある。料金は使用するリソースとは別に管理用が発生する。
- インスタンス
- CPU: $0.044 (N1)
- メモリ: $0.0059 (N1)
- GPU: $3.52 (A100)
- マネージドノートブック(管理料のみ)
- CPU: $0.05
- GPU: $0.35 (T4, K80, P4), $2.48 (P100, V100, A100)
- ユーザ管理のノートブック(管理料のみ)
- CPU: $0.005
- GPU: $0.035 (T4, K80, P4), $0.25 (P100, V100, A100)
個人利用に向いているか
個人利用に向くかといわれると、正直微妙な気がする。
理由は以下の2つ。
- 低価格なインスタンスが使えない
- インスタンスの上乗せ料金がまあまあ高い(15%くらい)
用途としてバッチ推論を短時間で行うだけなら良さそうだが、オンライン予測として推論APIを立てっぱなしにしたいときはもうちょっと安いインスタンスが使いたいし、何ならプリエンティブルインスタンスが使いたい。更に欲を言うと、無駄なくリソースを使いたいのでコンテナ単位でリソースを指定して課金とかにしてほしい。(自前でクラスタを立てれば管理料がかかるものの、より効率的にリソースを使えるはず)
だた、以前のAI Platform Pipelinesは確かKubeflowのクラスタの料金自体もかかっていた気がするから、それと比べると個人利用はしやすくなっているかもしれない。そもそもあまり計算資源を必要としないが、実験管理やモニタリングなどの環境だけほしいという場合にはかなりいい選択かもしれない。(Tensorboardのユーザ当たり月$300とかいうとんでも価格もなくなったので)
Discussion