🛬

GPUクラウド早見表(随時更新)

2024/03/04に公開

AIの普及に伴い、高速なGPUを備えたサーバーでのサービス提供が必要とされています。この記事では、さまざまなクラウドサービスで提供されるGPU搭載サーバーについて、WebサービスなどでAPIを利用する観点での個人的な使用感を含めて紹介します。

紹介するサービスでは、自作のモデルをアップロードし、実行することが可能です。

Runpod

https://www.runpod.io/
通常利用
A100 80GB $1.89/hr
RTX 3090 $0.44/hr

サーバーレスモード
A100 $4.68/hr
RTX 4090 $1.5/hr

個人的には最も使いやすくおすすめです。
Runpodの特徴はなんといっても処理が走っていない時間はゼロスケールすることで課金を0にするサーバーレスモードです。サーバーレスモードは秒単位で課金され、スケールアウトさせることができます。
ゼロスケールしてコールドスタートした場合の起動が非常に速く、非常に低いコストでサービス提供が可能です。
多機能で非常に使いやすいです。

vast.ai

https://vast.ai/
A100 $0.88/hr~
RTX 3090 $0.14/hr~
vast.aiは個人で運用しているサーバーを貸し借りできるマーケットプレイスです。したがって、時期によって価格は異なります。サーバーレスモードは使えないですが、時間あたりは最も安いので、モデル開発などで起動しっぱなしで学習回すなどといった用途では有用かと思います。
個人のサーバーに接続するので機密情報を扱う際には注意が必要です。一応Secure Cloudという認定があり、こちらから提供されているものなら機密情報を扱えるとしています。

Replicate

https://replicate.com/
A100 $5.04/hr
Replicateの特徴的なのは、様々なモデルが公開された状態で提供されています。もちろん非公開にして自分専用のモデルをアップロードすることも可能です。
Runpodと同じくゼロスケールが可能ですが、コールドスタートに非常に時間がかかり、APIとして使いにくいです。
個人的にはHuggingFaceより高速で様々なモデルを触るのを楽しんでいます。

https://modal.com/
A100 $5.59/hr
サーバーレスモードが利用可能です。
前に紹介したものは、Dockerfileを作成したり難易度が高いですがModelはソースコードのみで利用することができ、利用難易度が低いです。

LambdaLab

https://lambdalabs.com/
AWSよりは安いですが、比較的高価です。
エンタープライズ向けの印象で、サービス提供目的には使いにくいです。

Discussion