Open10

LLMをAWS Lambdaで動かす

kun432kun432

大きなモデルだと厳しいかもだけど、小さめのモデルや量子化されたモデルならばLambdaで動かせるんではないか?課題は色々ありそうだけど、Bedrockで提供されていないモデルとかが使えると良いなと思うので、まずはトライしている記事を集める。

kun432kun432

まあ普通に考えてこの辺がネックになるよな

  • モデル引っ張ってくる時間
  • コールドスタートのレイテンシー
  • 推論時間
  • Lambdaのメモリ