Open2024/09/27にコメント追加10LLMをAWS Lambdaで動かすAWSLambdaLLMOllamakun4322024/09/27に更新大きなモデルだと厳しいかもだけど、小さめのモデルや量子化されたモデルならばLambdaで動かせるんではないか?課題は色々ありそうだけど、Bedrockで提供されていないモデルとかが使えると良いなと思うので、まずはトライしている記事を集める。 返信を追加kun4322024/09/27に更新https://sebastianpdw.medium.com/serverless-llm-inference-with-ollama-29596ba5dd4e 返信を追加kun4322024/09/27https://www.reddit.com/r/aws/comments/180x2vt/running_mistral_7b_llama_2_13b_on_aws_lambda/ 返信を追加kun4322024/09/27https://medium.com/@seanbailey518/deploy-serverless-generative-ai-on-aws-lambda-with-openllama-793f97a7cbdd https://github.com/baileytec-labs/llama-on-lambda 返信を追加kun4322024/09/27https://zenn.dev/fusic/articles/llm-on-aws-lambda 返信を追加kun4322024/09/27に更新https://zenn.dev/nakamura196/articles/98e925a8821c4d https://aws.amazon.com/jp/blogs/compute/hosting-hugging-face-models-on-aws-lambda/ 返信を追加kun4322024/09/27https://qiita.com/oddgai/items/0d86e13014f898b6f811 返信を追加kun4322024/09/27https://medium.com/@mgsudhanva/deploying-hugging-face-transformers-model-on-aws-lambda-with-docker-containers-84c6f4483f2a 返信を追加kun4322024/09/27https://motemen.hatenablog.com/entry/2022/12/transformers-lambda 返信を追加kun4322024/09/27まあ普通に考えてこの辺がネックになるよな モデル引っ張ってくる時間 コールドスタートのレイテンシー 推論時間 Lambdaのメモリ 返信を追加
kun4322024/09/27に更新大きなモデルだと厳しいかもだけど、小さめのモデルや量子化されたモデルならばLambdaで動かせるんではないか?課題は色々ありそうだけど、Bedrockで提供されていないモデルとかが使えると良いなと思うので、まずはトライしている記事を集める。 返信を追加
kun4322024/09/27に更新https://sebastianpdw.medium.com/serverless-llm-inference-with-ollama-29596ba5dd4e 返信を追加
kun4322024/09/27https://www.reddit.com/r/aws/comments/180x2vt/running_mistral_7b_llama_2_13b_on_aws_lambda/ 返信を追加
kun4322024/09/27https://medium.com/@seanbailey518/deploy-serverless-generative-ai-on-aws-lambda-with-openllama-793f97a7cbdd https://github.com/baileytec-labs/llama-on-lambda 返信を追加
kun4322024/09/27に更新https://zenn.dev/nakamura196/articles/98e925a8821c4d https://aws.amazon.com/jp/blogs/compute/hosting-hugging-face-models-on-aws-lambda/ 返信を追加
kun4322024/09/27https://medium.com/@mgsudhanva/deploying-hugging-face-transformers-model-on-aws-lambda-with-docker-containers-84c6f4483f2a 返信を追加