🤖

GPUスパコンでvllmを試してみた:はじめに

に公開

Zennを使ってみるテスト兼作業メモ。

ふと、GPUスパコンでvllmを動かしてみようと思った。

資料

https://docs.vllm.ai/en/latest/getting_started/installation/gpu.html

環境

以下、試した内容を別記事に記す。適宜更新。

  • Pre-build wheel編
    • ビルド済みのものを持ってきて使う版。
    • 動きはしたのだが、Qwen3-Coderのserveを試してみたらエラー。
  • Build wheel from source編
    • 自分でビルドして使う版。
    • Qwen3-Coderのserveに成功。(小規模なものでのみ動作確認。)

Discussion