🍰

出力品質が下がらないLLM推論高速化手法「投機的デコーディング」

に公開

Discussion