🌊

38BモデルのLoss spikeについての反省

に公開
東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]

Discussion