Open2

【LLM Tips/ML Tips】LLMモデルの精度向上 / 高い精度を出すために使えるアプローチ📝

まさぴょん🐱まさぴょん🐱

限られた計算資源で高い精度を出すために使えるアプローチ📝

まさぴょん🐱まさぴょん🐱

トレーニングのSFT -> RLの順序📝

SFTでできるだけいい点数を取ってからRLをする方がいいかも。
RLのトレーニングでマイナスになるケースが多いです。