Zenn
Log in
GRPO
このトピックを指定するには
grpo
と入力
フォロー
Articles
5
articles
Trending
Alltime
Latest
🌡️
強化学習「GRPO」をCartPoleタスクで実装しながら解説
小川 雄太郎
in
松尾研究所テックブログ
2ヶ月前
74
🦁
DeepSeek R1! わくわく強化学習
Saito
2ヶ月前
11
📝
DeepSeek-V3 Technical Report
DeepKawamura
3ヶ月前
5
📝
DeepSeekMath : Pushing the Limits of Mathematical Reasoning in Open LM
DeepKawamura
3ヶ月前
1
👨🚒
RAGにGRPOを組み合わせて応答精度を改善する
stpete_ishii
19日前
1