Zenn
rlhf
このトピックを指定するには
rlhf
と入力
Articles
6
articles
Trending
Alltime
Latest
🤖
模倣を越える生成AIのためのフィードバック学習と画像への応用【RLHF, DPO】
Yosemat
2024/04/14
11
🥰
人間の好みを学習するDPOを理解してみよう!
toki_mwc
8日前
2
✨
強化学習における報酬ハッキング (新しい研究論文の紹介)
ロン
15日前
2
🐣
生成 AI を私の色で染めたい ~RLHF から DPO へ~
ひよこまんじゅう
1ヶ月前
🦁
Transformer言語モデルの強化学習ライブラリまとめ
しもし
2023/06/30
1
🍣
RLHFとTRLとPEFTの関係性
やまもってい
2023/10/21
3