JAX実装による、モデルフリーとモデルベースの良いとこどりをした強化学習法 「TD-MPC」

JAX実装による、モデルフリーとモデルベースの良いとこどりをした強化学習法 「TD-MPC」

無料で読める本

当記事は兵庫県立大学の橋本尚典(https://researchmap.jp/Takanori_Hashimoto)によって寄稿されました。 ICML 2022で発表された論文「Temporal Difference Learning for Model Predictive Control」を JAX での実装例を交えながら紹介します。

Author
株式会社 Proxima Technology
Topics
¥0今すぐ読む
公開
本文更新
文章量
77,273
価格
0