JAX実装による、モデルフリーとモデルベースの良いとこどりをした強化学習法 「TD-MPC」
無料で読める本
当記事は兵庫県立大学の橋本尚典(https://researchmap.jp/Takanori_Hashimoto)によって寄稿されました。 ICML 2022で発表された論文「Temporal Difference Learning for Model Predictive Control」を JAX での実装例を交えながら紹介します。
Author
Topics
当記事は兵庫県立大学の橋本尚典(https://researchmap.jp/Takanori_Hashimoto)によって寄稿されました。 ICML 2022で発表された論文「Temporal Difference Learning for Model Predictive Control」を JAX での実装例を交えながら紹介します。