Open8
ネタ帳
目次
- 導入
- 確率過程
- 拡散過程
- ブラウン運動
- 伊藤の補題
- マーク付き点過程
- ポアソン過程
- Hawkes過程
- パラメータ推定
- 最尤推定
- 拡散過程
- 確率制御
- 動的計画法・最適性原理
- HJB方程式
- LQ制御
- 非線形確率制御
- 数値計算手法
- 強化学習
- モデルフリー強化学習
- モデルベース強化学習
- 分布型強化学習
- 連続時間強化学習
- 確率制御と強化学習の関係
- ファイナンスへの応用
- Liquidation
- Market making
- Hedging
Appendix
- 数値計算や実験のpython実装
- 補題や定理の証明
- 最適制御理論
レバレッジを制御変数だと思えばレバレッジ最適化もまとめられそうなので追加
ファイナンスではまず確率過程を構成しにいく、という展開をよくみるが、確率システムや物理ではホワイトノイズやランジュバン方程式を持ってきて、ブラウン運動との対応関係を確認する、という展開がよくある
前者の展開を採用しようかと思っている
フィルタの話とPOMDPも入れたい
FBSDEの話も関連あるかもしれない
richmanbotやトリプルバリアの話も入れる
FBSDEは入れる
連続時間強化学習out MPC in