😎

競馬AI記事超要約集 (随時更新)

2021/05/19に公開

はじめに

はじめまして。
goto yutaです。 (twitter: @goto_yuta_)

最近競馬AIを始め、ちょっとずつ上手く行き始めているので備忘録も兼ねてzennを始めました。

競馬ではオッズ(金)が絡み、知見が共有されにくい風潮があります。
しかし、個人的にはもう少し知見が貯まって欲しいと思ってるので、自分の学習も兼ねて知見を共有して行こうと思います。

最近では競馬AIの基盤も整ってきており参入障壁は無くなってきていると感じます。
理由としては以下のようなことが挙げられます。

  • 面倒なデータの整備については、scrapingソースコードが公開されている
  • YouTubeとかでも知見の共有が行われているので、手を動かすのがしんどくても良い

https://www.youtube.com/watch?v=P_GSJoWyEnQ

本記事で触れること

今回は競馬AIを作るにあたって私が読んで有益と感じた記事をほぼ一言でまとめていこうと思います。
以下のような記事が多めです。

  • 機械学習の知識がそんなにいらない (主観ですが)
  • 機械学習と関係ない競馬のドメイン知識関連

このようになっているのは、機械学習の知識については他で賄えるからです。

要約一覧

Predict the Winning Horse (リンク)

kaggleにある。
実際にこの中にあるコードをコピペすれば簡単な競馬AIは作れてしまう。

競馬予測AI「Mamba」の思考に迫る

Mambaの期待値閾値の設定と、投資シミュレーションの結果の回収率などについて考察し、条件別の結果などについてもまとまっている。

実践・競馬データサイエンス  (リンク)

Alphaimpact中の人(twitterアカウント)が競馬AIの基本についてまとめたスライド。

  • 周期性のある特徴量は三角関数で表現できる
  • One-Hot-Encodingをする際に出現回数で足切りすることで時限削減する
  • カテゴリ変数はダミー化したほうが精度が出ることが多い

など、工夫点や実用的なtipsについて触れてるのも良い。

Road to Winning at Horse Racing with Data Science (リンク)

同じくAlphaimpact中の人による競馬AIまとめスライド。
ただし英語。
先ほどのスライドと内容の重複も多いが、重複していない内容もあるのでおすすめ。
回帰、分類、ランキングの3つの内どの学習をが良いかなどにも触れている。

オッズの歪みを使った競馬戦略 (リンク)

機械学習とは関係ないが、競馬のオッズがどういう時に歪むかをわかりやすく書いている。

競馬予測界のディープインパクトを作るために (リンク)

競馬予測 モデルを作るために試行錯誤した事例を紹介するスライド。
勝てるモデルを紹介してるわけではない。
勾配ブースティングではなく深層学習を用いている点が希少。
走破タイムを予測するモデルと3着以内を予測するモデルの2つを試している。

競馬予測の苦楽 (リンク)

個人的に神記事。
目的変数のエンジニアリングの重要性に触れていて良い。

競馬人工知能を1年間育てた話 (リンク)

AlphaImpactを開発して得た実践的な知見とかまとまってるのは嬉しすぎる。
特徴量の次元数とサンプル数に対するモデルの選び方などに触れている。

機械学習で競馬を勝つために必要なこと (リンク)

AIの中身の内容は古い記事なので他に劣っているが、リアルタイムでデータをどこから引っ張ってくるとか、実運用に即した内容。

Pythonを用いて3連単のオッズの歪みを検知する方法 (リンク)

単勝のオッズを基準に、3連単のオッズと比較して歪みを検知する記事。
コード付き。
読みやすくて面白い。

【競馬のオッズ理論】たった2ステップで回収率を劇的に向上させる方法 (リンク)

開発に役立つかは現状謎だが、断層などのオッズ理論について。
知っておいて損はないはず。

最後に

随時更新していきます。
他にも、おすすめ等あればtwitterで教えていただけると嬉しいです。

Discussion