binomialsheep

 概要codingameのUittimate Tic-Tac-Toeを題材にMCSTを学ぶ。
https://www.codingame.com/ide/puzzle/tic-tac-toe
とりあえず自分用なのでルール概要とかは書かない

落ち着いたらQiitaにまとめるかも

 Twitterのツリーhttps://x.com/BinauralSheep/status/1824414071099363478

binomialsheep

 教材、リンク集
 書籍『ゲームで学ぶ探索アルゴリズム実践入門』

『AlphaZero 深層学習・強化学習・探索 人工知能プログラミング実践入門』

 論文まずは日本語の博士論文を読む典型。導入が詳しい。

モンテカルロ木探索の改善に関する研究
日本語だけでも色々出てくる

 記事https://inaniwa.hatenablog.com/entry/2020/07/05/102506
https://mimemo.io/m/qERa6lBZLklPb0v
https://valgrowth.hatenablog.com/entry/2023/02/11/103944

 ツイート
 MCTShttps://x.com/pu__Ne/status/1527100007840903168
https://x.com/KawattaTaido/status/1668825827491086336
https://x.com/yamake_cpp/status/1410802500890816518
https://x.com/yamake_cpp/status/1410727823543738375
https://x.com/bowwowforeach/status/1394218302176563200

 高速化tipshttps://x.com/pu__Ne/status/1524581545901948928
https://x.com/yusapon_/status/1491751568550494209
https://x.com/inani_waon/status/1348589416550318080
https://x.com/inani_waon/status/1273669470876102657

 その他https://x.com/pu__Ne/status/1523961182205640704
https://x.com/inani_waon/status/1272753149942456321

 コドゲ直前の対戦の統計が見れる便利サイト。

http://cgstats.magusgeek.com/app/multi-tic-tac-toe/BinomialSheep

binomialsheep

高速化

vectorをarrayにする

before

const int pow_4_9 = 262144;
vector<int> big_winning_status(pow_4_9);
vector<int> small_winning_move_map_o(pow_4_9, -1);

after

constexpr int pow_4_9 = 262144;
array<int, pow_4_9> big_winning_status_map = {};
array<int, pow_4_9> small_winning_move_map_o = {};
// -1埋めはfill(small_winning_move_map_o.begin(), small_winning_move_map_o.end(), -1);

bit board

32bit整数を9個（＋big board用の1個）持つ。
2桁ごとに1マスを当てて、00が.、01がx, 10がo, 11が引き分け（big board用）のように持つ。
board[i] |= 2 << (桁数 * 2)のように使えるので便利。

binomialsheep

MCTS

テンプレ

サンダー本を使う。

パラメータ調整

大差なし。
c 1.0 EXPAND_THRESHOLD = 10 210位
c 1.2 EXPAND_THRESHOLD = 10 226位
c 0.8 EXPAND_THRESHOLD = 10 225位
c 1.0 EXPAND_THRESHOLD = 15 201位
c 1.0 EXPAND_THRESHOLD = 20 210位

binomialsheep

 順位情報Woodはminimaxでよい。

Bronzeからモンテカルロ。バグなく原始モンテカルロすればゴールドまでは上がるはず。ブロンズで勝てない場合は何かがおかしい。

 原始モンテカルロ620/8940位（Gold 283/1132位）

 原始モンテカルロ高速化594/8940位

 MCTS555/8941位

 前計算改善540/8941位

 root_nodeを作り直さずに張り替えで再利用506/8941位

 MCTS-solver（枝刈りしただけ）515/8949位

 bit board446/8951位

 ↑を高速化428/8951位

binomialsheep

TODO

終盤をalphabetaにする
異常高速化
序盤を定石化・単純多腕バンデット化する
論文のtranspotision入れる工夫を試す
MCTS-solverの更なる活用を試す
次同じ盤面になる手はグループ化する

binomialsheep

 論文リスト
 モンテカルロ木探索の改善に関する研究日本語の博士論文。

イントロで基本知識がすごく解説されていて良い。

MCTS-Solverの改善やハイブリッドMCTSの考察も試しやすそう。

 A Survey of Monte Carlo Tree Search Methods2012年までのMCTSの包括的なサーベイ。

 Monte Carlo Tree Search A Review of Recent2012年から2021年までのMCTSの包括的なサーベイ。かなり込み入った内容かも。

 Transpositions and Move Groups in Monte Carlo Tree Search転置テーブルや指し手のグループ化をどう取り入れるか。実装上重要そう。

 Revisiting Move Groups in Monte Carlo Treeグループ化再考。

 Monte-Carlo Tree Search SolverMCTS-Solverの提案論文。実装上は『モンテカルロ木探索の改善に関する研究』だけでいいかも。

binomialsheep

Kaggleで始まったやつ、何らかのヒントになりうる？まだ不明。