この本では、tensorflow を利用したじゃんけんの勝敗予測についての内容をまとめています。
じゃんけんの勝敗予測は、カメラを利用したりせずに整数値の組み合わせから学習します。
例えば、自分がグーを出したときに相手がパーであった場合の結果は「負け」となります。
このときの「負け」という結果を「グー」「パー」の2つの値から推測します。
一般的なじゃんけんでは、出せる手の種類は「グー」「チョキ」「パー」の三種類となります。
最初はこの三種類を使って勝敗を予測し、あとからもう一つ追加して再度学習させます。
追加するのは子供の頃によく追加されていた「爆弾」という手です。
この手を出すと、「グー」「チョキ」「パー」に必ず勝つことができるけれど、同じ「爆弾」には負けるという結果になります。
事前に学習した結果を使って、あとから入力を増やして再度学習することができれば、他の題材を使って機械学習した場合でも応用が効くはずです。
以降のチャプターではコピペで動かせるコードと、そのコードについての解説を載せています。
実装しつつ詰まった点や、試したことについても載せているので、実装時の参考にしてみてください。