🙌

#2 超初心者がKaggleのコンペに出場してみた

2024/04/01に公開

クロスバリデーション

KaggleでスコアをSubmitするのに回数制限があります。でもクロスバリデーションを用いると、回数制限なく自分の機械学習アルゴリズムの性能を知ることができます。あとは一度予測の値が良くても、その予測した部分が過学習によってたまたまいー感じに予測できていたみたいなこともある。でもクロスバリデーションはそれを防げる。クロスバリデーションは複数回にわたってデータセットを分割して、それぞれでホールドアウト検証(一種のvalidation=機械学習の性能を見つめること)を実行する方法だそうです。

ホールドアウト検証とは

引用:https://qiita.com/upura/items/3c10ff6fed4e7c3d70f0

クロスバリデーションとは

感想

本日は3月31日、コンペ最終日です。
常に全体像を把握しながら「自分は今ここのこの部分の処理をしているんだな。この処理があの処理に繋がるんだな。」といったように、全体を認識しつつ今の目の前にやっていることに注目した方が実感が湧きますし、なにより勉強が楽し苦なりそうな感じです。というのも例えばKaggleのコンペではある6ステップを踏むことでSubmitできるとした場合、分析中、「今自分はステップ2だから残り4ステップだな」みたいに考えることができます。

(追記)
今日は4月1日です。結局コンペでは何も提出できませんでした笑。でも、取り組んだという姿勢は我ながら自分を褒めてあげたいです笑。今回学んだことは専門用語が多くまた、英語での文章が多く、あまり何やっているのか理解できなかったということです。なので次は日本語で書かれた書籍を通じて機械学習を学ぼうと思います。「Kaggleで磨く機械学習の実践力」という書籍でやっていきます!

Discussion