🙆

ML超初心者がAmazon SageMaker Canvas を試すだけ

2022/03/02に公開

Domainをまず作るっぽい


しばらくすると、Domain完成するので、アプリケーションを起動のところから起動


えいや


しばらく待ちます。


数分したらこんな画面に

機械学習初学者は、よくタイタニック号のデータ使うらしいので、使ってみる。

https://www.kaggle.com/c/titanic/overview

dataからファイル3つともダウンロード。

s3バケットにアップロードしてImport。スクショ撮り忘れたので省略。

+ New model をクリック

モデル作る

train.csv 選択

target には Survived を指定。01なので、モデルタイプは2 category prediction

カラムは、unique少ないもの+年齢をチョイス。

データの説明はこちらを参考にしました。
https://www.codexa.net/kaggle-titanic-beginner/

ビルドする前にプレビューを。Estimated accuracy が低い場合は調整するんですかね

80%弱なら悪くなさそうなので、Quick build をクリック。

待ちます、といっても1分もしないうちに終わります。モデルの完成です。

では、予測してみます。さっきアップした test.csv を使います。

すぐできます。

こんな感じで出てきます。

各カラムソートできるので、 Probability をクリックして、確率の高い順に見てみます。

女性の方が生存率高かったみたいなので、大体合ってそうです。

gender_submission.csv が答えなので、これと照らし合わせればどのくらいかわかります。こんなデータです。

PassengerId,Survived
892,0
893,1
894,0
895,0
896,1
897,0

っと、モデルにはPassengerId入ってないですね!!! わかりにくいので入れて作り直してみます。で、出来た予測をダウンロードして スプレッドシート使って比較でいいか…。

結果は以下の通り

結構いい感じな気がしますね。

今回は以上。もう少しML勉強してまた色々やってみます。

Discussion