ML超初心者がAmazon SageMaker Canvas を試すだけ
Domainをまず作るっぽい
しばらくすると、Domain完成するので、アプリケーションを起動のところから起動
えいや
しばらく待ちます。
数分したらこんな画面に
機械学習初学者は、よくタイタニック号のデータ使うらしいので、使ってみる。
dataからファイル3つともダウンロード。
s3バケットにアップロードしてImport。スクショ撮り忘れたので省略。
+ New model
をクリック
モデル作る
train.csv
選択
target には Survived
を指定。0
と1
なので、モデルタイプは2 category prediction
。
カラムは、unique少ないもの+年齢をチョイス。
データの説明はこちらを参考にしました。
ビルドする前にプレビューを。Estimated accuracy
が低い場合は調整するんですかね
80%弱なら悪くなさそうなので、Quick build
をクリック。
待ちます、といっても1分もしないうちに終わります。モデルの完成です。
では、予測してみます。さっきアップした test.csv
を使います。
すぐできます。
こんな感じで出てきます。
各カラムソートできるので、 Probability
をクリックして、確率の高い順に見てみます。
女性の方が生存率高かったみたいなので、大体合ってそうです。
gender_submission.csv
が答えなので、これと照らし合わせればどのくらいかわかります。こんなデータです。
PassengerId,Survived
892,0
893,1
894,0
895,0
896,1
897,0
っと、モデルにはPassengerId
入ってないですね!!! わかりにくいので入れて作り直してみます。で、出来た予測をダウンロードして スプレッドシート使って比較でいいか…。
結果は以下の通り
結構いい感じな気がしますね。
今回は以上。もう少しML勉強してまた色々やってみます。
Discussion