ML超初心者がAmazon SageMaker Canvas を試すだけ
Domainをまず作るっぽい



しばらくすると、Domain完成するので、アプリケーションを起動のところから起動

えいや

しばらく待ちます。

数分したらこんな画面に
機械学習初学者は、よくタイタニック号のデータ使うらしいので、使ってみる。
dataからファイル3つともダウンロード。
s3バケットにアップロードしてImport。スクショ撮り忘れたので省略。
+ New model をクリック
モデル作る

train.csv 選択

target には Survived を指定。0と1なので、モデルタイプは2 category prediction。

カラムは、unique少ないもの+年齢をチョイス。

データの説明はこちらを参考にしました。
ビルドする前にプレビューを。Estimated accuracy が低い場合は調整するんですかね

80%弱なら悪くなさそうなので、Quick build をクリック。
待ちます、といっても1分もしないうちに終わります。モデルの完成です。

では、予測してみます。さっきアップした test.csv を使います。

すぐできます。

こんな感じで出てきます。

各カラムソートできるので、 Probability をクリックして、確率の高い順に見てみます。

女性の方が生存率高かったみたいなので、大体合ってそうです。
gender_submission.csv が答えなので、これと照らし合わせればどのくらいかわかります。こんなデータです。
PassengerId,Survived
892,0
893,1
894,0
895,0
896,1
897,0
っと、モデルにはPassengerId入ってないですね!!! わかりにくいので入れて作り直してみます。で、出来た予測をダウンロードして スプレッドシート使って比較でいいか…。
結果は以下の通り

結構いい感じな気がしますね。
今回は以上。もう少しML勉強してまた色々やってみます。
Discussion