Chapter 02

データの読み込みと用いる特徴量の決定

(株)ディープブラック
(株)ディープブラック
2021.03.19に更新

データの読み込み

まずは、Pandasを用いて、タイタニックのCSVを読み込みます。

import pandas as pd

data = pd.read_csv("titanic/train.csv")

用いる特徴量を決める、教師を確定する

次に、用いる特徴量と教師を確定します。
今回、『Ticket』と『Cabin』は、除外しました。
用いて見たい場合は、この本が終わった後に自分で試してみてください。

data = data[["Survived", "Pclass", "Name", "Sex", "Age", "SibSp", "Parch", "Fare", "Embarked"]]

data = data.dropna()

target = data["Survived"].values
data = data.drop("Survived", axis=1)