Open3
2024年10月27日~2024年11月2日
10/27
pl.concat([train, test], how="diagonal")
diagonal: 結合した際に、一方のデータフレームにない列データをnullにする。
vertical: pd.concat([train, test], axis=0)
horizontal: pd.concat([train, test], axis=1)
vertical_relaxed(relaxed): relaxedはconcatした際に、同じ列名でも異なるデータ型を寄りより汎用性のあるデータ型に変換する。
assert_frame_equal
データのどの部分が異なるかを比較してくれるツール。
データが一致しないとエラーが出る。
10/28
polarsのtrain[FEATURE_COLS]
とtrain.select(FEATURE_COLS)
の違い。
FEATURE_COLSが一つの時、
- 前者はpolars.dataframe.frame.DataFrame
- 後者はpolars.series.series.Series
となる。
11/2
polarsで新しい特徴量を追加する
外部のデータから作ったもの(例: oofで作成したデータフレームと同じサイズのnumpy配列など)の場合、
data.with_columns(pl.Series(array, dtype="指定したければ").align("add_data"))
指定しない場合だと、元のデータ型に合わせてデータ型を調整する。
しかしfloat16に関しては、polarsが対応していないので、float32となる。
polarsのオプション設定
- 表示する行数を変更する時
pl.Config.set_tbl_rows(50)
- 表示する行数を一時的に変更する時
with pl.Config() as cfg:
cfg.set_tbl_rows(10)
print(sub.head(20))
なおtblはtableの意味????