Open3

2024年10月27日~2024年11月2日

tttttttttttttttttttt

10/27

pl.concat([train, test], how="diagonal")

diagonal: 結合した際に、一方のデータフレームにない列データをnullにする。

vertical: pd.concat([train, test], axis=0)

horizontal: pd.concat([train, test], axis=1)

vertical_relaxed(relaxed): relaxedはconcatした際に、同じ列名でも異なるデータ型を寄りより汎用性のあるデータ型に変換する。

https://docs.pola.rs/api/python/stable/reference/api/polars.concat.html

assert_frame_equalデータのどの部分が異なるかを比較してくれるツール。

データが一致しないとエラーが出る。

tttttttttttttttttttt

10/28

polarsのtrain[FEATURE_COLS]train.select(FEATURE_COLS)の違い。

FEATURE_COLSが一つの時、

  • 前者はpolars.dataframe.frame.DataFrame
  • 後者はpolars.series.series.Series

となる。

tttttttttttttttttttt

11/2

polarsで新しい特徴量を追加する

外部のデータから作ったもの(例: oofで作成したデータフレームと同じサイズのnumpy配列など)の場合、
data.with_columns(pl.Series(array, dtype="指定したければ").align("add_data"))

指定しない場合だと、元のデータ型に合わせてデータ型を調整する。

しかしfloat16に関しては、polarsが対応していないので、float32となる。

polarsのオプション設定

  • 表示する行数を変更する時

pl.Config.set_tbl_rows(50)

  • 表示する行数を一時的に変更する時
with pl.Config() as cfg:
    cfg.set_tbl_rows(10)
    print(sub.head(20))

なおtblはtableの意味????