Zenn
Open1

Python Note

Hayashi NaokiHayashi Naoki

DataFrameのindexに文字列カラムを指定する時の留意点

df.set_index('col') でcolが文字列の場合ハッシュ化できる.行へのアクセスは O(1).
df.sort_index() でソートすると, バイナリ検索 O(log n) が使えるためdf.loc[[idx_a, idx_b, idx_c, …]] のような処理が高速になる.

df = df.set_index('col').sort_index()
ログインするとコメントできます