Chapter 16

Pandasでデータ(欠損)の置き換えや削除

poclabweb
poclabweb
2022.10.16に更新

5. 値(欠損)の置き換えや削除

欠損値NaNを共通の値で一律に置換

欠損値があったcas_numberを0で置き換えて、先頭の5行だけを表示した例

df.fillna(value={'cas_number': 0}).head()

欠損値であった部分が0になっているのがわかる

欠損値を含む行や列を削除する

# 欠損値のある行を全て削除する
df.dropna().shape
# 欠損値のある行で特定のものを削除する(ここでは、cas_number)
df.dropna(subset=['cas_number']).shape

もともと492行で10列だったデータが、cas_numberに数字が入っていないデータが削除されて、193行で10列のデータになっている。

#欠損値のある列を削除
df.dropna(axis='columns').shape

もともと492行で10列だったデータが、データが入っていない列が削除されて、492行で9列のデータになっている。