5. 値(欠損)の置き換えや削除
欠損値NaNを共通の値で一律に置換
欠損値があったcas_numberを0で置き換えて、先頭の5行だけを表示した例
df.fillna(value={'cas_number': 0}).head()
欠損値であった部分が0になっているのがわかる
欠損値を含む行や列を削除する
# 欠損値のある行を全て削除する
df.dropna().shape
# 欠損値のある行で特定のものを削除する(ここでは、cas_number)
df.dropna(subset=['cas_number']).shape
もともと492行で10列だったデータが、cas_numberに数字が入っていないデータが削除されて、193行で10列のデータになっている。
#欠損値のある列を削除
df.dropna(axis='columns').shape
もともと492行で10列だったデータが、データが入っていない列が削除されて、492行で9列のデータになっている。