Chapter 15

Pandasでデータの欠損状態の確認

poclabweb
poclabweb
2022.10.09に更新

4. データの欠損状態の確認

欠損値の確認

df.isnull()

データの欠損値があるとTrueになり、欠損値がなければFalseと表示される。

欠損値があるかどうかを行や列ごとに判定

any()は行・列ごとにTrueがひとつでもあればTrueと判定するメソッド
any()をisnull()の結果に適用することで、行・列ごとに欠損値NaNをひとつでも含むか判定

df.isnull().any()

欠損値がある列ごとにあるかを判定する。

行・列ごとに欠損値の個数をカウント

df.isnull().sum()

欠損値の個数を列ごとにカウントできる。