Chapter 14

Pandasでデータの状態確認

poclabweb
poclabweb
2022.11.03に更新

3. 簡単にデータの状態を確認する(行数列数カウント・データの選択的表示・重複の有無など)

行数・列数を取得する

dataframeの後ろにshapeとつけると、そのdataframeの行数と列数が確認できます。

df.shape

列名を取得する

dataframeの取得したい場合には、dataframeの後ろにcolumnsをつけると、列名がlist形式で取得できます。

df.columns

統計量をまとめて表示

dataframeの後ろにdescribe()とつけると、入っている数字のcount,mean,std,min,25%,50%,75%,maxという統計量を表示することができます。
describe(include='all')とすると、すべての型の列が対象となります。

# デフォルトでは数値(整数型int、浮動小数点型float)の列のみが選択される。
df.describe()
# include='all'とすると、すべての型の列が対象となる。
df.describe(include='all')