3. 簡単にデータの状態を確認する(行数列数カウント・データの選択的表示・重複の有無など)
行数・列数を取得する
dataframeの後ろにshapeとつけると、そのdataframeの行数と列数が確認できます。
df.shape
列名を取得する
dataframeの取得したい場合には、dataframeの後ろにcolumnsをつけると、列名がlist形式で取得できます。
df.columns
統計量をまとめて表示
dataframeの後ろにdescribe()とつけると、入っている数字のcount,mean,std,min,25%,50%,75%,maxという統計量を表示することができます。
describe(include='all')とすると、すべての型の列が対象となります。
# デフォルトでは数値(整数型int、浮動小数点型float)の列のみが選択される。
df.describe()
# include='all'とすると、すべての型の列が対象となる。
df.describe(include='all')