🧇

[Python] pandasで範囲内のデータ数を求める

2023/06/27に公開

はじめに

Python のデータ分析の学習を始めたいと思い、
Python2 年生 データ分析のしくみ 体験してわかる!会話でまなべる!を購入しました。
そこでpandasの使い方を学びました。

学習した内容を執筆します。

項目 内容
対象者 ・pandas で範囲内のデータ数を求める方法を知りたい方
・Python 微経験者
伝えたい内容 ・pandas で範囲内のデータ数を求める方法
前提条件 ・Python 3.9.10
・pandas 1.5.2

範囲内のデータ数を求めるサンプルコード

1. pandas インストール

下記コマンドでインストールします。

pip install pandas

下記コマンドでインストールされたか確認します。

$ pip show pandas
Name: pandas
Version: 1.5.2
Summary: Powerful data structures for data analysis, time series, and statisticsHome-page: https://pandas.pydata.org
Author: The Pandas Development Team
Author-email: pandas-dev@python.org
License: BSD-3-Clause
Location: /home/furuta/.local/lib/python3.9/site-packages
Requires: numpy, python-dateutil, pytz
Required-by:

2. pandas.value_counts()でコーディングする

python-value_counts.py
import pandas as pd

data = {
    "東京の気温(2020年)": [7.1, 8.3, 10.7, 12.8, 19.5, 23.2, 24.3, 29.1, 24.2, 17.5, 14.0, 7.7],
    "大阪の気温(2020年)": [8.6, 8.0, 11.4, 13.7, 20.8, 24.9, 26.0, 30.7, 25.8, 18.7, 14.7, 8.7]
}
df = pd.DataFrame(data)
"""
right=False, bins = [0, 5, 10, 15, 20, 25, 30]の設定で
    0℃以上5℃未満, 5℃以上10℃未満, 10℃以上15℃未満
    15℃以上20℃未満, 20℃以上25℃未満, 25℃以上30℃未満の範囲を指定する
"""
bins = [0, 5, 10, 15, 20, 25, 30]
cut = pd.cut(df["東京の気温(2020年)"], bins=bins, right=False)
print(cut.value_counts(sort=False))

cut = pd.cut(df["大阪の気温(2020年)"], bins=bins, right=False)
print(cut.value_counts(sort=False))

3. 出力結果を確認する

$ python python-value_counts.py
[0, 5)      0
[5, 10)     3
[10, 15)    3
[15, 20)    2
[20, 25)    3
[25, 30)    1
Name: 東京の気温(2020), dtype: int64
[0, 5)      0
[5, 10)     3
[10, 15)    3
[15, 20)    1
[20, 25)    2
[25, 30)    2
Name: 大阪の気温(2020), dtype: int64

おわりに

🧇 のくぼみの数って何個あるんでしょうか?を思いこの emoji にしました。

GitHubで編集を提案

Discussion