🐍

[Python] pandasで中央値を求める

2023/06/27に公開

はじめに

Python のデータ分析の学習を始めたいと思い、
Python2 年生 データ分析のしくみ 体験してわかる!会話でまなべる!を購入しました。
そこでpandasの使い方を学びました。

学習した内容を執筆します。

項目 内容
対象者 ・pandas で中央値を求める方法を知りたい方
・Python 微経験者
伝えたい内容 ・pandas で中央値を求める方法
前提条件 ・Python 3.9.10
・pandas 1.5.2

中央値を求めるサンプルコード

1. pandas インストール

下記コマンドでインストールします。

pip install pandas

下記コマンドでインストールされたか確認します。

$ pip show pandas
Name: pandas
Version: 1.5.2
Summary: Powerful data structures for data analysis, time series, and statisticsHome-page: https://pandas.pydata.org
Author: The Pandas Development Team
Author-email: pandas-dev@python.org
License: BSD-3-Clause
Location: /home/furuta/.local/lib/python3.9/site-packages
Requires: numpy, python-dateutil, pytz
Required-by:

2. pandas.median()でコーディングする

python-median.py
import pandas as pd

data = {
    "東京の気温(2020年)": [7.1, 8.3, 10.7, 12.8, 19.5, 23.2, 24.3, 29.1, 24.2, 17.5, 14.0, 7.7],
    "大阪の気温(2020年)": [8.6, 8.0, 11.4, 13.7, 20.8, 24.9, 26.0, 30.7, 25.8, 18.7, 14.7, 8.7]
}
df = pd.DataFrame(data)
# 全てのデータを出力する
print(df.median())
# 個別のデータを出力する
print("東京の気温(2020年) =", df["東京の気温(2020年)"].median())
print("大阪の気温(2020年) =", df["大阪の気温(2020年)"].median())

3. 出力結果を確認する

$ python python-median.py
東京の気温(2020)    15.75
大阪の気温(2020)    16.70
dtype: float64
東京の気温(2020) = 15.75
大阪の気温(2020) = 16.7

おわりに

中央値=体の中心のバランスを取るイメージで"🤸‍♂️"を選びました。

GitHubで編集を提案

Discussion