🐍
[Python] pandasで中央値を求める
はじめに
Python のデータ分析の学習を始めたいと思い、
Python2 年生 データ分析のしくみ 体験してわかる!会話でまなべる!を購入しました。
そこでpandas
の使い方を学びました。
学習した内容を執筆します。
項目 | 内容 |
---|---|
対象者 | ・pandas で中央値を求める方法を知りたい方 ・Python 微経験者 |
伝えたい内容 | ・pandas で中央値を求める方法 |
前提条件 | ・Python 3.9.10 ・pandas 1.5.2 |
中央値を求めるサンプルコード
1. pandas インストール
下記コマンドでインストールします。
pip install pandas
下記コマンドでインストールされたか確認します。
$ pip show pandas
Name: pandas
Version: 1.5.2
Summary: Powerful data structures for data analysis, time series, and statisticsHome-page: https://pandas.pydata.org
Author: The Pandas Development Team
Author-email: pandas-dev@python.org
License: BSD-3-Clause
Location: /home/furuta/.local/lib/python3.9/site-packages
Requires: numpy, python-dateutil, pytz
Required-by:
2. pandas.median()でコーディングする
python-median.py
import pandas as pd
data = {
"東京の気温(2020年)": [7.1, 8.3, 10.7, 12.8, 19.5, 23.2, 24.3, 29.1, 24.2, 17.5, 14.0, 7.7],
"大阪の気温(2020年)": [8.6, 8.0, 11.4, 13.7, 20.8, 24.9, 26.0, 30.7, 25.8, 18.7, 14.7, 8.7]
}
df = pd.DataFrame(data)
# 全てのデータを出力する
print(df.median())
# 個別のデータを出力する
print("東京の気温(2020年) =", df["東京の気温(2020年)"].median())
print("大阪の気温(2020年) =", df["大阪の気温(2020年)"].median())
3. 出力結果を確認する
$ python python-median.py
東京の気温(2020年) 15.75
大阪の気温(2020年) 16.70
dtype: float64
東京の気温(2020年) = 15.75
大阪の気温(2020年) = 16.7
おわりに
中央値=体の中心のバランスを取るイメージで"🤸♂️"を選びました。
Discussion