📊

データ分析 python 基本のグラフ -ヒートマップ-

2024/09/12に公開

データ分析で使用するグラフを簡単にまとめていきます
python + google colaboratory で 実行しています

ヒートマップとは

ヒートマップとは、データの数値を色で視覚的に表現するグラフのことです。
主に行列形式のデータや相関行列などを視覚化するために使われ、色の濃淡や色の違いで数値の大小を示します。
色の変化によって、データのパターンや傾向を簡単に確認できるため、データの全体像を一目で理解するのに便利です。

ヒートマップを表示

ヒートマップは seaborn の heatmap メソッドで表示します。

  • パラメータ
    • annot=True は各セルに数値を表示
    • fmt='.2f' で小数点以下2桁にフォーマット
    • vmax=1 と vmin=-1 で、カラースケールの最大値と最小値を指定
    • square=True は各セルを正方形にする
    • center=0 を指定することで、相関が 0 の部分がカラーバーの中心になり、プラスの相関(正の数値)とマイナスの相関(負の数値)をそれぞれ異なる色で強調することができる
sns.heatmap(df.corr(numeric_only=True), annot=True, square=True, vmax=1, vmin=-1, center=0, fmt='.2f');
# matplotlibで日本語を使用できるようにする
!pip install -q japanize-matplotlib

import pandas as pd
import matplotlib.pyplot as plt
import japanize_matplotlib
import seaborn as sns

plt.style.use('seaboran') #グラフのスタイル 他にも bmh, ggplot, などいろいろある 
plt.rcParams['font.family'] = 'IPAexGothic' #日本語フォント

df = pd.read_csv('/content/drive/MyDrive/correlation_analysis_testdata.csv')
df.head(3)

sns.heatmap(df.corr(numeric_only=True), annot=True, square=True, vmax=1, vmin=-1, center=0, fmt='.2f');

Discussion