📊
データ分析 python 基本のグラフ -ヒートマップ-
データ分析で使用するグラフを簡単にまとめていきます
python + google colaboratory で 実行しています
ヒートマップとは
ヒートマップとは、データの数値を色で視覚的に表現するグラフのことです。
主に行列形式のデータや相関行列などを視覚化するために使われ、色の濃淡や色の違いで数値の大小を示します。
色の変化によって、データのパターンや傾向を簡単に確認できるため、データの全体像を一目で理解するのに便利です。
ヒートマップを表示
ヒートマップは seaborn の heatmap メソッドで表示します。
- パラメータ
- annot=True は各セルに数値を表示
- fmt='.2f' で小数点以下2桁にフォーマット
- vmax=1 と vmin=-1 で、カラースケールの最大値と最小値を指定
- square=True は各セルを正方形にする
- center=0 を指定することで、相関が 0 の部分がカラーバーの中心になり、プラスの相関(正の数値)とマイナスの相関(負の数値)をそれぞれ異なる色で強調することができる
sns.heatmap(df.corr(numeric_only=True), annot=True, square=True, vmax=1, vmin=-1, center=0, fmt='.2f');
# matplotlibで日本語を使用できるようにする
!pip install -q japanize-matplotlib
import pandas as pd
import matplotlib.pyplot as plt
import japanize_matplotlib
import seaborn as sns
plt.style.use('seaboran') #グラフのスタイル 他にも bmh, ggplot, などいろいろある
plt.rcParams['font.family'] = 'IPAexGothic' #日本語フォント
df = pd.read_csv('/content/drive/MyDrive/correlation_analysis_testdata.csv')
df.head(3)
sns.heatmap(df.corr(numeric_only=True), annot=True, square=True, vmax=1, vmin=-1, center=0, fmt='.2f');
Discussion