🙆

Python|matplotlibの基本コマンド

2023/10/02に公開

matplotlibとは

分析結果を可視化するのに利用されるライブラリ。さまざまな種類のグラフが作成できる。

matplotlibの読み込み

import matplotlib.pyplot as plt
# matplotlibの読み込み。

%matplotlib inline
# グラフをノートブック内に直接表示するためのマジックコマンド。

import warnings
# Python標準ライブラリの warnings をインポート。プログラム実行中の警告を制御。

warnings.simplefilter('ignore')
# 全ての警告を無視する。

import numpy as np
import pandas as pd
# numpy,pandas のインポート。

np.random.seed(0)
# 乱数のシードを0に設定。

data = pd.DataFrame()
# DataFrame型の変数 data を作成。

共通の基本コマンド

plt.title('任意のタイトル')
# グラフにタイトルを表示させる。

plt.savefig("sample.png")
# グラフを任意の名前で保存する。

plt.savefig('sample.png', bbox_inches='tight')
# グラフを保存する際に、余白を`tight`にする。

plt.legend(loc='upper right')
# 右上に凡例を表示する。

plt.グラフタイプ(data, alpha=0.5)
# 'aplha'の値で、グラフの色の透明度を調整する。

plt.グラフタイプ(data, bins = 20)
# 'bins'の値で、グラフの幅を調整する。

plt.tick_params(axis='x', labelsize=20)
# 'labelsize'で、ラベルのフォントを調整する。

plt.set_ylim(0, 30)
# y軸の値を0から30に指定する。

ヒストグラム

plt.hist(data['カラム名'])
# data変数中の指定のカラムの値をヒストグラムで表示。

折れ線グラフ

plt.plot(data['カラム名'])
# data変数中の指定のカラムの値を折れ線グラフで表示。

複数の折れ線グラフを表示。

fig = plt.figure()
# キャンバスを準備。

ax = fig.add_subplot(1,1,1)
# サブプロットを準備。

for class_type in data['カラム1'].unique():
  ax.plot(data.loc[data['カラム1'] == 任意の変数, 'カラム2'].values)
# カラム1のユニークな値を取得。for以降は繰り返し処理。  

plt.show()
# グラフの表示。

`data.loc[data['カラム1'] == 任意の変数, 'カラム2']
特定の任意の変数の中のカラム2の値を選択。

.values
選択したデータをnumpy配列をして取得。

ax.plot()
配列のデータをサブプロットにプロットする。

散布図

シンプルな散布図。

x = data['カラム名1']
y = data['カラム名2']
plt.scatter(x,y)
# data変数の中の指定のカラムの値を散布図で表示。

回帰直線付きの散布図。

fig = plt.figure()
# 描画のための新しいキャンバスを作成。

ax = fig.add_subplot(1,1,1)
# 新しいキャンバスにサブプロットを作成。(1x1サイズのサブプロット1枚を追加。)

ax.scatter(data['カラム名1'], data['カラム名2'])
# data変数の中の指定のカラムの値を散布図で表示。

m,c = np.ployfit(data['カラム名1'], data['カラム名2'], 1)
# 1次式(傾きmと切片c)を指定。

ax.plot(data['カラム名1'], m*data['カラム名1'] + c)
# 回帰直線の描画。

plt.show()
# グラフの表示。

np.ployfit()
指定された次数の多項式でデータをフィットする関数(回帰直線の式)。ここでは1を指定しているので1次の多項式。1次の場合、mは傾き、xは切片。

Discussion