🙆
Python|matplotlibの基本コマンド
matplotlibとは
分析結果を可視化するのに利用されるライブラリ。さまざまな種類のグラフが作成できる。
matplotlibの読み込み
import matplotlib.pyplot as plt
# matplotlibの読み込み。
%matplotlib inline
# グラフをノートブック内に直接表示するためのマジックコマンド。
import warnings
# Python標準ライブラリの warnings をインポート。プログラム実行中の警告を制御。
warnings.simplefilter('ignore')
# 全ての警告を無視する。
import numpy as np
import pandas as pd
# numpy,pandas のインポート。
np.random.seed(0)
# 乱数のシードを0に設定。
data = pd.DataFrame()
# DataFrame型の変数 data を作成。
共通の基本コマンド
plt.title('任意のタイトル')
# グラフにタイトルを表示させる。
plt.savefig("sample.png")
# グラフを任意の名前で保存する。
plt.savefig('sample.png', bbox_inches='tight')
# グラフを保存する際に、余白を`tight`にする。
plt.legend(loc='upper right')
# 右上に凡例を表示する。
plt.グラフタイプ(data, alpha=0.5)
# 'aplha'の値で、グラフの色の透明度を調整する。
plt.グラフタイプ(data, bins = 20)
# 'bins'の値で、グラフの幅を調整する。
plt.tick_params(axis='x', labelsize=20)
# 'labelsize'で、ラベルのフォントを調整する。
plt.set_ylim(0, 30)
# y軸の値を0から30に指定する。
ヒストグラム
plt.hist(data['カラム名'])
# data変数中の指定のカラムの値をヒストグラムで表示。
折れ線グラフ
plt.plot(data['カラム名'])
# data変数中の指定のカラムの値を折れ線グラフで表示。
複数の折れ線グラフを表示。
fig = plt.figure()
# キャンバスを準備。
ax = fig.add_subplot(1,1,1)
# サブプロットを準備。
for class_type in data['カラム1'].unique():
ax.plot(data.loc[data['カラム1'] == 任意の変数, 'カラム2'].values)
# カラム1のユニークな値を取得。for以降は繰り返し処理。
plt.show()
# グラフの表示。
`data.loc[data['カラム1'] == 任意の変数, 'カラム2']
特定の任意の変数の中のカラム2の値を選択。
.values
選択したデータをnumpy配列をして取得。
ax.plot()
配列のデータをサブプロットにプロットする。
散布図
シンプルな散布図。
x = data['カラム名1']
y = data['カラム名2']
plt.scatter(x,y)
# data変数の中の指定のカラムの値を散布図で表示。
回帰直線付きの散布図。
fig = plt.figure()
# 描画のための新しいキャンバスを作成。
ax = fig.add_subplot(1,1,1)
# 新しいキャンバスにサブプロットを作成。(1x1サイズのサブプロット1枚を追加。)
ax.scatter(data['カラム名1'], data['カラム名2'])
# data変数の中の指定のカラムの値を散布図で表示。
m,c = np.ployfit(data['カラム名1'], data['カラム名2'], 1)
# 1次式(傾きmと切片c)を指定。
ax.plot(data['カラム名1'], m*data['カラム名1'] + c)
# 回帰直線の描画。
plt.show()
# グラフの表示。
np.ployfit()
指定された次数の多項式でデータをフィットする関数(回帰直線の式)。ここでは1を指定しているので1次の多項式。1次の場合、mは傾き、xは切片。
Discussion