Chapter 02無料公開

データ作成

(株)ディープブラック
(株)ディープブラック
2021.02.01に更新

データの作成方法について

numpyのrandomを使って、正常データと異常データを作成します。

ここで、正常データと異常データの定義は以下のようになります。
正常データ:データ集合がある範囲に収まっている
異常データ:データ集合がバラバラである

上記を踏まえて、正常データと異常データを作成します。

ライブラリのロード

import pickle
import numpy as np
import random

コード

numpyのrandom.sampleを使い、正常データを作成します。
対して異常データは、1以上の数値を配列に入れることで、作成します。

最後にpickle形式で保存します。

# 正常データ、異常データを生成
normal_data = np.random.rand(1000, 4)
number_lst = list(range(1, 100))

anomaly_data = list()
t_anomaly_data = list()
for i in range(0, 100):
	anomaly_data.append(random.sample(number_lst, 4))

anomaly_data = np.array(anomaly_data)

print(normal_data.shape)
print(anomaly_data.shape)

with open('normal_data.pkl', 'wb') as f:
	pickle.dump(normal_data, f)
with open('anomaly_data.pkl', 'wb') as f:
	pickle.dump(anomaly_data, f)