🤖

AWS認定 MLS 勉強メモ

2024/01/16に公開

AWS

はじめに

かなり適当なメモですが、マシンラーニング知識０からMLSを取得するまでに身につけた知識をなるべくそのまま書き出したものです。

練習問題に取り組みつつ、見知らぬ単語を一度ここに書き出して、その単語が解答に絡んでいる場合はGoogleで検索して記事を少し読みました。また、何度も出てくる単語はYoutubeの解説も参考にしました。

逆に書き出したものの、特に調べていないものは詳細を追記していません。

内容に間違いがあったらすみませんorz

機械学習

過去問に謎に歯ブラシと歯磨き粉の会社が多い

回帰
分類
線形学習
クラスタリング
ニューラルネットワーク
正則化
正規化

まだ分類してない

主成分分析法（PCA）

多くの変数を持つデータを集約して主成分を作成する統計的分析手法。
何かを予測する教師あり学習ではなく、教師なし学習にあたる。
主成分とはデータの特徴を表す要素のことで、「第一主成分、第二主成分・・・」という形で表現する。

参考URL
参考動画

教師なし機械学習

学習データに正解を与えない状態で学習させる学習手法。学習データに正解を与える「教師あり学習」と対をなす機械学習の学習手法となっている。教師なし学習では予測や判定の対象となる正解が存在しないため、教師あり学習とは違い回帰や分類の問題には対応できない。

教師なし学習で行なう代表的な例は以下

クラスタリング
次元削減

はじめに

機械学習

まだ分類してない

主成分分析法（PCA）

教師なし機械学習

教師あり機械学習

正則化(Regularization)

活性化関数 tanh関数？

SELU（Scaled Exponential Linear Unit）

長・短期記憶（LSTM）

バイナリ分類（二値分類）

複数クラスの分類（多クラス分類）

探索的データ分析

箱ヒゲ図（Box Plot Chart）

正規化変換

推論

エポック数（epoch）

テキスト特微量エンジニアリング手法（Feature Engineering）

Term Frequency - Inverse Document Frequency（TF-IDF、単語出現頻度-逆文書頻度）

N-Gram

Bag-of-Words

直角のスパースなバイグラム（OSB）

シミュレーションに基づく強化学習

ヒューリスティックアプローチ

特微量

ソフトマックス関数（正規化指数関数）

感情分析

自然言語処理（NLP）

独立変数

エルボー法

二乗平均平方根誤差（RMSE）

曲線下面積（AUC）

混同行列

潜在的ディリクレ配分（LDA）

傾向

季節性

損失関数

コーパス

線形最小二乗回帰モデル

多重代入法

SMOTE（Synthetic Minority Oversampling Technique ）

過学習

四分位ビニング

トレーニング前のバイアスの測定

アルゴリズム

回帰

線形回帰

ロジスティック回帰

多変量回帰

ニューラルネットワーク

自動符号化器（オートエンコーダ）

再帰型ニューラルネットワーク（RNN）

畳み込みニューラルネットワーク（CNN）

回帰型ニューラルネットワーク

ニューラルトピックモデル（NTM）

木系

分類木

回帰木

決定木（ディシジョンツリー）

ランダムフォレスト

ランダムカットフォレスト（RCF）

XGBoost（eXtreme Gradient Boosting）

k系

k近傍法（k-NN）

k平均法（K-means）

未分類

サポートベクタマシン（SVM）

ナイーブベイズ（単純ベイズ分類器）

モンテカルロシミュレーション

seq2seq

マルコフ連鎖モンテカルロ法（MCMC）

因数分解機アルゴリズム

協調フィルタリング（CF）

DeepAR予測

指標（メトリクス）

AUC/ROC

正解率（Accuracy）

再現率（Recall）/感度（Sensitivity）

適合率（Precision）

特異性（Specificity）

活性化関数　tanh関数？