AWS Certified Machine Learning – Specialty_勉強メモ(2日目)
はじめに
標記資格取得に向けた勉強メモ(2日目)です。
勉強メモ
・主成分分析 (PCA):
可能な限り多くの情報を保持しながら、データセット内の次元 (特徴の数) を削減しようとする教師なし機械学習アルゴリズム。
・k-means アルゴリズム
グループのメンバーが互いに可能な限り類似し、他のグループのメンバーとは可能な限り異なる、データ内の離散グループを見つけようとするアルゴリズム。
・Factorization Machine アルゴリズム
回帰および分類タスクの解決に使用される教師ありアルゴリズム。
・潜在的ディリクレ配分 (LDA)
教師なしアルゴリズム。主にテキスト コーパス内のドキュメントで共有される、ユーザーが指定した数のトピックを検出するために使用される。例えば、各単語の出現を判断することによって、ドキュメントから新しいトピック/カテゴリを明らかにすることができる。
・正則化
極端な重み値にペナルティを課すことで、線形モデルがトレーニングデータの例に過剰適合するのを防ぐのに役立つ。
・モデルが過剰適合している場合に各メンバーが電子メール通知で警告されるソリューションを実装するには?
CloudWatch APIオペレーションを使用して、トレーニング メトリクスを CloudWatch に送信し、それらのメトリクスのダッシュボードを作成する。最後に、Simple Notification Service (Amazon SNS) を使用して、モデルが過剰適合しているときに通知を送信する。
・Amazon Rekognition Content Moderationとは?
機械学習を使用して、画像およびビデオのモデレーション ワークフローを合理化または自動化できる。フル マネージドの画像およびビデオ モデレーション API を使用して、ヌード、暗示、暴力などのカテゴリを含む、不適切、不要、または攻撃的なコンテンツをプロアクティブに検出可能。
・コンテンツベースのフィルタリングアルゴリズムとは?
過去の行動や好みに基づいて、ユーザーのコンテンツをパーソナライズする。例えば、過去7日間、コメディ映画や SF映画をよく見ていたとすると、コンテンツベースのフィルタリングレコメンダーは、以前に視聴したのと同じジャンルの映画をレコメンデーションする可能性が高くなる。
・Amazon Lexとは?
会話型インターフェースまたはチャットボットの構築に使用できるサービス。
・Amazon Pollyとは?
テキスト読み上げサービス。
・セレンディピティとは?
成功または関連する推奨事項がどれほど驚くべきものであるかの尺度
・データストリームに対して SQLクエリを実行して、リアルタイムの洞察を得たい時
AWS Lambdaで設定された Kinesis Data Analytics アプリケーションを使用してデータを変換する。
※ S3 バケットに保存し、Amazon Athena を使用してクエリを実行する場合だと、リアルタイムで行うことができない。
・Amazon Comprehendとは?
機械学習を使用して、非構造化データの洞察と関係を明らかにするサービス。このサービスは、テキストの言語を識別し、キー フレーズ、場所、人、ブランド、またはイベントを抽出する。テキストがどの程度肯定的か否定的かを識別したり、トークン化と品詞を使用してテキストを分析し、トピックごとにテキスト ファイルのコレクションを自動的に整理する。Amazon Comprehend の AutoML 機能を使用することで、組織のニーズに合わせて独自に調整されたエンティティまたはテキスト分類モデルのカスタムセットを構築することも可能。
・Amazon Rekognitionとは?
機械学習による画像と動画の分析に使用されるサービス。
・Amazon Transcribeとは?
音声をテキストに迅速かつ正確に変換することができるサービス。
・AWS Glue DataBrewとは?
レシピアクションを使用して、さまざまな観点からデータを集計および要約したり、高度な変換を実行したりできるサービス。
参考
Discussion