📑

AI-900 メモ【AI の概要】

2024/03/04に公開

やること

AI-900の受験の際に、勉強した際のメモです。
以下の範囲のLearnを対象としてます。

https://learn.microsoft.com/ja-jp/training/paths/get-started-with-artificial-intelligence-on-azure/

AIの主なワークロード

  1. 機械学習
  2. Computer Vision
  3. 自然言語処理
  4. Document Intelligence
  5. ナレッジマイニング
  6. 生成AI

1. 機械学習(Azure Machine Learning)

Azure Machine Learningは、クラウドベースのプラットフォームであり、ユーザーが機械学習モデルを簡単に作成、管理、公開できます。
主な特徴は、以下です。

・Automated machine learning
専門知識がないユーザーでも手軽に機械学習モデルを作成することを可能にします。この機能は、データから最適なモデルを自動的に選択し、最適化します。

・Azure Machine Learningデザイナー
直感的なグラフィカルインターフェイスを提供します。このインターフェイスを使用すると、ユーザーはコードを書くことなく機械学習ソリューションを開発できます。

・Data metric visualization
実験の結果を視覚的に分析し、モデルのパフォーマンスを最適化するのに役立ちます。これにより、ユーザーはモデルの効果を直感的に理解し、必要な改善を行うことができます。

・Notebooks
マネージドJupyter Notebookサーバーが提供されています。これは、スタジオに直接統合されており、ユーザー自身のコードを記述して実行することができます。

https://learn.microsoft.com/ja-jp/azure/machine-learning/overview-what-is-azure-machine-learning?view=azureml-api-2

2. Computer Vision(Azure AI Vision)

Azure AI Visionを使用すると、Computer Visionソリューションを開発することができます。
主な機能は、以下です。

機能 説明
画像分析 画像やビデオを分析し、説明、タグ、オブジェクト、テキストを抽出する機能。
顔認識 顔検出や顔認識ソリューションを構築する機能。
光学式文字認識(OCR) 画像から印刷または手書きのテキストを抽出し、スキャンしたテキストのデジタルバージョンへのアクセスを可能にする機能。

https://learn.microsoft.com/ja-jp/azure/ai-services/computer-vision/overview

コンピュータビジョンモデル

  1. 画像分類
  2. 物体検出
  3. セマンティックセグメンテーション
  4. 画像解析
  5. 顔検出、分析、認識
  6. 光学式文字認証(OCR)

3. 自然言語処理(Azure AI Language,Azure AI Speech)

Azure AI Languageを使用すると、自然言語処理ソリューションを構築することができます。Azure AI Languageの特徴としては、テキストの理解と分析、話されたりテキストベースのコマンドを理解できる会話型言語モデルの訓練、インテリジェントなアプリケーションの構築などがあります。
また、Azure AI Speechも自然言語処理ソリューションを構築するために使用できるサービスです。Azure AI Speechの特徴としては、音声認識と合成、リアルタイムの翻訳、会話の書き起こし等があります。

https://learn.microsoft.com/ja-jp/azure/ai-services/language-service/overview

https://learn.microsoft.com/ja-jp/azure/ai-services/speech-service/overview

4. Document Intelligence(Azure AI Document Intelligence)

Azure AI Document Intelligence を使用して、スキャンしたドキュメントからのデータ収集を管理および高速化するソリューションをビルドできます。
主な機能は、以下です。

機能 説明
フォーム認識 手書きや印刷されたフォームから情報を抽出することを可能にします。これは、請求書、注文書、医療記録など、構造化された文書からデータを抽出するのに特に有用です。
レイアウト理解 文書のレイアウトと構造を自動的に理解し、テキスト、表、画像などの要素を識別します。文書の内容をより深く理解することが可能になります。
キーフレーズ抽出とエンティティリンキング これらの機能は、文書から重要なフレーズやエンティティ(人、場所、日付など)を抽出し、それらが他の情報源とどのように関連しているかを理解するのに役立ちます。
光学式文字認識(OCR) 画像やスキャンされた文書からテキストを抽出することを可能にします。これにより、紙ベースの文書をデジタルフォーマットに変換し、検索可能かつ分析可能にすることができます。

https://learn.microsoft.com/ja-jp/azure/ai-services/document-intelligence/overview?view=doc-intel-4.0.0

5. ナレッジ マイニング(Azure AI Serch)

Azure AI Searchでは、Azure AI サービスの組み込み AI 機能 (画像処理、ドキュメント インテリジェンス、自然言語処理など) を利用して、データを抽出できます。 この製品の AI 機能を使用すると、以前は検索できなかったドキュメントのインデックスを作成し、大量のデータからすばやく分析情報を抽出して表示することができます。

https://learn.microsoft.com/ja-jp/azure/search/search-what-is-azure-search

6. 生成 AI(Azure Open AI Service)

Azure OpenAI Serviceを使用して、生成 AI ソリューションを構築できます。
Azure OpenAI Serviceは、生成型AIモデルのデプロイ、カスタマイズ、ホスティングを行うためのMicrosoftのクラウドソリューションです。
OpenAIの先端的なモデルとAPIと、Azureクラウドプラットフォームのセキュリティとスケーラビリティを組み合わせています。

https://learn.microsoft.com/ja-jp/azure/ai-services/openai/overview

責任あるAI

原則 説明
公平性(Fairness) AIシステムは偏りや差別を引き起こすべきではありません。全ての個人やグループに対して公平であるべきです。
信頼性と安全性(Reliability & Safety) AIシステムは信頼性があり、期待通りの結果を得ることができるべきです。また、ユーザーの安全を保証するべきです。
プライバシーとセキュリティ(Privacy & Security) AIシステムは、ユーザーのデータプライバシーとセキュリティを尊重し、保護する必要があります
包括性(Inclusiveness) AIシステムは、全ての人々、特にマイノリティーや弱者が恩恵を受けられるように設計されるべきです
透明性(Transparency) AIシステムは透明性を持つべきです。つまり、どのように動作し、どのような結果を生むのかをユーザーが理解できるべきです。
アカウンタビリティ(Accountability) AIシステムの設計者と運用者は、システムの結果に対して責任を持つべきです。

https://learn.microsoft.com/ja-jp/azure/machine-learning/concept-responsible-ai?view=azureml-api-2

機械学習の種類

種類 概要
回帰 連続値を予測するタスク。例えば、家の特性(広さ、立地、築年数など)から価格を予測します。
分類 入力がどのクラスに属するかを予測するタスク。二値分類は入力が2つのクラスのうちどちらに属するかを予測し、多クラス分類は入力が複数のクラスのうちどれに属するかを予測します。
教師なし学習 事前にラベル付けられた訓練データがない状況で、データのパターンや構造を探すタスク。クラスタリングや次元削減などの手法が含まれます。
クラスタリング データを自然なグループに分けるタスク。データには予めラベルが付けられていないことが特徴で、顧客の購買履歴から顧客のグループ(クラスタ)を作り出すことができます。

機械学習モデルの評価指標

評価方法 概要
平均二乗誤差 (Mean Squared Error, MSE) 回帰タスクでよく使われる評価指標で、予測値と実際の値との差(誤差)を二乗したものの平均値です。値が小さいほど精度が高いとされます。
R2 スコア (R-squared, 決定係数) 回帰モデルの予測の正確さを評価するための指標で、モデルがデータにどれだけフィットしているかを示します。1に近いほどモデルの予測精度が高いとされます。
混同行列 (Confusion Matrix) 分類問題の性能を評価するための表で、モデルが予測を正しく行った数と間違った数を示します。True Positive, False Positive, True Negative, False Negativeの4つの指標からなります。
精度 (Accuracy) 全ての予測のうち、正しい予測の割合を示します。ただし、クラスのバランスが偏っている場合は誤解を招く可能性があります。
適合率 (Precision) 陽性と予測されたデータのうち、実際に陽性だったデータの割合を示します。偽陽性(誤報)を避けることが重要な場合に使用されます。
再現率 (Recall) 実際に陽性のデータのうち、陽性と予測されたデータの割合を示します。偽陰性(見逃し)を避けることが重要な場合に使用されます。
F値 (F-measure) 適合率と再現率はトレードオフの関係にあるため、両者をバランス良く取るための指標としてF値があります。適合率と再現率の調和平均で求められます。
AUC-ROC 二値分類問題で使用され、偽陽性率に対する真陽性率をプロットしたROC曲線下の面積(AUC)を示します。AUCの値が1に近いほど良いモデルとされます。
ヘッドウォータース

Discussion