📒
Azure OpenAI 関係の単語と説明まとめ
📌 はじめに
こんにちは!@Ryo54388667です!☺️
普段は都内でフロントエンドエンジニアとして業務をしてます!
主にTypeScriptやNext.jsといった技術を触っています。
Azure OpenAI(以下 AOAI)関係のワードの説明だけまとめてみました!
参考にしたのは、下記の3冊です!
体系的にまとまっており、図表が多くてわかりやすかったです!!☺️単語以外の詳細な解説なども書かれていますので、興味を持った方はぜひ手に取ってみることをオススメします〜
📌 ワードと説明
AI開発全般
Word | Explanation | Example |
---|---|---|
Azure OpenAI | Azure 上で提供される、OpenAIの技術を統合した生成AIサービスのこと。 | Azure Machine Learning, AI Search など。 |
ハルシネーション (幻覚) | AIが誤答すること。AIが事実と乖離した情報を生成する現象のこと。 | Meta Glactica の事例 |
識別モデル | 分類対象の特徴とクラスの関係を直接モデリングする手法。 | アルゴリズムは k-最近傍、ロジスティクス回帰 などを利用する。 |
生成モデル | データセットの分類に着目し、クラスが空間全体にどのように配置されているかを確立分布としてモデル化する手法。 | アルゴリズムはナイーブベイズ分類機、敵対的生成ネットワークなどを利用する。 |
メタプロンプト | システム側で追加するプロンプトのこと | ユーザーから与えられたプロンプトの他に、システム側で文脈や出力形式などを付加してからLLMに与えるなど。 |
RLHF(Reinforcement Learning from Human Feedback) | 人間のフィードバックによる強化学習 | 人間の指導による強化学習, 報酬モデルの導入 など |
アラインメント | 人間の好ましい文章にすること |
Azure AI Search について
Word | Explanation | Example |
---|---|---|
Azure AI Search | 従来の検索アプリケーションおよび対話型検索アプリケーションにユーザーが所有するコンテンツを提供するもの。 | 独自データ検索など |
インデックス | テーブルがデータベース内のレコードを整理する方法と同様に、Azure AI Search でドキュメントを整理および検索する主な手段。 | |
embedding | 機械学習モデルとアルゴリズムで使用できる特別な形式のデータにすること。 | Microsoft Azure の説明 |
セマンティック検索 | ユーザーの意図に基づき、検索結果を生成すること |
Grounding について
Word | Explanation | Example |
---|---|---|
Grounding | LLMの学習範囲外のデータを使って回答すること。 | 独自データを基にAIに回答させるなど |
RAG (Retrieval Augmented Generation) | 大規模言語モデル (LLM) と外部知識検索を組み合わせる生成 AI 設計パターンのこと。 | 設計詳細 |
Azure OpenAI On your data | Web ベースのインターフェイスを使用して独自のデータに基づく Azure OpenAI にアクセスし、独自のデータに接続してチャット エクスペリエンスを強化するソリューションを作成できるサービス。 | Microsoft詳細ページ |
Lang Chain | 大規模言語モデル(LLM)を活用して生成AIアプリケーション開発を効率的に行うためのフレームワーク。 | GitHub ページ |
アナライザー | インデックス作成とクエリ実行中に文字列を処理するフル テキスト検索エンジンのコンポーネント | フレーズやハイフンでつながれた単語を構成部分に分割するなど |
Semantic Kernel について
Word | Explanation | Example |
---|---|---|
Semantic Kernel | Semantic Kernel とはマイクロソフトが開発したソフトウェア開発キット(SDK)。 | Microsoft詳細 |
Planner | ユーザーの質問を受け取り、そのリクエストを達成する方法に関するPlanを返す機能。 | 例えば、「店に行くときに牛乳を買うようにリマインドする」や「明日母親に電話するようリマインドする」などのワークフローを作成。参考 |
Memories | ユーザーの質問に対し、より広い文脈を提供する方法。 | ドキュメントなど、トークン数上限以上のデータを渡したい時に利用。関連記事 |
Connector | 外部のデータへのアクセスを可能にするインターフェース。 | 文章の要約をするためのものなど、いくつか用意されている。GitHub リポジトリSample |
Function Calling について
Word | Explanation | Example |
---|---|---|
Function Calling | ユーザーのプロンプトに基づいて、あらかじめ定義した関数を呼ぶべきかどうかをAzure OpenAIのモデルが判断してくれる機能。 | 利用する関数が複数存在する場合、ユーザーのプロンプトを分析し、どの関数を呼ぶか判断する。 |
エージェント | 作業を多段階の要望に分解して生成された計画に従って作業を実行する仕組みのこと。 | |
Reasoning & Act (ReAct) | GPTがタスクの処理フローを動的に決め、さまざまなツールと連携して回答を生成する手法。 |
Fine Tuning について
Word | Explanation | Example |
---|---|---|
Fine Tuning | 既存のモデルを特定のタスクやデータに合わせて調整する手法。 | 学習モデル自体をカスタマイズしたい時に利用する。 |
基盤モデル | オーケストレーションレイヤーで利用するOpenAIのモデル、オープンソースのLLM、独自にファインチューニングしたLLMを指す。 | |
AIインフラストラクチャ | 基盤モデルをホスティングする計算リソース。 | |
量子化(Quaontitization) | モデルを構成する一つひとつの構成要素のビット数を落としてメモリと計算量の削減を図る圧縮方法。 | ひとつのパラメータは32bitだが、整数に変換すると8bitに圧縮される。 |
枝刈り(pruning) | 精度に影響を与えそうにないモデルのパラメータを削減することでメモリと計算量を削減する圧縮手法。 | 重み行列のパラメータを不規則に無視することで実現 |
蒸留(Distillation) | 大きなモデルを教師モデルとしてその出力を利用し、より小規模なモデルを学習することで、大きなモデルが持つ精度をより小規模なモデルで実現しようとする圧縮手法。 |
📌 まとめ
単語の説明だけまとめてみました!
対象のイメージをできるかできないかは大きな違いですよね。今後もいくつか追加していこうと思っています。理解の助けになれば幸いです。
最後まで読んでいただきありがとうございます!
気ままにつぶやいているので、気軽にフォローをお願いします!🥺
Discussion