【Amazon Bedrock】の重要用語をまとめてみた
はじめに
Amazon Bedrockを使い始める前に、まずは基本的な用語を理解しておくことが重要です。生成AIやAmazon Bedrockには多くの専門用語が登場しますが、これらを正しく理解することで、サービスをより効果的に活用できるようになります。
この記事では、Amazon Bedrockでよく使われる用語を、初心者の方にもわかりやすく解説します。
基本的なモデル関連の用語
基盤モデル(Foundation Model:FM)
基盤モデルは、大量の多様なデータで訓練された大規模なAIモデルのことです。多数のパラメータを持ち、テキスト生成、画像生成、質問応答など、幅広いタスクに対応できる汎用性の高いモデルです。
例えば、Claude、GPT、Llamaなどが基盤モデルにあたります。これらは「土台」となるモデルで、様々な用途に応用できるのが特徴です。
ベースモデル
ベースモデルは、各プロバイダーによってパッケージ化され、すぐに使用できる状態で提供されている基盤モデルのことです。Amazon Bedrockでは、Anthropic、Amazon、Meta、Cohereなど、様々なプロバイダーのベースモデルを利用できます。
入力・出力に関する用語
プロンプト
プロンプトは、AIモデルに対する「指示書」や「質問」のことです。モデルが適切な回答や出力を生成するために与える入力テキストのことを指します。
例えば:
- 「日本の首都を教えてください」
- 「以下の文章を要約してください:[文章]」
- 「Python でソートを実装するコードを書いてください」
プロンプトの書き方次第で、モデルの出力品質が大きく変わるため、効果的なプロンプト作成(プロンプトエンジニアリング)は重要なスキルです。
トークン
トークンは、モデルが処理する文字列の最小単位のことです。必ずしも単語と一致するわけではなく、文字、単語の一部、句読点なども1つのトークンとして扱われます。
例えば「Amazon Bedrock is amazing!」という文は、以下のようにトークン化される可能性があります:
- ["Amazon", " ", "Bedrock", " ", "is", " ", "amazing", "!"]
トークンは料金計算や利用制限の基準となるため、理解しておくことが重要です。
モデル推論
モデル推論は、プロンプト(入力)を受け取ったモデルが、レスポンス(出力)を生成するプロセスのことです。これがAIモデルの基本的な動作原理です。
パラメータ関連の用語
推論パラメータ
推論パラメータは、モデルの出力をコントロールするための設定値です。主なパラメータには以下があります:
temperature(テンプレチャー)
出力のランダム性と多様性を調整するパラメータです。
- 低い値(0.1など): より確実で一貫した回答
- 高い値(1.0など): より創造的で多様な回答
topK
モデルが考慮するトークンの上位K個を制限するパラメータです。
- 例:topK=10なら、確率の高い上位10個のトークンから選択
topP
累積確率がP以下のトークンから選択するパラメータです。
- 例:topP=0.9なら、確率の高いトークンから累積確率が90%になるまでのトークンから選択
maxTokens
生成するトークンの最大数を制限し、出力の長さをコントロールします。
ハイパーパラメータ
ハイパーパラメータは、モデルのカスタマイズ(訓練)時に設定する値で、訓練プロセス自体をコントロールします。推論パラメータとは異なり、モデルの学習方法を決定します。
高度な機能に関する用語
埋め込み(Embeddings)
埋め込みは、テキストや画像を数値のベクトル(数列)に変換する技術です。この数値表現により、異なるデータ間の類似性を数学的に比較できるようになります。
例えば、「犬」と「猫」の埋め込みベクトルは、「犬」と「車」よりも近い値になります。これにより、検索や推薦システムで活用されます。
取得拡張生成(RAG)
**RAG(Retrieval-Augmented Generation)**は、外部データベースから関連情報を検索し、その情報を基にモデルが回答を生成する手法です。
RAGの流れ:
- 質問に関連する情報をデータベースから検索
- 検索結果をプロンプトに追加
- 追加情報を基にモデルが回答を生成
これにより、モデルの訓練データにない最新情報も活用できます。
エージェント
エージェントは、基盤モデルを使って複数のタスクを自動的に実行するアプリケーションです。ユーザーの要求を理解し、必要に応じて複数のツールやサービスを組み合わせてタスクを完了します。
オーケストレーション
オーケストレーションは、基盤モデル、企業データ、アプリケーションを協調させてタスクを実行するプロセスです。複数のシステムを統合して、複雑な業務を自動化する際に重要な概念です。
カスタマイズ関連の用語
モデルカスタマイズ
モデルカスタマイズは、独自のデータを使ってベースモデルを特定の用途に特化させるプロセスです。主な手法には以下があります:
ファインチューニング
ラベル付きデータ(入力と正解のペア)を使ってモデルを調整する手法
継続的事前訓練
ラベルなしデータ(入力のみ)を使ってモデルのパラメータを調整する手法
プロビジョンドスループット
プロビジョンドスループットは、安定した性能を確保するために事前に購入するモデルの処理能力のことです。大量のリクエストが予想される場合や、レスポンス時間を保証したい場合に利用します。
その他の重要な用語
プレイグラウンド
プレイグラウンドは、AWS Management Consoleで提供される、モデルを手軽に試せるグラフィカルなインターフェースです。コードを書かずに、様々なプロンプトやパラメータを試すことができます。
モデル評価
モデル評価は、複数のモデルの性能を比較し、用途に最適なモデルを選択するプロセスです。精度、速度、コストなど、様々な観点から評価を行います。
参考
Amazon Bedrockの基本情報とRuntime APIの実行例まとめ - NRIネットコムBlog
Amazon Bedrock ユーザーガイド - 主要な定義
Discussion