Open5
LLMの理解

RDBとRAG

Q. LLMからの返答にユーザーが不快に思う様な表現が含まれてしまう可能性をどう防ぐか?
A. Azure AIではコンテンツフィルターを設定可能

Azure AIのクオータを理解する
動的クォータとは?
- 動的に制限を超えたクォータを割り当てられる
- メリット: クォータの限界を超えたリクエストが来た際に利用可能なクォータがあれば割り当てられる
- デメリット: 他のデプロイメントのクォータ上限に影響が出る?異常なリクエストの場合にクォータの上限が自動で引き上げられてしまう?
トークン制限(TPM)とリクエストリミット(RPM)

モデルのデプロイの種類とは?

Azure AIのコスト管理方法検討