Closed13
Kendraのキャッチアップ

Search console
Amazon Kendra のレスポンスには、デフォルトで 3 種類の結果が含まれます。
Relevant Passages (検索コンソールでKendraの推奨回答として表示されるものです)
Matching FAQs
Relevant Documents
FAQがヒットしたとき

s3のソースファイルがヒットしたとき
今回はAmazon Kendra suggested answersとしてヒットしている

WebCrawlerがヒット
今回はAmazon Kendra suggested answersとしてもヒットしている

Amazon Kendra suggested answers 以外

メタデータを加えるとフィルターに利用できたりして、検索精度の向上が期待できる

デフォルトのRelevanceだけではなく、_created_atとかを活用することで、過去のナレッジの影響を受けづらくすることもできるかもな

上記の関連かも

Amazon SageMaker ノートブックインスタンスからの利用

データソースへのアクセス制限
S3フォルダにACLsを追加する方法がある
- 予めS3フォルダにwhitepapers_acl.jsonのようなものを作成
- Kendra マネジメントコンソールで、インデックス作成時に上記ACLsのjsonを指定

{
"keyPrefix": "s3://NAME-OF-DATASOURCE-S3-BUCKET/whitepapers_with_metadata/Security/",
"aclEntries": [
{
"Name": "SA",
"Type": "GROUP",
"Access": "ALLOW"
},
{
"Name": "DB_SME_SA",
"Type": "GROUP",
"Access": "ALLOW"
},
{
"Name": "ML_SME_SA",
"Type": "GROUP",
"Access": "ALLOW"
},
{
"Name": "Admins",
"Type": "GROUP",
"Access": "ALLOW"
}
]
},
{
"keyPrefix": "s3://NAME-OF-DATASOURCE-S3-BUCKET/whitepapers_with_metadata/Well_Architected/",
"aclEntries": [
{
"Name": "SA",
"Type": "GROUP",
"Access": "ALLOW"
},
{
"Name": "DB_SME_SA",
"Type": "GROUP",
"Access": "ALLOW"
},
{
"Name": "ML_SME_SA",
"Type": "GROUP",
"Access": "ALLOW"
},
{
"Name": "Admins",
"Type": "GROUP",
"Access": "ALLOW"
}
]
},
{
"keyPrefix": "s3://NAME-OF-DATASOURCE-S3-BUCKET/whitepapers_with_metadata/Databases/",
"aclEntries": [
{
"Name": "DB_SME_SA",
"Type": "GROUP",
"Access": "ALLOW"
},
{
"Name": "Admins",
"Type": "GROUP",
"Access": "ALLOW"
}
]
},
{
"keyPrefix": "s3://NAME-OF-DATASOURCE-S3-BUCKET/whitepapers_with_metadata/Machine_Learning/",
"aclEntries": [
{
"Name": "ML_SME_SA",
"Type": "GROUP",
"Access": "ALLOW"
},
{
"Name": "Admins",
"Type": "GROUP",
"Access": "ALLOW"
}
]
}
]

以下のようなことが実現できる
- ゲストユーザーの検索結果は、ホワイトペーパーの「一般」、「ベストプラクティス」、「Well Architected」カテゴリのものだけであることに注意してください。
- 管理者の検索結果は、「一般(General)」、「ベストプラクティス(Best practice)」、「セキュリティ(Security)」、「Well Architected」、「データベース(Database)」、「機械学習(Machine Learning)」など、さまざまなカテゴリからのものであることに注意してください。

Custom Document Enrichment(CDE )
ドキュメントにメタデータをつける処理を自動化したいときに参考になる
LambdaでpreExtractionやpsotExtractionを行うみたいな感じ
このスクラップは2023/11/30にクローズされました