📌

Amazon Bedrock Knowledge Basesのマルチモーダル検索を試してみた

に公開

About

株式会社ガラパゴス(有志) Advent Calendar 2025 3日目の記事です。

はじめに

Amazon Bedrock Knowledge Basesのマルチモーダル検索がGAになったとのことで、試してみました。

https://dev.classmethod.jp/articles/bedrock-kb-multimodal-search-ga/

結論としては、

  • マルチモーダル埋め込みベースの画像検索環境が、驚くほど簡単にセットアップできた
  • 画像内の日本語の解釈も実用レベルにあることが分かった

という収穫を得ることができました。

試してみたこと

前提として、Nova Multimodal Embeddingsに対応しているリージョンがバージニア北部(us-east-1)のみとのことなので、今回はバージニア北部(us-east-1)リージョンで実験しています。

1. ナレッジベースの作成

今回はマネジメントコンソールから作成しました。特にややこしい設定は無く、簡単に作成できました。

  • データソース
    • S3バケット
    • このS3バケットに画像をアップロードします
  • 解析戦略
    • Bedrock データオートメーションの解析
  • 埋め込みモデル
    • Amazon Nova Multimodal Embeddingsv1 (3072次元)
  • ベクトルデータベース
    • Amazon S3 Vectors

2. データソース(S3バケット)への画像アップロード

今回は、下記のような画像をNano Banana Proで9枚作成して、データソースのS3バケットにアップロードしました。

想定としては、とある内装施工企業において、施工現場の写真と品質チェック観点がセットで記載された画像が大量に事例として保管されている、という状況を想定しています。


3. データソースの同期

データソースの同期を実行すると、アップロードした9枚の画像がドキュメントとして登録されます。

4. ナレッジベースのテストを実施

以上でナレッジベースの構築が完了した(簡単!)ので、テストしてみます。

まずはコンテンツに関する質問を投げてみます。

おお!画像と画像内の日本語を理解してナレッジ化出来ていることが確認できました。

プロンプト: 施工現場別に、どのようなチェック観点がありますか?日本語でリスト化して、Markdownとして出力してください。
施工現場別のチェック観点は以下の通りです:

## 玄関・エントランス
- 玄関ドアの開閉・施錠のスムーズさ
- 下駄箱扉の建て付けとチリ・隙間
- 玄関土間のタイル・石材の浮きと目地
- 上がり框の傷・納まりと床鳴り
- 人感センサー照明の動作確認

## 電気設備
- 分電盤の配線接続・締め付け
- ブレーカーの動作・表示確認
- 漏電ブレーカーのテスト
- 回路図との整合性確認
- 盤内の清掃・異物確認
- コンセントの電圧・通電確認
- スイッチの点灯・動作確認
- コンセントプレートの浮き・傷
- 配線器具のガタつき確認

## キッチン
- キッチン水栓の吐水・止水確認
- シンク周りコーキングの密着不良
- 収納扉のチリ・建付け調整
- 引出しのスムーズな動作
- レンジフードの吸い込み確認
- 排水トラップの漏水確認

## 室内全般
- 壁紙の継ぎ目と浮き
- 巾木の収まりと隙間
- フローリングの目地と段差
- 建具の開閉スムーズさ
- コーキングの仕上がり
- 照明器具の設置確認

もういっちょ。

[プロンプト]
本日キッチンの施工なのですが、チェック観点を教えて下さい!

[回答]
キッチンの施工におけるチェック観点として、水栓の吐水・止水確認、シンク周りコーキングの密着不良チェック、収納扉のチリ・建付け調整と引出しのスムーズな動作確認、レンジフードの吸い込み確認、排水トラップの漏水確認などが重要です。

回答で引用された画像

まとめ

画像の数やバリエーションを増やした場合の精度は追加で検証が必要かもしれないですが、まずは日本語を含めた画像の埋め込みベースの検索環境が驚くほど簡単にセットアップできることと、日本語の扱いも問題なさそうな点を確認することができました。

株式会社ガラパゴス(有志)

Discussion