Retrieval Augmented Generation を Kotlin と OpenAI で ざっくり構築してみる
無料で読める本
Retrieval Augmented Generation の構築を Kotlin と OpenAI を用いてやってみる資料です。 OpenAI の Emebdding API を用いてベクトル化。Posgres の pgvector を用いて正規化したあとのベクトルで類似検索を実現します。 インフラ環境としては AWS の Elastic Beanstalk で構築し、ベクターストアには Amazon RDS for PostgreSQL を用います。
Chapters
Retrieval Augmented Generation、通称 RAG とは
RAG の一般的な作り方
今回の作るものおよび作り方について
ポイント1. テキスト分割にも OpenAI の Chat Completion を使ってみる
ポイント2. 類似検索には pgvectorを用いる
Upload側の実装
Retrieval側の処理
ローカルで確認する
AWS Elastic Beastalk を使って デプロイする
完成
Author
Topics