🙌

ChatGPT Meetup Tokyo #0

2023/08/30に公開

セッション

その他メモ

AlexaでChatGPTとおしゃべりできる
英会話対応（多言語）の仕組み
- Amazon Polly音声では各言語のモデルが用意されている
- プロンプトに返答の言語を[lang:]形式で出力
- 適切なモデルを使うようにAlexaに指示

vicuna-13b
- gpt-3.5-turboに近い性能が出る
- 基盤LLMよりも、fine-tuningが大事
ローカル LLM の計算コストとその展望
- （何も工夫しないと）13bでもgpt-3.5-turboの方が10倍以上安い
- OpenAPIは原価ベース？
- 将来的にgpt-3.5は自分でホスティングできるようになる
- GPT-4なら1台1000万くらい？
GPT はもっと賢くなる
- パラメータは増えないけどtuningが進む
- 回路の繋がっていない素材のようなもの

その他メモ

IBM Watson Discoveryによるサイト内検索サービスとChatGPTを連携
- 質問文のWatson Discoveryの検索結果からChatGPTを使って応答文を作成
UIどうするか？
- 検索窓が当たり前で、利用者がチャットでの質問に慣れるのか？
- 最初のリリースではサイト内検索を補完する形
  - 結果のリストの右側に補足として表示
品質はどうする？
- 検索精度
  - Discoveryをトレーニングして並びをチューニング
  - 辞書機能で用語や略語を同一視
  - 収集データにアノテーション　etc...
- 応答精度
  - ChatGPTへ適切な情報を渡す
    - ↑の検索精度の対応
    - データの件数やサイズの調整
  - 嘘と変動の対策
    - 引用元提示
    - パラメータ調整
    - 注意書き（AIだから誤りを含む可能性があります）
- 検索精度や応答精度に満点はない
- 定期的な精度把握とチューニングのサイクルが重要
セキュリティはどうする？
- データは他の用途で使われないのでOK
- データセンターの場所指定や複数配置はできない
- 日本の法律を準拠法にできない（模様）
  ↓
  MS Azure OpenAI Servicesを採用してクリア

※公開資料見つからず

LLMによる疑義照会の半自動化のPoC
- 疑義照会=病院の処方せんの間違いを医師に問い合わせる
ステップ（2,4でGPT-4を使用）
1. 処方せん情報をOCRでテキストデータ化
2. 処方情報の構造化
- GPT-4のAPIでJSON形式に抽出
1. 医薬品の添付文章をDBに保存しておき取得
2. 処方情報と添付文章を照らし合わせて疑義照会の文章を作成
かなり正確に指摘できる
LLMの凄さ
- 非構造のデータを高度に扱える
  - 処方せんから構造化データ
- Few-shotプロンプティングで例を与えることができる
  - 独自の例を与えて学習