第一回:生成AIによるIGS(イニシャルギャラリースコア)算出について
生成AIによるIGS(イニシャルギャラリースコア)算出
はじめに
弊社ではイニシャルギャラリーというアーティスト紹介やアーティスト支援を行うサイトを運営しております。
当サイトにおいてアーティストの活動を様々な視点から数値化し、その数値をイニシャルギャラリースコアと呼んでいます。この「様々な視点から数値化する」という行動の一環として昨今注目されはじめている「生成AI」を使った場合どのような数値が出てくるのかということへの興味から始めた研究課題がこの記事の始まりとなっています。
生成AIとは
身の回りに存在するAI(人工知能)と言えば顔認証や音声認識など、収集したデータを元に結果を判定するといった特定の分野に特化したものが一般的なものでした。ここ1~2年で市民権を得つつある「chatGPT」や「Bing Chat」はこれらの特化したAIに比べて以下の特徴を持っているため旧来のAIと呼ばれてきた物に比べて判りやすく、使いやすいので「AIとして」の認知が進んでいるように見えます。
- 自然言語での問い合わせ(日本で一番標高の高い山を教えてください等)に対応し、問い合わせに対して自然な回答をする(対話型)
- 会話(問い合わせ)内容の記録、やりとりを元にした返答の修正、定型文による効率化などが可能に
- 外部のツールと連携した機能の拡張性
現在では国内、国外の様々な組織が生成AIの開発を始めたりその効果的な利用方法を模索しています。
IGS算出に使用しているモデル(LLM)
当初利用モデル gpt-3.5-turbo
現在利用モデル gpt-4
モデルとは生成AIの根幹をなすものでモデルに蓄えられた様々なデータが問い合わせに対する返答の品質を左右します。こちらからの問い合わせ方法によっても返答は変わりますが基本となる返答の品質はここであげた「モデルの選択」が重要となります。
現在利用しているgpt-4モデルはaiを開発しているうちの一社「openAI」社が提供しているモデルとなります。
※LLMとは……「大規模言語モデル(LLM)」は、言語モデルのうち「計算量」「データ量」「モデルパラメータ数」の3要素を大規模化したものを指します。「計算量」とはコンピュータが処理する仕事量のことで、「データ量」とはコンピュータに入力した文章データの情報量です。また「モデルパラメータ数」とは、ディープラーニング技術に特有のパラメータ(確率計算を行うための係数の集合体)の豊富さを指します。大規模言語モデルは、この3つを巨大化させることで急速に進化しました。 引用元NRI ナレッジインサイト
具体的な方法について
イニシャルギャラリーにおいては以下のページで算出項目について説明しています。
IGS(イニシャルギャラリースコア)
現在はアーティストの皆様から寄せられた情報やネット上で確認できるデータなどを元にスコアを算出していますがAIに算出を任せるという方針の下で算出方法を検討しました。
利用したツール
・GPT4
現状ではapiも整備され各種ツールの開発も進んでいる「openAI」社のLLM「GPT4」を利用するのが最も開発しやすいと判断。
LLM……大規模言語モデル(Large Language Models)の略。
・langchain
LLMの機能を拡張できるライブラリ、長文での問い合わせや回答の処理、最新情報の取得や検索エンジンなどとの連携等GPT4単体では出力が難しい物もlangchainライブラリを連携して利用することで可能になる。
・GoogleCustomSearch
Google検索エンジンをwebUI以外から使うためのapiなどが用意されているGoogleCloudプラットフォームサービスのひとつ、最新情報を取得するために利用。
データの鮮度
openAI社のモデルはそれぞれのモデル毎に学習元のデータ範囲が異なります。
モデル名 | 日時 |
---|---|
gpt-3.5-turbo | 2021年9月までのデータ |
gpt-4 | 2022年8月までのデータ |
※最新のgpt4-turboでは2023/4までの結果が学習されていると言われています。
アーティスト活動の数値化という点を考えた際、最近の活動を反映できないのは即時性に欠けると考え以下のようなシステムを検討しました。
基本的な仕組みは以上の通り、実際にどのような結果が出力されどのように修正していったかについては次回の記事にてお伝えしようかと思います。
Discussion