会話AI
本書では、「会話AI」という言葉を多用しています。本書では、「コンピュータが人間の発話に自動で応答するプログラム(AI)」のことを、「会話AI」と呼ぶことにします。メインテーマは「チャットボットの構築」ですが、チャットボットよりももう少し広義に、「会話ができるAI」について考えたいときは、この表現を用います。
類似表現としては、下記のような表現があります。
・対話システム
・対話型AI
・自動対話AI
・会話型AI
・Conversational AI
日本では「対話システム」という表現が学術的に多く利用されている節があります。しかし、世間一般的に「人間のように話せる」=「AI」のようなイメージが定着している感もあり、「会話AI」という表現がわかりやすく、この表現としています。
明確な定義があるわけではない認識ですが、下記のようなシステムは、会話AIに含まれるものとして話を進めます。
・チャットボット
・ボイスボット
・スマートスピーカー
・音声アシスタント
従来の会話AI
従来の会話AIは様々な手法による開発が行われてきました。従来の手法を4つ挙げてみます。
A. ルールーベース
B. 用例ベース
C. シナリオベース
D. 生成ベース
上記はそれぞれ完全に独立した手法ではなく、複数の手法を組み合わせて会話AIを構築するケースがほとんどです
A. ルールベース
予め用意されたルールに応じて応答を返す会話AIです。
B. 用例ベース
「用例ベース」は、今までの会話ログ(用例)からマッチする情報を探し、応答を返す会話AIです。
C. シナリオベース
「シナリオベース」は、管理者が作成したシナリオに沿って会話を進める会話AIです。
D. 生成ベース
「生成ベース」は確率的にAIが応答を生成し、返答する会話AIです。
従来の会話AIで実用的だったのは、A~Cでしょう。生成ベースのAIは昔から存在していましたが、実用化されているとは言えない状況でした。2016年にチャットボットの一大ブームが巻き起こりましたが、その際に用いられていた手法の多くはA~Cであり、それぞれの手法を拡張・精度向上させるためにAIの様々な技術が活用されていました。
A~Cの手法は、「人間が会話を用意する」方法です。つまり、A~Cにおける会話AIは「人間の管理下(コントローラブルな状態)」にあると言えます。一方でDの生成ベースの手法は、AIが会話を「勝手に」考えます。つまり、A~Cと比較して、「人間の管理外(アンコントローラブルな状態)」にあると言えるでしょう。
これらの手法やどんな会話AIが今までに登場してきたのか、変遷をこちらの記事にまとめています。もしご興味がある方は、こちらも合わせてご参照ください。
Generative AI時代の会話AI
Generative AI時代の会話AIは、まさに「生成ベース」のAIが実用化する時代だと考えられます。本来、会話というのは無限に発言のバリエーションがあります。A~Cのような人間が会話を管理するような会話AIには、「会話」と呼べるような自然なやり取りは難しかったのです。一方で、ジュライの生成ベースのAIには、人間のニーズを満たすような流暢な会話はできていませんでした。そのキャズムを乗り越えたのが、近年のGenerative AIの技術革新なのです。
つまりGenerative AI時代の到来により、「人間の管理下」で会話をしていたAIが、「人間の管理外」で会話をすることを社会に受け入れられ始めたと言えます。AIはこの数年で非常に賢くなり、人間に対して大きな説得力を持つようになってきているのです。