デジタルヒューマンを構築して会話する (基本編)
概要
こんにちは、maKunugiです。
本記事では、人間そっくりなAIアバター「デジタルヒューマン」を構築し、会話を行う方法について解説します。人間のように表情豊かに会話ができるデジタルヒューマンは、接客業務など様々なシチュエーションで活用することが期待されています。ぜひこの記事を通して、構築方法や会話の様子、カスタマイズの方法等を知っていただければ幸いです。
この記事の対象者
- デジタルヒューマンに興味がある方
- チャットボット等の対話システムに興味がある方
- デジタルヒューマンの活用をご検討の方
本記事のゴール
本記事では下記をゴールとして説明をしていきます。
- 自分で構築したデジタルヒューマンとブラウザ上で会話ができる
- デジタルヒューマンの会話内容をカスタマイズできる
デジタルヒューマンとは?
作業に入る前に、デジタルヒューマンについて簡単に説明をさせていただきます。
先ほども述べた通り、デジタルヒューマンは人間そっくりなAIアバターです。音声認識と音声合成による会話ができるだけでなく、人間のような豊かな表情を持ち、人間味あふれる会話ができることが特徴です。実店舗やWebサービス上での接客やカスタマーサポートなど、会話コミュニケーションを伴う様々なタスクを担うことができます。
類似の用途で利用されるのが「チャットボット」ですが、チャットボットはどうしても無機質な会話になりがちです。一方でデジタルヒューマンは、人間らしさや親しみやすさのある会話を可能にします。この人間らしさや親しみやすさは、デジタルヒューマンとの会話を体験したユーザとサービス提供者が感情的なつながりを形成するのに大きな効果があると言われています。デジタルヒューマンの導入は、ユーザとのつながりを深め、エンゲージメントを強化していくものとして期待されています。
下記は、「心臓病患者のコーチをデジタルヒューマンが行ったらどうなるか?」というコンセプト動画になります。
利用するデジタルヒューマンのサービス
本記事では、UneeQ社が提供するデジタルヒューマンを利用します。UneeQ社は簡単にデジタルヒューマンを作成してデプロイするためのクリエイター向けサービスを提供しており、短時間でユースケースに合わせたデジタルヒューマンを構築することが可能です。
日本では、デジタルヒューマン株式会社がUneeQ社に代わって事業を行なっており、日本語向けのデジタルヒューマンを提供しています。
接続する会話プラットフォーム
デジタルヒューマンを利用するには、ユーザから話しかけられた言葉に対して応答を返すための仕組みが必要です。デジタルヒューマンは、この仕組みを提供する様々な会話プラットフォームと接続が可能で、用途ごとに必要な会話プラットフォームを選択します。
本記事では、デジタルヒューマンと接続が容易で、尚且つ会話の内容をカスタマイズしやすい「mebo(ミーボ)」というサービスをデジタルヒューマンに接続します。
mebo(ミーボ)について
meboは筆者が開発をしている、会話AIを様々なプロダクトに簡単に導入することを目的としたサービスです。デジタルヒューマンとの接続にも対応しており、手軽に活用できます。
本記事では必要な操作のみご紹介しますが、ご興味がある方はぜひ下記のZen Booksもご参照ください。
構築方法
それでは、実際にデジタルヒューマンを構築する方法について紹介していきます。
デジタルヒューマンを構築する方法は下記の2種類です。
A. デジタルヒューマンクリエイターが提供するUIをそのまま使う方法
B. 独自にUIを用意して利用する方法
本記事では、まずはAを紹介し、次の記事でBの方法について説明します。(次の記事については、本記事最後にリンクを掲載しています。)
1. フリートライアルをはじめる
「デジタルヒューマンクリエイター」のサイトを開きます。
「フリートライアルをはじめる」をクリックして、アカウントを作成しましょう。
2. クリエイターを開く
フリートライアルを無事はじめることができると、下記のようなクリエイターのダッシュボードが表示されます。
3. ペルソナを作成する
デジタルヒューマンは「ペルソナ」という単位で存在します。「Personas」のページを開き、「Create New Persona」を押してペルソナの作成をはじめましょう。
まずはペルソナのアバターを選択します。フリートライアルは上3つのアバターのみ利用可能です。
次に背景、ペルソナの名前、言語を設定していきます。
この際、日本語が表示されないので、適当な項目を選択しておきましょう。後で日本語に設定できます。
ペルソナが作成できると、会話画面が表示されます。
まだ会話プラットフォームを繋いでいないので、日本語での会話はできません。
ガイドの会話ができるので、適当に会話をしてみましょう。
4. ペルソナを編集する
クリエイターのダッシュボードに戻ると、作成したペルソナが表示されています。
鉛筆ボタンを押してペルソナの編集をはじめましょう。
まずは「Conversation settings」を「Try Mode」から「Bring Your Own Conversation Platform」に変更します。
こちらのAPI URLに後で利用する会話プラットフォームで得られるURLを設定します。一旦空のまま次に進みましょう。
「Conversation settings」を変更すると、Language settingsで日本語が選択できるようになります。
「Language understood」と「Spoken voice」をそれぞれ「Japanses」に変更しましょう。
声は3種類から選べます。
5. 会話コンテンツを作成する
meboにサインアップ
先ほど紹介したmebo(ミーボ)を利用して、デジタルヒューマンの会話コンテンツを作成していきましょう。
下記のサイトにアクセスして、「サインアップ」をクリックします。
Googleアカウントがあれば、そのままサインインができます。Googleアカウントを利用しない場合は、右下の「新規アカウントを作成」からアカウントを作成してください。
エージェントの作成
meboにサインアップできたら、「新規作成をして開始する」をクリックします。
meboにおけるエージェントがデジタルヒューマンのペルソナと1対1で紐づく単位です。
各項目には任意な情報を入力してください。「応答の設定」で「AIによって自動で応答を返す」にチェックをつけると、手動で登録する会話コンテンツで応答ができない発話を、AIが自動で応答してくれます。
入力が終わったら、「登録して開始する」を押します。
ダッシュボードに作成したエージェントが表示されれば完了です。
会話コンテンツを追加する
meboでは様々なアプローチで会話コンテンツを作成することができます。今回は、1問1答のやりとりを手動で登録する方法のみ例として紹介します。そのほかの方法については下記の書籍をご参照ください。
ダッシュボード上の「会話をトレーニングする」をクリックします。
「雑談表現の編集」をクリックします。
デフォルトの雑談表現が表示されています。「挨拶の表現」をクリックしてみましょう。
3つの挨拶が既に登録されているので、「新しい発話を作成」から任意の挨拶表現を追加してみましょう。
登録ができたら右下の「変更を保存」をクリックして保存しましょう。
meboではこの要領で会話コンテンツを追加できます。
エージェントを公開する
デジタルヒューマンとmeboを接続するには、エージェントを公開する必要があります。meboの「公開設定」画面を開き、設定をしていきましょう。
まずは先ほど登録した会話コンテンツを反映して、会話のテストを行います。
「トレーニングを反映する」をクリックしましょう。
処理が完了したら、「会話をテストする」をクリックします。
チャット画面で先ほど設定した会話ができれば成功です。
会話のテストができたら、エージェントの公開を行いましょう。デジタルヒューマンでのみ利用し、チャット画面を一般に公開することは想定していないので、「限定公開」を選択して「利用規約に同意して公開」をクリックします。
API利用の設定
限定公開を行うと、公開設定画面に「外部サービス連携」という項目が表示されます。
デジタルヒューマンにはAPIを利用して接続をするので、「APIを有効にする」をクリックします。
APIを有効にすると、「デジタルヒューマン接続用URL」が表示されるのでコピーしましょう。
6. デジタルヒューマンにmeboのエージェントを接続する
meboでエージェントが公開できたら、デジタルヒューマンのクリエイターを再度開きましょう。
ペルソナの設定の上記イメージにある「API URL」に先ほどコピーしたURLを貼り付けます。これでデジタルヒューマンがユーザから話しかけられると、mebo経由で応答を返すようになります。
「Personas」のページに移動し、ペルソナの右上にある「TRY」を押して会話をしてみましょう。
下記のような会話画面が起動します。
テキストを入力するか、音声認識で話しかけることができます。
meboで登録した応答が確認できれば、meboとの疎通は成功です。以後、mebo上で会話の内容を編集することで、デジタルヒューマンの会話をカスタマイズすることができます。ここまでの作業さえできれば、デジタルヒューマンと会話をすることができます。会話内容をカスタマイズしながら、デジタルヒューマンとの会話をお楽しみください。
会話画面のカスタマイズについて
ここまで紹介した方法で、デジタルヒューマンを構築し、会話をすることができました。ただし、用途によっては会話画面をさらにカスタマイズする必要があります。
例えば、meboで作成するエージェントでは、「クイックリプライ」と呼ばれる発話候補を利用することができます。クイックリプライを表示すると、ユーザに対して会話の選択肢を与えられるため、会話の活性化に繋がります。デフォルトのデジタルヒューマンの会話画面ではクイックリプライを表示することはできませんが、会話画面を独自にカスタマイズを行うことで、表示ができるようになります。
下記のイメージは、クイックリプライを表示した例です。
また、デフォルトの会話画面では音声認識した言葉が表示されず、正しくデジタルヒューマンに音声を聞き取ってもらえたか心配になるケースなどがあります。そういった際には、音声認識をした文字列を下記のイメージのように表示することもできます。
このように、会話画面をカスタマイズすることで、より優れたユーザ体験の会話を提供することができます。
会話画面のカスタマイズ方法
会話画面をカスタマイズするには、フロントエンドを独自に構築してデプロイする必要があります。
具体的な手順については、次の記事(応用編)にてご紹介します。
まとめ
デジタルヒューマンとmeboを組み合わせて、簡単にデジタルヒューマンと会話する方法について紹介させていただきました。本記事は基本編になりますが、ここまでの方法で様々な会話ができるデジタルヒューマンを構築することができます。さらに画面をカスタマイズする高度な使い方については、次の応用編の記事にて紹介させていただきますので、興味をお持ちいただけた方はぜひご覧ください。
次の記事(応用編)
デジタルヒューマンはデジタル空間と現実の世界を違和感なく繋ぐ新しいインターフェースとして、大きな可能性を秘めている感じます。今後もデジタルヒューマン関連の記事を書いていこうと思っていますので、よろしければ下記アカウントのフォローをお願いいたします。
最後に、デジタルヒューマン構築に関してのご不明点やご相談に関しましては、maKunugiもしくはデジタルヒューマン株式会社さんにお問い合わせください。
本記事をお読みいただきありがとうございました!
Discussion