AIスタックチャンが喋れるようになるまで
昔、ハッカソン用に無料でいただいたM5Stack Core2 for AWS - ESP32 IoT開発キットでスタックチャンが出来る事を思い出し、試してみました。しかし、画面右側のボタンを押して電源残量の確認は音声で出来るのに、ずんだもんの声で会話できなくて四苦八苦しました。
Xで呟いた所、スタックチャン界隈の重鎮の皆様に助けていただきました。本当にありがとうございます。
この記事では私がどこをミスったのか記録する事で、後に続く方の参考になればと思いました。
上記サイトにある動画を見ながら設定しました。
知識ゼロで作る! 手乗りサイズのスーパーカワイイロボット AIスタックチャン2PLUS版
①ChatGPTのAPIキー
②VOICEVOXのAPIキー
③Google Cloud Speech to TextのAPIキー
まず最初に困ったのは、M5BurnerをインストールしてM5Stackを認識させようとしたが、「COM」に表示されない事でした。
M5stack Burner でCOMがNo results found
この解決策は、USB DRIVER & OPEN SOURCE LIBRARY
からダウンロードするドライバーをCP210x_VCP_Windows.zipとCH9102_VCP_SER_Windows.exeの2種類をインストールする事でした(当方のPCは、大昔のMacbookブートキャンプで動くWindows10)。
AIスタックチャン2 (FY24/7月 証明書更新+ChatGPT-4o mini)をインストールすべし
先のYouTube動画は割と前の動画です。M5stack BurnerでM5Stackに書き込むのは、最新のバージョンがお勧めです。
以上により無事に設定ファイルの書き込み、インストールが出来たはずですが、生成AIのChatGPTの応答がずんだもんの声で再生されません。画面右下のボタン押下で、電源残量はずんだもんの声になるのに。
ほとほど困り果てていて状況をX(旧Twitter)でポストしたところ、スタックチャン沼の先輩方に助けていただきました。
スマホに「スタックチャン CONNECT」をインストールしよう
スタックチャンがiPhoneのインターネット共有で接続できるよう、SDカードのwifi.txtにWi-Fiの名前とパスワードを書き込みました。パソコンのネット接続先をこのiPhoneにすれば、ChatGPTと接続できるのか試せます。しかし、このアプリだと、会話・台詞・表情・設定の4メニューで気軽に設定したり動作を試せたり出来ます。この存在は初めて知りました。
M5stack BurnerのSerial Monitorで通信ログを確認しよう
M5stack Burnerを起動して、右上のハンバーガーメニューで「Serial Monitor」が選べます。M5stackの通信状況が確認できるようになるので、生成AIのChatGPTのログなどが確認できるようになります。この存在は初めて知りました。
"success": true,
"isApiKeyValid": false,
"speakerName": "VOICEVOX:ずんだもん(ノーマル)",
電源残量の確認でずんだもんの声がしても、「isApiKeyValid": false」だと問題だという事を教えていただきました。
ChatGPTのレスポンスが多い場合、WEB版VOICEVOX API(高速)の方が良い
VOICEVOXのAPI Key取得と利用登録方法【スタックチャン】
通常版で登録してしまったので、高速版の場合は登録しなおして上書きする必要があります。
・apiKeyを作り直し
・tts.quest API利用申請フォームを編集し直し
皆さんに教えていただいて、無事にAIスタックチャンが喋る事が出来ました。
本当にありがとうございました。
Discussion