🤖

【Discord BOT まとめ】読み上げBOTの一覧

2022/07/29に公開
2

はじめに

よくサーバーの初期整備を依頼されるので自分のためのまとめも兼ねています。
掲載しているBOTは全てある程度は触っていますが、半年くらい触っていないものもあるので最新の情報は各BOTのサイトをご確認下さい。

また、掲載しているBOTは認証済みBOTのみとさせて頂きます。
今後は多機能BOTの中の読み上げ機能が付いているものやセルフホストのBOTも別記事で紹介する予定です。

2022年10月の時点での読み上げBOTは全て網羅していると思います。
もしも調査漏れ等ありましたらコメントでお知らせいただけると幸いです。

記事のまとめ

当記事で紹介するBOTの早見表

BOT名 音声の種類 料金プラン webから設定 オススメ度
喋太郎 Open JTalk 無料 × ★★☆☆☆
Shovel Open JTalk 課金 × ★★★☆☆
よるみさん Open JTalk 無料 × ★★★☆☆
読みそ Open JTalk 無料 × ★★★☆☆
Chat Reader Open JTalk
Google TTS
VOICEVOX
無料 × ★★☆☆☆
ShabeleA Open JTalk
Google TTS
有料 ★★★★★
ALBOT Google TTS 課金 ★★★★★
ずんだもんβ VOICEVOX 課金 × ★★★★☆
VOISCORD VOICEROID 無料 ★★★★★

筆者の体感オススメ早見表

とにかく無料で済ませたい 妥協せずDiscordライフを満喫したい
Open JTalk Shovel ShabeleA
Google TTS ALBOT ShabeleA
VOICEROID VOISCORD VOISCORD

開発者目線での各BOTへの寄付のお願い
読み上げBOT運用に関するお金のことを少しだけ書いています。
ご興味がある方はご覧下さい。

背景

投稿者の名前からも分かる通り、VOISCORDというBOTを開発、運営しています。
このBOTの開発経緯は他BOTが筆者の欲しい機能と完全に一致するBOTがなく、あっても安定したものやコマンドが複雑すぎて直感的に分からないものだったりしたからです。

こちらは本題ではないのでVOISCORDに関しての詳細はこちらの記事を参照して下さい。
https://zenn.dev/voiscord/articles/47a23c98884a4a

閑話休題

2018年から今までDiscordを使い続けている筆者ですが、今まで数々のBOTに出会ってきました。
良いBOTからあまり使えなかったBOTまで、今まで出会ってきた読み上げBOTを皆様と共有することでDiscordコミュニティに貢献できたらと考えこの記事を作成しました。

注意書き

この記事はできるだけ公平にしているつもりではありますが、どうしても主観的評価が入ってしまっているでしょう。

この記事の真偽はご自身でお考え下さい。
間違った情報があればぜひコメントでご指摘お願い致します。

音声合成エンジン

開発元 簡単な紹介
Open JTalk 名古屋工業大学 Discord読み上げBOT界において最も一般的な音声合成ライブラリ
Google TTS Google LLC 人と遜色のない限りなく自然に近い音声を出せる有料ライブラリ
音声はStandardとWavenetがあり、後者の方が精度が高い
A.I.VOICE 株式会社エーアイ 結月ゆかり、琴葉姉妹を代表とする合成音声ソフトウェア
人に近い音声を出せる
VOICEVOX ヒホ氏等
オープンソース
オープンソースソフトウェアで高品質の音声を生成できるソフトウェア

評価方法

項目 評価
可用性 BOTの稼働率
安定性 しっかり読み上げてくれるかどうか
応答性 読み上げやコマンドの反応の早さ
復旧性 故障した際のBOTの復旧速度
機能性 機能が豊富にあるか
利便性 機能が理解しやすいか
音声の種類 使用している合成音声
コマンド形態 テキストコマンド / スラッシュコマンド
ウェブダッシュボード あり / なし
料金プラン 無料:金銭のやりとりなし (機能制限なしの寄付がある場合はこちら)
課金:機能制限などがあるが一部無料で使える
有料:完全に有料
サービスに対しての料金、いわゆるコスパについての評価はここではしない。
総合評価 四捨五入の5点満点

※上6つの性能に関する語の一部はシステム管理工学に精通していない人でも分かるように本来の言葉の意味よりかは字面に寄せて定義しております。

BOT一覧

喋太郎

項目
可用性 ★★★☆☆
安定性 ★★☆☆☆
応答性 ★★★★☆
復旧性 ★★★☆☆
機能性 ★★☆☆☆
利便性 ★★☆☆☆
音声の種類 Open JTalk
コマンド形態 テキストコマンド / 一部スラッシュコマンド
ウェブダッシュボード なし
料金プラン 無料
総合評価 ★★☆☆☆

更新日2022/09/09
筆者が知る中で最古の日本製読み上げBOTです。
Open JTalkを使った合成音声は誰しも一度は聞いたことがあるのではないでしょうか。
反応速度、つまり機械音声の合成速度は早いですが、稀に反応しなくなったりBOTが落ちたりする不安定さがあります。
辞書機能などにも対応していますが、2022/07/29現在ファイルでの出力は対応していないようです。

2022年9月からのDiscordの仕様変更により一部のコマンドがスラッシュコマンドに対応しました。基本的に説明文が書いてあるコマンドは対応しており、一部/helpなどは説明文がない状態でも対応しています。

Fantiaを経由して寄付をすることが出来ます。
https://www.dayaman.work/syabetaro/info


Shovel

項目
可用性 ★★★★☆
安定性 ★★☆☆☆
応答性 ★☆☆☆☆
復旧性 ★★★★☆
機能性 ★★★★☆
利便性 ★★☆☆☆
音声の種類 Open JTalk
コマンド形態 テキストコマンド
ウェブダッシュボード なし
料金プラン 課金
総合評価 ★★★☆☆

更新日2022/07/29
喋太郎と日本読み上げBOT界の双璧を成すShovelシリーズです。
Shovelシリーズにはそれぞれ青(無印)、赤、緑、シアン、マゼンタ、イエローの6つがあり、さらに試用版の青-、支援者向けの青+、赤+、緑+があり、全てを導入したら計10個のBOTをサーバーに入れることができます。
夜は利用者が多いため、青赤緑は反応が非常に遅いです。シアン、マゼンタ、イエローは比較的反応は早いです。
課金プランは月額500円、1000円、3000円プランがありますが、内容は全て同じです。
課金をする場合、上の安定性と応答性がかなり上昇しますので、Shovelを使い続けたい方はご検討なさってみては如何でしょうか。

無料プラン 支援プラン (全て内容は同じ)
料金 Free \500/月
\1000/月
\3000/月
使用可能BOT 青、赤、緑、シアン、マゼンタ、イエロー、青- 無料プランに加えて
青+、赤+、緑+
接続制限 通常 優先接続

支援プランはサポートサーバーに入り、支援窓口でpixivFANBOXに飛び、支援をしてから開発者にDMを送る必要があります。
https://cod-sushi.com/shovel-how-to-use/


よるみさん

項目
可用性 ★★★★★
安定性 ★★★★★
応答性 ★☆☆☆☆
復旧性 ★★★★☆
機能性 ☆☆☆☆☆
利便性 ★★★★★
音声の種類 Open JTalk
コマンド形態 スラッシュコマンド
ウェブダッシュボード なし
料金プラン 無料
総合評価 ★★★☆☆

更新日2022/07/30
読み上げる機能のみが付いた非常にシンプルなBOTです。
コマンドも/yorumi join/yorumi disconnectしかなく、辞書機能や話者変更なども実装されていないようです。
音声生成速度はあまり早くはありませんが、昼夜問わず安定した読み上げをしてくれます。

また、毎月4万文字の読み上げ制限があるため活発なコミュニティではやや不十分気味かもしれませんが、初めて入れる読み上げBOTとしてはハードルも高くなく良いのでは無いでしょうか。
https://note.com/yorumi_bot/n/naaf8b11a906b


読みそ

項目
可用性 ★★★★☆
安定性 ★★★★☆
応答性 ★★☆☆☆
復旧性 ★★★★☆
機能性 ★★★☆☆
利便性 ★★★☆☆
音声の種類 Open JTalk
コマンド形態 テキストコマンド
ウェブダッシュボード なし
料金プラン 無料
総合評価 ★★★☆☆

更新日2022/07/30
複数の読み上げチャンネルを指定できる特徴があるBOTです。
-connectで接続し-connectmultiを入力すると他のチャンネルも読み上げしてくれます。
切断後はチャンネル指定もリセットされるため再接続させたときに再度指定する必要があります。

基本的に昼夜問わず快適に読み上げてくれますが、若干読み上げにラグがあります。
それをストレスに感じないのであればオススメできるBOTと言えるでしょう。

また、Buy Me a Coffeeから寄付をすることが出来ます。
https://megumiso.com/article/made-discord-reading-bot/


Chat Reader

項目
可用性 ★☆☆☆☆
安定性 ☆☆☆☆☆
応答性 ★★☆☆☆
復旧性 ★★★★★
機能性 ★★★☆☆
利便性 ★★☆☆☆
音声の種類 Open JTalk, Google TTS, VOICEVOX
コマンド形態 スラッシュコマンド
ウェブダッシュボード なし
料金プラン 無料
総合評価 ★★☆☆☆

更新日2022/08/06
Chat Readerの特徴はメンバーのミュートのON / OFFや画面共有、カメラ配信等のアナウンスも非常に細かく読み上げてくれる設定ができるところです。
音声に関する設定はエンジンごとに変えることができ、ピッチやボリューム、スピードなども細かく調整できます。

しかし現時点では長文を読み上げる際、途中までしか読み上げなかったりBOTが固まり1分半ほどすると(おそらく全サーバーの)VCから強制的に切断されてしまうなど安定性に欠けます。一つのサーバーでこの現象が起きると他全てのサーバーでも切断されてしまうため、この不具合は致命的と言えるでしょう。

幸いVCから切断されてしまってもBOTが落ちることはないようです。なので再び/setコマンドでVCに呼んだら読み上げてくれますので、サーバー導入数が増えるまでは使用できると考えられます。

安定性が改善されたら良いBOTとなると考えられるので、今後の開発に期待します。
https://kuwa.app/discord/


ShabeleA

項目
可用性 ★★★★★
安定性 ★★★★☆
応答性 ★★★★★
復旧性 ★★★★★
機能性 ★★★★★
利便性 ★★★☆☆
音声の種類 Open JTalk / Google TTS
コマンド形態 テキストコマンド / 一部スラッシュコマンド
ウェブダッシュボード あり
料金プラン 有料
総合評価 ★★★★★

更新日2022/07/29
多機能読み上げBOTです。
チャンネル作りから自動入退室など痒いところに手が届く素晴らしいBOTです。
コマンドはメニューによって管理されており、「m」で表示されるメニューから多数の機能を操作できます。
しかしこちらのBOTは機能がありすぎて難解な印象を受けます。1年近く使わせて貰っていますがおそらく筆者も全てのコマンドを網羅しているわけではないでしょうし、多くの機能を使いません。
料金はOpenJTalkプランとGoogle TTSプランがあり、前者は月額500円 (年額5,500円) で、後者は月額800円 (年額8,800円) で合計10機を複数のサーバーに導入することができます。
Google TTSプランでは月ごと、年ごとのポイント制限 (文字数制限) があります。制限超過後は自動的にOpenJTalk音声に切り替わります。

注意事項として、支払いはCAMPFIRE CommunityとStripe(yieldspace connect)を利用できますが、CAMPFIREでの支払いではGoogle TTSプランは利用できないため、特に理由が無ければStripeをオススメします。

Open JTalkプラン Google TTSプラン (Stripe決済のみ)
料金 \500/月
\5500/年 (Stripe決済のみ)
\800/月
\8800/年
OpenJTalk 無制限 無制限
Google TTS ポイント × 80万ポイント/月
960万ポイント/年
以下のStandardとWavenetで消費ポイントが異なるので注意
Google TTS Standard × 1文字ごとに1ポイント消費
80万文字/月
960万文字/年
Google TTS Wavenet × 1文字ごとに4ポイント消費
20万文字/月
240万文字/年
話者 Open JTalkの5種類 左に加えGoogle TTSの4種類

Stripeでの支払いは先にBOTをサーバーに招待して!shw contractコマンドでプランを選択し支払いページに移行します。

スラッシュコマンドには一部対応していますが、2022/07/29現在まだ未実装な部分も多いため、対応されたらさらに素晴らしいBOTになることが期待できます。
https://community.camp-fire.jp/projects/view/315819


ALBOT

項目
可用性 ★★★★☆
安定性 ★★★★★
応答性 ★★★★★
復旧性 ★★★★☆
機能性 ★★★★☆
利便性 ★★★★★
音声の種類 Google TTS
コマンド形態 テキストコマンド
ウェブダッシュボード あり
料金プラン 課金
総合評価 ★★★★★

更新日2022/07/29
たくさんの機能がありますが、設定の変更はダッシュボード上で行われており、直感的に分かりやすいデザインになっています。
料金体系は月額200円(年額2,200円)の基本プランと月額400円 (年額4,000円)のラージプランがあり、導入するサーバーの活発度によって使い分けることができます。

無料プラン 基本プラン ラージプラン
料金 Free \200/月
\2200/年
\400/月
\4000/年
自然な音声 5000字/月 2万字/月 10万字/月
人工的な音声 1万字/月 4万字/月 20万字/月
言語 日本語 / 英語 全言語 全言語
その他 VCの入退室の読み上げ
読み上げ時の自動翻訳
声の変更
VCの入退室の読み上げ
読み上げ時の自動翻訳
声の変更

また、プランとは別に寄付もすることができるので、BOTが気に入ったら寄付も検討してみては如何でしょうか。
https://albo.info/


ずんだもんβ

項目
可用性 ★★★★★
安定性 ★★★★★
応答性 ★☆☆☆☆
復旧性 ★★★★☆
機能性 ★☆☆☆☆
利便性 ★★★★★
音声の種類 VOICEVOX
コマンド形態 スラッシュコマンド
ウェブダッシュボード なし
料金プラン 課金
総合評価 ★★★★☆

更新日2023/01/23
VOICEVOXの読み上げBOT。β, γ, δがある。
おそらく初号機と思われるBOTの名前は「???(開発中)」となっている。
現在辞書機能はサポートサーバーでのみ使用でき、そこで登録した単語は全てのサーバーで適用されます。
BOTの名前はずんだもんですが、VOICEVOXの話者は網羅されています。

コマンドは/setvc/vcのみ。
/vcコマンドは参加と退場を一つのコマンドにまとめていて、/setvcはBOTが喋る話者を変更できる。
stripeにて課金することができる。

金額は月100円から1,000円まであるが、内容は全て同じもの。

無料プラン プレミアムプラン
読み上げる文字数 50 100
一時声変更機能 ×

無料プランでは1メッセージあたり50文字の制限があり、有料プランではそれが100文字にまで引き上げられる。
プレミアムプランはユーザーごとの機能で加入者が/vcコマンドを使用するとプレミアム機能を使用することができる。

その他は計測中
https://lenlino.com/?page_id=2171


VOISCORD

項目
可用性 ★★★★☆
安定性 ★★★★☆
応答性 ★★★★★
復旧性 ★★★★★
機能性 ★★★★☆
利便性 ★★★★★
音声の種類 VOICEROID
コマンド形態 スラッシュコマンドコマンド
ウェブダッシュボード あり
料金プラン 無料 (今後課金に変更予定)
総合評価 ★★★★★

更新日2022/07/29
最後におまけ程度にVOISCORDです。
筆者が開発しているBOTですので、自信はありますがこちらの評価はあまりあてにしないで下さい。

安定したVOICEROIDの読み上げを目指しています。
筆者は元々聴覚が敏感だったため、Open JTalkなどで生成された高い音声では苦しく感じることがあり、それ故VOISCORDもデフォルトのピッチなどは低く設定されています。

機能は読み上げに便利で必要かつ十分な機能を加え、今後は複雑な設定はコマンドからではなくウェブダッシュボードでの操作を主体に開発していく予定です。

現在は毎日50ほど導入サーバーが増えており、今後の課題として負荷分散を解決していきます。

他BOTの差別化として、当BOTは読み上げチャンネルを任意の数増やすことができます。
例えばチャンネル1とチャンネル2、チャンネル5を読み上げの対象にしたい場合、それぞれを有効化すると有効化されたチャンネルで投稿されたメッセージを読み上げてくれます。
https://zenn.dev/voiscord/articles/47a23c98884a4a

評価済み未掲載BOT一覧

BOT名 状況
読ませてイルカ(イルー) 一時掲載取り消し。

未評価のBOT一覧 (2022/07/29)

BOT名 理由
ぴちぴちBOT 認証済みBOTではないため
外部サイトがなかったためリンク先はいくら様の紹介ページ
ヨミアゲハ 招待コードがどこにあるのか分からなかったため
読み上げボット 認証済みBOTではないため
先着100サーバー限定(2022/07/29時点で56サーバー)で
快適に読み上げてくれる
読み上げ bot 認証済みBOTではないため

おわりに

可能な限り公平に書いたつもりですが、使っていた時間によって筆者の把握度合いが違うため、どこかひいき目に見ている可能性もあります。

記事の真相はご自身で体験してみて下さいませ。

開発者目線での各BOTへの寄付のお願い

BOTが無料で使える仕様になっているものは開発者の善意によるものです。
BOTの中でもTTS (Text-to-Speech) BOT、いわゆる読み上げBOTは音声合成という高負荷の掛かる処理をしており、マシンスペックを一定以上保たなければスムーズな読み上げができません。Google TTSなどの外部のWEBサービスを利用する場合はそのサービスの従量課金制となり、さらにコストは嵩んでしまいます。
また、他BOTと異なり音声ファイルという大きなサイズのファイルを扱うことから通信量もそれなりにかかり、開発費・運営費共に比較的高コストなBOTとなっています。
金額で言うならば、運営費だけでも月々数千円から大規模になれば数万、数十万円かかってしまう場合もあるでしょう。
気に入ったBOTがあればぜひ有料プランや寄付などを行い、今後もサービスが続くようにBOT運営の手助けをして上げてください。

あなたの数百円の寄付が開発者の負担を軽減させ、開発意欲を向上させます。

謝辞

全ての善良なDiscord Developerは皆一貫してDiscordを便利にしたいという志の下で開発を行っており、開発費は基本的に個人負担です。
また、Developerを支えるDiscord API Libraryもまた大きなコミュニティに属するDeveloperによる無償提供です。
Discord無くしてDeveloperは存在しませんし、Developer無くしてDiscordは発展しません。そしてそれらを支えているのは皆様ユーザー一人一人です。
私はいちDeveloperとしてDiscordコミュニティに属する全ての善良なユーザー、そして音声合成技術を日々研究開発して下さる方々に最大限の敬意を表します。

ついでにVOISCORDもよろしくお願い致します。
https://zenn.dev/voiscord/articles/47a23c98884a4a

Discussion