
音声AIの300ms -- 人はなぜAIとの会話に違和感を覚えるのか
音声AIの体験は「速さ」で9割決まる。人間の会話ターンは平均200ms。300msを超えると違和感、800msを超えると会話が崩壊する。本書では、Pipecat・LiveKit・Deepgramなど最新スタックを使い、カスケードパイプラインの525msの壁をストリーミング設計・知覚ハック・エッジAIで突破する方法を解説する。
Chapters
前書き: 0.3秒の壁
第1章: 人間の会話は200msで回っている
第2章: Nielsenの3閾値を音声UIに翻訳する
第3章: 待ち時間の心理学 -- 人間の脳は「遅い」をどう感じるか
第4章: 300ms・500ms・800ms -- 3つの崖
第5章: レイテンシの解剖 -- 遅延はどこで生まれるか
第6章: TTFB -- 最初の1バイトが全てを決める
第7章: ストリーミング設計 -- 並列化で時間を圧縮する
第8章: 待たせても気づかせない -- 知覚ハック
第9章: ターンテイキング -- 「遮らない」「遅れない」の両立
第10章: Alexa / Siri / Google Assistantの教訓
第11章: エッジAIで300msを実現する
第12章: 設計原則 -- 音声AIのUXチェックリスト
あとがき: 0.3秒が変える未来
参考文献
著者紹介
奥付
Author
Topics
- 公開
- NEW
- 文章量
- 約53,330字
- 価格
- 1,200円