🐙
FFMPEGのラウドネスノーマライゼーションについて調査
Zeeny アシスタントにMyVPAという機能を追加した際に、コンテンツによって音のばらつきがでてしまうため、調整方法についてリサーチしました。
FFMpeg の loudnorm オプション
内部処理としてはFFMpegを使って音声を処理しており、そこでloudnormオプションを発見しました。
しかし、使い方がわからない。。
そこで色々調べると、放送業界では活用されており、音声配信や動画配信でも活用されているという、業界では当たり前の機能とのこと。
設定をメインで見ていたのが、統合ラウドネス値(Integrated loudness target)、LRA(Loudness Range)、TP(True Peak)の値を調整していく形になりあす。
統合ラウドネス値が聴いた感じのうるささ、LRAが音の強弱の幅、TPが全体の中でのレベルのMAX値をどこまで抑えるかという設定。
設定値の調査
統合ラウドネス値が、インターネットサービスは-14LUFSという値が多く、AmazonのAlexaなどでも基準になっているっぽい。YouTubeや、Spotfyも扱っている基準。
放送やNetflixなどは、-24LUFSあたりで調整しているらしい。
TPは-1~-3が多い。
LRAは数字が小さいほどうるさいところで、大きいほど静かな広いところで聴くのに適しているらしい。5とかが電車の騒音の中で聴くような音、15が台所など。
一旦の設定値
色々試して、着信音としては
統合ラウドネスは-24、TPは-2、LRAは-10
あたりで調整。iOSとAndroidで聴こえが違うので、色々テストしてます。
開発しているアプリ
目覚ましやアラームの通知音を一括設定できるので、好きな曲や音声でアラームを設定したいという場合には非常に便利だと思います。
ジャニーズ、K-POP、VTuberの音声なんかを入れ込むと、推しでバーチャルなアシスタント感覚で利用できるます。
Discussion