🐙

FFMPEGのラウドネスノーマライゼーションについて調査

2023/06/22に公開

Zeeny アシスタントにMyVPAという機能を追加した際に、コンテンツによって音のばらつきがでてしまうため、調整方法についてリサーチしました。

FFMpeg の loudnorm オプション

内部処理としてはFFMpegを使って音声を処理しており、そこでloudnormオプションを発見しました。
https://ffmpeg.org/ffmpeg-filters.html#loudnorm

しかし、使い方がわからない。。

そこで色々調べると、放送業界では活用されており、音声配信や動画配信でも活用されているという、業界では当たり前の機能とのこと。

設定をメインで見ていたのが、統合ラウドネス値(Integrated loudness target)、LRA(Loudness Range)、TP(True Peak)の値を調整していく形になりあす。

統合ラウドネス値が聴いた感じのうるささ、LRAが音の強弱の幅、TPが全体の中でのレベルのMAX値をどこまで抑えるかという設定。

設定値の調査

https://trivisionstudio.com/streaming-lufs/
統合ラウドネス値が、インターネットサービスは-14LUFSという値が多く、AmazonのAlexaなどでも基準になっているっぽい。YouTubeや、Spotfyも扱っている基準。

https://s3.amazonaws.com/izotopedownloads/docs/insight200/ja/loudness/index.html
放送やNetflixなどは、-24LUFSあたりで調整しているらしい。

TPは-1~-3が多い。

https://www.audiokinetic.com/ja/library/edge/?source=Help&id=more_on_loudness_range_lra
LRAは数字が小さいほどうるさいところで、大きいほど静かな広いところで聴くのに適しているらしい。5とかが電車の騒音の中で聴くような音、15が台所など。

一旦の設定値

色々試して、着信音としては

統合ラウドネスは-24、TPは-2、LRAは-10

あたりで調整。iOSとAndroidで聴こえが違うので、色々テストしてます。

開発しているアプリ

https://zeeny.com/pages/zeeny-assistant

目覚ましやアラームの通知音を一括設定できるので、好きな曲や音声でアラームを設定したいという場合には非常に便利だと思います。

ジャニーズ、K-POP、VTuberの音声なんかを入れ込むと、推しでバーチャルなアシスタント感覚で利用できるます。

Discussion