Pamiętasz czasy kiedy oglądając telewizję trzeba było energicznie sięgać po pilota żeby ściszyć dużo głośniejszy blok reklamowy?
Jeśli tak to również uprawiałeś DJ-ską zabawę suwakiem głośności by wzmocnić powracający, lecz cichszy, materiał.
Być może doświadczyłeś także zauważalnej zmiany poziomu głośności pomiędzy sąsiednimi utworami Twojej ulubionej składanki?
Nie takiej kupionej w sklepie, ale takiej do której materiał audio pozbierałeś samodzielnie…
Czy to w radio czy w telewizji, czy nawet w początkach działalności internetowych platform streamingowych, niejednorodność poziomów głośności była czymś spotykanym na co dzień.
Pomijając fakt, iż przytaczana niespójność mogła mieć charakter intencjonalny (jak w przypadku reklam), wynikała ona w dużej mierze z braku standardu dotyczącego pomiaru i oczekiwanego poziomu głośności dostarczanych materiałów.
Średnia odczuwalna głośność pozostająca na stałym lub zbliżonym poziomie jest po prostu przyjemna i nie rozprasza. Dzięki temu raz nastawione pokrętło wzmocnienia nie musi być ruszane w takt zmieniającego się materiału.
Zatem w jaki sposób wyrównać głośność różnych utworów, jakimi miarami dysponujemy i kiedy ich używać?
Nazywam się Grzegorz Kaczmarek i zapraszam Cię na odcinek podcastu Słowo Dźwięk Komunikacja, gdzie zajmiemy się tematem podstawowej oceny głośności materiału audio.
Wstęp
Zmienna głośność materiału audio to swego rodzaju metoda na zwrócenie uwagi słuchacza.
Niestety jeśli jej uśredniony poziom jest zauważalnie różny, w przypadku utworów odtwarzanych po sobie, zmienność ta może być uciążliwa.
Tak samo jak krzykliwe reklamy tak i skokowa zmiana głośności jest drażniąca i na ogół wymaga akcji związanej z jej regulacją.
Z jednej więc strony mamy kreatywność związaną z wykorzystaniem sposobu na przykucie uwagi, z drugiej zaś problem możliwych niedogodności płynących z niedopasowania poziomów głośności.
Na przestrzeni lat gdy technika zaczęła umożliwiać zapis dźwięku z coraz większą dynamiką ludzie zaczęli wykorzystywać ten fakt by produkować utwory odczuwalnie głośniejsze od materiałów innych producentów.
Za cenę kompresji dynamiki, uzyskuje się możliwość wzmocnienia cichszych partii utworu, co bezpośrednio przekłada się na głośniejszy jego odbiór.
Takie postępowanie doczekało się nawet swojego własnego terminu jakim jest “Loudness War” czyli wojna głośnością.
W wojnie tej bazuje się na przeświadczeniu, że to co odbierane jest jako głośniejsze ma mieć odbicie w poczuciu, że jest po prostu lepsze.
Problem zróżnicowania poziomów został uwidoczniony na masową skalę w okresie od powstania i w ciągu rozwoju platform streamingowych. Playlisty złożone z różnych treści i gatunków muzycznych ułożone w przypadkowej kolejności powodowały, że przejścia pomiędzy niedopasowanymi głośnością utworami wymagały, dość często, regulacji wzmocnienia odbiornika.
O ile potrzeba zwiększenia głośności w przypadku utworu cichego mogła być co najwyżej niewygodna, o tyle uderzenie mocnym dźwiękiem kolejnego utworu na rozkręconym już wzmacniaczu słuchawkowym mogło mieć konkretne konsekwencje zdrowotne.
W związku z powyższym, aby ukrócić ten stan i umożliwić zbalansowanie poziomów emitowanych materiałów podjęto działania zmierzające do tego, by wprowadzić standardowy wskaźnik oceniający głośność prezentowanego utworu.
Ustalenie i przestrzeganie jego umownej wartości ma za zadanie przeciwdziałać niespójności i chronić słuch.
Nie jest bynajmniej tak, że przed wprowadzeniem wymagań odnośnie średniego poziomu dźwięku nie było narzędzia do jej oceny. Po prostu problem jego zróżnicowania nie podlegał żadnym regulacjom, a jeśli nadawca starał się wyrównać odstające poziomy, było to przejawem jego własnego, jakkolwiek pojmowanego, interesu.
O ile w czasach techniki analogowej ocena poziomu głośności utworu dotyczyła właściwie wyłącznie parametrów elektrycznych zapisanego sygnału, o tyle wraz z pojawieniem się rozwiązań cyfrowych możliwym stała się bardziej zaawansowana analiza biorąca pod uwagę to w jaki sposób ludzkie ucho odczuwa głośność.
Mowa tu o dwóch wskaźnikach używanych współcześnie: RMS i LUFS.
Obie miary są dostępne każdej osobie pracującej z dźwiękiem.
Przekonajmy się jak mierzą i kiedy są używane.
Poziom głośności
Aby móc porównać i dopasować głośność pomiędzy utworami nie wystarczy po prostu wykonać jakiegokolwiek odczytu w dowolnym ich miejscu. Sygnał audio jest zmienny w czasie i dlatego miarą głośności musi być wskaźnik, który obejmuje ilościowo całe utwory.
Dlaczego całe, a nie na przykład początki lub końce?
Dla tego, że podczas słuchania całości niejako przyzwyczajamy się do dynamiki materiału i na tej podstawie potrafimy ocenić czy aktualnie słuchana audycja, lub muzyka, jest średnio rzecz biorąc głośniejsza lub cichsza od tego czego słuchaliśmy poprzednio, lub zaczynamy słuchać jako następne.
Jest to odczucie, czyli coś co opiera się o wrażenie jak odbieramy poziom dźwięku dla danego przedziału czasu.
Skoro coś co pochodzi typowo ze świata technicznego – w tym przypadku zapis dźwiękowy – ma być ocenione miarą opartą o ludzkie wrażenie, należało znaleźć sposób, aby stworzyć narzędzie oceniające głośność łączące oba te dwa światy.
W czasach, gdy produkcja dźwięku odbywała się głównie torami analogowymi do wykonania takiej oceny stosowano metrykę dość dobrą i dostosowaną do panującej wówczas techniki.
Mowa tu o mierze średniej RMS.
Polega ona na pomiarze wartości skutecznej sygnału uśrednionej za zadany czas, co jest realizowane za pomocą obwodu filtrującego.
To co otrzymujemy na wyjściu to informacja o energii jaką niesie badany sygnał.
Ekwiwalentem tej miary jest ilość ciepła jaka wydzieliłaby się na oporności odbiornika, podczas nagrzewania go prądem elektrycznym o natężeniu modulowanym sygnałem audio podlegającym ocenie.
W przypadku pomiaru RMS im więcej mocy w sygnale tym bardziej postrzegany jest on jako głośniejszy.
Poziom głośności tak ocenianej nie jest jednak liniowo proporcjonalny do mocy sygnału ponieważ nie uwzględnia on pewnych specyficznych cech ludzkiego słuchu.
Mimo to miara ta jest dość dobrą estymatą, a mierniki mocy RMS były i są dość proste w konstrukcji.
W czasach minionych ich wskazania były odczytywane ze wskaźników świetlnych i wychyłowych i dopasowywane “na oko” bądź po prostu “na ucho”.
Współcześnie, w dobie dźwięku cyfrowego, RMS wyrażany jest w decybelach względem pełnej skali, to jest umownego poziomu 0dB.
Poziom taki osiąga sygnał sinusoidalny, którego amplituda mieści się w całym przedziale przetwarzania urządzenia, lub oprogramowania.
Pomiar taki oznacza się jako RMS DBFS.
Zbliżanie się z wartością uśrednioną RMS, mierzoną za cały utwór, do obszaru bliskiego 0DBFS powoduje ryzyko zniekształceń dźwięku. Pozostawienie przestrzeni przynajmniej kilku decybeli na minusie to niezbędne minimum by nie zniekształcać bardziej dynamicznych partii materiału.
Rozwój psychoakustyki dostarczył wiedzy na temat zależności w percepcji głośności ludzkiego słuchu biorąc pod uwagę zmianę częstotliwości i ciśnienia akustycznego sygnałów testowych.
Tak zwane krzywe jednakowej głośności Fletcher’a Munson’a stały się podstawą do przedefiniowania sposobu oceny materiału audio i stworzenia udoskonalonej miary głośności.
W skrócie: inaczej odczuwamy poziom głośności sygnałów o tym samym ciśnieniu akustycznym, ale o innej częstotliwości. Zmiany te nie są liniowe i podlegają dodatkowym modyfikacjom przy zmianie natężenia dźwięku.
Możliwość cyfrowego przetwarzania sygnałów połączona z nową wiedzą spowodowała powstanie udoskonalonego wskaźnika wiążącego własności elektryczne z fizyką ciała ludzkiego – czymś czego próżno szukać w RMS.
Mowa tu o mierze LUFS “Loudness Unit Full Scale” czyli jednostce głośności odniesionej do, tak zwanej, pełnej skali.
LUFS czasem występuje pod nazwą LKFS, ale to te same metryki.
Wskaźnik ten podawany jest w decybelach i ma wartości ujemne z maksimum na poziomie 0DBFS – co odpowiada rzeczonej pełnej skali.
Poziom ten jest poziomem obcinania szczytów sygnału co wprowadza zniekształcenia. Tak jak w przypadku miary średniej RMS tak i w przypadku uśrednionego wskazania LUFS należy pozostawić przynajmniej kilka decybeli przestrzeni w minusie, aby nie doprowadzać do zniekształceń bardziej dynamicznych partii materiału.
Pomiar głośności metryką LUFS to swego rodzaju RMS na sterydach.
Oprócz uwzględniania specyfiki detekcyjnej ludzkiego ucha wskaźnik nie jest czuły na krótkotrwałe impulsy sygnału o znacznej energii oraz na bardzo ciche partie o dowolnej długości. Dzięki temu nie jest podatny na prostą manipulację jego wartości jakiej można dopuścić się przy klasycznym pomiarze RMS poprzez odpowiednie spreparowanie nagrania.
Tak w przypadku RMS jak i LUFS interesujemy się dzisiaj ich wariatami podającymi pomiar uśredniony za cały utwór. Te wskazania często noszą sufiks “integrated” – czyli zagregowane, lub po prostu oznaczane są dodatkowo wielką literą “I”.
To tyle teorii.
Sprawdźmy oba wskaźniki w działaniu, żeby porównać jak sobie radzą w przypadku tonów testowych oraz muzyki.
Testy odsłuchowe [tony testowe]
Posłuchaj kilku próbek sygnału o różnych częstotliwościach, lecz o tej samej wartości głośności wyrażonej miarą RMS.
Sygnały: 100Hz, 1kHz, i 5kHz zagram Ci po kolei dwukrotnie, a Ty spróbuj ocenić czy mają podobne poziomy głośności, a jeśli nie to które są względnie głośniejsze, a które cichsze.
[sygnały proste o równym RMS]
Biorąc pod uwagę miarę mocy zaprezentowane sygnały były takie same, a ich poziom został ustalony na -15DBFS RMS.
Jeśli zaś chodzi o odczuwalną głośność to mam nadzieję iż wyłapałeś, że poziomy były zróżnicowane.
Dla tych specjalnie dobranych częstotliwości ułożonych w tej, a nie innej kolejności wrażenie narastającej głośności wynika wprost ze wspomnianych wcześniej krzywych jednakowej głośności.
Wynik pomiaru wskaźnikiem LUFS jest o około 3dB niższy dla 100Hz i o około 3dB wyższy dla 5kHz. Dla 1kHz pomiary są zgodne.
Zobaczmy co się stanie kiedy te same sygnały zostaną poddane wyrównaniu do -15LUFS.
Zagram Ci je teraz w takiej samej sekwencji jak poprzednio.
[sygnały proste wyrównane w LUFS]
Prawda, że lepiej?
Na ucho jest dużo lepiej.
Głośność sygnałów została wyrównana.
Potęga nauki!
Przekonaliśmy się, że rzeczywiście miara LUFS uwzględnia to w jaki sposób postrzegamy głośność. Zamiast kręcić wzmocnieniem sygnałów dopasowując je “na ucho”, uzyskaliśmy wyrównanie głośności mogące odbywać się automatycznie.
Testy odsłuchowe [muzyka]
Rozważmy teraz bardziej skomplikowany przykład.
Z laboratorium przenieśmy się do prawdziwego świata, gdzie zamiast prostych tonów mamy do czynienia z szerokim zakresem częstotliwości i ich mocy obecnych jednocześnie, czyli muzyką.
Na potrzeby demonstracji wybrałem dwa utwory o odmiennych gatunkach muzycznych zrealizowanych tak, że nie przystają do siebie głośnością, ani pod względem miary RMS, ani LUFS.
Zagram Ci teraz ich kawałki, tak jakbyś słyszał je w portalu streamingowym w momencie, gdy następuje ich zmiana.
Czyli trochę końca jednego i trochę początku drugiego.
Najpierw wersje oryginalne.
[przejście muzyczne bez wyrównania]
Zagrałem Ci dwa kawałki o długościach na tyle dużych, żebyś mógł wyrobić sobie zdanie na temat ogólnego poziomu głośności każdego z utworów.
Oczywiście same nagrania zostały dobrane tak, by ich początki lub końce nie odbiegały zbytnio od tego co dzieje się w innych ich sekcjach.
Bez tego musielibyśmy przesłuchiwać każdy z utworów w całości, a to mogłoby być nużące.
Utwory pozostające bez wyrównania ich średniej głośności wzięły właśnie udział w wojnie głośności. Na przejściu pomiędzy nimi wyraźnie wychwycamy, że muzyka odtwarzana jako druga jest głośniejsza.
Dla porządku podam, że pomiar głośności utworu pierwszego to -12.5LUFS, a drugiego -6.8LUFS.
Zobaczmy teraz co się stanie kiedy dokonamy wyrównania głośności obu utworów według wskaźnika RMS na poziomie, użytych wcześniej sygnałów testowych, czyli -15DBFS.
[przejście muzyczne z wyrównaniem RMS]
Okazuje się, że przejście nie jest już przeszkadzające. Poziomy wyrównały się i można powiedzieć, że mamy narzędzie do tego, by trzymać w ryzach zmienność głośności różnych materiałów.
Wykonajmy teraz wyrównanie głośności obu utworów do poziomu -15LUFS i zobaczmy jaki jest efekt.
[przejście muzyczne z wyrównaniem LUFS]
Przejście pomiędzy utworami, zgodnie z założeniami, jest jak najbardziej OK.
Tym razem, według najlepszej wiedzy, wyrównanie powinno być dokładniejsze niż w przypadku wskaźnika RMS, ponieważ do oceny nie wchodziła wyłącznie moc sygnału, lecz także wiedza o tym jak postrzega głośność ludzki słuch.
Dla dopełnienia informacji liczbami, podczas wyrównywania głośności względem RMS odczyty w mierze LUFS dla obu utworów były na poziomie: -17.2LUFS i -15.9LUFS.
Oznacza to, że utwór drugi, z poprzedniego przykładu, powinien być odbierany mimo wszystko jako trochę głośniejszy.
Skutkiem tego przy wyrównaniu do żądanych -15LUFS utwór pierwszy został wzmocniony nieco bardziej, bo o 2.2dB, przy niespełna 1dB w przypadku drugim.
Wprawny muzycznie słuchacz prawdopodobnie jest w stanie wychwycić tą różnicę.
Podsumowanie
W tym odcinku miałeś okazję usłyszeć, że wrażenie głośności to coś więcej niż tylko poziom ciśnienia akustycznego.
Jednocześnie usłyszałeś jak rozważane metryki pomagają ocenić głośność sekwencji audio, by na tej podstawie móc wyrównać zróżnicowane poziomy.
I choć sposoby dokonywania przez nie pomiaru są różne, uzyskane efekty wcale nie muszą zbytnio od siebie odbiegać.
Dowiedziałeś się też, że w środowisku nadawczym wypracowany został pewien standard dotyczący normalizacji głośności.
W związku z powyższym nasuwa się kilka wniosków.
Po pierwsze tak RMS jak i LUFS nadają się do oceny głośności wybranego odcinka dźwięku, gdyż ich wskazania pozostają w relacji z ludzką percepcją głośności.
Po drugie przy pracy “na ucho” dowolna z tych miar może być stosowana w dowolnym miejscu ciągu przetwarzania audio ponieważ jego produkcja to nie zaprogramowany automat, a wytwór gustu, smaku i doświadczenia.
Po trzecie w związku z tym, że LUFS jest wskaźnikiem nowoczesnym biorącym pod uwagę dodatkowe informacje, których zwyczajnie brakuje w RMS, oraz faktem iż platformy streamingowe oraz świat broadcastingowy wymaga dostosowania się do tej miary, warto zadbać by był on na stałe włączony na samym końcu łańcucha miksu, nad którym pracujesz.
Na koniec jeszcze istotna uwaga.
Bez względu na to, z której metryki korzystasz należy mieć świadomość, że istnieją inne parametry przetwarzanego audio nie omówione tutaj, jak na przykład chwilowa wartość maksymalna sygnału, których odczyty także trzeba brać pod uwagę.
Dopasowanie głośności bazujące wyłącznie na uśrednionych wartości RMS czy LUFS nie zapewni, że wyprodukowany materiał będzie najlepszej próby lecz zgodny z częścią wymagań.
Zakończenie
Mam nadzieję, że dzięki zaprezentowanym przykładom pobudziłem Cię do rozważań i chęci zgłębiania tematu pomiaru głośności.
Być może poeksperymentujesz z dźwiękiem by uzyskać zaskakujące wyniki pomiaru głośności obu metrykami?
Jeśli tak się stanie koniecznie daj mi znać i podziel się wiedzą lub spostrzeżeniami ze słuchaczami SDK.
Jak zwykle zapraszam Cię do kontaktu.
Zostaw mi wiadomość głosową lub napisz email.
Sposobów kontaktu szukaj w opisie do tego odcinka.
Ja tymczasem wracam do pracy, ponieważ odkryłem właśnie, że moje wcześniejsze odcinki podcastu wymagają wyrównania głośności i dostosowania jej do standardu platformy streamingowej.
Informacje dodatkowe
- Analizator głośności materiału online
- Skala dBFS
- Loudness War – wojna głośnością
- Miara RMS
- Moc RMS
- Techniczne aspekty pomiaru RMS
- Krzywe jednakowej głośności Fletcher’a Munson’a
- LUFS
- LUFS kontra RMS
- Pomiary LUFS i RMS w przykładowym DAW [wideo]
- Mastering dźwięku dla różnych platform streamingowych
- Norma EBU R128 dotycząca poziomu głośności w broadcastingu