EP005 Maskowanie dźwięku czyli rzecz o słuchu



Bale maskowe znane są już od czasów średniowiecza.
Poza dostarczaniem wrażeń w wymiarze rytualnym lub rozrywkowym umożliwiają zamaskowania części informacji, tak by do odbiorcy nie docierał pełen obraz.
W ten sposób wprowadzany jest intrygujący element niewiadomej.
Jest to oczywiście intencjonalne i sztuczne działanie na informacji.

Okazuje się, że podobną maskaradę uprawia z nami nasze własne ciało.
I mimo, iż nie chodzi tu o obraz, lecz dźwięk, manipulacja, w tym przypadku, odbywa się w zupełnie naturalny sposób.
Przekonajmy się czym jest zjawisko, na które być może nie zwracamy uwagi, a które jest obecne z nami na co dzień.

Nazywam się Grzegorz Kaczmarek i zapraszam Cię do wysłuchania odcinka podcastu Słowo Dźwięk Komunikacja poświęconego tematowi maskowania dźwięków.

Wstęp

Mówi się, że dynamika naszego słuchu, czyli różnica pomiędzy poziomem najcichszego i najgłośniejszego słyszalnego dźwięku, jest duża. Dzięki temu sprawnie funkcjonujemy tak w ciszy jak i hałasie.

Co zatem dzieje się z nami gdy oczekując na informację o zmianie peronu pociągu, na który już prawie spóźniliśmy się, rozlega się hałas przejeżdżającego składu?
Dlaczego na miłym spotkaniu w zatłoczonej restauracji podnosimy głos, by porozumieć się z osobami znajdującymi się po drugiej stronie stolika?

Przecież głośne do cichego jest w ramach specyfikacji, a mimo to nie potrafimy usłyszeć tego na czym nam zależy.
Czyżby problemy zależały od tego z czego składa się scena dźwiękowa?…

To czego doświadczamy słuchając jest zróżnicowane pod wieloma względami.
Jedne dźwięki są głośniejsze (hau hau), inne zaś cichsze.
Jedne są prostsze, a inne bardziej złożone.
Tempo zmian słyszanej treści może zdawać się wolne, kiedy zaś indziej zupełnie szybkie.
Do tego wszystkiego dochodzą jeszcze różne kierunki, z których nadchodzą sygnały, zróżnicowanie ich poziomów, odbicia, przesunięcia czasowe i częstotliwościowe.

W całym tym skomplikowaniu musimy się jakoś odnaleźć.
Korzystamy więc z dedykowanego zmysłu jakim jest nasz słuch.

Jak każda fizyczna konstrukcja posiada on jednak swoje ograniczenia, które wpływają na to jak wiernie potrafimy odbierać to co dzieje się dookoła nas.

Ty i ja funkcjonujemy w świecie otaczającym nas obficie skomponowanym koktajlem dźwięków, które jako niezależne podróżują sobie w przestrzeni.
Gdy w końcu dotrą do naszych uszu podlegają detekcji przez nerwy słuchowe, które wprawdzie reagują na zmieniającą się częstotliwość i intensywność, ale nie rozróżniają współistnienia różnych źródeł dźwięku.
Każdy z nerwów wychwytuje drgania w konkretnych zakresach, skutkiem czego tony o zbliżonej ilości cykli mogą być odbierane jako jeden.
Taka sytuacja może prowadzić do przekłamań lub utraty informacji.

Uczeni zajmujący się badaniem mechanizmów działania ludzkiego słuchu dokonali ciekawego odkrycia, które stało się kanonem psychoakustyki.
Wykazali oni, że stajemy się nieczuli na pewne dźwięki pojawiające się w obecności innych.
Oznacza to tyle, że część informacji docierającej do uszu jest niedetekowalna lub poziom czułości na nie zostaje, nawet znacząco, obniżony.
Jest to swego rodzaju bal maskowy serwowany nam przez nasze własne ciało.

Odkryty efekt, zgodnie z jego działaniem, został nazwany maskowaniem, a wiedza o nim stała się na tyle użyteczna, że wykorzystywana jest komercyjnie.
Przykładami użycia mogą być: wkład w opracowanie bardzo popularnego formatu kompresji dźwięku mp3, automatyczna regulacja wzmocnienia systemu audio w poruszającym się samochodzie lub budowa akustycznych systemów tworzących strefy poufności w zatłoczonych biurach.

Te ciekawe zastosowania mają jednak swoje korzenie w stosunkowo prostych obserwacjach.
Pozwól, że przybliżę Ci kilka z nich, aby zainspirować Cię do pogłębienia wiedzy i poeksperymentowania z jednym z własnych zmysłów.

Maskowanie

Termin maskowanie określa zjawisko podniesienia progu czułości układu słuchowego dla sygnału maskowanego, który staramy się usłyszeć w obecności sygnału maskującego – czyli maskera.
Obrazowo jest to zjawisko podobne do podnoszenia głosu w czasie rozmowy odbywającej się w hałaśliwej przestrzeni. Ma to na celu utrzymanie zrozumiałości przekazu, która to jest ograniczana wpływem sygnałów zakłócających. Wymóg zwiększenia ciśnienia akustycznego zanikającej informacji ma przeciwdziałać utracie jej czytelności.
Ta sama rozmowa może być przeprowadzona dużo ciszej gdy przeszkadzające hałasy nie występują.

Poznanie i zrozumienie mechanizmów działania maskowania wymagało szeregu eksperymentów, z których wiedza umożliwia świadome kreowanie przestrzeni akustycznej i jest istotnym narzędziem wykorzystywanym przy tworzeniu materiałów audio.

Wyróżnia się dwa typy maskowania, które dzieli się ze względu na sposób występowania sygnału maskującego.
Są nimi: maskowanie stałe i tymczasowe.

Maskowanie stałe, lub równoczesne, zachodzi wówczas, gdy masker obecny jest przez cały czas trwania sygnału maskowanego.
Maskowanie tymczasowe, lub nie równoczesne, to z kolei sytuacja kiedy masker pojawia się tuż przed lub tuż po sygnale maskowanym.

Aby zrozumieć i poczuć na sobie omawiane zjawiska wykonajmy serię doświadczeń.
Przekonajmy się razem jakie ciekawostki skrywa nasze ciało w obszarze słuchu.

Maskowanie stałe – permanent masking

W pierwszej kolejności zajmiemy się maskowaniem stałym.
Oznacza to tyle, że podczas testów odsłuchowych tony maskowane będą prezentowane na tle stałego sygnału maskującego.

Na masker wybrałem szerokopasmowy sygnał o stałym ciśnieniu akustycznym na oktawę czyli szum różowy. Zawiera on w sobie wszystkie składowe częstotliwości z pasma akustycznego czyli w przedziale od 20[Hz] do 20[kHz].
Szum ten jest sygnałem testowym często stosowanym w akustyce.

W pierwszym przykładzie chcę zaprezentować Ci co dzieje się z sygnałem maskowanym, który będę odtwarzał Ci ze zmieniającą się mocą.
Słyszalny ton 1[kHz] będzie skokowo tracił na intensywności do momentu, aż przestaniesz go w ogóle słyszeć, ponieważ zginie w szumie. Gdy do tego dojdzie dalsze zmniejszanie mocy sygnału maskowanego zostanie zatrzymane, a ja usunę szum, abyś mógł się przekonać, że niesłyszalny dotąd ton jest całkiem dobrze odbieralny, gdy usunie się sygnał maskujący.
Próbkę tą zagram Ci dwukrotnie.

[próbka dźwiękowa]

Po przekroczeniu pewnego progu w różnicy pomiędzy mocami obu sygnałów szum całkiem przykrył ton testowy. Sygnał maskujący był dużo głośniejszy od tonu maskowanego.
Okazało się także, że po usunięciu zakłócacza ton maskowany był doskonale wyczuwalny co pokazuje że informacja o jego istnieniu została stracona w obecności odpowiednio dobranego maskera.

Następnym przykładem efektu maskowania jest sytuacja, w której 1[kHz] ton testowy zmniejsza stopniowo czas swojego trwania.
Startując od sygnału o długości pół sekundy zobaczymy czy i jak zmienia się wrażenie jego głośności gdy długość ta będzie skracana by osiągnąć minimum na poziomie 1[ms].

Odegram Ci w kolejności 12 próbek mających coraz mniejszy czas trwania tonu testowego.
Początkowo będzie to czysty ton, abyś mógł się przekonać czy jesteś w stanie usłyszeć wszystkie elementy.
Następnie dodam szum maskujący i powtórzę całą sekwencję dwukrotnie.

Zwróć uwagę na poziom postrzeganej głośności tonu maskowanego i czy jesteś w stanie usłyszeć wszystkie z jego 12 próbek.

[próbka dżwiękowa]

W zależności od tego jak sprawny masz słuch najprawdopodobniej mogłeś usłyszeć 10 do 11 próbek. Prawdopodobnie zauważyłeś także iż wraz ze spadkiem długości sygnału testowego wrażenie głośności tonu 1[kHz] było coraz niższe, by całkowicie zaniknąć przy końcu sekwencji.

Ideą kolejnego testu jest pokazanie, że dzięki odpowiednio dobranym parametrom maskera można uzyskać efekt przykrywania wybranych częstotliwości sygnału maskowanego.
Do tej próby wykorzystam masker będący sygnałem wąskopasmowym.
Wąskopasmowym w takim rozumieniu, że nie zajmuje on już tak szerokiego pasma, jak używany dotąd szum różowy.
Zawężenie pasma uzyskałem przez odfiltrowanie szumu różowego w paśmie około 1[kHz] przy częstotliwości środkowej 2[kHz].
Sygnałem testowym jest ton o płynnie zmieniającej się częstotliwości pomiędzy 500[Hz] a 3[kHz].
Ów ton zagram Ci na czysto raz na początku, po czym dwukrotnie w obecności maskera.
Zwróć uwagę na to czy i jak zmienia się wrażenie odczuwalnej głośności sygnału maskowanego.

[próbka dźwiękowa]

Wrażenie ściszania w czasie zbliżania się sygnału testowego do częstotliwości 2[kHz] i późniejsze jego zgłaśnianie to efekt maskowania sygnałem wąskopasmowym o częstotliwości środkowej ustalonej właśnie na 2[kHz].
Eksperyment ten pokazuje, że możliwe jest takie konstruowanie maskerów, by w bardziej celowy sposób wpływać na blokowanie żądanych składowych sygnału maskowanego.

Maskowanie tymczasowe – backward masking

Drugim typem maskowania jest maskowanie tymczasowe. Polega ono na tym, że masker nie jest obecny w czasie trwania sygnału maskowanego, lecz występuje tuż przed lub za nim.
Zaprezentuję Ci oba efekty osobno, a na pierwszy ogień weźmiemy wersję, gdzie maskowany sygnał występuje tuż przed maskerem.

Pre-masking lub backward masking działa w małym zakresie gdzie przerwa pomiędzy sygnałami jest nie dłuższa niż 20[ms]. Skuteczność maskowania ma charakter wykładniczy z jej wzrostem przy skracaniu tego czasu.

Sygnałem maskowanym jest ton o częstotliwości 1[kHz] i długości 20[ms]. Sygnałem maskującym jest szum różowy o czasie trwania wynoszącym 1[s].
Sekwencja testowa to 13 prób, gdzie pierwszych 6 polega na skracaniu odstępu w zakresie od 25[ms] do 5[ms].
Próba 7 to czas wyzerowany – co oznacza, że koniec tonu rozpoczyna szum.
Pozostałe 6 prób to ponowne narastanie odstępu w sekwencji odwrotnej do pierwszych 6 przypadków.
Postaraj się wsłuchać i zauważyć czy odczuwasz zmianę intensywności tonu testowego.

[próbka dźwiękowa]

Mam nadzieję, że udało Ci się zarejestrować nasilenie wpływu maskowania przy zbliżaniu się końca tonu testowego do początku szumu.
Sygnał testowy stracił na intensywności w porównaniu do sytuacji kiedy był znacznie oddalony od szumu.

Maskowanie tymczasowe – forward masking

Ostatnim z przykładów jest maskowanie sygnału występującego tuż po sygnale maskującym.
Badania nad zjawiskiem forward masking, lub post-masking, podają, że tego typu maskowanie jest efektywniejsze i oddziaływuje na dłuższym odcinku pomiędzy maskerem i sygnałem maskowanym.
Jest to zakres do około 200[ms] i wpływ maskera ma charakter wykładniczy tracąc na intensywności wraz ze zwiększaniem się odstępu.

Podobnie jak poprzednio sygnał testowy jest tonem o częstotliwości 1[kHz] i długości 20[ms]. Masker to szum różowy o długości 1[s].
Schemat eksperymentu jest także ułożony podobnie i składa się z 13 prób, gdzie pierwszych 6 polega na zmniejszaniu odstępu sygnału maskowanego od maskera w przedziale 250[ms] do 5[ms].
Próba 7 to brak odstępu pomiędzy sygnałami, zaś numery 8 do 13 to ponowne zwiększanie się odstępu.
Podczas odsłuchu zwróć ponownie uwagę na to czy wrażenie głośności słyszanego tonu 1[kHz] ulega zmianie.

[próbka dźwiękowa]

Mam nadzieję, że tak jak poprzednio udało Ci się zarejestrować spadek głośności sygnału maskowanego wraz ze zmniejszaniem się odległości pomiędzy sygnałami.
Efekt maskowania ma bliźniaczy charakter jak w przypadku poprzedniego testu z różnicą dotyczącą czasu, w którym efekt maskowania jest zauważalny.

Podsumowanie

W kwestii warsztatowej to już wszystko.
Czas na podsumowanie.

Przede wszystkim mam nadzieję, że podczas odsłuchu zaprezentowanych materiałów świetnie się bawiłeś.
W poczynionych obserwacjach zależało mi na pokazaniu Ci pewnej ciekawostki, której doświadczenie może być inspiracją i powodem do zastanowienia.

Omówione pokrótce zagadnienie maskowania ukazuje specyficzną właściwość ludzkiego słuchu.
W życiu codziennym doświadczamy tego przykładowo podnosząc głos chcąc zrozumiale komunikować się w obecności zgiełku.
Podobnie jest w przypadku podróżowania samochodem, gdy podkręcamy wzmocnienie radia by dobrze słyszeć audycję podczas szybszej jazdy.

Mimo, iż nie jesteśmy w stanie obejść tego zjawiska, ponieważ wynika ono wprost z budowy naszego ciała, możemy próbować wykorzystywać je do tego by żyło się nam lepiej.

Przykładem takiego zastosowania jest minimalizacja rozpraszającego wpływu rozmów pobliskich osób, na przykład w miejscu pracy, poprzez budowanie systemów audio generujących odpowiednio spreparowany szum maskujący docierające odgłosy.

Jak to zwykle z nauką bywa ciekawe odkrycia można sprytnie wykorzystać do tworzenia innowacyjnych i czasem zaskakujących rozwiązań technologicznych.

Dobrym przykładem jest popularny format stratnej kompresji dźwięku mp3.
U jego podstaw leży, między innymi, psychoakustyczny model słuchu, pozwalający na usuwanie nadmiaru danych opisujących dźwięki, których odbiorca i tak nie usłyszy właśnie ze względu na efekt maskowania.

Zachęcam Cię do zgłębienia wiedzy i poeksperymentowania z własnym słuchem.
Listę ciekawych materiałów startowych znajdziesz w notatkach do tego odcinka.

Być może zdobytą wiedzę wykorzystasz w sposób pozwalający na uzyskanie jakiegoś zaskakującego efektu audio?
Jeśli tak się stanie nie zapomnij podzielić się nim z pozostałymi słuchaczami SDK.
Może to być wiadomość głosowa, email lub też komentarz.
Sposobów kontaktu szukaj w opisie towarzyszącym temu epizodowi.

Informacje dodatkowe

Leave a Comment

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Witryna jest chroniona przez reCAPTCHA i Google Politykę Prywatności oraz obowiązują Warunki Korzystania z Usługi.