Počúvame už len vzorky?

Zaznamenávanie zvuku nie je žiadnou novinkou. Neviem si ani len predstaviť, že by sme svoje obľúbené skladby počuli iba tri-štyrikrát za život. No aj keď sa zaznamenávaním zvuku všetko zjednodušilo a umelec už nemusí poslucháčovi hrať naživo priamo ”do uší”, stále s ním ostáva v kontakte. Veď iba pred pár rokmi sme sledovali drážky v platniach, vďaka ktorým sme dokázali určiť, kedy jedna skladba končí a ďalšia začína. Taktiež si väčšina z nás určite spomína na rozmotávanie magnetofónovej pásky perom. Okrem týchto chvíľ je tu však prítomný ešte jeden dôležitý aspekt. Samotná vlna pripravená na reprodukciu, samotný zvuk.

Zvuk bol neskôr reprodukovaný aj prostredníctvom CD. Tie sa pekne ligotali, mali zaujímavé booklety, no hudba uložená na tomto médiu sa už ozaj mohla nazývať duševným vlastníctvom. Povedzme si rovno, aký tvar má XY.wav/mp3? Nie vinyl, kotúč alebo vlnka na filmovej surovine, ale vzorky. Presne tie sú zodpovedné za to, že dnes už nemusíme so sebou nosiť 300 kaziet na obyčajný roadtrip autom, no zároveň sú stále spoľahlivým translatorom v styku mikrofón-počítač-reproduktor. V tomto kontakte je tiež badateľný fakt, že na začiatku i na konci máme opäť iba vlnu. Bolo by fajn, keby v rámci takejto komunikácie existoval aj medzistupeň kompatibilný s touto formou spracovania pôvodne akustickej informácie, lenže nie je. Vyberať si môžeme iba z dvoch možností: 1 alebo 0, áno alebo nie. Tento nedostatok je preto potrebné akosi obísť.

Určite ste už mali príležitosť zahliadnuť niečo ako 44.100Hz/16bit, prípadne 48000Hz/24bit. Tieto čísla, resp. aspoň to, čo reprezentujú, majú svoje korene v dvadsiatych rokoch minulého storočia, konkrétne v roku 1928, kedy americký génius z oblasti elektrotechniky, Harry Niquist, priniesol do povedomia vedeckých kruhov teóriu o vzorkovacej frekvencii, ktorá sa stala základom pre dnešný analog/digital-digital/analog prevod. Znie nasledovne:

„Rekonštrukcia spojitého, frekvenčne obmedzeného signálu z jeho vzoriek je možná vtedy, ak je vzorkovacia frekvencia minimálne dvojnásobne vyššia než je najvyššia frekvencia pôvodného signálu.”

 

A ozaj, spojitý signál máme v podobe známej vlnky, ktorá môže mať pôvod v hudobnom nástroji, ľudskom hlase, ba i v šume listov a vetra. Frekvenčne obmedzeného? Samozrejme. DNA nás totiž predurčuje na počutie od 20Hz po cca 20000Hz, na vyšších frekvenciách ako polovica vzorkovacej frekvencie by nastalo skreslenie, ktoré nazývame aliasing. Termín rekonštrukcia presne vystihuje to, čo sa deje prostredníctvom ďalších vzoriek.

(Spojitá vlna o frekvencii 440Hz)

 

Vlnu nazývame spojitou z dôvodu, že má svoj plynulý priebeh od začiatku až po koniec. Predstavte si, že nastúpite do výťahu na prízemí a chcete vystúpiť na najvyššom poschodí. Postupujete teda z minima na maximum, no medzi týmito dvoma koncovými bodmi vašej cesty sa neustále nachádzate na inom mieste. Ďalší deň je však výťah pokazený a vám neostáva nič iné, iba ísť po schodoch. Znova idete z prízemia na najvyššie poschodie, vaša cesta je už ale lemovaná presne danými polohami jednotlivých schodov, ktoré budú na rovnakom mieste aj v budúcnosti. Je možné presne určiť, na ktorom schode sa nachádzate, tým pádom sa údaj o polohe stáva zapisovateľným a matematicky definovateľným. A počítače majú matematiku v obľube. Tiež požadujú presnú logiku údajov, ktoré majú spracovať a “upratať” do finálneho súboru podľa presných algoritmov.

Týmto sme vyriešili otázku miesta, ostáva nám ešte posledná, a to otázka času. Každý si určite spomína na rána z detstva, kedy sa doma nestíhalo, ale mama naliehala, že je už pol ôsmej, pritom bolo iba 7:18. Nebola to chyba vo vnímaní času, iba malé rozlíšenie zaokrúhľovacích bodov, pretože mama v tú chvíľu čas zaokrúhlila na polhodiny.


Ak by čas zaokrúhlila na dvadsať minút, prípadne na štvrťhodiny, výsledok by bol v oboch prípadoch iný, no oveľa presnejší. Ide o princíp, ktorý porovnáva dve možnosti a vyberie si tú, ktorá je najbližšia. Presne tento princíp využíva aj A/D prevodník v 8, 16 alebo 24 bitovej hĺbke. Ani na tejto vertikálnej rovine grafu našej vlny však nemožno pracovať s nekonečným množstvom bodov. Aj keď už bude výťah opravený, nepovieme, že sme na 1703,28. centimetri od prízemia. Približný údaj typu: “Akurát som na treťom poschodí.”, nám dodá dostatočnú predstavu o našej polohe, a ak by sme ešte chceli údaj spresniť, môžeme zahrnúť aj medziposchodia, čím sa počet možných polôh zdvojnásobí.

(Navzorkovaný signál v rozlížení 44 100Hz/16bit)

 

Priblížme si konkrétnu situáciu. Počítač zoberie vzorku a následne sa opýta, či je v danej chvíli vlna v pluse (1) alebo v mínuse (0). Ak v pluse, je to prvý bit. Potom sa opýta, či je v hornej alebo v dolnej polovici plusu, čo predstavuje druhý bit, a tak postupne pokračuje ďalej, až po číslo reprezentované našou bitovou hĺbkou. Toto číslo sa môže zdať oproti vzorkovacej frekvencii malé, no pamätajte, že ide o exponent čísla 2 počtu počiatočných dvoch možností áno alebo nie. V prípade CD, ktoré má štandardizované parametre 44.100Hz/16bit, môžeme teda povedať, že za jednu vzorku môže nastať 2 na 16-tu možností, kde sa vlna v konkrétnom momente môže nachádzať, čiže 65 536. Ak počet vzoriek vynásobíme číslom 16, dostaneme počet bitov uložených na disku vo formáte .wav za sekundu, čo je 705600bitov = 88200bajtov = 88,2 kilobajtu pre jednu mono stopu. Samozrejme, vyššie hodnoty parametrov vzorkovania znamenajú väčšiu presnosť vzoriek, ale aj omnoho vyššiu náročnosť na kapacitu úložiska.

Odkiaľ sa ale tieto hodnoty a konkrétne číselné údaje nabrali? A prečo existujú aj 192 000 Hz vzorkovacie frekvencie, keď sú naše uši schopné zachytiť len 20 000 Hz? 44 100 Hz sa stalo štandardom pre CD z dôvodu, že je to dvojnásobok prenášaných frekvencií aj s dvojtisícovým priestorom na doznenie nadbytočných frekvencií, ktoré sú postupne utlmované takzvaným anti-aliasing filtrom, aby sa neozvali frekvencie prevyšujúce túto hodnotu. Kapacitne je to tak akurát na zaznamenávanie na médium, na ktorom sa v dobách, kedy CD ešte len vznikalo, dodávali finálne nahrávky do lisovní. Prekvapivo to boli videokazety VHS. V profesionálnej praxi sa stalo módou používanie vyšších vzorkovacích frekvencií a bitových hĺbok, pretože čoraz výkonnejšie systémy mohli benefitovať z toho, že spomínaný anti-aliasing filter nemusel byť strmý na 2000 Hz, ale na 90 000 Hz. Viedlo to k zmenšeniu skreslenia na horných frekvenciách a omnoho presnejším digitálnym záznamom, s ktorými bolo možné narábať ešte precíznejšie.

(Jendotlivé kvantizačné body)

 

Preto, ak budete nabudúce nastavovať svoju zvukovú kartu, domáce kino, prípadne exportovať video, pamätajte, že ak narazíte na extrémne vysoké hodnoty, ktoré sa pri exporte dajú zvoliť, nenechajte sa oklamať. Vyššie technické parametre väčšinou slúžia len zvukovým procesorom, aby vedeli presnejšie signál interne vyhodnocovať. Ak nechceme signál spracovávať, úplne nám postačia nižšie hodnoty, dokonca sa môže stať, že pri vyšších hodnotách by nám content ani nešiel tak ako by mal. To už by nás opäť čakalo len ďalšie premýšľanie nad tým, prečo to nejde. A to si pri užívaní si kvalitnej muziky, dobrého filmu alebo hry nik nepraje.

Matej Volf

ABOUT THE AUTHOR

Matej Volf
V Grand Beats Production som na poste zvukového inžiniera. Najviac ma baví robiť audiovizuálnu tvorbu, ktorú aj na Filmovej a televíznej fakulte VŠMU študujem, no nebránim sa hocijakému mixíku, editíku a MIDI tóniku. Tónikov sa nebojím ani v analógovejšej podobe, keďže mám vychodené dva stupne hry na saxofón a aktívne hrávam na gitare v kapele.

Leave A Comment