44 100 Hz - 44,100 Hz

V digitální audio , 44100  Hz (střídavě reprezentován jako 44,1 kHz ), je společná vzorkovací frekvence . Analogový zvuk se často zaznamenává vzorkováním 44 100krát za sekundu a poté se tyto vzorky používají k rekonstrukci zvukového signálu při jeho přehrávání.

Vzorkovací frekvence zvuku 44,1 kHz je široce používána díky formátu kompaktních disků (CD), který se datuje od jeho použití společností Sony od roku 1979.

Dějiny

Časný digitální zvuk byl zaznamenán na videokazetách U-matic .

Vzorkovací frekvence 44,1 kHz vznikla koncem sedmdesátých let s adaptéry PCM , které zaznamenávaly digitální zvuk na videokazety , zejména Sony PCM-1600 představený v roce 1979 a přenesený v dalších modelech této série. To se poté stalo základem pro kompaktní disk Digital Audio (CD-DA), definovaný ve standardu Red Book v roce 1980. Jeho použití pokračovalo jako alternativa v 90. letech, jako je DVD , a v 2000s, jako je HDMI . Tato vzorkovací frekvence se běžně používá pro MP3 a další formáty zvukových souborů pro spotřebitele, které byly původně vytvořeny z materiálu vytrženého z kompaktních disků.

Původ

Výběr vzorkovací frekvence byl založen především na potřebě reprodukovat slyšitelný frekvenční rozsah 20–20 000 Hz (20 kHz). Nyquist-Shannon vzorkovací teorém říká, že je zapotřebí se vzorkovací frekvencí vyšší než dvojnásobek maximální frekvencí signálu, který má být zaznamenán, což vede k požadované rychlosti alespoň 40 kHz. Přesná vzorkovací frekvence 44,1 kHz byla převzata z adaptérů PCM, což byl nejdostupnější způsob přenosu dat z nahrávacího studia k výrobci CD v době, kdy byla vyvíjena specifikace CD.

Míra byla zvolena na základě debaty mezi výrobci, zejména Sony a Philips , a její implementace společností Sony poskytla de facto standard. Skutečná volba rychlosti byla bodem nějaké debaty s dalšími alternativami, včetně 44,1 / 1,001 ≈ 44,056 kHz (odpovídá rychlosti barevného pole NTSC 60 / 1,001 = 59,94 Hz) nebo přibližně 44 kHz, navržených společností Philips. Sony nakonec zvítězilo jak na vzorkovací frekvenci (44,1 kHz), tak na bitové hloubce (16 bitů na vzorek, spíše než 14 bitů na vzorek). Technické důvody zvolené sazby jsou následující.

Lidský sluch a zpracování signálu

Nyquist-Shannon vzorkovací teorém říká, že vzorkovací frekvence musí být větší než dvojnásobek maximální frekvence chce někdo reprodukovat. Protože rozsah lidského sluchu je zhruba 20 Hz až 20 000 Hz, vzorkovací frekvence musela být větší než 40 kHz.

Kromě toho musí být signály před vzorkováním filtrovány dolní propustí, aby nedocházelo k aliasingu . Zatímco ideální low-pass filtr by dokonale propustil frekvence pod 20 kHz (aniž by je oslabil ) a dokonale by odřízl frekvence nad 20 kHz, takový ideální filtr je teoreticky a prakticky nemožné implementovat, protože je nekauzální , takže v praxi je přechodové pásmo je nutné, pokud jsou frekvence částečně tlumené. Čím širší je toto přechodové pásmo, tím snazší a ekonomičtější je vytvořit filtr proti vyhlazení . Vzorkovací frekvence 44,1 kHz umožňuje přechodové pásmo 2,05 kHz.

Záznam na video zařízení

Brzy digitální zvuk byl zaznamenán na stávající analogové videokazety, protože videorekordéry byly jedinými dostupnými transporty s dostatečnou kapacitou pro uložení smysluplných délek digitálního zvuku. Aby bylo možné opětovné použití s ​​minimální úpravou video zařízení, běžely stejnou rychlostí jako video a používaly většinu stejných obvodů. 44,1 kHz bylo považováno za nejvyšší použitelnou rychlost kompatibilní s videem PAL i NTSC a vyžadovalo kódování ne více než 3 vzorky na linku videa na zvukový kanál.

Vzorkovací frekvence je složena následovně:

Aktivní řádky / pole Pole / sekundu Vzorky / řádek Výsledná vzorkovací frekvence
NTSC 245 60 3 245 × 60 × 3 = 44 100 Hz
KAMARÁD 294 50 3 294 × 50 × 3 = 44 100 Hz

NTSC má 490 aktivních řádků na snímek, z celkového počtu 525 řádků; PAL má 588 aktivních řádků na snímek, z celkového počtu 625 řádků.

Související sazby

44 100 je součinem čtverců prvních čtyř prvočísel ( ), a proto má mnoho užitečných celočíselných faktorů . Zdá se, že je to náhoda, vzorkovací frekvence 44,1 kHz je také přesně 4krát vyšší než frekvence linky starého 441 řádků německého televizního standardu, který měl frekvenci 441 × 50 ÷ 2 = 11 025 Hz (441 řádků na snímek, 50 pole za sekundu, 2 pole na snímek).

Používají se různé násobky 44,1 kHz - nižší frekvence 11,025 kHz a 22,05 kHz se nacházejí v souborech WAV a jsou vhodné pro aplikace s malou šířkou pásma, zatímco vyšší rychlosti 88,2 kHz a 176,4 kHz se používají při masteringu a při DVD-Audio - vyšší rychlosti jsou užitečné jak z obvyklého důvodu poskytnutí dodatečného rozlišení (tedy méně citlivého na zkreslení způsobená editací), tak také pro usnadnění dolní propusti, protože mnohem větší přechodové pásmo (mezi člověkem slyšitelným při 20 kHz a vzorkovací frekvence). Rychlosti 88,2 kHz a 176,4 kHz se primárně používají, když je konečným cílem CD.

Ostatní sazby

Několik dalších vzorkovací frekvence byly také použity v časném digitálním zvuku. Vzorkovací frekvence 50 kHz, používaný společností Soundstream v 70. letech, po prototypu 37 kHz. Na začátku 80. let byla ve vysílání použita vzorkovací frekvence 32 kHz (zejména ve Velké Británii a Japonsku), protože to je dostatečné pro stereofonní vysílání FM , které má šířku pásma 15 kHz. Některé digitální audio byly pro domácí použití poskytovány ve dvou nekompatibilních formátech EIAJ , což odpovídá 525 / 59,94 (vzorkování 44 056 Hz) a 625/50 (vzorkování 44,1 kHz).

Formát Digital Audio Tape (DAT) byl vydán v roce 1987 se vzorkováním 48 kHz. Tato vzorkovací frekvence se stala standardní rychlostí pro profesionální zvuk . Až donedávna byla konverze vzorkovací frekvence mezi 44 100 kHz a 48 000 kHz komplikována vysokým počtem poměrů mezi nimi, protože nejnižší společný jmenovatel 44 100 a 48 000 je 147: 160, ale s moderní technologií je tato konverze provedena rychle a efektivně. Stroje DAT, které dříve používaly, nepodporovaly 44,1 kHz, a tento rozdíl znesnadňoval vytváření přímých digitálních kopií CD s frekvencí 44,1 kHz pomocí zařízení 48 DAT.

Postavení

Kvůli popularitě CD existuje velké množství zařízení 44,1 kHz, stejně jako velké množství zvuku zaznamenaného na 44,1 kHz (nebo jeho násobcích). Některé novější standardy však kromě nebo místo 44,1 kHz používají 48 kHz. Ve videu je nyní standardem 48 kHz, ale pro zvuk zaměřený na CD se stále používá 44,1 kHz (a násobky).

Standard HDMI TV (2003) umožňuje 44,1 kHz i 48 kHz (a jejich násobky). To zajišťuje kompatibilitu s přehrávači DVD, které přehrávají obsah CD, VCD a SVCD . Standardy DVD-Video a Blu-ray Disc používají pouze násobky 48 kHz.

Většina zvukových karet PC obsahuje digitálně-analogový převodník schopný pracovat nativně na 44,1 kHz nebo 48 kHz. Některé starší procesory obsahují pouze výstup 44,1 kHz a některé levnější novější procesory obsahují pouze výstup 48 kHz, což vyžaduje, aby počítač provedl digitální převod vzorkovací frekvence na výstup dalších vzorkovacích frekvencí. Podobně mají karty omezení vzorkovací frekvence, kterou podporují při nahrávání.

Viz také

Poznámky

Reference