Zvukový kodek aac. Jak otevřít soubor .AAC? Chápu výhody tohoto formátu, ale jak mohu překódovat svou hudbu

Zdarma si stáhněte kodek AAC pro Windows 10/8/7 atd., abyste mohli dekódovat/kódovat AAC na PC

Kodeky AAC dostupné ke stažení pro Windows 10/8/7 atd.

Kodek AAC může být softwarová knihovna/projekt nebo sada softwarových nástrojů pro kódování nebo dekódování zvuku AAC. Některé kodeky AAC mohou spravovat kódování i dekódování AAC, zatímco některé jiné dokáží dekódovat pouze AAC za účelem přehrávání nebo konverze. Jaké kodeky AAC si tedy můžeme stáhnout pro Windows 10/8/7 atd.? Zkontrolujte seznam níže.

Kodek Nero AAC
Podporované OS: Windows, Linux
Typ: Kodér/dekodér
Licence: Zdarma
Odkaz ke stažení: https://www.videohelp.com/software/Nero-AAC-Codec

Nero AAC Codec, vyvinutý a distribuovaný společností Nero AG, je all-in-one AAC kodér a dekodér podporující MPEG-4 AAC LC, HE-AAC a HE-AACv2 se vzorkovací frekvencí až 96 kHz a až 6 kanálů (5.1 surround). ). Je velmi chválen, protože může poskytovat vysoce kvalitní výsledky s malou velikostí. Tento kodek AAC vydal svou poslední aktualizaci 18. února 2010 s verzí 1.5.4.0. Ačkoli to již není vývojář, může fungovat bez problémů na Windows 10, 8, 7 a nižších verzích.

Fraunhofer FDK AAC
Podporované OS: Android, Windows, macOS, Linux
Typ: Kodér/dekodér
Licence: Liberální
Odkaz ke stažení: https://github.com/mstorsjo/fdk-aac

Fraunhofer FDK AAC je zpočátku vyvíjen jako zahrnutý kodek AAC pro Android a později se rozšiřuje na další platformy. Podporuje širokou škálu typů audio objektů AAC zahrnujících MPEG-2/4 AAC LC, HE-AAC (AAC LC + SBR), HE-AACv2 (LC + SBR + PS) a AAC-LD/ELD. Zvukové soubory se vzorkovací frekvencí v rozsahu od 8 kHz do 96 kHz a až 8 kanálů (7.1 surround) lze kódovat pomocí její kódovací knihovny. Knihovnu Fraunhofer pro distribuci zdrojového kódu s názvem fdk-aac lze použít i na jiné programy, například HandBrake. >>Další čtení:

FAAC
Podporované OS: Windows, macOS, Linux
Typ: kodér (FAAC)/dekodér (FAAD2)
Licence: Proprietární (FAAC)/Free (GNU General Public License verze 2 nebo novější pro FADD2)
Odkaz ke stažení: http://www.audiocoding.com/downloads.html

Kodek FAAC AAC obsahuje kodér FAAC a dekodér FAAD2. První kodér se používá hlavně ke generování souborů AAC (MPEG-2/4 AAC) z jiných formátů, zatímco pozdější dekodér dokáže dekódovat soubory MPEG-2/4 AAC s podporou typů zvukových objektů LC, Main, LTP, SBR a PS. . Knihovnu (libfaad) obsaženou v dekodéru FAAD2 mohou pro dekódování AAC použít jiné programy, například kodek AAC ACM.

Kromě výše uvedených kodeků, které se specializují na kódování a dekódování zvuku AAC v systému Windows, existuje několik komplexních balíčků/knihoven kodeků, které dosahují stejného účelu.

kodek Podporovaný OS Licence Stažení
Windows, macOS, Linux LGPL 2.1+, GPL 2+ https://www.ffmpeg.org/download.html
ffdshow Windows XP a novější GNU General Public License 2.0 https://sourceforge.net/projects/ffdshow-tryout/
Balíček kodeků K-Lite Windows XP a novější Volný, uvolnit https://www.codecguide.com/download_kl.htm
Balíček kodeků pro přehrávač médií Windows 2003 nebo novější Volný, uvolnit http://www.mediaplayercodecpack.com/

Nejchytřejší AAC Audio Downloader a Extractor – WinX HD Video Converter Deluxe

Rychle stahujte hudbu AAC/MP3 ze SoundCloud, Audiomack a dalších hudebních stránek bez ztráty kvality.
Převádějte místní a online videa (například hudbu z YouTube/Vevo) do AAC nebo jiných zvukových formátů, jako jsou MP3, WMA, FLAC, ALAC, M4R, OGG, DTS atd., s hi-fi zvukem.

Související externí zdroj z Wiki:
Audio kodek – Zařízení nebo počítačový program schopný kódovat nebo dekódovat digitální datový tok audio...

Formát AAC dosud nedosáhl masového rozšíření na zvukových nosičích, v řadě parametrů však předčí všechny dnes existující typy komprese zvuku, a proto si zaslouží naši pozornost.

co to je

Začněme definicí: AAC je proprietární (proprietární) možnost komprese pro zvukový soubor. Zároveň má menší ztrátu kvality při kódování ve srovnání s MP3 při stejném bitrate. Formát AAC je navíc širokopásmový algoritmus kódování zvuku, který používá dva hlavní principy kódování k výraznému snížení množství dat potřebných k přenosu kvalitního digitálního zvuku. Toto řešení je uznáváno jako jedno z nejkvalitnějších implementovaných pomocí technologie ztrátové komprese. Formát podporuje většina moderních zařízení, dokonce i přenosná. Je třeba poznamenat, že vyzváněcí tóny AAC lze zakoupit v iTunes Store a tento obchod nabízí pouze hudbu komprimovanou tímto řešením. Je třeba také říci, že formát AAC byl původně vytvořen jako nástupce MP3, který může poskytnout lepší kvalitu kódování. Řešení bylo publikováno již v roce 1997 jako nová, sedmá část rodiny MPEG-2.

Princip činnosti

Při kódování do tohoto formátu se provádějí následující procesy: ze signálu jsou odstraněny nepostřehnutelné složky, kódovaný audio signál je zbaven redundance. Poté jsou data zpracována v souladu s metodou MDCT podle jejich složitosti. V další fázi jsou přidány kódy pro opravu různých vnitřních chyb. Nakonec je signál přenesen nebo uložen.

Všechny detaily

Zajímavé je, že formát AAC má vzorkovací frekvenci v rozsahu 8-96 kHz, stejně jako počet kanálů v rozsahu 1-48. MP3 používá hybridní sadu filtrů. AAC zase odkazuje na Modified Discrete Cosine Transform se zvětšenou velikostí okna, která dosahuje 2048 bodů.

Proto je AAC mnohem vhodnější pro kódování zvuku, který má komplexní pulzní proud i obdélníkový průběh než MP3. Formát získal schopnost dynamického přepínání v délkách bloků MDCT v rozsahu 2048-256 bodů. V případě krátké nebo jediné změny se použije malé okno 256 bodů, aby se dosáhlo lepšího rozlišení. Toto výchozí nastavení je velké okno o velikosti 2048 bodů, aby se maximalizovala efektivita kódování. AAC má oproti konvenčnímu MP3 řadu výhod. Mezi nimi je třeba poznamenat: implementace velkého počtu zvukových kanálů (až 48), významná účinnost kódování v podmínkách konstantní a proměnné bitové rychlosti, jakož i vzorkovací frekvence v rozmezí od 8 Hz do 96 kHz (pro MP3 to hodnota je od 8 Hz do 48 kHz) a flexibilnější speciální režim nazvaný Joint stereo. Pokud jde o řešení, "AAC +" je kodek, který je zaměřen na práci s nízkým bitratem. Jde o kombinaci SBR a AAC LC, díky které je dosaženo dobrého zvuku již v rozsahu 32-48 kbps.

Vysvětlení:
NOVÝ SOFTWARE = ​​Nový nástroj od vaší poslední návštěvy
NOVÁ VERZE = Nová verze od vaší poslední návštěvy
NOVÁ RECENZE = Nová recenze od vaší poslední návštěvy
NEW VERSION = Nová verze

Nejnovější verze
Číslo verze / Číslo beta verze / Číslo verze aktualizace a kdy byla vydána.

Zadejte a stáhněte
ŽÁDNÉ DALŠÍ AKTUALIZACE?= Software nebyl aktualizován více než 2 roky.
JIŽ SE NEVYVÍJÍ= Software nebyl aktualizován více než 5 let.
NEDÁVNO AKTUALIZOVÁNO = Software byl aktualizován za posledních 31 dní.
Freeware= Stáhněte si bezplatný software.
Freeware zkušební verze= Stáhněte si bezplatný software, ale některé části jsou zkušební/shareware.
svobodný software= Stáhněte si bezplatný software a také otevřený zdrojový kód známý také jako FOSS (Free and Open Source Software).
Zkušební verze bezplatného softwaru= Stáhněte si bezplatný software a také otevřený zdrojový kód, ale některé části jsou zkušební/shareware.
Freeware reklamy= Stáhnout bezplatný software, ale podporovaný reklamou, obvykle s přiloženým panelem nástrojů prohlížeče. Může být deaktivován při instalaci nebo po instalaci.
reklamy na bezplatný software= Zdarma ke stažení software a otevřený zdrojový kód, ale podporovaný reklamou, obvykle s přiloženým panelem nástrojů prohlížeče. Může být deaktivován při instalaci nebo po instalaci.
zkušební verze= Také se nazývá shareware nebo demo. Bezplatná zkušební verze dostupná ke stažení a testování s obvykle časovým limitem nebo omezenými funkcemi.
payware= Není k dispozici žádné demo ani zkušební verze.
přenosná verze= K dispozici je přenosná/samostatná verze. Není nutná žádná instalace.
v1.0.1 = Nejnovější dostupná verze.
Stáhnout beta = Může to být beta, RC (Release Candidate) nebo Alpha / Nightly / Unstable verze softwaru.
Stáhnout 15 MB = Přímý odkaz na stažení softwaru.
Win = verze ke stažení pro Windows. Funguje na 32bitových a 64bitových systémech Windows.
Win64 = Windows 64bitová verze ke stažení. Funguje pouze na 64bitových Windows.
Mac = verze pro Mac ke stažení. Funguje na 32bitovém a 64bitovém MacOS.
Mac64 = Verze stažení pro Mac OS. Funguje pouze na 64bitovém MacOS.
Linux = verze ke stažení pro Linux.
Portable = Přenosná verze. Není nutná žádná instalace.
Ad-Supported = Software je dodáván s reklamou. Buďte opatrní při instalaci softwaru a deaktivujte doplňky, které nechcete!
Navštivte web vývojáře = odkaz na web vývojáře softwaru.
Stáhnout (zrcadlový odkaz) = Zrcadlový odkaz na stažení softwaru. Nemusí obsahovat nejnovější verze.
Stáhnout staré verze = Bezplatné stažení předchozích verzí programu.
Stáhnout 64bitovou verzi = Pokud máte 64bitový operační systém, můžete si stáhnout tuto verzi.
Stáhnout přenosnou verzi = Přenosná/Samostatná verze, což znamená, že není nutná žádná instalace, stačí rozbalit soubory do složky a přímo spustit.
Dostupná přenosná verze = Stáhněte si přenosnou verzi a můžete pouze rozbalit soubory a spustit program bez instalace.
Dostupné staré verze = Stáhněte si staré verze programu.
Historie verzí k dispozici = Kompletní changelog na našem webu.
= K dispozici je verze Windows.
= K dispozici je verze Mac OS.
= K dispozici verze pro Linux.
Naše hostované nástroje jsou viry a malware skenované pomocí několika antivirových programů

2009-09-30T20:52

2009-09-30T20:52

Audiofilský software

První myšlenky na použití psychoakustického maskování ke kompresi zvukových dat pocházejí z roku 1979. Odpovídající audio kodéry se však začaly rozšiřovat až od poloviny 90. let, kdy výpočetní výkon osobních počítačů začal stačit na přehrávání komprimovaného zvuku v reálném čase a standard MPEG-1 Audio Layer 3, známější jako MP3, se objevil. Pro přenos zvuku přes internet se staly nepostradatelné formáty komprimovaného zvuku, které poskytují "prakticky transparentní" kvalitu stereo zvuku (to znamená, že kódovaný signál je pro většinu posluchačů nerozeznatelný od originálu) při přenosových rychlostech nad 128 kbps. Základní principy formátu MP3 naleznete v článcích K. Glasmana (2…8/2005)

Rozvoj metod komprese dat a psychoakustiky postupně vedl k tomu, že se standard MP3 „přiblížil“ implementaci nových myšlenek v kódování zvuku. Výsledkem je, že do roku 1997 Fraunhoferův institut (Fraunhofer IIS), který vytvořil MP3 na počátku 90. let, stejně jako Dolby, AT & T, Sony a Nokia, vyvinul novou metodu komprese zvuku - Advanced Audio Coding (AAC), který byl zahrnut do standardů MPEG-2 a MPEG-4. Hlavní rozdíly oproti standardu MP3 jsou:

  • podpora širší škály formátů (až 48 kanálů) a vzorkovací frekvence zvuku (od 8 kHz do 96 kHz);
  • účinnější a jednodušší banka filtrů: banka hybridních filtrů MP3 byla nahrazena konvenčním MDCT (Modified Discrete Cosine Transform);
  • širší limity kolísání frekvenčně-časového rozlišení v bance filtrů – osmkrát (v MP3 – třikrát) – vedly k lepšímu kódování přechodných jevů (přechodových jevů) a stacionárních částí zvukového signálu;
  • lepší kódování frekvencí nad 16 kHz;
  • flexibilnější režim stereo kódování, který umožňuje nezávisle přepínat do režimu M / S („joint stereo“) v různých frekvenčních pásmech;
  • další vlastnosti standardu zvyšující účinnost komprese: technologie pro generování šumu v časové doméně (TNS), predikce MDCT koeficientů v čase (dlouhodobá predikce), parametrický režim stereo kódování (parametrické stereo), syntéza šumu (percepční šum substituce), technologie pro obnovu vysokých frekvencí (SBR).

Díky těmto vlastnostem je standard AAC schopen dosáhnout flexibilnějšího a efektivnějšího a tím i kvalitnějšího kódování zvuku. V důsledku rozšířeného používání formátu MP3 si standard AAC zatím nezískal popularitu srovnatelnou s MP3. AAC je však hlavním formátem v populárním iTunes Store, iPod, iTunes, iPhone, PlayStation 3, Nintendo Wii a digitální vysílání DAB+/DRM.

Zvažte hlavní rysy AAC podrobněji.

Banka filtrů

Stejně jako ostatní psychoakustické audio kodéry funguje AAC následujícím způsobem. Vstupní signál prochází bankou filtrů - transformací, která převádí signál z časové oblasti do frekvenčně-časové oblasti (podobně jako při vytváření spektrogramu). Paralelně s tím psychoakustický model analyzuje signál a určuje prahové hodnoty pro psychoakustické maskování. Dále se kvantují spektrální koeficienty signálu na výstupu banky filtrů tak, aby spektrum šumu, pokud je to možné (pokud to bitová rychlost umožňuje), bylo pod prahovými hodnotami maskování a nebylo slyšitelné. Kvantované koeficienty jsou bezeztrátově komprimovány do výstupního souboru AAC. Banka filtrů tedy sama signál nekomprimuje, pouze jej převede do podoby vhodnější pro kompresi.

Vlastností každé banky filtrů je její frekvenční rozlišení, tedy počet frekvenčních pásem, do kterých rozděluje spektrum signálu. Většina bank filtrů používaných pro kompresi zvuku má stovky pásem. To znamená, že v důsledku vztahu nejistoty mají takové banky filtrů časové rozlišení v řádu několika desítek milisekund. Když jsou spektrální koeficienty signálu kvantovány, kvantizační chyba zavedená během dekódování signálu se šíří v čase po celé délce okna banky filtrů. V některých případech to vede k nežádoucímu efektu zvanému pre-echo. Projevuje se, když se kvantizační chyba z přechodného děje (prudký výboj energie v signálu) šíří v čase do časového úseku předcházejícího přechodnému jevu a stává se slyšitelným (obr. 1). Ke snížení tohoto efektu se používají banky filtrů s proměnným časově-frekvenčním rozlišením. Například MP3 používá přepínatelné časové rozlišení banky filtrů mezi 26 a 9 ms. Stacionární signály používají okna 26 ms, aby poskytovaly dobré frekvenční rozlišení, zatímco přechodové jevy používají okna 9 ms ke snížení efektu pre-echo (viz obrázek 1).

Algoritmus AAC také používá přepínání velikosti okna MDCT. V tomto případě je rozdíl ve velikosti oken osminásobný: 6 a 48 ms (256 a 2048 vzorků). Díky tomu je algoritmus schopen se přizpůsobit širšímu rozsahu signálů a dosáhnout lepšího stupně komprese.

Technologie TNS - Noise Amplitude Envelope Shaping

Jedním z problémů moderních kodérů psychoakustických zvukových signálů je práce s přechodovými jevy (přechodové jevy ve zvukovém signálu). Pro zajištění transparentního kódování je nutné zajistit, aby kvantizační šum spadal pod maskovací práh, který závisí na čase. V praxi je však tento požadavek obtížné splnit v blízkosti přechodových jevů, protože Kvantizační šum generovaný během kódování je rozložen v čase během dekódování po celé délce MDCT okna. To může vést k významným přebytkům kvantizačního šumu v závislosti na prahových hodnotách časového maskování.

Technologie TNS (temporal noise shaping) ve standardu AAC umožňuje řídit šíření časového kvantovacího šumu v rámci každého okna MDCT. Technologie TNS je založena na podobnosti (časově-frekvenční dualismus) amplitudové obálky signálu a obálky jeho spektra a také na použití lineární predikce (LPC) ve frekvenci při kvantování spektra.

Je dobře známo, že u signálů se spektrem, které je velmi odlišné od bílé (například tóny), použití lineární predikce (LPC) v časové oblasti umožňuje efektivně "vybělit" spektrum a zakódovat takové signály rozkladem převést je na koeficienty predikce a relativně malou chybu predikce amplitudy (zbytkovou). Při dekódování generuje lineární predikční filtr chybové spektrum podle spektra původního signálu.

V kodéru AAC se lineární predikce používá opačným způsobem: k predikci vzorků spektra ve frekvenční oblasti. Rozdíl mezi původními a predikovanými MDCT koeficienty je kvantován podle prahů utajení (v konvenčních kodérech jsou kvantovány původní MDCT koeficienty). Koeficienty lineární predikce jsou také zapsány do výstupního souboru. Při dekódování signálu generuje lineární predikční filtr aplikovaný na rozdílový signál ve frekvenční doméně (včetně kvantizační chyby) amplitudovou obálku původního signálu (a kvantizační chyby) v časové oblasti. Tím se amplitudová obálka kvantizačních chyb přiblíží amplitudové obálce původního signálu (obr. 2).

Technologie TNS snižuje vliv pre-echa a viditelnost kvantizačních chyb u některých pulzních harmonických signálů (řeč, některé dechové a smyčcové nástroje). Na Obr. 2 porovnává chyby kvantizace zavedené do hlasového signálu algoritmy AAC a MP3 se stejnými datovými toky. Spolu s obecným poklesem kvantizační chyby (díky větší účinnosti AAC) je pozorován vznik amplitudové obálky kvantizační chyby v čase podle obálky původního signálu.

Ve standardu AAC lze technologii TNS aplikovat na jednotlivá frekvenční pásma spektra samostatně nebo zcela vypnout.

SBR Technology - Treble Restoration

Spolehlivý přenos širokého frekvenčního rozsahu je důležitým požadavkem pro vysoce kvalitní kódování. Přenos každé další oktávy zvukového rozsahu však zvyšuje požadavky na přenosovou rychlost pro tradiční zvukový kodér jeden a půl až dvakrát. Za účelem snížení bitrate a zároveň zachování vysokých frekvencí v kódovaném materiálu byla vytvořena technologie pro umělou syntézu vysokých frekvencí SBR (spectral band repplication).

Technologie je založena na skutečnosti, že náš sluch analyzuje vysoké frekvence s menší přesností než střední a nízké. Pro vytvoření efektu přítomnosti vysokých frekvencí není nutné průběh matematicky přesně rekonstruovat, ale stačí pouze obnovit některé významné parametry psychoakustického signálu na vysokých frekvencích. Mezi tyto podstatné parametry patří časově-frekvenční rozložení (obálka) energie signálu a stupeň jeho tonality/šumu.

Myšlenka algoritmu je taková. Při kódování se provádí analýza vysokých frekvencí v původním audio signálu a extrahují se jejich parametry: především obálka amplitudy v několika (obvykle osmi) frekvenčních pásmech. Dále se ze záznamu odstraní vysoké frekvence a zakódují se pouze zbývající nízké a střední frekvence. V tomto případě je do výstupního souboru přidán také relativně malý proud informací o parametrech ztracených vysokých frekvencí.

Během přehrávání jsou nejprve dekódovány basové a střední frekvence. Dále (pokud je v přehrávači přítomen) začne fungovat dekodér SBR. Prvním krokem je syntetizovat vysokofrekvenční signál transpozicí (přesněji frekvenčním posunem) dostupných středních frekvencí. Protože je stupeň tonality/šumu spektra na středních a vysokých frekvencích přibližně stejný, výsledkem tohoto kroku je vysokofrekvenční signál s věrohodnou strukturou spektra. Ve druhém kroku používá dekodér SBR dodatečné uložené informace o vysokých frekvencích, aby jim poskytl požadovanou amplitudovou obálku v každém frekvenčním pásmu. Výsledkem je signál, ve kterém jsou vysoké frekvence plně syntetizovány ze středů, přičemž je zachován zvuk původních vysokých frekvencí.

Technologie SBR může být přidána k mnoha existujícím metodám kódování zvuku. Například SBR v kombinaci s MP3 se nazývá MP3 PRO a SBR v kombinaci s AAC se nazývá HE-AAC (vysoká účinnost AAC). V zásadě se SBR používá pro kódování při relativně nízkých přenosových rychlostech: 64 kbps a méně. Technologie umožňuje výrazně rozšířit frekvenční rozsah audio signálu s minimálním zvýšením bitrate (několik kbps).

Parametrická stereo technologie

Přenos stereo signálu obvykle vyžaduje téměř 2krát vyšší bitrate z kodéru než přenos mono signálu. Současně lze stereo kanály kódovat jak nezávisle, tak po M/S konverzi. V druhém případě má S-kanál často nižší přenosovou rychlost než M-kanál. Tento režim kódování se také nazývá společné stereo. Ve standardu AAC lze tento režim zapínat a vypínat kodérem nezávisle pro každé frekvenční pásmo.

Pro efektivnější kódování stereo signálů při velmi nízkých bitratech (16...32 kbit/s) byla vyvinuta technologie parametrického stereo kódování (parametrické stereo). Spočívá v tom, že stereo signál je před kódováním redukován na mono, ale do výstupního souboru je přidán malý stream (2 ... 3 kbit / s), který obsahuje informace o stereo panorama původního stereo souboru. Tento proud obsahuje (ve zkomprimované podobě) jakousi „panorámatu mapu“ pro časově-frekvenční rovinu.

Ve fázi dekódování je na přijímaný mono signál aplikován frekvenčně závislý panning. To lze provést současně s dekódováním aplikací vhodných amplitudových faktorů na původně stejné MDCT koeficienty levého a pravého kanálu.

Parametrická stereo technologie dává dobrý dojem z původního stereo zvuku za cenu pouze malého zvýšení bitrate oproti mono kódování. Neumožňuje však dosáhnout zcela transparentního zvuku, protože nedokáže zohlednit všechny nuance stereo panorama, jako jsou fázové posuny mezi stereo kanály.

Parametrická stereo technologie byla zahrnuta do standardu HE-AAC v2.

Technologie PNS - generování šumu

Pro další zvýšení účinnosti kódování šumových signálů poskytuje standard AAC technologii PNS (perceptual noise substitution) pro syntézu šumu. Je známo, že naše ucho je citlivější na amplitudové spektrum signálu než na fázové spektrum. Proto místo kódování MDCT koeficientů původního signálu v šumových doménách lze přenášet pouze parametry šumu: jeho výkon jako funkci frekvence a času.

Takto funguje technologie PNS. Během kódování jsou identifikovány spektrální oblasti, které jsou šumem, a odpovídající skupiny MDCT koeficientů jsou vyloučeny z procesu kódování. Kmitočtové pásmo je označeno jako šumové a ukládá se pro něj celková energie šumu.

Při dekódování se do frekvenčních pásem označených jako šum dosadí pseudonáhodné koeficienty MDCT s požadovaným celkovým výkonem. Výsledkem je, že ve specifikovaných frekvenčních rozsazích je syntetizován šum, který se zvukově blíží původnímu šumu.

Technologie dlouhodobé predikce - časová predikce

Psychoakustické kódování tónů vyžaduje vyšší lokální poměr signálu k šumu než kódování šumu (např. 20 dB, resp. 6 dB). A to zase vyžaduje zvýšený datový tok. Tónové koeficienty MDCT jsou však předvídatelné v průběhu času. Tato okolnost nám umožňuje využít jejich časovou závislost ke snížení datového toku.

Standard AAC poskytuje režim dlouhodobé predikce, ve kterém jsou koeficienty MDCT dodatečně kódovány v čase pomocí lineární predikce. Termín "dlouhodobá" znamená, že předpověď není prováděna sousedními vzorky, ale vzorky oddělenými nejpravděpodobnější periodou tónu na dané frekvenci.

Kvantování a komprese MDCT koeficientů

Podobně jako standard MP3 využívá AAC nelineární kvantování MDCT koeficientů a jejich kompresi Huffmanovou metodou. Koeficienty MDCT jsou kvantovány po umocnění 0,75, což umožňuje zvýšení kvantizační chyby pro silné signály a její snížení pro slabé signály v každém frekvenčním pásmu. Dochází tak k dodatečnému implicitnímu vytváření spektra šumu.

Po kvantizaci jsou MDCT koeficienty komprimovány pomocí sady pevných Huffmanových tabulek. Ve standardu AAC je těchto tabulek více než v MP3 a je zde více příležitostí pro seskupovací koeficienty. To má za následek další zvýšení komprese.

Kvalita zvuku

Při hodnocení kvality zvuku audio kodérů se obvykle používají subjektivní testy. Posluchačům jsou předkládány fragmenty nahrávek komprimované různými kodéry a čistotu zvuku každého fragmentu hodnotí na stupnici od 1 do 5. Nejlepší kodek je ten, který je schopen dosáhnout vyšší kvality zvuku ve srovnání s konkurencí na daný datový tok.

Docela směrodatným internetovým zdrojem, kde jsou uvedeny výsledky takových testů, je stránka http://www.rjamorim.com/test/ Představuje testy různých kodeků při různých bitratech. Tyto výsledky obecně dobře souhlasí s jinými zdroji. Zde jsou některé výsledky pro kodéry MP3 a AAC, které vám pomohou porovnat jejich kvalitu.

Nejlepší MP3 kodér je bezplatný Lame. U většiny datových toků je však kvalitativně horší než novější standardy komprese. Při vysokých datových tocích (nad 128 kbps) je toto zpoždění malé a kodér Ogg Vorbis je lídrem.

Při 64 kbps je již výhoda AAC znatelná. Ve variantě HE-AAC získá algoritmus skóre 3,68. To zhruba odpovídá Lame s datovým tokem 96 kbps a znamená to, že výhoda AAC oproti MP3 je asi 1,5násobná. Skóre Lame při 128 kbps je 4,29.

Při datovém toku 32 kbps vyhrává kodér Nero AAC výrazně v kvalitě ve srovnání s MP3: skóre 3,23 a 1,72, v tomto pořadí. AAC je však jen nepatrně před formátem MP3PRO, který získal skóre 3,08. To znamená, že technologie SBR výrazně zlepšuje kvalitu při nízkých přenosových rychlostech.

závěry

Díky novým technologiím používaným ve standardu AAC má tento formát znatelnou výhodu oproti MPEG-1 Layer 3 (MP3), což umožňuje dosáhnout lepší kvality zvuku při stejných přenosových rychlostech. Zvláště silný zisk je pozorován v oblasti nízkých datových toků: 96 kbps a méně. To potvrzuje příslib formátu AAC pro digitální vysílání.

Popularita AAC pro distribuci hudby na internetu dnes zůstává ve srovnání s formátem MP3 nízká. Uživatelé nadále preferují lepší přenositelnost MP3 před silnější kompresí AAC. Významná část hudebních archivů na hudebních distribučních stránkách je již nativně ve formátu MP3 a poskytovatelé nemají přístup k nekomprimovaným nahrávkám. To znamená, že překódování takových nahrávek do formátu AAC nemá valný smysl – kvalita se už často ztrácí. Nové kapesní přehrávače a některé internetové obchody však již podporují formát AAC, často s ověřením legálnosti obsahu (což také odrazuje uživatele, kteří se raději neomezují pouze na kopírování hudby).

Ačkoli je formát AAC velmi slibný, není jediným nejkvalitnějším formátem komprese zvuku. Při vysokých datových tocích (nad 128 kbps) je AAC často horší než kodéry Ogg Vorbis a Musepack. Při nejnižších datových tocích (méně než 32 kbps) může být AAC horší než parametrické audio kodéry, včetně specializovaných kodérů pro kompresi řeči. V rozsahu středně nízkých datových toků si však AAC aktuálně zachovává dlaň.

Alexej Lukin
Časopis "Zvukový inženýr" 2008 #1

Inzerát

Formát audio souboru AAC

Soubory AAC byly vyvinuty, aby nahradily soubory MP3. Ztrátová komprese umožňuje získat lepší zvuk při stejných datových tocích. Soubory AAC byly standardizovány ISO/IEC jako součást rodiny souborů MPEG-2 a MPEG-4 (a byly původně součástí skupiny souborů MPEG-2 Part 7). Soubory AAC obsahují více vzorkovacích frekvencí (ve srovnání s MP3) a až 48 kanálů. Výrazně zlepšená efektivita kódování, včetně více sad filtrů. Vylepšená přesnost kódování přechodového signálu. Stejně jako soubory MP3 omezují soubory AAC frekvence, které lidé neslyší. To vám umožní zmenšit velikost souboru. Ve srovnání s MP3 jsou soubory AAC mnohem menší.

Technické informace o souborech AAC

Soubory MPEG-2 část 7 jsou reprezentovány třemi typy souborů: nízkokomplexní AAC-LC, hlavní typ (AAC Main) a soubory s proměnnou vzorkovací frekvencí (AAC-SSR). Soubory AAC umožňují tvarování dočasného šumu, nejednotné vzorkování a přeformátování bitového toku (pro 16 stereo kanálů, 16 mono kanálů, 16 nízkofrekvenčních kanálů a 16 anotačních kanálů v jednom bitovém toku). V roce 1999 byl formát MPEG-2 part 7 začleněn do formátu MPEG-4 Part 3. To umožnilo zavedení typů zvukových objektů a také technologii náhrady konstantního šumu. Formát AAC je v současnosti popsán v normě ISO/IEC 14496-3. Maskování zvuku se používá při ztrátové kompresi k odstranění nežádoucích informací při zachování kvality.

Další informace o formátu AAC

Přípona souboru .aac
Kategorie souboru
Ukázkový soubor (1,2 MiB)
Související programy Windows přehrávač médií
iTunes
KMPlayer
Pravý hráč
Přehrávač médií VideoLAN VLC