Codec audio Aac. Cum se deschide un fișier .AAC? Înțeleg avantajele acestui format, dar cum îmi pot transcoda muzica

Descărcați gratuit AAC Codec pentru Windows 10/8/7 etc, pentru a decoda/coda AAC pe PC

Codecuri AAC disponibile pentru descărcare pentru Windows 10/8/7 etc.

Codecul AAC poate fi o bibliotecă/proiect software sau un set de instrumente software pentru codificarea sau decodarea audio AAC. Unele codecuri AAC pot gestiona atât codarea, cât și decodarea AAC, în timp ce altele pot decoda AAC doar în scopul redării sau conversiei. Deci, ce codecuri AAC putem descărca pentru Windows 10/8/7 etc? Verificați lista de mai jos.

Nero AAC Codec
Sistem de operare acceptat: Windows, Linux
Tip: Encoder/Decoder
Licență: gratuită
Link de descărcare: https://www.videohelp.com/software/Nero-AAC-Codec

Nero AAC Codec, dezvoltat și distribuit de Nero AG, este un codificator și decodor AAC all-in-one care acceptă MPEG-4 AAC LC, HE-AAC și HE-AACv2 cu frecvență de eșantionare de până la 96 kHz și până la 6 canale (surround 5.1). ). Este foarte lăudat pentru că poate produce rezultate de înaltă calitate cu dimensiuni mici. Acest codec AAC și-a dat ultima actualizare pe 18 februarie 2010 cu versiunea 1.5.4.0. Deși nu mai este un dezvoltator, poate rula bine pe Windows 10, 8, 7 și versiuni inferioare.

Fraunhofer FDK AAC
Sistem de operare acceptat: Android, Windows, macOS, Linux
Tip: Encoder/Decoder
Licență: liberală
Link de descărcare: https://github.com/mstorsjo/fdk-aac

Fraunhofer FDK AAC este dezvoltat inițial ca un codec AAC inclus pentru Android și se extinde ulterior la alte platforme. Acceptă o gamă largă de tipuri de obiecte audio AAC, incluzând MPEG-2/4 AAC LC, HE-AAC (AAC LC + SBR), HE-AACv2 (LC + SBR + PS) și AAC-LD/ELD. Fișierele audio cu frecvență de eșantionare care variază de la 8 kHz la 96 kHz și până la 8 canale (7.1 surround) pot fi codificate folosind biblioteca sa de codare. Biblioteca Fraunhofer de distribuție a codului sursă numită fdk-aac poate fi aplicată altor programe, de exemplu HandBrake. >>Lectură suplimentară:

FAAC
Sistem de operare acceptat: Windows, macOS, Linux
Tip: Encoder (FAAC)/Decoder (FAAD2)
Licență: Proprietar (FAAC)/gratuit (GNU General Public License versiunea 2 sau ulterioară pentru FADD2)
Link de descărcare: http://www.audiocoding.com/downloads.html

Codecul FAAC AAC include encoder FAAC și decodor FAAD2. Primul codificator este folosit în principal pentru a genera fișiere AAC (MPEG-2/4 AAC) din alte formate, în timp ce decodorul ulterioară poate decoda fișiere MPEG-2/4 AAC cu suport pentru tipurile de obiecte audio LC, Main, LTP, SBR și PS . Biblioteca (libfaad) inclusă în decodorul FAAD2 poate fi utilizată de alte programe pentru decodarea AAC, de exemplu AAC ACM Codec.

Pe lângă codecurile de mai sus care sunt specializate în codificarea și decodificarea audio AAC pe Windows, există mai multe pachete/biblioteci de codecuri cuprinzătoare care ating același scop.

codec Sistem de operare acceptat Licență Descarca
Windows, macOS, Linux LGPL 2.1+, GPL 2+ https://www.ffmpeg.org/download.html
ffdshow Windows XP și mai târziu GNU General Public License 2.0 https://sourceforge.net/projects/ffdshow-tryout/
Pachetul de codec K-Lite Windows XP și mai târziu Gratuit https://www.codecguide.com/download_kl.htm
Media Player Codec Pack Windows 2003 sau o versiune ulterioară Gratuit http://www.mediaplayercodecpack.com/

Cel mai inteligent descărcator și extractor audio AAC – WinX HD Video Converter Deluxe

Descărcați rapid muzică AAC/MP3 de pe SoundCloud, Audiomack și alte site-uri de muzică fără a pierde calitatea.
Convertiți videoclipuri locale și online (de exemplu, muzică YouTube/Vevo) în AAC sau în alte formate audio precum MP3, WMA, FLAC, ALAC, M4R, OGG, DTS etc, cu sunet hi-fi.

Sursă externă similară din Wiki:
Codec audio - Un dispozitiv sau un program de calculator capabil să codifice sau să decodeze un flux de date digitale de audio...

Până în prezent, formatul AAC nu a ajuns încă la distribuția în masă pe mediile audio, cu toate acestea, într-o serie de parametri, depășește toate tipurile de compresie audio care există astăzi, ceea ce înseamnă că merită atenția noastră.

Ce este?

Să începem cu o definiție: AAC este o opțiune de comprimare proprietară (proprietă) pentru un fișier audio. În același timp, are mai puțină pierdere de calitate în timpul codificării în comparație cu MP3 la același bitrate. În plus, formatul AAC este un algoritm de codare audio în bandă largă care utilizează două principii principale de codare pentru a reduce considerabil cantitatea de date necesară pentru a transmite audio digital de calitate. Această soluție este recunoscută ca fiind una dintre cele mai de înaltă calitate implementate folosind tehnologia de compresie cu pierderi. Formatul este suportat de majoritatea echipamentelor moderne, chiar și de cele portabile. De menționat că tonurile de apel AAC pot fi achiziționate din iTunes Store, iar acest magazin oferă doar muzică comprimată cu această soluție. De asemenea, trebuie spus că formatul AAC a fost creat inițial ca un succesor al MP3, care poate oferi o calitate îmbunătățită a codificării. Soluția a fost publicată în 1997 ca parte nouă, a șaptea, a familiei MPEG-2.

Principiul de funcționare

La codificarea în acest format, sunt efectuate următoarele procese: componentele imperceptibile sunt îndepărtate din semnal, semnalul audio codificat este eliminat de redundanță. După aceea, datele sunt prelucrate în conformitate cu metoda MDCT în funcție de complexitatea lor. În etapa următoare, se adaugă coduri pentru a corecta diverse erori interne. În cele din urmă, semnalul este transmis sau stocat.

Toate detaliile

Interesant este că formatul AAC are o rată de eșantionare în intervalul 8-96 kHz, precum și numărul de canale în intervalul 1-48. MP3 folosește un set hibrid de filtre. La rândul său, AAC se referă la Transformarea Cosinus discretă modificată cu o dimensiune crescută a ferestrei, care ajunge la 2048 de puncte.

Astfel, AAC este mult mai potrivit pentru codificarea audio care are flux de impulsuri complexe, precum și unde pătrate, în comparație cu MP3. Formatul a câștigat capacitatea de comutare dinamică în lungimi de bloc MDCT în intervalul 2048-256 de puncte. În cazul în care există o modificare scurtă sau unică, se aplică o fereastră mică de 256 de puncte pentru a obține o rezoluție mai bună. Aceasta este implicită la o fereastră mare de 2048 de puncte pentru a maximiza eficiența codificării. AAC are o serie de avantaje față de MP3 convențional. Printre acestea, trebuie remarcate: implementarea unui număr mare de canale audio (până la 48), eficiență semnificativă de codare în condiții de debit constant și variabil, precum și rate de eșantionare cuprinse între 8 Hz și 96 kHz (pentru MP3 aceasta cifra este de la 8 Hz la 48 kHz) și un mod special mai flexibil numit Joint stereo. În ceea ce privește soluția, „AAC +” este un codec care se concentrează pe lucrul cu un bitrate scăzut. Este o combinație de SBR și AAC LC, datorită căreia se obține deja un sunet bun în intervalul de 32-48 kbps.

Explicaţie:
SOFTWARE NOU = Instrument nou de la ultima vizită
VERSIUNE NOUĂ = Versiune nouă de la ultima vizită
NEW REVIEW = O recenzie nouă de la ultima vizită
NEW VERSION = Versiune nouă

Ultima versiune
Numărul versiunii/Numărul versiunii beta/Actualizați numărul versiunii și când a fost lansat.

Tastați și descărcați
NU MAI ACTUALIZĂRI?= Software-ul nu a fost actualizat de peste 2 ani.
NU MAI DEZVOLTAT= Software-ul nu a fost actualizat de peste 5 ani.
RECENT UPDATED = Software-ul a fost actualizat în ultimele 31 de zile.
Freeware= Descărcați software gratuit.
Program de încercare gratuit= Descărcați software gratuit, dar unele părți sunt de probă/shareware.
software gratuit= Descărcați software gratuit și, de asemenea, cod sursă deschis cunoscut și sub numele de FOSS (Software gratuit și cu sursă deschisă).
Software de încercare gratuit= Descărcați software gratuit și, de asemenea, cod sursă deschis, dar unele părți sunt de probă/shareware.
Reclame gratuite= Descărcați software gratuit, dar acceptat de publicitate, de obicei cu o bară de instrumente inclusă a browserului. Poate fi dezactivat la instalare sau după instalare.
reclame pentru software gratuit= Descărcare gratuită de software și cod sursă deschis, dar acceptate de publicitate, de obicei cu o bară de instrumente inclusă a browserului. Poate fi dezactivat la instalare sau după instalare.
software de încercare= Denumit și shareware sau demo. Versiune de încercare gratuită disponibilă pentru descărcare și testare, de obicei cu o limită de timp sau cu funcții limitate.
payware= Nu este disponibilă nicio demonstrație sau versiune de încercare.
versiune portabilă= Este disponibilă o versiune portabilă/autonomă. Nu este necesară nicio instalare.
v1.0.1 = Cea mai recentă versiune disponibilă.
Descărcați beta = Ar putea fi o versiune Beta, RC (Release Candidate) sau o versiune Alpha / Nightly / Unstable a software-ului.
Descărcare 15 MB = Un link direct către descărcarea software-ului.
Win = versiunea de descărcare a Windows. Funcționează pe Windows pe 32 și 64 de biți.
Win64 = versiunea de descărcare a Windows pe 64 de biți. Funcționează numai pe Windows pe 64 de biți.
Mac = versiunea de descărcare pentru Mac. Funcționează pe MacOS pe 32 și 64 de biți.
Mac64 = versiunea de descărcare a Mac OS. Funcționează numai pe MacOS pe 64 de biți.
Linux = versiunea de descărcare Linux.
Portable = versiune portabilă. Nu este necesară nicio instalare.
Ad-Supported = Software-ul este inclus cu publicitate. Fiți atenți când instalați software-ul și dezactivați suplimentele pe care nu le doriți!
Vizitați site-ul dezvoltatorilor = Un link către site-ul dezvoltatorului de software.
Descărcare (link în oglindă) = O legătură în oglindă către descărcarea software-ului. Este posibil să nu conțină cele mai recente versiuni.
Descărcare versiuni vechi = Descărcări gratuite ale versiunilor anterioare ale programului.
Descărcați versiunea pe 64 de biți = Dacă aveți un sistem de operare pe 64 de biți, puteți descărca această versiune.
Descărcați versiunea portabilă = versiunea portabilă/autonomă, ceea ce înseamnă că nu este necesară nicio instalare, doar extrageți fișierele într-un folder și rulați direct.
Versiunea portabilă disponibilă = Descărcați versiunea portabilă și puteți doar să extrageți fișierele și să rulați programul fără instalare.
Versiuni vechi disponibile = Descărcați versiuni vechi ale programului.
Istoricul versiunilor disponibil = Jurnal complet de modificări pe site-ul nostru.
= Versiune Windows disponibilă.
= Versiunea Mac OS disponibilă.
= Versiunea Linux disponibilă.
Instrumentele noastre găzduite sunt viruși și programe malware scanate cu mai multe programe antivirus

2009-09-30T20:52

2009-09-30T20:52

Software pentru audiofili

Primele idei despre utilizarea mascării psihoacustice pentru a comprima datele audio datează din 1979. Cu toate acestea, codificatoarele audio corespunzătoare au început să se răspândească abia de la mijlocul anilor 90, când puterea de calcul a computerelor personale a început să fie suficientă pentru a reda audio comprimat în timp real și standardul MPEG-1 Audio Layer 3, mai bine cunoscut sub numele de MP3, a apărut. Formatele audio comprimate au devenit indispensabile pentru transmiterea audio pe Internet, oferind o calitate stereo „practic transparentă” (adică semnalul codificat nu se poate distinge de original pentru majoritatea ascultătorilor) la rate de biți de peste 128 kbps. Principiile de bază ale formatului MP3 pot fi găsite în articolele lui K. Glasman (2…8/2005)

Dezvoltarea metodelor de compresie a datelor și a psihoacusticii a condus treptat la faptul că standardul MP3 a devenit „apropiat” de implementarea de noi idei în codarea audio. Drept urmare, până în 1997, Institutul Fraunhofer (Fraunhofer IIS), care a creat MP3 la începutul anilor 90, precum și Dolby, AT & T, Sony și Nokia, au dezvoltat o nouă metodă de compresie audio - Advanced Audio Coding (AAC), care a fost inclus în standardele MPEG-2 și MPEG-4. Principalele diferențe față de standardul MP3 sunt:

  • suport pentru o gamă mai largă de formate (până la 48 de canale) și rate de eșantionare audio (de la 8 kHz la 96 kHz);
  • banc de filtre mai eficient și mai simplu: bancul de filtre hibrid MP3 a fost înlocuit cu MDCT convențional (Modified Discrete Cosine Transform);
  • limite mai largi de variație a rezoluției frecvență-timp în bancul de filtre - de opt ori (în MP3 - de trei ori) - au condus la o codificare îmbunătățită a tranzitorilor (tranzitorii) și a secțiunilor staționare ale semnalului audio;
  • o mai bună codificare a frecvențelor peste 16 kHz;
  • un mod de codare stereo mai flexibil, care vă permite să comutați la modul M / S („joint stereo”) independent în diferite benzi de frecvență;
  • caracteristici suplimentare ale standardului care măresc eficiența compresiei: tehnologie pentru generarea de zgomot în domeniul temporal (TNS), predicția în timp a coeficienților MDCT (predicție pe termen lung), modul de codare stereo parametrică (stereo parametric), sinteza zgomotului (zgomot perceptiv). substituție), tehnologie de recuperare a frecvențelor înalte (SBR).

Datorită acestor caracteristici, standardul AAC este capabil să realizeze o codificare audio mai flexibilă și mai eficientă și, astfel, o calitate mai bună. Ca urmare a utilizării pe scară largă a formatului MP3, standardul AAC nu a dobândit încă o popularitate comparabilă cu MP3. Cu toate acestea, AAC este formatul principal în popularul iTunes Store, iPod, iTunes, iPhone, PlayStation 3, Nintendo Wii și transmisia digitală DAB+/DRM.

Luați în considerare principalele caracteristici ale AAC mai detaliat.

Banca de filtre

Ca și alte codificatoare audio psihoacustice, AAC funcționează în felul următor. Semnalul de intrare este trecut printr-un banc de filtre - o transformare care convertește semnalul din domeniul timp în domeniul frecvență-timp (similar cu construirea unei spectrograme). În paralel cu aceasta, modelul psihoacustic analizează semnalul și determină pragurile pentru mascarea psihoacustică. În continuare, coeficienții spectrale ai semnalului la ieșirea bancului de filtre sunt cuantificați astfel încât spectrul de zgomot, dacă este posibil (dacă rata de biți permite), să fie sub pragurile de mascare și să nu fie audibil. Coeficienții cuantificați sunt comprimați fără pierderi într-un fișier de ieșire AAC. Astfel, banca de filtre în sine nu comprimă semnalul, ci doar îl transformă într-o formă mai potrivită pentru compresie.

O caracteristică a fiecărui banc de filtre este rezoluția de frecvență, adică numărul de benzi de frecvență în care împarte spectrul semnalului. Majoritatea bancilor de filtre utilizate pentru compresia audio au sute de benzi. Aceasta înseamnă că, datorită relației de incertitudine, astfel de bănci de filtre au o rezoluție în timp de ordinul a câteva zeci de milisecunde. Atunci când coeficienții spectrali ai unui semnal sunt cuantificați, eroarea de cuantizare introdusă în timpul decodării semnalului este răspândită în timp pe întreaga lungime a ferestrei filterbank. În unele cazuri, acest lucru duce la un efect nedorit numit pre-eco. Se manifestă atunci când eroarea de cuantizare de la tranzitoriu (o explozie bruscă de energie în semnal) se propagă în timp la segmentul de timp care precede tranzitoriul și devine audibilă (Fig. 1). Pentru a reduce acest efect, se folosesc bancuri de filtre cu rezoluție timp-frecvență variabilă. De exemplu, MP3 folosește o rezoluție de timp comutabilă între 26 și 9 ms. Semnalele staționare folosesc ferestre de 26 ms pentru a oferi o rezoluție bună de frecvență, în timp ce tranzitorii folosesc ferestre de 9 ms pentru a reduce efectul pre-ecou (vezi Figura 1).

Algoritmul AAC utilizează, de asemenea, comutarea dimensiunii ferestrei MDCT. În acest caz, diferența de dimensiune a ferestrelor este de opt ori: 6 și 48 ms (256 și 2048 mostre). Datorită acestui fapt, algoritmul este capabil să se adapteze la o gamă mai largă de semnale și să atingă un grad mai bun de compresie.

Tehnologia TNS - Modelarea plicului cu amplitudinea zgomotului

Una dintre problemele codificatoarelor moderne de semnal audio psihoacustic este lucrul cu tranzitorii (tranzitorii într-un semnal audio). Pentru a asigura o codificare transparentă, este necesar să se asigure că zgomotul de cuantizare se încadrează sub pragul de mascare, care depinde de timp. Cu toate acestea, în practică, această cerință este dificil de satisfăcut aproape de tranzitorii, deoarece Zgomotul de cuantizare generat în timpul codificării este răspândit în timp în timpul decodării pe toată lungimea ferestrei MDCT. Acest lucru poate duce la excese semnificative de zgomot de cuantizare în timp pragurilor de mascare.

Tehnologia TNS (temporal noise shaping) din standardul AAC vă permite să controlați propagarea zgomotului de cuantificare a timpului în fiecare fereastră MDCT. Tehnologia TNS se bazează pe asemănarea (dualismul timp-frecvență) a anvelopei de amplitudine a semnalului și a anvelopei spectrului acestuia, precum și pe utilizarea predicției liniare (LPC) în frecvență la cuantificarea spectrului.

Este bine cunoscut faptul că pentru semnalele cu un spectru care este foarte diferit de alb (de exemplu, tonuri), utilizarea predicției liniare (LPC) în domeniul timp vă permite să „albiți” eficient spectrul și să codificați astfel de semnale prin descompunere. acestea în coeficienți de predicție și o eroare de predicție de amplitudine relativ mică (reziduală). La decodificare, filtrul de predicție liniară generează un spectru de eroare în conformitate cu spectrul semnalului original.

În codificatorul AAC, predicția liniară este utilizată în sens invers: pentru a prezice eșantioane de spectru în domeniul frecvenței. Diferența dintre coeficienții MDCT inițiali și cei preziși este cuantificată în funcție de pragurile de ascundere (în codificatoarele convenționale, coeficienții MDCT originali sunt cuantificați). Coeficienții de predicție liniară sunt, de asemenea, scrieți în fișierul de ieșire. La decodificarea unui semnal, un filtru de predicție liniar aplicat unui semnal de diferență în domeniul frecvenței (inclusiv eroarea de cuantizare) generează o anvelopă de amplitudine a semnalului original (și eroarea de cuantizare) în domeniul timp. Astfel, anvelopa de amplitudine a erorilor de cuantizare devine apropiată de anvelopa de amplitudine a semnalului original (Fig. 2).

Tehnologia TNS reduce efectul pre-ecoului și vizibilitatea erorilor de cuantizare asupra unor semnale armonice pulsate (vorbire, unele instrumente de vânt și cu coarde arcuite). Pe fig. 2 compară erorile de cuantizare introduse în semnalul vocal de către algoritmii AAC și MP3 cu aceleași rate de biți. Împreună cu o scădere generală a erorii de cuantizare (datorită eficienței mai mari a AAC), se observă formarea în timp a anvelopei de amplitudine a erorii de cuantizare în funcție de anvelopa semnalului original.

În standardul AAC, tehnologia TNS poate fi aplicată la benzile de frecvență individuale ale spectrului independent sau poate fi oprită complet.

Tehnologia SBR - Restaurare Treble

Transmisia fiabilă a unei game largi de frecvențe este o cerință importantă pentru o codificare de înaltă calitate. Cu toate acestea, transmisia fiecărei octave următoare a intervalului audio crește cerințele de bitrate pentru un codificator audio tradițional de o dată și jumătate până la două ori. Pentru a reduce rata de biți și în același timp a păstra frecvențele înalte în materialul codificat, a fost creată o tehnologie de sinteză artificială a frecvențelor înalte SBR (spectral band replication).

Tehnologia se bazează pe faptul că auzul nostru analizează frecvențele înalte cu mai puțină acuratețe decât cele medii și joase. Pentru a crea efectul prezenței frecvențelor înalte, nu este necesar să reconstruiți matematic exact forma de undă, ci este suficient doar să restabiliți unii parametri semnificativi ai semnalului psihoacustic la frecvențe înalte. Acești parametri esențiali includ distribuția frecvență-timp (anvelopă) a energiei semnalului și gradul de tonalitate/zgomot al acesteia.

Ideea algoritmului este aceasta. La codificare, se efectuează analiza frecvențelor înalte din semnalul audio original și se extrag parametrii acestora: în primul rând, anvelopa de amplitudine în mai multe benzi de frecvență (de obicei opt). În plus, frecvențele înalte sunt eliminate din înregistrare și doar frecvențele joase și medii rămase sunt codificate. În acest caz, la fișierul de ieșire este adăugat și un flux relativ mic de informații despre parametrii frecvențelor înalte pierdute.

În timpul redării, frecvențele joase și medii sunt mai întâi decodificate. În plus (dacă este prezent în player), decodorul SBR începe să funcționeze. Primul pas este sintetizarea unui semnal de înaltă frecvență prin transpunerea (mai precis, o schimbare de frecvență) a frecvențelor medii disponibile. Deoarece gradul de tonalitate/zgomot al spectrului la frecvențe medii și înalte este aproximativ egal, în urma acestei etape se obține un semnal de înaltă frecvență cu o structură de spectru plauzibilă. În al doilea pas, decodorul SBR utilizează informațiile suplimentare stocate despre frecvențele înalte pentru a le oferi anvelopa de amplitudine dorită în fiecare bandă de frecvență. Rezultatul este un semnal în care frecvențele înalte sunt pe deplin sintetizate din medii, păstrând în același timp sunetul frecvențelor înalte originale.

Tehnologia SBR poate fi adăugată multor metode de codare audio existente. De exemplu, SBR combinat cu MP3 se numește MP3 PRO, iar SBR combinat cu AAC se numește HE-AAC (AAC de înaltă eficiență). Practic, SBR este folosit pentru codificare la rate de biți relativ scăzute: 64 kbps și mai jos. Tehnologia vă permite să extindeți în mod semnificativ gama de frecvență a semnalului audio cu o creștere minimă a ratei de biți (câțiva kbps).

Tehnologie stereo parametrică

Transferul unui semnal stereo necesită de obicei de aproape 2 ori mai mult bitrate de la codificator decât transferul unui semnal mono. În același timp, canalele stereo pot fi codificate atât independent, cât și după conversia M/S. În acest din urmă caz, canalul S consumă adesea mai puțin bitrate decât canalul M. Acest mod de codificare este numit și stereo comun. În standardul AAC, acest mod poate fi activat și dezactivat de către codificator independent pentru fiecare bandă de frecvență.

Pentru o codificare mai eficientă a semnalelor stereo la rate de biți foarte mici (16...32 kbit/s), a fost dezvoltată tehnologia de codare stereo parametrică ( stereo parametric ). Constă în faptul că semnalul stereo este redus la mono înainte de codificare, dar la fișierul de ieșire este adăugat un flux mic (2 ... 3 kbit / s), care conține informații despre panorama stereo a fișierului stereo original. Acest flux conține (în formă comprimată) un fel de „hartă panoramică” pentru planul timp-frecvență.

În etapa de decodare, semnalului mono recepționat se aplică panning dependent de frecvență. Acest lucru se poate face simultan cu decodificarea prin aplicarea unor factori de amplitudine corespunzători coeficienților MDCT inițial egali ai canalelor stânga și dreapta.

Tehnologia stereo parametrică oferă o impresie bună asupra sunetului stereo original cu doar o mică creștere a ratei de biți în comparație cu codarea mono. Cu toate acestea, nu vă permite să obțineți un sunet complet transparent, deoarece nu poate ține cont de toate nuanțele panoramei stereo, cum ar fi schimbările de fază între canalele stereo.

Tehnologia stereo parametrică a fost inclusă în standardul HE-AAC v2.

Tehnologia PNS - generare de zgomot

Pentru a crește și mai mult eficiența codării semnalelor de zgomot, standardul AAC prevede tehnologia PNS (substituție perceptivă a zgomotului) pentru sinteza zgomotului. Se știe că urechea noastră este mai sensibilă la spectrul de amplitudine al semnalului decât la spectrul de fază. Prin urmare, în loc de a codifica coeficienții MDCT ai semnalului original în domeniile de zgomot, se pot transmite doar parametri de zgomot: puterea acestuia în funcție de frecvență și timp.

Acesta este modul în care funcționează tehnologia PNS. În timpul codificării, regiunile spectrale care sunt zgomote sunt identificate, iar grupurile corespunzătoare de coeficienți MDCT sunt excluse din procesul de codare. Banda de frecvență este marcată ca zgomotoasă și energia totală a zgomotului este stocată pentru aceasta.

În timpul decodării, coeficienții MDCT pseudo-aleatori cu puterea totală necesară sunt înlocuiți în benzile de frecvență marcate ca zgomot. Ca rezultat, în intervalele de frecvență specificate, se sintetizează zgomot care este apropiat ca sunet de zgomotul original.

Tehnologia de predicție pe termen lung - predicție de timp

Codificarea tonurilor psihoacustice necesită un raport local semnal-zgomot mai mare decât codarea zgomotului (de exemplu, 20 dB și, respectiv, 6 dB). Și acest lucru, la rândul său, necesită o rată de biți crescută. Cu toate acestea, coeficienții de ton MDCT sunt predictibili în timp. Această circumstanță ne permite să exploatăm dependența lor de timp pentru a reduce rata de biți.

Standardul AAC oferă un mod de predicție pe termen lung în care coeficienții MDCT sunt codați suplimentar în timp folosind predicția liniară. Termenul „pe termen lung” înseamnă că predicția este efectuată nu de eșantioane învecinate, ci de eșantioane separate de cea mai probabilă perioadă de ton la o anumită frecvență.

Cuantificarea și compresia coeficienților MDCT

Similar cu standardul MP3, AAC utilizează cuantificarea neliniară a coeficienților MDCT și comprimarea acestora prin metoda Huffman. Coeficienții MDCT sunt cuantificați după exponențiarea de 0,75, ceea ce permite creșterea erorii de cuantizare pentru semnale puternice și scăderea acesteia pentru semnale slabe din fiecare bandă de frecvență. Astfel, se realizează o formare implicită suplimentară a spectrului de zgomot.

După cuantizare, coeficienții MDCT sunt comprimați folosind un set de tabele Huffman fixe. În standardul AAC, există mai multe dintre aceste tabele decât în ​​MP3 și există mai multe oportunități de grupare a coeficienților. Aceasta are ca rezultat o creștere suplimentară a compresiei.

Calitatea sunetului

Atunci când se evaluează calitatea sunetului codificatoarelor audio, se folosesc de obicei teste subiective. Ascultătorilor li se prezintă fragmente de înregistrări comprimate de diferiți codificatori și evaluează puritatea sunetului fiecărui fragment pe o scară de la 1 la 5. Cel mai bun codec este cel care este capabil să obțină o calitate mai mare a sunetului în comparație cu concurenții la un nivel superior. rata de biți dată.

O sursă de internet destul de autorizată, unde sunt date rezultatele unor astfel de teste, este site-ul http://www.rjamorim.com/test/ Acesta prezintă teste ale diferitelor codecuri la o varietate de rate de biți. Aceste rezultate sunt în general de acord cu alte surse. Iată câteva rezultate pentru codificatoarele MP3 și AAC pentru a ajuta la compararea calității acestora.

Cel mai bun codificator MP3 este gratuit Lame. Cu toate acestea, la majoritatea ratelor de biți, este inferioară ca calitate față de standardele de compresie mai noi. La rate de biți mari (peste 128 kbps), acest decalaj este mic, iar codificatorul Ogg Vorbis este lider.

La 64 kbps, avantajul AAC este deja vizibil. În varianta HE-AAC, algoritmul obține un scor de 3,68. Acest lucru corespunde aproximativ lui Lame cu o rată de biți de 96 kbps și înseamnă că avantajul AAC față de MP3 este de aproximativ 1,5 ori. Scorul Lame la 128 kbps este 4,29.

La o rată de biți de 32 kbps, codificatorul AAC de la Nero câștigă semnificativ în calitate în comparație cu MP3: scoruri de 3,23 și, respectiv, 1,72. Cu toate acestea, AAC este doar puțin înaintea formatului MP3PRO, care a primit un scor de 3,08. Acest lucru indică faptul că tehnologia SBR îmbunătățește semnificativ calitatea la rate de biți scăzute.

concluzii

Datorită noilor tehnologii utilizate în standardul AAC, acest format are un avantaj vizibil față de MPEG-1 Layer 3 (MP3), permițându-vă să obțineți o calitate mai bună a sunetului la aceleași rate de biți. Un câștig deosebit de puternic se observă în zona ratelor de biți scăzute: 96 kbps și mai jos. Acest lucru confirmă promisiunea formatului AAC pentru difuzarea digitală.

Popularitatea AAC pentru distribuirea muzicii pe Internet rămâne astăzi scăzută în comparație cu formatul MP3. Utilizatorii continuă să prefere portabilitatea mai bună a MP3-ului în detrimentul compresiei AAC mai puternice. O parte semnificativă a arhivelor muzicale de pe site-urile de distribuție a muzicii este deja nativ în format MP3, iar furnizorii nu au acces la înregistrări necomprimate. Aceasta înseamnă că nu are prea mult sens să recodificați astfel de înregistrări în format AAC - calitatea este adesea pierdută deja. Cu toate acestea, playerele noi de buzunar și unele magazine online acceptă deja formatul AAC, adesea cu verificarea legalității conținutului (care descurajează și utilizatorii care preferă să nu se limiteze la copierea muzicii).

Deși foarte promițător, formatul AAC nu este singurul format de compresie audio de cea mai înaltă calitate. La rate de biți mari (peste 128 kbps), AAC este adesea inferior codificatoarelor Ogg Vorbis și Musepack. La cele mai mici rate de biți (mai puțin de 32 kbps), AAC poate fi inferior codificatoarelor audio parametrice, inclusiv codificatoarelor specializate pentru compresia vorbirii. Cu toate acestea, în intervalul ratelor de biți medii-scăzute, AAC păstrează în prezent palma.

Alexey Lukin
Revista „Inginer de sunet” 2008 #1

Anunț

Format de fișier audio AAC

Fișierele AAC au fost dezvoltate pentru a înlocui fișierele MP3. Compresia cu pierderi vă permite să obțineți un sunet mai bun la aceleași rate de biți. Fișierele AAC au fost standardizate de ISO/IEC ca parte a familiilor de fișiere MPEG-2 și MPEG-4 (și au fost inițial parte din grupul de fișiere MPEG-2 Part 7). Fișierele AAC conțin mai multe rate de eșantionare (comparativ cu MP3) și până la 48 de canale. Eficiență de codare îmbunătățită semnificativ, inclusiv mai multe seturi de filtre. Precizie îmbunătățită de codare a semnalului tranzitoriu. La fel ca fișierele MP3, fișierele AAC elimină frecvențele pe care oamenii nu le pot auzi. Acest lucru vă permite să reduceți dimensiunea fișierului. În comparație cu MP3, fișierele AAC sunt mult mai mici.

Informații tehnice despre fișierele AAC

Fișierele MPEG-2 partea 7 sunt reprezentate de trei tipuri de fișiere: AAC-LC de complexitate redusă, tip principal (AAC Main) și fișiere cu frecvență de eșantionare variabilă (AAC-SSR). Fișierele AAC permit modelarea temporală a zgomotului, eșantionarea neuniformă și reformatarea fluxului de biți (pentru 16 canale stereo, 16 canale mono, 16 canale de joasă frecvență și 16 canale de adnotare într-un singur flux de biți). În 1999, formatul MPEG-2 partea 7 a fost încorporat în formatul MPEG-4 partea 3. Acest lucru a permis introducerea unor tipuri de obiecte audio, precum și a tehnologiei de înlocuire a zgomotului constant. Formatul AAC este descris în prezent în standardul ISO/IEC 14496-3. Mascarea audio este utilizată în compresia cu pierderi pentru a elimina informațiile nedorite, menținând în același timp calitatea.

Mai multe informații despre formatul AAC

Extensie de fișier .aac
Categoria de fișiere
Exemplu de fișier (1,2 MiB)
Programe înrudite Windows Media Player
iTunes
KMPlayer
Jucător adevărat
VideoLAN VLC Media Player