Codec audio aas. Comment ouvrir un fichier .AAC ? Je comprends les avantages de ce format, mais comment ré-encoder ma musique ?

Téléchargez gratuitement le codec AAC pour Windows 10/8/7, etc., pour décoder/encoder AAC sur PC

Codecs AAC disponibles en téléchargement pour Windows 10/8/7, etc.

Le codec AAC peut être une bibliothèque/un projet logiciel ou un ensemble d'outils logiciels pour encoder ou décoder l'audio AAC. Certains codecs AAC peuvent gérer à la fois l'encodage et le décodage AAC, tandis que d'autres ne peuvent décoder l'AAC qu'à des fins de lecture ou de conversion. Alors, quels codecs AAC pouvons-nous télécharger pour Windows 10/8/7, etc. ? Consultez la liste ci-dessous.

Codec Nero AAC
Systèmes d'exploitation pris en charge : Windows, Linux
Type: encodeur/décodeur
Licence : Gratuite
Lien de téléchargement : https://www.videohelp.com/software/Nero-AAC-Codec

Nero AAC Codec, développé et distribué par Nero AG, est un encodeur et décodeur AAC tout-en-un prenant en charge MPEG-4 AAC LC, HE-AAC et HE-AACv2 jusqu'à 96 kHz. taux d'échantillonnage et jusqu'à 6 canaux (surround 5.1). Il est très apprécié car il peut produire des résultats de haute qualité avec une petite taille. Ce codec AAC a donné sa dernière mise à jour le 18 février 2010 avec la version 1.5.4.0. Bien qu'il ne s'agisse plus d'un développeur, il peut fonctionner correctement sur Windows 10, 8, 7 et versions antérieures.

Fraunhofer FDK AAC
Systèmes d'exploitation pris en charge : Android, Windows, macOS, Linux
Type: encodeur/décodeur
Permis : Libéral
Lien de téléchargement : https://github.com/mstorsjo/fdk-aac

Fraunhofer FDK AAC est initialement développé en tant que codec AAC inclus d'Android et s'étend ensuite à d'autres plates-formes. Il prend en charge une large gamme de types d'objets audio AAC, notamment MPEG-2/4 AAC LC, HE-AAC (AAC LC + SBR), HE-AACv2 (LC + SBR + PS) et AAC-LD/ELD. Les fichiers audio avec une fréquence d'échantillonnage allant de 8 kHz à 96 kHz et jusqu'à 8 canaux (surround 7.1) peuvent être encodés à l'aide de sa bibliothèque d'encodage. La bibliothèque Fraunhofer de distribution de code source nommée fdk-aac peut être appliquée à d'autres programmes, par exemple HandBrake. >> Lectures complémentaires :

FAAC
Systèmes d'exploitation pris en charge : Windows, macOS, Linux
Type : Encodeur (FAAC)/Décodeur (FAAD2)
Licence : propriétaire (FAAC)/gratuite (licence publique générale GNU version 2 ou ultérieure pour FADD2)
Lien de téléchargement : http://www.audiocoding.com/downloads.html

Le codec FAAC AAC comprend l'encodeur FAAC et le décodeur FAAD2. Le premier encodeur est principalement utilisé pour générer des fichiers AAC (MPEG-2/4 AAC) à partir d'autres formats, tandis que le dernier décodeur peut décoder les fichiers MPEG-2/4 AAC avec la prise en charge des types d'objets audio LC, Main, LTP, SBR et PS. . La bibliothèque (libfaad) incluse dans le décodeur FAAD2 peut être utilisée par d'autres programmes pour le décodage AAC, par exemple AAC ACM Codec.

Outre les codecs ci-dessus spécialisés dans l'encodage et le décodage audio AAC sous Windows, il existe plusieurs packs/bibliothèques de codecs complets atteignant le même objectif.

Codec Système d'exploitation pris en charge Licence Télécharger
Windows, macOS, Linux LGPL2.1+, GPL2+ https://www.ffmpeg.org/download.html
ffdshow Windows XP et versions ultérieures Licence publique générale GNU 2.0 https://sourceforge.net/projects/ffdshow-tryout/
Pack de codecs K-Lite Windows XP et versions ultérieures Gratuit https://www.codecguide.com/download_kl.htm
Pack de codecs pour lecteur multimédia Windows 2003 ou version ultérieure Gratuit http://www.mediaplayercodecpack.com/

Le téléchargeur et extracteur audio AAC le plus intelligent – ​​WinX HD Video Converter Deluxe

Téléchargez rapidement de la musique AAC/MP3 depuis SoundCloud, Audiomack et d'autres sites de musique sans perte de qualité.
Convertissez des vidéos locales et en ligne (par exemple la musique YouTube/Vevo) en AAC ou en d'autres formats audio comme MP3, WMA, FLAC, ALAC, M4R, OGG, DTS, etc., avec un son hi-fi.

Source externe associée à partir du wiki :
Codec audio - Un appareil ou un programme informatique capable de coder ou de décoder un flux de données numériques audio...

Aujourd'hui, le format AAC n'a pas encore été distribué en masse sur les supports audio, mais dans un certain nombre de paramètres, il surpasse tous les types de compression audio existants, ce qui signifie qu'il mérite notre attention.

Qu'est-ce que c'est?

Commençons par une définition : AAC est une option propriétaire (propriétaire) de compression de fichiers audio. Dans le même temps, il présente moins de perte de qualité lors de l'encodage que le MP3 dans des conditions de même débit. De plus, le format AAC est un algorithme de codage audio à large bande qui utilise deux principes de codage principaux pour réduire considérablement la quantité de données requise pour transmettre un son numérique de qualité. Cette solution est reconnue comme étant de la plus haute qualité, mise en œuvre grâce à la technologie de compression avec perte. Le format prend en charge la plupart des équipements modernes, même portables. Il convient de noter que les sonneries dans Format AAC peut être acheté sur l'iTunes Store, et ce magasin propose de la musique compressée exclusivement à l'aide de ladite décision. Il faut également dire que le format AAC a été créé à l'origine pour succéder au MP3, ce qui pourrait offrir une qualité d'encodage améliorée. La solution a été lancée en 1997 en tant que nouveau septième membre de la famille MPEG-2.

Principe de fonctionnement

Lors du codage dans ce format, les processus suivants sont effectués : les composants non perçus sont supprimés du signal et le signal audio codé est débarrassé de toute redondance. Ensuite, les données sont traitées selon la méthode MDCT en fonction de leur complexité. À l'étape suivante, des codes sont ajoutés pour corriger diverses erreurs internes. Enfin, le signal est transmis ou stocké.

Tous les détails

Fait intéressant, le format AAC a une fréquence d'échantillonnage comprise entre 8 et 96 kHz, ainsi qu'un nombre de canaux compris entre 1 et 48. MP3 utilise un ensemble hybride de filtres. À son tour, AAC recourt à la transformation cosinus discrète modifiée avec une taille de fenêtre accrue, qui atteint 2048 points.

Ainsi, l’AAC est beaucoup plus adapté au codage de l’audio comportant un flux d’impulsions complexes ainsi que des ondes carrées, par rapport au MP3. Le format a la capacité de changer dynamiquement les longueurs de bloc MDCT dans la plage de 2 048 à 256 points. S'il y a un changement court ou unique, une petite fenêtre de 256 points est appliquée pour obtenir une meilleure résolution. La valeur par défaut est une grande fenêtre de 2 048 points pour maximiser l'efficacité de l'encodage. L'AAC présente de nombreux avantages par rapport au MP3 conventionnel. Parmi eux, il convient de noter : la mise en œuvre grand nombre canaux audio (jusqu'à 48), efficacité d'encodage importante dans des conditions de débits constants et variables, ainsi que des taux d'échantillonnage allant de 8 Hz à 96 kHz (pour le MP3 ce chiffre varie de 8 Hz à 48 kHz) et plus flexibles traitement spécial appelé Joint stéréo. Quant à la solution AAC+, il s’agit d’un codec axé sur le travail avec de faibles débits. Il s'agit d'une combinaison de SBR et d'AAC LC, grâce à laquelle un bon son est déjà obtenu dans la plage de 32 à 48 kbps.

Explication:
NOUVEAU LOGICIEL = Nouvel outil depuis votre dernière visite
NOUVELLE VERSION = Nouvelle version depuis votre dernière visite
NOUVEL AVIS = Nouvel avis depuis votre dernière visite
NOUVELLE VERSION = Nouvelle version

Dernière version
Numéro de version / Numéro de version bêta / Numéro de version de mise à jour et date de sortie.

Tapez et téléchargez
PLUS DE MISES À JOUR ?= Le logiciel n'a pas été mis à jour depuis plus de 2 ans.
PLUS DÉVELOPPÉ= Le logiciel n'a pas été mis à jour depuis plus de 5 ans.
RÉCEMMENT MISE À JOUR = Le logiciel a été mis à jour au cours des 31 derniers jours.
Logiciel gratuit= Téléchargez le logiciel gratuit.
Logiciel d'essai gratuit= Téléchargez le logiciel gratuit mais certaines parties sont en version d'essai/shareware.
Logiciel gratuit= Téléchargez des logiciels gratuits et également du code open source également connu sous le nom de FOSS (Free and Open Source Software).
Logiciel d'évaluation gratuit= Téléchargez des logiciels gratuits et également du code open source, mais certaines parties sont en version d'essai/shareware.
Annonces de logiciels gratuits= Téléchargez un logiciel gratuit mais soutenu par la publicité, généralement avec une barre d'outils de navigateur incluse. Il peut être désactivé lors de l'installation ou après l'installation.
Annonces de logiciels gratuits= Téléchargement gratuit de logiciels et de code open source mais soutenu par la publicité, généralement avec une barre d'outils de navigateur incluse. Il peut être désactivé lors de l'installation ou après l'installation.
Logiciel d'essai= Également appelé shareware ou démo. Version d'essai gratuite disponible pour téléchargement et test avec généralement une limite de temps ou des fonctions limitées.
Logiciel payant= Aucune démo ou essai disponible.
Version portable= Une version portable/autonome est disponible. Aucune installation n'est requise.
v1.0.1 = Dernière version disponible.
Télécharger la version bêta = Il peut s'agir d'une version bêta, RC (Release Candidate) ou d'une version Alpha / Nightly / Unstable du logiciel.
Télécharger 15 Mo = Un lien direct vers le téléchargement du logiciel.
Gagner = version téléchargée de Windows. Il fonctionne sous Windows 32 bits et 64 bits.
Win64 = version téléchargée de Windows 64 bits. Cela ne fonctionne que sur Windows 64 bits.
Mac = version téléchargeable pour Mac. Il fonctionne sur Mac OS 32 bits et 64 bits.
Mac64 = version téléchargeable de Mac OS. Cela ne fonctionne que sur Mac OS 64 bits.
Linux = version téléchargée de Linux.
Portable = Version portable. Aucune installation n'est requise.
Ad-Supported = Le logiciel est fourni avec de la publicité. Soyez prudent lorsque vous installez le logiciel et désactivez les modules complémentaires dont vous ne voulez pas !
Visiter le site des développeurs = Un lien vers le site des développeurs de logiciels.
Télécharger (lien miroir) = Un lien miroir vers le téléchargement du logiciel. Il se peut qu'il ne contienne pas les dernières versions.
Télécharger les anciennes versions = Téléchargements gratuits des versions précédentes du programme.
Télécharger la version 64 bits = Si vous possédez un 64 bits système opérateur vous pouvez télécharger cette version.
Télécharger la version portable = Version portable/autonome, ce qui signifie qu'aucune installation n'est requise, extrayez simplement les fichiers dans un dossier et exécutez-les directement.
Version portable disponible = Téléchargez la version portable et vous pouvez simplement extraire les fichiers et exécuter le programme sans installation.
Anciennes versions disponibles = Téléchargez les anciennes versions du programme.
Historique des versions disponible = Journal des modifications complet sur notre site.
= Version Windows disponible.
= Version Mac OS disponible.
= Version Linux disponible.
Nos outils hébergés sont analysés contre les virus et les logiciels malveillants avec plusieurs programmes antivirus utilisant

2009-09-30T20:52

2009-09-30T20:52

Logiciel pour audiophile

Les premières idées sur l’utilisation du masquage psychoacoustique pour compresser des données audio remontent à 1979. Cependant, les encodeurs audio correspondants n'ont commencé à se généraliser qu'au milieu des années 90, lorsque la puissance de calcul des ordinateurs personnels est devenue suffisante pour lire l'audio compressé en temps réel et que la norme MPEG-1 Audio Layer 3, mieux connue sous le nom de MP3, est apparue. Les formats audio compressés sont devenus indispensables pour la transmission audio sur Internet, offrant une qualité sonore stéréo « virtuellement transparente » (c'est-à-dire que le signal codé est impossible à distinguer de l'original pour la plupart des auditeurs) à des débits binaires supérieurs à 128 kbps. Les principes de base du format MP3 peuvent être trouvés dans les articles de K. Glasman (2...8/2005)

Le développement des méthodes de compression de données et de la psychoacoustique a progressivement conduit au fait que la norme MP3 est devenue « à l'étroit » pour la mise en œuvre de nouvelles idées en matière de codage audio. En conséquence, en 1997, l'Institut Fraunhofer (Fraunhofer IIS), qui a créé le MP3 au début des années 90, ainsi que Dolby, AT&T, Sony et Nokia, ont développé une nouvelle méthode de compression audio : Audio avancé Codage (AAC), inclus dans les normes MPEG-2 et MPEG-4. Les principales différences par rapport à la norme MP3 sont :

  • prise en charge d'une gamme plus large de formats (jusqu'à 48 canaux) et de fréquences d'échantillonnage audio (de 8 kHz à 96 kHz) ;
  • banc de filtres plus efficace et plus simple : le banc de filtres hybride MP3 a été remplacé par le MDCT (transformation en cosinus discrète modifiée) conventionnel ;
  • des limites plus larges pour faire varier la résolution fréquence-temps dans la banque de filtres - huit fois (en MP3 - trois fois) - ont conduit à un codage amélioré des transitoires (processus transitoires) et des sections stationnaires du signal audio ;
  • meilleur codage des fréquences supérieures à 16 kHz ;
  • un mode de codage stéréo plus flexible, permettant de passer en mode M/S (« joint stéréo ») indépendamment dans différentes bandes de fréquences ;
  • fonctionnalités supplémentaires de la norme qui augmentent l'efficacité de la compression : technologie de génération de bruit dans le domaine temporel (TNS), prédiction à long terme des coefficients MDCT, mode de codage stéréo paramétrique, substitution du bruit perceptuel, fréquences de technologie de restauration à grande vitesse (SBR).

Grâce à ces fonctionnalités, la norme AAC est capable d’obtenir un encodage audio plus flexible et plus efficace, et donc de meilleure qualité. En raison de l'utilisation généralisée du format MP3, la norme AAC n'a pas encore acquis une popularité comparable à celle du MP3. Néanmoins, AAC est le format principal de la célèbre boutique en ligne iTunes Store, des lecteurs iPod, iTunes, téléphone iPhone, PlayStation 3, Nintendo Wii et diffusion numérique DAB+/DRM.

Examinons de plus près les principales fonctionnalités d'AAC.

Banque de filtres

Comme les autres encodeurs audio psychoacoustiques, AAC fonctionne selon le schéma suivant. Le signal d'entrée passe à travers une banque de filtres - une transformation qui transfère le signal du domaine temporel au domaine temps-fréquence (semblable à la construction d'un spectrogramme). En parallèle, le modèle psychoacoustique analyse le signal et détermine les seuils de masquage psychoacoustique. Ensuite, les coefficients spectraux du signal en sortie du banc de filtres sont quantifiés pour que le spectre du bruit, si possible (si le débit le permet), soit inférieur aux seuils de masquage et ne soit pas audible. Les coefficients quantifiés sont compressés sans perte dans un fichier de sortie AAC. Ainsi, le banc de filtres lui-même ne compresse pas le signal, il le convertit uniquement sous une forme plus adaptée à la compression.

Une caractéristique de chaque banc de filtres est sa résolution en fréquence, c'est-à-dire le nombre de bandes de fréquences en lesquelles il divise le spectre du signal. La plupart des banques de filtres utilisées pour la compression audio comportent plusieurs centaines de bandes. Cela signifie que, du fait de la relation d'incertitude, de tels bancs de filtres ont une résolution temporelle de l'ordre de plusieurs dizaines de millisecondes. Lorsque les coefficients spectraux d'un signal sont quantifiés, l'erreur de quantification introduite lors du décodage du signal est répartie dans le temps sur toute la longueur de la fenêtre du banc de filtres. Dans certains cas, cela se traduit par un effet indésirable appelé pré-écho. Cela se manifeste lorsqu'une erreur de quantification provenant d'un transitoire (une forte explosion d'énergie dans le signal) se propage dans le temps jusqu'au segment temporel précédant le transitoire et devient audible (Fig. 1). Pour réduire cet effet, des banques de filtres à résolution temps-fréquence variable sont utilisées. Par exemple, MP3 utilise une résolution temporelle de banque de filtres commutant entre 26 et 9 ms. Pour les signaux stationnaires, des fenêtres de 26 ms sont utilisées pour obtenir une bonne résolution en fréquence, et pour les transitoires, des fenêtres de 9 ms sont utilisées pour réduire l'effet de pré-écho (voir Fig. 1).

L'algorithme AAC utilise également la commutation de taille de fenêtre MDCT. Dans le même temps, la différence de taille des fenêtres est multipliée par huit : 6 et 48 ms (256 et 2048 échantillons). Grâce à cela, l'algorithme est capable de s'adapter à une plus large gamme de signaux et d'obtenir un meilleur degré de compression.

Technologie TNS - formation d'une enveloppe de bruit d'amplitude

L'un des problèmes des encodeurs audio psychoacoustiques modernes est de travailler avec des transitoires (processus transitoires dans un signal audio). Pour obtenir un codage transparent, le bruit de quantification doit se situer dans un seuil de masquage dépendant du temps. Cependant, en pratique, cette exigence est difficile à satisfaire dans les processus quasi transitoires, car Le bruit de quantification généré lors du codage se propage dans le temps lors du décodage sur toute la longueur de la fenêtre MDCT. Cela peut entraîner un bruit de quantification dépassant considérablement les seuils de masquage temporel.

La technologie TNS (Temporal Noise Shaping) de la norme AAC permet de contrôler la propagation du bruit de quantification temporelle au sein de chaque fenêtre MDCT. La technologie TNS repose sur la similarité (dualité temps-fréquence) de l'enveloppe d'amplitude du signal et de l'enveloppe de son spectre, ainsi que sur l'utilisation de la prédiction linéaire (LPC) en fréquence lors de la quantification du spectre.

Il est bien connu que pour les signaux dont le spectre est très différent du blanc (par exemple, les signaux toniques), l'utilisation de la prédiction linéaire (LPC) dans le domaine temporel peut effectivement « blanchir » le spectre et coder ces signaux en les décomposant. en coefficients de prédiction et en une erreur de prédiction d'amplitude relativement faible (résiduelle). Lors du décodage, le filtre de prédiction linéaire génère un spectre d'erreur en fonction du spectre du signal d'origine.

Un codeur AAC utilise la prédiction linéaire de la manière opposée : pour prédire des échantillons spectraux dans le domaine fréquentiel. La différence entre les coefficients MDCT d'origine et prédits est quantifiée en fonction de seuils de masquage (dans les codeurs traditionnels, les coefficients MDCT d'origine sont quantifiés). Les coefficients de prédiction linéaire sont également écrits dans le fichier de sortie. Lors du décodage d'un signal, un filtre de prédiction linéaire appliqué à un signal de différence dans le domaine fréquentiel (y compris l'erreur de quantification) produit une enveloppe d'amplitude du signal d'origine (et l'erreur de quantification) dans le domaine temporel. Ainsi, l'enveloppe d'amplitude des erreurs de quantification devient proche de l'enveloppe d'amplitude du signal original (Fig. 2).

La technologie TNS réduit l'effet de pré-écho et la visibilité des erreurs de quantification sur certains signaux harmoniques à caractère pulsé de production sonore (parole, certains instruments à vent et à archet). Sur la fig. La figure 2 compare les erreurs de quantification introduites dans le signal vocal par les algorithmes AAC et MP3 avec les mêmes débits. Parallèlement à une diminution générale de l'erreur de quantification (due à la plus grande efficacité de l'AAC), la formation de l'enveloppe d'amplitude de l'erreur de quantification temporelle est observée en fonction de l'enveloppe du signal d'origine.

Dans la norme AAC, la technologie TNS peut être appliquée indépendamment à des bandes de fréquences individuelles du spectre ou complètement désactivée.

Technologie SBR - restauration haute fréquence

Une transmission fiable sur une large plage de fréquences est une condition importante pour un codage de haute qualité. Cependant, la transmission de chaque octave suivante de la plage audio augmente d'une fois et demie à deux fois les exigences de débit binaire pour un encodeur audio traditionnel. Pour réduire le débit binaire et en même temps préserver les hautes fréquences dans le matériel codé, la technologie de synthèse artificielle des hautes fréquences SBR (réplication de bande spectrale) a été créée.

La technologie est basée sur le fait que notre audition analyse les hautes fréquences avec moins de précision que les moyennes et basses fréquences. Pour créer l’effet de présence de hautes fréquences, il n’est pas nécessaire de reconstruire mathématiquement avec précision la forme d’onde, mais plutôt seulement de restaurer certains paramètres psychoacoustiques essentiels du signal aux hautes fréquences. Ces paramètres essentiels incluent la distribution temps-fréquence (enveloppe) de l’énergie du signal et le degré de sa tonalité/bruit.

L'idée de l'algorithme est la suivante. Lors de l'encodage, les hautes fréquences du signal audio original sont analysées et leurs paramètres sont extraits : tout d'abord, l'enveloppe d'amplitude dans plusieurs (généralement huit) bandes de fréquences. Ensuite, les hautes fréquences sont supprimées de l’enregistrement et seules les basses et moyennes fréquences restantes sont codées. Dans le même temps, un flux relativement restreint d'informations sur les paramètres des hautes fréquences perdues est également ajouté au fichier de sortie.

Pendant la lecture, le signal basse et moyenne fréquence est décodé en premier. Ensuite (s'il est présent dans le lecteur), le décodeur SBR commence à fonctionner. La première étape consiste à synthétiser un signal haute fréquence en transposant (ou plutôt en décalant la fréquence) les fréquences moyennes existantes. Étant donné que le degré de tonalité/bruit du spectre aux moyennes et hautes fréquences est approximativement égal, cette étape aboutit à un signal haute fréquence avec une structure spectrale plausible. Dans un deuxième temps, le décodeur SBR utilise les informations haute fréquence supplémentaires stockées pour lui donner l'enveloppe d'amplitude souhaitée dans chaque bande de fréquence. Le résultat est un signal dans lequel les hautes fréquences sont entièrement synthétisées à partir des fréquences moyennes, tout en conservant le son des hautes fréquences d'origine.

La technologie SBR peut être appliquée à de nombreux méthodes existantes encodage audio. Par exemple, SBR en combinaison avec MP3 est appelé MP3 PRO, et SBR en combinaison avec AAC est appelé HE-AAC (high efficient AAC). Fondamentalement, SBR est utilisé lors du codage avec des débits binaires relativement faibles : 64 kbit/s et moins. La technologie vous permet d'élargir considérablement la gamme de fréquences du signal audio avec une augmentation minimale du débit binaire (plusieurs kbit/s).

Technologie stéréo paramétrique

La transmission d'un signal stéréo nécessite généralement que l'encodeur ait un débit binaire presque deux fois plus élevé que la transmission d'un signal mono. Dans ce cas, les canaux stéréo peuvent être codés indépendamment et après conversion M/S. Dans ce dernier cas, le canal S consomme souvent moins de débit que le canal M. Ce mode d'encodage est également appelé stéréo conjoint. Dans la norme AAC, ce mode peut être activé et désactivé par l'encodeur indépendamment pour chaque bande de fréquence.

Pour un codage plus efficace des signaux stéréo à très faibles débits (16...32 kbit/s), une technologie de codage stéréo paramétrique a été développée. Cela consiste dans le fait que le signal stéréo est réduit en mono avant l'encodage, mais un petit flux (2...3 kbit/s) est ajouté au fichier de sortie, contenant des informations sur le panorama stéréo du fichier stéréo d'origine. Ce flux contient (sous forme compressée) une sorte de « carte panoramique » du plan temps-fréquence.

L'étape de décodage applique un panoramique dépendant de la fréquence au signal mono résultant. Ceci peut être effectué simultanément au décodage en appliquant des multiplicateurs d'amplitude appropriés aux coefficients MDCT initialement égaux des canaux gauche et droit.

La technologie stéréo paramétrique donne une bonne impression du son stéréo original au prix d'une légère augmentation du débit par rapport à l'encodage mono. Cependant, il ne permet pas d'obtenir un son totalement transparent, car il est incapable de prendre en compte toutes les nuances du panorama stéréo, par exemple les déphasages entre les canaux stéréo.

La technologie stéréo paramétrique a été incluse dans la norme HE-AAC v2.

Technologie PNS - génération de bruit

Pour augmenter encore l'efficacité du codage des signaux de bruit, la norme AAC fournit la technologie PNS (perceptual noise substitution) pour la synthèse du bruit. On sait que notre oreille est plus sensible au spectre d’amplitude d’un signal qu’au spectre de phase. Par conséquent, au lieu de coder les coefficients MDCT du signal original dans des régions de bruit, vous pouvez uniquement transmettre les paramètres du bruit : sa puissance en fonction de la fréquence et du temps.

C'est ainsi que fonctionne la technologie PNS. Lors du codage, les régions du spectre qui représentent le bruit sont identifiées et les groupes correspondants de coefficients MDCT sont exclus du processus de codage. La bande de fréquences est marquée comme bruit et l’énergie totale du bruit correspondante est stockée.

Lors du décodage, des coefficients MDCT pseudo-aléatoires avec la puissance totale requise sont remplacés dans des bandes de fréquences marquées comme bruit. En conséquence, dans les plages de fréquences spécifiées, un bruit est synthétisé dont le son est proche du bruit d'origine.

Technologie de prévision à long terme – prédiction temporelle

Le codage psychoacoustique des signaux sonores nécessite un rapport signal/bruit local plus élevé que le codage des signaux sonores (par exemple, 20 dB et 6 dB, respectivement). Et cela, à son tour, nécessite un débit binaire accru. Cependant, les coefficients MDCT des tonalités sont prévisibles dans le temps. Cette circonstance permet d'exploiter leur dépendance temporelle pour réduire le débit.

La norme AAC fournit un mode de prédiction à long terme, dans lequel les coefficients MDCT sont en outre codés dans le temps à l'aide d'une prédiction linéaire. Le terme « long terme » signifie que la prédiction est faite non pas à partir d'échantillons adjacents, mais à partir d'échantillons séparés par la période tonale la plus probable à une fréquence donnée.

Quantification et compression des coefficients MDCT

Semblable au standard MP3, AAC utilise la quantification non linéaire des coefficients MDCT et la compression à l'aide de la méthode Huffman. Les coefficients MDCT sont quantifiés après avoir été augmentés à la puissance 0,75, ce qui permet d'augmenter l'erreur de quantification pour les signaux de forte puissance et de la réduire pour les signaux de forte puissance. signaux faibles au sein de chaque bande de fréquence. De cette manière, une formation implicite supplémentaire du spectre de bruit est réalisée.

Après quantification, les coefficients MDCT sont compressés à l'aide d'un ensemble de tables de Huffman fixes. Dans la norme AAC, il y a plus de ces tableaux qu'en MP3, et il existe des possibilités plus larges de regroupement des coefficients. Il en résulte une augmentation supplémentaire de la compression.

Qualité sonore

Lors de l'évaluation de la qualité sonore des encodeurs audio, des tests subjectifs sont généralement utilisés. Les auditeurs se voient présenter des fragments d'enregistrements compressés par différents encodeurs et évaluent la pureté sonore de chaque fragment sur une échelle de 1 à 5. Le meilleur codec est considéré comme celui qui est capable d'obtenir une qualité sonore supérieure à celle de ses concurrents. à un débit donné.

Une source Internet faisant autorité qui fournit les résultats de ces tests est le site http://www.rjamorim.com/test/. Il présente des tests de divers codecs à différents débits. Les résultats présentés sont généralement en bon accord avec d’autres sources. Voici quelques résultats pour les encodeurs MP3 et AAC pour vous aider à comparer leur qualité.

Le meilleur encodeur MP3 est le gratuit Lame. Cependant, pour la plupart des débits binaires, sa qualité est inférieure aux normes de compression les plus récentes. À des débits binaires élevés (au-dessus de 128 kbps), ce décalage est faible et le leader est l'encodeur Ogg Vorbis.

Avec un débit binaire de 64 kbps, l'avantage de l'AAC est déjà perceptible. Dans la variante HE-AAC, l’algorithme obtient un score de 3,68. Cela correspond à peu près à Lame avec un débit binaire de 96 kbps et signifie que l'AAC est environ 1,5 fois supérieur au MP3. Le score de Lame à 128 kbps est de 4,29.

Avec un débit de 32 kbit/s, l'encodeur AAC de Nero présente une amélioration significative de la qualité par rapport au MP3 : scores de 3,23 et 1,72, respectivement. Cependant, l'AAC n'est que légèrement en avance sur le format MP3PRO, qui a reçu une note de 3,08. Cela indique que la technologie SBR améliore considérablement la qualité à faible débit.

Conclusions

Grâce aux nouvelles technologies utilisées dans la norme AAC, ce format présente un avantage notable par rapport au MPEG-1 Layer 3 (MP3), lui permettant d'obtenir une meilleure qualité sonore aux mêmes débits. Un gain particulièrement fort est observé dans le domaine des faibles débits : 96 kbit/s et moins. Cela confirme la promesse du format AAC pour la diffusion numérique.

La popularité de l’AAC pour la distribution de musique sur Internet reste aujourd’hui faible par rapport au format MP3. Les utilisateurs continuent de préférer la meilleure portabilité du MP3 à la compression plus forte de l'AAC. Une partie importante des archives musicales des sites qui distribuent de la musique sont déjà initialement au format MP3 et les fournisseurs n'ont pas accès aux enregistrements non compressés. Cela signifie qu'il ne sert à rien de transcoder de tels enregistrements au format AAC - la qualité est souvent déjà perdue. Cependant, les nouveaux lecteurs de poche et certaines boutiques en ligne supportent déjà le format AAC, souvent avec vérification de la légalité du contenu (ce qui décourage également les utilisateurs qui préfèrent ne pas se limiter à copier de la musique).

Bien que très prometteur, le format AAC n’est pas le seul format de compression audio de haute qualité. À des débits binaires élevés (supérieurs à 128 kbps), la qualité AAC est souvent inférieure à celle des encodeurs Ogg Vorbis et Musepack. Aux débits les plus bas (moins de 32 kbit/s), l'AAC peut être inférieur aux encodeurs audio paramétriques, y compris les encodeurs spécialisés pour la compression vocale. Cependant, dans la gamme des débits moyens à faibles, l’AAC conserve actuellement la palme.

Alexeï Loukine
Magazine "Ingénieur du Son" 2008 #1

Annonce

Format de fichier audio AAC

Les fichiers AAC ont été développés pour remplacer les fichiers MP3. La compression avec perte vous permet d'obtenir plus son de haute qualité aux mêmes débits. Les fichiers AAC sont normalisés par l'ISO/IEC en tant que membres des familles de fichiers MPEG-2 et MPEG-4 (ayant été à l'origine membres de la famille de fichiers MPEG-2 Part 7). Les fichiers AAS contiennent plus taux d'échantillonnage (par rapport au MP3), ainsi que jusqu'à 48 canaux. Efficacité d'encodage considérablement améliorée et inclusion de davantage de banques de filtres. La précision du codage des signaux transitoires a été améliorée. Comme les fichiers MP3, les fichiers AAC coupent le son des fréquences que les humains ne peuvent pas entendre. Cela vous permet de réduire la taille du fichier. Comparés au MP3, les fichiers AAC sont nettement plus petits.

Informations techniques sur les fichiers AAC

Les fichiers MPEG-2 partie 7 sont disponibles en trois types de fichiers : AAC-LC de faible complexité, type principal (AAC Main) et fichiers à taux d'échantillonnage variable (AAC-SSR). Les fichiers AAC permettent une mise en forme temporaire du bruit, un échantillonnage non uniforme et une refonte du format du flux binaire (pour 16 canaux stéréo, 16 canaux mono, 16 canaux basse fréquence et 16 canaux de commentaires dans un flux binaire). En 1999, la partie 7 de MPEG-2 a été incorporée à la partie 3 de MPEG-4. Cela a permis l'introduction de types d'objets audio ainsi que d'une technologie de remplacement continu du bruit. Le format AAC est actuellement décrit dans la norme ISO/IEC 14496-3. Le masquage audio est utilisé en compression avec perte pour supprimer les informations inutiles tout en conservant la qualité.

Plus d'informations sur le format AAC

Extension de fichier .aac
Catégorie de fichier
Exemple de fichier (1,2 Mo)
Programmes associés Windows Média Joueur
iTunes
KMPlayer
Joueur réel
Lecteur multimédia VidéoLAN VLC