Aacオーディオコーデック。 .AACファイルを開く方法は? この形式の利点は理解していますが、音楽をトランスコードするにはどうすればよいですか

PCでAACをデコード/エンコードするためのWindows10/8/7などのAACコーデックを無料でダウンロード

Windows10/8/7などでダウンロードできるAACコーデック。

AACコーデックは、AACオーディオをエンコードまたはデコードするためのソフトウェアライブラリ/プロジェクトまたはソフトウェアツールのセットにすることができます。 一部のAACコーデックは、AACのエンコードとデコードの両方を管理できますが、他のコーデックは、再生または変換の目的でのみAACをデコードできます。 では、Windows 10/8/7などにダウンロードできるAACコーデックは何ですか? 以下のリストを確認してください。

NeroAACコーデック
サポートされているOS:Windows、Linux
タイプ:エンコーダー/デコーダー
ライセンス:無料
ダウンロードリンク:https://www.videohelp.com/software/Nero-AAC-Codec

NeroAGによって開発および配布されているNeroAACコーデックは、最大96kHzのサンプルレートと最大6チャンネル(5.1サラウンド)を備えたMPEG-4 AAC LC、HE-AAC、およびHE-AACv2をサポートするオールインワンAACエンコーダーおよびデコーダーです。 )。 小型で高品質な仕上がりが得られることから高い評価を得ています。 このAACコーデックは、2010年2月18日にバージョン1.5.4.0で最後の更新を行いました。 開発者ではなくなりましたが、Windows 10、8、7以下のバージョンで正常に動作します。

フラウンホーファーFDKAAC
サポートされているOS:Android、Windows、macOS、Linux
タイプ:エンコーダー/デコーダー
ライセンス:リベラル
ダウンロードリンク:https://github.com/mstorsjo/fdk-aac

Fraunhofer FDK AACは、最初はAndroidに含まれるAACコーデックとして開発され、後に他のプラットフォームに拡張されます。 MPEG-2 / 4 AAC LC、HE-AAC(AAC LC + SBR)、HE-AACv2(LC + SBR + PS)、AAC-LD/ELDなどの幅広いAACオーディオオブジェクトタイプをサポートしています。 サンプルレートが8kHz〜96kHzで、最大8チャンネル(7.1サラウンド)のオーディオファイルは、エンコードライブラリを使用してエンコードできます。 fdk-aacという名前のソースコード配布フラウンホーファーライブラリは、HandBrakeなどの他のプログラムに適用できます。 >>参考資料:

FAAC
サポートされているOS:Windows、macOS、Linux
タイプ:エンコーダー(FAAC)/デコーダー(FAAD2)
ライセンス:プロプライエタリ(FAAC)/無料(FADD2のGNU General Public Licenseバージョン2以降)
ダウンロードリンク:http://www.audiocoding.com/downloads.html

FAAC AACコーデックには、FAACエンコーダーとFAAD2デコーダーが含まれています。 前者のエンコーダーは主に他の形式からAAC(MPEG-2 / 4 AAC)ファイルを生成するために使用され、後者のデコーダーはオーディオオブジェクトタイプLC、メイン、LTP、SBR、PSをサポートしてMPEG-2 /4AACファイルをデコードできます。 FAAD2デコーダーに含まれているライブラリ(libfaad)は、AAC ACMコーデックなど、AACデコード用の他のプログラムで使用できます。

WindowsでのAACオーディオエンコーディングとデコーディングに特化した上記のコーデックに加えて、同じ目的を達成するいくつかの包括的なコーデックパック/ライブラリがあります。

コーデック サポートされているOS ライセンス ダウンロード
Windows、macOS、Linux LGPL 2.1 +、GPL 2+ https://www.ffmpeg.org/download.html
ffdshow WindowsXP以降 GNU General Public License 2.0 https://sourceforge.net/projects/ffdshow-tryout/
K-Liteコーデックパック WindowsXP以降 無料 https://www.codecguide.com/download_kl.htm
メディアプレーヤーコーデックパック Windows2003以降 無料 http://www.mediaplayercodecpack.com/

最もスマートなAACオーディオダウンローダーおよびエクストラクター–WinXHDビデオコンバーターデラックス

品質を損なうことなく、SoundCloud、Audiomack、その他の音楽サイトからAAC/MP3音楽をすばやくダウンロードします。
ローカルおよびオンライン(YouTube / Vevoミュージックなど)のビデオを、AACまたはMP3、WMA、FLAC、ALAC、M4R、OGG、DTSなどの他のオーディオ形式にhi-fiサウンドで変換します。

Wikiからの関連する外部ソース:
オーディオコーデック-オーディオのデジタルデータストリームをコーディングまたはデコードできるデバイスまたはコンピュータプログラム...

現在まで、AAC形式はまだオーディオメディアで大量に配布されていませんが、多くのパラメータで、現在存在するすべてのタイプのオーディオ圧縮を上回っています。つまり、注目に値します。

それは何ですか?

定義から始めましょう。AACはオーディオファイルの独自の(独自の)圧縮オプションです。 同時に、同じビットレートのMP3と比較して、エンコード中の品質の低下が少なくなります。 さらに、AAC形式は、2つの主要なコーディング原理を使用して、高品質のデジタルオーディオを送信するために必要なデータ量を大幅に削減する広帯域オーディオコーディングアルゴリズムです。 このソリューションは、非可逆圧縮技術を使用して実装された最高品質の1つとして認識されています。 このフォーマットは、ポータブル機器を含め、ほとんどの最新機器でサポートされています。 AACの着信音はiTunesStoreから購入でき、このストアではこのソリューションで圧縮された音楽のみを提供していることに注意してください。 また、AAC形式は元々MP3の後継として作成されたものであり、エンコード品質を向上させることができます。 このソリューションは、MPEG-2ファミリの新しい7番目の一部として1997年に公開されました。

動作原理

この形式にエンコードする場合、次のプロセスが実行されます。知覚できないコンポーネントが信号から削除され、エンコードされたオーディオ信号の冗長性がクリアされます。 その後、データはその複雑さに応じてMDCTメソッドに従って処理されます。 次の段階では、さまざまな内部エラーを修正するためのコードが追加されます。 最後に、信号が送信または保存されます。

すべての詳細

興味深いことに、AAC形式のサンプリングレートは8〜96 kHzの範囲であり、チャネル数は1〜48の範囲です。 MP3は、フィルターのハイブリッドセットを使用します。 次に、AACは、ウィンドウサイズが増加した修正離散コサイン変換を指します。これは2048ポイントに達します。

したがって、AACは、MP3と比較して、方形波だけでなく複雑なパルスストリームを持つオーディオのエンコードにもはるかに適しています。 このフォーマットは、2048〜256ポイントの範囲のMDCTブロック長で動的スイッチング機能を備えています。 短い変更または単一の変更がある場合は、より良い解像度を実現するために、256ポイントの小さなウィンドウが適用されます。 これは、エンコーディング効率を最大化するために、デフォルトで2048ポイントの大きなウィンドウに設定されています。 AACには、従来のMP3に比べて多くの利点があります。 それらの中で、注意する必要があります:多数のオーディオチャネル(最大48)の実装、一定および可変ビットレートの条件での大幅なコーディング効率、および8Hzから96kHzの範囲のサンプリングレート(MP3の場合図は8Hz〜48 kHz)で、ジョイントステレオと呼ばれるより柔軟な特殊モードです。 解決策として、「AAC +」は、低ビットレートでの作業に焦点を当てたコーデックです。 これはSBRとAACLCの組み合わせであり、そのおかげで32〜48kbpsの範囲ですでに良好なサウンドが実現されています。

説明:
新しいソフトウェア=前回の訪問以降の新しいツール
新しいバージョン=前回の訪問以降の新しいバージョン
新しいレビュー=前回の訪問以降の新しいレビュー
新しいバージョン=新しいバージョン

最新バージョン
バージョン番号/ベータバージョン番号/アップデートバージョン番号とリリース時期。

入力してダウンロード
これ以上の更新はありませんか?=ソフトウェアは2年以上更新されていません。
もはや開発されていない=ソフトウェアは5年以上更新されていません。
最近更新された=ソフトウェアは過去31日間に更新されました。
フリーウェア=無料のソフトウェアをダウンロードします。
フリーウェア試用版=無料ソフトウェアをダウンロードしますが、一部は試用版/シェアウェアです。
自由ソフトウェア=フリーソフトウェアと、FOSS(フリーおよびオープンソースソフトウェア)とも呼ばれるオープンソースコードをダウンロードします。
自由ソフトウェア試用版=無料のソフトウェアとオープンソースコードをダウンロードしますが、一部は試用版/シェアウェアです。
フリーウェア広告=無料のソフトウェアをダウンロードしますが、通常はブラウザのツールバーが含まれている広告でサポートされています。 インストール時またはインストール後に無効になる場合があります。
自由ソフトウェア広告=無料ダウンロードソフトウェアとオープンソースコードですが、通常はブラウザツールバーが含まれている広告でサポートされています。 インストール時またはインストール後に無効になる場合があります。
試用版=シェアウェアまたはデモとも呼ばれます。 無料試用版をダウンロードしてテストできます。通常は制限時間または機能が制限されています。
ペイウェア=利用可能なデモまたはトライアルはありません。
ポータブル版=ポータブル/スタンドアロンバージョンが利用可能です。 インストールは必要ありません。
v1.0.1=利用可能な最新バージョン。
ベータ版のダウンロード=ベータ版、RC(リリース候補)、またはソフトウェアのアルファ版/夜間/不安定版の可能性があります。
ダウンロード15MB=ソフトウェアダウンロードへの直接リンク。
Win=Windowsダウンロードバージョン。 32ビットおよび64ビットのWindowsで動作します。
Win64 =Windows64ビットのダウンロードバージョン。 64ビットWindowsでのみ動作します。
Mac=Macのダウンロードバージョン。 32ビットおよび64ビットのMacOSで動作します。
Mac64 =MacOSのダウンロードバージョン。 64ビットMacOSでのみ動作します。
Linux=Linuxダウンロードバージョン。
ポータブル=ポータブルバージョン。 インストールは必要ありません。
Ad-Supported=ソフトウェアは広告にバンドルされています。 ソフトウェアをインストールし、不要なアドオンを無効にするときは注意してください。
開発者サイトにアクセス=ソフトウェア開発者サイトへのリンク。
ダウンロード(ミラーリンク)=ソフトウェアダウンロードへのミラーリンク。 最新バージョンが含まれていない可能性があります。
古いバージョンのダウンロード=プログラムの以前のバージョンの無料ダウンロード。
64ビットバージョンのダウンロード=64ビットオペレーティングシステムを使用している場合は、このバージョンをダウンロードできます。
ポータブルバージョンのダウンロード=ポータブル/スタンドアロンバージョンは、インストールが不要であることを意味します。ファイルをフォルダーに抽出して直接実行するだけです。
利用可能なポータブルバージョン=ポータブルバージョンをダウンロードすると、ファイルを抽出して、インストールせずにプログラムを実行できます。
利用可能な古いバージョン=プログラムの古いバージョンをダウンロードします。
利用可能なバージョン履歴=当サイトの完全な変更ログ。
=利用可能なWindowsバージョン。
=利用可能なMacOSバージョン。
=利用可能なLinuxバージョン。
私たちがホストするツールは、ウイルスとマルウェアを使用していくつかのウイルス対策プログラムでスキャンしたものです。

2009-09-30T20:52

2009-09-30T20:52

オーディオファンのソフトウェア

音響心理学的マスキングを使用してオーディオデータを圧縮することに関する最初のアイデアは、1979年にさかのぼります。 しかし、対応するオーディオエンコーダーは、パーソナルコンピューターの計算能力が圧縮オーディオをリアルタイムで再生するのに十分であり、MPEG-1オーディオレイヤー3標準(MP3としてよく知られている)が始まった90年代半ばからのみ普及し始めました。現れた。 圧縮オーディオ形式は、インターネットを介してオーディオを送信するために不可欠になり、128 kbpsを超えるビットレートで「実質的に透過的な」ステレオサウンド品質を提供します(つまり、エンコードされた信号はほとんどのリスナーにとって元の信号と区別できません)。 MP3形式の基本原則は、K。Glasmanによる記事(2005年2月8日)に記載されています。

データ圧縮方法と音響心理学の開発により、MP3標準がオーディオコーディングの新しいアイデアの実装に「近づいた」という事実が徐々に生まれました。 その結果、1997年までに、90年代初頭にMP3を作成したフラウンホーファー研究所(Fraunhofer IIS)、およびドルビー、AT&T、ソニー、ノキアは、新しいオーディオ圧縮方式であるAdvanced Audio Coding(AAC)を開発しました。これは、MPEG-2およびMPEG-4の標準に含まれていました。 MP3標準との主な違いは次のとおりです。

  • 幅広いフォーマット(最大48チャンネル)とオーディオサンプリングレート(8kHzから96kHz)のサポート。
  • より効率的でシンプルなフィルターバンク:MP3ハイブリッドフィルターバンクは、従来のMDCT(修正離散コサイン変換)に置き換えられました。
  • フィルタバンクの周波数-時間分解能の変動のより広い制限-8倍(MP3では-3倍)-は、オーディオ信号のトランジェント(トランジェント)および静止セクションのコーディングを改善しました。
  • 16kHzを超える周波数のより良いコーディング。
  • 異なる周波数帯域で独立してM/S(「ジョイントステレオ」)モードに切り替えることができる、より柔軟なステレオコーディングモード。
  • 圧縮の効率を高める標準の追加機能:時間領域(TNS)でノイズを生成するテクノロジー、時間でのMDCT係数の予測(長期予測)、パラメトリックステレオコーディングモード(パラメトリックステレオ)、ノイズ合成(知覚ノイズ)置換)、高周波(SBR)を回復するための技術。

これらの機能のおかげで、AAC規格は、より柔軟で効率的な、したがってより高品質のオーディオコーディングを実現できます。 MP3形式が広く使用されている結果、AAC規格はまだMP3に匹敵する人気を獲得していません。 ただし、AACは、人気のあるiTunes Store、iPod、iTunes、iPhone、PlayStation 3、Nintendo Wii、DAB +/DRMデジタル放送のメインフォーマットです。

AACの主な機能をより詳細に検討してください。

フィルタバンク

他の音響心理学オーディオエンコーダーと同様に、AACは次のように機能します。 入力信号はフィルターバンクを通過します。これは、信号を時間領域から周波数-時間領域に変換する変換です(スペクトログラムの作成と同様)。 これと並行して、音響心理学モデルは信号を分析し、音響心理学マスキングのしきい値を決定します。 次に、フィルターバンクの出力での信号のスペクトル係数が量子化され、可能であれば(ビットレートが許せば)ノイズスペクトルがマスキングしきい値を下回り、聞こえなくなります。 量子化された係数は、ロスレスでAAC出力ファイルに圧縮されます。 したがって、フィルターバンク自体は信号を圧縮せず、圧縮により適した形式に変換するだけです。

各フィルターバンクの特徴は、その周波数分解能、つまり、信号スペクトルを分割する周波数帯域の数です。 オーディオ圧縮に使用されるほとんどのフィルターバンクには、数百の帯域があります。 これは、不確定性の関係により、このようなフィルターバンクの時間分解能は数十ミリ秒のオーダーであることを意味します。 信号のスペクトル係数が量子化されると、信号のデコード中に導入された量子化誤差は、フィルターバンクウィンドウの全長にわたって時間とともに広がります。 場合によっては、これはプリエコーと呼ばれる望ましくない効果につながります。 これは、トランジェントからの量子化誤差(信号内のエネルギーの急激なバースト)がトランジェントに先行する時間セグメントに時間内に伝播して聞こえるようになると現れます(図1)。 この影響を減らすために、可変時間周波数分解能のフィルターバンクが使用されます。 たとえば、MP3は、26〜9ミリ秒の切り替え可能なフィルターバンクの時間分解能を使用します。 定常信号は26ミリ秒のウィンドウを使用して良好な周波数分解能を提供し、過渡信号は9ミリ秒のウィンドウを使用してプリエコー効果を低減します(図1を参照)。

AACアルゴリズムは、MDCTウィンドウサイズの切り替えも使用します。 この場合、ウィンドウのサイズの違いは8倍です。6ミリ秒と48ミリ秒(256サンプルと2048サンプル)です。 このため、アルゴリズムはより広い範囲の信号に適応し、より優れた圧縮度を実現できます。

TNSテクノロジー-ノイズ振幅エンベロープシェーピング

最新の音響心理学的オーディオ信号エンコーダーの問題の1つは、トランジェント(オーディオ信号のトランジェント)を処理することです。 透過的なコーディングを確実にするには、量子化ノイズが時間に依存するマスキングしきい値を下回るようにする必要があります。 ただし、実際には、この要件は、過渡に近いものを満たすのは困難です。 エンコード中に生成された量子化ノイズは、MDCTウィンドウの全長にわたってデコード中に時間的に拡散します。 これにより、時間マスキングしきい値を超える量子化ノイズが大幅に過剰になる可能性があります。

AAC標準のTNS(時間的ノイズシェーピング)テクノロジを使用すると、各MDCTウィンドウ内の時間量子化ノイズの伝播を制御できます。 TNSテクノロジは、信号の振幅エンベロープとそのスペクトルのエンベロープの類似性(周波数と時間の二重性)、およびスペクトルを量子化する際の周波数の線形予測(LPC)の使用に基づいています。

スペクトルが白とは大きく異なる信号(トーンなど)の場合、時間領域で線形予測(LPC)を使用すると、スペクトルを効果的に「白く」し、分解してそのような信号をエンコードできることはよく知られています。それらを予測係数と比較的小さな振幅予測誤差(残差)に変換します。 デコード時に、線形予測フィルターは元の信号のスペクトルに従ってエラースペクトルを生成します。

AACエンコーダーでは、線形予測は反対の方法で使用されます。周波数領域でスペクトルサンプルを予測するためです。 元のMDCT係数と予測されたMDCT係数の差は、隠蔽しきい値に従って量子化されます(従来のエンコーダーでは、元のMDCT係数が量子化されます)。 線形予測係数も出力ファイルに書き込まれます。 信号をデコードする場合、周波数領域の差信号(量子化誤差を含む)に適用される線形予測フィルターは、時間領域の元の信号(および量子化誤差)の振幅エンベロープを生成します。 したがって、量子化誤差の振幅包絡線は、元の信号の振幅包絡線に近くなります(図2)。

TNSテクノロジーは、一部のパルス高調波信号(音声、一部の風および擦弦楽器)に対するプリエコーの影響と量子化エラーの可視性を低減します。 イチジクに 2は、同じビットレートのAACおよびMP3アルゴリズムによって音声信号に導入された量子化エラーを比較します。 (AACの効率が高いため)量子化誤差の一般的な減少とともに、元の信号の包絡線に従って、時間内の量子化誤差の振幅包絡線の形成が観察されます。

AAC規格では、TNSテクノロジーをスペクトルの個々の周波数帯域に個別に適用することも、完全にオフにすることもできます。

SBRテクノロジー-高音域の復元

広い周波数範囲の信頼性の高い伝送は、高品質のコーディングにとって重要な要件です。 ただし、オーディオ範囲の次のオクターブごとに送信すると、従来のオーディオエンコーダのビットレート要件が1.5倍から2倍に増加します。 ビットレートを下げると同時に、エンコードされた素材の高周波を維持するために、高周波SBR(スペクトルバンドレプリケーション)を人工的に合成する技術が開発されました。

この技術は、私たちの聴覚が中低周波数よりも低い精度で高周波数を分析するという事実に基づいています。 高周波の存在の効果を作成するには、波形を数学的に正確に再構築する必要はありませんが、高周波でいくつかの重要な音響心理学的信号パラメータを復元するだけで十分です。 これらの重要なパラメータには、信号エネルギーの時間-頻度分布(エンベロープ)とその調性/ノイズの程度が含まれます。

アルゴリズムのアイデアはこれです。 エンコードするとき、元のオーディオ信号の高周波の分析が実行され、それらのパラメータが抽出されます。まず、いくつかの(通常は8つの)周波数帯域の振幅エンベロープです。 さらに、高周波数はレコードから削除され、残りの低周波数と中周波数のみがエンコードされます。 この場合、失われた高周波のパラメータに関する比較的小さな情報のストリームも出力ファイルに追加されます。

再生中、低音域と中域が最初にデコードされます。 さらに(プレーヤーに存在する場合)、SBRデコーダーが動作を開始します。 最初のステップは、利用可能な中間周波数を転置(より正確には周波数シフト)することによって高周波信号を合成することです。 中周波数と高周波数でのスペクトルの調性/ノイズの程度はほぼ等しいので、このステップの結果として、もっともらしいスペクトル構造を持つ高周波数信号が得られます。 2番目のステップでは、SBRデコーダーは、高周波に関する追加の保存情報を使用して、各周波数帯域で目的の振幅エンベロープを提供します。 その結果、元の高周波数のサウンドを維持しながら、高周波数が中域から完全に合成された信号になります。

SBRテクノロジーは、多くの既存のオーディオコーディング方法に追加できます。 たとえば、MP3と組み合わせたSBRはMP3 PROと呼ばれ、AACと組み合わせたSBRはHE-AAC(高効率AAC)と呼ばれます。 基本的に、SBRは、64kbps以下の比較的低いビットレートでのエンコードに使用されます。 このテクノロジーにより、ビットレートの増加を最小限に抑えて(数kbps)、オーディオ信号の周波数範囲を大幅に拡大できます。

パラメトリックステレオテクノロジー

ステレオ信号の転送には、通常、モノラル信号の転送よりもエンコーダからのビットレートがほぼ2倍必要です。 同時に、ステレオチャンネルは独立しておよびM/S変換後にエンコードすることができます。 後者の場合、SチャネルはMチャネルよりも少ないビットレートを消費することがよくあります。 このエンコーディングモードは、ジョイントステレオとも呼ばれます。 AAC規格では、このモードは、周波数帯域ごとにエンコーダーによって個別にオンとオフを切り替えることができます。

非常に低いビットレート(16 ... 32 kbit / s)でのステレオ信号のより効率的なコーディングのために、パラメトリックステレオコーディング(パラメトリックステレオ)の技術が開発されました。 これは、エンコード前にステレオ信号がモノラルに変換されるという事実にありますが、元のステレオファイルのステレオパノラマに関する情報を含む小さなストリーム(2 ... 3 kbit / s)が出力ファイルに追加されます。 このストリームには、(圧縮された形式で)時間-周波数平面の一種の「パノラママップ」が含まれています。

デコード段階では、周波数に依存するパンニングが受信したモノラル信号に適用されます。 これは、左右のチャネルの最初に等しいMDCT係数に適切な振幅係数を適用することにより、デコードと同時に実行できます。

パラメトリックステレオテクノロジーは、モノラルエンコーディングと比較してビットレートがわずかに増加するだけで、元のステレオサウンドの良い印象を与えます。 ただし、ステレオチャンネル間の位相シフトなど、ステレオパノラマのニュアンスをすべて考慮することができないため、完全に透明なサウンドを実現することはできません。

パラメトリックステレオテクノロジーは、HE-AACv2規格に含まれています。

PNSテクノロジー-ノイズ生成

ノイズ信号のコーディングの効率をさらに高めるために、AAC規格は、ノイズ合成のためのPNS(知覚ノイズ置換)テクノロジーを提供します。 私たちの耳は、位相スペクトルよりも信号の振幅スペクトルに敏感であることが知られています。 したがって、ノイズドメインで元の信号のMDCT係数をエンコードする代わりに、ノイズパラメータ(周波数と時間の関数としてのパワー)のみを送信できます。

これがPNSテクノロジーの仕組みです。 コーディング中に、ノイズであるスペクトル領域が識別され、MDCT係数の対応するグループがコーディングプロセスから除外されます。 周波数帯域はノイズが多いとマークされ、総ノイズエネルギーが保存されます。

デコード中に、必要な総電力を持つ疑似ランダムMDCT係数が、ノイズとしてマークされた周波数帯域に置き換えられます。 その結果、指定された周波数範囲で、元のノイズに近い音のノイズが合成されます。

長期予測技術-時間予測

音響心理学的トーンコーディングでは、ノイズコーディングよりも高いローカル信号対ノイズ比が必要です(たとえば、それぞれ20dBと6dB)。 そして、これには、ビットレートを上げる必要があります。 ただし、MDCTトーン係数は時間の経過とともに予測可能です。 この状況では、時間依存性を利用してビットレートを下げることができます。

AAC標準は、線形予測を使用してMDCT係数が時間内に追加でコード化される長期予測モードを提供します。 「長期」という用語は、予測が隣接するサンプルによってではなく、特定の周波数で最も可能性の高いトーン周期によって間隔が空けられたサンプルによって実行されることを意味します。

MDCT係数の量子化と圧縮

MP3標準と同様に、AACはMDCT係数の非線形量子化とハフマン法によるそれらの圧縮を使用します。 MDCT係数は、0.75のべき乗後に量子化されます。これにより、各周波数帯域内の強い信号の量子化誤差を増やし、弱い信号の量子化誤差を減らすことができます。 したがって、ノイズスペクトルの追加の暗黙的な形成が実行されます。

量子化後、MDCT係数は一連の固定ハフマンテーブルを使用して圧縮されます。 AAC標準では、MP3よりもこれらのテーブルの数が多く、係数をグループ化する機会が多くなっています。 これにより、圧縮率がさらに向上します。

音質

オーディオエンコーダの音質を評価するときは、通常、主観的なテストが使用されます。 リスナーには、さまざまなエンコーダーによって圧縮された録音のフラグメントが提示され、各フラグメントのサウンドの純度を1〜5のスケールで評価します。最高のコーデックは、競合他社と比較してより高い音質を実現できるコーデックです。与えられたビットレート。

このようなテストの結果が示されているかなり信頼できるインターネットソースは、サイトhttp://www.rjamorim.com/test/です。さまざまなビットレートでのさまざまなコーデックのテストを示しています。 これらの結果は、一般的に他の情報源とよく一致しています。 品質の比較に役立つMP3およびAACエンコーダーの結果を次に示します。

最高のMP3エンコーダーは無料のLameです。 ただし、ほとんどのビットレートでは、品質が新しい圧縮標準より劣っています。 高ビットレート(128 kbps以上)では、このラグは小さく、OggVorbisエンコーダーがリーダーです。

64 kbpsでは、AACの利点はすでに顕著です。 HE-AACバリアントでは、アルゴリズムは3.68のスコアを獲得します。 これは、ビットレートが96 kbpsのLameにほぼ対応しており、MP3に対するAACの利点は約1.5倍であることを意味します。 128kbpsでのLameスコアは4.29です。

32 kbpsのビットレートで、NeroのAACエンコーダーは、MP3と比較して品質が大幅に向上しています。スコアはそれぞれ3.23と1.72です。 ただし、AACは、3.08のスコアを獲得したMP3PRO形式よりもわずかに進んでいます。 これは、SBRテクノロジが低ビットレートでの品質を大幅に向上させることを示しています。

結論

AAC標準に適用された新しいテクノロジーのおかげで、このフォーマットはMPEG-1 Layer 3(MP3)に比べて顕著な利点があり、同じビットレートでより良い音質を実現できます。 特に強いゲインは、低ビットレートの領域で観察されます:96kbps以下。 これは、デジタル放送用のAACフォーマットの可能性を裏付けています。

今日のインターネットでの音楽配信におけるAACの人気は、MP3形式と比較して低いままです。 ユーザーは、より強力なAAC圧縮よりもMP3の優れた移植性を引き続き好みます。 音楽配信サイトの音楽アーカイブの大部分は、すでにMP3形式でネイティブに作成されており、プロバイダーは非圧縮の録音にアクセスできません。 これは、そのような録音をAAC形式に再コード化することはあまり意味がないことを意味します-品質はすでに失われていることがよくあります。 ただし、新しいポケットプレーヤーと一部のオンラインストアはすでにAAC形式をサポートしており、多くの場合、コンテンツの合法性が検証されています(これにより、音楽のコピーに限定したくないユーザーも思いとどまります)。

非常に有望ですが、AAC形式だけが最高品質のオーディオ圧縮形式ではありません。 高ビットレート(128 kbps以上)では、AACはOggVorbisおよびMusepackエンコーダーよりも劣ることがよくあります。 最も低いビットレート(32 kbps未満)では、AACは、音声圧縮用の専用エンコーダーを含むパラメトリックオーディオエンコーダーより劣る可能性があります。 ただし、中低ビットレートの範囲では、AACは現在手のひらを保持しています。

アレクセイ・ルキン
雑誌「サウンドエンジニア」2008#1

広告

AACオーディオファイル形式

AACファイルはMP3ファイルを置き換えるために開発されました。 非可逆圧縮を使用すると、同じビットレートでより良いサウンドを得ることができます。 AACファイルは、MPEG-2およびMPEG-4ファイルファミリの一部としてISO / IECによって標準化されています(元々はMPEG-2 Part 7ファイルグループの一部でした)。 AACファイルには、より多くのサンプルレート(MP3と比較して)と最大48チャネルが含まれています。 より多くのフィルターセットを含む、大幅に改善されたコーディング効率。 過渡信号のコーディング精度が向上しました。 MP3ファイルと同様に、AACファイルは人間が聞くことができない周波数を遮断します。 これにより、ファイルサイズを小さくすることができます。 MP3と比較して、AACファイルははるかに小さいです。

AACファイルに関する技術情報

MPEG-2パート7ファイルは、複雑度の低いAAC-LC、メインタイプ(AACメイン)、および可変サンプリングレートのファイル(AAC-SSR)の3つのタイプのファイルで表されます。 AACファイルは、一時的なノイズシェーピング、不均一なサンプリング、およびビットストリームの再フォーマットを可能にします(単一のビットストリーム内の16のステレオチャネル、16のモノラルチャネル、16の低周波数チャネル、および16の注釈チャネルの場合)。 1999年に、MPEG-2パート7フォーマットがMPEG-4パート3フォーマットに組み込まれました。これにより、オーディオオブジェクトタイプの導入と一定のノイズ置換技術が可能になりました。 AAC形式は、現在ISO /IEC14496-3規格で説明されています。 オーディオマスキングは、非可逆圧縮で使用され、品質を維持しながら不要な情報を削除します。

AAC形式の詳細

ファイル拡張子 .aac
ファイルカテゴリ
サンプルファイル (1.2 MiB)
関連プログラム ウィンドウズメディアプレイヤー
iTunes
KMPlayer
リアルプレーヤー
VideoLANVLCメディアプレーヤー