Mpeg 2 itu up to date. MPEG2 dan MPEG4 - deskripsi format. Kombinasi Profil dan Level yang diizinkan

pada saat ini kebanyakan kabel dan satelit televisi menggunakan standar MPEG2 untuk mengirimkan sinyal mereka. Standar MPEG2 dikembangkan oleh Moving Pictures Experts Group dari International Organization for Standardization. MPEG2 telah diterbitkan sebagai standar internasional ISO/IEC 13818. Standar ini hanya menjelaskan prinsip umum kompresi, menyerahkan detailnya kepada produsen enkoder.

Algoritma kompresi didasarkan pada fitur persepsi manusia terhadap gambar. Misalnya, mata manusia merasakan gradasi kecerahan jauh lebih baik daripada warna; gradasi beberapa warna dianggap lebih baik, yang lain - lebih buruk.

Selain itu, paling sering latar belakang stasioner dan beberapa objek bergerak ditampilkan di layar. Oleh karena itu, cukup hanya mengirimkan informasi tentang bingkai dasar, dan kemudian mengirimkan bingkai yang berisi informasi tentang objek bergerak.

Prinsip lain yang digunakan dalam kompresi gambar dalam standar MPEG2 adalah membuang informasi yang tidak penting, mirip dengan prinsip yang digunakan dalam format grafik JPEG.

Tapi kembali ke topik pembicaraan kita yang sebenarnya. Perkembangan teknologi diatur oleh prinsip: lebih baik, lebih indah, lebih banyak dengan lebih sedikit dan dengan harga lebih rendah. Dalam kasus kami, gambar kualitas terbaik, dengan lebar saluran informasi yang lebih kecil (satelit, kabel, terestrial). Peningkatan codec video MPEG2 telah mengarah pada fakta bahwa sekarang untuk transmisi gambar diperlukan saluran dengan bandwidth 2 kali lebih sedikit daripada di awal era penyiaran digital. Seiring waktu, menjadi jelas bahwa perkembangan baru dapat secara signifikan mengurangi jumlah informasi yang dikirimkan, tetapi tidak sesuai dengan format MPEG2 yang ada. Oleh karena itu, para spesialis menghadapi tugas mengembangkan yang lebih universal dan tepat teknologi modern standar.

Untuk televisi satelit digital menggunakan MPEG2, dengan resolusi 720 x 576 piksel kecepatan maksimum aliran informasi adalah 15 Mbps, dan laju aliran yang digunakan secara praktis adalah 3-4 Mbps. Pada satu transponder (penerima - pemancar) di satelit, 8-12 saluran biasanya cocok.

Karena HDTV mengasumsikan resolusi 1920 x 1080 piksel, mis. Karena area layar 5 kali lebih besar dari TV konvensional, maka perlu menyewa setengah dari transponder untuk menyiarkan satu saluran HDTV dalam standar MPEG2.

Langkah baru dalam pengembangan algoritma kompresi gambar adalah standar MPEG4. Ide standar MPEG4 bukanlah untuk menstandarisasi satu produk, tetapi untuk menggabungkan beberapa sub-standar dari mana vendor dapat memilih salah satu yang paling sesuai dengan kebutuhan mereka.


Substandar yang paling penting adalah:

  • ISO 14496-1 (Sistem), format wadah MP4, animasi/interaktivitas (mis. menu DVD)
  • ISO 14496-2 (Video #1), Profil Sederhana Lanjutan (ASP)
  • ISO 14496-3 (Audio), Pengodean Audio Tingkat Lanjut (AAC)
  • ISO 14496-10 (Video #2), Pengodean Video Tingkat Lanjut (AVC), juga dikenal sebagai H.264.

Saya tidak akan mencantumkan fitur teknologi dan algoritme yang digunakan dalam pengembangan format MPEG4.
Mari beralih ke yang paling penting: penggunaan gabungan DVB-S2 (standar transmisi data digital lanjutan) dan H.264 memungkinkan Anda menempatkan 6-8 saluran di transponder, tetapi sudah televisi HDTV. Perlu dicatat bahwa, seperti biasa, peningkatan kualitas tidak gratis: jumlah perhitungan telah meningkat secara signifikan baik pada penerima maupun pada peralatan transmisi. Sayangnya, ini sangat mempengaruhi biaya peralatan untuk konsumen dan penyiar.

Standar kompresi MPEG dikembangkan oleh Moving Picture Experts Group (MPEG). MPEG adalah standar untuk mengompresi file audio dan video ke dalam format yang lebih nyaman untuk diunduh atau dikirim, misalnya, melalui Internet, suatu format.

Ada standar MPEG yang berbeda (seperti yang kadang-kadang disebut fase): MPEG-1, MPEG-2, MPEG-3, MPEG-4, MPEG-7.

MPEG terdiri dari tiga bagian: Audio, Video, Sistem (menggabungkan dan menyinkronkan dua lainnya).

MPEG-1

Di bawah standar MPEG-1, aliran data video dan audio ditransmisikan pada 150 kilobyte per detik -- kecepatan yang sama dengan pemutar CD-ROM kecepatan tunggal -- dan dikendalikan dengan pengambilan sampel video kunci frame dan hanya mengisi area yang berubah antar frame. Sayangnya, MPEG-1 memberikan kualitas video yang lebih rendah daripada video standar TV.

MPEG-1 telah dirancang dan dioptimalkan untuk berjalan pada 352 ppl (titik per baris) * 240 (baris per bingkai) * 30 fps (bingkai per detik), yang sesuai dengan kecepatan bit audio CD Kualitas tinggi. digunakan skema warna- YCbCr (di mana Y adalah bidang pencahayaan, Cb dan Cr adalah bidang warna).

Cara kerja MPEG:

Tergantung pada beberapa alasan, setiap frame (frame) dalam MPEG dapat berbentuk sebagai berikut:

  • Bingkai I (Intra) - dikodekan sebagai gambar biasa.
  • Frame P (Predicted) - informasi dari frame I atau P sebelumnya digunakan untuk encoding.
  • B (Bidirectional) frame - saat encoding, informasi dari satu atau dua frame I atau P digunakan

Urutan bingkai mungkin terlihat seperti ini: IBBBPBBBPBBPBBIBBPBBPB...

Urutan penguraian kode: 0312645...

Perlu dicatat bahwa sebelum decoding B bingkai diperlukan untuk memecahkan kode dua Saya atau P bingkai. Ada standar berbeda untuk frekuensi yang harus diikuti. Saya frame, sekitar 1-2 per detik, ada standar yang sesuai untuk P frame (setiap 3 frame harus P bingkai). Ada resolusi relatif yang berbeda dari bidang Y, Cb, Cr (Tabel 1), biasanya Cb dan Cr dikodekan dengan resolusi yang lebih rendah dari Y.

Tabel 1

Untuk menerapkan algoritma pengkodean, bingkai dibagi menjadi blok makro, yang masing-masing terdiri dari sejumlah blok (ukuran blok - 8*8 piksel). Jumlah blok dalam makroblok di pesawat yang berbeda berbeda dan tergantung pada format yang digunakan.

Teknik pengkodean:

Untuk lebih banyak kompresi di B dan P frame, algoritma prediksi gerakan digunakan (yang dapat sangat mengurangi ukuran P dan B frame -- Tabel 2) yang outputnya adalah:

  • Vektor perpindahan (motion vector) balok yang akan diprediksi relatif terhadap balok dasar.
  • Perbedaan antara blok (yang kemudian dikodekan).

Karena tidak setiap blok dapat diprediksi berdasarkan informasi tentang blok sebelumnya, maka dalam P dan B bingkai mungkin Saya blok (blok tanpa prediksi gerak).

Meja 2

Metode pengkodean blok (atau perbedaan yang diperoleh dengan metode prediksi gerakan) berisi:

  • Transformasi Kosinus Diskrit (DCT - Transformasi Kosinus Diskrit).
  • Kuantisasi (konversi data dari kontinu ke bentuk diskrit).
  • Pengkodean blok yang diterima menjadi suatu urutan.

DCT menggunakan fakta bahwa piksel dalam blok dan blok itu sendiri saling berhubungan (yaitu, berkorelasi), sehingga dipecah menjadi komponen Fourier frekuensi (sebagai hasilnya, matriks kuantisasi diperoleh - matriks transformasi data dari kontinu ke bentuk diskrit, angka-angka yang merupakan nilai amplitudo dari frekuensi yang sesuai), maka algoritma Kuantisasi membagi koefisien frekuensi menjadi sejumlah nilai tertentu. Encoder memilih matriks kuantisasi yang menentukan bagaimana setiap koefisien frekuensi di blok akan dibagi (manusia lebih sensitif terhadap resolusi pemisahan untuk frekuensi rendah daripada yang besar). Karena dalam proses kuantisasi banyak koefisien yang menjadi nol, maka digunakan algoritma zigzag untuk mendapatkan barisan nol yang panjang.

Audio dalam MPEG:

Format encoding audio dibagi menjadi tiga bagian: Layer I, Layer II, Layer III (prototipe untuk Layer I dan Layer II adalah standar MUSICAM, nama ini sekarang kadang-kadang disebut Layer II). Layer III mencapai kompresi tertinggi, tetapi, karenanya, membutuhkan lebih banyak sumber daya untuk pengkodean. Prinsip pengkodean didasarkan pada kenyataan bahwa telinga manusia tidak sempurna dan pada kenyataannya banyak informasi yang berlebihan ditransmisikan dalam audio yang tidak terkompresi (CD-audio). Prinsip kompresi bekerja pada efek menutupi beberapa suara untuk seseorang (misalnya, jika ada suara yang kuat pada frekuensi 1000 Hz, maka suara yang lebih lemah pada frekuensi 1100 Hz tidak akan terdengar lagi oleh seseorang. , sensitivitas telinga manusia juga akan melemah untuk jangka waktu 100 ms setelah dan 5 ms sampai suara yang kuat terjadi). Model psycoacustic (psychoacoustic) yang digunakan dalam MPEG memecah seluruh spektrum frekuensi menjadi bagian-bagian di mana tingkat suara dianggap sama, dan kemudian menghilangkan suara yang tidak terlihat oleh manusia, berkat efek yang dijelaskan di atas.

Pada Layer III, bagian dari spektrum split adalah yang terkecil, yang memberikan kompresi terbaik. MPEG Audio mendukung kompatibilitas Layer dari bawah ke atas, yaitu decoder untuk Layer II juga akan mengenali Layer I.

Sinkronisasi dan penggabungan audio dan video dilakukan dengan menggunakan System Stream, yang meliputi:

  • Lapisan sistem yang berisi waktu dan informasi lain untuk memisahkan dan menyinkronkan video dan audio.
  • Lapisan kompresi yang berisi aliran video dan audio.

Aliran video berisi judul, kemudian beberapa grup gambar (judul dan beberapa gambar diperlukan untuk memberikan akses acak ke gambar dalam grup, terlepas dari urutannya).

Sebuah audio stream terdiri dari paket-paket yang masing-masing terdiri dari header dan beberapa frame audio (audio-frame).

Untuk menyinkronkan aliran audio dan video, pengatur waktu dibangun ke dalam aliran sistem, beroperasi pada frekuensi 90 kHz (Referensi Jam Sistem - SCR, tanda di mana penghitung waktu dalam dekoder meningkat) dan Stempel Data Presentasi (PDS, label pemutaran dimasukkan ke dalam gambar atau ke dalam bingkai audio untuk memberi tahu dekoder kapan harus memutarnya. Ukuran PDS adalah 33 bit, memungkinkan setiap kerangka waktu hingga 24 jam untuk diwakili).

Parameter MPEG-1 (Disetujui pada tahun 1992)

Opsi audio: 48, 44,1, 32 kHz, mono, ganda (dua saluran mono), stereo, stereo intens (sinyal dengan frekuensi di atas 2000 Hz digabungkan.), stereo m/s (satu saluran membawa jumlah - perbedaan lainnya). Kompresi dan bit rate audio untuk satu saluran, untuk frekuensi 32 kHz disajikan pada Tabel 3.

Tabel 3

Opsi Video: pada prinsipnya, menggunakan MPEG-1, Anda dapat mengirimkan resolusi hingga 4095x4095x60 fps (dalam batas ini, bingkai dapat berukuran sewenang-wenang), tetapi karena ada Bitstream Parameter Terkendala (CPB, parameter aliran data yang tidak dapat diubah; standar lain untuk MPEG -1 jauh dari yang didukung semua dekoder) yang membatasi jumlah total macroblocks dalam gambar (396 untuk kecepatan<= 25 fps и 330 для скорости <= 30 fps) то MPEG-1 кодируется стандартом SIF /352*240*30 - (получено урезанием стандарта CCIR-601) или 352*288*25 - (урезанный PAL, SECAM) формат 4:2:0, 1.15 MBPS (мегабит в сек.), 8 bpp (бит на точку) - в каждой плоскости/.

Ada resolusi yang lebih tinggi untuk MPEG-1 - yang disebut MPEG-1 Plus, resolusi yang sama dengan MPEG-2 [dilindungi email](Level Utama, Profil Utama) - Standar ini sering digunakan di Set-Top-Box untuk meningkatkan kualitas.

MPEG2 - tingkatkan untuk MPEG1

Kompresi MPEG-2 mengubah banyak hal secara dramatis. Lebih dari 97% data digital yang mewakili sinyal video diduplikasi, mis. berlebihan dan dapat dikompresi tanpa mengurangi kualitas gambar. Algoritma MPEG-2 menganalisis gambar video untuk mencari pengulangan, yang disebut redundansi. Sebagai hasil dari proses penghapusan redundansi, video MPEG-2 yang sangat baik disediakan pada bit rate yang lebih rendah. Untuk alasan ini, sistem pengiriman perangkat lunak video modern seperti sistem satelit digital dan DVD menggunakan standar MPEG-2.

Perubahan dalam Audio:

  • Ada jenis baru frekuensi 16, 22,05, 24 kHz.
  • Dukungan multi-saluran - kemampuan untuk memiliki 5 saluran lengkap (kiri, tengah, kanan, surround kiri, surround kanan) + 1 frekuensi rendah (subwoofer).
  • Standar AAC (Pengkodean Audio Lanjutan - pengkodean audio progresif) telah muncul - memberikan suara berkualitas sangat tinggi dengan kecepatan 64 kbps per saluran (kilobit per detik per saluran), dimungkinkan untuk menggunakan 48 saluran utama, 16 saluran frekuensi rendah untuk efek suara, 16 saluran multi-bahasa dan 16 saluran data. Hingga 16 program dapat dideskripsikan menggunakan sejumlah audio dan item data lainnya. Untuk AAC, ada tiga jenis profil - Utama (digunakan saat tidak ada memori tambahan), Kompleksitas Rendah (LC), Tingkat Sampling Scalable (SSR, diperlukan dekoder dengan kecepatan data variabel).

Dekoder harus:

  1. "kompatibel ke depan" (kompatibel ke depan) - Decoder Audio MPEG-2 memahami semua saluran audio MPEG-1.
  2. "kompatibel ke belakang" (kompatibel ke belakang) - Dekoder Audio MPEG-1 harus memahami inti Audio MPEG-2 (saluran-L, saluran-R)
  3. "matriks" (dapat dimatrikskan) - Dekoder Audio MPEG1 harus memahami MPEG-2 5-saluran (L = sinyal kiri + a * sinyal tengah + b * sinyal surround kiri, R = sinyal kanan + a * sinyal tengah + b * sinyal surround kanan)
  4. MPEG-1 Dekoder audio tidak diperlukan untuk memahami MPEG-2 AAC.

Hasilnya, Anda dapat dengan aman menggunakan MPEG-1 Vidio + MPEG-2 Audio atau sebaliknya MPEG-2 Audio + MPEG-1 Video.

Perubahan Video:

  • Diperlukan resolusi vertikal dan horizontal kelipatan 16 dalam standar frame-encoder (frame-by-frame encoding), dan 32 vertikal dalam standar field-encoder (field-encoder, setiap field terdiri dari dua frame) (video interlace).
  • Kemungkinan format 4:4:4, 4:2:2 (Profil berikutnya).
  • Konsep Profil (bentuk, profil) dan Level (level) diperkenalkan.
  • ukuran bingkai hingga 16383*16383.
  • Kemampuan untuk mengkodekan video interlaced.
  • Kehadiran mode penskalaan (Mode Scalable)
  • Pan&Scanning vector (vektor pan dan zoom) yang memberitahu dekoder bagaimana mengkonversi misalnya 16:9 ke 4:3.

Perubahan yang terkait dengan algoritme penyandian:

  • Keakuratan koefisien frekuensi dapat dipilih pengguna (8, 9, 10, 11 bit per nilai -- MPEG-1 hanya memiliki 8 bit).
  • Proses kuantisasi nonlinier (membagi data kontinu menjadi data diskrit).
  • Kemungkinan untuk memuat matriks kuantisasi sebelum setiap frame.
  • Mode prediksi gerakan baru (16x8 MC, MC lapangan, Dual Prime)

Mode yang Dapat Diskalakan (hanya tersedia di Profil Berikutnya dan Utama+) membagi MPEG-2 menjadi tiga lapisan (dasar, tengah, tinggi) untuk mengatur tingkat prioritas dalam data video (misalnya, saluran dengan prioritas lebih tinggi dikodekan dengan lebih banyak koreksi kesalahan informasi dari kurang):

  1. Skalabilitas spasial (penskalaan spasial) - lapisan utama dikodekan dengan resolusi yang lebih rendah dan kemudian digunakan sebagai prediksi untuk prioritas yang lebih tinggi.
  2. Partisi Data (pemisahan data) - membagi blok 64 koefisien kuantisasi menjadi dua aliran, di mana prioritas yang lebih tinggi mentransfer yang berfrekuensi rendah (yang paling penting untuk kualitas), dan yang berprioritas lebih rendah (yang berfrekuensi tinggi).
  3. SNR (Signal to Noise Ratio) Skalabilitas (signal to noise ratio scaling) - saluran dikodekan pada tingkat yang sama, tetapi dengan kualitas yang berbeda (lapisan prioritas lebih rendah berisi gambar yang buruk - langkah yang lebih terpisah, dan lapisan prioritas tinggi berisi makeweight yang memungkinkan Anda membuat gambar berkualitas tinggi)
  4. Skalabilitas Temporal (skalabilitas temporal) - lapisan prioritas lebih rendah berisi saluran dengan kecepatan bingkai rendah, dan lapisan prioritas tinggi berisi informasi yang memungkinkan Anda memulihkan bingkai perantara menggunakan yang berprioritas lebih rendah untuk prediksi.

Tabel 4, Level

Tingkat Resolusi Maksimum kecepatan maksimum Catatan
Rendah 352*240*30 4 Mbps CIF, kaset
Utama 720*480*30 15 Mbps CCIR 601, studio TV
Tinggi 1440 1440*1152*30 60 Mbps 4x601, HDTV konsumen
tinggi 1920*1080*30 80 Mbps Produk SMPTE 240M std

Tabel 5, Profil

Tabel 6, Kombinasi Profil dan Level yang Diizinkan

Lapisan sistem MPEG-2 menyediakan dua tingkat agregasi data:

  1. Packetized Elementary Stream (PES) - memecah audio dan video menjadi beberapa paket.
  2. Tingkat kedua dibagi menjadi:
    • Aliran Program MPEG-2 (kompatibel dengan Sistem MPEG-1) - untuk transmisi lokal di lingkungan kesalahan rendah
    • MPEG-2 Transport Stream - penyiaran eksternal di lingkungan dengan tingkat kesalahan yang tinggi - mentransmisikan paket transport (panjang 188 atau 188 + 16 bit) dari dua jenis (data terkompresi - PES - dan tabel sinyal Informasi Spesifik Program - PSI).

MPEG-3 adalah format yang tidak perlu

Ini dikembangkan untuk aplikasi HDTV dengan parameter - resolusi maksimum (1920*1080*30), kecepatan 20 - 40 Mbps. Karena tidak memberikan perbaikan mendasar dibandingkan dengan MPEG-2 (dan selain itu, MPEG-2 telah digunakan secara luas di berbagai versi, termasuk untuk HDTV), ia telah berhasil dipadamkan.

MPEG-4 adalah format yang sangat kuat

MPEG-4 adalah standar kecepatan bit rendah (64 kbps) yang masih dalam pengembangan. Versi pertama dijadwalkan selesai pada tahun 1999.

Deskripsi Singkat:

  • Membagi gambar menjadi elemen yang berbeda yang disebut objek media.
  • Menjelaskan struktur objek-objek ini dan hubungannya untuk kemudian merakitnya menjadi panggung suara video.
  • Memungkinkan Anda mengubah adegan, yang menyediakan interaktivitas tingkat tinggi bagi pengguna akhir.

Tahap suara video terdiri dari objek media yang digabungkan menjadi struktur hierarkis:

  • Gambar diam (misalnya latar belakang)
  • Objek video (orang yang berbicara).
  • Objek audio (suara yang terkait dengan orang ini).
  • Teks yang terkait dengan adegan ini.
  • Objek sintetis - objek yang awalnya tidak ada dalam adegan yang direkam, tetapi ditambahkan di sana saat ditampilkan kepada pengguna akhir (misalnya, kepala bicara disintesis).
  • Teks yang terkait dengan kepala dari mana suara disintesis di akhir.

Cara penyajian data ini memungkinkan:

  • Pindahkan dan tempatkan objek media di mana saja di tempat kejadian.
  • Mengubah objek, mengubah dimensi geometris.
  • Merakit objek komposit dari objek terpisah dan melakukan beberapa operasi di atasnya.
  • Mengubah tekstur objek (misalnya, warna), memanipulasi objek (membuat kotak bergerak di sekitar adegan)
  • Mengubah sudut pandang adegan.

MPEG-J

MPEG-J adalah ekstensi MPEG-4 standar yang menggunakan elemen Java.

MPEG-7

MPEG-7- bukan merupakan kelanjutan dari MPEG semata - merupakan pengembangan yang relatif baru, direncanakan akan selesai pada tahun 2001

Dan pencarian cepat. MPEG-7 secara resmi disebut "Antarmuka Deskripsi Konten Multimedia". MPEG-7 mendefinisikan satu set deskriptor standar untuk berbagai jenis informasi multimedia, dan juga menstandarisasi cara mendefinisikan deskriptor dan hubungannya (skema deskripsi). Untuk tujuan ini, MPEG-7 memperkenalkan DDL (Description Definition Language - definition description language). Tujuan utama penggunaan MPEG-7 adalah untuk mencari informasi multimedia (seperti sekarang kita dapat menemukan teks dalam sebuah kalimat), misalnya:

  • Musik. Dengan memainkan beberapa not di keyboard, Anda bisa mendapatkan daftar potongan musik yang berisi urutan seperti itu.
  • seni grafis. Dengan menggambar beberapa garis di layar, kita mendapatkan satu set gambar yang berisi fragmen ini.
  • Lukisan. Setelah mendefinisikan objek (mengatur bentuk dan teksturnya), kita mendapatkan daftar gambar yang memuatnya.
  • Video. Dengan mengatur objek dan gerakannya, kita mendapatkan satu set video atau animasi.
  • Suara. Dengan mengatur penggalan suara penyanyi, kita mendapatkan satu set lagu dan klip video tempat dia bernyanyi.

MHEG

MHEG- (Multimedia & Hypermedia Expert Group - grup pakar multimedia dan hypermedia) - mendefinisikan standar untuk pertukaran objek multimedia (video, suara, teks, dan data arbitrer lainnya) antara aplikasi dan mentransmisikannya dengan cara yang berbeda (jaringan area lokal, jaringan telekomunikasi dan penyiaran) menggunakan kelas objek MHEG. Hal ini memungkinkan objek program untuk memasukkan sistem pengkodean (misalnya MPEG) yang didefinisikan dalam aplikasi dasar. MHEG telah diadopsi oleh DAVIC (Digital Audio-Visual Council). Objek MHEG dibuat oleh aplikasi multimedia menggunakan bahasa skrip multimedia.

MHEG dikatakan sebagai standar internasional masa depan untuk TV interaktif, karena berjalan di semua platform dan dokumentasinya didistribusikan secara bebas.

Dalam waktu singkat, singkatan MPEG telah menjadi begitu akrab bagi kita sehingga tidak ada alasan untuk bertanya-tanya bagaimana cara kerjanya.

Anastasia Bliznetsova

Konversi analog ke digital


Jenis prediksi perpindahan gambar dalam bingkai


Transformasi Kosinus Diskrit

MPEG-2 adalah standar untuk pengkodean sinyal siaran televisi digital, jadi mari kita mulai dengan sejarah video digital. Anehnya, itu tidak terkait dengan komputer sama sekali, seperti yang terlihat sekarang, tetapi dengan siaran televisi, karena kekurangan sinyal analog terutama mempengaruhi pemirsa televisi. Ada dua masalah utama - ini adalah penurunan kualitas yang cepat dengan setiap perekaman ulang baru (menakutkan untuk mengingat apa itu "salinan kelima" pada VHS) dan gangguan besar dalam transmisi sinyal, yang sangat sulit untuk ditangani. Yang pertama mempengaruhi kualitas program, yang kedua mempengaruhi kualitas gambar untuk pemirsa. Cara menghilangkan kekurangan ini sudah dikenal sejak tahun 50-an - ini adalah konversi sinyal ke dalam bentuk digital. Namun, kemungkinan teknis untuk mendigitalkan video secara real time baru muncul sekitar seperempat abad yang lalu, dan pada tahun 1979 European Broadcasting Union (EBU) dan Society of Motion Picture and Television Engineers (SMPTE) bersama-sama menyusun standar internasional untuk digital. pengkodean sinyal televisi berwarna, dan pada tahun 1982 standar diadopsi. MPEG-2 didasarkan pada standar ITU-R BT.601 ini.

Bagaimana video digital diterima?

Diketahui bahwa salah satu dari jutaan warna yang membedakan seseorang dapat direpresentasikan sebagai kombinasi dari tiga warna referensi: merah (Merah), hijau (Hijau) dan biru (Biru) - inilah yang disebut model warna RGB. Dengan menggunakan model ini, sinyal analog berwarna (misalnya, gambar yang "melihat" lensa kamera video analog) dapat diuraikan menjadi komponen RGB.

Namun, dekomposisi seperti itu tidak cocok untuk televisi: ketika beralih ke siaran berwarna, program berwarna harus dilihat di TV hitam-putih, dan ini tidak mungkin jika sinyal terdiri dari komponen RGB. Solusinya adalah mengubah sinyal RGB menjadi sinyal pencahayaan Y dan dua sinyal perbedaan warna U dan V - dalam hal ini, informasi warna (U dan V) ditransmisikan secara terpisah dari informasi pencahayaan Y, dan hanya di televisi hitam putih sinyal luminance digunakan, dan dalam warna - kecerahan bersama dengan warna. Pada saat yang sama, dimungkinkan untuk memasukkan sinyal televisi berwarna ke dalam bandwidth standar: karena fakta bahwa mata manusia kurang sensitif terhadap perubahan warna spasial daripada perubahan kecerahan, informasi warna dapat "dipotong" tanpa mengorbankan persepsi. .

Kedua dekomposisi sama-sama cocok untuk pengkodean digital.

Jadi, untuk membentuk sinyal digital, perlu dilakukan operasi berikut pada setiap komponen sinyal analog (R, G, B atau Y, U, V): pengambilan sampel, kuantisasi, dan penyandian.

Diskritisasi adalah representasi sinyal analog kontinu dengan urutan nilai amplitudonya (disebut sampel). Frekuensi di mana nilai diambil sampelnya disebut sample rate. Diagram di sebelah kanan menunjukkan sinyal sampel analog dan 1/T. Jelas, semakin tinggi laju sampling, semakin akurat sinyal analog akan direproduksi. Untuk mendapatkan gambar berkualitas tinggi, frekuensi sampling harus minimal 12 MHz (yaitu 12 Msample per detik). Dalam standar pengkodean digital, dipilih menjadi 13,5 MHz.

Kuantisasi - pembulatan nilai sampel. Karena mata manusia memiliki resolusi yang terbatas, maka tidak perlu mentransmisikan semua nilai bacaan secara akurat. Itu diciptakan untuk menggantikan nilai referensi dengan nilai terdekat dari serangkaian nilai tetap tertentu, yang disebut level kuantisasi, yaitu, untuk membulatkan ke level terdekat. Diagram di sebelah kanan menunjukkan sinyal terkuantisasi. Untuk membuat sinyal dengan kualitas yang diinginkan, 256 level kuantisasi sudah cukup.

Dan akhirnya, pengkodean. Karena sinyal terkuantisasi hanya dapat mengambil sejumlah nilai yang terbatas (sesuai dengan set level kuantisasi), maka untuk setiap sampel dapat diwakili hanya dengan angka yang sama dengan nomor urut aktual dari level kuantisasi. Angka ini dapat dikodekan dengan karakter biner (misalnya, nol dan satu). Untuk mengkodekan 256 level kuantisasi, diperlukan setidaknya delapan bit (28 = 256), yaitu, nilai setiap sampel ditransmisikan dalam delapan bit.

Akibatnya, setelah pengambilan sampel, kuantisasi, dan pengkodean, kami menerima dari sinyal analog satu set pulsa yang hanya mengambil dua nilai - 0 dan 1, yang sudah dapat ditransmisikan sebagai data biasa. Ini disebut konversi analog-ke-digital, atau ADC.

Sangat mudah untuk menghitung laju bit yang diperlukan saat mentransmisikan sinyal yang kami digitalkan: kalikan delapan bit dengan jumlah sampel yang ditransmisikan per detik (ingat bahwa kami memiliki tiga komponen): 8 [bit] x 13,5 [MHz] x 3 = 324 Mb / s !!! Bekerja dengan aliran seperti itu adalah kesenangan yang sangat mahal dan hampir tidak dapat diakses (sebagai perbandingan: modem standar mentransmisikan pada kecepatan rata-rata 33,2 kb / s, yaitu sepuluh ribu kali lebih lambat).

Inilah saatnya untuk mengingat bahwa, seperti di televisi analog, saat mendigitalkan Y, U, dan V, Anda dapat dengan mudah menghapus sebagian informasi warna, yaitu, mengurangi laju pengambilan sampel sinyal perbedaan warna beberapa kali. Oleh karena itu, pengkodean YUV (disebut split) lebih menguntungkan daripada RGB dalam hal kecepatan bit. Dengan pengkodean terpisah, biasanya menunjukkan rasio frekuensi sampling komponen. Misalnya, 4:2:2 berarti bahwa Y ditransmisikan dalam setiap sampel di setiap saluran, dan U dan V ditransmisikan dalam setiap sampel kedua di setiap saluran (yaitu, Y disampel pada 13,5 MHz dan U dan V dua kali lebih sedikit - 6,75MHz).

Kompresi

Namun, hasil pengkodean dalam kaitannya dengan ukuran aliran digital masih tidak cocok untuk siapa pun. Siaran televisi membutuhkan setidaknya 4:2:2 pengkodean terpisah - yaitu 216 Mbps. Bahkan jika kita tidak berbicara tentang transfer data, hanya menulis aliran seperti itu ke kaset atau hard drive tampaknya menjadi masalah.

Hanya ada satu jalan keluar: kompresi aliran video digital. Untungnya, sinyal video digital secara inheren berlebihan dan karenanya cocok untuk kompresi sebaik mungkin: dimungkinkan untuk mengompresi video bahkan 30 kali tanpa kehilangan persepsi! Redundansi sinyal video, pertama, disebabkan oleh fakta bahwa mata manusia tidak melihat perubahan kecerahan dan warna di area kecil, yaitu detail kecil. Redundansi ini disebut spasial dan dihilangkan dengan pengkodean intra-frame - mengurangi informasi dalam satu frame.

Kedua, biasanya dalam beberapa detik, frame yang berurutan sedikit berbeda satu sama lain - inilah yang disebut redundansi temporal. Tidak perlu mentransmisikan semua frame secara penuh, untuk beberapa frame cukup mengirimkan hanya perbedaan dari frame sebelumnya atau berikutnya. Redundansi temporal dihilangkan dengan pengkodean antar-bingkai, yang mengurangi informasi tentang kelompok bingkai tertentu secara keseluruhan.

Saya harus mengatakan bahwa sejak awal bekerja dengan video digital, berbagai format kompresi telah dibuat: dari Cinepak dan Intel Indeo hingga H.263, MJPEG, dan DV. Beberapa dari mereka hanya menghapus redundansi spasial (seperti DV atau MJPEG), tetapi beberapa algoritma (misalnya, Intel Indeo) juga menggunakan perbedaan interframe.

Hidup dengan begitu banyak standar yang tidak kompatibel ternyata terlalu sulit, jadi pada tahun 1988 kelompok ahli khusus telah dibuat - Kelompok Ahli Gambar Bergerak (MPEG), yang seharusnya mengembangkan metode untuk mengompresi dan merekonstruksi sinyal video digital. Kelompok ini mulai mengerjakan standar MPEG2 pada tahun 1990. Standar ini dimaksudkan khusus untuk televisi digital, yaitu untuk transmisi gambar televisi berkualitas tinggi, dan telah diadopsi pada tahun 1994. Saat ini standar MPEG yang paling umum dan paling serbaguna dari semua standar.

Bagaimana MPEG-2 dikompresi

Pertama, di setiap bingkai, elemen gambar berukuran 16 x 16 piksel dipilih secara berurutan - inilah yang disebut makroblok.

MPEG mengkodekan YUV, sehingga setiap blok makro direpresentasikan sebagai sekumpulan blok berukuran 8 x 8 piksel - setiap blok membawa informasi tentang kecerahan atau warna. Misalnya, format chrominance 4:2:2 akan membutuhkan empat 8 x 8 blok informasi luminansi dan dua 8 x 8 blok informasi tentang setiap komponen perbedaan warna, dengan total delapan blok. Setiap elemen dalam kecerahan atau blok warna mewakili nilai sampel. Di masa depan, MPEG-2 sudah bekerja dengan macroblocks.

Ada tiga jenis frame dalam MPEG-2. I-frame (Intra) adalah referensi frame di mana setiap macroblock dikodekan tanpa referensi ke macroblock di frame sebelumnya atau berikutnya. Pada dasarnya, I-frame dikodekan sebagai gambar diam.

Pframes (Predicted) - frame di mana macroblocks dikodekan relatif terhadap I atau P-frame sebelumnya (walaupun tidak semua macroblocks dapat dikodekan dengan cara ini, lebih lanjut di bawah). Gambar dalam bingkai diprediksi menggunakan informasi dari bingkai sebelumnya - yang disebut prediksi "maju". Oleh karena itu, bingkai-P sebagian hanya berisi referensi ke blok makro di bingkai sebelumnya, dan dengan demikian lebih terkompresi daripada bingkai-I.

B-frame (Diprediksi Dua Arah) - frame di mana macroblocks dikodekan relatif terhadap baik sebelumnya atau berikutnya, atau keduanya I atau P-frame. Prediksi dua arah (maju dan mundur) diterapkan di sini: gambar dalam bingkai diprediksi menggunakan informasi dari bingkai sebelumnya dan dari bingkai berikutnya. Artinya, pembacaan frame oleh decoder harus terjadi lebih cepat daripada pemulihannya.

Jika ternyata makroblok dalam bingkai-P atau bingkai-B tidak dapat dikodekan dengan mengacu pada bingkai lain (misalnya, jika objek baru telah muncul dalam bingkai), maka blok makro tersebut dikodekan sebagai blok makro dalam I-frame.

Bingkai digabungkan dalam urutan (Group Of Pictures, GOP), dan prediksi selalu dilakukan hanya dalam satu grup. Jelas bahwa di bawah kondisi ini, setiap kelompok harus mulai dengan bingkai-I yang membawa informasi paling lengkap tentang gambar, karena bingkai-I adalah titik referensi relatif terhadap bingkai-bingkai yang tersisa dikodekan. Alangkah baiknya jika I-frame selalu berada di awal cerita, tapi sayangnya semua cerita memiliki durasi yang berbeda.

MPEG-2 mendefinisikan tipe urutan standar, seperti IPBBPBBPBBPBBPBB. Jika plot hampir tidak berubah dari bingkai ke bingkai, maka Anda dapat menyandikan dengan sejumlah besar bingkai-B, dan jika diperlukan kualitas yang sangat tinggi, sebaliknya, gunakan grup yang hanya terdiri dari satu bingkai-I. Pada prinsipnya, dimungkinkan untuk mengoptimalkan pilihan jenis bingkai - misalnya, ketika kesalahan prediksi besar muncul di bingkai-B, tambahkan bingkai-I ke urutannya.

Katakanlah segera bahwa kata "prediksi" agak membingungkan - ini adalah istilah, meskipun mapan, tetapi tidak terlalu benar. Kami tidak memprediksi apa pun, kami benar-benar menentukan dengan tepat apa yang harus ada dalam bingkai. Untuk melakukan ini, kesalahan prediksi dihitung - perbedaan antara gambar yang diambil dari bingkai lain dan gambar dalam bingkai saat ini, dan perbedaan ini digunakan dalam decoding.

Kompensasi gerak dipahami sebagai memperhitungkan perpindahan gambar relatif terhadap bingkai sebelumnya atau berikutnya. Kompensasi gerak dalam bingkai P dan B diimplementasikan sebagai berikut: untuk setiap blok makro yang ditemukan di bingkai sebelumnya/berikutnya, vektor gerakan dihitung, yaitu, ditentukan berapa perpindahan relatif dari blok makro yang sesuai. Jadi, dalam prediksi kompensasi gerak, tidak hanya kesalahan prediksi tetapi juga vektor gerak ditransmisikan ke dekoder.

Sekarang kita sampai pada pengkodean intraframe. Kita perlu mengompresi informasi dalam blok makro yang tidak merujuk ke apa pun. Ini dilakukan dengan menggunakan transformasi kosinus diskrit (DCT), yang didasarkan pada transformasi Fourier. DCT sama sekali bukan hak prerogatif MPEG, DCT digunakan untuk pengkodean intraframe dalam banyak format kompresi, termasuk untuk mengompresi gambar statis (JPEG yang terkenal, dikembangkan untuk fotografi digital oleh Joint Photographic Experts Group).

Semuanya didasarkan pada kenyataan bahwa seseorang membedakan dengan baik bentuk suatu objek bahkan dengan batas-batas yang kabur. Oleh karena itu, jika kontur dibuat kurang tajam, pemirsa tidak akan melihat apa pun, tetapi jumlah informasi yang dikirimkan akan berkurang secara drastis. Dalam sinyal digital, setiap elemen dalam blok adalah nilai sampel, dan masing-masing blok adalah matriks nilai sampel. Penerapan DCT ke matriks sampel memungkinkan untuk mengekstrak informasi tentang transisi tajam dan membuangnya. Sedikit yang tersisa dikodekan menurut algoritma pengoptimalan khusus, yang menggunakan teknik yang dikenal dalam teknik pengkodean (dan, antara lain, ada metode untuk memperbaiki kesalahan selama transmisi data).

Akan menarik untuk mengetahui bahwa hampir semua filter di editor grafis didasarkan pada operasi pada matriks sampel. Terapkan filter blur di Photoshop untuk melihat DCT beraksi. Dan omong-omong, Anda dapat memastikan bahwa gambar, bahkan dengan kontur yang sedikit buram, dikompresi oleh JPEG dengan jauh lebih efisien.

Mengompresi gambar bergerak membutuhkan daya komputasi yang besar, sehingga kompresi waktu nyata biasanya menggunakan papan dan prosesor khusus, yaitu, kompresi diimplementasikan pada tingkat perangkat keras.

Profil dan level

Pembuat MPEG-2 mencoba memperluas cakupan standar sebanyak mungkin, dan ini dilakukan dengan menggunakan sistem profil dan level. Level menentukan parameter sinyal digital: jumlah sampel per baris, jumlah bingkai per detik, ukuran aliran, dll. Profil menetapkan parameter pengkodean: jenis bingkai, format warna, set operasi kompresi data yang digunakan , yaitu, kualitas penyandian ditentukan. Dengan demikian, standar memberi pengguna kesempatan untuk memilih kompresi yang sesuai untuk tugas tertentu - misalnya, video rumahan atau profesional.

Gagasan tentang profil dan level ternyata sangat bermanfaat sehingga dengan menambahkan level, bahkan dimungkinkan untuk memperluas standar pengkodean sinyal televisi definisi tinggi (HDTV). Tapi awalnya MPEG-3 dikembangkan untuk HDTV, yang dengan aman dilupakan segera setelah kemampuan yang sesuai diperkenalkan ke MPEG-2.

Format video

Standar MPEG tidak menentukan di mana pun bagaimana pengkodean sebenarnya dilakukan, itu hanya menjelaskan bagaimana aliran data yang dihasilkan akan terlihat, karena itulah yang penting untuk dekoder.

Pengkodean dapat dilakukan baik dalam perangkat keras maupun perangkat lunak, dan setiap perusahaan membuat algoritmenya sendiri (yang sangat penting, misalnya, algoritme untuk mencari blok makro yang digeser). Pada saat yang sama, pengembang memilih profil yang diinginkan, level, operasi kompresi data yang diperlukan, dan, yang sangat penting untuk pengkodean perangkat keras, dasar di mana algoritme diterapkan (papan khusus, prosesor, dll.). Misalnya, Sony telah membuat dua format perekaman video berdasarkan MPEG-2 - ini adalah Betacam SX dan MPEG IMX. Keduanya menggunakan profil 422P yang sama, tetapi disetel ke ukuran aliran data yang berbeda dan menggunakan perangkat keras yang berbeda untuk penyandian.

MPEG adalah singkatan dari Moving Picture Experts Group. Kelompok ahli ini bekerja di bawah kepemimpinan bersama dari dua organisasi - ISO (Organisasi Standar Internasional) dan IEC (Komisi Elektroteknik Internasional). Nama grup resmi adalah ISO/IEC JTC1 SC29 WG11. Tugasnya adalah mengembangkan standar umum untuk penyandian sinyal audio dan video. Standar MPEG digunakan dalam teknologi CD-i dan CD-Video, merupakan bagian dari standar DVD, dan secara aktif digunakan dalam penyiaran digital, TV kabel dan satelit, radio Internet, produk komputer multimedia, komunikasi melalui saluran ISDN dan banyak informasi elektronik lainnya. sistem.

Format yang sangat populer di seluruh dunia, berdasarkan codec JPG. Kompresi dilakukan dalam rangkaian tiga frame. Ini adalah salah satu codec tertua, jadi di hampir semua mesin, bahkan mesin yang paling "lemah", Anda dapat menonton video dengan suara stereo dalam format ini. Namun, kualitas gambarnya tidak tinggi: sebanding dengan format VHS analog yang sudah dikenal. Gambar tersebut memiliki resolusi 352x288 piksel, dan kualitasnya meninggalkan banyak hal yang diinginkan. Dan meskipun MPEG-1 tidak menuntut sumber daya, nasibnya telah ditentukan: dengan perkembangan kapasitas dan kecepatan transfer data di komputer dan Internet, formatnya akan dilupakan secara bertahap.

Bagaimana informasi dikompresi dalam format ini? Misalkan kita memiliki adegan berikut: sebuah mobil bergerak dari titik "A" ke titik "B". Pergerakan mesin dapat digambarkan dengan dua parameter: vektor perpindahan dari titik "A" ke titik "B" dan sudut rotasi di sekitar sumbunya. Pada saat yang sama, latar belakang tetap tidak berubah atau hampir tidak berubah - pemirsa tidak mungkin memperhatikan fluktuasi cabang kecil di dekat pohon yang jauh. Oleh karena itu, dimungkinkan untuk membagi bingkai menjadi dua komponen - latar belakang, yang disimpan sekali, dan kemudian menggantikan pemutaran semua bingkai, dan area di mana mobil bergerak - itu harus direkam secara terpisah untuk setiap bingkai.

Dalam format MPEG-1, semua frame video dibagi menjadi tiga jenis: I-, P- dan B-frame. Jenis pertama (I-frame, Intra Frames) termasuk frame referensi. Gambar mereka disimpan secara keseluruhan dalam format JPEG. Untuk P-frame (Predicted Frames), hanya perbedaan dari i-frame sebelumnya yang direkam, yang membutuhkan lebih sedikit ruang disk. Untuk B-frame (Bi-DirectiOnally Interpolated Frames), perbedaan dari I- atau P-frame sebelumnya dan berikutnya dipertahankan.

Akibatnya, ukuran file terkompresi kira-kira 1/35 dari aslinya. Ini berarti bahwa satu setengah jam film dengan kualitas yang setara dengan rekaman analog pada kaset VHS dalam format MPEG-1 akan muat dalam dua CD. Untuk transmisi melalui Internet atau jaringan penyiaran satelit, tentu saja standar ini tidak cocok.

MPEG-2 adalah perpanjangan lebih lanjut dari MPEG-1. Ini meningkatkan ukuran bingkai yang disarankan - sekarang 1920 x 1080 piksel, menambahkan dukungan untuk suara enam saluran. Namun, pemutaran video dalam format ini membutuhkan lebih banyak daya pemrosesan komputer.

Perlu dicatat bahwa pekerjaan sedang berlangsung pada pembuatan standar MPEG-3 (jangan dikelirukan dengan format kompresi audio populer - MPEG-1 Audio Layer 3). Itu seharusnya menjadi dasar untuk sistem televisi digital HDTV. Tetapi pengerjaannya terganggu, karena persyaratan untuk HDTV diimplementasikan dalam bentuk ekstensi kecil ke MPEG-2.

Format yang dominan saat ini adalah MPEG-2 dengan resolusi 720x576 piksel. Semua disk DVD-video bekerja dalam format MPEG-2. Siaran dari satelit ke beberapa saluran pada frekuensi yang sama, siaran langsung, termasuk TV definisi tinggi, berbagai pemutar DVD, camcorder microMV menggunakan format kompresi ini. Dan ini tidak mengejutkan. Setelah kesuksesan besar MPEG-1, format baru, yang memberikan kualitas gambar yang hampir profesional, telah disetujui untuk beberapa waktu, dan ternyata sangat sukses. MPEG-2 cocok untuk merekam satu setengah jam film dengan kualitas yang sangat baik pada disk DVD standar (4,7 GB). Selain itu, format ini dapat merekam film DVD ganda (9 GB) berkualitas tinggi menggunakan beberapa trek audio yang berbeda (dubbing), format audio multi-saluran yang berbeda, subtitle, sudut pandang yang berbeda dari materi video (beberapa trek video sinkron) dan lainnya. inovasi digital. Di antara mereka, misalnya, ada akses instan acak ke bagian mana pun dari materi video pada disk dan kurangnya rewind ketika akhir materi video tercapai, yang dulunya merupakan masalah yang agak besar.

MPEG-2 memungkinkan resolusi hingga 1920x1080 piksel (25 frame per detik, berbatasan dan tanpa batas, pemindaian progresif) dan mendukung audio 6 saluran.

Fitur format ini banyak digunakan oleh Sony dalam standar microMV yang diperluas, meskipun aliran informasi di sana meningkat hingga 12 Mbps (dibandingkan dengan standar DVD maksimum 9,8 Mbps), dan ukuran kaset berkurang (dibandingkan dengan DV). Namun standar DV lebih stabil dan lebih tersebar luas di seluruh dunia.

Kamera baru-baru ini muncul yang menulis langsung ke disk miniDVD dalam format MPEG-2. Mereka memiliki beberapa keunggulan penting - menulis ulang cakram hingga 1000 kali tanpa kehilangan kualitas, ketersediaan material, dan beberapa keunggulan lainnya. Tetapi kerugiannya juga jelas - terbatasnya jumlah materi yang direkam (hingga 30 menit per 1 disk miniDVD). Meskipun ini adalah opsi yang sangat cocok untuk pembuatan film amatir: disk miniDVD dapat diputar dengan sempurna pada pemutar rumahan dan PC, dan program yang disertakan dengan kamera semacam itu memungkinkan Anda untuk mengedit di komputer mana pun yang dilengkapi dengan drive DVD.

Itu dimaksudkan untuk digunakan dalam sistem televisi definisi tinggi (HDTV) dengan kecepatan data 20-40 Mbps, tetapi kemudian menjadi bagian dari standar MPEG-2 dan tidak lagi disebutkan secara terpisah. By the way, format MP3, yang kadang-kadang bingung dengan MPEG-3, dimaksudkan hanya untuk mengompresi informasi audio dan nama lengkap suara MP3 seperti MPEG Audio Layer III.

Format MPEG-1 dan MPEG-2 tidak memberikan kemungkinan nyata untuk menyiarkan video melalui Internet dan membuat televisi interaktif berdasarkan format tersebut - ukuran file terlalu besar. Untuk menguranginya secara radikal, serta untuk mengimplementasikan fungsi lain yang diperlukan untuk streaming video, pekerjaan dimulai pada spesifikasi format baru - MPEG-4. Faktanya, ini tidak terlalu terfokus pada kompresi video, tetapi pada pembuatan apa yang disebut "konten multimedia" - perpaduan antara TV interaktif, grafik 3D, teks, dll.

Format MPEG-4 menggabungkan suara yang sangat baik dan kompresi video maksimum (hingga 30-40% lebih baik dari pendahulunya). Perbedaannya adalah bahwa urutan lebih dari tiga frame dikodekan (biasanya hingga 250 frame). Ini mencapai kompresi yang lebih besar dan kemampuan untuk menonton video streaming berkualitas tinggi secara real-time di Internet. Kompresi dinamis juga hemat sumber daya, dan CD biasa dapat memuat 1,5 jam video dengan kualitas yang cukup baik. Namun, dalam kebanyakan kasus, pemirsa yang penuh perhatian akan dapat melihat pada layar yang bagus perbedaan antara gambar yang disandikan MPEG2 dan MPEG4.

Fitur menarik dari format ini adalah bahwa untuk objek tipikal bahkan algoritma terpisah untuk memprediksi dan menggambarkan gerakan mereka telah dikembangkan - ini berlaku, khususnya, untuk gaya berjalan orang, gerakan paling umum, dan ekspresi wajah. Sekarang tidak perlu merekam perubahan seperti itu dalam bingkai sama sekali - perubahan tersebut dapat dihitung secara terprogram.

MPEG-4 mendukung tampilan teks dalam berbagai font di atas gambar video. Selain itu, teks ini dapat disuarakan menggunakan synthesizer ucapan dengan kemampuan meniru suara pria dan wanita. Jika perlu, suara disinkronkan dengan gerakan wajah pembicara sesuai dengan fonem yang diucapkan. Suara beberapa alat musik juga dapat disintesis. Kompresi rekaman audio digital lebih efisien dengan codec AAC (Advanced Audio Codec) yang dikembangkan secara khusus.

Beberapa camcorder memungkinkan Anda untuk merekam video dalam format MPEG-4 pada kartu memori Anda sendiri atau bekerja sebagai webcam, mentransfer video dengan audio dalam format MPEG-4 melalui kabel USB.

Selain itu, teknologi modern bahkan memungkinkan untuk memutar televisi digital (dikompresi dalam format MPEG-4 atau MPEG-2) dengan ponsel menggunakan GPRS.

Saat ini, MPEG-4 adalah format distribusi video paling populer di Internet dan di komputer pribadi. Penggunaan memori yang rasional dengan kualitas video yang bagus membuat dirinya terasa. Setiap versi codec MPEG-4 berikutnya (hari ini versi 3.xx, 4.xx dan 5.xx digunakan) membawa peningkatan yang semakin progresif. Sejumlah besar pemain rumah tangga, PDA, dan perangkat lain bekerja dengan format ini tanpa masalah. MPEG-4 akan relevan untuk setidaknya sepuluh tahun lagi, sampai sesuatu yang secara fundamental baru datang untuk menggantikannya.

Kompresi MPEG menggunakan ide-ide utama berikut:

1. Penghapusan redundansi temporal dalam video, dengan mempertimbangkan fakta bahwa dalam interval waktu yang singkat, sebagian besar fragmen adegan berubah menjadi tidak bergerak atau sedikit bergeser melintasi lapangan.

2. Penghapusan redundansi spasial gambar dengan menekan detail kecil dari pemandangan yang tidak penting untuk persepsi visual manusia;

3. Menggunakan resolusi warna yang lebih rendah dalam representasi yuv gambar (y - kecerahan, u dan v - sinyal perbedaan warna) - telah ditemukan bahwa mata kurang sensitif terhadap perubahan spasial dalam nuansa warna dibandingkan dengan perubahan kecerahan.

4. Meningkatkan kepadatan informasi dari aliran digital yang dihasilkan dengan memilih kode matematika yang optimal untuk menggambarkannya (misalnya, menggunakan kata kode yang lebih pendek untuk nilai yang paling sering diulang).

5. Gambar dalam urutan Mpeg dibagi menjadi beberapa jenis berikut:

· I (intra), yang memainkan peran referensi saat memulihkan gambar lain berdasarkan perbedaannya;

P (diprediksi), berisi perbedaan antara gambar saat ini dan I atau P sebelumnya, dengan mempertimbangkan pergeseran fragmen individu;

· B (prediksi dua arah), berisi perbedaan antara gambar saat ini dan gambar sebelumnya dan selanjutnya dari tipe I atau P, dengan mempertimbangkan pergeseran fragmen individu.

Gambar digabungkan ke dalam kelompok (GOP - Group Of Pictures), yang merupakan kumpulan gambar berurutan minimum yang dapat diulang yang dapat didekodekan secara independen dari gambar lain dalam urutan. Grup tipikal adalah (I0 B1 B2 P3 B4 B5 P6 B7 B8 P9 B10 B11) (I12 B13 B14 P15 B16 B17 P18…), di mana tipe I diulang setiap setengah detik. Perhatikan bahwa dalam gambar P3, sebagian besar fragmen adegan diprediksi berdasarkan fragmen gambar offset I0 yang sesuai. Hanya perbedaan dari pasangan fragmen ini yang benar-benar dikodekan. Demikian pula, P6 "dibangun" berdasarkan P3, P9 - berdasarkan P6, dll. Pada saat yang sama, sebagian besar fragmen B1 dan B2 diprediksi sebagai setengah jumlah dari fragmen yang digeser dari I0 dan P3, B4 dan B5 dari P3 dan P6, B7 dan B8 dari P6 dan P9, dan seterusnya. Seiring dengan ini, B-gambar tidak digunakan untuk memprediksi gambar lain. Karena ketergantungan gambar dalam proses pengkodeannya, urutan urutan berubah. Untuk urutan di atas menjadi: I0 P3 B1 B2 P6 B4 B5 P9 B7 B8 I12 B10 B11 P15 B13 B14 P18 B16 B17…

Jelas bahwa akurasi pengkodean harus maksimum untuk I, lebih rendah untuk P, minimum untuk B. Telah ditemukan bahwa untuk pemandangan biasa, hasil yang baik dicapai ketika jumlah bit untuk I 3 kali lebih besar daripada untuk P, dan untuk P 2 -5 kali lebih besar daripada untuk B. Rasio ini berkurang untuk pemandangan dinamis dan meningkat untuk pemandangan statis.

Gambar individu terdiri dari makroblok. Macroblock adalah unit struktural dasar dari fragmentasi gambar. Ini sesuai dengan area gambar 16*16 piksel. Bagi mereka vektor perpindahan relatif terhadap gambar I atau P ditentukan. Jumlah total makroblok pada citra adalah 396. Untuk meningkatkan stabilitas proses restorasi citra terhadap kemungkinan kesalahan transmisi data, makroblok sekuensial digabungkan menjadi bagian yang independen satu sama lain (irisan), dengan jumlah maksimum 396,396 makroblok. Pada gilirannya, setiap blok makro terdiri dari enam blok, empat di antaranya membawa informasi tentang kecerahan Y, dan masing-masing menentukan warna komponen U dan V. Setiap blok adalah matriks dari 8*8 elemen. Blok adalah unit struktural dasar di mana operasi pengkodean utama dilakukan, termasuk transformasi kosinus diskrit (DCT - Transformasi Kosinus Diskrit) dan kuantisasi koefisien yang diperoleh.

Jadi kompresi MJPEG didasarkan pada pengkodean independen dari setiap frame dan menggabungkan urutan yang dihasilkan ke dalam file. Kompresi video dilakukan sesuai dengan algoritma JPEG: setiap gambar dibagi menjadi kotak berukuran 8x8 piksel dan direpresentasikan dalam bentuk vektor dengan transformasi diskrit dan penyaringan high-pass dari spektrum yang dihasilkan. Pada dasarnya, video terkompresi adalah urutan gambar JPEG independen.

Karena setiap frame dikodekan secara terpisah dari yang lain, pengeditan gambar frame-by-frame berikutnya dimungkinkan. Keuntungan signifikan dari algoritma kompresi video ini adalah simetrinya, yaitu, biaya komputasi yang sama diperlukan untuk encoding dan decoding.

Berkenaan dengan MJPEG, rasio kompresi video hingga 1:15 memungkinkan Anda untuk menyimpan informasi video tanpa kehilangan kualitas, dari 1:15 hingga 1:25 menyebabkan sedikit hilangnya resolusi. Dengan rasio kompresi yang tinggi, kompresi video menggunakan algoritma MJPEG disertai dengan karakteristik distorsi format JPEG: pada batas kisi partisi [persegi 8x8 piksel], kelancaran gambar terganggu, yang mengarah ke yang sudah diketahui efek "mosaik".
Kerugian lain dari format kompresi MJPEG termasuk efisiensi kompresi yang tidak terlalu tinggi, serta ketidakmungkinan membuat fragmen video yang lebih besar dari 2 GB - struktur file tidak memungkinkan peningkatan ukurannya. Saat ini, metode perangkat lunak digunakan untuk "menempelkan" file MJPEG, memungkinkan Anda untuk beralih di antara mereka hampir tanpa terasa.

Beberapa tahun yang lalu, kompresi MJPEG menjadi standar dalam multimedia, mendorong pengembang perangkat keras dan perangkat lunak untuk membuat codec MJPEG mereka sendiri.

Formatnya menggunakan pemrosesan sederhana dari sinyal video analog yang dikodekan menurut standar JPG (dengan resolusi 768x576 piksel). Singkatan dari Motion-JPEG (JPEG bergerak). Sampai saat ini, format ini praktis tidak digunakan, karena. video terkompresi berkualitas tinggi menghabiskan banyak ruang. Di beberapa model perangkat (misalnya, kamera dengan fungsi video) ada versi sederhana dari M-JPEG dengan resolusi 320x240 piksel.

Algoritma kompresi video yang relatif baru di mana, tidak seperti JPEG, gambar diproses tanpa membelah menjadi kotak. Setelah Perangkat Analog merilis chip kompresi video perangkat keras khusus, format ini menjadi dasar untuk sistem pengawasan video digital multi-saluran dan perekam video digital.

Seperti dalam kasus format JPEG, dalam kompresi Wavelet dilakukan dengan kehilangan informasi yang tidak dapat diubah, tetapi gambar tidak memiliki cacat "mosaik" bahkan pada rasio kompresi yang sangat tinggi. Keuntungannya - tidak adanya cacat yang terlihat bahkan dengan rasio kompresi video yang tinggi - ketajaman berkurang, dan gambar menjadi kurang jelas.

Dari sudut pandang matematika, fitur utama dari transformasi wavelet adalah kemampuan untuk menguraikan gambar menjadi dua komponen - bagian frekuensi rendah yang berisi informasi dasar, dan bagian frekuensi tinggi yang hanya berisi sedikit informasi. Bagian frekuensi rendah dapat didekomposisi lagi menjadi dua bagian, dan seterusnya. Sisa gambar hanya berisi komponen frekuensi tinggi kecil. Sebagai hasil dari penerapan transformasi wavelet yang berurutan, diperoleh gambar yang menempati sejumlah kecil ruang disk.

JPEG [Kelompok Ahli Fotografi Gabungan]- algoritma kompresi gambar diam. Format JPEG secara inheren menyediakan penurunan kualitas yang terkontrol tetapi tidak dapat diubah. Ide utama dari algoritma kompresi ini adalah bahwa seluruh "gambar" dibagi menjadi kotak berukuran 8x8 piksel, dan gambar di setiap kotak didekomposisi menjadi harmonik [Transformasi Fourier]. Hanya harmonik dasar yang dipertahankan, dan nilai sisanya dibulatkan secara kasar. Fitur format kompresi JPEG sangat cepat [full frame dalam 1/50 detik] dan kompresi tinggi [10 ... 100 kali].

Secara tradisional, format JPEG telah digunakan untuk mengompresi gambar penuh warna dan skala abu-abu tanpa transisi tajam dalam kecerahan, mungkin memberikan kompresi digital terbaik. Transisi dari gambar monokrom ke gambar warna RGB meningkatkan ukuran gambar hanya satu setengah kali, bukan tiga.

Format JPEG digunakan oleh kamera web dan server video web - dalam hal ini, pengawasan video dapat dilakukan di jendela browser standar. Harus diingat bahwa gambar ukuran penuh "langsung" dalam format JPEG dapat ditransmisikan melalui saluran komunikasi setidaknya 64K.

Saat mengompresi video menggunakan algoritma JPEG, beberapa informasi hilang, tetapi rasio kompresi tinggi tercapai. Dalam beberapa kasus, efek Gibbs muncul - "halo" di sekitar tepi horizontal dan vertikal gambar yang tajam. Perangkat lunak memutuskan apakah persegi 8x8 tertentu signifikan dalam gambar yang diberikan atau apakah itu dapat diinterpolasi. Ketika tingkat kompresi meningkat, jumlah blok yang dibuang meningkat, dan artefak mulai muncul pada gambar - cacat persegi panjang yang khas.

Apple QuickTime

Format file MOV dikembangkan oleh Apple untuk komputer Macintosh dan kemudian di-porting ke platform PC. Dari 1993 hingga 1995 format ini dominan. Versi terbarunya nomor 4.1 memungkinkan Anda untuk mentransfer data dalam mode streaming. Ini berarti tidak perlu mengunduh file sepenuhnya untuk mulai menonton video. Namun, dengan munculnya spesifikasi MPEG, format ini secara bertahap kehilangan popularitas. Masalah utamanya adalah bahwa standar QuickTime ditutup. Metode pengkodean video dirahasiakan oleh Apple. Oleh karena itu, pemrogram pihak ketiga tidak dapat menulis program yang memampatkan video ke dalam format ini.

Intel Indo

Format ini dikembangkan oleh Intel Corporation untuk mengompresi data video menggunakan kemampuan baru prosesor Intel Pentium MMX. Selain mendukung data streaming dan fitur perlindungan hak cipta, standar ini menerapkan beberapa fitur inovatif pada saat diperkenalkan. Ini memungkinkan Anda untuk menerapkan berbagai efek ke urutan video (misalnya, mengubah kecerahan atau kontras) secara real time, mendekode bukan seluruh bingkai, tetapi, misalnya, fragmen pusat, membuat bagian dari bingkai satu video menjadi transparan dan overlay dua video di atas satu sama lain. Efek terakhir sering digunakan dalam program berita televisi, ketika komentator digambarkan dengan latar belakang laporan video dari tempat kejadian.

Namun, format Indeo tidak banyak digunakan. Dan dengan dirilisnya MPEG-4, yang juga berisi semua fitur ini, standar ini umumnya tidak berfungsi.

CCIR 601

CCIR-601- standar yang menjelaskan format video digital dengan resolusi 720x576 (PAL) dan 720x480 (NTSC).

Standar televisi digital diterbitkan oleh ITU-R (CCIR) pada tahun 1990. Mendefinisikan format bingkai (misalnya CIF, QCIF), aturan untuk mengkonversi video analog standar (NTSC, PAL, SECAM) ke sinyal komponen digital, dan metode pengkodean video digital.

Rekomendasi ITU-T H.261 - Codec video untuk layanan audiovisual pada p x 64 kbit/s. Rekomendasi ini menjelaskan metode encoding/decoding video untuk digunakan dalam sistem konferensi video dengan kecepatan data p x 64 Kbps, di mana p dapat mengambil nilai dari 1 hingga 30. H.261 mendefinisikan penggunaan format bingkai CIF dan QCIF (bila p < 3).

H.263 adalah codec video, ITU-T, yang dirancang untuk mengirimkan video melalui saluran bandwidth yang relatif rendah (biasanya di bawah 128 kbps). Digunakan dalam perangkat lunak konferensi video.

Standar H.263 awalnya dikembangkan untuk digunakan dalam sistem berbasis H.324 (PSTN dan konferensi video dan sistem komunikasi suara lainnya), tetapi kemudian ditemukan digunakan dalam H.323 (konferensi video berdasarkan RTP/IP), H.320 ( konferensi video berbasis ISDN), RTSP (streaming audio dan video) dan SIP (internet conferencing).

H.263 merupakan evolusi dari standar H.261, standar kompresi video ITU-T sebelumnya, dan algoritma MPEG-1 dan MPEG-2. Versi pertama selesai pada tahun 1995 dan merupakan pengganti yang baik untuk H.261 usang pada saluran bandwidth apapun. Pengembangan lebih lanjut dari proyek ini adalah H.263v2 (juga dikenal sebagai H.263+ atau H.263 1998) dan H.263v3 (dikenal sebagai H.263++ atau H.263 2000).

Codec canggih baru dari ITU-T (dalam kemitraan MPEG) setelah H.263 adalah standar H.264, juga dikenal sebagai AVC dan MPEG-4 Bagian 10. Ini telah menjadi pokok dalam pengembangan perangkat lunak konferensi video. Sebagian besar perangkat lunak modern di bidang ini mendukung H.264, serta H.263 atau H.261.

Teori Ogg

Ogg adalah wadah metadata, yang menyediakan penyimpanan beberapa trek data dalam satu file, memungkinkan Anda mendeteksi kesalahan dalam aliran dan mencari tempat yang tidak rusak.

Codec Theora dikembangkan oleh Xiph.org Foundation. Algoritmenya didasarkan pada codec dari codec VP3 gratis, dibuat oleh On2 Technologies dan didistribusikan di bawah lisensi yang memungkinkan Anda untuk menggunakannya secara tidak dapat dibatalkan (yaitu gratis) dan tidak memerlukan royalti paten apa pun untuk digunakan, baik VP3 itu sendiri maupun codec yang diturunkan darinya. Theora adalah codec video berkinerja tinggi yang benar-benar bersaing dengan MPEG-4 dan teknologi kompresi video bandwidth rendah lainnya.


File AVI adalah kasus khusus dari file RIFF. (kependekan dari Resource Interchange File Format). Format ini, awalnya ditujukan untuk pertukaran data multimedia, dibagikan oleh Microsoft dengan IBM. Format ini adalah bentuk paling umum dari presentasi video di komputer pribadi. Tergantung pada bentuk penyajian data video, file AVI datang dalam berbagai standar.

MPEG yang dapat diedit

MPEG yang dapat diedit, seperti M-JPEG, digunakan untuk pengeditan video digital dan merupakan file AVI yang hanya terdiri dari bingkai MPEG tipe i. Namun, semua mekanisme kompresi MPEG lainnya terlibat di sini. Termasuk dalam distribusi standar Microsoft Video untuk Windows 1.1. dan digunakan oleh sistem pengeditan video digital desktop seperti Adobe Premiere.

Meskipun kompresor yang tercantum di atas cukup populer, namun, ini jauh dari semua standar untuk mengompresi file AVI. Mencirikan kelompok kompresor ini, dapat dicatat bahwa mereka dirancang dan dibuat terutama sebagai sarana untuk mengompresi data video dan audio yang disimpan pada hard drive dan CD, dan ini, pada gilirannya, menunjukkan kemampuan kompresinya yang rendah dan kualitas pemutaran yang relatif tinggi.

Dengan munculnya Internet, metode dan alat untuk mengompresi data video dan audio menjadi semakin populer, memungkinkan, menggunakan teknologi canggih (perkiraan dan kompensasi gerakan canggih, wavelet, fraktal, dan lainnya), untuk mencapai "kilobit / detik" terkecil. rasio yang memungkinkan, misalnya, untuk melakukan sesi konferensi video melalui Internet. Jelas bahwa metode kompresi tersebut memberikan rasio kompresi yang jauh lebih tinggi, dengan kualitas yang relatif rendah.

VDONet merilis kompresor video berbasis wavelet yang disertakan dengan Video versi 32-bit untuk Windows. Microsoft menggunakan VDOWave sebagai bagian dari NetShow. Saat ini ada dua versi kompresor VDOWave:

VDO Wave 2.0 adalah codec video tarif tetap.

VDOWave 3.0 adalah codec video yang "dapat diskalakan".

Set standar NetShow 2.0 hanya menginstal dekoder VDOWave. Alat pengembangan NetShow 2.0 menginstal encoder dan decoder VDONet VDOWave. Menurut beberapa pengujian, VDOWave secara signifikan mengungguli MPEG-1 dan kompresor lain berdasarkan algoritma Transformasi Kosinus Diskrit dalam kompresi, tetapi hanya pada rasio kilobit / detik rendah.

Salah satu kompresor Video untuk Windows yang paling umum dan digunakan. Menyediakan pemutaran video tercepat. Tidak seperti Indeo 32, yang memberikan kualitas yang sedikit lebih baik, tetapi secara signifikan membebani prosesor selama dekompresi, Cinepak menurunkan sumber daya prosesor secara maksimal.

Sampai saat ini, setidaknya ada tiga standar untuk Cinepak.

· Cinepak SuperMac (asli, kompresor 16-bit);

· Cinepak Radius (kompresor 16-bit baru yang ditingkatkan);

· Cinepak Radius (Radius Cinepak versi 32-bit disertakan dengan Windows 95).

Fitur dari metode ini adalah penggunaan algoritma kuantisasi gambar vektor bersama dengan algoritma perbedaan bingkai (lihat di bawah).

Urutan video yang dikompresi sesuai dengan format MPEG-1 dan MPEG-2 berbeda dalam jumlah informasi dan, akibatnya, dalam kualitas. Meskipun algoritme MPEG-1 dapat bekerja dengan resolusi hingga standar CCIR-601 (720x480), video biasanya dikodekan pada bit rate yang jauh lebih rendah, menghasilkan kualitas pemutaran video yang buruk. Kualitas MPEG-1 biasanya dikaitkan dengan kualitas VHS hanya dalam format (352x240). Selama pemutaran, gambar seperti itu "diregangkan" oleh perangkat keras atau perangkat lunak ke layar penuh, dan meskipun ini kehilangan kualitas, tetap memungkinkan untuk memutar video layar penuh bahkan dengan CD-ROM dua kecepatan.

MPEG-2 mendukung resolusi yang lebih tinggi (termasuk CCIR-601). Pada saat yang sama, ukuran file MPEG-2 kira-kira empat kali lebih besar dari file MPEG-1, yang memungkinkan Anda merekam film layar penuh dengan kualitas "broadcast" (Betacam). Format ini telah dipilih untuk digunakan pada disk video generasi baru berdasarkan teknologi DVD, dan akan segera menjadi dominan di PC juga akses ke video. Fitur utama lain dari MPEG-2 adalah adanya ekstensi di dalamnya, yang memungkinkan, selama perekaman, untuk membagi sinyal video menjadi dua (atau lebih) aliran data yang disandikan secara independen yang mewakili video dalam resolusi yang berbeda, mis. dengan kualitas gambar yang lebih baik atau lebih buruk. Ini dilakukan untuk membuat aliran data independen dengan intensitas tertentu dalam satu sinyal video. Fitur ini penting jika Anda perlu menyiarkan HDTV dan sinyal TV standar secara bersamaan.

Standar MPEG-2 terdiri dari tiga bagian utama: sistem, video, dan suara.

Bagian sistem menjelaskan format pengkodean untuk multiplexing audio, video dan informasi lainnya, mempertimbangkan masalah menggabungkan satu atau lebih aliran data menjadi satu atau lebih aliran yang cocok untuk penyimpanan atau transmisi.

Pengkodean sistem sesuai dengan aturan sintaksis dan semantik yang diberlakukan oleh standar ini memberikan informasi yang diperlukan dan cukup untuk menyinkronkan decoding tanpa buffer dekoder yang meluap atau "mengalir" di bawah berbagai penerimaan aliran atau kondisi pemulihan.

Dengan demikian, level sistem melakukan lima fungsi utama:

    Sinkronisasi beberapa aliran terkompresi selama pemutaran

    Menggabungkan beberapa aliran terkompresi menjadi satu aliran

    Inisialisasi untuk memulai pemutaran

    Pemeliharaan penyangga

    Definisi Garis Waktu

Bagian video dari standar menjelaskan bitstream yang dikodekan untuk video digital berkualitas tinggi.MPEG-2 adalah ekstensi yang kompatibel dari MPEG-1, mendukung format video interlaced dan berisi fasilitas untuk dukungan HDTV.

Standar MPEG-2 didefinisikan dalam hal profil yang dapat diperluas, yang masing-masing, sebagai kasus khusus standar, memiliki fitur yang dibutuhkan oleh semua kelas aplikasi. Profil skalabel hierarkis dapat mendukung aplikasi seperti TV multiprogram terestrial interoperable (HDTV), sistem video jaringan paket, kompatibilitas mundur dengan standar lain (MPEG-1 dan H.261) dan aplikasi yang menggunakan pengkodean berlapis. Sistem seperti itu akan memungkinkan konsumen menggunakan receiver untuk memecahkan kode sinyal TV standar dan sinyal HDTV dari saluran siaran yang sama.

Bagian audio dari standar MPEG-2 mendefinisikan pengkodean audio multi-saluran. MPEG-2 mendukung hingga lima saluran pita lebar penuh ditambah saluran frekuensi rendah tambahan dan/atau hingga tujuh saluran komentar multibahasa. Ini juga meningkatkan pengkodean mono dan stereo MPEG-1 dengan menggunakan kecepatan setengah sampel (16, 22,05 dan 24 kHz) untuk meningkatkan kualitas pada kecepatan bit 64 kbps ke bawah.

Penggunaan standar MPEG-2 dalam siaran televisi dapat secara signifikan mengurangi laju transmisi data video dan audio dan dengan demikian mentransmisikan beberapa program digital dalam pita frekuensi standar saluran radio siaran televisi terestrial, kabel dan satelit. Misalnya, MPEG-2 memberikan keuntungan besar dalam sistem penyiaran televisi satelit. Kompresi memungkinkan Anda mentransfer satu saluran standar dari satu hingga lima saluran digital pada tingkat kualitas sinyal video profesional. Penting juga bahwa saluran digital, dibandingkan dengan saluran analog, memberikan lebih banyak peluang untuk mentransmisikan informasi tambahan.

Bandwidth saluran satelit standar dengan pita 32 MHz adalah 55 Mbps. Penyiaran dengan kualitas profesional membutuhkan bit rate 5 - 8 Mbps. Dengan demikian, satu saluran satelit standar memungkinkan Anda untuk menyiarkan 4 - 5 program televisi. Dimungkinkan untuk menggunakan saluran digital dengan rasio kompresi yang lebih tinggi. Dalam hal ini, hingga sepuluh program video ditransmisikan dalam satu saluran standar. Namun, dalam kasus ini, penurunan kualitas gambar terlihat.

Secara umum, transisi ke siaran TV multi-program digital melibatkan penghentian bertahap sistem penyiaran analog: SECAM, PAL, NTSC, pelepasan saluran radio dan jalur komunikasi yang ada karena ini, serta profil ulang mereka untuk TV digital penyiaran. Pada saat yang sama, sistem penyiaran TV multi-program harus dibangun ke dalam rencana frekuensi yang ada untuk distribusi saluran TV, yang menyediakan bandwidth 8 MHz untuk siaran TV terestrial dan kabel, 27 MHz untuk sistem satelit TV langsung. penyiaran dan 30, 33, 36, 40, 46, 54,72 MHz - untuk layanan satelit tetap. Penting juga untuk mempertimbangkan hubungan yang ada antara sistem penyiaran televisi satelit dan terestrial, yang melibatkan penggunaan saluran TV kabel dan jaringan penyiaran terestrial juga untuk menghadirkan program satelit kepada pemirsa.

Dengan siaran digital, pertukaran timbal balik program TV antara layanan siaran terestrial dan satelit sangat disederhanakan jika jumlah program TV digital di setiap saluran radio satelit, kabel dan terestrial bandwidth standar adalah sama. Persyaratan ini diperhitungkan ketika mengembangkan standar internasional untuk metode modulasi dan pengkodean saluran dalam saluran komunikasi satelit dan terestrial digital - DVB-S, DVB-C dan DVB-T (Siaran Video Digital - Satelit, Kabel, Terestrial) - dengan menerapkan pada saluran radio pita sempit lebih kompleks dan efisien dalam hal metode modulasi kepadatan transmisi informasi.

Saat mengatur siaran TV digital multi-program, sangat penting untuk memilih tingkat transmisi yang tepat, karena kualitas gambar dan iringan suara secara langsung tergantung pada ini. Menurut perkiraan ahli, untuk mendapatkan gambar berkualitas studio yang sesuai dengan Rekomendasi CCIR 601, perlu mengirimkan data video dengan kecepatan sekitar 9 Mbps. Dalam hal ini, sinyal video yang didekode akan cocok untuk pemrosesan digital berikutnya. Untuk mendapatkan gambar dengan kualitas yang sesuai dengan kualitas gambar di layar TV rumah tangga, kecepatan transfer sekitar 6 Mbps sudah cukup. Dalam hal ini, sinyal video yang didekodekan akan sedikit berguna untuk pemrosesan lebih lanjut dan pengkodean ulang dengan kompresi informasi.

Perlu dicatat bahwa kualitas gambar TV pada kecepatan data video yang sama di
sistem televisi dengan frekuensi sapuan medan 50 Hz akan lebih tinggi daripada sistem televisi dengan frekuensi sapuan medan 60 Hz.

Beberapa kata tentang kecepatan transfer data audio. Standar keunggulan kualitas suara saat ini adalah kualitas yang diperoleh saat memutar CD. Oleh karena itu, standar MPEG-2 mengasumsikan bahwa dalam sistem penyiaran TV digital, kualitas suara stereo tidak boleh berbeda secara subyektif dari suara CD. Kondisi ini terpenuhi untuk sistem kompresi data audio MUSICAM yang diadopsi dalam standar MPEG-2 pada kecepatan transmisi 128 Kbps untuk setiap monochannel audio. Jadi, tingkat terendah, audio stereo dua saluran, akan membutuhkan kecepatan data digital 128 Kbps x 2 = 256 Kbps.

Aliran digital untuk transmisi informasi tambahan (SI) dipilih tergantung pada volume yang diharapkan. Laju transmisi biasanya dipilih sebagai kelipatan laju aliran digital saluran telepon - 64 Kbps. Untuk menyatukan saluran transmisi digital data audio dan informasi tambahan, kecepatan transmisi DI biasanya dipilih menjadi 128 Kbps. Karena kerumitan besar dalam membangun standar MPEG-2, biaya peralatan penerima digital lebih tinggi daripada analog. Karena alasan inilah penyiaran analog akan terus ada bersama digital untuk saat ini.