Monday, November 25, 2013

DIGITAL MULTIMEDIA BROADCASTING

Kemajuan teknologi video kompresi pada tahun 1980 berkembang dengan pesat, bersamaan dengan ketersediaan prosesor di tahun 1990-an, evolusi di dalam penggunaan digital multimedia broadcasting berjalan dengan cepat. Keberadaan penyiaran digital merupakan sebuah langkah sederhana dari sistem analog ke digital. Penyiaran digital memungkinkan tingkat kualitas dan fleksibelitas tak terhingga dengan analog penyiaran serta menyediakan berbagai layanan yang baik karena adanya kualitas gambar dan suara yang tinggi, interaktivitas, serta kemampuan penyimpaan. Eropa memulai usaha penyiaran untuk menerapkan infrastruktur satelit program telivisi direct-to-home lengkap dengan pengiriman yang memiliki kapasitas lebih dari 100 saluran satelit tunggal, yaitu DVB (digital video broadcasting) pada tahun 1993 dan pekerjaan standarisasi untuk sistem pengiriman satelit (DVB-S) serta kabel (DVB-C) pada tahun 1994. Secara khusus versi terstrial (DVB-T) ditambahkan ke dalam DVB.

DVB memberikan kualitas gambar superior dengan kesempatan untuk melihat gambar dalam format satadar / layar lebar, bersama dengan suara mono, stereo, atau surround. Hal ini memungkinkan berbagai fitur dan layanan baru seperti subtitling, panduan program elektronik (EPGs), beberapa track audio interaktif, dan konten multimedia. Program ini juga memungkinkan untuk disebarluaskan melalui jaringan internet.

MOVING FROM DVB-T TO DVB-H

Dua asplek yang paling penting pada sistem DVB-T adalah penggunaan MPEG-2 pada aliran transportasi stream (TS) dan penggunaan format kode orthogonal frequency-division multiplex (COFDM). Secara khusus, setelada data video dan audio dalam DVB-T dikompresi menurut standar kompresi MPEG-2, data tersebut dikemas oleh SD packetized aliran stream (PES) dan kemudian setiap paket PES dibagi menjadi paket – paket dengan panjang tetap dari 188 byte.
Broadcasting network interfaces menerima transportasi stream, saluran encode, dan melakukan modulasi sebelum mengirim ke media transmisi. Pada penyiaran menengah, modulasi yang digunakan berbeda, didasarkan pada teknik modulasi multicarrier dan COFDM. OFDM merupakan teknik membagi sinyal informasi berkecepatan tinggi menjadi beberapa seri yang memeiliki kecepatan sub-sinyal lebih rendah, sehingga sistem lebih efektif dalam mengirimkan sub-sinyal secara bersamaan dalam frekuensi yang berbeda secara paralel.


DVB-H dirancang khusus untuk broadcasting siarang TV pada perangkat batterypowered handled mobile bersama dengan satu set spesifikasi IP datacast. Pada pengiriman konten media massa, jaringan siaran DVB-H harus menggunakan jaringan seluler digital point-to-point seperti 3G dan UMTS. DVB-H lebih menambahkan sejumlah fitur untuk memperhitungkan masa penggunaan baterai terbatas pada perangkat dan lingkungan tertentu di mana penerima beroperasi. Penggunaan tersebut disebut sebagai teknik time slicing, di mana data yang diterima secara berkala memungkinkan penerima untuk mematikan perangkat ketika tidak aktif untuk penghematan daya. Sistem DVB-H menggunakan FEC (forward error connection) untuk meningkatkan kinerja mobile dari DVB-T.  Protokol yang digunakan pada DVB-H:
 

 Time slicing in DVB-H
Sejak datagram IP digunakan untuk mengisi packetize DVB-H, DVB standar membawa datagram IP dalam TS MPEG-2 dengan menggunakan multiprotocol, di mana setiap IP datagram dirumuskan menjadi satu bagian MPE. Aliran bagian pada MPE kemudian dimasukkan menjadi aliran dasar (ES), yaitu MPEG-2 TS dengan paket program identifier tertentu (PID). Setiap bagian MPE memiliki header 12 byte, redudansi siklik 4 byte yang memeriksa panjang payload (identic dengan panjang IP datagram). Pada handled device masa depan, DVB-H memungkinkan untuk menerima layanan audio dan video yang ditransmisikan melalui IP pada ES yang memiliki bitrate rendah (250 kbps). Time slicing diperkenankan untuk mengurangi konsumsi daya secara drastis sehingga demodulasi penerima dan decode hanya 2.5% bagian dari porsi seutuhnya pada MPEG-2 TS. Prinsip time slicing:


MPE-FEC in DVB-H

Dengan MPE-FEC, IP datagram setiap time-sliced dilindungi oleh RS (Reed-Solomon) FEC (Forward Error Correction) yang dihitung dari IP datagram. RS (n,k) merupakan salah satu jenis kode penghapusan di mana pesan k ukuran simbol dapat digunakan untuk membuat nk paritas simbol. Pada dasarknya, nilai k asli ditransmisikan simbol ditambahkan simbol nk. Setiap k dari simbol transmisi n dapat digunakan untuk memecahkan kode pesan asli.
Data RS diringkas menjadi MPE – FEC bagian yang merupakan bagian dari brust dan langsung dikirim setelah bagian MPE terakhir, dalam ES yang sama dengan table id berbeda dari bagian MPE, yang memungkinkan penerima untuk membedakan dua jenis bagian pada ES. Pada perhitungan data RS menggunakan sebuah frame MPE-FEC.

T-DMB MULTIMEDIA BROADCASTING FOR PORTABLE DEVICE

T-DMB memiliki kesamaan dengan standar TV mobile DVB-H yang menggunakan teknik kompresi data multimedia. Secara khusus T-DMB menggunakan MPEG-4 HE AAC untuk pengkodean audio. Data audio dan video yang terkompresi dikemas dalam sebuah aliran transportasi MPEG-2 (TS) dan lapisan MPEG-4 sinkronisasi (SL) untuk streaming. Terestrial digital multimedia broadcasting juga mendefinisikan layanan konvergen dalam penyiaran dan telekomunikasi. Binary format for scenes digunakan sebagai pilihan untuk mengaktifkan layanan siaran interaktif. MPEG-4 BIFs merupakan bagian dari sistem MPEG-3 yang digunakan untuk deskripsi sekuen MPEG-4.
Aplikasi lain dari T-DMB adalah visual radio, sebuah layanan radio yang mampu mengirimkan dua frame video per detik. Konep visual radio sangat mirik dengan slideshow yang ditawarkan oleh MOT (Multimedia Object Transfer) protocol transportasi untuk transmisi konten multimedia pada saluran data DAB ke berbagai penerima dengan kemampuan multimedia. Visual radio menggunakan MPEG-4 BSAC untuk penyiaran audio digital dengan urutan frame gambar H.264/AVC.

MPEG-4 BSAC audio coding in T-DMB

BSAC (bit-sliced arithmetic coding) merupakan alat pengkodean audio MPEG-4 secara umum berdasarkan pendekatan coding persepsi seperti yang digunakan dalam MPEG-2/4 skema AAC (advanced audio coding). Metode kompresi BSAC mirip dengan AAC kecuali pada algoritma pengkodean lossless.

Layanan audio MPEG-4 berbasis BSAC di T-DMB mendukung penyiaran stereo audio standar di tingkat sampling 24, 44.1, atau 48 kHz. BSAC memungkinkan kontrol bitrate adaptirf pada buffer awal lebih kecil dan hasil dari audio digital lebih jernih. Bit slicing pada MPEG-4 BSAC:



System specification of T-DMB
Video dan audio yang digunakan dalam T-DMB video dan visual radio dikodekan menggunakan MPEG-4 H.264/AVC video codec dan  MPEG-4 error resilient BSAC or MPEG-4 HE AAC. Stream dasar dalam pengkodean menggunakan multiplexing bersamaan dengan MPEG-4 BIFs yang digunakan untuk transportasi dua arah. MPEG-4 menentukan standar sistem untuk packetization, sinkronisasi, dan multiplexing, tetapi juga menentukan informasi penting seperti deskripsi adegan (scene), deskripsi objek, dan sinkronisasi berbagai jenis media stream untuk mendeskripsikan isi kode dari multimedia interaktif.
Berdasarkan MPEG-4 BIFs, deskripsi adegan membahasi pengorganisasian audio visual objek dalam sebuah adegan baik dari segi atribut spasial maupun temporal. Deskripsi objek mengidentifikasi dan menjelaskan media stream secara tepat untuk deskripsi adegan. T-DMB menggunakan profil inti MPEG-4 level 1 untuk deskripsi adegan dan grafis dalam siaran interaktif. Dalam menggunaan infrastruktur transportasi, MPEG-2 pada T-DMB yang bersifat interaktif dalam hal jumlah variabel media stream (audio, video) dijelaskan oleh MPEG-4. Dalam pengaplikasian mekanisme lain, multiplexing digunakan untuk membawa isi MPEG-4 ke sistem MPEG-2 yang disebut “MPEG-4 over MPEG-2 standard”. Sistem spesifikasi pada T-DMB:



ATSC FOR NORTH AMERICA TERRESTRIAL VIDEO BROADCASTING

The Advanced Television Systems Committee (ATSC) digital television (DTV, A/53) standar dideskripsikan menggunakan sebuah sistem yang dirancang untuk mengirimkan video dan audio berkualitas tinggi beserta tambahan data dalam satu MHz terrestrial televise 6 saluran siaran. Penekanan desain pada kualitas mengakibatkan munculunya HDTV digital dan multichannel surround sound. Standar ATSC digambarkan dalam beberapa layer arsitektur yang memisahkan format gambar, pengkodean kompresi, transportasi data, dan transmisi, seperti gambar berikut:



Video and audio subsystems in ATSC

ATSC standar menggunakan sintaks MPEG-2 video streaming untuk pengkodean video dan AC3 untuk pengkodean audio. ATSC DTV standar mendefinisikan 6 format video untuk HDTV dan format video untuk SDTV. Berikut  gambar subsistemn video dan audio dalam teknik kompresi data yang tepat untuk penaplikasian pada video, audio, dan data digital:


 Service multiplex and transport in ATSC

Multiplex servisi dan subsistemn transportasi mengacu pada pembagian setiap bitstream menjadi paket – paket informasi, yang secara unik mengidentifikasi setiap paket termasuk jenis paket dan metode interleaving yang tepat atau multiplexing bitstream  paket video, paket bitstream audio, dan bitstream paket data ke dalam mekanisme transportasi tunggal.

RF transmission subsystem in ATSC

Sistem transmisi RF mengacu pada penyaluran penkodean dan modulasi. Saluran coder mengambil bitrstream digital packetized, memformat, dan menambahkan informasi tambahan yang membantu penerima dalam mengeluarkan data asli dari penerima sinyal yang karena gangguan transmisi dapat mengadung kesalahan. Untuk memberikan perlindungan terhadap burst dan kesalahan acak, paket data disisipkan sebelum transmisi dan menambahkan Reed-Solomon kode FEC. Modulasi menggunakan informasi bitstream digital untuk memodulasi carrier pada sinyal yang ditransmisikan.
Data services and interactivity in ATSC

ATSC terdiri dari rangkaian standar penyiaran data yang memungkinkan berbagai layanan data, di mulai dari streaming audio, video, atau layanan teks ke pengiriman data pribadi.  Penerima ATSC diantaranya komputer pribadi, televisi, set-top boxes, dan perangkat lainnya. Secara umum aplikasi data broadcast ATSC ditargetkan untuk konsumen agar dapat mengklasifikasi tingkat kopling pemrograman video seperti:
a.       Penonton dengan layanan data dapat menonton TV secara bersamaan dengan menerima tambahan data (tightly coupled)
b.      Sebuah program TV dimungkinkan dapat mengirim tambahan data yang berhubungan dengan program tetapi tidak disinkronisasikan dengan waktu (loosely coupled)
c.       Saluran virtual yang dimaksudkan untuk melihat secara real-time (non-coupled)
Advanced common application platform (ACAP, A/1010) merupakan standar platform yang digunakan oleh ATSC untuk iTV / layanan televise interaktif. Di bawah ACAP, pemrograman interaktif berjalan pada satu platform yang disebut receiver, berisi arsitektur yang terdefinisi dengan baik, eksekusi model, sintaksis, dan semantik.

ISDB DIGITAL BROADCASTING IN JAPAN

Digital broadcasting yang ada di Jepang didasrkan pada sistem serbaguna yang disebut  integrated services digital broadcasting (ISDB). Sistem ISDB dirancang untuk memberikan layanan informasi digital terpadu yang terdiri dari audio, video, dan data melalului satelit, terrestrial atau TV kabel saluran transmisi jaringan. ISDB dirancang untuk memungkinkan sistem mengakomodasi layanan baru seperti audio dan video berkualitas penyiaran data yang tinggi melalui digitalisasi saluran transmisi yang baik.
Pada tuahun 2000 Jepang meluncurkan penyiaran HDTV satelit pertama di dunia yang disebut BS, terdiri dari 1090 baris pemindai efektif (interlaced) sebagai format input video MPEG-2 pengkodean sumber video sampai 5.1 channel sinyal audio untuk MPEG-2 AAC audio. Berikut merupakan skema arsitektur dari ISDB:


MINDMAP

Saturday, November 2, 2013

DIGITAL VIDEO CODING

Berbeda dengan pengkodean pada gambar, terdapat banyak isu dan format di dalam pengkodean pada video:
a.       Chroma Subsampling
Karena jumlah data yang dibuthkan untuk diolah jauh lebih besar, maka chroma subsampling merupakan hal yang cukup penting pada beberapa format yang ada.
b.      Intraframe Compression
Teknik ini hampir sama dengan yang digunakan pada pengkodean untuk frame gambar, seperti JPEG. Teknik ini digunakan untuk menghapus redudansi pada satu frame, yang kemudian digunakan sebagai refrensi untuk IFS kompresi.
c.        Interframe Compression
Teknik ini merupakan teknik yang paling berbeda dan penting dalam pengkodean video. Interframe compression berguna untuk menghilangkan redudansi temporal antara frame yang sering disebut sebagai estimasi gerak dan komprensasi.
d.      Entropy Coding
Hampir sama dengan entropy coding pada pengkodean gambar JPEG.

COMPRESSION TECHNIQUES FOR DIGITAL VIDEO CODING


Pengkodean pada video bertujuan untuk pengurangan bitrate dalam penyimpanan dan transmisi dengan menggunakan redudansi, baik pada statistik dan subjektif untuk mengambil kelebihan dari informasi probabilistik menggunakan teknik pengkodean entropi yang mengurangi simbol encoding length losslessly. Kompresi video yang tinggi dapat terjadi dengan menurunkan kualitas video, mengukur frame-by-frame (atau rata-rata temporal) puncak rasio signal-to-noise (PSNR). Teknik yang digunakan dalam pengkodean video:

Simple Techniques

Teknik kompresi yang paling sederhana biasanya digunakan untuk very-low-complexity untuk kompresi lossless. RLC merupakan teknik yang berguna untuk kompresi lossless pada simbol – simbol set terbatas yang memiliki frekuensi tidak merata.  Ketika dikombinasikan dengan entropy coding, Huffman code, atau arithmetic coding, RLC menjadi teknik yang sangat efektif dalam mengkonversi data dari satu representasi simol ke representasi simbol lain yang lebih memadai untuk entropy coding. Sebagai contoh dapat dilihat pada konversi koefisien DCT terkuantisasi menjadi representasi menengah yang digunakan pada format JPEG.

Subsampling and Interpolation

Hampir semua teknik pengkodean video menggunakan subsampling chroma. Prinsip dasar penggunaan subsampling chroma adalah mengurangi dimensi spasial komponen chrominance dari masukan video, sehingga jumlah pixel harus dikodekan sebelum proses encoding dapat dikurangi. Subsampling chroma untuk mengurangi dimensi spasial juga diterapkan dalam temporal direction untuk mengurangi frame rate sebelum pengkodean.


Entropy Coding

Merupakan salah satu elemen paling dasar dalam standar pengkodean multimedia saat ini, terutama dalam mengubah domain atau teknik pengkodean prediktif. Entropy coding dapat didahului dengan run-length.

Predictive Coding and Motion Estimation

Ketika terdapat korelasi antara spasial atau temporal pixel berdekatan atau merubah domain koefisien, predictive coding dapat diterapkan secara efektif. Dasar dari sistem predictive coding, prediksi perkiraan pixel / perubahan koefisien harus dikodekan berasal dari pengkodean informasi kode sebelumnya yang telah dikirimkan. Perbedaan antara actual pixel atau transformasi koefisien dan nilai prediksi biasanya terkuantisasi dan kode entropi, hal ini dikenal dengan teknik diferensial pulsecode modulasi (DPCM). Metode predictive coding juga dapat dikombinasikan dengan run-length coding procedure.
Hampir semua standar kompresi video menggunakan teknik estimasi blok, satu gerak vector diasumsikan mewakili satu gerakan blok (biasa disebut dengan macroblock) dari pixel yang berdekatan ketika adanya korelasi temporal antara dua frame yang berdekatan sedang digunakan. Keuntungan dari menggunakan fixed-size block adalah adanya algoritma yang simple dan fakta bahwa tidak ada segmentasi informasi yang perlu ditransmisikan.

CODEC

Terdapat beberapa macam CODEC yang digunakan pada pengkodean video, yaitu:
1.       MPEG-1
Digunakan untuk penyimpanan media dan transfer rate tinggi
1.      MPEG-2
Digunakan pada pemanfaatan SDTV hingga HDTV supaya mempunyai kemampuan yang lebih baik
2.      MPEG-4
Beda dengan codec sebelumnya, MPEG-4 ini ditambahkan audio dan visual yang biasa kita kenal AV.
3.      MPEG-4 AVC
Digunakan sebagai standard pengkompresian H.264/AVC, dan dijadikan sebagai standar akhir pada ITU-T Video Coding Experts Group (VCEG) serta ISO/IEC Moving Picture Experts Group (MPEG).
4.      WMV-9
Codec terbaru pada suite ini didasakan pada teknologi yang dapat mencapai kualitas state-of-the-art kompresi kualitas video dari bitrate yang sangat rendah.

MINDMAP

Tuesday, October 29, 2013

DIGITAL IMAGE CODING

Kompresi citra merupakan suatu aplikasi dari teknik kompresi gambar digital dua dimensi l(x,y) untuk mengurangi redudansi data gambar dalam penyimpanan atau transmisi dalam bentuk yang lebih efisien. Kompresi gambar dapat diklasifikasikan ke dalam dua kategori, yaitu:
·         Lossless
Kompresi lossless mempunyai rasio kompresi yang lebih kecil dibandingkan dengan kompresi lossy, kompresi ini memiliki kelebihan pada gambar yang mempunyai distribusi probabilitas seragam untuk sebuah representasi panjang variable dari pixel gambar. Jenis kompresi ini biasa digunakan untuk menggambar teknis, ikon atau komik, foto atau gambar untuk keperluan medis, dan gambar scan untuk keperluan arsip.
·         Lossy
Kompresi lossy mempunya rasio kompresi yang sangat tinggi, di mana ketika mencapai suatu rasio tertentu dapat disebut sebagai kompresi artifact. Teknik kompresi ini baik untuk digunakan pada gambar – gambar natural, seperti foto.

BASIC OF INFORMATION THEORY FOR IMAGE COMPRESSION



Setiap simbol dapat direpresentasikan menjadi m­-tuple (m-dimensional), dan difenisikan dengan:
ENTROPY CODING
Entropy coding merupakan skema pengodean yang memberikan kode pada simbol untuk mencocokkan panjang kode dengan probabilitas dari simbol. Entropy encoder biasanya digunakan untuk kompresi data dengan mengganti simbol yang memiliki panjangan kode sama dengan simbol diwakili oleh kode yang panjang setiap codeword sebanding dengan probabilitas logaritma negatif. Oleh karena itu, simbol yang paling umum menggunakan kode terpendek. Dua teknik penkodean entropi yang paling popular ada Huffman coding dan arithmetic coding.

Huffman Coding

Dikembangkan oleh David A. Huffman, sebuah entropy encoding algoritma yang digunakan untuk kompresi data lossless. Teknk ini bekerja dengan menggunakann variable length binary code untuk encoding satu set simbol. Tabel variable length code didasarkan pada perkiraan terjadinya probabilitas dari setiap nilai yang mungkin dari simbol. Huffman coding menggunakan metode khusus untuk menentukan representasi setiap simbol dan hasilnya di dalam sebuah prefix. Huffman code menggambarkan simbol yang memiliki frekuensi paling tinggi / paling sering keluar dengan bit string yang lebih pendek dibandingkan yang memiliki frekuensi keluar rendah. Huffman metode kompresi paling efisien pada tipe ini.
Huffman coding sering digunaan sebagai ”back – end” dengan beberapa metode kompresi lainnya. PKZIP codec dan beberapa codec multimedia seperti JPEG dan MPG memiliki front-end skema kompresi lossy yang diikuti oleh lossless huffman coding. Beberapa sifat properti yang terkait dengan Huffman code:
1.      Blok Code
Setiap simbol dipetakan ke dalam urutan sekuen yang tetap (variable - length) kode simbol, tanpa perubahan yang dinamis selama berlangsungnya penggabungan simbol
2.      Instantaneous (Prefix – Free) Code
Decoding  terjadi tanpa mengacu pada urutan simbol tersebut.
3.      Uniquely decodable
Setiap string dari kode simbol diterjemahkan dalam satu cara
4.      Close to Entropy
Rata – rata panjangan kode L, dekat dengan ekspektasi jumlah yang diharapkan dari informasi, entropi H

Arithmetic Coding

Meskipun Huffman coding optimal untuk pengkodean setiap simbol dengan input distribusi probabilitas yang diketahui, arithmetic coding terkadang memiliki kemampuan kompresi yang lebih baik. Dalam penerapanya, arithmetic coding dimulai dengan Huffman coding karena lebih mudah untuk menemukan arithmetic coding dengan menggunakan biner. Arithmetic coding terdiri dari non-block code dengan korespondensi satu – satu antara source dan simbol codeword dari Huffman.
Algoritma kompresi yang menggunakan arithmetic coding dimulai dengan menentukan model probabilistic dari data yaitu dengan memprediksi pola yang akan ditemukan dalam simbol – simbol pesan. Semakin akurat prediksi yang dihasilkan, maka output yang dihasilkan akan semakin optimal.

Context Adaptive Binary Arithmetic Coding (CABAC)

CABAC merupakan teknik yang efisien untuk kondisional entropy coding. Teknik ini biasanya diterapkan pada pengkodean gambar untuk kompresi dokumen level bi (bi-level documents), contohnya gambar hitam dan putih atau gambar faks. Umumnya di dalam CABAC, sebuah array dari variabel dengan masing – masing nilai terkait didefinisikan untuk mewakili distribusi probabilitas yang berbeda (geometris). Sistem CABAC menerapkan mekanisme adaptasi sensitif backward untuk menghitung probabilitas input binary symbol.

Run – Length Coding (RLC)

Skenario yang buruk dari Huffman coding akan terjadi ketika probabilitas dari sebuah simbol lebih besar dari 2-1 – 0.5. Hal ini juga akan terjadi ketika dua source simbol dengan probabilitas yang tidak sama ter-encoded. Kedua situasi ini akan lebih baik jika di-encode menggunakan arithmetic coding atau RLC. RLC akan meng-encode sekuen dari simbol binary dengan data yang berjalan. RLC akan bekerja dengan method lossless coding yang merekam jalannya satuan nilai data dan menghitung lebih akurat dari yang sebelumnya dijalankan.
RLC encoding biasanya dikombinasikan dengan teknik lain, seperti Huffman coding untuk menghasilkan teknik kompresi data yang sangat efisien. RLC method juga dapat digunakan dalam kasus dua dimesi, ketika diketahui alamat pengkodean realatif (RAC) yang biasa digunakan di JBIG2 untuk kompresi dokumen fax bewarna. Penggunaan RLC lebih jauh di manfaatkan pada sekuen multiple simbol dengan satu simbol yang memilii probabilitas lebih tinggi dibandingkan dengan simbol lainnya.

LOSSY IMAGE COMPRESSION
Kompresi lossless tidak cukup baik untuk melakukan kompresi pada gambar yang memiliki bitrate rendah. Melihat kebutuhan yang ada, melalui teknik kompresi lossy kita perlu melakukan pendekatan lebih yang memperhatikan distorsi dan sinyal dari proses kuantisasi. Kuantisasi dapat dijalankan secara spasial atau pada transformasi domain. Hampir semua contoh spasial / transformasi domain dari suatu gambar dapat diasumsikan dengan nilai yang dapat dijelaskan.
Kuantisasi merupakan sebuah non-linear dan operasi irreversible yang dipetakan secara berkelanjutan dalam suatu nilai skalar, yang di mana level dari indeks dapat direpresentasikan dengan sebuah nilai finite number L dari bit. Terdapat dua tipe berbeda dari kuantisasi:
a.       Uniform Quantization
Mendefinisikan set finite dari nilai yang dikombinasikan dengan ruang tertentu untuk memilih bentuk
b.      Non – Uniform Quantization
Terbagi secara tidak beraturan dengan range kuantisasi 2z level yang mungkin dengan ruang yang berbeda
JOINT PHOTGRAPHIC EXPERTS GROUP (JPEG)
JPEG merupakan salah satu standar pengkodean gambar yang cukup terkenal dan komprehensif. Nama JPEG diambil dari komite yang menciptakan kompresi gambar dengan teknik lossy standar ISO/IEC 10918-1/2/3 pada tahun 1994 yang dilanjutkan dengan pewarnaan grayscale dan non-grayscale.
Banyak parameter yang terasosiasi dengan teknik kompresi JPEG. Dengan merubah suatu parameter , dapat menyebabkan ukuran gambar yang dikompres merekonstruksi kualitas dalam range yang cukup besar. Biasanya threshold yang terlihat berbeda dari gambar yang sebenarnya dari rasio kompresi berada di sekitas 10 hingga 20, 1 hingga 2 bit per pixel warna.
Terdapat 3 perbedaan melakukan pengkodean menggunakan mode JPEG, yaitu:
1.      A Lossy Baseline Mode, biasa disebut sebagai penggunaan sekuensial dasar dengan menggunakan teknik kompresi berdasarkan DCT hampir di semua aplikasi. Gambar ter-encode dengan menggunakn single left-to-right, top-tobottom scan.
2.      An Extended Coding Mode, digunakan untuk kompresi dengan hasil yang baik dan ketelitian yang lebih tinggi. Gambar ter-encode dengan menggunakan multiple scan / multiple coarse-to-clear-passes.
3.      A Losssless Encoding Mode, gambar ter-encode dengan ekstrak recovery setiap contoh nilai dari source, sekalipun kompresi ini sulit untuk dibandingkan dengan mode lossy.
DCT-based sequential berdasarkan enkoder:
DCT-based sequential berdasarkan dekoder:
Source Image Data Preparation: Chroma Subsampling

Block – Based Discrete Cosine Transform
Untuk setiap komponen gambar yang menggunakan atau tidak menggunakan chroma subsampling, kita akan mengelompokkan nilai pixel {f(x,y)} menjadi 8 x8 blok untuk discrete transform (DCT), di mana menghasilkan nilai yang sebenarnya dan energy compact frekuensi yang dipetakan {F(u,v)} dari data dua dimensi. Penggunaan DCG digunakan pada informasi yang berfrekuensi tinggi yang tidak terlihat seperti informasi berfrekuensi rendah. Forward DCT (FDCT) dan Inverse DCT (IDCT) untuk 8x8 blok gambar, ditunjukkan dengna persamaan:

 Quantization of DCT Coefficients
Setelah mendapatkan hasil dari FDCT, masing masing 64 koefisien DCT F(u,v), dikuantisasi menggunakan prespecified 64 element yang di dapat dari tabel kuantisasi (normalisasi matrix). Kuantisasi proses ditunjukkan dengan persamaan:
Objektif dari langkah – langkah kuantisasi untuk menghilangkan informasi yang terlihat tidak signifikan. Koefisien berfrekuensi tinggi terkuantisasi lebih akurat dibandingkan dengan yang berfrekuensi rendah. Dekuantisasi merpakan fungsi invers yang mengambil koefisien FDCT dikalikan dengan ukuran langkah Q(u,v) yang mengembalikan hasil untuk representasi nilai yang dijadikan sebagai masukan ke IDCT.

DC Coding and Zigzag Sequence

Hasil dari kuantisasi, koefisien DC biasanya memiliki nilai yang cukup besar. Karena adanya korelasi yang kuat antara koefisien DC pada matriks adjensi 8x8 blok, koefisien DC yang terkuantisasi ter-encode berbeda dari DC yang sebelumnya ada pada blok di encoding order. Terakhir, semua koefisien kuantisasi tersusun menjadi zigzag sekuen.


Entropy Coding

Digunakan untuk memenuhi beberapa tambahan pada kompresi losslessly dengan meng-encode multiple-symbol menggunakan RLC sekuen, dari masing – masing karakteristik statisktik.

Header Information and JPEG Decoding

Dalam keadaan perubahan yang normal pada berkas JPEG, semua parameter kompresi berada di dalam header, sehingga decoder dapat mengembalikan proses. Parameter ini termasuk quantization table dan Huffman coding table.

Trading Off Compression and Picture Quality

Pada gambar berwarna dengan bagian yang cukup komplreks, semua mode berbasis operasi DCT biasanya akan menghasilkan kualitas gambar pada rentang kompresi tertentu. “Bit per pixel” menunjukkan jumlah bit yang dikompres pada gambar, termasuk komponen pencahayaan. Terbagi menjadi 4 rentang pencahayaan:
1.      0.25 – 0.5 bits/pixel
2.      0.5 - 0.75 bits/pixel
3.      0.75 – 1.5 bits/pixel
4.      1.5 – 2.0 bits/pixel
JPEG Progressive Mode
Mode JPEG progressive dibuat dengan tujuan untuk mendukung transmisi gambar secara real-time, di mana hasil yang memiliki kualitas rendah dapat dikirim dan diikuti dengan tetap cepat secara halus dalam waktu yang memungkinkan.
JPEG Hierarchical Mode
Mode ini digunakan untuk merepresentasikan sebuah gambar pada beberapa resolusi. Dengan menggunakan konsep skala spasial, gambar beresolusi tinggi dapat dikodekan sebagai perbedaan dari gambar berikutnya yang lebih kecil dan hanya membutuhkan sedikit bit jika dibandingkan disimpan secara independen pada resolusi yang lebih tinggi. Berikut langkah – langkah melakukan encoding:
1.      Mem-filter downsample dari gambar yang asli
2.      Meng-encode reduced-size menggunakan sekuens DCT, progresif DCT, atau lossless encode
3.      Decode reduced-size gambar
4.      Menggunakan gambar sebagai prediksi reslusi dari gambar yang asli
5.      Mengulangi langkah ke-3 dan ke -4
JPEG Lossless Mode
Mode JPEG ini tidak dapat digunakan pada DCT dikarenakan adanya kesalahan pembulatan oleh kuantisasi koefisien DCT.
JPEG Codestream
JPEG Codestream diilustrasikan sebagai berikut:


 
JPEG  2000
Meskipun penggunaan kompresi gambar menggunakan JPEG 2000 sudah sering digunakan, tetapi kompresi ini memiliki banyak sekali kekurangan, beberapa kekurangan tersebut diantaranya:
1.      Distortion and Artifacts
2.      Ineffective Handling of High Quality Images
3.      Lock of effective color-space support
4.      Ineffective Progressive and Hierarchical Modes
5.      Poor Lossless Compression Performance
Untuk menutupi kekurangan yang ada, makan diciptakan algoritma kompresi JPEG 2000. JPEG 200 merupakan standar kompresi gambar yang berbasis wavelet. Beberapa kelebihan JPEG 2000:
1.      Superior Compression Performance
2.      Multiple Resolution Representation
3.      Progressive Transmission by Pixel and Resolution Accuracy
4.      Lossless and Lossy Compression
5.      Random Codestream Access and Processing
6.      Error Resilecnce
7.      Sequential Buildup Capability
8.      Flexible File Format
Technical Overview of JPEG200
Preprocessing
Spesifikasi RCT:
Inverse RCT:
Discrete Wavelet Transform and Quantization
Lifting algoritma yang digunakan pada wavelet transform:
1.      Split step
2.      Lifting step
3.      Normalization step
Codeblock and Precinct Partition
Contoh parttisi dari wavelet subband
MINDMAP