ana sayfa : araştırma : mpeg görüntü : diğer sayısal görüntü standartları [ 9 / 9 ] |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
GERİ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
BÖLÜM 9DİĞER SAYISAL GÖRÜNTÜ STANDARTLARITablo 9.1 sayısal görüntü standartlarının faklı ailelerine genel bir bakış içermektedir. Sol sütunda alan adları listelenmiştir. Aileye dahil olan bazı standartlar orta sütunda listelenmiş ve her standardın maksadı sağdaki sütunda yer almıştır. Bu tablo, tam bir görüntü uygulaması oluşturabilmek için ne kadar çok standarda ihtiyaç olduğunu açıkça göstermektedir. Tablo 9.1 - Sayısal Görüntü Standartları ve İlgili Standartlar
9.1 px64 Tele Konferans Standardıpx64
ailesi 64 kbit/s 'den 2 Mbit/s 'e kadar olan değerlerde çalışan bir tele
konferans standardıdır. ITU-T Rec. H.261 görüntü bölümü tek başına
bütün bir sistem oluşturmak için yeterli değildir. ITU-T Rec. H.221 ses
ve görüntü paketleri çoklamak için kullanılan söz dizimini tanımlar.
ITU-T Rec. H.230 ise telefon sistemi kurmaya kalkışan terminallerin
yeterliliklerini belirleyen ilk tokalaşmayı (initial handshake) tanımlar.
ITU-T Rec. H.242 (1993'de basılan versiyonu)sesli görüntü terminalleri
arasında iletişim kurmak için sistem kontrol protokolü sağlar. ITU-T
Rec. H.320 MPEG sistemlerine benzemektedir. Tamamıyla bir sistem tanımlamak
için gerekli olan diğer tüm tavsiyeleri anlatır. standart ailesi resmi
olarak H.320 olarak bilinir. Ses
standartları içinse birkaç farklı seçenek vardır. ITU-T Rec. G.711
kodlanmış ses için hazırdır. Örnekleme 8 bit/örnek'tir ve 8000 örnek/s
vardır. m-kanunu ve A-kanunu sıkıştırmalarını
kullanır. ITU-T Rec. G.722, 64 Kbit/s'de 7 kHz'lik ses kodlamasını sunar.
Buna rağmen daha iyi bir kodlama verimini ITU-T Rec. G.728 sağlamaktadır.
Çünkü bu, 16 Kbit/s'de düşük beklemeli kod-uyarılı (low-delay code-excited
linear prediction - LD-CELP) lineer kestirim sağlamaktadır. 9.2 Düşük Bit Oranlı Tele Konferans StandardıDüşük
bit oranlı iletişim tele konferans (low-bitrate communication - LBC)
ailesi px64 ailesinden daha yenidir. ITU-T Draft Rec. H.263, MPEG-1 ve MPEG-2
özelliklerini bulunduran tele konferans uygulamalarında kullanılan düşük
bit oranlı bir görüntü standardıdır. ITU-T Rec. H.324 düşük bit
oranında terminal sistem yeterliliği sağlar. ITU-T Rec. H.245 kontrol
protokolünü kurar ve ITU-T Rec. H.223 görüntü karıştırma ve konuşma
verisi bit akışları için çoklama protokolünü tanımlar. ITU-T Rec.
G.723 (1995'de basıldı) 5.3 Kbit/s ve 6.3 Kbit/s'de düşük bit oranlarında
konuşma sağlar ve bunu cebrik kod uyarılı lineer kestirimle (ACELP)
yapar. 9.3 American TV StandardıGelişmiş
Televizyon Sistemleri Komisyonu (Advanced Television Systems Committee -
ATSC) 1987 yılında Amerikan karasal televizyon iletim standardını, 1953
NTSC standardına halef olacak şekilde kurmak için kiralandı. Bu standart
çalışması halen gelişme içersinde fakat bir çok önemli teknik
detayları karara bağlanmıştır. ABD
Gelişmiş TV (ATV) sistem karakteristikleri 1995 sayısal televizyon
standardında tanımlandı ve kullanım için bir rehberde yer aldı.MPEG-2
görüntü ve sistemleri temeline dayanır fakat ses'e değil. Onun yerine
Dolby AC-3 ses sıkıştırması kullanılmıştır. ATSC
dağıtım teknolojisi grubu (T3) HDTV iletimi için sayısal TV standardı
hazırladı. T3 komisyonu üyeleri oylama ile 23 Şubat 1995'de onaylandı.
Ve hazırladıkları doküman 12 Nisan 1995'de onaylandı. A/52
dokümanı ses temsilini anlatmaktadır (Dolby AC-3). HDTV görüntü yapısı
MPEG-2 an profiline dayandırıldı. Sınırlamalar ve seviyeler A/53 ve
A/54 dokümanlarında bulunabilir. Program rehber bilgileri A/55 dokümanında
anlatıldı. HDTV taşıma katmanı A/56 dokümanında yer aldı. Kablolu
televizyon versiyonu IEEE 802 standardı olarak standartlaştırıldı. Uydu
ve kablo iletimi CableLabs çalışma grubu (WG) içinde tanımlandı. 9.4 European DVB StandardıAvrupa
Sayısal Görüntü Yayını (The European Digital Video Broadcast - DVB)
konsorsiyumu 1993 yılında kuruldu. 25 ülkeden 200'den
fazla özel ve genel organizasyonlar (80'den fazla şirket içererek)
üye olarak katıldı veya üye olarak düşünüldüler. Bu grup bir doküman
grubu üretti. Bu dokümanlar şunları içermekteydi: taşıma, teletext,
kablolu iletim, uydu iletimi, SMATV dağıtım sistemleri ve Avrupa için
karasal iletim. Tüm bu sistemler MPEG-2 sistemleri, görüntüsü ve sesini
kullanmaktadır. 9.5 Sayısal Görüntü Konsorsiyumu StandardıSayısal
görüntü kaseti (Digital Video Casette - DVC) konsorsiyumu profesyonel
kalitede görüntü kaydı için yeni bir 6 mm teyp formatı tanımladı.
Halihazırda bulunan çözüm 25 Mbit/s'de görüntü kaydını MPEG-2 çerçeve
içi kodlama tekniğine benzer bir teknikle yapmaktaydı. Kodlama metodu
bireysel makroblokları iki alandada kodlama yeteneğine ve uyarlamalı
nicelendirme beraber çerçeve formatına sahipti. 9.6 Motion JPEG StandardıYukarıdaki
tabloda son giriş hareketli JPEG (Motion JPEG) olmuştur. JPEG ismi birleşik fotoğraf uzmanları grubu (joint photographic experts group)'nun
baş harflerinin birleşiminden oluşturulmuştur. Bu sabit görüntü sıkıştırma
standardı (yani sadece resim içi kodlama kullanan) hareketli resimleri biçimlendirme
uygulamalarında sıklıkla kullanılmaktadır. 1989'dan sonra resim içi
kodlama yapılmayınca ve gerçek zamanlı görüntüden yüksek kalitede
resim yakalama olayı imkanlı oldu. Orijinal dizilimler sanki yüksek
kalitede bağımsız JPEG görüntü dizileri gibi düşünülerek
kodlanmaya başlandı. Sadece en son biçimlendirilen versiyonu MPEG'e dönüştürüldü.
MPEG sıkıştırılmış resimleri ortaya çıktıktan sonra farklı MJPEG
uygulamaları dizilimler için patentli protokoller kullandı. Bununla
beraber 1995'de açık doküman konsorsiyumu (Open Doc Consortium-ODC) MJPEG için
genel bir yayın çıkardı. 9.7 ITU-T Rec. H.261 StandardıHareketli
görüntülerin kodlanması için JPEG algoritmasından hareketle değişik
algoritmalar geliştirilmiştir. Bunlardan ilki ITU-T Rec. H.261
video-telefon standardıdır. ITU-T Rec. H.261 standardı kısaca p*64
olarak da adlandırılır. Çünkü veri hızı p
kere 64 KB/s olarak ayarlanmaktadır. Görüntülü telefonda p=1
yani hız 64 KB/s alınır. p=32
seçilirse 2 MB/s hızında tele konferans için kullanılan yüksek
kaliteli görüntü elde edilebilir. Bu kodlama sisteminde hem çerçeve içi
hem de çerçeveler arası ilişkilerden yararlanılarak çok daha yüksek
bir sıkıştırma elde edilmiştir. Çerçeve içi sıkıştırmada
JPEG’de olduğu gibi dönüşüm teknikleri (DCT), çerçeveler arası sıkıştırmada
ise kestirimci (Predictive) kodlama teknikleri kullanılır. Yukarda
da bahsedildiği gibi devre iki ana bölümden oluşmuştur. Önce görüntü
sayısallaştırılıp ayrık kosinüs dönüşümü (DCT) uygulanır ve değişken
uzunluklu uyarlamalı nicelendirme (quantization) tekniği ile veri hızı
en aza indirilir. Daha sonra görüntüde hareket kestirilip çerçeveler
arası ilişki bulunur. Buradan hareketle bir sonraki resmin ne olması
gerektiği kestirilip, kestirilmiş çerçeve ile yeni gelen çerçevenin
farkı alınır. Kodlamada sadece bu farkın karşı tarafa iletilmesi
yeterlidir. Ancak başlangıç için ilk çerçevenin tam olarak gönderilmesi
gerekir. Bunu mod seçici devre sağlar. Eğer hata çok büyükse resmin
tamamı, aksi halde sadece fark gönderilir. Buradan hareketle alıcıda
resimlerin peş peşe oluşturulması mümkündür. Bu yöntemle, veri hızının
büyük oranda düşürülmesi yani sıkıştırma yapılabilmektedir. İki
çerçeve arasındaki farkın alınabilmesi için bir çerçevelik görüntünün
hafızada saklanması gerekir. Ayrıca iletim sırasındaki hataları önlemek
için bir hata kodlaması yapılır. Alıcıdaki
kod çözme devresi nispeten daha basittir. Çünkü
kodlayıcıda hem dönüştürücü
hem de ters dönüştürücü bulunmasına karşılık burada sadece ters dönüştürme
işlemleri yapılır. Tablo 9.2’de H.261 ile MPEG karşılaştırılmıştır. Tablo 9.2 - H.261 İle MPEG'in Karşılaştırılması
9.8 TASLAK ITU-T Rec. H.263 StandardıBir
başka MPEG benzeri tele konferans görüntü standardı da H.263'tür. Düşük
bit oranlı iletimde (LBC) kullanılmak üzere görüntü kodlaması için
geliştirildi. H.263'ün alanının açıklığı kendisinin görüntü
kodlamasının H.261 tabanına dayandığını itiraf eder. ITU-T Rec. H.262
(MPEG-2 görüntü) de aynı zamanda referanslardan birisidir. H.263 MPEG'de
olduğu gibi kestirim ve hareket kompanzasyonu ile birlikte blok ve
makrobloklara sahiptir. MPEG çalışma-seviye metodlarını kullanarak
zikzak nicelendirme katsayıları kullanılmıştır fakat farklı
tablolarla. 4
tane opsiyonel mod H.263 standardının
işlevselliğini arttırır. Birincisi, sınırlandırılmamış
hareket vektör modudur. Bu mod kayıp örneklerin yeniden oluşturulabilmesi
için köşe örneklerine ve resim dışı referanslara izin verir. Ayrıca
geniş hareket vektörlerine de izin verir. İkincisi, aritmetik kodlama
modudur. Bu mod değişken uzunluk kodlarının yerlerini değiştirir.
Aritmetik kodlama modu aynı kalitedeki resmin daha düşük oranda kodlanmış
bitlerde oluşmasını sağlayarak kodlama verimini arttırır. Üçüncüsü
gelişmiş kestirim modudur. Bu mod P- resimleri için her 8x8'lik aydınlık
bloğa ait hareket vektörlerini gönderir. Dördüncü mod PB-çerçeve
modudur. Bu mod iki resmi tek bir ünite olarak kodlar. Bir P- resmi daha önceki
bir resme referans alınarak kodlanır ve bir B- resmi de iki P- resmi
kullanarak kodlanır. P- resmindeki makroblok B- resmindeki uygun makroblok
tarafından hemen takibe alınır. H.261'e ek olarak H.263 bir adet daha küçük
ve iki tane de daha geniş formatlı görüntüyü desteklemektedir. 9.9 JPEG Standardı
Şekil 9.1 - JPEG kodlayıcı blok şeması(DCT: Ayrık Kosinüs Dönüşümü; Q: Nicelendirme; VLC: Değişken Uzunluklu Kodlama)
Bundan
sonra her bloğa iki boyutlu Ayrık
Kosinüs Dönüşümü (Discrete
Cosine Transform, DCT) uygulanarak 64 katsayı elde edilir. Bu katsayılar
görüntü bloğunun frekans bileşenlerini gösterir ve yine iki boyutlu
olarak 8x8’lik bir matrisle gösterilir. Sol üst köşedeki sayı bloğunun
sıfır frekanslı yani doğru akım (DC) bileşenini gösterir. Soldan sağa
gidildikçe artan yatay frekanslı bileşenler, üstten alta doğru gidildikçe
de artan düşey frekanslı bileşenlere karşı düşen değerler elde
edilir. Örnek olarak eğer bütün blok aynı değerlerde bir gri
seviyesine ise sadece DC bileşen vardır ve sol üst köşe dışındaki bütün
değerler sıfırdır. Bu
matris zikzak biçiminde taranarak iki boyutlu matris tek boyutlu 64 katsayı
elde edilir. Zikzak tarama ile katsayılar sıfırdan (DC) başlayarak en yüksek
uzamsal sıklığa doğru sıralanmış olur. Bundan sonra değişken ağırlıklı
nicelendirme işlemine geçilir. Yüksek sıklıktaki bileşenler fazla önemli
olmadığından daha geniş adımlı, alçak frekanslı bileşenler ise daha
önemli olduğundan daha küçük adımlı (daha fazla basamaklı) olarak
nicelendirilir. Son
adım değişken uzunluklu Huffman
kodlamasıdır. Değerler yine önem sırasına göre değişen uzunluktaki
bit dizileri ile gösterilir. Böylece toplam bit sayısı en aza indirilir.
DC bileşeni farksal olarak kodlanır. Yani DC bileşenin değeri değil bir
önceki blokla işlenmekte olan bloğun DC bileşenlerinin farkı kodlanır.
Tablo 9.3 - Ayrık
Kosinüs ve Değişken Uzunluklu Kodlamaya örnek
Şekil 9.2 - JPEG kod çözücü blok şeması
JPEG
ile MPEG arasındaki farklar; MPEG
temel olarak JPEG'in kullandığı sıkıştırma planıyla aynı planı
kullanır fakat sabit resimler için değil hareketli görüntüler için
dizayn edilmiştir. Buna rağmen belirli farklar vardır; ·
MPEG,
JPEG tarafından açıkta bırakılan bir çok probleme açıklık kazandırır;
örnek olarak; MPEG YCrCb renk modeli gerektirirken
JPEG'de böyle bir gereklilik yoktur. ·
MPEG
Huffman kodlaması gerektirir ve kodlama tablolarına ön tanımlamalar
getirir. Bunun yanında JPEG Huffman kodlaması ve aritmetik kodlamalarının
ikisine de izin verir ve kodlama tablolarını önceden açıklamaz. ·
MPEG
bir görüntü dizisi içindeki her çerçeveyi ayrı ayrı tek ve bağımsız
olarak kodlamaz. Kodlanan verinin büyüklüğünü en aza indirgeme için
dizi içindeki bir çok çerçeve öncekilerden veya sonrakilerden farklılıklar
arz eder. Buna resimler arası kodlama denir çünkü birden fazla çerçeve
gerektirmektedir. ·
MPEG
sadece grafiksel kodlama için bir standart değildir. Ses verileri için de
bir sıkıştırma planı içerir. İlave olarak hem ses, hem görüntü ve
hem de diğer tür verileri tek bir bit akışı içersine sıkıştırarak
depolayabilir. Senkronizeli ve doğru bir şekilde bu veri tiplerini geri
sarma işlemine tabi tutabilir. Bu işlem çoklama
(multiplexing) olarak adlandırılır.
MPEG 32 ses ve 16 görüntü akışlarını eşzamanlı olarak çoklayabilir. |