ana sayfa : araştırma : mpeg görüntü : diğer sayısal görüntü standartları [ 9 / 9 ]

GERİ

BÖLÜM 9

DİĞER SAYISAL GÖRÜNTÜ STANDARTLARI

Tablo 9.1 sayısal görüntü standartlarının faklı ailelerine genel bir bakış içermektedir. Sol sütunda alan adları listelenmiştir. Aileye dahil olan bazı standartlar orta sütunda listelenmiş ve her standardın maksadı sağdaki sütunda yer almıştır. Bu tablo, tam bir görüntü uygulaması oluşturabilmek için ne kadar çok standarda ihtiyaç olduğunu açıkça göstermektedir.

Tablo 9.1 - Sayısal Görüntü Standartları ve İlgili Standartlar

Alan Adı

İlgili Standartlar

Yorumlar

Px64

H.261

H.221

H.230

H.320

H.242:1993

G.711

G.722

G.728

Görüntü

İletişim

İlk Tokalaşma

Terminal Sistemleri

Kontrol Protokolü

Companded Audio (64 Kbit/s)

Yüksek Kalitede Ses (64 kbit/s)

Konuşma (LD-CELP @ 16 Kbit/s)

LBC

H.263

H.324

H.245

H.223

G.723:1995

Görüntü

Terminal Sistemler

Kontrol Protokolü

Çoklama Protokolü

Konuşma (5.3 & 6.3 Kbit/s)

American TV

A/52

A/53

A/54

A/55

A/56

IEEE 802

CableLabs WG

Ses (448 bit/s 'e kadar)

HDTV Karasal İletim

HDTV Alıcıları

Program Kılavuzu

HDTV Taşıma Katmanı

Kablolu TV

Uydu & Kablo İletimi

European DVB

ETR 154

DVB-SI

DVB-C

DVB-S

DVB-CS

DVB-T

DVB-TXT

DVB-CI

Görüntü (MPEG-2)

Taşıma

Kablo İletimi

Uydu İletimi

SMATV Dağıtım Sistemi

Karasal İletim

DVB Bit Akışlarında Teletext

Ortak Arabirim

DVC

ISO

Sayısal Görüntü Kaseti (6 mm.)

MJPEG

JPEG

ODC

Hareketsiz Görüntü Sıkıştırması

Wrapper

 

9.1 px64 Tele Konferans Standardı

px64 ailesi 64 kbit/s 'den 2 Mbit/s 'e kadar olan değerlerde çalışan bir tele konferans standardıdır. ITU-T Rec. H.261 görüntü bölümü tek başına bütün bir sistem oluşturmak için yeterli değildir. ITU-T Rec. H.221 ses ve görüntü paketleri çoklamak için kullanılan söz dizimini tanımlar. ITU-T Rec. H.230 ise telefon sistemi kurmaya kalkışan terminallerin yeterliliklerini belirleyen ilk tokalaşmayı (initial handshake) tanımlar. ITU-T Rec. H.242 (1993'de basılan versiyonu)sesli görüntü terminalleri arasında iletişim kurmak için sistem kontrol protokolü sağlar. ITU-T Rec. H.320 MPEG sistemlerine benzemektedir. Tamamıyla bir sistem tanımlamak için gerekli olan diğer tüm tavsiyeleri anlatır. standart ailesi resmi olarak H.320 olarak bilinir.

Ses standartları içinse birkaç farklı seçenek vardır. ITU-T Rec. G.711 kodlanmış ses için hazırdır. Örnekleme 8 bit/örnek'tir ve 8000 örnek/s vardır. m-kanunu ve A-kanunu sıkıştırmalarını kullanır. ITU-T Rec. G.722, 64 Kbit/s'de 7 kHz'lik ses kodlamasını sunar. Buna rağmen daha iyi bir kodlama verimini ITU-T Rec. G.728 sağlamaktadır. Çünkü bu, 16 Kbit/s'de düşük beklemeli kod-uyarılı (low-delay code-excited linear prediction - LD-CELP) lineer kestirim sağlamaktadır.

9.2 Düşük Bit Oranlı Tele Konferans Standardı

Düşük bit oranlı iletişim tele konferans (low-bitrate communication - LBC) ailesi px64 ailesinden daha yenidir. ITU-T Draft Rec. H.263, MPEG-1 ve MPEG-2 özelliklerini bulunduran tele konferans uygulamalarında kullanılan düşük bit oranlı bir görüntü standardıdır. ITU-T Rec. H.324 düşük bit oranında terminal sistem yeterliliği sağlar. ITU-T Rec. H.245 kontrol protokolünü kurar ve ITU-T Rec. H.223 görüntü karıştırma ve konuşma verisi bit akışları için çoklama protokolünü tanımlar. ITU-T Rec. G.723 (1995'de basıldı) 5.3 Kbit/s ve 6.3 Kbit/s'de düşük bit oranlarında konuşma sağlar ve bunu cebrik kod uyarılı lineer kestirimle (ACELP) yapar.

9.3 American TV Standardı

Gelişmiş Televizyon Sistemleri Komisyonu (Advanced Television Systems Committee - ATSC) 1987 yılında Amerikan karasal televizyon iletim standardını, 1953 NTSC standardına halef olacak şekilde kurmak için kiralandı. Bu standart çalışması halen gelişme içersinde fakat bir çok önemli teknik detayları karara bağlanmıştır.

ABD Gelişmiş TV (ATV) sistem karakteristikleri 1995 sayısal televizyon standardında tanımlandı ve kullanım için bir rehberde yer aldı.MPEG-2 görüntü ve sistemleri temeline dayanır fakat ses'e değil. Onun yerine Dolby AC-3 ses sıkıştırması kullanılmıştır.

ATSC dağıtım teknolojisi grubu (T3) HDTV iletimi için sayısal TV standardı hazırladı. T3 komisyonu üyeleri oylama ile 23 Şubat 1995'de onaylandı. Ve hazırladıkları doküman 12 Nisan 1995'de onaylandı.

A/52 dokümanı ses temsilini anlatmaktadır (Dolby AC-3). HDTV görüntü yapısı MPEG-2 an profiline dayandırıldı. Sınırlamalar ve seviyeler A/53 ve A/54 dokümanlarında bulunabilir. Program rehber bilgileri A/55 dokümanında anlatıldı. HDTV taşıma katmanı A/56 dokümanında yer aldı. Kablolu televizyon versiyonu IEEE 802 standardı olarak standartlaştırıldı. Uydu ve kablo iletimi CableLabs çalışma grubu (WG) içinde tanımlandı.

9.4 European DVB Standardı

Avrupa Sayısal Görüntü Yayını (The European Digital Video Broadcast - DVB) konsorsiyumu 1993 yılında kuruldu. 25 ülkeden 200'den  fazla özel ve genel organizasyonlar (80'den fazla şirket içererek) üye olarak katıldı veya üye olarak düşünüldüler. Bu grup bir doküman grubu üretti. Bu dokümanlar şunları içermekteydi: taşıma, teletext, kablolu iletim, uydu iletimi, SMATV dağıtım sistemleri ve Avrupa için karasal iletim. Tüm bu sistemler MPEG-2 sistemleri, görüntüsü ve sesini kullanmaktadır.

9.5 Sayısal Görüntü Konsorsiyumu Standardı

Sayısal görüntü kaseti (Digital Video Casette - DVC) konsorsiyumu profesyonel kalitede görüntü kaydı için yeni bir 6 mm teyp formatı tanımladı. Halihazırda bulunan çözüm 25 Mbit/s'de görüntü kaydını MPEG-2 çerçeve içi kodlama tekniğine benzer bir teknikle yapmaktaydı. Kodlama metodu bireysel makroblokları iki alandada kodlama yeteneğine ve uyarlamalı nicelendirme beraber çerçeve formatına sahipti.

9.6 Motion JPEG Standardı

Yukarıdaki tabloda son giriş hareketli JPEG (Motion JPEG) olmuştur. JPEG ismi birleşik fotoğraf uzmanları grubu (joint photographic experts group)'nun baş harflerinin birleşiminden oluşturulmuştur. Bu sabit görüntü sıkıştırma standardı (yani sadece resim içi kodlama kullanan) hareketli resimleri biçimlendirme uygulamalarında sıklıkla kullanılmaktadır. 1989'dan sonra resim içi kodlama yapılmayınca ve gerçek zamanlı görüntüden yüksek kalitede resim yakalama olayı imkanlı oldu. Orijinal dizilimler sanki yüksek kalitede bağımsız JPEG görüntü dizileri gibi düşünülerek kodlanmaya başlandı. Sadece en son biçimlendirilen versiyonu MPEG'e dönüştürüldü. MPEG sıkıştırılmış resimleri ortaya çıktıktan sonra farklı MJPEG uygulamaları dizilimler için patentli protokoller kullandı. Bununla beraber 1995'de açık doküman konsorsiyumu (Open Doc Consortium-ODC) MJPEG için genel bir yayın çıkardı.

9.7 ITU-T Rec. H.261 Standardı

Hareketli görüntülerin kodlanması için JPEG algoritmasından hareketle değişik algoritmalar geliştirilmiştir. Bunlardan ilki ITU-T Rec. H.261 video-telefon standardıdır. ITU-T Rec. H.261 standardı kısaca p*64 olarak da adlandırılır. Çünkü veri hızı p kere 64 KB/s olarak ayarlanmaktadır. Görüntülü telefonda p=1 yani hız 64 KB/s alınır. p=32 seçilirse 2 MB/s hızında tele konferans için kullanılan yüksek kaliteli görüntü elde edilebilir. Bu kodlama sisteminde hem çerçeve içi hem de çerçeveler arası ilişkilerden yararlanılarak çok daha yüksek bir sıkıştırma elde edilmiştir. Çerçeve içi sıkıştırmada JPEG’de olduğu gibi dönüşüm teknikleri (DCT), çerçeveler arası sıkıştırmada ise kestirimci (Predictive) kodlama teknikleri kullanılır.

Yukarda da bahsedildiği gibi devre iki ana bölümden oluşmuştur. Önce görüntü sayısallaştırılıp ayrık kosinüs dönüşümü (DCT) uygulanır ve değişken uzunluklu uyarlamalı nicelendirme (quantization) tekniği ile veri hızı en aza indirilir. Daha sonra görüntüde hareket kestirilip çerçeveler arası ilişki bulunur. Buradan hareketle bir sonraki resmin ne olması gerektiği kestirilip, kestirilmiş çerçeve ile yeni gelen çerçevenin farkı alınır. Kodlamada sadece bu farkın karşı tarafa iletilmesi yeterlidir. Ancak başlangıç için ilk çerçevenin tam olarak gönderilmesi gerekir. Bunu mod seçici devre sağlar. Eğer hata çok büyükse resmin tamamı, aksi halde sadece fark gönderilir. Buradan hareketle alıcıda resimlerin peş peşe oluşturulması mümkündür. Bu yöntemle, veri hızının büyük oranda düşürülmesi yani sıkıştırma yapılabilmektedir. İki çerçeve arasındaki farkın alınabilmesi için bir çerçevelik görüntünün hafızada saklanması gerekir. Ayrıca iletim sırasındaki hataları önlemek için bir hata kodlaması yapılır.

Alıcıdaki kod çözme devresi nispeten daha basittir. Çünkü  kodlayıcıda  hem dönüştürücü hem de ters dönüştürücü bulunmasına karşılık burada sadece ters dönüştürme işlemleri yapılır. Tablo 9.2’de H.261 ile MPEG karşılaştırılmıştır.

Tablo 9.2 - H.261 İle MPEG'in Karşılaştırılması

Konu

MPEG

H.261

Uygulamalar

Görüntü Biçimlendirme

Görüntü Depolama

Görüntü Geri Sarımı

Gerçek Zamanlı İletim

Görüntü Büyüklüğü

Sınırlama Yok

Sadece 352x288 (CIF) veya 176x144 (QCIF)

Tazeleme Oranı

23,976'dan 60 resim/saniye oranlarına kadar 8 değişik seçenek

29,97

Resim Kodlamaları

İçsel Kodlama (Intra-Coded)

Kestirimli Kodlama (Predictive-Coded)

Çift yönlü Kodlama (Bidirectional-Coded)

DC Kodlama

İçsel Kodlama (Intra-Coded)

Kestirimli Kodlama (Predictive-Coded)

Resim Sıralamaları

Resimler kod çözücünün ihtiyaçları doğrultusunda kodlanır (eğer B- resimleri varsa görüntü sırasına göre değil)

Resimler görüntü sırasına göre kodlanırlar

Hareket Kompanzasyonu

İleri Hareket Vektörleri

Geri Hareket Vektörleri

Çift Yönlü Enterpolasyon

İleri Hareket Vektörleri

Renk Modeli

YCrCb

YCrCb

Veri Organizasyonu

Resim Grupları

Resim (1 veya daha fazla Dilim)

Dilim (1 veya daha fazla Makroblok)

Makroblok (6 veri bloğu)

Resim (1'den 22'ye Resim grupları)

1'den 33'e makroblok

Makroblok (6 veri bloğu)

9.8 TASLAK ITU-T Rec. H.263 Standardı

Bir başka MPEG benzeri tele konferans görüntü standardı da H.263'tür. Düşük bit oranlı iletimde (LBC) kullanılmak üzere görüntü kodlaması için geliştirildi. H.263'ün alanının açıklığı kendisinin görüntü kodlamasının H.261 tabanına dayandığını itiraf eder. ITU-T Rec. H.262 (MPEG-2 görüntü) de aynı zamanda referanslardan birisidir. H.263 MPEG'de olduğu gibi kestirim ve hareket kompanzasyonu ile birlikte blok ve makrobloklara sahiptir. MPEG çalışma-seviye metodlarını kullanarak zikzak nicelendirme katsayıları kullanılmıştır fakat farklı tablolarla.

4 tane opsiyonel mod H.263 standardının  işlevselliğini arttırır. Birincisi, sınırlandırılmamış hareket vektör modudur. Bu mod kayıp örneklerin yeniden oluşturulabilmesi için köşe örneklerine ve resim dışı referanslara izin verir. Ayrıca geniş hareket vektörlerine de izin verir. İkincisi, aritmetik kodlama modudur. Bu mod değişken uzunluk kodlarının yerlerini değiştirir. Aritmetik kodlama modu aynı kalitedeki resmin daha düşük oranda kodlanmış bitlerde oluşmasını sağlayarak kodlama verimini arttırır. Üçüncüsü gelişmiş kestirim modudur. Bu mod P- resimleri için her 8x8'lik aydınlık bloğa ait hareket vektörlerini gönderir. Dördüncü mod PB-çerçeve modudur. Bu mod iki resmi tek bir ünite olarak kodlar. Bir P- resmi daha önceki bir resme referans alınarak kodlanır ve bir B- resmi de iki P- resmi kullanarak kodlanır. P- resmindeki makroblok B- resmindeki uygun makroblok tarafından hemen takibe alınır. H.261'e ek olarak H.263 bir adet daha küçük ve iki tane de daha geniş formatlı görüntüyü desteklemektedir.

9.9 JPEG Standardı

Şekil 9.1 - JPEG kodlayıcı blok şeması(DCT: Ayrık Kosinüs Dönüşümü; Q: Nicelendirme; VLC: Değişken Uzunluklu Kodlama)


JPEG standardı ISO (International Standarts Organisation) tarafından 1987 yılında geliştirilmiş olup sadece hareketsiz resimlerin kodlanması için önerilmişti. Bu sistemde renkli resimler önce bileşenlerine ayrılır. Bu ayırma bilgisayar sistemlerindeki R-G-B şeklinde ana renkler, televizyondaki Y-U-V şeklinde fark bileşenleri veya matbaacılıktaki C-M-Y-K şeklindeki 3 renk ve siyah olarak yapılabilir. Her bileşen üst üste çakışmayan 8x8 piksellik bloklara ayrılır. Şekil 9.1’de bir JPEG kodlayıcının blok şeması verilmiştir. Basitlik için 8x8 blok yerine 4x4 blok kullanılmıştır.

Bundan sonra her bloğa iki boyutlu Ayrık Kosinüs Dönüşümü (Discrete Cosine Transform, DCT) uygulanarak 64 katsayı elde edilir. Bu katsayılar görüntü bloğunun frekans bileşenlerini gösterir ve yine iki boyutlu olarak 8x8’lik bir matrisle gösterilir. Sol üst köşedeki sayı bloğunun sıfır frekanslı yani doğru akım (DC) bileşenini gösterir. Soldan sağa gidildikçe artan yatay frekanslı bileşenler, üstten alta doğru gidildikçe de artan düşey frekanslı bileşenlere karşı düşen değerler elde edilir. Örnek olarak eğer bütün blok aynı değerlerde bir gri seviyesine ise sadece DC bileşen vardır ve sol üst köşe dışındaki bütün değerler sıfırdır.

Bu matris zikzak biçiminde taranarak iki boyutlu matris tek boyutlu 64 katsayı elde edilir. Zikzak tarama ile katsayılar sıfırdan (DC) başlayarak en yüksek uzamsal sıklığa doğru sıralanmış olur. Bundan sonra değişken ağırlıklı nicelendirme işlemine geçilir. Yüksek sıklıktaki bileşenler fazla önemli olmadığından daha geniş adımlı, alçak frekanslı bileşenler ise daha önemli olduğundan daha küçük adımlı (daha fazla basamaklı) olarak nicelendirilir.

Son adım değişken uzunluklu Huffman kodlamasıdır. Değerler yine önem sırasına göre değişen uzunluktaki bit dizileri ile gösterilir. Böylece toplam bit sayısı en aza indirilir. DC bileşeni farksal olarak kodlanır. Yani DC bileşenin değeri değil bir önceki blokla işlenmekte olan bloğun DC bileşenlerinin farkı kodlanır.

Tablo 9.3 - Ayrık Kosinüs ve Değişken Uzunluklu Kodlamaya örnek

D

68

-23

-23

-4

-28

-4

-3

17

17

-3

3

20

3

-11

-11

-12

E

7

-2

-2

0

-3

0

0

2

2

0

0

2

0

-1

-1

-1

F

11110

101

101

0

11100

0

0

110

110

0

0

110

0

100

100

100

Şekil 9.2 - JPEG kod çözücü blok şeması


JPEG kod çözücü kodlayıcıda yapılan işlemlerin tersini sırasıyla yaparak görüntüyü yeniden oluşturur. Şekil 9.2’de görüldüğü gibi elde edilen görüntü ile asıl görüntü arasında küçük farklar oluşmaktadır.

JPEG ile MPEG arasındaki farklar;

MPEG temel olarak JPEG'in kullandığı sıkıştırma planıyla aynı planı kullanır fakat sabit resimler için değil hareketli görüntüler için dizayn edilmiştir. Buna rağmen belirli farklar vardır;

·       MPEG, JPEG tarafından açıkta bırakılan bir çok probleme açıklık kazandırır; örnek olarak; MPEG YCrCb renk modeli gerektirirken JPEG'de böyle bir gereklilik yoktur.

·       MPEG Huffman kodlaması gerektirir ve kodlama tablolarına ön tanımlamalar getirir. Bunun yanında JPEG Huffman kodlaması ve aritmetik kodlamalarının ikisine de izin verir ve kodlama tablolarını önceden açıklamaz.

·       MPEG bir görüntü dizisi içindeki her çerçeveyi ayrı ayrı tek ve bağımsız olarak kodlamaz. Kodlanan verinin büyüklüğünü en aza indirgeme için dizi içindeki bir çok çerçeve öncekilerden veya sonrakilerden farklılıklar arz eder. Buna resimler arası kodlama denir çünkü birden fazla çerçeve gerektirmektedir.

·       MPEG sadece grafiksel kodlama için bir standart değildir. Ses verileri için de bir sıkıştırma planı içerir. İlave olarak hem ses, hem görüntü ve hem de diğer tür verileri tek bir bit akışı içersine sıkıştırarak depolayabilir. Senkronizeli ve doğru bir şekilde bu veri tiplerini geri sarma işlemine tabi tutabilir. Bu işlem çoklama (multiplexing) olarak adlandırılır. MPEG 32 ses ve 16 görüntü akışlarını eşzamanlı olarak çoklayabilir.