Documente online.
Zona de administrare documente. Fisierele tale
Am uitat parola x Creaza cont nou
 HomeExploreaza
upload
Upload




SISTEME DE TELEVIZIUNE DIGITALA

tehnica mecanica



SISTEME DE TELEVIZIUNE DIGITALĂ


4.1 Probleme specifice în televiziunea digitala




Ochiul, receptorul sistemului vizual uman, este un receptor de tip analogic.

Televiziunea analogica (cu definitie normala) transmite imagini color si sunetul însotitor într-o banda de 6-8 MHz în cazul distributiei terestre si într-o banda de 18-30 MHz în cazul distributiei prin satelit sau prin retele terestre de microunde (pentru a realiza un raport S/Z mare la modulatia FM).

Un semnal digital TV de calitate ar putea fi transmis într-o banda de frecventa mult mai mica, dependenta si de raportul semnal / zgomot de pe canalul de comunicatie

Dar largimea de banda în care poate fi transmis semnalul TV digital nu este singurul argument în favoarea televiziunii digitale. Al doilea argument important este avantajul prelucrarii si transmisiei digitale fata de prelucrarea si transmisia analogica a semnalelor. Calitatea originala a semnalului poate fi refacuta ori de câte ori este nevoie în transmisie, înregistrare sau prelucrare în studiouri de televiziune, ceea ce nu este valabil pentru semnalul analogic. Se pot folosi tehnici de codare pentru protectie la perturbatii specifice canalelor digitale.

Trebuie totodata remarcat faptul ca exista o tendinta evidenta spre dezvoltarea masiva a retelelor digitale integrate tip ISDN (Integrated Service Digital Network), care sunt deosebit de avantajoase pentru distributia televiziunii digitale.

În sistemele TV digitale trebuie transmis si sunetul însotitor (mono sau stereo) precum si semnalele de sincronizare pe orizontala si verticala în acelasi timp cu secventele video.

Un alt aspect important este ca la transmisia digitala a semnalului de televiziune se poate realiza usor criptarea, necesara atat pentru rezolvarea unor probleme legate de licenta de transmisie pe anumite zone cât si pentru sistemele de tip televiziune interactiva.

Nu în ultimul rând trebuie spus ca transmisia digitala a semnalului de televiziune elimina problemele create în studiourile analogice la conversia de standard si sistem atunci când sursele de program TV sunt din tari cu standarde si norme TV diferite.

Evolutia spre televiziunea digitala a început în studiourile de televiziune prin adoptarea standardului digital international de studio 4:2:2, ceea ce permite transmisia semnalului între studiouri fara transcodari. La celalalt capat al lantului-receptorul TV au aparut functii noi. Desi semnalul TV este în continuare analogic în majoritatea situatiilor (din considerente de compatibilitate), televizoarele încep sa fie dotate cu convertoare A/D si D/A rapide, cu memorii de unul sau mai multe cadre si cu circuite specializate, care permit prelucrari digitale în timp real asupra semnalului TV : filtrari pentru îmbunatatirea raportului semnal/zgomot, afisarea unei imagini fara pâlpâire (cu 100 Hz), efecte speciale (zoom, imagine în imagine, afisarea unor informatii), prelucrari ale unor semnale codate, etc. Exista si receptoare în care, cu exceptia partii de înalta frecventa (tuner, AFI, demodulator) si a blocurilor de putere, toate celelalte prelucrari sunt realizate digital.

Ulterior acestor dezvoltari de la capetele lantului de televiziune, în momentul actual se transmite din ce în ce mai mult semnalului TV în forma digitala într-o banda acceptabila si la un pret accesibil al receptorului, prin diverse metode : prin satelit, prin emitatoare terestre, prin cablu, prin internet (Video over IP), telefonie mobila, etc.


4.2 Etapele conversiei digitale a semnalului de televiziune


Etapele conversiei analog - digitala pentru semnalul de televiziune sunt cele clasice care se aplica oricarui semnal dependent de timp - esantionarea, cuantizarea si codarea - cu particularitati specifice care tin seama de banda, structura spectrului si particularitatile sistemului vizual uman.


4.2.1 Esantionarea semnalelor de televiziune


Teorema esantionarii a lui Nyquist trebuie evident respectata si în acest caz, ceea ce înseamna ca frecventa de esantionare trebuie sa fie destul de mare. De exemplu, pentru un semnal video cu rezolutie normala care are banda de 5 MHz trebuie aleasa o frecventa de esantionare peste 10 MHz (având în vedere ca filtrele de pre- si postesantionare trebuie sa fie realizabile). În acest fel se elimina posibilitatea de aliere a spectrului de baza cu spectrele repetate.

În aceasta zona de frecventa este util sa se aleaga o frecventa de esantionare f E a carei valoare sa fie un multiplu al frecventei liniilor fH. În acest fel se obtine o structura de esantionare ortogonala :



De unde rezulta :


În acest fel pe o linie de explorare încap un numar întreg de esantioane, deci pe linii succesive esantioanel cad unele sub altele. Este un avantaj pentru redarea corecta a contururilor verticale abrupte.

Un alt aspect ce trebuie sa fie luat în calcul este cel legat de posibilitatea realizarii subesantionarii daca se tine seama de structura particulara a spectrului semnalului de imagine, care contine benzi spectrale înguste (circa 5-6 Hz) centrate pe multipli ai fre 545h77f cventei liniilor, frecventei semicadrelor si combinatii liniare ale acestora. Prin alegerea corespunzatoare a frecventei de esantionare se poate asigura intercalarea benzilor din spectrul original cu cele din spectrul repetat (care are evident aceeasi structura) fara aparitia efectului de aliere valabil atunci cand spectrul este continuu. Se poate de exemplu esantiona semnalul PAL cu dublul frecventei subpurtatoarei de culoare (aproximativ 8,86 MHz) care este sub frecventa Nyquist de 10 MHz (pentru o banda a semnalului PAL de 5 MHz).

Esantionarea se poate face pe componente (R, G, B sau Y, R-Y, B-Y) sau pe semnal videocomplex (PAL, SECAM sau NTSC). Din punct de vedere al calitatii imaginii este recomandata esantionarea pe componente, lucru care se realizeaza în standardul digital de studio. Se utilizeaza esantionarea pe componente pe luminanta Y si diferente de culoare R-Y si B-Y în locul celei pe semnale primare R, G, B, deoarece banda semnalelor diferenta de culoare (si în consecinta frecventa de esantionare) poate fi redusa cel putin la jumatate.

Esantionarea semnalului videocomplex este realizata în receptoarele cu prelucrare digitala în care, dupa demodularea semnalului si obtinerea semnalului videocomplex în banda de baza, toata prelucrarea ulterioara se face digital. În acest caz pentru PAL este util de ales o frecventa de esantionare egala cu de 4 ori frecventa subpurtatoarei de culoare (aproximativ 17,72 MHz) ceea ce permite realizarea usoara a decodorului de culoare digital PAL, deoarece sunt 4 esantioane pe o perioada de subpurtatoare. Se poate observa ca în acest caz frecventa de esantionare este si multiplu al frecventei liniilor, adica structura de esantionare este ortogonala.



4.2.2. Cuantizarea semnalelor de imagine


Cuantizarea semnalelor de imagine însemana alegerea unor nivele de decizie si de cuantizare astfel încât valoarea analogica a fiecarui esantion sa fie rotunjita la valoarea cea mai apropiata de cuantizare. Aceasta operatie introduce o eroare la reconstituirea esantioanelor dupa conversia digital - analog, deoarece valoarea esantionului reconstituit nu mai este riguros egala cu valoarea esantionului original. Apare asa-numitul zgomot de cuantizare. Pentru ca acesta sa nu afecteze calitatea imaginii este necesar ca numarul si dispunerea nivelelor de cuantizare sa tina seama de calitatile de perceptie ale sistemului vizual uman.

Cel mai suparator mod în care zgomotul de cuantizare ar putea afecta imaginea ar fi în cazul în care în zona respectiva de imagine este o variatie continua de stralucire. Dupa cuantizare la trecerea de la un nivel de cuantizare la altul ar putea apare efectul de contur fals.

Se stie ca perceptia variatiilor de luminanta este discontinua si neliniara. Astfel, daca luminanta variaza într-o zona de imagine, ochiul va percepe acest lucru doar daca se depaseste un anumit prag ΔB. Acest prag depinde însa de luminanta B a zonei de imagine respective, raportul ΔB / B este constant si egal cu aproximativ 0,02. Daca distanta dintre doua nivele de cuantizare este mai mica decât cel mai mic ΔB perceptibil de catre ochi, atunci zgomotul de cuantizare nu afecteaza imaginea.

Din punct de vedere al realizarii caracteristicii de cuantizare, aceasta va fi o caracteristica în trepte situata în cadranul unu daca semnalul este unipolar (cum este de exemplu semnalul de luminanta Y sau semnalele primare R, G, B) sau simetrica în cadranele unu si trei daca este vorba de cuantizarea semnalelor diferenta de culoare R-Y si B-Y care sunt semnale bipolare. Treptele caracteristicii pot fi egale sau inegale. Daca se utilizeaza cuantizarea uniforma nivelele de decizie si de cuantizare sunt egal departate. Daca nivelele de decizie si de cuantizare nu sunt uniforme se spune ca avem un cuantizor neuniform.

Alegerea caracteristicii de cuantizare trebuie sa duca la minimizarea zgomotului de cuantizare si tine seama în acest scop de statistica semnalului. Daca distributia de probabilitate a nivelelor esantioanelor este uniforma, atunci cuantizorul optim este cuantizorul uniform. Acesta este si cel mai simplu de realizat practic, pentru ca pragurile comparatoarelor din convertorul A / D sunt egale.

Atunci când distributia de probabilitate a esantioanelor semnalului nu este uniforma, cu alte cuvinte exista probabilitati diferite ca un nivel sa apara la intrarea cuantizorului, cuantizorul optim ce minimizeaza zgomotul de cuantizare este cel neuniform. Constructia practica a acestuia se face folosind tot un cuantizor uniform dar care este precedat de un circuit cu o caracteristica neliniara numit compresor.

Rolul compresorului este de a face ca la iesirea sa nivelele de cuantizare sa aiba distributie de probabilitate uniforma, ceea ce face posibila utilizarea cuantizorului uniform. Dupa prelucrarea semnalului digital (transmisie, memorare, etc.) când este necesara conversia D/A a semnalului video, este nevoie de realizarea unei operatii inverse celei a compresorului astfel încât semnalul sa nu fie distorsionat. Aceasta operatie se numeste expandare si se realizeaza dupa conversia D/A. De exemplu, daca functia neliniara a compresorului este una logaritmica, atunci functia expandorului este una exponentiala.

Operatia de comprimare si expandare se numeste compandare. Trebuie precizat ca prelucrari asemanatoare se fac si pentru semnalul audio.




4.2.3 Codarea semnalului video


Ultima etapa în prelucrarea necesara conversiei analog-digitale a semnalului video este codarea. Aceasta înseamna ca fiecarui nivel de cuantizare sa i se aloce un cod binar. Cea mai simpla codare este codarea cu modulatia impulsusrilor în cod MIC (în engleza PCM Pulse Code Modulation). Aceasta înseamna ca fiecarui nivel de cuantizare qk sa i se aloce codul binar natural ce reprezinta numarul k. De exemplu, pentru codarea PCM a semnalului video cuantizat uniform cu 256 nivele (8 biti pe esantion) rezulta urmatoarea alocare


q0 ... 0000 0000

q1 .. 0000 0001


q255 . . 1111 1111


Toate celelalte metode de codare se raporteaza la codarea PCM atunci când se calculeaza viteza de transmisie necesara pentru semnalul video digital. De exemplu, daca frecventa de esantionare este de 12 MHz (suficienta pentru o banda video de 5 MHz) si se cuantizeaza uniform cu 8 biti pe esantion, viteza seriala de transmisie a semnalului video digital este


V [Mbit/s] = 12 x 8 = 96 Mbit/s


Aceasta este o viteza foarte mare pentru orice canal de comunicatie. Ea poate fi redusa prin metode de compresie spectru la valori rezonabile de 2-4 Mbit/s sau chiar mai mult exploatând doua elemente

Caracteristica sistemului vizual uman.

Statistica semnalului video.

Raportul de compresie obtinut se exprima fie ca un numar fata de metoda standard PCM (de exemplu se obtine o compresie 8 : 1) sau ca numarul echivalent de biti pe esantion necesar transmisiei (pentru acelasi exemplu 1 bit / esantion).



4.3 Standardul digital de studio si familiile de standarde corespunzatoare


Recomandarea 601 a CCIR (ITU-R 601) prevede pentru studiouri un standard principal digital cu codare pe componente, standardul 4:2:2 ai carui parametri principali sunt prezentati în tabelul 4.1. Frecventa de esantionare este un multiplu întreg al frecventei liniilor atât pentru standardul cu 625 linii/50 Hz cît si pentru standardul cu 525 linii/60 Hz deoarece :



Multiplii comuni ai acestor frecvente sunt multiplii frecventei de 2,25 MHz. Valorile convenabile ale frecventei de esantionare sunt : 11,25 MHz (5x2,25) ; 13,5 (6x2,25) ; 15,75 (7x2,25) . Pentru standardul principal s-a ales valoarea de 13,5 MHz.


Tabelul 4.1

Parametrii

Sistemul 525 linii/60 Hz

Sistemul 625 linii/50 Hz

Semnale

Y, R-Y, B-Y

Y, R-Y, B-Y

Esantioane/linie

Y

R-Y, B-Y







Structura de esantionare


Ortogonala, esantioanele R-Y si B-Y coincid cu esantioanele impare ale lui Y

Frecventa de esantionare

Y

R-Y, B-Y



13,5 MHz

6,75 MHz



13,5 MHz

6,75 MHz

Codare

PCM uniform cu 8 bit    pe esantion

Nr. de esantioane pe linia activa

Y

B-Y, R-Y









Relatia dintre nivelul semnalului video si nivelele de cuantizare

Y


R-Y, B-Y






nivel 16=nivel de negru, nivel 235=nivel de alb


224 nivele cu nivelul    128=nivel de zero



Lungimea liniei active este aceeasi pentru ambele sisteme de explorare si anume 720 esantioane pentru luminanta si 360 esantioane pentru fiecare semnal de crominanta.

Debitul de informatie pentru standardul principal este :

pentru semnalul de luminanta si :

pentru semnalul de crominanta deci în total :

Exista multe situatii în care calitatea imaginii este diferita de cea din standardul principal. De aceea, plecînd de la standardul principal s-a creat o familie de standarde care au proprietatea ca frecventele lor de esantionare se afla într-un raport de numere întregi cu standardul principal 4:2:2 (tabelul 4.2).


Tabelul 4.2

Standard

Frecventa

de esantionare

Y

Frecventa de esantionare

R-Y

Frecventa de esantionare

B-Y

Debitul de informatie

[Mbit/s]

Aplicatii


13,5 MHz

13,5 MHz

13,5 MHz


Calitate ridicata la încrustare


13,5 MHz

6,75 MHz

6,75 MHz


Standard primar de studio


13,5 MHz

3,375 MHz

3,375 MHz


Transmi-siuni de calitate înalta   


6,75 MHz

3,375 MHz

3,375 MHz


Jurnalistica electronica

(ENG)


10,125 MHz



3,375 MHz

3,375 MHz


Calitate identica cu cea din PAL


Standardele de ordin superior sunt 8:4:4 si 4:4:4. Standardul 8:4:4 este un standard de explorare progresiva cu 625 linii/semicadru. Dupa prefiltrare vertical-temporala si eliminarea unei linii din doua se obtine semnal întretesut 4:2:2. Dupa stocare acest semnal poate fi postfiltrat si aplicat pe un monitor cu afisare cu 625 linii/semicadru. Standardul 4:4:4 esantioneaza semnalele R, G, B sau Y, R-Y, B-Y cu aceeasi banda initiala.

Standarde de ordin inferior (sau substandarde) sunt 4:1:1 ; 2:1:1 ; 4:1:0 (semnale diferenta de culoare transmise secvential) si 3:1:0. Standardul 4:1:1 poate fi transmis cu 140 Mbit/s (nivelul cuaternar al ierarhiei digitale de transmisie) daca se utilizeaza intervalul de stingere pe orizontala.

Construirea unui standard inferior din standardul principal nu înseamna numai reducerea frecventelor de esantionare ci si modificarea structurii de esantionare care devine neortogonala ceea ce reduce rezolutia pe directie diagonala. Standardul 3:1:0 realizeaza esantionarea în sah pe cadre a semnalului de luminanta la 3/4 din frecventa standardului principal si transmisia secventiala a semnalelor diferenta de culoare. La standardul 2:1:1 se face o esantionare neortogonala la jumatate din frecventa standardului principal ceea ce permite mentinerea unei rezolutii pe orizontala de 6 MHz pentru luminanta si de 3 MHz pentru crominanta în timp ce rezolutia pe diagonala scade. Atât standardul 3:1:0 cât si standardul 2:1:1 produc o oarecare degradare a calitatii imaginii, dar aceasta este suficient de mica, ceea ce permite obtinerea unei calitati comparabile cu cea a semnalului PAL (asa numitul "nivel auxiliar" sau nivel reportaj "ENG=Electronic News Gathering").

Recomandarea 601 a CCIR a lasat însa nerezolvate doua probleme importante :

1) Forma filtrelor trece-jos necesare înainte de conversia A/D si dupa conversia D/A.

2) Realizarea interfetelor pentru transmisia semnalelor în unul din aceste standarde.

Filtrele trece-jos trebuie sa îndeplineasca urmatoarele conditii :

- distorsionari cât mai mici ale semnalelor din banda de trecere ;

- posibilitatea cascadarii codec-urilor (codor-decodor) fara degradari semnificative ale semnalului ;

- complexitate acceptabila (deci dimensiuni si costuri reduse).

Este necesar un compromis deoarece o banda de trecere mare si o rejectie puternica a frecventelor de aliere mai mari sau egale cu jumatate din frecventa de esantionare implica o cadere abrupta a caracteristicii filtrului si deci oscilatii ale caracteristicii de amplitudine în banda de oprire. Riplul caracteristicilor de amplitudine si timp de grup poate fi redus marind complexitatea filtrului. Amplitudinea acestui riplu se va multiplica cu numarul de codec-uri cascadate daca se utilizeaza filtre identice.

CCIR si EBU au dat unele directii de proiectare a acestor filtre :

- Se va specifica o banda de trecere (daca este posibil pâna la 5,5 MHz) pentru luminanta ;

- Se va realiza o atenuare mare (40 dB) a benzii translatate (în cazul anterior 8-13,5 MHz) ;

- Rejectia la jumatate din frecventa de esantionare va fi moderata (12 dB sau chiar mai putin) pentru a se realiza un compromis între oscilatii în banda de oprire si aliere ;

- Masuri comparabile (în raport 2:1 pentru standardul principal) se vor aplica semnalelor diferenta de culoare urmând ca filtrarea sa se efectueze o singura data la sursa sau la afisare chiar si în cazul cascadarii unor codec-uri.

În ceea ce priveste interfetele pentru transmisia semnalelor digitale din standardul 4:2:2 pe distante de pâna la maximum cîtiva kilometri se pot utiliza interfete seriale sau paralel. În interfetele paralel se transmit simultan cei 8 biti plus un semnal de ceas. Cele trei fluxuri de cuvinte Y, R-Y, B-Y sunt multiplexate în timp pentru a forma un singur flux de cuvinte cu viteza de 27 Mbit/s. O astfel de interfata permite utilizarea unor circuite integrate ieftine. O interfata seriala cu viteza de 243 Mbit/s a fost realizata de EBU si SMPTE.


4.4 Metode de compresie a imaginilor

Viteza mare de bit pentru fluxul de date în standardul digital de studio impune utilizarea unor metode de compresie de spectru pentru reducerea semnificativa a acestei viteze.

Pentru compararea performantelor diverselor metode de compresie se utilizeaza mai multe criterii.

Primul dintre ele este raportul de compresie care este egal cu raportul dintre viteza de bit în transmisia cu modulatia impulsurilor în cod (PCM) si viteza de transmisie dupa compresie.

Al doilea criteriu este calitatea imaginii receptionate. Obiectivul urmarit de CCIR este de a evita receptia unei imagini de calitate mai slaba decît cea produsa de o transmisie analogica. Calitatea este evaluata prin teste subiective în raportul CCIR 405-4 si Recomandarea 500-2.

Al treilea criteriu este complexitatea procesului, care trebuie limitata la minimum deoarece determina complexitatea si costul echipamentului de codare si decodare.

Al patrulea criteriu este sensibilitatea sistemului de decodare la erorile din lantul de transmisie si efectul acestor erori asupra imaginii (Raportul CMTT 967).

Reducerea vitezei de transmisie se bazeaza pe proprietatile sursei de semnal si pe proprietatile sistemului vizual uman. Acestea vor fi trecute în revista în continuare.

Proprietatile sursei

Au fost facute în decursul timpului multe masuratori statistice asupra imaginilor si a secventelor de imagini si au fost propuse cîteva modele, în general modele stationare. În afara studiilor teoretice este de mentionat ca trebuie utilizate proprietatile structurale ale imaginilor, care sunt sensibile la rupturi locale ale stationaritatii (de ex. margini). În general, s-a dovedit eficient sa se analizeze imaginile si secventele de imagini printr-un model de tip "mozaic", un model nestationar unde fiecare componenta a "mozaicului" are proprietatile sale statistice. Principalele configuratii locale sunt :

zone cvasi-uniforme, adica zone în care gradientul spatial este mai mic decât de exemplu 2 % din gama dinamica a unui pixel iar extensia spatiala mai mare decât câteva zeci de pixeli în fiecare directie ;

zone cu detalii cu contrast scazut, adica zone cu contrast local mai mic de 5 % din gama dinamica, fiecare detaliu fiind mic în directie spatiala (câtiva pixeli) ;

zone cu detalii cu contrast mare, cu contrast si gradient mai mare decât de exemplu 15 % din gama dinamica, fiecare detaliu fiind mic în spatiu ;

margini, cu contrast mai mare decât 15 %, latimea tranzitiei de unul sau doi pixeli, tranzitia întinzându-se longitudinal pe câtiva zeci de pixeli.

Primele trei tipuri sunt configuratii de tip "suprafata" si sunt mai mult sau mai putin stationare, Ultima poate fi considerata de tip "linie" si corespunde la întreruperi ale stationaritatii. Este evident ca nu exista delimitari foarte clare între aceste patru categorii, zonele uniforme devin texturate pe masura ce contrastul creste iar zonele texturate devin un mozaic de zone uniforme si margini pe masura ce distanta focala creste.

De asemenea, fiecare din aceste configuratii spatiale devine o configuratie spatio-temporala daca se considera si axa timpului. Ele vor fi supuse modificarilor în timp si miscarii. S-a propus sa se faca distinctie între miscarea obiectelor si miscarea camerei, aceasta din urma fiind o miscare globala. S-a propus si introducerea unor parametri relevanti ca vectorul de miscare, amplitudinea sa în spatiu, geometria sa (translatie, zoom) si posibilitatea de urmarire a miscarii datorata abilitatii ochiului de a urmari miscarile.

În descrierea generala spatio-temporala se considera secventele de imagini ca esantioane ale unui model dinamic de tip mozaic. Din cauza lipsei de date statistice adecvate acest model este un model calitativ structural suficient pentru studiul compresiei de date a semnalului video.

Proprietatile sistemului vizual uman.

Acestea pot fi studiate din diferite aspecte : anatomice, fiziologice, psihofizice (detectie, perceptie) si psihologice (cunoastere, semiotica).

Pentru aplicatii legate de codarea semnalelor de televiziune sunt utile datele psihovizuale care dau praguri de detectie (masuratori directe sau modele) sau nivele de perceptie subiectiva ca functii de parametrii stimulilor vizuali carora subiectii trebuie sa le raspunda. Având ca obiectiv un standard de calitate înalta pentru sisteme TV sunt utile mai ales datele de detectie. Pragurile de detectie se pot aplica conditiilor de vizualizare asa cum se definesc în Recomandarea CCIR 500. Datele se obtin prin asa numita metoda a "stimulului constant" care consta în a prezenta în ordine aleatoare stimuli predeterminati cu valori selectate ale parametrilor. Procentele de cazuri în care se vad stimulii sunt interpolate pentru a defini un prag de detectie de 50%. Se poate folosi întreaga scala de vizibilitate a stimulului pentru a defini un prag de perceptibilitate între cele doua grade mai înalte, "imperceptibil" si "perceptibil dar nu suparator". Literatura de specialitate contine foarte multe date de acest tip dar de multe ori acestea sunt dificil de aplicat la problemele de optimizare a codarii. În majoritatea cazurilor defectele codarii corespund unor stimuli vizuali mai complecsi si apar în imagini sau în secvente de imagini reale în contrast cu formele de test simple utilizate în experimentele psihovizuale (de obicei fundal uniform, margini sintetice foarte precise, etc).

În continuare se vor trece în revista principalele metode de compresie utilizate în televiziune.

Exista doua constrîngeri specifice care determina tipurile de algoritmi ce pot fi utilizati pentru televiziune. În primul rând este necesara o operare în timp real, cu o viteza mare (de ordinul zecilor de megabiti pe secunda) , pe un canal cu viteza de transmisie fixa. Aceasta face sa fie preferate schemele de codare cu viteza fixa sau, pentru algoritmi care produc viteze variabile, este necesar sa se utilizeze registre tip buffer si metode de evitare a supraîncarcarii registrelor. În al doilea rând, constrîngerile sursei nu permit ca unii algoritmi care sunt eficienti, de exemplu pentru videoconferinta, sa fie la fel de eficienti pentru televiziune. De asemenea nu este posibila utilizarea schemelor de codare adaptiva cu transformare care sunt foarte eficiente pentru imagini fixe, sau a schemelor de codare pentru grafice si facsimil.

Având în vedere aceste considerente variantele posibile de codare pentru compresie sunt :

PCM (Pulse Code Modulation) si scheme de codare înrudite : cuantizare liniara, cuantizare neliniara si cuantizare adaptiva, esantionare cu diferite frecvente si structuri, cu filtrare pre- si postesantionare fixa sau adaptiva.

DPCM (Differential PCM) : scheme de codare cu predictie spatiala (intrasemicadru) sau spatio-temporala (intersemicadru sau intercadru) cu predictie fixa sau adaptiva, cu cuantizare fixa sau adaptiva, urmata uneori de codare cu lungime de cod variabila a semnalului diferenta. Pentru marirea eficientei predictiei se poate folosi estimarea miscarii sau a marginilor.

Codare cu transformare : transformari pe blocuri, spatiale sau spatio-temporale, de tip Hadamard, cosinus, etc., cu cuantizare zonala (fixa sau adaptiva) sau codare cu prag ;

Scheme hibride : cu DPCM în unele dimensiuni si transformare în altele.

Codarea cu transformare este într-adevar o metoda foarte eficienta realizând factori de compresie mari, dar pretinde foarte multe operatii de calcul ce trebuie efectuate în timp real pentru codarea semnalului de televiziune.

Dimpotriva, codarea cu DPCM este mai usor de realizat practic si are avantajul ca separarea celor doua functii (predictie si cuantizare) permite o buna adaptare la proprietatile semnalului (predictie) si ale observatorului uman (cuantizare).


4.4.1 Codarea cu predictie

Codarea cu predictie este o metoda larg utilizata pentru eliminarea redundantei din semnalul de televiziune. Codarea cu predictie se bazeaza pe observatia ca între esantioanele semnalului de televiziune exista o corelatie destul de puternica. Codarea este cu atât mai eficienta cu cât aceasta corelatie este mai mare. Predictia valorii unui esantion se bazeaza pe valoarea esantioanelor anterioare. Valoarea prezisa nu va fi chiar valoarea esantionului curent dar va putea fi foarte aproape de aceasta. Daca se transmite numai diferenta dintre esantionul curent si cel prezis, volumul de informatie transmis poate fi redus semnificativ. Deci în codarea cu predictie redundanta previzibila poate fi eliminata din semnalul de intrare, ceea ce permite compresia datelor.

Esantionul prezent este estimat din valoarea esantioanelor anterioare

. În codarea cu predictie liniara esantionul prezis este o combinatie liniara a valorilor esantioanelor precedente :

unde sînt coeficienti constanti iar este valoarea esantionului anterior cu i perioade de tact. Daca se aplica transformata Z rezulta :

unde :

Eroarea de predictie este :


Eroarea de predictie este codata si transmisa la receptor. La receptor este reconstituit din semnalul receptionat . Daca exista o corelatie puternica în semnalul de televiziune, eroarea de predictie este relativ mica în raport cu semnalul de intrare, deci poate fi codata cu un numar mai mic de biti. Principiul acestei prelucrari este prezentat în fig. 4.1.






Fig. 4.1 Schema bloc a codarii cu predictie


Predictia este o filtrare liniara cu functia de transfer si este realizata cu un filtru digital nerecursiv. Functia de transfer a codorului este . Decodorul este un filtru digital cu functia de transfer . Daca se face predictia utilizînd doar esantionul precedent, adica

atunci functia de transfer a codorului este (un circuit de diferentiere) iar functia de transfer a decodorului este (un circuit de integrare). De obicei codarea cu predictie este realizata într-o configuratie cu bucla de reactie. Prezenta cuantizorului în bucla de reactie evita acumularea erorilor de cuantizare. Codarea DPCM are si avantajul de a elimina un eventual comportament nestationar al semnalului.

Proiectarea optima a unui predictor înseamna înseamna alegerea unui numar suficient de mare de esantioane anterioare si alegerea valorilor coeficientilor (deci determinarea functiei de transfer ) pentru care eroarea medie patratica de predictie este minima :

unde reprezinta media statistica. Derivînd partial în raport cu si egalînd rezultatul cu zero se obtine sistemul de ecuatii :

Daca se noteaza functia de autocorelatie a semnalului cu :

sistemul se poate scrie matricial :


Daca se rezolva ecuatia matriciala se pot obtine valorile coeficientilor de predictie. Puterea erorii de predictie minimizate este :

În cadrul experimentarilor s-a constatat ca proprietatile statistice ale erorii de predictie pot fi descrise cu ajutorul distributiei Laplace :


Functia de autocorelatie a semnalului de televiziune poate fi aproximata cu expresia :

unde este o constanta. Se poate demonstra, folosind ecuatiile de mai sus, ca în acest caz predictorul optim este de ordinul unu iar coeficientii sunt dati de relatia :

unde este coeficientul de corelatie între doua esantioane vecine. Puterea erorii de predictie minime este :


Cu cât este mai mare puterea erorii de predictie minime este mai mica fata de puterea semnalului. Daca se doreste ca eroarea medie de predictie sa fie egala cu zero, atunci este necesar ca predictia sa se faca în conformitate cu ecuatia :

unde este media semnalului. În cazul imaginilor este utila predictia bidimensionala. În predictia bidimensionala sunt utilizate si esantioane din liniile precedente ale aceluiasi câmp. De obicei corelatia este puternica doar cu elementele liniei anterioare din acelasi cîmp. Coeficientii functiei de predictie se determina în cazul bidimensional pe acelasi principiu ca si în cazul unidimensional, punând conditia minimizarii erorii patratice medii de predictie.

Functia de autocorelatie bidimensionala a imaginii pentru zone stationare în sens larg este de forma :

Valorile experimentale obtinute sunt urmatoarele :

- Pentru imagini de tip prim-plan (cu suprafete uniforme relativ multe)

- Pentru imagini cu multe detalii :

- Pentru imagini tip prim plan

- Pentru imagini cu multe detalii

Daca functia de autocorelatie bidimensionala are forma din relatia de mai sus, atunci se poate demonstra ca :

pentru

Cu alte cuvinte semnalul de eroare de predictie este necorelat. În cazul în care functia de autocorelatie bidimensionala este de alta forma decît cea de mai sus, atunci este necesar sa se utilizeze mai mult de 3 elemente vecine ale esantionului curent pentru a se obtine o buna estimare. În aplicatiile practice, deoarece proprietatile statistice ale imaginii sunt nestationare si neuniforme spatial, se prefera sa se varieze functia de predictie adaptiv, în functie de proprietatile locale ale imaginii. Un mod tipic de adaptare este de a selecta un predictor optim din mai multe functii de predictie (fig. 4.2). Alegerea functiei de predictie optime se face observând elementele anterioare ale imaginii din vecinatatea elementului considerat. Aceasta este o schema de predictie neliniara în care functia de predictie variaza cu statistica locala a imaginii. Predictia adaptiva este eficace pentru scaderea erorii de predictie la tranzitia dintre doua zone cu proprietati statistice diferite.


Functia rata-distorsiune în codarea cu predictie

Functia rata-distorsiune arata legatura care exista între distorsiunile admise într-o metoda de compresie care reduce entropia sursei initiale si valoarea minima la care poate fi redus debitul de informatie al sursei efective.

Fie un vector N-dimensional care reprezinta într-un spatiu metric semnalul generat de sursa si vectorul N-dimensional care reprezinta semnalul comprimat transmis. Distorsiunea introdusa prin compresie poate fi masurata daca se defineste distanta între cele doua semnale. Se poate alege distanta :





Fig. 4.2 Predictie adaptiva cu predictori comutati


unde :


unde si sunt componentele înainte si respectiv dupa compresie.

Reducerea entropiei în procesul de compresie este echivalenta cu efectul perturbatiilor asupra unui canal de transmisiune. Circuitul de compresie poate fi considerat un canal afectat de perturbatii si se poate defini transinformatia :

Eroarea medie este cu atât mai mare cu cât distorsiunile introduse prin compresie sunt mai importante. Functia rata-distorsiune este definita prin relatia :

unde minimul este în raport cu probabilitatile si este supus conditiei ca distorsiunile sa nu depaseasca valoarea D admisa :

Functia reprezinta debitul de informatie minim la iesirea circuitului de compresie care garanteaza ca distorsiunea nu este depasita. Deci o compresie efectuata de o transformare care reduce entropia transforma sursa cu debit biti/s într-o noua sursa cu debit mai mic astfel încît distorsiunile sa nu depaseasca o valoare admisa D. Se poate deci defini raportul de compresie maxim :

care reprezinta de fapt o limita superioara ce nu poate fi depasita prin nici un procedeu de compresie fara depasirea limitei admise pentru distorsiuni.

Teorema codarii surselor a lui Berger este urmatoarea :

" Pentru codarea unei surse discrete fara memorie, exista, atunci când distorsiunea este mai mica decît , un cod bloc cu viteza de bit atunci când lungimea blocului este suficient de mare ".



Reciproca acestei teoreme este :

" Daca este disponibila o viteza de bit pentru codarea unei surse discrete fara memorie, atunci nu poate fi depasita o distorsiune ".

Pentru o sursa stationara continua, fara memorie, caracterizata de functia de distributie gaussiana :

Valoarea functiei este :

[biti/simbol]

iar distorsiunea :

Pentru orice rata de informatie , sistemele de compresie care sunt proiectate sa atinga o distorsiune pentru o sursa cu distributie gaussiana cu valoare medie nula si dispersie , vor asigura o distorsiune care nu depaseste valoarea pentru orice alta sursa stationara având valoare medie nula si aceeasi dispersie. Cu alte cuvinte, dintre toate sursele continue fara memorie, stationare si ergodice, cu valoare medie nula si cu aceeasi dispersie, cea care necesita cea mai mare valoare a functiei este sursa gaussiana :

Sursele reale sunt în majoritatea cazurilor surse cu memorie. Pentru surse cu memorie, stationare si ergodice, calculul functiei rata-distorsiune se face, în functie de momentele de ordinul unu si doi, utilizînd rezultatele obtinute în calculul functiei pentru surse fara memorie.


4.4.2 Codarea cu transformate

Metodele de compresie care utilizeaza transformate reduc corelatia dintre esantioane prin trecerea în spatiul transformat în care corelatia dintre coeficientii transformatei este redusa semnificativ. Raportul de compresie obtinut este cu atât mai mare cu cât de obtine o decorelare mai puternica a coeficientilor din spatiul transformat.

Schema bloc a transmisiei cu codare cu transformate este prezentata în fig. 4.3.



Fig. 4.3 Codarea cu transformate. Schema bloc


Transformarea se face pe blocuri 8 x 8 sau 4 x 4 din motive de complexitate a calculelor care trebuie efectuate la imaginile cu miscare în timp real. La intrarea etajului de transformare directa se aplica esantioanele f(x,y) ale blocului N x N (de ex. 8 x 8). Transformarea directa se efectueaza conform relatiei (care poate fi scrisa si matricial).

A(x,y,u,v) este nucleul transformarii directe.

Blocul de selectie va face selectarea coeficientilor ce vor fi transmisi dupa doua criterii posibile :

Selectie zonala

Selectie cu prag.

Selectia zonala presupune alegerea unei anumite zone din spatiul transformat (zona de joasa frecventa) si transmisia numai a acelor coeficienti, ceilalti coeficienti urmând a fi considerati egali cu zero la receptie.

Selectia cu prag presupune fixarea unui anumit prag de amplitudine de la care se considera ca valoarea coeficientilor din spatiul transformat este semnificativa si transmisia numai a coeficientilor care depasesc acest prag, ceilalti coeficienti find considerati egali cu zero. În acest caz trebuie însa transmisa si informatia despre localizarea coeficientilor nenuli din spatiul transformat.


La receptie transformata inversa permite trecerea înapoi în spatiul imaginii

Unde s-a notat cu B(x,y,u,v) nucleul transformarii inverse si cu S(u,v) functia de selectie a coeficientilor ce urmeaza a fi transmisi (egala cu 1 pentru coeficientii ce vor fi transmisi si cu 0 pentru coeficientii ce nu vor fi transmisi si vor fi considerati la receptie egali cu 0).

Transformarile bidimensionale utilizate trebuie sa fie unitare (matricea transformarii sa fie unitara) si sa aiba algoritm de calcul rapid. Transformata optima care elimina complet corelatia dintre coeficienti în spatiul transformat este transformarea Karhunen-Loeve, dar aceasta nu are algoritm de calcul rapid.Transformari suboptimale cu algoritm de calcul rapid sunt transformarile Fourier rapida, Walsh-Hadamard, Cosinus discreta (DCT = Discrete Cosine Transform) ;I transformarea wavelet.


4.4.3 Codarea vectoriala

Codarea vectoriala se bazeaza pe rezultatele teoremei rata-distorsiune a lui Shannon, care arata ca performantele metodelor de compresie de date sunt întotdeauna mai bune atunci când se codeaza vectori în locul scalarilor, chiar daca sursa este fara memorie.

Codarea vectoriala este foarte mult utilizata în codarea imaginilor statice. Schema bloc pentru o metoda de compresie cu cuantizare vectoriala este data în fig. 4.4. Codorul si decodorul utilizeaza o lista de coduri , care contine cuvinte de cod (vectori de cod) de dimensiune notati cu un indice . Imaginea este împartita în blocuri de pixeli de dimensiune . Fiecare bloc poate fi considerat un vector de dimensiune . Pentru fiecare bloc codorul selecteaza cuvântul de cod care da cea mai mica distorsiune . Indicele al cuvîntului de cod este transmis pe canal. Daca nu exista zgomot, decodorul reface cuvîntul de cod din indicele si rezulta .

Din punct de vedere matematic cuantizarea vectoriala este o functie de la un spatiu -dimensional la un set finit de simboluri :

Viteza de transmisie este :

[biti/vector]

Viteza de transmisie pe esantion este [biti/esantion]. De obicei este o putere a lui 2 si atunci este numar întreg.

Performantele sistemului cu codare vectoriala depind de structura listei de coduri. Exista mai multe criterii pentru a proiecta în mod optim o lista de coduri. Unul dintre ele consta în minimizarea distorsiunii medii (tipic eroarea medie patratica MSE). Alt criteriu urmareste maximizarea entropiei listei de coduri, ceea ce înseamna ca fiecare cuvînt de cod este utilizat în medie de acelasi numar de ori. De obicei lista de coduri este fixata la codor si la decodor. În codarea vectoriala adaptiva lista de coduri este modificata odata cu modificarea caracteristicilor statistice ale imaginii. Se creaza noi liste de coduri pe parcursul functionarii sistemului care le înlocuiesc pe cele vechi.

În trecut codarea vectoriala a fost mai putin utilizata din cauza complexitatii calculelor atât în procesul de codare cât si în procesul de învatare. În ambele procese se calculeaza distorsiunile pentru fiecare cuvînt de cod din lista si se compara între ele pentru a gasi cuvîntul de cod care da distorsiunea cea mai mica. Deoarece se utilizeaza blocuri în codarea vectoriala exista posibilitatea ca structura de blocuri sa fie vizibila pe imagine.

În acelasi timp, codarea vectoriala prezinta avantaje semnificative, pe lânga compresia pe care o realizeaza. Se pot construi liste de cuvinte de cod pentru care entropia este aproape de valoarea maxima posibila. Rezulta astfel ca se poate face codare cu cuvinte de cod cu lungime fixa cu toate avantajele ce decurg de aici în privinta comportarii sistemului în prezenta erorilor de pe canal. De asemenea, cuvintele de cod pot fi aranjate astfel încât cele care sunt apropiate în distanta Euclidiana sa aiba indici de cod apropiati în distanta Hamming. Rezultatul obtinut este ca erorile de transmisie determina decodorul sa selectioneze un cuvînt apropiat de cel original. Se obtine astfel compresie maxima (pe baza entropiei) si o sensibilitate redusa la erorile de transmisie.

O metoda clasica de proiectare a listei de cuvinte de cod este algoritmul LBG, care este un algoritm optimizat local utilizat în mod frecvent la proiectarea cuantizorilor vectoriali pentru imagine si semnal vocal.

În ultimul timp au fost propuse pentru proiectarea codorilor vectoriali retele artificiale neuronale (ANN=Artificial Neural Network) care elimina limitarile algoritmilor traditionali. Retelele ANN sunt formate dintr-un numar mare de unitati de calcul simple interconectate între ele, care pot lucra în paralel. Algoritmii de proiectare cu ANN nu necesita acces în acelasi timp la întregul set de date pentru învatare.



Fig.4.4 Principiul codarii vectoriale


Cuantizarea vectoriala diferentiala (DVQ=Differential Vector Quantization) înlocuieste cuantizorul scalar din schema DPCM cu un cuantizor vectorial. Rezulta un sistem care îmbina multe din avantajele celor doua metode de compresie.

Un rol important în DVQ joaca marimea blocurilor de imagine considerate. În general blocurile mai mari maresc raportul de compresie dar degradeaza calitatea. De obicei se lucreaza cu blocuri 2 x 2 (), 3 x 3 (k=9), 4 x 4 (k=16). S-a constatat ca blocurile mai mari de 2 x 2 introduc o structura vizibila pe imagine, care nu este acceptabila pentru imagini de foarte buna calitate. De asemenea, blocurile 2 x 2 permit prelucrarea în timp real.

S-a constatat, prin teste pe secvente de imagini, ca eroarea patratica medie MSE depinde de numarul de biti/esantion. Pentru un numar fix de cuvinte de cod blocurile de dimensiune 2 x 2 necesita mai putine cicluri de învatare. Trebuie spus ca, daca prelucrarea în timp real se dovedeste posibila, este util sa se realizeze un sistem DVQ intercadre. De asemenea, cuantizorul vectorial poate fi facut adaptiv, arhitectura retelei neuronale artificiale ANN putând fi folosita pentru reactualizarea listei de cuvinte de cod pe masura ce se modifica proprietatile statistice ale imaginii.


4.5 Standarde de compresie digitala a imaginilor


4.5.1 Standardul JPEG

Standardul JPEG (Joint Photographic Experts Group) este utilizat pentru compresia imaginilor fixe. Grupul JPEG a fost creat în 1988 sub egida ISO ca un proiect comun al ISO si al comisiei Q16 CCITT. În anul 1992 a devenit standard ISO. Rata de compresie poate ajunge pâna la 15:1. Exista si o varianta pentru secvente de imagini MJPEG (Motion JPEG). Standardul JPEG permite patru moduri de operare :

Codare secventiala DCT , în care fiecare componenta de imagine (YUV) este codata într-o singura explorare de la stânga la dreapta si de sus în jos.

Codare progresiva DCT, în care imaginea este codata în explorari succesive pentru a produce o imagine rapida, decodata brut atunci când timpul de transmisie este lung.

Codare fara pierderi, în care imaginea este codata pentru a garanta o refacere exacta dupa decodare. Se utilizeaza algoritmi de codare cu predictie în locul codarii cu DCT.

Codare ierarhica, în care imaginea este codata cu rezolutii multiple.

Imaginea sursa ce trebuie codata consta din 1 pâna la 255 de planuri de imagine fiecare cu alt numar de pixeli. De exemplu se pot coda imagini în format RGB (3 plane cu aceeasi rezolutie) sau YUV (3 plane cu rezolutii diferite). Toti pixelii dintr-un plan sunt codati cu acelasi numar de biti.

Schema bloc a codorului si a decodorului JPEG pentru codarea secventiala este prezentata în fig.9.4.

Codorul JPEG consta din trei blocuri principale

Blocul de transformare cosinus discret (DCT)

Cuantizorul

Codorul entropic

La intrarea codorului esantioanele din gama [0, 2p -1] sunt translatate în gama [-2p-1 , 2p-1-1]. De exemplu, pentru imagini cu p=8, esantioanele originale din gama [0, 255] sunt translatate în gama

Apoi imaginea este divizata în blocuri de esantioane de dimensiune 8x8, asupra carora se efectueaza transformata cosinus discreta (DCT)




unde   


iar pentru u si v diferite de 0

Coeficientul F(0,0) se numeste coeficient DC iar ceilalti 63 de coeficienti se numesc coeficienti AC. Pentru p coeficientii DCT sunt în gama [-1024,+1023], ceea ce implica trei biti aditionali pentru reprezentarea lor.

Pentru un bloc tipic de imagine majoritatea coeficientilor DCT au valori zero sau apropiate de zero. Pe acest lucru se bazeaza compresia de spectru.



Fig.4.5 Codor si decodor JPEG. Schema bloc



În etajul urmator, cuantizorul, cei 64 de coeficienti DCT sunt cuantizati utilizând un tabel de cuantizare cu 64 de elemente specificat de aplicatie. Cuantizarea reduce amplitudinea coeficientilor care a caror contributie este neglijabila la calitatea imaginii, având ca scop cresterea numarului de coeficienti DCT egali cu zero. Cuantizarea se face în conformitate cu urmatoarea ecuatie

unde [ ] simbolizeaza partea întreaga iar Q(u,v) sunt coeficientii specificati în tabelul de cuantizare. Fiecare element Q(u,v) este un numar întreg cuprins între 1 si 255, care specifica pasul de cuantizare pentru coeficientul DCT corespunzator.

Dupa cuantizare cei 63 de coeficienti AC sunt ordonati într-o secventa în zig-zag. Aceasta ordonare în zig-zag va facilita în pasul urmator codarea entropica pentru ca se poate vedea pe imagini reale ca probabilitatea ca sa fie în aceasta secventa coeficienti egali cu zero creste monoton cu indexul coeficientilor.

Coeficientii DC, care sunt valoarea medie a esantioanelor dintr-un bloc 8x8, sunt codati printr-o tehnica de codare adaptiva, prin transmisia diferentei dintre doi coeficienti DC de la doua blocuri adiacente. Acest lucru se face pentru ca exista o corelatie puternica între coeficientii DC de la blocuri adiacente.

În final, codarea entropica ofera o compresie de spectru aditionala. Standardul JPEG specifica doua metode de codare entropica codarea Huffman si codarea aritmetica. Standardul de baza secvential JPEG utilizeaza codare Huffman. Codarea Huffman converteste coeficientii DCT într-o secventa binara compacta utilizând doua etape

Formarea secventei de simbol intermediare

Conversia acestei secvente în secventa binara cu tabelele Huffman.

În secventa de simboluri intermediare fiecare coeficient AC este reprezentat printr-o pereche de simboluri

Simbol 1    (RUNLENGTH, SIZE)

Simbol 2    (AMPLITUDINE)

RUNLENGTH este numarul de coeficienti AC consecutivi cu valoare zero care preced un coeficient AC diferit de zero. Gama sa de valori este între 0 si 15, ceea ce necesita 4 biti.

SIZE este numarul de biti necesari pentru codarea AMPLITUDE. Numarul de biti pentru AMPLITUDE este între 0 si 10 biti, astfel încât sunt necesari 4 biti pentru a coda SIZE.

AMPLITUDE este amplitudinea coeficientului AC diferit de zero care poate fi în gama [+1024, -1023], ceea ce necesita 10 biti pentru codare.

De exemplu, daca secventa coeficentilor AC este


reprezentarea secventei de simboluri este :


unde RUNLENGTH=6, SIZE=9, AMPLITUDE=476.

Daca RUNLENGTH este mai mare decât 15, atunci simbolul (15,0) este interpretat ca extensia cu RUNLENGTH 16. Pot exista pâna la trei extensii consecutive (15,0).

Pentru coeficientii DC reprezentarea simbolurilor intermediare este

Simbol-1 (SIZE)

Simbol-2 (AMPLITUDE)

Deoarece coeficientii DC sunt codati diferential aceasta gama este dubla fata de gama coeficentilor AC si este

A doua etapa în codarea Huffman este conversia secventei intermediare de simboluri în secventa binara. Simbolurile sunt înlocuite coduri cu lungime variabila, începând cu coeficientul Dc si continuând cu coeficientii AC. Fiecare Simbol-1 (pentru coeficientii AC si DC este codat cu un cod cu lungime variabila (VLC=Variable Length Code) obtinut dintr-un tabel Huffman specificat pentru fiecare componenta de imagine YUV. Simbolurile-2 sunt codate utilizând un cod cu lungime variabila de tip VLI (Variable Length Integer, a carui lungime în biti este data în tabelul 4.3.



Tabelul 4.3

Lungime cod

Gama amplitudinilor
























Decodarea standardului secvential JPEG cuprinde în ordine inversa toate etapele procesului de codare asa cum se prezinta în figura 9.4.


Decodorul entropic (Huffman) este primul bloc în care secventa binara este convertita într-o secventa de simboluri utilizând tabelele Huffman (pentru coeficientii codati VLC) si decodarea VLI, dupa care simbolurile se convertesc în coeficienti DCT. Apoi se face decuantizarea conform ecuatiei

Unde Q(u,v) sunt coeficientii de cuantizare din tabelul de cuantizare utilizat si la codare.

Este efectuata apoi transformarea cosinus discreta inversa (IDCT) care face transformarea în domeniul spatial

unde C(u) si C(v) au aceleasi expresii ca la transformarea cosinus discreta directa..

Ultimul pas consta în translatarea esantioanelor în gama [0, 2p-1].


4.5.2 Standardele din familia MPEG

Standardele MPEG (Moving Picture Experts Group) sunt propuse pentru compresia imaginilor cu miscare.

Primul standard introdus în 1991 (MPEG-1 , ISO/IEC 11172 din 1993) este destinat compresiei imaginilor video cu miscare cu rezolutie 320x240 (calitate VHS) pâna la viteze de transmisie de 1-1,5 Mbit/s.

Standardul MPEG-2 introdus în 1994 (ISO/IEC 13818 din 1996) este destinat transmisiei imaginilor de cu rezolutie mai buna (720x480), similara cu cea din standardului digital de studio. Fluxul de date MPEG-2 ajunge la 4-10 Mbit/s. Standardul permite transmisia imaginilor cu întretesere. MPEG-2 permite transmisia imaginilor pentru o larga varietate de aplicatii care necesita rezolutii diverse cum sunt comunicatiile video prin retele ISDN utilizând ATM.

Metoda de compresie în standardele MPEG-1 si MPEG-2 este hibrida si utilizeaza transformata cosinus discreta (DCT) intracadru si codare cu predictie cu compensarea miscarii intercadre. Raportul de compresie poate ajunge pâna la 200

Pentru televiziunea de înalta definitie (HDTV High Definition Television) s-a stabilit initial sa se creeze un standard special, MPEG-3. Ulterior s-a constatat ca nu este necesar un astfel de standard si ca se poate folosi tot standardul MPEG-2, evident cu cresterea vitezei de transmisie dupa compresie fata de viteza necesara pentru semnale video pentru imagini cu rezolutie normala codate MPEG-2.

Standardele MPEG-1 si MPEG-2 au creat posibilitatea dezvoltarii televiziunii digitale si, de asemenea posibilitatea televiziunii interactive pe CD-ROM si apoi pe DVD (Digital Video Disk)..

Standardul MPEG-4 (ISO/IEC 14496-2 din anul 2000) a fost dezvoltat pentru a oferi utilizatorilor un nou nivel de interactiune cu continutul vizual. Metodele de compresie sunt diferite de cele din standardele MPEG-1 si MPEG-2. Standardul MPEG-4 ofera tehnologii pentru a vizualiza, accesa si manevra obiecte în locul esantioanelor, tehnologii robuste la erori si pentru o gama larga de viteze de transmisie. Domeniile de aplicatie sunt televiziunea digitala, aplicatii grafice interactive (continut sintetic) si multimedia interactiva.

În loc sa considere imaginea ca fiind formata din esantioane (pixeli) de diverse amplitudini si cu variatie în timp pentru imagini cu miscare (asa cum se întâmpla la MPEG-1 si MPEG-2), standardul MPEG-4 considera imaginea formata din obiecte care se afla în fata unui fundal, atât obiectele cât si fundalul putând sa-si modifice în timp pozitia si forma pentru imagini cu miscare. Este un mod de descriere a imaginilor mai apropriat de ceea ce se întâmpla în cadrul sistemului vizual uman, lucru ce poate explica obtinerea unor imagini de buna calitate la viteze de bit relativ scazute.


Standardele MPEG-1 si MPEG-2

Tabelul 4.4 prezinta mai multe formate de secvente video si parametrii corespunzatori ai standardului MPEG-1 si MPEG-2.


Tabelul 4.4

FORMAT

PARAMETRI VIDEO

VITEZĂ DE BIT DUPĂ COMPRESIE

STANDARD MPEG

SIF

352x240    30 Hz

1,2-3 Mbit/s

MPEG-1

CCIR 601

720X486    30 Hz

5-10 Mbit/s

MPEG-2

EDTV

960x486    30 Hz

7-15 Mbit/s

MPEG-2

HDTV

1920x1080    30Hz

20-40 Mbit/s

MPEG-2


Standardul MPEG-2 este utilizat atât pentru aplicatii simetrice cât si pentru aplicatii asimetrice. Aplicatiile asimetrice sunt caracterizate prin utilizarea frecventa a decompresiei, în timp ce procesul de compresie este efectuat o singura data. Exemplele includ televiziunea digitala ca si aplicatii interactive (filme la cerere, educatie la distanta, etc).

Aplicatiile simetrice necesita o utilizare egala a proceselor de compresie si decompresie. Exemple de astfel de aplicatii sunt posta multimedia si videoconferinta.

Standardul MPEG-2 consta din trei parti

Sincronizarea si multiplexarea secventelor video si audio.

Video.

Audio.

Se prezinta în continuare principiile standardului video.

Se definesc 8 frecvente de cadre

23,976 Hz ; 24 Hz ; 25 Hz ; 29,97 Hz ; 30 Hz ; 50 Hz ; 59,94 Hz ; 60 Hz .

Fiecare imagine se împarte în zone numite macroblocuri cu dimensiunea de 16 x 16 pixeli pentru Y si 8 x 8 pixeli pentru U si V.

În standardul MPEG-2 cadrele de imagine sunt codate utilizând trei algoritmi diferiti, asa cum se prezinta în figura 4.6.

Fig.4.6 Tipuri de cadre în standardul MPEG-2


Cadrele de tip I sunt codate intracadru utilizând transformata cosinus discreta (DCT) în mod sismilar cu standardul JPEG. Aceste cadre sunt puncte de acces aleator în fluxul de date MPEG-2 si au cea mai scazuta rata de compresie.

Cadrele de tip P sunt codate cu predictie temporala având ca referinta cadre de tip P sau de tip I anterioare. Raportul de compresie pentru aceste cadre este net superior fata de cadrele I.

Cadrele de tip B sunt codate bidirectional în timp utilizând doua cadre de referinta (unul anterior si unul posterior) care pot fi de tip I sau P. Aici se obtine rata de compresie cea mai mare.

Din cele expuse mai sus rezulta ca ordinea de decodare va fi diferita de ordinea de codare. Cadrul P (5) trebuie sa fie decodat înaintea cadrelor B (2,3,4), iar cadrul I (9) înaintea cadrelor B (6,7,8). La transmisia semnalului MPEG ordinea de transmisie trebuie sa fie 1,5,2,3,4,9,6,7,8.

Daca este necesar acces aleator rapid cea mai buna solutie ar fi codarea tuturor cadrelor drept cadre I (MPEG devine identic cu MJPEG). Cea mai mare rata de compresie se obtine cu un numar cât mai mare de cadre de tip B.

Procesul de codare pentru cadrele de tip B si P include estimarea miscarii pentru extragerea informatiei de miscare din secventa video. Pentru fiecare bloc 16 x 16 din cadrele B si P se calculeaza unul sau doi vectori de miscare. Pentru cadrele B se calculeaza un vector de miscare, iar pentru cadrele B interpolate se calculeaza doi vectori de miscare. Standardul MPEG-2 nu indica un anumit algoritm pentru estimarea miscarii dar specifica modul de codare a rezultatului. Se codeaza vectorul de miscare si diferenta dintre blocuri. Zona de cautare (amplitudinea vectorului de miscare) nu este definita în standard dar este restrânsa prin definirea gamei vectorului. Cu cât zona de cautare este mai mare, cu atât estimarea miscarii este mai buna (desi calculul este mai complex) si rata de compresie mai mare.


Standardul MPEG-4

Aplicatiile multimedia atrag atentia din ce în ce mai mult industriei telecomunicatiilor, a bunurilor de consum electronice si industriei de calculatoare. Într-un sens larg multimedia este cadrul general de interactiune cu informatiile provenite din mai multe surse, inclusiv video.

Un standard multimedia este de asteptat sa ofere suport pentru un mare numar de aplicatii. Aceste aplicatii se traduc într-un set specific de cerinte care pot sa fie foarte diferite. Un domeniu comun pentru majoritatea aplicatiilor este necesitatea de a suporta interactivitatea cu diverse tipuri de date. Aplicatiile legate de informatia vizuala pot fi gruoate pe baza mai multor trasaturi :

Codarea formei poate fi realizata în mod binar (forma fiecarui obiect fiind descrisa printr-o masca binara) , sau în modul corespunzator unei scari de gri (permitând astfel transparemta obiectelor afisate si reducând fenomenele de aliere la marginile obiectului).

Compensarea miscarii se face pe blocuri, cu modificarea corespunzatoare pentru marginile obiectului. Marimea blocurilor poate fi 16 x 16 sau 8 x 8, cu rezolutie spatiala de jumatate de esantion.

Codarea zonelor cu texturi se bazeaza pe utilizarea transformatei cosinus discreta (DCT) pe blocuri 8 x 8, cu modificari corespunzatoare pentru blocurile de la marginea obiectelor. Zonele statice cu texturi se pot coda cu transformarea wavelet.

Rezistenta la erori se realizeaza prin utilizarea unor markeri de sincronizare, coduri de extensie pentru header si coduri reversibile cu lungime variabila.

Scalabilitatea se realizeaza atât spatial cît si temporal. MPEG-4 realizeaza scalabilitate pe baza de obiect, cu restrictia ca forma obiectului sa fie rectangulara.


Punctele de conformitate pentru MPEG-4 sunt definite ca Profilul Simplu (Simple Profile), Profilul Nucleu (Core Profile) si Profilul Principal (Main Profile). Primele doua profile sunt specifice pentru imagini cu rezolutie tipica QCIF si CIF (vezi paragraful 4.5.3.), cu viteze de bit dup[ compresie de 64 kbit/s, 128 kbit/s, 384 kbit/s si 2 Mbit/s. Profilul principal se foloseste pentru imagini cu rezolutie tipica CIF, ITU-R 601 si HDTV, cu viteze de bit dup[ compresie de 2 Mbit/s, 15 Mbit/s si 38,4 Mbit/s.


4.5.3 Alte standarde de compresie a imaginilor

Recomandarea CCITT H.261 din 1990 (cunoscuta si sub denumirea de p x 64) este optimizata pentru a obtine rapoarte foarte mari de compresie pentru imagini color cu miscare. Ea se utilizeaza în videotelefonie si videoconferinta.

Algoritmul de compresie combina codarea intracadru DCT cu codarea cu predictie intercadre. Deoarece în aplicatiile de videoconferinta si videotelefonie nu exista miscare foarte rapida, iar majoritatea timpului miscarea lipseste, algoritmul utilizeaza strategii de estimare si compensare a miscarii limitate spatial la 15 pixeli. Se pot obtine rapoarte de compresie între 100 si 2000

Standardul este utilizat pe canale ISDN cu viteze de transmisie multipli ai vitezei de baza de 64 Kbit/s. Numarul p poate fi cuprins între 1 si 30, de unde rezulta ca viteza de transmisie este cuprinsa între 64 Kbit/s si 2 048 Kbit/s. Pentru p egal cu 1 sau 2 se pot implementa doar comunicatii de tip videotelefon. Pentru p mai mare decât 6 se poate transmite o videoconferinta.

Spre deosebire de JPEG care admite o mare varietate de formate de imagine, standardul H.261 precizeaza foarte exact formatul de imagine. Imaginile au frecventa cadrelor de 29,97 Hz (59,94 Hz : 2) iar în procesul de codare este posibil sa se genereze o secventa comprimata cu 10 - 15 cadre/s. Componentele imaginii , luminanta si cele doua diferente de culoare sunt subesantionate conform Rec. CCIR 601 (standardul digital de studio) la 6,75 MHz pentru luminanta si 3,375 MHz pentru cele doua diferente de culoare.

Sunt specificate doua formate de rezolutie cu raport de aspect al imaginii de 4

a)     Formatul comun intermediar (CIF=Common Intermediate Format) cu rezolutie egala cu 288 linii x 352 pixeli pentru semnalul de luminanta si 144 linii x 176 pixeli pentru semnalele diferenta de culoare.

b)    Formatul sfert CIF (QCIF Quarter CIF) care are rezolutia redusa la jumatate pe fiecare directie (orizontala si verticala) fata de formatul CIF (144 linii x 176 pixeli pentru luminanta si 72 linii x 88 pixeli pentru diferentele de culoare), adica o rezolutie de 4 ori mai mica pe ansamblu decât la formatul CIF.

Formatul QCIF necomprimat are viteza de transmisie de 9,115 Mbit/s , iar formatul CIF necomprimat are viteza de transmisie de 36,45 Mbit/s.

Algoritmul de codare cuprinde :

Codare intracadru (corespunde codarii tip I din MPEG).

Codare intercadre (corespunde codarii tip P din MPEG).

Conform standardului H.261 nu este obligatoriu ca dispozitivul codor sa determine un vector de miscare, de unde rezulta ca o implementare simpla considera doar diferentele dintre macroblocurile situate în aceeasi pozitie în cadre succesive (vector de miscare egal cu 0). Daca se utilizeaza o implementare mai complexa componentele vectorului de miscare se codeaza entropic cu un sistem VLC (Variable Length Coding). Cuantizarea este liniara si pasul de cuantizare se regleaza în conformitate cu cantitatea de date din registrul tampon (buffer). Acest mecanism forteaza o viteza de date constanta la iesirea codorului.

Recomandarea 723 CCIR este un alt standard de compresie pentru transmisia semnalelor video care se refera la codarea pentru transmisie a imaginilor din standardul digital de studio 4 : 2 : 2. Viteza de transmisie este cuprinsa între 34 Mbit/s si 140 Mbit/s.











































Document Info


Accesari: 6747
Apreciat: hand-up

Comenteaza documentul:

Nu esti inregistrat
Trebuie sa fii utilizator inregistrat pentru a putea comenta


Creaza cont nou

A fost util?

Daca documentul a fost util si crezi ca merita
sa adaugi un link catre el la tine in site


in pagina web a site-ului tau.




eCoduri.com - coduri postale, contabile, CAEN sau bancare

Politica de confidentialitate | Termenii si conditii de utilizare




Copyright © Contact (SCRIGROUP Int. 2025 )