Sunteți pe pagina 1din 62

9.

TEHNICI DE WATERMARKING PENTRU IMAGINI


‫܇‬I VIDEO

9.1. Introducere

În ultimele decenii, apariĠia camerelor digitale foto úi video, cât úi a CD-urilor, a DVD-
urilor sau a discurilor Blueray, a uúurat crearea, stocarea si vizualizarea informaĠiei
multimedia digitale. În plus, apariĠia calculatoarelor mai rapide, combinată cu creúterea
capacităĠii de stocare úi cu mărirea vitezei de transfer, facilitează utilizarea globală a
tehnologiei digitale. Toate acestea au dus la o adevărată explozie în ceea ce priveúte folosirea
datelor digitale úi, cel puĠin în domeniul media, putem considera că trăim într-o lume digitala.
ConĠinutul digital are mari avantaje în ceea ce priveúte stocarea si procesarea. Mai mult,
el poate fi reprodus fără a se pierde din calitate, permiĠând modificarea într-un mod uúor úi
imperceptibil. Acest lucru permite distribuirea de informaĠie audio úi vizuală de înaltă calitate
úi producerea de animaĠii vizuale incredibil de reale în industria filmului. Totuúi, această
digitalizare aduce după ea úi probleme: proprietatea intelectuală este mai greu de protejat úi
acelaúi lucru se întâmplă úi cu conĠinutul original. De aceea trebuie dezvoltate noi metode care
să protejeze proprietatea intelectuală úi să securizeze conĠinutul informaĠiilor digitale.
Watermarking-ul digital este o tehnologie relativ nouă care inserează informaĠie ascunsă
în imagini, muzică, date audio sau video prin modificarea imperceptibila a acestora. Este o
tehnica diferită de cea de criptare în sensul că watermarking-ul constă în ascunderea existenĠei
informaĠiei secrete, în timp ce criptarea încearcă doar să protejeze această informaĠie. Deúi
procedurile de inserare sunt proiectate astfel încât oamenii să nu observe marcajele inserate,
pot fi create programe care să poată extrage marcajele originale cu destul de multă uúurinĠă.
Apoi ele pot fi folosite pentru protecĠia drepturilor de autor, supravegherea transmisiei sau
pentru autentificarea conĠinutului.
Datoritӽ gamei largi de aplicaĠii úi potenĠialului mare al watermarking-ului, aceastӽ sub-
disciplinӽ a securităĠii comunicaĠiilor a atras mult interes în ultimii ani. La momentul actual a
evoluat pânӽ la stadiul de candidat recunoscut pentru protecĠia dreptului de autor, dreptului de
proprietate úi a sistemelor de securitate bazate pe amprentӽ. Mai mult, o serie de aplicaĠii
comerciale ale watermarking-ului pentru dispozitive de control al copierii sunt planificate sau
chiar deja implementate. Pe viitor se doreúte dezvoltarea unor scheme mai robuste de
watermarking care să îmbunătăĠească permanent utilitatea acestei tehnici.
154 Analiza úi prelucrarea digitală a semnalelor video

9.1.1. Scurt istoric


Tehnicile de watermarking nu sunt noi. Ele sunt doar un subdomeniu al steganografiei.
Cuvântul steganografie provine din cuvintele greceúti: steganos care înseamnă acoperit,
ascuns úi graphia care înseamnă scris, deci steganografia ar fi scrierea ascunsă. În comparaĠie
cu criptografia care codează mesajul pentru a fi neinteligibil pentru persoane neautorizate,
steganografia ascunde existenĠa mesajului. Kahn a găsit rădăcinile steganografiei in Egipt
acum 4000 de ani, unde, pentru a înscrie informaĠii în mormântul unui nobil, Khnumhoteb II,
au fost folosite substituiri de simboluri hieroglifice [115], [116].
Herod a scris cum grecii au fost înútiinĠaĠi de intenĠiile ostile ale lui Xerxes printr-un
mesaj scris sub vopseaua unei mese. O altă metodă de scriere ascunsă pe care a descris-o, era
tunderea mesagerului úi tatuarea mesajului sau a unei imagini pe capul acestuia. După
creúterea părului mesajul era indetectabil pană la tundere [117], [118].
O altă metodă sugerată de Aenas Tacticianul era marcarea diferitelor litere dintr-un text
cu cerneală invizibilă iar literele marcate formau mesajul secret.
Tehnica „watermarking” a fost folosită prima dată în secolul al XIII-lea în Fabriano,
Italia, pentru etichetarea bucăĠilor de hârtie făcute de mânӽ [119]. Inventatorii au introdus
desene în foile de hârtie prin subĠierea anumitor regiuni sau prin plasarea unor fire în material.
Se putea avea acces la desenul inserat prin punerea bucăĠii uscate a hârtiei marcate într-o
lumină puternică. Tehnica Watermarking a fost folosită pentru a distinge materialul folosit la
fabricare, pentru a identifica marcajul hârtiei [120] sau, mai simplu, pentru decoraĠiuni [121].
Tehnica a fost numita „watermarking” deoarece urmele formate de fire erau percepute ca
suprafeĠe de apă pe articolele marcate [119].
Aceasta tehnică a fost acceptată ca o unealtă de etichetare pentru foi de hârtie. În secolul
al XVIII-lea, marcatorii de hârtie foloseau watermark-uri pentru înregistrarea informaĠiilor
despre hârtia produsă. În acest fel, watermark-urile au servit úi încă servesc ca un mijloc de
identificare a hârtiei cu membrii organizaĠiei care au produs-o. În aproximativ acelaúi timp,
numărul în creútere al schimburilor comerciale úi circulaĠia bancnotelor au mărit problemele
legate de falsificarea banilor. Din acest motiv, watermarking-ul a devenit rapid o metodă
eficientă de a împiedica duplicarea bancnotelor. Deoarece s-a dovedit că este eficientă,
tehnica watermarking este încă folosită pentru protejarea bancnotelor.
Johannes Trithemius (1462-1526), un călugăr german, a fost primul care a folosit
termenul steganografie. El a codat litere folosind cuvinte religioase, astfel încât mesajele să
fie practic transformate în rugăciuni cu sens. Drept recompensă pentru artificiul său, prima
copie tipărită a manuscrisului său Steganographia, realizată în anul 1606, a fost plasată în
Index-ul interzis al Vaticanului úi caracterizată ca „plină de superstiĠii” [115], [122].
9. Tehnici de watermarking pentru imagini ‫܈‬i video 155

Figura 9.1. Prima pagină a cărĠii lui Porta: „De occultis notis”

În anul 1593, Giovanni Baptista Porta a publicat o carte despre criptografie sub titlul:
„De occultis literarum notis seu artis animemi occulte alijs significadi, aut ab alijs significata
expiscandi enodandique. Libri III” (vezi Figura 9.1). El a descris, printre altele, în cartea sa o
metodă de ascundere a unui mesaj text secret într-un document gazdă prin intermediul unei
măúti. In următorul exemplu mesajul secret poate fi extras prin ignorarea textului mascat (gri)
[123]:

Honor Militiae tuus suit Carolus pater, nam cum infini to victus est, cum minima
exercitu inuitus parte hostis fugit, ac prope ultimum diem iniurius peribit, necabunt
Bere illum; atque extemplo puer Arato peribit, res omnes deprehensae bonae si sunt,
ante Sillam, & optimo capite non poenitentias amplius decidere sperabit. Vale.

În secolul al 17-lea nu era neobiúnuit să publici manuscrise anonime, mai ales când era
vorba despre scrieri istorice. Riscul de a stârni mânia diferitelor grupări politice puternice, ce
ar fi avut urmări severe pentru autor, era prea mare. Din acest motiv, episcopul Francis
Godwin úi-a codat numele în prima literă a fiecărui capitol din manuscrisul său [122]. Acesta
este un exemplu timpuriu de protecĠie a drepturilor de autor.
Un exemplu de codare a informaĠiei de drepturi de autor in piese muzicale a fost
practicat de Bach care úi-a ascuns numele în multe din piesele sale. De exemplu, în piesa sa
pentru cor, „Vor deinem Tor”, a folosit codarea cu cheie nulă scriind B-A-C-H în note
muzicale prin numărul de apariĠii a unor note: o apariĠie pentru A, două apariĠii pentru B, trei
pentru C úi opt pentru H [116]. La mijlocul anilor 1950, Emil Hembrooke, un inginer de la
Muzak Corporation, a introdus o autorizaĠie prin watermarking pentru lucrările muzicale.
156 Analiza úi prelucrarea digitală a semnalelor video

Introducerea unei chei de identificare a autorului a fost destinată să identifice respectiva piesă.
Tehnica foloseúte aplicarea intermitentă a unui filtru îngust în semnalul audio folosind un cod
bazat pe codul Morse. In [124], sistemul este descris după cum urmează:
Prezenta invenĠie face posibilă identificarea provenienĠei unei prezentări muzicale úi,
în consecinĠ΁, constituie o metodă eficientă de prevenire a pirateriei; poate fi
comparată cu watermark-ul la hârtie.
În cel de-al doilea război mondial, tehnicile de steganografie erau deja larg răspândite
[115], [117]. În SUA, serviciul poútal a interzis mai multe obiecte ce ar fi putut ascunde
mesaje, ca de exemplu jocuri de úah, reviste de cuvinte încruciúate úi fragmente de ziare. Alte
obiecte au fost modificate înainte de livrare, ora ceasurilor de mână a fost schimbată, timbre
au fost dezlipite úi coli de hârtie goale au fost schimbate. Cenzura a refrazat telegrame pentru
a preveni eventualele mesaje text ce ar fi putut fi ascunse în mesaje text normale. Mii de
oameni au fost implicaĠi în citirea de scrisori, în căutarea exprimării ambigue. De exemplu,
următorul exemplu a fost trimis de un spion german [115]:
Apparently neutral’s protest is thoroughly discounted and ignored. Isman hard hit.
Blockade issue affects pretext for embargo on by-products, ejecting suets and vegetable oils.
Extrăgând a doua literă a fiecărui cuvânt se obĠine:
Pershing sails from NY June 1.
În anii 1980, tehnicile steganografice au fost folosite ca amprentă. Premierul Margaret
Thatcher a devenit atât de iritată de scurgerea de informaĠii din documente ale cabinetului
spre presă încât a ordonat ca editoarele de text să fie astfel reprogramate, încât identitatea
utilizatorului să fie codată în spaĠierea dintre cuvinte, reuúind astfel să identifice miniútrii
neloiali [125].
Watermarking-ul a trebuit să aútepte mult până să atragă destulă atenĠie úi să devină un
câmp activ de cercetare. În 1988, Komatsu úi Tominaga au fost primii care au folosit termenul
„digital watermarking” pentru sistemul lor de autentificare a imaginii [126]. Deúi au mai
existat câteva publicaĠii între timp, o lucrare scrisă de Cox úi al. [127] a fost începutul unei
cercetări intense. Numărul de publicaĠii despre watermarking a crescut aproape exponenĠial
între 1995 úi 2010. Desigur, meritul nu a fost al lucrării scrise de Cox úi al., ci al organizaĠiilor
de cercetători în domeniul watermarking-ului. Prima conferinĠă „Information Hiding
Workshop” a avut loc în anul 1996 úi în 1999 „Societatea inginerilor în instrumentaĠie foto-
optică”, SPIE, a început să organizeze conferinĠe în special cu tema „Securitate si tehnici de
Watermarking pentru conĠinut multimedia”. În afară de eforturile oficiale, diferite persoane au
contribuit la formarea unei noi comunităĠi de cercetare. Munca lui Martin Kutter pe tema
„Digital Watermarking” este primul úi probabil cel mai bun exemplu de efort individual
pentru avansarea tehnologiei. Între timp, folosirea comercialӽ a watermarking-ului digital
(WD) a început să intereseze companii úi organizaĠii. Industria muzicală a apărut cu
„IniĠiativa Securizării Digitale a Muzicii”, SDMI, în 1999, pentru a crea un mediu legitim
pentru distribuĠia muzicii digitale. În plus, au fost create câteva companii (ex. Digimarc
Corporation, Alpvision si Alpha-Tec), specializate în DW. Acest lucru a avut ca rezultat o
creútere considerabilă a efortului destinat cercetării în diferite domenii ale WD. Este de
9. Tehnici de watermarking pentru imagini ‫܈‬i video 157

aúteptat ca un număr mare de afaceri să fie create în viitorul apropiat pentru a crea noi baze
pentru această tehnologie [128].

9.1.2. Securitatea în comunicaĠiile multimedia


Acum 20 de ani documentele multimedia erau aproape inexistente pe piaĠa de consum.
Dar, odată cu dezvoltarea rapidă a tehnologiei informaĠiei digitale, orice calculator are la
dispoziĠie compresia de imagini úi video de înaltă calitate, acces úi bandă largă în reĠea, medii
portabile de stocare cu densitate mare úi puterea de procesare necesară. Dar aceste avansuri
tehnologice au condus la o altă criză. Utilizatorii multimedia au posibilitatea să modifice, să
producă copii ale conĠinutului digital distribuit ilegal. Fără rezolvarea acestei probleme de
securitate, produsele úi serviciile multimedia digitale nu pot fi lansate corespunzător în
comerĠul electronic [129].
Semnătura digitală úi criptografia sunt două domenii standardizate pentru protecĠia
conĠinutului digital. Semnătura digitală este folosită pentru autentificarea transmisiunilor
digitale. Este bazată pe criptografia cu cheie publică úi funcĠii hash unidirecĠionale. Prin
trecerea documentului printr-o funcĠie hash unidirecĠională publică este generat un
identificator unic care este codat cu cheia privată a utilizatorului. Astfel este produs un úir de
caractere numit semnătură digitală. Pe lângă documentul semnat, destinatarii primesc chei
publice din partea autorităĠilor de certificare [130]. Documentul este autentic doar dacă se
potriveúte cu semnătura decriptată prin aplicarea funcĠiei hash. Oricum, documentul úi
semnătura nu sunt legate în nici un fel. La transmiterea documentelor multimedia ele pot fi
separate accidental sau intenĠionat de către o persoană răuvoitoare. Astfel, destinatarul nu o să
poată verifica autenticitatea documentului. În plus, această metodă de detecĠie a modificărilor
este prea restrictivă pentru obiecte multimedia. Nu permite documentului sӽ fie supus
compresiei úi schimbărilor de format úi să îúi menĠină, în acelaúi timp, autenticitatea. Dacă
doar un singur bit diferă de original, de exemplu datorită compresiei fără pierderi pentru
transfer eficient în reĠea, testul de identificare cu funcĠia hash o să eúueze.
Folosirea cheilor de licenĠă sigure din punct de vedere al criptografiei este altă metodă
de protecĠie a proprietăĠii intelectuale digitale. ConĠinutul documentelor este protejat
împotriva manipulării úi furtului în timpul livrării prin faptul că deschiderea documentului
este permisă doar persoanelor care posedă cheia corespunzătoare. Oricum, dezavantajul critic
al acestei soluĠii este că, după transmisia úi livrarea documentului [129], destinatarul permis
are acces la datele proprietare, ce apoi pot fi reproduse perfect úi distribuite fără cheltuieli.
Deci, această tehnică nu este efectivă datorită faptului că nu oferă protecĠie permanentă
conĠinutului multimedia după livrare. Mai mult chiar, prin această metodă proprietarul
intelectual nu poate depista responsabilii pentru piratare.
O soluĠie ideală ar trebui să integreze, într-un fel, informaĠia de securitate direct în
conĠinutul documentului multimedia úi informaĠia de securitate să fie inseparabilă de
document de-a lungul timpului lui de viaĠă util. Mai mult, informaĠia adiĠională ar trebui să fie
perceptual invizibilă deoarece, în cele din urmă, documentele multimedia sunt procesate de
către observatori sau ascultători umani iar conĠinutul nu trebuie să fie afectat. În sfârúit, mai
158 Analiza úi prelucrarea digitală a semnalelor video

intervine úi flexibilitatea sistemului folosit. Ar trebui să poată identifica copii diferite ale
documentului.
Watermarking-ul digital este una dintre soluĠiile potrivite. Cu mult timp în urmă era o
tehnică analogică folosită pentru protecĠia de documente valoroase, ca de exemplu bani,
cecuri úi corespondenĠa oficială. Watermark-ul pe hârtie reprezintă un model fin ce este
adăugat de către producător hârtiei. Aceste urme sunt greu de reprodus convingător úi, în
acelaúi timp, nu obstrucĠionează procesarea normală, cum ar fi citirea, úi sunt imposibil de
eliminat fără a cauza distrugerea puternică a conĠinutului documentului. Tehnologiile de
watermarking digital tind spre a atinge aceste scopuri în mediul digital prin inserarea unui
watermark recuperabil direct în copia soft a fluxului de date.

9.1.3. Criptografia
Criptografia este prima tehnologie la care proprietarii drepturilor intelectuale ar trebui
să apeleze. Este probabil cea mai obiúnuită metodă de protecĠie a documentelor digitale úi
sigur una dintre cele mai bine dezvoltate ca útiinĠă. Înainte de livrare documentul este criptat
úi cheia de decriptare este distribuită doar celor ce au permisiunea de a accesa copii legale ale
conĠinutului. Apoi fiúierul criptat se publică pe Internet, dar ar fi inutil pentru un pirat fără
cheia corespunzătoare. După criptare structura mesajului este schimbată; mesajul este fără
înĠeles úi neinteligibil până la decriptare [120].
Există două tipuri de sisteme de criptare: simetrice úi asimetrice [131]. Sistemele de
criptare simetrice folosesc aceeaúi cheie, numită cheie privată, atât la criptarea, cât úi la
decriptarea mesajului, iar sistemele asimetrice de criptare folosesc o cheie, numită cheie
publică, pentru criptare, úi o cheie diferită, numită cheie privată, pentru decriptare. Sistemele
asimetrice de criptare se numesc úi sisteme de criptare cu cheie publică.
Sistemele de criptare simetrice au o problemă: „cum se transportă cheia secretă de la
expeditor la destinatar într-o manieră secretă úi fără posibilitate de modificare?” [131]. Dacă
s-ar putea trimite cheia în siguranĠă, atunci, teoretic, s-ar putea utiliza canalul securizat pentru
a transmite mesajul iniĠial fără a mai cripta mesajul folosind sistemul de criptare simetric. De
obicei, pentru a rezolva această problemă, se folosesc curieri de încredere. Un exemplu de
folosire a unui sistem de criptare simetric este prezentat în Figura 9.2. Cristina úi Mihai doresc
să comunice în secret, în timp ce George vrea să tragă cu urechea. Cristina úi Mihai pot fi
avioane militare, afaceri online sau doar prieteni, ce doresc sa aibă o conversaĠie privată. Nu îl
pot opri pe George să asculte semnalele lor radio, dar comunică folosind criptografia. Cristina
úi Mihai schimbă între ei o cheie digitală, astfel încât ambii să o cunoască, dar în rest să fie
secretă [132]. Cristina foloseúte această cheie ca să cripteze mesajele pe care le trimite úi
Mihai reconstruieúte mesajul original prin decriptare cu aceeaúi cheie. Mesajele criptate sunt
inutile pentru George care nu cunoaúte cheia úi, deci, nu poate reconstrui mesajul iniĠial. Cu
un algoritm bun de criptare această schemă poate funcĠiona bine, dar transferul cheii úi, în
acelaúi timp, păstrarea ei secretă pentru George este o problemă.
9. Tehnici de watermarking pentru imagini ‫܈‬i video 159

Cristina Mihai

Cheie Cheie

Mesaj Criptare Decriptare Mesaj


George

Figura 9.2. Sistem de criptare simetric

Mihai cheie
publică
Cristina Mihai

Cheie Cheie Generator


publică secretă de chei

Mesaj Criptare Decriptare Mesaj


George

Figura 9.3. Sistem de criptare asimetric

Sistemul de criptare asimetric este o altă soluĠie mai eficientă úi mai sigură. Un exemplu
de sistem de criptare asimetric este RSA care este o cunoscută unealtă de securitate [132].
Sistemul asimetric de criptare este diferit, deoarece împarte cheia într-o cheie de criptare úi o
cheie secretă pentru decriptare. Nu este posibilă determinarea cheii secrete folosind cheia
publică.
În Figura 9.3 Mihai generează o pereche de chei, spune tuturor, inclusiv lui George,
cheia lui publică, dar păstrează doar pentru el cheia secretă. Oricine poate folosi cheia publică
a lui Mihai ca sa îi trimită mesaje criptate, dar doar Mihai cunoaúte cheia secretă ca să le
decripteze. Această schemă permite ca Mihai úi Cristina să comunice în secret fără să fie
nevoie să se întâlnească.
160 Analiza úi prelucrarea digitală a semnalelor video

9.1.4. Watermarking digital


Tehnica watermarking este un caz particular al securităĠii multimedia. Watermarking-ul
digital se defineúte ca un semnal digital inserat în datele digitale úi poate fi numit úi informaĠie
de drepturi de autor. Watermarking-ul este un proces cheie în protejarea drepturilor de
proprietate a datelor electronice, inclusiv imagini, video, sunet, etc. CerinĠa adiĠională pentru
watermarking este robusteĠea. Chiar dacă existenĠa watermark-ului este cunoscută, cum este
cazul în schemele publice de watermarking, în mod ideal ar trebui să fie imposibil pentru un
atacator să îndepărteze sau să distrugă informaĠia watermark fără a distruge inclusiv
documentul sursă. În general, watermark-ul are trei proprietăĠi: este imperceptibil, inseparabil
de documentul sursă úi parcurge aceleaúi transformări ca úi documentul sursă [133]. O schemă
simplă de watermarking este prezentată în Figura 9.4. Procesul de watermarking reprezintă,
de fapt, adăugarea semnalului watermark W la semnalul sursă. Semnalul watermark poate
depinde, în afară de informaĠia watermark W’ úi de o cheie K úi de semnalul sursă în care este
ascuns (vezi EcuaĠia (9.1)).
W f 0 ( I , K ,W c) (9.1)
Algoritmul de inserare a watermark-ului are la intrare datele sursă I, ca de exemplu o
imagine, watermark-ul W úi eventual o cheie K úi oferă la ieúire imaginea cu watermark I’
(vezi Figura 9.4).
Algoritmul de verificare este o metoda corespunzătoare de recuperare a informaĠiei
watermark din semnalul mixat, eventual cu ajutorul unei chei úi a imaginii/watermark-ului
original (vezi EcuaĠia (9.2)).
Wc g ( I , I c, K ) (9.2)

Figura 9.4. Inserarea úi detecĠia watermark-ului


9. Tehnici de watermarking pentru imagini ‫܈‬i video 161

9.1.5. CerinĠele unui sistem de watermarking


Fiecare sistem de watermarking are propriile cerinĠe specifice. De aceea nu există un set
de cerinĠe ce trebuiesc îndeplinite de toate tehnicile de watermarking. Oricum, câteva direcĠii
generale pot fi date pentru majoritatea aplicaĠiilor:
x TransparenĠă perceptuală: În majoritatea aplicaĠiilor, algoritmul de watermarking
trebuie să ascundă watermark-ul astfel încât acest lucru să nu afecteze calitatea
datelor gazdă. O procedură de ascundere a watermark-ului este cu adevărat
imperceptibilă dacă oamenii nu pot deosebi datele originale de cele cu watermark-ul
inserat. Deoarece utilizatorii datelor cu watermark nu au acces la datele originale, nu
pot face această comparaĠie. De aceea, ar fi suficient ca modificările datelor supuse
procesului de watermarking să treacă neobservate, atâta timp cât datele nu sunt
comparate cu cele originale.
x Capacitate (adaos de informaĠie): Cantitatea de informaĠie ce poate fi stocată în
watermark depinde de aplicaĠie. Pentru protecĠia la copiere, un singur bit de
informaĠie ar fi suficient. Conform unei propuneri pentru tehnologiile de
watermarking audio din partea International Federation for Phonographic Industry
(IFPI), adaosul minim de informaĠie pentru un watermark audio ar trebui să fie 20
biĠi/s, independent de nivelul semnalului úi de tipul muzicii [134]. Oricum, conform
[135], acest minim este foarte ambiĠios úi ar trebui scăzut la câĠiva biĠi pe secundă.
Pentru protecĠia proprietăĠii intelectuale pare rezonabil de presupus că cineva doreúte
să ascundă o cantitate de informaĠie similară cu cea folosită de ISBN, International
Standard Book Numbering, (10 digiĠi) sau ISRC, International Standard Recording
Code (12 caractere alfa-numerice). În afară de acest lucru, ar mai trebui inclus anul úi
drepturile acordate asupra datelor. Deci am ajunge la 60 biĠi [136] sau 70 biĠi [137]
de informaĠie ce ar trebui introdusă în datele gazdă (imagine, cadru video, fragment
audio).
x RobusteĠe: Un watermark fragil ce îúi propune să dovedească autenticitatea datelor
gazdă, nu trebuie să fie robust la tehnicile de procesare sau alterări intenĠionate ale
datelor gazdă, deoarece eúuarea tentativei de a detecta watermark-ul dovedeúte că
datele gazdă au fost modificate úi nu mai sunt autentice. Dar dacă watermark-ul este
folosit pentru alt tip de aplicaĠie, este preferabil să rămână permanent în datele gazdă,
chiar dacă calitatea lor se degradează intenĠionat sau neintenĠionat. Exemple de
modificări neintenĠionate sunt aplicaĠiile de stocare sau transmisiune a datelor,
deoarece sunt aplicate tehnici de compresie cu pierderi pentru a reduce rata de bit úi a
creúte eficienĠa. Alte tehnici de procesare ce includ degradarea neintenĠionată a
calităĠii includ filtrarea, reeúantionarea, conversiile digital-analog úi analog-digital.
Pe de altă parte, datele cu watermark pot fi supuse procesării cu singurul scop de a
elimina watermark-ul. În plus, atunci când există mai multe copii ale aceluiaúi
conĠinut cu watermark-uri diferite, ca în cazul amprentei digitale, eliminarea
watermark-ului este posibilă prin conlucrarea dintre mai mulĠi proprietari de copii. În
general, nu ar trebui să existe nici o cale de a elimina sau altera watermark-ul fără o
162 Analiza úi prelucrarea digitală a semnalelor video

degradare a calităĠii perceptuale a datelor gazdă suficientă pentru a le face


inutilizabile.
x Securitate: Securitatea tehnicilor de watermarking poate fi interpretată în acelaúi fel
ca úi securitatea tehnicilor de criptare. Conform [125], ar trebui presupus că metoda
folosită pentru a cripta datele este cunoscută unei părĠi neautorizate úi că securitatea
trebuie să fie asigurată prin alegerea unei chei. Astfel, o tehnică de watermarking este
cu adevărat sigură, dacă cunoaúterea exactă a algoritmului de ascundere úi de
extragere a watermark-ului nu ajută o parte neautorizată să detecteze prezenĠa
watermark-ului.
x Watermarking public úi privat: În unele aplicaĠii, ca de exemplu protecĠia
drepturilor de autor úi monitorizarea datelor, algoritmii de extragere a watermark-ului
pot folosi datele originale, fără watermark, pentru a găsi watermark-ul. Aceste
tehnici se numesc tehnici de watermarking private. Pentru majoritatea celorlaltor
aplicaĠii, ca de exemplu protecĠia la copiere úi indexarea, algoritmii de extragere nu
au acces la datele fără watermark. În aceste cazuri extragerea watermark-ului este
mai dificilă. Algoritmii de watermarking de acest tip se numesc publici, orbi sau
evidenĠi.
Toate cerinĠele de mai sus sunt legate între ele. De exemplu, un watermark foarte robust
poate fi obĠinut prin realizarea de modificări foarte puternice ale datelor gazdă pentru fiecare
bit al watermark-ului. Oricum, modificările mari ale datelor sursă vor fi observabile iar multe
modificări per bit de watermark vor limita cantitatea maximă de biĠi de watermark ce pot fi
stocaĠi într-un obiect de date. Pe de altă parte, securitatea algoritmului de watermarking
influenĠează enorm robusteĠea lui. Dacă nu este sigur, nu poate fi nici prea robust.

TransparenĠă perceptuală

Adaos de informaĠie RobusteĠe Securitate

Public sau privat

Figura 9.5. DependenĠele mutuale dintre cerinĠele de bază ale unui sistem de watermarking
9. Tehnici de watermarking pentru imagini ‫܈‬i video 163

Astfel, ar trebui găsit un compromis între diferitele cerinĠe, încât să poată fi dezvoltat un
watermark optim pentru fiecare aplicaĠie în parte. DependenĠele mutuale dintre cerinĠele de
bază sunt descrise în Figura 9.5.

9.1.6. Domenii de aplicabilitate


Tehnicile watermarking pot fi folosite pentru următoarele scopuri:
x ProtecĠia drepturilor de autor: Pentru protejarea drepturilor intelectuale,
proprietarii datelor pot ascunde în datele lor un watermark reprezentând informaĠie
de drepturi de autor. Acest watermark poate dovedi proprietatea în instanĠă atunci
când cineva a încălcat drepturile de autor.
x Amprentarea: Pentru a descoperi sursa copiilor ilegale, proprietarul poate folosi o
tehnică de amprentare. În acest caz, proprietarul ascunde watermark-uri diferite în
copiile documentului, ce sunt distribuite diferiĠilor clienĠi. Amprentarea poate fi
comparată cu ascunderea în datele originale a unui număr serial ce este legat de
identitatea clientului. Acest lucru permite proprietarului drepturilor intelectuale să
identifice clienĠii care au încălcat condiĠiile de licenĠă prin punerea datelor la
dispoziĠia unei părĠi terĠe.
x ProtecĠia la copiere: InformaĠia stocată în watermark poate controla direct aparate
digitale de înregistrare cu scopul protecĠiei la copiere [138]. În acest caz, watermark-
ul este un bit ce interzice copierea úi detectoarele din recorder determină dacă datele
oferite pot fi stocate sau nu.
x Monitorizarea emisiei: Prin ascunderea de watermark-uri în reclame comerciale, un
sistem de monitorizare automatizat poate verifica dacă reclamele sunt emise conform
contractului [125]. Nu doar reclame, ci úi producĠii TV valoroase pot fi protejate prin
monitorizarea traficului [139]. Buletinele de útiri pot avea o valoare de sute de mii de
USD pe oră, fapt ce le face foarte vulnerabile la violări ale drepturilor de proprietate
intelectuală. Un sistem de monitorizare a traficului poate verifica toate canalele de
transmisie úi poate factura posturile TV în funcĠie de rezultate.
x Autentificarea datelor: Pot fi folosite watermark-uri fragile [140] pentru verificarea
autenticităĠii datelor. Un watermark fragil indică faptul cӽ datele au fost alterate úi
oferă informaĠii în legătură cu poziĠia părĠii alterate.
Tehnicile de watermarking nu sunt folosite doar în scopuri de protecĠie. Alte aplicaĠii ar
fi:
x Indexarea: Indexarea de muzică, imagini sau secvenĠe video unde pot fi incluse
comentarii direct în conĠinut, indexarea de filme úi buletine de útiri în care pot fi
inserate marcaje úi comentarii ce pot fi apoi folosite de motoare de căutare.
x SiguranĠa medicală: Inserarea datei úi numelui pacientului în imagini medicale
poate fi o măsură de securitate folositoare [125].
164 Analiza úi prelucrarea digitală a semnalelor video

x Ascunderea datelor: Tehnicile de watermarking pot fi folosite pentru transmiterea


de mesaje private secrete. Deoarece diferite guverne restricĠionează folosirea
serviciilor de criptare, anumite persoane ar putea ascunde mesaje în altfel de date.
În ultimii ani au fost propuse mai multe tehnici de watermarking pentru diferite domenii
de aplicabilitate folosind diferite metode de inserare úi extragere. Tehnicile de watermarking
pot fi clasificate din mai multe puncte de vedere conform Tabelul 9.1.

Tabelul 9.1. Clasificarea tehnicilor de watermarking

Clasificare ConĠinut
Text
Imagine
Tipul datelor gazdă
Audio
Video
Vizibil
TransparenĠă perceptuală
Invizibil
Robust
RobusteĠea watermark-ului Semi-fragil
Fragil
Zgomot
Text
Tipul watermark-ului inserat
Siglă
Imagine
LSB
CorelaĠie
Domeniul spaĠial
Metode statistice
Cuantizare
Cosinus (DCT)
Domeniul frecvenĠă Wavelet (DWT)
Fourier (DFT)
Domeniul de procesare JPEG
JPEG2000
Domeniul comprimat MPEG1
MPEG2
MPEG4
Audio-vizual
Hibrid Watermark-uri diferite
Scheme watermarking diferite
Privat
Date necesare pentru extragere Semi-privat
Public
9. Tehnici de watermarking pentru imagini ‫܈‬i video 165

Watermarking-ul digital poate fi aplicat pentru mai multe tipuri de documente, ca de


exemplu text, audio, imagini úi video. Tehnicile de watermarking pot fi clasificate în tehnici
cu watermark vizibil sau invizibil. De obicei sunt folosite cele cu watermark invizibil, dar
există aplicaĠii úi pentru watermark-uri vizibile, ca de exemplu pagina de internet a unei
agenĠii de fotografii. ClienĠii agenĠiei ar trebui să poate vedea fotografiile, dar să nu le poată
folosi decât după ce au efectuat plata pentru fotografiile respective. Astfel, agenĠia poate
insera un watermark vizibil, ca de exemplu sigla firmei, peste materialul foto úi să permită
eliminarea ei doar după ce clientul a efectuat plata.
Watermark-ul trebuie să fie robust pentru a proteja proprietatea împotriva diferitelor
atacuri. Astfel, se poate face o clasificare în trei categorii: watermark-uri robuste, semi-fragile
úi fragile. Pot fi alese, în funcĠie de necesităĠi, diferite aplicaĠii pentru diferite nivele de
robusteĠe. AplicaĠiile pentru protecĠia drepturilor de autor au nevoie de un watermark robust,
aplicaĠii pentru autentificare sau demonstrarea integrităĠii necesită un watermark fragil sau
semi-fragil.
Din punctul de vedere al tipului informaĠiei watermark, ele pot fi: zgomot, text, sigle,
imagini binare. Primul tip include secvenĠe de zgomot pseudo-aleator, aleator gaussian sau
haotic. Watermark-ul poate fi o secvenĠa aleatoare cu un singur bit de informaĠie sau
informaĠie cu sens formată din mai mulĠi biĠi. O secvenĠă aleatoare este de obicei mai robustă,
dar inserarea de informaĠie cu sens este pentru unele aplicaĠii mai importantă.
O altă clasificare se poate face în funcĠie de domeniul în care se realizează inserarea
watermark-ului: domeniul spaĠial, frecvenĠă, comprimat sau hibrid.
În sfârúit, metodele de extragere a watermark-ului pot fi clasificate ca private, semi-
private úi publice, în funcĠie de necesitatea datelor originale pentru extragere.

9.2. Tehnici de watermarking pentru imagini

Unul dintre motivele dezvoltării rapide a cercetării în domeniul watermarking-ului


digital este necesitatea de a găsi soluĠii pentru protecĠia proprietăĠii intelectuale a materialelor
digitale. Chiar dacă există tehnici de watermarking pentru orice tip de date digitale,
majoritatea lucrărilor din literatura de specialitate se adresează tehnicilor de watermarking
pentru imagini pentru protecĠia drepturilor de autor. În acest capitol realizăm un rezumat al
tehnicilor robuste de watermarking propuse în literatura de specialitate. Majoritatea tehnicilor
descrise se aplică imaginilor cu nuanĠe de gri, dar pot fi extinse uúor úi pentru imagini color
prin inserarea watermark-ului în toate componentele de crominanĠă úi pentru secvenĠe video
prin inserarea aceluiaúi watermark sau watermark-uri diferite în diferite cadre ale secvenĠei
video. O să încercăm sӽ punctăm, în primul rând, ideile de bază úi, apoi, să explicăm mai
detaliat câteva metode pentru a ilustra modul în care principiile sunt puse în practică.
Foarte mulĠi algoritmi de watermarking sunt, de fapt, foarte asemănători úi diferă doar
parĠial sau prin unul dintre următoarele patru aspecte singulare:
x Alegerea locaĠiei de inserare a watermark-ului. Aici adresăm metode ce nu iau în
calcul, respectiv, ce iau în calcul Sistemul Vizual Uman (SVU).
166 Analiza úi prelucrarea digitală a semnalelor video

x Domeniul în care operează algoritmul. De exemplu, un algoritm poate modifica


imaginea direct în domeniul spaĠial pentru a insera un watermark sau poate întâi
transforma imaginea originală într-un alt domeniu, de exemplu, în domeniul
Transformatei Fourier Discrete, Transformatei Cosinus Discrete, Transformatei
Wavelet Discrete, insera watermark-ul în domeniul transformat úi, în cele din urmă,
calcula transformata inversă pentru a obĠine imaginea cu watermark. Vor fi discutate
avantajele úi dezavantajele diferitelor domenii.
x Codarea watermark-ului. Este adresat modul de reprezentare a informaĠiei de
inserat. Watermark-ul poate fi pur úi simplu însumat la datele originale sau aceste
date pot fi modificate pentru a oglindi prezenĠa watermark-ului.
x Formarea datelor cu watermark. Aici sunt prezentate modurile în care watermark-
ul este inserat în datele sursă.
x Modul de extragere a watermark-ului. Este strâns legat de modul de inserare.
Deoarece watermark-ul are o putere mică în comparaĠie cu datele sursă, decodorul
operează într-un mediu cu raport semnal-zgomot mic. Există o serie de metode de
îmbunătăĠire a performanĠelor decodorului, inclusiv în cazul în care imaginea cu
watermark a fost modificată de un atacator.
Fiecare dintre aceste categorii vor fi discutate mai pe larg în cele ce urmează.

9.2.1. LocaĠia de inserare a watermark-ului


În literatura de specialitate problema imperceptibilităĠii watermark-ului este tratată de
regulă în două moduri diferite. Prima grupă de metode permite doar modificări arbitrare mici
pentru inserarea watermark-ului într-o imagine sau secvenĠă video în domeniul spaĠial sau
transformat, pentru a nu cauza vreo distorsiune vizibilă. Metodele din a doua grupă abordează
aceeaúi problemă prin utilizarea unor proprietăĠi explicite ale sistemului vizual uman pentru a
satisface compromisul dintre imperceptibilitate úi robusteĠe. Majoritatea metodelor din grupul
doi sunt tehnici de watermarking cu spectru împrăútiat [141]. Tehnicile ce exploatează
caracteristici ale SVU, ca de exemplu sensibilitatea spaĠială sau la luminanĠă [142], [143], pot
fi, de asemenea, incluse în acest grup. Alte metode sunt bazate pe caracteristici de nivel mai
înalt ale SVU, ca de exemplu mascarea în frecvenĠă [144], mascarea entropiei [145], mascarea
entropiei miúcării [146], fenomene de focalizare a ochiului uman [147] úi unele caracteristici
temporale ale SVU. Toate acestea cresc în mod clar complexitatea algoritmului. AplicaĠia cea
mai importantă pentru astfel de metode este protecĠia drepturilor de autor unde complexitatea
sau procesarea în timp real nu sunt cerinĠe prea importante.

A. Tehnici de watermarking ce nu folosesc caracteristicile SVU


Una dintre cele mai populare abordări din acest grup lucrează în domeniul spaĠial úi
inserează watermark-ul în cel mai puĠin semnificativ bit al pixelilor imaginii [148].
Dezavantajul acestei metode este sensibilitatea la procesări de semnal. Koch úi alĠii [149, 150]
sugerează schimbarea ordinii unor perechi de coeficienĠi DCT de frecvenĠă medie pentru a
insera un watermark, deoarece frecvenĠele medii tind să supravieĠuiască compresiei JPEG úi
9. Tehnici de watermarking pentru imagini ‫܈‬i video 167

produc o distorsiune vizuală mai mică decât frecvenĠele joase. O metodă asemănătoare [151]
inserează un bit de watermark în cadrele Intra (I) a secvenĠei video codate MPEG prin
schimbarea relaĠiei dintre coeficienĠii de frecvenĠă medie din blocuri alăturate. Într-o abordare
în domeniul Wavelet [152], cadrele Y ale secvenĠei video sunt descompuse în subnivele
wavelet úi watermark-ul este inserat în componentele de frecvenĠă joasă printr-un proces
controlat de cuantizare [153]. Wang úi Kuo selectează coeficienĠi wavelet importanĠi pentru
watermarking [154] bazându-se pe un codec wavelet cu mai multe praguri [155], dar
algoritmul lor necesită imaginea originală pentru decodare. În lucrarea [156], watermark-ul
este inserat în domeniul Transformatei Fourier Discrete 3-D. Pentru fiecare element al
secvenĠei de watermark sunt selectaĠi doi coeficienĠi din domeniul transformat úi elementul
secvenĠei de watermark este inserat în unul dintre ei în funcĠie de semn.
Alte metode din acest grup folosesc semnalul video comprimat ca intrare, iar
watermark-ul este inserat direct în coeficienĠii codaĠi sau în vectorii de miúcare după
compresia video [157-160].
Din păcate, nici una dintre aceste metode nu ia în considerare SVU la inserarea
watermark-ului pentru a exploata percepĠia umană.

B. Tehnici de watermarking ce folosesc caracteristicile SVU


În această clasă de metode, problema imperceptibilităĠii este tratată folosind
proprietăĠile SVU.
Ochiul uman este mai puĠin sensibil la zgomot în zone cu textură decât în zone uniforme
ale unei imagini sau cadru video. Sistemele de compresia tind úi ele să păstreze intacte zonele
cu textură úi marginile, cuantizând în schimb zonele uniforme cu un pas de cuantizare mare.
Din aceste motive Cox úi alĠii [161, 162] argumentează că watermark-ul ar trebui inserat în
zone perceptual importante ale imaginii. Un atacator nu poate îndepărta uúor watermark-ul
fără a cauza o distorsiune importantă. În această metodă, după aplicarea transformatei DCT
imaginii, watermark-ul este ponderat cu o fracĠiune a coeficientului DCT úi adăugat la acelaúi
coeficient DCT. De fapt, ponderarea energiei watermark-ului în funcĠie de valoarea
coeficientului din domeniul frecvenĠă este o aproximare a principiului de mascare de contrast
a SVU [144] care se referă la scăderea vizibilităĠii unui semnal în prezenĠa altui semnal mai
puternic. În cadrul metodelor de watermarking cu spectru împrăútiat scăderea vizibilităĠii se
presupune direct proporĠională cu amplitudinea coeficientului DCT, cu toate că în realitate
dependenĠa este neliniară [142], [144]. Un dezavantaj al acestei metode este posibilitatea
apariĠiei de artefacte vizibile în imagine, mai ales în regiuni uniforme [163].
Darmstaedtler úi alĠii descriu o schemă de watermarking în domeniul spaĠial la care
imaginea este divizată în blocuri, fiecare bloc este clasificat în funcĠie de contrastul său, iar
watermark-ul este inserat corespunzător. Metodele de watermarking în diferite domenii vor fi
discutate mai în detaliu în subcapitolul 2.2.
Tehnicile de watermarking cu spectru împrăútiat sunt, de asemenea, adaptate la secvenĠe
video prin folosirea unei descompuneri 3-D multi-rezoluĠie. În [164], după ce semnalul video
este descompus în sub-semnale folosind Transformata Wavelet 3-D, watermark-ul este
168 Analiza úi prelucrarea digitală a semnalelor video

însumat la coeficienĠii wavelet trece-sus la fiecare nivel de rezoluĠie, excluzând primul nivel.
Într-o abordare asemănătoare, în [165] watermark-ul este însumat în domeniul wavelet 3-D
prin ponderarea watermark-ului cu o mască definită în funcĠie de varianĠa úi luminanĠa
subbenzilor 3-D. Datorită aceluiaúi raĠionament ca úi în cazul tehnicilor de watermarking cu
spectru împrăútiat pentru imagini, dezavantajul acestor metode este o posibilă distorsiune de
tip fluctuaĠie în domeniul timp.
Tot din acest grup fac parte úi tehnicile ce folosesc sensibilitatea spaĠială úi la luminanĠă
a SVU. Sensibilitatea spaĠială se referă la fenomenul de diferenĠiere mai uúoară a
modificărilor din regiuni de contrast scăzut, în comparaĠie cu schimbările din regiunile de
contrast mare. Una dintre cele mai importante lucrări de watermarking în domeniul
comprimat [166] utilizează sensibilitatea spaĠială prin folosirea unui coeficient de ponderare
mai mic pentru inserarea watermark-ului în regiuni trece-jos úi un coeficient mai mare pentru
regiunile de contrast mare ale cadrului video. Ulterior a fost propusă în [167] o abordare
asemănătoare pentru protecĠia la copiere pentru formatul DVD. În [168] acelaúi principiu este
folosit pentru inserarea watermark-ului în obiecte video. Aici este aplicată Transformata
Wavelet obiectelor video úi este inserat un watermark în coeficienĠii de frecvenĠă înaltă prin
ponderarea cu o mască vizuală calculată din caracteristice spaĠiale ale imaginii din subbanda
respectivă. În [169] sensibilitatea spaĠială a SVU este exploatată în domeniul DCT. Pentru
fiecare bloc DCT de luminozitate, de dimensiune 8x8 pixeli, al cadrelor I ale semnalului
video codat MPEG, este determinată puterea úi regiunea de inserare a watermark-ului în
funcĠie de energia totală a coeficienĠilor AC din acel bloc, conform sensibilităĠii spaĠiale a
SVU. Pe lângă sensibilitatea spaĠială, este folosită úi sensibilitatea la luminanĠă a SVU [170].
În acest caz, watermark-ul este ponderat cu o mască vizuală, având la bază faptul că ochiul
uman este mai puĠin sensibil la contrast în zone întunecate sau luminoase, în comparaĠie cu
zonele de luminanĠă medie [142].
Pentru toate metodele anterioare se foloseúte, de regulă, un factor de scalare ce satisface
compromisul dintre imperceptibilitate úi robusteĠe. În mod evident, dezavantajul unei astfel de
abordări este necesitatea unui proces de control pentru a satisface criteriul de
imperceptibilitate de fiecare dată când watermark-ul este inserat într-un conĠinut diferit.
Există úi metode ce folosesc modele mai sofisticate ale SVU, utilizând măsurări
perceptuale explicite, numite praguri de contrast, pentru determinarea locaĠiei úi puterii
watermark-ului. În general, pragul de contrast se referă la nivelul minim de contrast pentru ca
o grilă sinusoidală să fie vizibilă [144]. Creúterea pragurilor de contrast pentru multe
caracteristici diferite ale SVU, ca de exemplu mascarea luminanĠei [142], mascarea
contrastului [142], mascarea entropiei [145], mascarea entropiei miúcării [146], mascarea
temporală [171] úi fenomene de focalizare a ochiului uman [147] este analizată prin teste
perceptuale. Pragurile pentru aceste fenomene se numesc, pur úi simplu, Just Noticeable
Differences (JND - DiferenĠe Abia Perceptibile) [142]. În [163] JND sunt exploatate în
contextul mascării luminanĠei úi a contrastului pentru determinarea puterii úi a locaĠiei de
inserare a watermark-ului. Watermark-ul este inserat în blocuri de 8x8 coeficienĠi DCT care
sunt mai mari decât JND, pentru a satisface imperceptibilitatea úi robusteĠea la atacuri prin
9. Tehnici de watermarking pentru imagini ‫܈‬i video 169

compresie. Într-o altă abordare [172] este folosită mascarea entropiei ce se referă la efectul de
interacĠiune dintre blocuri vecine la calcularea valorilor JND. Metodele mai sus menĠionate
sunt extinse úi pentru video codat MPEG prin inserarea watermark-ului în cadre I úi aplicarea
unei interpolări liniare simple în timp a watermark-urilor între două cadre I consecutive,
pentru a evita pâlpâirea temporală la fiecare cadru intra din secvenĠa video. Un dezavantaj al
acestor metode este ineficienĠa în utilizarea „spaĠiului disponibil” pentru ascunderea datelor,
deoarece cadrele inter sunt excluse din procesul de watermarking.
Problema imperceptibilităĠii, în special pâlpâirea temporală, este, de asemenea, abordată
în unele metode [173-175] prin luarea în calcul atât a dimensiunilor spaĠiale, cât úi a celei
temporale în procesul de inserare a watermark-ului. În [173] o Transformată Wavelet
Temporală este aplicată fiecărui cadru video úi în fiecare cadru de coeficienĠi wavelet este
inserat câte un watermark diferit, ponderat conform caracteristicilor SVU de mascare spaĠială
úi de contrast. O altă schemă de watermarking [174], ce se ocupă cu problema pâlpâirii
temporale este propusă, în special pentru cinematografia digitală, inserând watermark-ul în
valoarea medie a luminanĠei Y a semnalului video. Pentru a evita pâlpâirea temporală se
inserează acelaúi bit de watermark într-un număr de cadre succesive. Ulterior, metoda a fost
extinsă în [175] prin filtrarea trece-jos a watermark-ului înainte de inserare pentru a nu cauza
o diferenĠă majoră între pixeli consecutivi.
Pe lângă alegerea locaĠiei conform importanĠei lor vizuale, se poate folosi úi o cheie, de
regulă generată de un număr aleator, pentru selectarea coeficienĠilor ce urmează să conĠină
watermark-ul. Un exemplu este algoritmul Patchwork [152] ce selectează n perechi de pixeli
folosind o cheie K. LuminanĠa a jumătate dintre pixelii selectaĠi este incrementată cu 1, pe
când cealaltă jumătate este decrementată cu 1. Decodorul ce foloseúte aceeaúi cheie K
selectează aceleaúi perechi de pixeli úi compară diferenĠa dintre mediile celor două jumătăĠi.
Pornind de la prezumĠia că n este suficient de mare úi că pixelii selectaĠi sunt relativ
independenĠi úi distribuiĠi identic, diferenĠa dintre cele două medii va fi aproximativ 2n.
Această metodă permite însă doar verificarea existenĠei watermark-ului úi nu poate insera un
watermark de dimensiune mai mare. Algoritmul lui Kutter [176] foloseúte o cheie pentru a
partiĠiona pixelii imaginii úi a selecta un subset pentru watermarking. În comparaĠie cu
algoritmul Patchwork ce schimbă doar statistica imaginii, watermark-ul este adaptat
perceptual imaginii. În sfârúit, se poate insera repetat watermark-ul în întreaga imagine úi se
pot evalua diferitele copii extrase la decodor conform autenticităĠii lor [177].

9.2.2. Domeniul de inserare a watermark-ului


A. Watermarking în domeniul spaĠial
Primii algoritmi de watermarking au fost concepuĠi în domeniul spaĠial. Aceste metode
sunt de obicei mult mai directe úi, astfel, necesită úi mult mai puĠin efort de calcul decât cele
ce lucrează în domeniul transformatei. De aceea, astfel de algoritmi sunt indicaĠi pentru
implementarea în timp real. În continuare sunt prezentate câteva dintre cele mai importante
metode în domeniul spaĠial.
170 Analiza úi prelucrarea digitală a semnalelor video

Watermark vizibil
O tehnică foarte simplă, dar folosită la scară largă, pentru inserarea watermark-ului în
imagini este adăugarea unui simbol peste imaginea existentă. De obicei acest simbol este tot o
imagine, un logo sau ceva asemănător care distorsionează imaginea gazdă.
În exemplul din Figura 9.6 simbolul este imaginea roúie din mijloc, iar imaginea gazdă
este cea din stânga. Într-un editor standard de imagini este posibilă însumarea celor două
imagini úi obĠinerea imaginii cu watermark. Atâta timp cât watermark-ul este cunoscut,
procesul invers este posibil fără efecte adverse, astfel încât imaginea originală nu trebuie
păstrată. Watermark-ul este vizibil úi, chiar úi fără watermark-ul original, este posibilă
eliminarea simbolului watermark fără prea mare efort.

Modificarea celui mai puĠin semnificativ bit


Dacă fiecare pixel al unei imagini în tonuri de gri este reprezentat pe 8 biĠi, imaginea
poate fi împărĠită în 8 planuri de biĠi. În Figura 9.7, aceste 8 planuri de bit sunt reprezentate
pentru imaginea „Lena”, unde, în colĠul stânga sus, este imaginea corespunzătoare celui mai
semnificativ plan de biĠi, iar, în colĠul dreapta jos, imaginea corespunzătoare celui mai puĠin
semnificativ plan de biĠi.
Deoarece cel mai puĠin semnificativ plan de biĠi nu conĠine informaĠie vizuală foarte
importantă, poate fi înlocuit printr-o cantitate enormă de biĠi de watermark. În Figura 9.8 sunt
prezentate patru exemple de ascundere a watemark-ului într-unul sau mai multe planuri de
biĠi, unde imaginea din stânga este imaginea gazdă iar cea din dreapta este watermark-ul.
Există diferite variaĠii ale acestei metode. În [178], autorul propune 2 metode: prima
metodă înlocuieúte cei mai puĠin semnificativi biĠi ai fiecărui pixel cu un zgomot pseudo-
aleator iar a doua însumează o secvenĠă pseudo-aleatoare la planul de biĠi cel mai puĠin
semnificativ. O altă metodă de watermarking calculează o sumă de verificare a imaginii
originale úi apoi o inserează în cel mai puĠin semnificativ bit al unor pixeli aleúi aleator [178-
180].

+ =
Figura 9.6. Inserarea unui watermark vizibil
9. Tehnici de watermarking pentru imagini ‫܈‬i video 171

Figura 9.7. Planurile de biĠi pentru imaginea Lena

Aceste tehnici de watermarking nu sunt prea sigure úi nici prea robuste la tehnici de
procesare, deoarece cel mai puĠin semnificativ plan de biĠi poate fi uúor înlocuit cu biĠi
aleatori, eliminând astfel eficient biĠii watermark-ului.

Imaginile originale BiĠi folosiĠi: 1

BiĠi folosiĠi: 4 BiĠi folosiĠi: 7

Figura 9.8. Înlocuirea biĠilor mai puĠini semnificativi biĠi ai imaginii din stânga cu biĠii cei mai
semnificativi ai imaginii din dreapta
172 Analiza úi prelucrarea digitală a semnalelor video

Tehnici de watermarking bazate pe corelaĠie

k X

Cheie

W(x,y): SecvenĠă
pseudo-aleatoare {-1,0,1}
Figura 9.9. Procedura de inserare a watermark-ului cu spectru împrăútiat

O metodă directă de a insera un watermark într-o imagine în domeniul spaĠial este


adăugarea unei secvenĠe de zgomot pseudo-aleator la valorile de luminanĠă ale pixelilor
imaginii. Multe metode sunt bazate pe acest principiu [180-185]. În general, secvenĠa de
zgomot pseudo-aleator constă din întregii {-1,0,1}, dar pot fi folosite úi numere în virgulă
mobilă. SecvenĠa este generată pe baza unei chei, folosind, de exemplu, registre de deplasare
sau numere binare deplasate aleator. Singura constrângere este ca energia secvenĠei să fie cât
mai uniform distribuită úi ca secvenĠa să nu fie corelată cu conĠinutul imaginii sursă. Pentru a
crea imaginea cu watermark I w ( x, y ) , secvenĠa pseudo-aleatoare W ( x, y ) este multiplicată
cu un factor de câútig k úi apoi adunată la imaginea gazdă I ( x, y ) , ca în Figura 9.9.

I ( x, y ) I ( x, y )  k ˜ W ( x , y ) (9.3)
Pentru a detecta watermark-ul într-o imagine IWc ( x, y ) , calculăm corelaĠia dintre
imaginea IWc ( x, y ) úi secvenĠa de zgomot pseudo-aleator W ( x, y ) . În general, înainte de
efectuarea corelaĠiei W ( x, y ) este normat, astfel încât să aibă medie nulă. Dacă corelaĠia R XY
9. Tehnici de watermarking pentru imagini ‫܈‬i video 173

depăúeúte un anumit prag T, detectorul determină că imaginea IWc ( x, y ) conĠine watermark-ul


W ( x, y ) :

­ ! T o W ( x, y ) detetctat
RIWc ( x , y )W ( x , y ) ® (9.4)
¯ T o W ( x, y ) nedetectat
Dacă W ( x, y ) conĠine doar întregii {-1,1} úi numărul de „-1” este egal cu numărul de 1,
atunci putem estima corelaĠia astfel:
1 Z 1 Z /2 1 Z /2
RIWc ( x , y )W ( x , y ) ¦
Z i1
IWc i ( x, y )Wi ( x, y )
Z i1
¦ IWc i Wi  
Z
¦ Ic W
i 1
Wi i


(9.5)
1
2
^
P ª¬ I Wc ( x, y ) º¼  P ª¬ I Wc ( x, y ) º¼ `
unde Z este numărul de pixeli ai imaginii IWc , supraindicii +,- indică setul de pixeli pentru care
secvenĠa de zgomot corespunzătoare este pozitivă sau negativă úi P ª¬ I Wc ( x, y ) º¼ este valoarea

medie a pixelilor din I Wc ( x, y) . Din ecuaĠia (9.5) rezultă că problema detecĠiei watermark-ului
corespunde testării ipotezei dacă două seturi aleatoare de pixeli au aceeaúi medie.
Detectorul de watermark poate face două tipuri de erori. În primul rând poate detecta
existenĠa watermark-ului, chiar dacă el nu există. Această eroare se numeúte pozitiv fals. În al
doilea rând, detectorul poate rejecta existenĠa watermark-ului, chiar dacă există. Această
eroare se numeúte negativ fals. În [139] probabilităĠile de apariĠie a cestor două tipuri de erori
rezultă din modelul autoregresiv de ordinul întâi al imaginii:

1 T Z 1 (V 2  T ) Z
Ppf erfc( ) si Pnf erfc( W ) (9.6)
2 V wV I 2 2 V wV I 2
unde
1
erfc( x) f
(9.7)
2S ³ e t 2 / 2
dt
x

În această ecuaĠie, V W2 reprezintă varianĠa pixelilor watermark-ului úi V I2 este varianĠa


pixelilor imaginii. Dacă watermark-ul W ( x, y ) este format doar din întregii {-1,1} úi numărul
de „-1” este egal cu numărul de „1”, atunci varianĠa watermark-ului V W2 este egală cu k 2 .
Erorile Pfp úi Pfn pot fi minimizate prin creúterea factorului de câútig k. Dar, pe de altă parte,
alegerea de valori mai mari pentru factorul de câútig duce la scăderea calităĠii vizuale a
imaginii cu watermark.
Deoarece conĠinutul imaginii poate avea interferenĠe cu watermark-ul, mai ales la
componentele de frecvenĠă joasă, performanĠa de detecĠie a detectorului poate fi îmbunătăĠită
prin filtrare înainte de a calcula corelaĠia. Acest lucru scade contribuĠia imaginii originale la
174 Analiza úi prelucrarea digitală a semnalelor video

corelaĠie. De exemplu, poate fi folosit un simplu filtru de accentuare a contururilor cu funcĠia


pondere Fcontur dată de:

ª 1 1 1º

Fcontur 1 10 1»» (9.8)

«¬ 1 1 1»¼

Aplicarea acestui filtru înaintea operaĠiei de corelaĠie reduce semnificativ probabilitatea


de eroare, chiar dacă calitatea vizuală a imaginii cu watermark a fost serios afectată de filtrare
[138, 181].
Pentru o serie de aplicaĠii se doreúte creúterea capacităĠii de inserare. Din punctul de
vedere al detectorului, o imagine I poate fi privită ca un zgomot gaussian ce distorsionează
informaĠia de watermark W, iar imaginea cu watermark IW poate fi privită ca ieúire a unui
sistem de comunicaĠie afectat de zgomot gaussian prin care este transmis watermark-ul. În
acest caz, transmisia sigură a watermark-ului este teoretic posibilă dacă rata de informaĠie nu
depăúeúte capacitatea canalului [186]:

§ V2 ·
Cc Wb log 2 ¨1  W2 ¸ biĠi/pixel (9.9)
© VI ¹
unde CC este dată în biĠi per pixel al imaginii úi banda disponibilă Wb este egală cu 1 Hertz per
pixel.
Pentru sistemele reale, totuúi, poate fi determinată empiric o limită mai redusă [188]:

§ V2 ·
CC Wb log 2 ¨1  W 2 ¸ biĠi/pixel (9.10)
© DV I ¹
unde Į este un factor de scalare ales, de obicei, mai mare ca 1, în jurul valorii 3.
Deoarece raportul semnal-zgomot V W2 / V I2 este mult mai mic decât unu, relaĠia de mai
sus poate fi aproximată cu:

1 § V W2 ·
CC | ¨ ¸ biĠi/pixel (9.11)
ln 2 © DV I2 ¹
Conform relaĠiei de mai sus, este posibilă inserarea a mai mult de 1 bit de informaĠie
într-o imagine. De exemplu, un watermark alcătuit din numerele întregi {-k,k}, adăugat la
imaginea Lena de rezoluĠie 512x512 pixeli (Figura 9.9), poate avea aproximativ 50, 200 sau
500 de biĠi de informaĠie pentru k=1,2,3 úi Į=3.
Există o serie de metode pentru a creúte capacitatea tehnicii de watermarking de bază.
Cea mai simplă metodă pentru a insera un úir de l biĠi de watermark b0b1...bl-1 într-o imagine,
este împărĠirea imaginii I în l subimagini I0, I1,..,.Il-1 úi inserarea unui watermark în fiecare
subimagine, unde fiecare watermark reprezintă un bit al úirului [181, 187, 188]. Acest
procedeu este descris în Figura 9.10.
9. Tehnici de watermarking pentru imagini ‫܈‬i video 175

Figura 9.10. Procedura de inserare a watermark-ului

Folosind (9.12) se pot calcula numărul de pixeli P, necesari per subimagine, pentru
detecĠia sigură a unui singur bit dintr-o subimagine:

DV I2 ln 2
P| pixeli (9.12)
V W2
BiĠii watermark-ului pot fi reprezentaĠi în mai multe moduri. Dacă bitul este 1, se
adaugă o secvenĠă pseudo-aleatoare, iar dacă este 0, subimaginea rămâne neatinsă. În acest
caz, detectorul calculează corelaĠia dintre subimagine úi secvenĠa pseudo-aleatoare úi atribuie
valoarea 1 bitului de watermark, când corelaĠia depăúeúte un anumit prag T, în caz contrar
bitul de watermark se consideră zero. Folosirea unui prag poate fi evitată, prin adăugarea a
două secvenĠe pseudo-aleatoare diferite, RP0 úi RP1, pentru biĠii de marcaj 0, respectiv 1. În
acest caz, detectorul calculează corelaĠia dintre subimagine úi cele două secvenĠe. Bitului de
watermark i se asignează valoarea asociată secvenĠei care generează corelaĠia maximă. Cele
două secvenĠe pseudo-aleatoare pot fi alese, astfel încât să difere doar prin semn, RP0= - RP1
ca úi în [188]. În acest caz, detectorul trebuie să calculeze doar o corelaĠie dintre subimagine
úi una dintre secvenĠe, iar semnul corelaĠiei determină valoarea bitului de watermark.
Altă modalitate de a creúte capacitatea watermark-ului este folosirea tehnicilor DS-
CDMA (Direct Sequence-CDMA) [189, 190]. Pentru fiecare bit bj al watermark-ului b0,b1...bl-
1 este generată o secvenĠă pseudo-aleatoare diferită, stohastic independentă, RPj, de aceeaúi
176 Analiza úi prelucrarea digitală a semnalelor video

dimensiune ca úi imaginea. Acest model este independent de valoarea bitului bj. Se foloseúte
modelul +RPj dacă bj reprezintă un 0, úi -RPj dacă bj reprezintă un 1. Suma tuturor celor l
secvenĠe aleatoare ±RPj formează watermark-ul. Înainte de însumarea watermark-ului la
imagine, acesta se poate scala cu un factor, sau se poate limita la un anumit domeniu. Un
exemplu pentru generarea unui watermark unidimensional este prezentat în Figura 9.11. Sunt
folosite úapte secvenĠe pseudo-aleatoare diferite, pentru inserarea celor úapte biĠi de
watermark 0011010.
Fiecare bit bj din úirul biĠilor watermark-ului b0,b1...bl-1 poate fi extras prin calcularea
corelaĠiei dintre imaginea normalizată IWc úi secvenĠa pseudo-aleatoare corespunzătoare RPj.
Când corelaĠia este pozitivă, este asignată bitului de watermark valoarea 0, altfel se presupune
că bitul de watermark este 1. Figura 9.12 prezintă extragerea biĠilor watermark-ului inseraĠi
conform Figura 9.11.
Ambele metode pentru creúterea capacităĠii watermark-ului descrise mai sus au
avantajele úi dezavantajele lor. Dacă fiecare bit de watermark are propria parte din imagine,
nu există interferenĠă între biĠi úi este necesar doar un număr mic de înmulĠiri pentru calculul
corelaĠiei. Dar dacă se decupează o porĠiune de imagine se pierd biĠii de watermark de la
margine. Dacă se foloseúte tehnica CDMA, probabilitatea ca toĠi biĠii să fie recuperaĠi după
decuparea imaginii este mare. Totuúi, biĠii de watermark pot interfera între ei, úi este necesară

Figura 9.11. Exemplu de generare a watermark-ului folosind CDMA pentru 7 biĠi b0,b1...b6

Figura 9.12. Exemplu de extragere a watermark-ului inserat folosind CDMA. De comparat cu Figura
9.11
9. Tehnici de watermarking pentru imagini ‫܈‬i video 177

efectuarea de multe înmulĠiri pentru calcularea corelaĠiei, deoarece fiecare bit este complet
împrăútiat pe suprafaĠa imaginii.
BiĠii de watermark inseraĠi folosind metodele menĠionate pot reprezenta orice: mesaje
de protecĠie a drepturilor de autor, numere de serie, text simplu, semnale de control, etc.
ConĠinutul reprezentat de aceúti biĠi poate fi comprimat, criptat úi protejat prin coduri
corectoare de erori. În unele cazuri poate fi util un logo ca marcaj, în locul unui úir de biĠi.
Dacă imaginea cu watermark este distorsionată, logo-ul va fi afectat úi el. Pentru detectarea
lui pot fi exploatate capacităĠile SVU [191, 193]. De exemplu, putem insera un logo binar de
128x32 pixeli într-o imagine de 512x512 pixeli folosind tehnicile descrise în acest capitol.
Fiecare pixel al logo-ului este inserat într-un bloc de 8x8 pixeli al imaginii adăugând secvenĠa
pseudo-aleatoare +RP pentru un bit 0 sau –RP pentru un bit 1 la blocul imaginii. În Figura
9.13 sunt prezentate rezultatele extragerii watermark-ului după degradarea imaginii cu
watermark prin compresie JPEG cu pierderi cu diferiĠi factori de calitate. Din figură se
observă că logo-ul poate fi recunoscut, chiar dacă este distorsionat destul de puternic.

Codare uni úi bidirecĠională


Tehnicile de watermarking în domeniul spaĠial nu sunt prea rezistente la compresie úi
atacuri geometrice (rotaĠie, scalare). O metodă ce a reuúit să reducă aceste dezavantaje este
bazată pe modulaĠia în amplitudine úi a fost folosită în [116] pentru imagini color. Valorile
pixelilor corespunzătoare canalului de albastru au fost modificate proporĠional cu cele de
crominanĠă astfel:

Watermark original

Watermark extras după compresia


JPEG a imiginii cu Q=90

Watermark extras după compresia


JPEG a imiginii cu Q=75

Watermark extras după compresia


JPEG a imiginii cu Q=50

Figura 9.13. Logo-uri extrase după compresia imaginii cu diferiĠi factori de calitate JPEG.
178 Analiza úi prelucrarea digitală a semnalelor video

Bi , j * Bi , j  (2 s  1)qLi , j , (9.13)

B este valoarea originală a canalului de albastru;


B* este valoare modificată;
L este luminanĠa;
s este bitul ce trebui ascuns;
q este câútigul.
Câútigul este ajustat în funcĠie de cerinĠele de robusteĠe ale watermark-ului; o valoare
mare produce un watermark vizibil iar valori mici produc un watermark cu robusteĠe mică.
Acest algoritm s-a dovedit rezistent la atacuri geometrice, procesare de semnal úi compresie
JPEG. Această tehnică a fost numită codare unidirecĠională. Imaginea este împărĠită în blocuri
úi este calculată valoarea medie a pixelilor din bloc. Fiecărui bloc îi este atribuită o valoare
binară „0” sau „1”, ce formează un cod folosit pentru stocarea de informaĠie. Dacă blocul
reprezintă „1”, atunci media pixelilor din bloc este adăugată la fiecare pixel din bloc. Această
metodă s-a dovedit a fi o metodă eficientă, dar a fost îmbunătăĠită mai departe pentru o mai
mare robusteĠe.
Algoritmul dezvoltat din metoda anterioară, numit codare bidirecĠională, era identic cu
codarea unidirecĠională, dar mai includea un pas în plus. În această etapă, dacă un bloc trebuia
să reprezinte un „0”, valoare medie era scăzută din fiecare pixel din bloc. Figura 9.14a arată
un exemplu de codare bidimensională folosind un watermark slab, deci invizibil, iar Figura
9.14b arată o imagine căreia i se aplică acelaúi algoritm, dar cu un watermark mai puternic
care creúte robusteĠea, dar cu costul pierderii de calitate. Dezavantajul metodei este că, dacă
cineva obĠine mai multe copii ale imaginii cu watermark-uri diferite, poate să elimine
watermark-ul úi, practic, să aibă la dispoziĠie imaginea originală.

a) b)
Figura 9.14. Imagini obĠinute după aplicarea codării bidirecĠionale a) cu watermark slab, b) cu
watermark puternic
9. Tehnici de watermarking pentru imagini ‫܈‬i video 179

Metode statistice
Comunitatea útiinĠifică úi-a dat seama în scurt timp că watermarking-ul digital úi
modulaĠia digitală, în special modulaĠia cu spectru împrăútiat, împărtăúesc concepte comune úi
s-a propus considerarea watermarking-ului ca o comunicaĠie cu zgomot non-gaussian. Primele
abordări teoretice au fost realizate de Smith în [195]. O analiză mai exactă a modulaĠiei în
amplitudine multi-puls a fost făcută de Hernandez úi al. [196].
După publicaĠiile mai sus menĠionate, interesul úi activitatea de cercetare în domeniul
watermarking-ului au crescut semnificativ. Producătorii úi distribuitorii de materiale
multimedia au fost interesaĠi în mod deosebit de soluĠii funcĠionale. În continuare vom
prezenta câteva lucrări mai recente.
Bender úi al. Propun în [197] două metode pentru ascunderea de date în imagini. În
prima metodă, numită „codarea perechilor”, sunt folosite perechi de pixeli (ai,bi) selectate
aleator pentru a ascunde 1 bit de watermark prin creúterea valorii lui ai cu o unitate úi scăderea
valorii lui bi tot cu o unitate. Presupunând că imaginea satisface niúte proprietăĠi statistice,
atunci valoarea aúteptată a sumei diferenĠelor dintre ai úi bi pentru N perechi de pixeli este 2N:

­2 N , pentru perechi cu watermark


¦a b
i i ® (9.14)
N ¯ 0, pentru perechi fără watermark
A doua metodă, numită „codarea texturii blocurilor”, propune introducerea watermark-
ului prin copierea texturii unui bloc din imagine într-o altă regiune a imaginii cu textură
asemănătoare. Pentru recuperarea watermark-ului trebuie calculată funcĠia de autocorelaĠie. O
proprietate remarcabilă a acestei tehnici este robusteĠea ridicată la orice tip de distorsiune,
dacă ambele regiuni cu textură sunt distorsionate în acelaúi mod, ceea ce înseamnă că
recuperarea watermark-ului prin autocorelaĠie funcĠionează.
Pitas úi Kaskalis propun metoda „semnăturii” pentru imagini în [198-200] care este
bazată pe algoritmul de codare a perechilor propus de Bender úi al. în [201]. Watermark-ul
S {sm,n } este o matrice de numere binare de aceeaúi mărime ca úi imaginea originală úi în
care numărul de „1” este egal cu numărul de „0”. Imaginea originală I, cu valorile de
luminanĠă xm,n la poziĠiile (m,n) este divizată în două seturi A úi B de aceeaúi mărime în
următorul mod:
A {xm,n  I , sm,n 1}
(9.15)
B {xm,n  I , sm,n 0}
Watermark-ul este introdus prin modificarea elementelor subsetului A adăugând o
constantă întreagă k. De exemplu, Ac {xm,n  k , xm,n  A} . Imaginea cu watermark este dată
de reuniunea mulĠimilor A’ úi B. Pentru verificarea prezenĠei watermark-ului, este aplicat
testul [202]. Statistica de test q este definită ca diferenĠa normată dintre media ac a setului A’
úi media b a setului B.
180 Analiza úi prelucrarea digitală a semnalelor video

b  ac
q (9.16)
V A2c  V B2
unde V A2c úi V B2 sunt varianĠele setului A’, respectiv B.
Parametrul q este comparat cu un prag pentru a determina dacă există un watermark sau
nu. Metoda este imună la subeúantionare urmată de supraeúantionare úi rezistă la compresie
JPEG cu un factor de compresie 1:4.
O versiune îmbunătăĠită a acestei idei a fost propusă de Langelaar úi al. în [203, 204].
Imaginea este împărĠită în blocuri pătrate de dimensiune multiplu de 8. Un singur bit este
introdus prin modificarea iterativă a unui bloc selectat pseudo-aleator. Fiecӽrui bloc selectat îi
corespunde o secvenĠă pseudo-aleatoare P, cu număr egal de „1” úi „0”. Pentru a ascunde un
bit de valoare „1”, secvenĠa scalată k x P este adunată la bloc, unde k este un factor de scalare
predefinit corespunzător nivelului de vizibilitate al watermark-ului. Fie I0 media tuturor
pixelilor din bloc pentru care valoarea corespunzătoare din secvenĠa pseudo-aleatoare este
zero úi I1 media pixelilor rămaúi. Fie Dsus I1  I 0 diferenĠa dintre cele două medii úi
D jos Iˆ1  Iˆ0 diferenĠa mediilor după compresia JPEG a blocului cu factorul de calitate Q
predefinit. Dacă este ascuns un „0”, secvenĠa P este scăzută în mod iterativ din bloc, până
când ambele diferenĠe, Dsus úi D jos sunt mai mici decât zero sau a fost atins numărul maxim
de iteraĠii. Dacă se ascunde un „1”, secvenĠa este însumată iterativ blocului până când Dsus úi
D jos sunt mai mari decât un prag predefinit T sau a fost atins numărul maxim de iteraĠii.
Un bit ascuns poate fi extras prin calcularea din nou a diferenĠei Dsus între cele două
medii I1 úi I0. Semnul diferenĠei este apoi folosit pentru a determina valoarea bitului ascuns.
Teste cu blocuri de dimensiune 32x32, prag T=1, factor de scalare iniĠial k=4 úi număr maxim
de iteraĠii n=6, arată că metoda are o robusteĠe decentă la compresia JPEG: rată a erorii de bit
de aproximativ 5% pentru o calitate JPEG de 85% úi de 20% pentru o calitate de 60%.
Pentru a creúte performanĠa metodelor de watermarking în domeniul spaĠial bazate pe
blocuri, Bruyndonckx úi al. sugerează în [205] folosirea clasificării pixelilor. Pixelii din
blocuri selectate pseudo-aleator sunt clasificaĠi în zone (1 úi 2) de valoare omogenă a
luminanĠei. Clasificarea este bazată pe 3 tipuri de contrast între zone: contrast puternic,
contrast progresiv, úi contrast zgomotos. Fiecare zonă este apoi împărĠită în 2 categorii A úi B
bazate pe o grilă definită de codor. Astfel, fiecare pixel este încadrat într-una din combinaĠiile
zonă/categorie, ca de exemplu 1/A, 1/B, 2/A úi 2/B. Un bit b este ascuns prin modificarea
zonei/categoriei astfel încât să fie satisfăcute următoarele constrângeri:

dacă b 0 : m1*B  m1*A k


m2* B  m2* A k
(9.17)
dacă b 1: m1*A  m1*B k
m2* A  m2* B k

m1*A , m1*B , m2* A úi m2* B sunt valorile medii ale zonei/categoriei;


9. Tehnici de watermarking pentru imagini ‫܈‬i video 181

k este puterea watermark-ului introdus.


Modificarea valorii medii este realizată prin aplicarea de variaĠii egale de luminanĠa
pentru toĠi pixelii aparĠinând aceleaúi zone. Pentru a creúte robusteĠea algoritmului autorii au
sugerat introducerea de biĠi redundanĠi úi folosirea de coduri corectoare de erori. A fost
raportată o robusteĠe bună la compresia JPEG.
Pentru a creúte performanĠele metodelor de watermarking cu spectru împrăútiat în
domeniul spaĠial, Kuter úi al. [206] au propus o metodă care funcĠionează exclusiv pe
componenta de albastru din spaĠiul de culori RGB, pentru a maximiza puterea watermark-ului
úi păstrând, în acelaúi timp, artefactele vizuale minime. Ei mai propun úi o preprocesare a
imaginii înainte de decodarea watermark-ului pentru a prezice watermark-ul ascuns. Acest
concept îmbunătăĠeúte semnificativ robusteĠea úi este aplicabil oricărei tehnici de
watermarking în domeniul spaĠial. Metoda ascunde watermark-ul sub forma unui număr binar
prin modulaĠie în amplitudine în domeniul spaĠial. Un singur bit b este ascuns la o poziĠie
pseudo-aleatoare (i,j) fie prin adunare, fie prin scădere, depinzând de valoarea bitului, a unei
valori proporĠionale cu luminanĠa acelui pixel:

Bi , j m
 Bi , j  k (1)b Li , j (9.18)

Bi , j este valoare de albastru a pixelului de la poziĠia (i,j);


Li , j este luminanĠa la aceeaúi poziĠie úi k puterea watermark-ului.
Pentru a recupera un bit ascuns este calculat un estimat al valorii originale, fără
watermark folosind o combinaĠie liniară a pixelilor învecinaĠi în cruce:

1 § c c
·
Bˆi , j ¨ ¦
4c © n  c
Bi  n, j  ¦
n c
Bi , j  n  2 B j ,n ¸
¹
(9.19)

unde c defineúte mărimea vecinătăĠii în formă de cruce.


Valoarea bitului este determinată din semnul diferenĠei G i , j dintre pixelul inspectat úi
estimatul originalului. Pentru a creúte robusteĠea, fiecare bit al semnăturii este ascuns de mai
multe ori úi, pentru extragerea bitului introdus, este folosit semnul sumei tuturor diferenĠelor
Gi, j .
Figura 9.15 ilustrează un exemplu de compunere a două imagini. Cele două imagini cu
watermark de sus sunt folosite pentru a genera imaginea nouă, compusă de jos. Folosind
cheile corespunzătoare, ambele watermark-uri originale pot fi recuperate. Extensii ale acestei
metode permit creúterea robusteĠii úi chiar recuperarea watermark-ului după atacuri
geometrice úi de tipul printare-scanare.
182 Analiza úi prelucrarea digitală a semnalelor video

Figura 9.15. Compunerea imaginilor cu watermark. Umbrela din a doua imagine de sus este suprapusă
peste plaja din prima imagine. Watermark-urile din ambele imagini pot fi recuperate din imaginea
compusă.

Metode bazate pe fractali


Tot legate de domeniul spaĠial sunt úi metodele bazate pe compresia imaginilor folosind
fractali. Ideea folosirii acestei tehnici a fost propusă prima dată în [207]. În compresia
imaginilor folosind fractali, imaginea este codată utilizând principiile sistemelor de funcĠii
iterative úi similitudinea proprie [208]. Imaginea originală este divizată în blocuri pătrate Rk,
numite blocuri distanĠă. Fie F un set de funcĠii de mapare fk care sunt compuse dintr-o
transformare geometrică gk úi o transformare de masă mk. FuncĠiile de mapare acĠionează
asupra blocurilor domeniu Dk care sunt mai mari ca dimensiune decât blocurile distanĠă.
Transformarea geometrică constă în miúcarea blocului domeniu Dk pe poziĠia blocului
distanĠă Rk úi reducerea dimensiunii blocului domeniu la dimensiunea blocului distanĠă.
Transformarea de masă ajustează intensitatea úi poziĠia pixelilor blocului domeniu după
transformarea geometrică. Transformările de masă includ rotaĠia cu 900, reflexia după axa
orizontală sau diagonală. Pentru compresia unei imagini trebuie găsite pentru toate blocurile
dimensiune cea mai bună combinaĠie dintre bloc domeniu Dk úi funcĠie de mapare fk, astfel
încât diferenĠa dintre blocul distanĠă Rk úi blocul domeniu mapat fk(Dk) să fie minimă. Acest
lucru înseamnă că operaĠiunea de codare include o căutare spaĠială în toate blocurile domeniu
posibile. Decodarea este realizată prin iteraĠie folosind funcĠiile de mapare codate. Pentru a
ascunde un bit în această schemă, este selectat un bloc pseudo-aleator. SpaĠiul de căutare Sk
9. Tehnici de watermarking pentru imagini ‫܈‬i video 183

corespunzător blocurilor distanĠă este apoi împărĠit în două substaĠii de căutare SK1 úi SK2 de
aceeaúi mărime. Fiecărui subspaĠiu îi este atribuit un bit, iar blocul distanĠă curent este codat
căutând doar în subspaĠiul corespunzător valorii bitului curent. Pentru recuperarea unui bit
ascuns, imaginea este comprimată din nou, dar de data aceasta folosind spaĠiul complet de
căutare. Atunci, pentru un bloc distanĠă marcat, blocul domeniu corespunzător denotă
valoarea bitului inserat. Algoritmul a fost testat folosind compresia JPEG úi a oferit rezultate
bune până la un factor de calitate de 50%. Un dezavantaj al acestei scheme este viteza scăzută
datorată schemei de codare cu fractali.
O abordare similară a fost propusă de Davern úi Scott în [209]. Singura diferenĠă faĠă de
metoda anterioară este faptul că nu se codează imaginea totală, ci doar o regiune distanĠă
definită de utilizator bazată pe o regiune domeniu. Fiind date cele două regiuni, inserarea
watermark-ului este echivalentă cu sistemul propus de Poarte úi Jordan în care regiunea
domeniu este divizată în două părĠi úi, depinzând de valoarea bitului, una dintre subregiuni
este folosită pentru a coda un bloc distanĠă. Această idee de watermarking în domeniul spaĠial,
folosind codarea imaginilor cu fractali, a fost extinsă în [210] de către Bas úi al. la
Transformata Cosinus Discretă.

B. Watermarking în domeniul transformat


Tehnicile ce folosesc domeniul transformatelor sunt de obicei mai complexe decât
metodele în domeniul spaĠial, necesită astfel un efort de calcul mai mare, dar oferă un grad
mai ridicat de robusteĠe la operaĠii uzuale de prelucrări de imagini sau video. În continuare
vor fi prezentate câteva metode clasificate în funcĠie de transformata folosită.

Tehnici de watermarking în domeniul Transformatei Cosinus Discrete


Un domeniu de lucru des întâlnit în aplicaĠiile de watermarking este domeniul
Transformatei Cosinus Discrete. Folosind DCT, o imagine poate fi uúor împărĠită în benzi de
pseudo-frecvenĠă, astfel încât watermark-ul poate fi inserat în mod convenabil în cele mai
importante benzi de frecvenĠă centrală. Mai mult, a fost studiată sensibilitatea sistemului
vizual uman, ceea ce a produs tabelul de cuantizare JPEG standard [211]. Aceste rezultate pot
fi folosite pentru prezicerea úi minimizarea impactului vizual al distorsiunilor cauzate de
watermark. DCT bazată pe blocuri este folosită la scară largă pentru compresia de imagini úi
video. Prin inserarea unui watermark în acelaúi domeniu se poate anticipa compresia cu
pierderi úi exploata descompunerea DCT pentru a dezvolta aplicaĠii de watermarking în timp
real.
În Figura 9.16a este dat un exemplu de imagine în care a fost inserat un watermark
format dintr-un semnal 2-D pseudo-aleator în blocurile DCT de dimensiune 8 x 8 de frecvenĠă
medie. CoeficienĠii DCT sunt modulaĠi conform ecuaĠiei următoare:
184 Analiza úi prelucrarea digitală a semnalelor video

(a) Imagine cu watermark (k mic) (b) Imagine cu watermark (k mare)

(c) DiferenĠa W ( x, y ) I ( x , y )  IW ( x , y ) (d) Spectrul Fourier al lui W ( x, y )

Figura 9.16. Watermark independent de conĠinutul imaginii inserat în benzile DCT de frecvenĠă medie

Figura 9.17. Definirea benzilor de frecvenĠă medie într-un bloc DCT

­ I x , y (u, v)  k ˜Wx , y (u, v) u, v  FM


IWx , y (u, v) ® x, y 1,8,16,! (9.20)
¯ I x , y (u, v) u, v  FM
9. Tehnici de watermarking pentru imagini ‫܈‬i video 185

În EcuaĠia (9.20), FM sunt benzile de frecvenĠă medie, k este factorul de câútig, (x,y)
locaĠia spaĠială a unui bloc de 8x8 pixeli în imaginea I úi (u,v) frecvenĠele coeficientului DCT
din blocul DCT corespunzător (vezi Figura 9.17).
În Figura 9.16c este prezentată diferenĠa puternic amplificată dintre imaginea originală
úi imaginea cu watermark. Figura 9.16d arată spectrul Fourier al watermark-ului. Se poate
vedea clar că watermark-ul afectează doar benzile de frecvenĠă medie.
Dacă este aplicată funcĠia de modulaĠie din EcuaĠia (9.21) rezultatele din Figura 9.16 se
transformă în cele din Figura 9.18. Din Fig. Figura 9.18b úi c se vede că cele mai mari
distorsiuni introduse de watermark sunt localizate la contururi úi în zonele cu textură.

­ I x , y (u, v) ˜ (1  k ˜ Wx , y (u, v)) u, v  FM


IWx , y (u, v) ® x, y 1,8,16,! (9.21)
¯ I x , y (u, v) u, v  FM
Prima metodă eficientă de watermarking în domeniul DCT a fost introdusă de către
Koch úi al. în [212-214]. Ca úi în schema de compresie JPEG, imaginea este, în primul rând,
divizată în blocuri pătrate de dimensiune 8x8 pixeli. Pentru fiecare dintre aceste blocuri este
calculată Transformata Cosinus Discretă. Pentru un bloc selectat pseudo-aleator este aleasă o
pereche de coeficienĠi de frecvenĠa medie din 12 perechi predeterminate. Pentru a insera un
bit de watermark coeficienĠii sunt modificaĠi astfel încât diferenĠa dintre ei să fie pozitivă, fie
negativă, depinzând de valoarea bitului de inserat. Pentru ca algoritmul să fie robust la
compresia JPEG cu pierderi, matricea de cuantizare JPEG este folosită la modificarea
coeficienĠilor DCT. Această metodă dovedeúte o robusteĠe bună la compresia JPEG până la un
factor de calitate Q=50.
Bor‫ ܈‬úi Pitas [215], [216] sugerează o metodă de modificare a coeficienĠilor DCT
conform unei constrângeri asupra selecĠiei poziĠiei blocurilor. Imaginea este întâi divizată în
blocuri de 8x8 pixeli. Anumite blocuri sunt selectate conform unei decizii pe baza unui
clasificator de reĠea Gaussian. CoeficienĠii de frecvenĠă medie sunt apoi modificaĠi folosind
fie o constrângere liniară, fie o constrângere de regiune circulară, pentru a insera informaĠia
watermark. În prima dintre abordări, constrângea liniară este definită astfel:
(9.22)
Y FQ
F este vectorul modificat de coeficienĠi DCT;
Q este vectorul de ponderare dependent de watermark.
Constrângerea este impusă modificând coeficienĠii DCT după criteriul celor mai mici
pătrate. Al doilea algoritm propus defineúte regiuni circulare în jurul coeficienĠilor DCT
selectaĠi. CoeficienĠii sunt apoi cuantizaĠi astfel:
186 Analiza úi prelucrarea digitală a semnalelor video

(a) Imagine cu watermark (k mic) (b) Imagine cu watermark (k mare)

(c) DiferenĠa W ( x, y ) I ( x , y )  IW ( x , y ) (d) Spectrul Fourier al lui W ( x, y )

Figura 9.18. Watermark dependent de conĠinutul imaginii în benzile DCT de frecvenĠa medie
H
2 2
F  Qk min F  Qi atunci F Qk (9.23)
i 1

unde Qi , i 1,! , H este setul de vectori de coeficienĠi dat de watermark.


În procesul de recuperare a watermark-ului algoritmul verifică constrângerea asupra
coeficienĠilor DCT pentru fiecare bloc, iar apoi constrângerea asupra locaĠiei blocului.
Algoritmul este robust la compresia JPEG cu un factor de compresie de 13:1 folosind
constrângerea liniară úi de 18:1 folosind constrângerea circulară.
Swanson úi al. sugerează în [217] úi [218] o tehnică de watermarking bazată pe
mascarea în frecvenĠă a coeficienĠilor DCT, metodă ce este similară cu cea propusă de Smith
úi Comiskey [195]. Imaginea de intrare este împărĠită în blocuri úi este calculată DCT. Pentru
fiecare bloc de coeficienĠi DCT este calculată o mască de frecvenĠă având la bază faptul că o
grilă de mascare creúte pragul vizual pentru componentele semnalului din jurul măútii de
frecvenĠă. Masca perceptuală rezultantă este scalată úi multiplicată cu coeficientul DCT al
secvenĠei de zgomot pseudo-aleator de lungime maximă. Acest watermark este adăugat la
blocul DCT corespunzător iar apoi se verifică prin mascare spaĠială dacă watermark-ul este
9. Tehnici de watermarking pentru imagini ‫܈‬i video 187

vizibil úi se controlează factorul de scalare. DetecĠia watermark-ului necesită imaginea


originală úi watermark-ul original úi este realizată prin testarea posibilităĠilor. Autorii
raportează o bună robusteĠe a watermark-ului la compresie JPEG, zgomot colorat úi decupare
a imaginii.
Tao úi Dickinson [219] introduc o tehnică de watermarking adaptivă în domeniul DCT
bazată pe clasificatori perceptuali de regiuni cu indice de sensibilitate asignat. Watermark-ul
este inserat în N coeficienĠi DCT AC (de frecvenĠă diferită de 0). CoeficienĠii sunt selectaĠi
astfel încât să aibă cei mai mici paúi de cuantizare conform tabelului de cuantizare JPEG.
CoeficienĠi xi selectaĠi sunt modificaĠi după cum urmează:

ª Dº
xˆi xi  max « xiD m , sign( xi ) i » , (9.24)
¬ k ¼
D m este indicele de sensibilitate la zgomot al blocului curent;
Di pasul de cuantizare pentru Xi;
k satisface relaĠia 5 d k d 6 .
Trebuie observat că semnalul watermark nu este generat aleator. Există diferite abordări
pentru a determina sensibilitatea la zgomot prin exploatarea eficientă a efectului de mascare al
sistemului vizual uman. Autorii propun un algoritm de clasificare pe regiuni care încadrează
blocul într-una din úase clase perceptuale. Algoritmul de clasificare exploatează efectele SVU
de mascare a luminanĠei, mascare a marginilor úi mascare a texturilor. Clasele perceptuale
sunt definite în ordinea descrescătoare a sensibilităĠii la zgomot astfel: la margini, uniform, de
sensibilitate scăzută, texturat mediu, texturat, foarte texturat. Fiecare clasă perceptuală are
asignat un indice de sensibilitate la zgomot. Recuperarea watermark-ului necesită imaginea úi
watermark-ul original úi este bazată pe testarea posibilităĠilor. Experimentele arată că metoda
rezistă la compresia JPEG până la un factor de calitate de 5% úi la zgomot aleator cu un
PSNR 22.1 dB .
Podilchuk introduce în [220] úi [221] watermarking-ul perceptual folosind diferenĠa
abia observabilă (JND) pentru a determina o mască de modulaĠie a watermark-ului
dependentă de imagine. ModulaĠia coeficienĠilor selectaĠi fie în domeniul DCT, fie în
domeniu Wavelet poate fi descrisă astfel:

­ I u ,v  JNDu ,v u wu ,v , daca I u ,v ! JNDu ,v


I u*,v ® , (9.25)
¯ I u ,v , in rest
I u ,v sunt coeficienĠii transformatei;
wu ,v sunt valorile watermark-ului;
JNDu ,v este diferenĠa abia observabilă calculată pe baza modelelor vizuale.
Pentru coeficienĠii DCT, autorul sugerează un model perceptual definit de Watson úi
bazat pe folosirea sensibilităĠii în frecvenĠă úi la luminozitate, dar úi mascarea locală a
contrastului. Acest model oferă pentru fiecare bloc DCT 8x8 praguri de mascare dependente
188 Analiza úi prelucrarea digitală a semnalelor video

de imagine. DetecĠia watermark-ului este bazată pe corelaĠia dintre diferenĠa dintre imaginea
originală úi imaginea inspectată úi secvenĠa de watermark. CorelaĠia maximă este comparată
cu un prag pentru a determina dacă o imagine conĠine watermark-ul căutat. Experimentele au
arătat că schema este extrem de robustă la compresia JPEG, decupare, scalare, zgomot aditiv,
corecĠie de gama, úi scanare-xeroxare-scanare.
Piva úi al. descriu în [222] altă metodă bazată pe DCT ce exploatează caracteristicile de
mascare a SVU. Watermark-ul este format dintr-o secvenĠă pseudo-aleatoare de M numere
reale cu distribuĠie normală X {x1 , x2 ,! , xM } . CoeficienĠii unui bloc DCT de dimensiune
NxN sunt rearanjaĠi într-un vector folosind scanarea în zig-zag. Din acest vector sunt selectaĠi
M coeficienĠi, începând de la poziĠia L+1 ce generează vectorul T {t1 , t2 ,!, tM } .
Watermark-ul X este inserat în T astfel:

­ I u ,v  JNDu ,v u wu ,v , daca I u ,v ! JNDu ,v


I u*,v ® , (9.26)
¯ I u ,v , in rest
unde k este puterea watermark-ului.
CoeficienĠii modificaĠi înlocuiesc coeficienĠii nemodificaĠi înainte ca imaginea cu
watermark sa fie reconstruită. Pentru a creúte robusteĠea este aplicată mascarea vizuală după
cum urmează:

yij" yij (1  Eij )  Eij yij' yiy  Eij ( yif'  yij )


(9.27)
unde E ij este factorul de ponderare având în vedere caracteristicile SVU. Un mod simplu de
a alege E ij este varianĠa normată a eúantionului la pixelul yij definită ca raportul dintre
varianĠa eúantionului dintr-un bloc pătrat cu centrul în yij úi maximul dintre varianĠele tuturor
blocurilor. Ca úi în majoritatea tehnicilor, detecĠia watermark-ului este realizată prin
compararea corelaĠiei z dintre watermark úi coeficienĠii DCT cu semn posibil corupĠi T * .
CorelaĠia z este definită astfel:

X ˜T * 1 M
z
M M
¦xt
i 1
*
i i (9.28)

Pragul S z este adaptiv úi dat de expresia:


M
k
Sz
3M
¦t
i 1
*
i (9.29)

Rezultatele experimentale au arătat că watermark-ul este robust la diferite tehnici de


procesare a imaginilor (de exemplu, compresia JPEG, filtrarea mediană úi watermarking
multiplu) úi la distorsiuni geometrice (după aplicarea transformării geometrice inverse).
9. Tehnici de watermarking pentru imagini ‫܈‬i video 189

Tehnici de watermarking în domeniul Transformatei Fourier Discrete


Watermarking-ul în domeniul Transformatei Fourier Discrete a fost introdus prima oară
de Boland úi al. în [223] úi Cox úi al. în [224] care au dezvoltat independent metode
perceptuale adaptive bazate pe modulaĠie. Cox úi al. au tras paralele între tehnologia lor úi
comunicaĠiile cu spectru împrăútiat, deoarece watermark-ul este împrăútiat printre
componente de frecvenĠă importante din punct de vedere vizual (vezi Figura 9.19).

Watermark-ul conĠine o secvenĠă de numere x x1 ,! , xn cu o distribuĠie statistică dată,


ca de exemplu distribuĠia normală N (0,1) cu medie zero úi varianĠă 1. Watermark-ul este
inserat în imaginea V úi produce imaginea cu watermark V’. Sunt propuse trei tehnici pentru
inserarea watermark-ului:
vic vi  kxi
vic vi (1  kxi ), (9.30)
vic vi e kxi
k este puterea watermark-ului;
vi sunt componente spectrale importante din punct de vedere perceptual.
Prima ecuaĠie este potrivită doar dacă valorile vi nu variază prea mult.
Următoarele două ecuaĠii dau rezultate similare pentru valori mici pentru kxi úi, pentru
vi pozitive, ultima ecuaĠie poate fi văzută ca o aplicaĠie a primei, dacă sunt folosiĠi logaritmii
valorilor originale. Schema poate fi generalizată prin introducerea mai multor parametrii de
scalare ki pentru a se adapta la diferitele componente spectrale úi, astfel, să reducă artefactele
vizuale.
În Figura 9.20b este dat un exemplu de imagine în care este inserat un watermark
folosind amplitudinea tuturor coeficienĠilor DFT conform EcuaĠiei (9.30), forma a doua, cu o
valoare relativ mică pentru factorul de câútig k. Figura 9.20c arată diferenĠa puternic
amplificată dintre imaginea originală úi imaginea cu watermark. Figura 9.20d arată o imagine
în care watermark-ul a fost inserat folosind o valoare mare pentru factorul de câútig k.
Pentru verificarea prezenĠei watermark-ului, trebuie măsurată similitudinea dintre
watermark-ul recuperat X*, dat de diferenĠa dintre imaginea originală V úi imaginea posibil
modificată V*, úi watermark-ul original X. Măsurarea similitudinii se face printr-un coeficient
de corelaĠie normat

Date gazdă Distorsiuni/


atacuri
Mesaj
Watermark Codor Inserare Extragere Decodor extras
m Watermark Watermark + Watermark Watermark m’

Figura 9.19. Watermarking ca sistem de comunicaĠie


190 Analiza úi prelucrarea digitală a semnalelor video

(a) Imaginea originală (b) Imagine cu watermark (k mic)

(c) DiferenĠa scalată pentru vizibilitate (d) Imagine cu watermark (k mare)


Figura 9.20. Watermark ascuns în amplitudinea DFT

X*˜X
sim( X , X * ) (9.31)
X*˜X
Testele de robusteĠe au arătat că metoda rezistă la compresia JPEG (cu factor de calitate
de 50), dither, transmisie prin fax, printare-fotocopiere-scanare, watermarking multiplu úi
atacuri prin complotare (între mai mulĠi deĠinători de copii cu watermark). Pentru
experimente, watermark-ul a fost de lungime 1000 cu N (0,1) , unde N ( P , V ) reprezintă o
distribuĠie normală cu medie P úi varianĠă V , k a fost setat la 0.1, iar watermark-ul a fost
inserat în primii 1000 cei mai importanĠi coeficienĠi DCT folosind a doua tehnică de inserare.
Boland úi al. au propus o tehnică similară bazată pe un hibrid între modulaĠia în
amplitudine úi FSK (Frequency Shift Keying), úi sugerează folosirea diferitelor domenii
transformate ca DCT, DWT, Walsh-Hadamard úi Transformata Fourier Rapidă (FFT – Fast
Fourier Transform).
Ruanaidh úi al. propun în [225] úi [219] o metodă de watermarking prin modificarea
fazei în domeniul frecvenĠă. Pentru a insera un bit este modificată faza coeficientului selectat
9. Tehnici de watermarking pentru imagini ‫܈‬i video 191

F ( k1 , k2 ) al Transformatei Fourier Discrete de dimensiune N1xN2 prin adăugarea unui factor


mic G :

 ‘F (k1 , k2 )  G
‘F (k1 , k2 ) m (9.32)
Pentru ca imaginea cu watermark să fie reală, faza trebuie să satisfacă condiĠia de
simetrie negativă, ceea ce conduce la modificarea adiĠională:

 ‘F ( N1  k1 , N 2  k2 )  G
‘F ( N1  k1 , N 2  k2 ) m (9.33)
CoeficienĠii sunt modificaĠi doar dacă puterea lor relativă este peste un anumit prag.
Dacă imaginea originală este disponibilă, watermark-ul poate fi uúor extras prin compararea
fazei. În cazul în care originalul nu este disponibil, Ruanaidh sugerează precuantizarea fazei
originale înaintea modificării ei. Astfel, deviaĠiile între stările cuantizate pot fi folosite pentru
transmiterea datelor.
În altă publicaĠie [226], Ruanaidh úi al. creează o tehnică de watermarking în special
concepută pentru ca watermark-ul sӽ fie invariant la translaĠii, rotaĠii úi scalări. Metoda este
un hibrid între DFT úi mapare log-polară. Procesul este reprezentat în Figura 9.21. Într-un
prim pas este calculată DFT a imaginii. Una dintre proprietăĠile DFT este că o deplasare în
domeniul spaĠial rezultă într-o deplasare de fază în domeniul frecvenĠă. Păstrând doar
amplitudinea pentru procesări ulterioare face imaginea invariantă la translaĠie. În cel de-al
doilea pas, invarianĠa la rotaĠie úi scalare este realizată prin maparea amplitudinii din sistemul
cartezian în sistemul log-polar. Să considerăm un punct ( x, y )   . Atunci maparea este
definită astfel:

x e P cos T
(9.34)
y eP sin T
unde P   úi 0  T  2S .
Se poate vedea uúor că aceasta este o mapare bijectivă úi că rotaĠia úi scalarea în
sistemul cartezian sunt transformate într-o translaĠie a coordonatelor P úi T . Calculând din
nou DFT a mapării log-polare úi păstrând doar amplitudinea rezultă într-o invarianĠă la rotaĠie
úi translaĠie. Calculând Transformata Fourier a unei hărĠi log-polare este echivalent cu
calcularea Transformatei Fourier-Mellin. Combinând cei doi paúi, se obĠine o transformată
invariantă la rotaĠie, scalare úi translaĠie (RST). Watermark-ul are forma unui semnal bi-
dimensional cu spectru împrăútiat în domeniul transformatei invariante RST.
192 Analiza úi prelucrarea digitală a semnalelor video

InvarianĠă la rotaĠie, scalare úi translaĠie Watermark

Amplitudine

Fază
DFT IDFT

Mapare Mapare
log-polară log-polară
inversă
Fază
Amplitudine

DFT IDFT

Imagine

Figura 9.21. Metodă invariantă la rotaĠii, translaĠii úi scalări

Figura 9.22 arată un exemplu al proprietăĠilor sistemului log-polar. Figura 9.22b


prezintă harta log-polară a imaginii „Lena” (a). Figura 9.22c reprezintă o versiune rotită úi
scalată a imaginii úi Figura 9.22d reprezintă harta log-polară (HLP) a imaginii (c). Se poate
vedea clar că rotaĠia úi scalarea pot fi convertite în translaĠie.
Într-un test, un watermark de 104 biĠi a fost inserat într-o imagine. Imaginea cu
watermark a fost apoi rotată cu 1430 úi scalată cu 75% pe fiecare axă. Watermark-ul inserat a
fost recuperat din această imagine. Mai mult, metoda rezistă compresiei JPEG până la un
factor de calitate de 75%. Această metodă care a fost prima dezvoltată special pentru a rezista
la atacuri geometrice, conĠine aspecte úi idei interesante úi ar putea fi concepută o direcĠie
nouă de abordare a tehnicilor de watermarking. O variaĠie a acestei idei, bazată pe
Transformata Radon, a fost propusă de Wu úi al. în [222].
9. Tehnici de watermarking pentru imagini ‫܈‬i video 193

(a) Imaginea originală (b) HLP a imaginii

(c) Scalare úi rotire a imaginii (a) (d) HLP a imaginii c


Figura 9.22. Exemplu al proprietăĠilor hărĠii log-polare

Tehnici de watermarking în domeniul Wavelet


Deoarece tehnicile de watermarking pot exploata caracteristicile sistemului vizual
uman, este posibilă ascunderea de watermark-uri cu mai multă energie în imagine, ceea ce le
face mai robuste. Din acest punct de vedere, Transformata Wavelet Discretă este o unealtă
foarte atractivă, pentru că poate fi folosită ca o modalitate de calcul eficientă a modelelor în
frecvenĠă a SVU [227]. De exemplu, se pare că ochiul uman este mai puĠin sensibil la
zgomotul din benzile DWT de rezoluĠie înaltă úi în benzile DWT ce au o orientare de 450
(benzile HH). Mai mult, codarea de imagini úi video pe baza DWT, ca de exemplu codarea
EWZ (Embedded Zerotree Wavelet), sunt încadrate în standarde de compresie de ultimă
generaĠie, cum ar fi JPEG2000. Prin inserarea unui watermark în acest domeniu, putem
anticipa compresia cu pierderi bazată pe DWT úi exploata descompunerea DWT pentru a
dezvolta aplicaĠii de watermarking în timp real. Multe abordări aplică această tehnică în
benzile DWT de rezoluĠie înaltă LH1, HH1, úi HL1 [227-231] (vezi Figura 9.23).
194 Analiza úi prelucrarea digitală a semnalelor video

Figura 9.23. Descompunere DWT a unei imagini pe 2 nivele

În Figura 9.24a este dat un exemplu de imagine în care o secvenĠa pseudo-aleatoare 2-D
este inserată în benzile DWT LH1, HH1, úi HL1 folosind un factor de câútig k mare.
CoeficienĠii DWT din fiecare din cele 3 benzi DWT sunt modulaĠi după cum urmează:
IW (u , v) I (u , v)  k ˜ W (u , v) (9.35)
Figura 9.24b arată diferenĠa puternic amplificată dintre imaginea originală úi imaginea
cu watermark.
Watermark-ul DWT poate fi făcut dependent de imaginea gazdă prin modulaĠia
coeficienĠilor DWT din toate cele 3 subbenzi după cum urmează:

(a) Imagine cu watermark (k mare) b) DiferenĠa W ( x, y ) I ( x , y )  IW ( x , y )

Figura 9.24. Watermark inserat în domeniul DWT independent de conĠinutul imaginii


9. Tehnici de watermarking pentru imagini ‫܈‬i video 195

IW (u , v) I (u , v)(1  k ˜ W (u , v)) (9.36)


În Figura 9.25a este dat un exemplu de imagine în care o secvenĠa pseudo-aleatoare 2-D
este inserată în benzile DWT LH1, HH1, úi HL1 folosind EcuaĠia (9.36) úi un factor de câútig k
mare. Figura 9.25b arată diferenĠa puternic amplificată dintre imaginea originală úi imaginea
cu watermark.
Inserarea watermark-ului folosind o descompunere multi-rezoluĠie a fost pentru prima
oară propusă de Boland úi al. în [223]. Ca úi în schemele ce funcĠionează în alte domenii
transformate, watermark-ul este o secvenĠă 2-D pseudo-aleatoare. Atât imaginea, cât úi
watermark-ul sunt descompuse folosind Transformata Wavelet 2-D, iar în fiecare subbandă a
imaginii este inserată o versiune ponderată a watermark-ului. Decodarea watermark-ului este,
ca de obicei, bazată pe corelaĠia normată dintre un estimat al watermark-ului inserat úi
watermark-ul original. În [232-235] au fost propuse diferite scheme bazate pe Wavelet.
DiferenĠa între diferitele metode constă, de obicei, în modul în care watermark-ul este
ponderat pentru a elimina artefactele vizuale.

(a) Imagine cu watermark (k mare) (b) DiferenĠa W ( x, y ) I ( x , y )  IW ( x , y )

Figura 9.25. Watermark inserat în domeniul DWT dependent de conĠinutul imaginii

9.2.3. Codarea watermark-ului


A. Metode de watermarking cu spectru împrăútiat
Deoarece se doreúte ca watermark-ul să aibă putere redusă (pentru a fi imperceptibil),
procesul de watermarking poate fi privit ca un proces de comunicaĠie printr-un canal foarte
zgomotos. Tehnicile cu spectru împrăútiat sunt cunoscute pentru avantajul lor de a facilita
comunicaĠiile în medii zgomotoase úi din acest motiv sunt foarte mult folosite în
watermarking. Foarte multe tehnici de watermarking reprezintă watermark-ul sub forma unei
secvenĠe de zgomot pseudo-aleator. Starea generatorului de numere aleatoare folosit pentru
generarea secvenĠei devine cheia watermark-ului. Deoarece decodorul trebuie să cunoască
cheia pentru a decoda watermark-ul, aceste scheme sunt de regulă private. Hartung úi alĠii
propun în [236] ca o parte a secvenĠei sa fie făcută publică pentru a permite decodarea publică
196 Analiza úi prelucrarea digitală a semnalelor video

a watermark-ului. De asemenea, detectorul/decodorul trebuie să se sincronizeze cu secvenĠa


pseudo-aleatoare înainte ca watermark-ul să poată fi detectat/decodat. Din păcate, acest lucru
devine marele dezavantaj al multor scheme existente. O variaĠie a principiului de baza cu
spectru împrăútiat este filtrarea trece bandă/trece jos a secvenĠei înainte de inserarea
watermark-ului [237], astfel încât watermark-ul să aibă cât mai puĠină energie de înaltă
frecvenĠă care este, de regulă, eliminată de sistemele de compresie.
Metodele de watermarking cu spectru împrăútiat au fost prezentate în detaliu în
subcapitolul 2.2.1 dedicat metodelor de watermarking în domeniul spaĠial.

B. Metode de watermarking bazate pe cuantizare


O metodă bazată pe cuantizare a fost propusă de Chen úi Wornell [238]. Această metodă
este denumită ModulaĠie a Indicelui de Cuantizare (QIM) úi este bazată pe un set N-
dimensional de cuantizori. Cuantizorii satisfac o constrângere de distorsiune úi sunt creaĠi
astfel încât valorile reconstruite folosind un cuantizor să fie „foarte departe” de punctele de
reconstrucĠie a oricărui alt cuantizor. Mesajul de transmis este folosit ca indice pentru
selectarea cuantizorului. Cuantizorul selectat este apoi folosit pentru ascunderea informaĠiei
prin cuantizarea datelor imaginii în domeniul spaĠial sau în domeniul DCT. În procesul de
codare este calculat un parametru distanĠă pentru toĠi cuantizorii úi indicele cuantizorului cu
cea mai mică distanĠă identifică informaĠia ascunsă. Autorii arată că performanĠa schemei
rezultate este superioară modulaĠiei cu spectru împrăútiat standard. Un exemplu de inserare a
watermark-ului folosind metoda QIM este dat în Figura 9.26. În acest exemplu watermark-ul
poate lua 4 valori diferite wi , i 1,! , 4 . Pentru a insera watermark-ul wi de indice i în
eúantionul X, aceste eúantion se cuantizează folosind cuantizorul Qi cu acelaúi indice i. Pentru
o identificare mai uúoară cuantizorii au fost reprezentaĠi cu culori diferite. DistanĠa dintre doi
cuantizori consecutivi este ' / 4 , unde ' este pasul de cuantizare folosit. Pentru a extrage
watermark-ul wc din e‫܈‬antionul X w cu watermark, se verifică fa‫܊‬ă de ce cuantizor Qi
valoarea X w se află cel mai aproape. Rezultă că indicele watermark-ului este egal cu indicele
cuantizorului wc wi , de unde úi denumirea metodei.

Figura 9.26. Exemplu de inserare a unui watermark cu 4 valori posibile folosind metoda QIM
9. Tehnici de watermarking pentru imagini ‫܈‬i video 197

Takana úi al. descriu în [239] úi [240] mai multe scheme de watermarking care se
bazează pe ascunderea watermark-ului prin modificarea zgomotului de cuantizare. Ideea lor
se bazează pe faptul că zgomotul de cuantizare este, în general, imperceptibil observatorilor.
Prima schemă ascunde watermark-ul în imagine prin folosirea unei secvenĠe de date
predefinite pentru a selecta nivelul într-un cuantizor predictiv. SecvenĠa de date este astfel
aleasă, încât imaginea rezultantă să arate ca úi zgomotul de cuantizare. De asemenea, este
prezentată úi o variaĠie a acestei scheme, unde un watermark sub forma unei matrice de dither
este folosită pentru a modifica imaginea într-un anumit mod.
Există mai multe dezavantaje pentru aceste scheme. Cel mai important ar fi faptul că
sunt sensibile la procesări de semnal, mai ales la recuantizare úi la atacuri geometrice. Ele
degradează imaginea în acelaúi mod ca úi codarea predictivă sau dither-ul.

9.2.4. Formarea datelor cu watermark


Cea mai uzuală modalitate de formare a semnalului cu watermark este însumarea directă
a watermark-ului, de obicei sub forma unei secvenĠe pseudo-aleatoare, la amplitudinea datelor
sursă. Această operaĠie poate fi realizată în domeniul spaĠial, DFT, DCT sau Wavelet, după
cum s-a discutat anterior. Această metodă de formare a datelor cu watermark este de obicei
folosită de tehnicile de watermarking cu spectru împrăútiat. O alternativă ar fi modificarea
fazei semnalului sursă, ca de exemplu în [241]. Nu contează ce modificăm la datele sursă,
atâta timp cât nu luăm în calcul aceste date în procesul de inserare, ele vor constitui o
interferenĠă majoră la decodarea watermark-ului, limitând performanĠa decodorului chiar în
absenĠa atacurilor.
În cazul metodelor de watermarking bazate pe cuantizare eúantioanele sursei sunt
cuantizate pentru a reprezenta watermark-ul. Gradul de distorsiune a datelor originale depinde
de cuantizorii folosiĠi de algoritmul de inserare.

9.2.5. Extragerea watermark-ului


Majoritatea schemelor de watermarking cu spectru împrăútiat folosesc corelaĠia pentru
detecĠia úi decodarea watermark-ului, deci se presupune implicit că interferenĠa este de tip
gaussian, deoarece doar atunci corelaĠia este optimă. Imaginile, însă nu urmăresc o distribuĠie
gaussiană în domeniul spaĠial úi mulĠi autori (de exemplu în [242] úi [243]) sugerează filtrarea
(cu un filtru trece sus) a imaginii recepĠionate înainte de detecĠie pentru a îmbunătăĠi
performanĠa. Acest lucru se realizează, deoarece majoritatea energiei imaginii se află în
componentele de frecvenĠă joasă. Prin filtrarea trece sus aceste componente sunt înlăturate úi
semnalul se apropie mai mult de o distribuĠie gaussiană. Scăderea imaginii iniĠiale din
imaginea cu watermark înaintea detecĠiei, ca úi în cazul algoritmilor privaĠi, este de asemenea
un caz special de preprocesare. Dacă avem la dispoziĠie distribuĠia coeficienĠilor imaginii,
putem folosi un decodor de probabilitate maximă în locul blocului de corelaĠie. De exemplu,
în [244] Rosa úi alĠii modelează coeficienĠii DFT folosind o distribuĠie Weibull úi deduc
decodorul optim corespunzător. Dacă inserarea watermark-ului are loc în domeniul frecvenĠă
198 Analiza úi prelucrarea digitală a semnalelor video

se pot combina semnalele de la ieúirea diferitelor subbenzi într-un mod optim pentru a
maximiza raportul semnal-zgomot total. Un alt aspect a detecĠiei watermark-ului ce poate fi
optimizat este alegerea pragului de detecĠie. Piva úi alĠii argumentează în [245] că alegerea
pragului pe baza principiului Neyman-Pearson [246] este o metodă mai bună decât
minimizarea probabilităĠii erorii în prezenĠa atacurilor.
Sistemele de watermarking cu spectru împrăútiat se bazează pe sincronizarea perfectă
dintre transmiĠător úi receptor pentru o comunicaĠie perfectă. Dacă imaginea este supusă unei
transformări geometrice (tăiere, scalare, rotaĠie), se pierde această sincronizare úi watermark-
ul trebuie resincronizat înainte de detecĠie. Mai mulĠi autori au propus folosirea unei secvenĠe
separate [248] sau construirea secvenĠei de watermark într-un mod specific [248] pentru a
permite sincronizarea. Atacurile geometrice vor fi discutate în subcapitolul 3.2.1.
În cazul metodele bazate pe cuantizare, decodorul cuantizează eúantioanele recepĠionate
úi se uită în ce categorie intră fiecare eúantion pentru a recupera datele inserate. În acest caz,
semnalul sursă nu mai acĠionează ca o interferenĠă.
Se poate observa că majoritatea metodelor de watermarking pentru imagini sunt bazate
pe acelaúi principiu: sunt aplicate modificări pseudo-aleatoare mici asupra unor coeficienĠi
selectaĠi în domeniul spaĠial sau al transformatei. Aceste modificări sunt apoi identificate prin
corelaĠie sau măsurări de similitudine asemănătoare corelaĠiei pentru tehnicile cu spectru
împrăútiat úi prin cuantizare pentru metodele bazate pe cuantizare. De obicei, numărul de
coeficienĠi este mult mai mare decât numărul de biĠi de informaĠie inseraĠi. Rezultă astfel o
inserare redundantă ce conduce la robusteĠe. După cum am văzut, domeniul de inserare a
watermark-ului poate avea o influenĠă substanĠială asupra robusteĠii watermark-ului.
Schemele de watermarking în domeniul spaĠial sunt, în general, mai puĠin robuste la atacuri
cu zgomot sau compresie JPEG sau MPEG cu pierderi. Oricum, un mare avantaj este, de
obicei, faptul că watermark-ul poate fi uúor recuperat dacă imaginea a fost decupată sau
translatată. Decuparea imaginii în domeniul spaĠial corespunde unei distorsiuni destul de
substanĠiale în domeniul frecvenĠă, ce distruge watermark-ul inserat. Acelaúi lucru este valabil
pentru domeniul DCT. Dacă watermark-ul este introdus în blocuri DCT, este important să se
útie poziĠia blocurilor pentru o decodare cu succes. Domeniul Wavelet are dezavantaje
asemănătoare, deoarece Transformata Wavelet nu este invariantă nici la translatare, nici la
rotaĠie. Majoritatea metodelor lucrează în domeniul spaĠial probabil datorită simplităĠii úi
eficienĠei unor astfel de metode. Numărul de publicaĠii bazate pe DCT este, de asemenea,
mare.

9.3. Tehnici de watermarking pentru video

În acest capitol vom vorbi despre metode de watermarking specifice pentru video.
SecvenĠele video sunt formate dintr-o serie de imagini consecutive, egal depărtate în timp.
Astfel, problema generală a watermarking-ului pare foarte asemănătoare pentru imagini úi
secvenĠe video úi ideea că tehnicile watermarking pentru imagini pot fi aplicate pentru
secvenĠe video este evidentă. Acest lucru este parĠial adevărat úi există destul de multe
9. Tehnici de watermarking pentru imagini ‫܈‬i video 199

publicaĠii care se încheie cu observaĠia că abordarea propusă este aplicabilă úi pentru secvenĠe
video. Oricum, există diferenĠe importante între imagini úi video, ce sugerează o abordare
specifică pentru video.
O diferenĠă importantă este spaĠiul disponibil al semnalului. Pentru imagini, spaĠiul
semnalului este foarte limitat. Acest lucru motivează mulĠi cercetători să folosească modele
implicite sau explicite ale Sistemului Vizual Uman pentru a atinge graniĠa invizibilităĠii úi a
insera un watermark cât se poate de robust fără a sacrifica calitatea imaginii.
Pentru secvenĠe video spaĠiul disponibil al semnalului este mult mai larg. Pe de altă
parte, watermarking-ul pentru video impune constrângeri de timp real sau aproape timp real
asupra sistemului. Ca o consecinĠă a acestui lucru, folosirea metodelor de watermarking
bazate pe modele explicite ale SVU este mai puĠin importantă úi pentru multe aplicaĠii chiar
prohibitivă din punct de vedere al complexităĠii. Gradul de complexitate este, în general, o
caracteristică mult mai importantă pentru aplicaĠiile de watermarking video decât pentru
aplicaĠiile pentru imagini.
Pentru aplicaĠii specifice, de exemplu amprentarea secvenĠelor video (inserarea unui
identificator de destinatar), această problemă este chiar mai gravă, deoarece secvenĠele video
sunt de obicei stocate în format comprimat. În comparaĠie cu imaginile, stocarea în format
necomprimat úi compresia sau decompresia în timp real, inserarea watermark-ului úi
recomprimarea, nu sunt de obicei fezabile pentru astfel de aplicaĠii. Astfel, acest tip de
aplicaĠii necesită inserarea watermark-ului în domeniul comprimat.
O altă observaĠie de luat în calcul este faptul că structura unei secvenĠe video văzută ca
succesiune de imagini creează problema atacurilor specifice, ca de exemplu medierea de
cadre, eliminarea de cadre úi interschimbarea de cadre [249, 250]. La o frecvenĠă a cadrelor de
25-30 Hz, ca cea folosită în televiziune, aceste atacuri nu ar putea fi percepute de un
observator normal. Dar o schemă bună de watermarking ar trebui, totuúi, să reziste acestor
tipuri de atacuri, de exemplu prin distribuirea informaĠiei watermark în mai multe cadre
consecutive. Pe de altă parte, ar fi de preferat ca întreaga informaĠie inserată să poată fi
extrasă dintr-o mică parte a secvenĠei video. Compromisul între aceste două cerinĠe
contradictorii se face în funcĠie de aplicaĠie.
Dacă în domeniul watermarking-ului pentru imagini au fost publicate foarte multe
lucrări, există mai puĠine publicaĠii care să se ocupe cu watermarking-ul video digital. Totuúi,
interesul pentru astfel de tehnici e mare, de exemplu, pentru standardul DVD se doreúte un
sistem eficient de protecĠie la copiere bazat pe watermarking. Scopul este de a marca orice
material video astfel încât toate player-ele úi recorder-ele să refuze rularea sau înregistrarea
materialelor piratate.

9.3.1. Provocări în domeniul watermarking-ului video

Cu toate că mulĠi algoritmi de watermarking care au fost iniĠial dezvoltaĠi pentru


imagini pot fi folosiĠi pentru inserarea úi extragerea informaĠiei watermark în/din secvenĠe
200 Analiza úi prelucrarea digitală a semnalelor video

video brute, există câteva provocări de bază în domeniul watermarking-ului video ce trebuie
adresate úi care sunt specifice acestui tip de conĠinut.
O primă provocare de interes specific pentru comunitatea de watermarking video sunt
distorsiunile video neagresive ce pot distruge informaĠia ascunsă sau capacitatea de detecĠie a
watermark-ului. O a doua provocare sunt atacurile deliberate asupra sistemului de
watermarking. RobusteĠea watermark-ului digital a fost întotdeauna evaluată prin integritatea
watermark-ului după distorsiuni/atacuri. Au fost dezvoltate chiar úi unelte speciale de
evaluare pentru automatizarea acestui proces [251]. Distorsiunile úi atacurile asupra
sistemelor de watermarking sunt prezentate pe larg în Capitolul 6 úi nu vor mai fi discutate úi
aici. În subcapitolul următor ne vom concentra, în schimb, pe o altă provocare importantă
pentru sistemele de watermarking video, úi anume, procesarea în timp real care este destul de
multe ori o cerinĠă pentru prelucrarea video.

A. Watermarking în timp real


Procesarea în timp real ar putea fi o specificaĠie în plus pentru watermarking-ul video.
Pentru imagini acest lucru nu a fost o grijă reală. Dacă cineva doreúte să insereze un
watermark sau să verifice prezenĠa unui watermark într-o imagine, o durată de câteva secunde
este o întârziere acceptabilă. Dar o astfel de întârziere este nerealistă în contextul video.
Cadrele sunt trimise cu o frecvenĠa destul de mare, de obicei 25-30 de cadre pe secundă,
pentru a se obĠine o miúcare continuă. Cel puĠin codorul sau detectorul de watermark, în unele
cazuri chiar ambele, ar trebui să producă o astfel de rată a cadrelor. În contextul monitorizării
emisiei, detectorul ar trebui să fie în stare să detecteze un watermark în timp real. Într-un
mediu VOD (Video On Demand – video la cerere) server-ul video ar trebui să poată insera
watermark-ul, ce îl identifică pe utilizator, la rata cadrelor cu care se face transmisia. Pentru a
îndeplini condiĠia de timp real complexitatea algoritmului de watermarking ar trebui să fie cât
mai redusă. Mai mult, dacă watermark-ul poate fi inserat direct în fluxul comprimat, acest
lucru va elimina necesitatea decompresiei úi recompresiei complete úi, astfel, va reduce
efortul de calcul. Această idee a dus la dezvoltarea de scheme de watermarking foarte simple.
Exploatarea părĠilor specifice ale standardului de compresie poate conduce la algoritmi foarte
eficienĠi. Un flux video codat MPEG conĠine o succesiune de cod cu lungime variabilă
(VLC). Un watermark poate fi inserat consecvent în flux prin modificarea cuvintelor de cod
VLC [252]. Standardul MPEG foloseúte într-adevăr cuvinte de cod VLC asemănătoare, adică
cu aceeaúi lungime run length, aceeaúi lungime VLC úi o diferenĠă de nivel de cuantizare de
unu. Astfel de cuvinte de cod VLC pot fi folosite alternativ pentru a ascunde un bit.

Doar un Alt Sistem de watermarking (JAWS)


Când este vorba despre procesare în timp real, algoritmul dezvoltat de Philips Research
este deseori considerat de referinĠă. Algoritmul JAWS a fost iniĠial dezvoltat pentru
monitorizarea emisiei úi este unul dintre candidaĠii de frunte pentru watermarking în formatul
DVD. CerinĠa de procesare în timp real este îndeplinită prin folosirea de operaĠii simple la
rata cadrelor úi doar câteva mai complexe la o rată mai mică decât rata cadrelor [253].
9. Tehnici de watermarking pentru imagini ‫܈‬i video 201

Procesul de inserare este prezentat în Figura 9.27 úi funcĠionează astfel:


x Se generează o secvenĠă de referinĠă pr de dimensiune MxM distribuită normal.
x Se creează un watermark de referinĠă wr conform ecuaĠiei:

wr pr  trans ( pr , mesaj ) (9.37)

Figura 9.27. Descrierea inserării JAWS

unde funcĠia trans(.) returnează o versiune translatată ciclic a secvenĠei de referinĠă


pr . În sistemul JAWS mesajul este codat complet prin translatarea celor două
secvenĠe de referinĠă. Această secvenĠa este apoi multiplicată, posibil úi cu
trunchiere, pentru a obĠine watermark-ul complet w.
x Pentru fiecare cadru, acest watermark este modificat din punct de vedere perceptual
astfel încât inserarea să rămână imperceptibilă. Fiecare element i al watermark-ului
este scalat cu factorul de activitate locală O (i ) a cadrului obĠinut prin filtrare
laplaciană. Cu cât regiunea este mai uniformă, cu atât este mai mic factorul de
activitate locală. Acest lucru este în concordanĠă cu faptul că ochiul uman este mai
sensibil la zgomotul ce apare în regiuni uniforme ale cadrului.
x Watermark-ul este, în cele din urmă, scalat cu un factor global s úi însumat cadrului F
pentru a obĠine cadrul cu watermark Fw . Procesul total de inserare poate fi exprimat
astfel:
Fw (i ) F (i )  sO (i) w(i ) (9.38)
La detector, cadrele sunt sumate úi stocate într-un buffer B de dimensiune MxM.
Detectorul caută apoi toate apariĠiile secvenĠei de referinĠă pr în buffer printr-o convoluĠie
ciclică bi-dimensională. Deoarece o astfel de operaĠie se realizează cel mai eficient în
domeniul frecvenĠă, se obĠine o detecĠie prin filtrare SPOMF (Symmetrical Phase Only
Matched Filtering), dată de ecuaĠia următoare:
202 Analiza úi prelucrarea digitală a semnalelor video

SPOMF ( B, pr ) IFFT [M ( FFT ( B)) ˜ M ( FFT ( pr )* )] (9.39)

­ x / x , daca x z 0
M ( x) ® (9.40)
¯ 1, daca x 0

Figura 9.28. Exemplu de detecĠie SPOMF

unde FFT (˜) úi IFFT (˜) sunt Transformata Fourier Rapidă directă, respectiv inversă;
x * reprezintă conjugarea complexă.
Figura 9.28 arată rezultatele unei astfel de detecĠii. Pot fi izolate două maxime ce
corespund celor două apariĠii ale lui pr în wr . Datorită posibilităĠii apariĠiei jitter-ului
poziĠional, nu pot fi folosite toate poziĠiile relative dintre vârfuri, ele sunt impuse a fi multiplii
ai pasului G al grilei. După ce detectorul a extras vârfurile, informaĠia ascunsă poate fi extrasă
uúor. Se observă că această schemă este invariantă la translaĠie, deoarece o translatare nu
modifică poziĠia relativă dintre vârfuri.
Ulterior, această schemă a fost îmbunătăĠită. De exemplu, invarianĠa la translaĠie a fost
exploatată mai departe pentru a creúte cantitatea de informaĠie ascunsă [254], iar simple
modificări au permis obĠinerea invarianĠei la scalare [255].

B. DirecĠii principale în watermarking-ul video


Watermarking-ul video este un domeniu relativ nou de cercetare ce beneficiază de
rezultatele pentru imagini. Au fost propuúi mulĠi algoritmi în literatura útiinĠifică úi pot fi
izolate trei mari tendinĠe. Cea mai simplă úi directă abordare este considerarea unei secvenĠe
video ca o succesiune de imagini. Alt punct de vedere consideră úi exploatează dimensiunea
temporală adiĠională pentru a dezvolta algoritmi noi úi mai robuúti de watermarking video.
Ultima direcĠie de cercetare consideră secvenĠa video ca niúte date comprimate corespunzător
unui standard de compresie video úi caracteristicile unui astfel de standard pot fi folosite
9. Tehnici de watermarking pentru imagini ‫܈‬i video 203

pentru a obĠine o schemă eficientă de watermarking. Fiecare dintre aceste abordări are puncte
forte úi puncte slabe (vezi Tabelul 9.2)

Tabelul 9.2. Avantajele úi dezavantajele tendinĠelor în watermarking-ul video


Clasificare Avantaje Dezavantaje
Adaptare imagine - Beneficiază de toate rezultatele Pot necesita un efort mare de
video pentru imagini calcul
Integrarea dimensiunii Algoritmi video care de obicei Pot necesita un efort mare de
temporale permit o mai mare robusteĠe calcul
Exploatarea Algoritmi simplii, ce permit Watermark-ul este legat doar de
standardului de procesarea în timp real respectivul standard de compresie
compresie

Adaptarea tehnicilor folosite la imagini pentru video


La început, domeniul watermarking-ului digital a fost investigat pentru imagini. Au fost
descoperiĠi o serie de algoritmi úi rezultate úi, atunci când a început investigarea de noi
domenii, cum ar fi cel video, prima idee a fost încercarea refolosirii rezultatelor descoperite
anterior. În consecinĠă, comunitatea watermarking a considerat la început un semnal video ca
o succesiune de imagini úi a adaptat scheme de watermarking deja existente pentru imagini la
video. Exact acelaúi fenomen a avut loc când comunitatea ce acĠiona în domeniul codării a
trecut de la codarea de imagini la codarea video. Primul algoritm propus pentru codarea video
a fost JPEG în Miúcare (Moving JPEG – M-JPEG), care, pur úi simplu, comprima fiecare
cadru al unei secvenĠe video cu standardul JPEG de compresie a imaginilor. Cel mai simplu
mod de a extinde o schemă de watermarking pentru imagini este inserarea aceluiaúi
watermark în cadrele video cu o anumită frecvenĠă. Dacă secvenĠa video conĠine watermark-
ul, atunci la ieúirea detectorului ar trebui să se observe un răspuns periodic cu frecvenĠa de
inserare [256]. O astfel de schemă nu are însă prea multe avantaje. Detectorul poate doar
verifica dacă un watermark dat este prezent sau nu, dar nu poate extrage mesajul ascuns. Pe
de altă parte, datele gazdă sunt mult mai mari decât în cazul imaginilor. Deoarece ar trebui să
fie posibil să ascundem mai mulĠi biĠi într-un semnal gazdă de dimensiuni mai mari, ar putea
fi aúteptate watermark-uri cu adaos mare de informaĠie. Acest lucru poate fi realizat uúor prin
inserarea unui watermark independent, cu mulĠi biĠi, în fiecare cadru al secvenĠei [257]. Ceea
ce trebuie însă avut în vedere este că adaosul de informaĠie este contrabalansat de pierderea în
robusteĠe.

Watermark cu energie diferită (WED)


Metoda WED a fost iniĠial dezvoltată pentru imagini úi a fost extinsă la video prin
adăugarea de watermark-uri în cadrele I ale fluxului MPEG [252]. Metoda este bazată pe
eliminarea selectivă a coeficienĠilor DCT de frecvenĠă înaltă din fluxul de date comprimate.
Procesul de inserare este prezentat în Figura 9.29. Blocurile de 8x8 pixeli ale cadrului video
sunt mai întâi amestecate pseudo-aleator.
204 Analiza úi prelucrarea digitală a semnalelor video

Această operaĠie creează cheia secretă a algoritmului úi aleatorizează în domeniul


spaĠial aranjarea blocurilor, adică distruge corelaĠia spaĠială între blocuri învecinate. Cadrul
obĠinut este apoi împărĠit în n blocuri de dimensiune 8 x 8 pixeli. În Figura 9.29 n este egal cu
16. Un bit de watermark este inserat în fiecare dintre aceste blocuri prin introducerea unei
diferenĠe de energie între coeficienĠii DCT de frecvenĠe înalte din jumătatea de sus a blocului
(regiunea A) úi cei din jumătatea de jos a blocului (regiunea B). Din acest motiv metoda se
numeúte watermark cu energie diferită.

8 blocuri DCT D E A  EB

Cadru original Cadru cu blocuri


16 blocuri
amestecate pseudo- de 8x8 pixeli
aleator

Figura 9.29. Inserarea WED

Pentru a introduce diferenĠa de energie, pentru fiecare din cele n blocuri de 8 x 8 pixeli
este calculat blocul DCT corespunzător úi coeficienĠii DCT sunt precuantizaĠi cu factorul de
calitate QJPEG folosind procedura de cuantizare JPEG standard. CoeficienĠii obĠinuĠi sunt
împărĠiĠi în două jumătăĠi úi energia de înaltă frecvenĠă este calculată pentru fiecare regiune
conform următoarei ecuaĠii:
n /2 1
E (c, n, QJPEG ) ¦ ¦ ([T
b 0 iS ( c )
]
i ,b QJPEG )2 cu S (c ) {i  {0, 63} | (i ! c )} (9.41)

Ti ,b este coeficientul DCT cu indicele i în ordinea zig-zag din blocul DCT cu numărul b;
[.] reprezintă precuantizarea cu factorul de calitate QJPEG;
c este un indice de tăiere dat care în Figura 9.29 a fost setat la valoarea 27.
Valoarea bitului de inserat este codată în semnul diferenĠei de energie D E A  EB
dintre cele două regiuni A úi B. Toată energia după indicele de tăiere c este eliminată în
ambele regiuni prin setarea coeficienĠilor corespunzători la zero pentru a obĠine semnul
corespunzător pentru diferenĠa D. Ar trebui observat faptul că acest lucru se poate face uúor
direct în domeniul comprimat prin translatarea marker-ului End Of Block (EOB) al blocurilor
corespunzătoare spre coeficientul DC până la indicele de tăiere. În cele din urmă, se
calculează DCT inversă úi aleatorizarea blocurilor este inversată pentru a obĠine cadrul cu
watermark.
La detector, diferenĠa de energie este calculată úi bitul inserat este determinat în funcĠie
de semnul diferenĠei D. Acest algoritm a fost îmbunătăĠit în continuare pentru a adapta
9. Tehnici de watermarking pentru imagini ‫܈‬i video 205

indicele de tăiere c la conĠinutul în frecvenĠă a celor n blocuri 8 x 8 considerate úi astfel încât


diferenĠa de energie D să fie mai mare decât un prag Ddorit dat de [258].

Integrarea dimensiunii temporale


Principalul dezavantaj în considerarea unei secvenĠe video ca fiind o succesiune de
imagini independente este faptul că nu se ia în seamă noua dimensiune, úi anume cea
temporală. Codarea a făcut un mare pas înainte prin încorporarea dimensiunii temporale în
schemele de codare úi, de aceea, este evident că úi domeniul watermarking-ului poate profita
în egală măsură de avantajele acestei abordări. MulĠi cercetători au investigat posibilitatea
reducerii impactului vizual al imaginilor datorat watermark-ului prin utilizarea proprietăĠilor
sistemului vizual uman, ca de exemplu mascarea în frecvenĠă, mascarea de luminanĠă úi
mascarea de contrast. Astfel de studii pot fi uúor exportate spre domeniul video printr-o
abordare cadru cu cadru. Totuúi, watermark-ul obĠinut nu este optim din punct de vedere al
vizibilităĠii, deoarece nu are în vedere sensibilitatea temporală a ochiului uman.
Miúcarea este o caracteristică specifică pentru video, deci trebuie dezvoltate măsurări
perceptuale specifice secvenĠelor video pentru a fi exploatate în domeniul watermarking-ului
digital. Acest exemplu simplu arată că dimensiunea temporală este un factor hotărâtor în
domeniul video, ce trebuie avut în vedere în dezvoltarea de algoritmi eficienĠi.

timp

Figura 9.30. Scanarea pe linii într-o secvenĠa video

Semnalul video privit ca un semnal unidimensional


Una dintre lucrările de referinĠă în domeniul watermarking-ului digital consideră
semnalul video ca un semnal uni-dimensional [259]. Altfel spus, algoritmul nu ia în calcul
dimensionalitatea spaĠială úi temporală a semnalului video úi îl priveúte ca o colecĠie de
eúantioane. Un astfel de semnal este achiziĠionat printr-o simplă scanare pe linii (vezi Figura
206 Analiza úi prelucrarea digitală a semnalelor video

9.30). Acest algoritm de watermarking video cu spectru împrăútiat este detaliat în cele ce
urmează.
Fie a ( j )  {1,1} secvenĠa de biĠi ai watermark-ului, ce trebuie inserat. Această secvenĠa
este împrăútiată cu un factor cr conform următoarei ecuaĠii:
b (i ) a ( j ), j ˜ cr d i d ( j  1) ˜ cr , i  N (9.42)
OperaĠia de împrăútiere permite adăugarea de redundanĠă prin inserarea unui bit de
informaĠie în cr eúantioane de semnal video. SecvenĠa b (i ) obĠinută este apoi amplificată
local cu un factor reglabil O (i ) t 0 úi modulată cu o secvenĠa binară pseudo-aleatoare
p (i )  {1,1} . În cele din urmă, watermark-ul cu spectru împrăútiat w(i ) este adăugat
semnalului video v (i ) scanat pe linii. Astfel, se obĠine semnalul video cu watermark vw (i ) .
Procesul complet de inserare este descris riguros de următoarea ecuaĠie:
vw (i ) v(i )  w(i ) v(i)  O (i )b(i ) p(i ), i  N (9.43)
Factorul reglabil O (i ) poate fi ajustat în funcĠie de proprietăĠile locale ale semnalului
video, ca de exemplu mascarea spaĠială úi temporală a SVU, sau poate fi păstrat constant în
funcĠie de aplicaĠie.
Pe partea de detecĠie, extragerea watermark-ului se realizează uúor printr-o simplă
corelaĠie. Totuúi, pentru a reduce interferenĠa dintre watermark úi semnalele video, secvenĠa
video cu watermark este filtrată trece-sus, obĠinându-se astfel semnalul vw (i ) în care
componente majore ale semnalului video iniĠial sunt izolate úi eliminate. Al doilea pas este
demodularea. Semnalul video filtrat este multiplicat cu zgomotul pseudo-aleator p (i ) folosit
la inserare úi se calculează corelaĠia s ( j ) pentru fiecare bit j al watermark-ului:
( j 1)˜cr 1 ( j 1)˜cr 1 ( j 1)˜cr 1
s( j) ¦
i j ˜cr
p (i ) v w ( i ) ¦
i j ˜cr
p (i ) v ( i )  ¦
i j ˜cr
p (i )O (i )b(i ) p (i ) (9.44)

CorelaĠia conĠine doi termeni 61 úi 6 2 . Scopul principal al filtrării a fost păstrarea lui
6 2 neafectat úi reducerea lui 61 la 0. În concluzie, corelaĠia devine:
( j 1)˜cr 1
s( j)  62  ¦
i j ˜cr
p (i ) 2 O (i )b(i ) a ( j ) ˜ cr ˜ med (O (i )) (9.45)

Bitul ascuns este dat direct de semnul lui s ( j ) . Această tehnică oferă un cadru foarte
flexibil pentru o schemă de watermarking mai elaborată.

Semnalul video privit ca un semnal temporal


Chiar dacă metoda de watermarking cu spectru împrăútiat oferă un algoritm flexibil ce
poate fi folosit pentru scheme de watermarking mai elaborate, ea ignoră complet dimensiunea
temporală. Din această cauză watermark-ul inserat nu va fi optim din punctul de vedere al
invizibilităĠii úi rezistenĠei la atacuri. Au fost investigate o serie de alte metode pentru a
integra úi dimensiunea temporală, iar una dintre ele este interpretarea semnalului video ca un
9. Tehnici de watermarking pentru imagini ‫܈‬i video 207

semnal pur temporal. Un exemplu tipic ar fi inserarea unui semnal de watermarking temporal
în anumiĠi pixeli specificaĠi de o cheie [260]. Pentru a asigura invizibilitatea watermark-ului
locaĠiile de inserare ar trebui alese cu grijă. Într-adevăr, chiar dacă modificarea unui singur
pixel dintr-o zonă cu textură este imperceptibilă în fiecare cadru în parte, ea ar putea fi
vizibilă la redarea secvenĠei video. În practică se observă că pixelii ce se modifică rapid în
timp sau pixelii de la extremităĠile regiunilor fără miúcare sunt candidaĠi buni pentru inserare.
Oricum, folosirea unui număr mic de pixeli pentru inserarea watermark-ului reduce drastic
capacitatea de inserare. De fapt, de multe ori se preferă calcularea unei transformate pe
întreaga secvenĠă video pentru a avea un spaĠiu de inserare mai larg. În particular,
descompunerea wavelet temporală poate fi utilă pentru a obĠine o reprezentare temporală
multi-rezoluĠie compactă a secvenĠei video [261]. Folosind o astfel de descompunere se poate
izola o componentă statică (fără miúcare) úi o serie de componente dinamice (cu miúcare).
Caracterul multi-rezoluĠie al Transformatei Wavelet permită watermark-ului existenĠa pe mai
multe scări temporale. De exemplu, dacă watermark-ul este inserat în cadrul wavelet de cea
mai joasă frecvenĠă temporală (DC), va exista în toate cadrele secvenĠei video. O altă
transformată temporală promiĠătoare este Analiza Componentelor Independente (ACI).
Această transformată produce un set de cadre care pot fi folosite ca surse independente pentru
generarea secvenĠei video procesate [262].

Semnalul video privit ca un semnal tri-dimensional


Semnalul video mai poate fi privit úi ca semnal tri-dimensional. Acest punct de vedere a
fost deja investigat în codare úi poate fi extins úi asupra watermarking-ului. Transformata
Fourier Discretă 3-D poate fi folosită ca o reprezentare alternativă a semnalului video [263].
În acest caz sunt avute în vedere frecvenĠele spaĠiale sau temporale medii pentru inserarea
watermark-ului pentru a obĠine un compromis între invizibilitatea watermark-ului úi robusteĠe.
Pe de o parte, sistemul vizual uman este avut în vedere pentru a defini o regiune de inserare
care să nu conducă la un watermark vizibil, iar, pe de altă parte, regiunea de inserare obĠinută
este modificată, astfel încât să devină imună la compresia MPEG. Pentru a produce un
watermark robust au fost investigate úi Transformata Wavelet 3-D úi Transformata Gabor 3-D
[264]. Totuúi, considerarea semnalului video ca un semnal tridimensional poate fi imprecisă.
Cele trei dimensiuni avute în vedere nu sunt, de fapt, omogene: există două dimensiuni
spaĠiale úi una temporală. Acest aspect úi costul de calcul au îngreunat cercetările ulterioare în
această direcĠie. Oricum, această abordare rămâne pertinentă în unele cazuri. În domeniul
medical de exemplu, diferitele imagini de pe scanner pot fi cadre diferite ale unei secvenĠe
video. În acest caz, cele trei dimensiuni sunt omogene úi poate fi folosită o transformată 3-D.

Exploatarea formatelor de compresie video


DirecĠii noi de cercetare consideră datele video ca niúte date comprimate cu ajutorul
unui standard specific de compresie video. Într-adevăr, în cele mai multe cazuri o secvenĠa
video este stocată într-o versiune comprimată pentru a ocupa mai puĠin spaĠiu de stocare.
208 Analiza úi prelucrarea digitală a semnalelor video

Astfel au fost dezvoltate metode de watermarking care inserează watermark-ul direct în fluxul
video comprimat.
Watermarking-ul în fluxul comprimat poate fi privit ca o formă de editare video în
domeniul comprimat [265]. O astfel de editare nu este ceva obiúnuit în practică úi apar o serie
de probleme.

Modificarea coeficienĠilor în domeniul transformatei


În [266] este propusă o metodă ce adaugă o secvenĠă pseudo-aleatoare, transformată
DCT direct în coeficienĠii DC-DCT ai unui flux video codat MPEG. Procesul de
watermarking ia în considerare doar valorile de luminanĠă ale cadrelor I. Pentru a insera
watermark-ul este folosită următoarea procedură:
x Este generată o secvenĠă pseudo-aleatoare conĠinând întregii {-1,1} folosind o cheie
secretă. Această secvenĠa are aceeaúi dimensiune ca úi cadrul I.
x SecvenĠa este modulată de un úir de biĠi de watermark úi multiplicată cu un factor de
câútig.
x Este aplicată Transformata DCT 8x8 pe secvenĠa modulată úi coeficienĠii DC
rezultaĠi sunt însumaĠi la valorile DC corespunzătoare din toate cadrele I
x Watermark-ul poate fi detectat folosind tehnici de corelaĠie în domeniul DCT sau în
domeniul spaĠial.
Autorii raportează că algoritmul scade drastic calitatea vizuală a secvenĠei video. De
aceea, factorul de câútig al watermark-ului trebuie ales foarte mic (<1) úi numărul de pixeli
per bit de watermark trebuie ales foarte mare (>>100.000) pentru a menĠine o calitate video
rezonabilă pentru secvenĠa video rezultantă. Acest lucru se datorează, în primul rând, faptului
că secvenĠa watermark este inserată în doar unul din cei 64 de coeficienĠi DCT, coeficientul
DC. Mai mult, secvenĠa conĠine doar componente de frecvenĠa joasă la care ochiul uman este
destul de sensibil.
În [259] este propusă o metodă mai sofisticată ce inserează watermark-ul nu doar în
coeficienĠii DC, ci úi în coeficienĠii AC ai fiecărui cadru I, P sau B. ùi aici, watermark-ul este
o secvenĠă pseudo-aleatoare de întregi {-1,1} generaĠi cu ajutorul unei chei secrete. SecvenĠa
are aceeaúi dimensiune ca úi cadrul video. SecvenĠa este modulată de un úir de biĠi de
watermark úi multiplicată cu un factor de câútig k.
Pentru inserarea watermark-ului, secvenĠa W ( x, y ) este divizată în blocuri de 8x8.
Aceste blocuri sunt transformate în domeniul DCT úi notate Wx , y (u, v) , unde x, y 0,8,16 !
úi u , v 0 ! 7 . Apoi blocurile 2-D Wx , y (u, v) sunt reordonate prin scanare în zig-zag úi devin
úiruri Wx , y (i) , unde i 0! 63 . Wx , y (0) reprezintă coeficientul DC, iar Wx , y (63) este
coeficientul AC de frecvenĠa cea mai mare a blocului de watermark. Deoarece blocurile
MPEG de dimensiune 8x8 corespunzătoare sunt codate în acelaúi mod ca úi Wx , y (i) , aceste
úiruri I x , y (i) pot fi direct folosite pentru adăugarea watermark-ului. Pentru fiecare bloc video
I x, y (i) din cadrele I, P sau B sunt aplicaĠi următorii paúi:
9. Tehnici de watermarking pentru imagini ‫܈‬i video 209

x Coeficientul DC este modulat astfel:


IWx , y (0) I x , y (0)  Wx , y (0) (9.46)

ceea ce înseamnă că valoarea medie a blocului de watermark este adăugată la


valoarea medie a blocului video.
x Pentru modularea coeficienĠilor AC în úirul de biĠi a blocului video codat este căutat
următorul cuvânt de cod VLC, reprezentând următorul coeficient DCT diferit de
zero. Lungimea úi nivelul acestui cuvânt de cod sunt decodate pentru a determina
poziĠia i din scanarea zig-zag úi amplitudinea I x , y (i) .
x Apoi este inserat un watermark într-un coeficient AC astfel:
IWx , y (i ) I x , y (i )  Wx , y (i ), i z 0 (9.47)

x Acum intră în calcul úi constrângerea, ca rata de bit a secvenĠei video să nu crească.


Lungimea S zI a codului VLC necesar pentru a coda I x , y (i ) úi lungimea S zI pentru a
w

coda IWx , y (i) sunt determinate folosind tabelele VLC B.14 úi B.15 ale standardului
MPEG-2 [268]. Dacă lungimea codului VLC pentru codarea coeficientului cu
watermark este egală sau mai mică decât lungimea codului VLC existent, codul VLC
existent este înlocuit. Altfel, codul VLC este lăsat nemodificat. Astfel, coeficientul
I x , y (i) este modulat în următorul mod:

dacă S zI d S zI atunci IWx , y (i ) I x , y (i )  Wx , y (i )


w
(9.48)
altfel IWx , y (i ) I x , y (i )

x Această procedură este repetată până când sunt procesaĠi toĠi coeficienĠii AC ai
blocului video codat.
Pentru extragerea informaĠiei watermark, fluxul video MPEG este întâi decodat complet
úi biĠii de watermark sunt extraúi prin corelaĠia dintre cadrele decodate úi secvenĠa de
watermark W ( x, y ) în domeniul spaĠial folosind tehnicile standard descrise în capitolul pentru
imagini.
Un alt exemplu este algoritmul anterior de watermark cu spectru împrăútiat, ce a fost
adaptat astfel încât watermark-ul să poate fi inserat direct în coeficienĠii DCT diferiĠi de zero
ai unui flux MPEG [259]. Prima grijă a fost ca procesul de inserare a watermark-ului să nu
crească rata de bit de ieúire. În primul rând, practic nimic nu ne asigură că un coeficient DCT
cu watermark va fi codat cu lungime variabilă (VLC) cu acelaúi număr de biĠi ca úi cel fără
watermark. O strategie directă ar fi, atunci, inserarea watermark-ului doar în coeficienĠii care
nu necesită mai mulĠi biĠi pentru codarea VLC. Un al doilea aspect a fost prevenirea
propagării distorsiunilor datorate watermark-ului de la un cadru la altul. Standardul MPEG are
la bază predicĠia miúcării úi orice distorsiune se propagă în cadrele învecinate. Pentru a
preveni ca acumularea de astfel de semnale să producă o calitate video slabă, poate fi adăugat
un semnal compensator. Într-un astfel de caz compensarea miúcării poate fi văzută ca o
210 Analiza úi prelucrarea digitală a semnalelor video

constrângere. Dar, pe de altă parte, poate fi exploatată, astfel încât vectorii de miúcare ai
fluxului MPEG să poarte informaĠia ascunsă [269]. Componentele vectorului de miúcare pot fi
cuantizate conform unei reguli, ce depinde de bitul ce trebuie inserat. De exemplu,
componenta orizontală a vectorului de miúcare poate fi cuantizată la o valoare pară de paúi de
cuantizare, dacă bitul de inserat este 0, úi la o valoare impară, dacă bitul este 1.
Nu toate cadrele unei secvenĠe video codate MPEG sunt codate în acelaúi fel. Cadre
codate intra (I) sunt comprimate cu standardul JPEG de compresie a imaginilor iar cadrele
codate inter (B úi P) sunt codate prin predicĠie folosind alte cadre video învecinate. Ca o
consecinĠă, pot fi folosite strategii alternative de watermarking în funcĠie de tipul cadrelor ce
urmează să conĠină informaĠia [270].

Modificarea vectorilor de miúcare


Un alt element cheie în codarea video este estimarea/compensarea miúcării pentru a
reduce redundanĠa temporală. Într-adevăr, cadrele video succesive sunt foarte asemănătoare
iar codarea video are ca scop de bază predicĠia unui cadru dintr-un alt cadru folosind predicĠia
miúcării pentru a reduce cantitatea de date transmise. De exemplu, în standardul MPEG există
o distincĠie clară între cadre I ce sunt codate ca niúte imagini de sine stătătoare úi cadre P sau
B care sunt codate ca referinĠă la un cadru I sau alt cadru P, respectiv ca referinĠă la două
cadre, fiecare I sau P. Se obĠin o serie de vectori de miúcare ce sunt transmiúi la decodor
pentru a realiza compensarea miúcării. Ar fi interesant de folosit aceúti vectori de miúcare ca
úi potenĠiali candidaĠi pentru inserarea unui watermark. În acest sens, se poate impune o
regulă de paritate pentru componentele vectorului de miúcare [269]. The exemplu,
componenta orizontală a unui vector de miúcare este cuantizat la o valoare pară, dacă bitul
watermark-ului de inserat este 0 úi la o valoare impară altfel. Din motive de vizibilitate se pot
considera pentru inserare doar vectorii de miúcare de valori mari úi se poate modifica fie
componenta orizontală, fie cea verticală a vectorului de miúcare în funcĠie de unghiul
vectorului [271]. Ca alternativă, schemele de cuantizare pot fi, de asemenea, folosite pentru
modificarea informaĠiei de miúcare. În acest sens, vectorii de miúcare pot fi cuantizaĠi folosind
o grilă pătrată, circulară sau unghiulară [272, 273]. Astfel de abordări s-au dovedit a fi puĠin
mai robuste. Oricum, una dintre principalele preocupări la modificarea informaĠiei de miúcare
este fidelitatea: este foarte dificil de calculat care este impactul perceptual al modificării
vectorilor de miúcare. Totuúi, această problemă pare a nu fi critică pentru unele aplicaĠii. De
exemplu, informaĠia de miúcare poate fi modificată pentru a realiza o criptare parĠială, numită
úi scrambling de watermark [274]. În acest sens, scopul este degradarea calităĠii video, dar
totuúi permiĠând utilizatorului privat perceperea conĠinutului video, dându-i o idee despre
conĠinutul original pentru a produce un impuls de cumpărare.

Modificarea cuvintelor de cod VLC


Multe codoare realizează de obicei cuantizarea coeficienĠilor din domeniul transformat
úi a vectorilor de miúcare folosind fie o cuantizare scalară, fie una vectorială. Apoi informaĠia
rezultată este reprezentată prin diferite simboluri care sunt trimise unui codor entropic pentru
9. Tehnici de watermarking pentru imagini ‫܈‬i video 211

a obĠine úirul de biĠi final. De exemplu, la standardul MPEG coeficienĠii DCT sunt scanaĠi în
zigzag úi reprezentaĠi sub forma de tuple (run, level - lungime, nivel). Lungimea este egală cu
numărul de zerouri ce preced un coeficient nenul, iar nivelul este egal cu valoarea
coeficientului cuantizat. Aceste tuple sunt trimise unui codor entropic. În practică, în
standardul MPEG sunt definite tabele de căutare pentru asocierea fiecărei tuple posibile unui
cuvânt de cod codat cu lungime variabilă (VLC). Astfel cercetători au investigat cum se poate
modifica direct fluxul de biĠi, respectiv cuvintele de cod VLC pentru a evita compresia úi
decompresia completă ce sunt consumatoare de timp. În acest sens, o lucrare deschizătoare de
drumuri a identificat un set de cuvinte VLC ce poate fi modificat fără introducerea de
artefacte vizuale prea mari [252]. Acest algoritm este detaliat mai jos. Chiar dacă au fost
propuse câteva variaĠii ale acestei abordări [275], cea mai importantă direcĠie de cercetare este
cea care face cuvintele de cod VLC să prezinte proprietăĠi de resincronizare după ce sunt
afectate de erori de bit [276, 277]. Astfel de cuvinte de cod VLC sunt numite cuvinte VLC
reversibile (RVLC) úi pot fi decodate în două moduri. Ideea este să se folosească apoi puterea
de corecĠie de erori a acestor RVLC pentru conceperea de scheme reversibile de
watermarking: modificările binare datorate procesului de watermarking sunt considerate erori
de canal úi pot fi corectate.

Tabelul 9.3. Exemple de cuvinte VLC 1c din Tabelul B.14 al standardului MPEG.
Cod cu lungime variabilă Lungime Run Level LSB al Level
VLC
0010 0110 s 8+1 0 5 1
0010 0001 s 8+1 0 6 0
0000 0001 1101 s 12+1 0 8 0
0000 0001 1000 s 12+1 0 9 1
0000 0000 1101 0 s 13+1 0 12 0
0000 0000 1100 1 s 13+1 0 13 1
0000 0000 0111 11 s 14+1 0 16 0
0000 0000 0111 10 s 14+1 0 17 1
0000 0000 0011 101 s 15+1 1 10 0
0000 0000 0011 100 s 15+1 1 11 1
0000 0000 0001 0011 s 16+1 1 15 1
0000 0000 0001 0010 s 16+1 1 16 1

Modificarea bitului de paritate în domeniul VLC


În unele lucrări din literatura de specialitate s-a modificat direct fluxul video comprimat
pentru a insera un watermark. Astfel de algoritmi sunt foarte interesanĠi datorită ratei mari de
inserare úi a complexităĠii de calcul scăzute obĠinute. În cazul unui flux video MPEG un
watermark conĠinând l biĠi bi (i=0,1,…,l-1) este inserat în fluxul video prin selectarea
cuvintelor VLC potrivite úi egalarea bitului celui mai puĠin semnificativ (LSB) al pasului de
cuantizare corespunzător cu biĠii watermark-ului [252]. Pentru asigurarea invizibilităĠii
perceptuale úi a dimensiunii fluxului video doar câĠiva coeficienĠi VLC numiĠi label bit
carrying VLC (lc-VLC – cuvinte VLC etichetă) sunt avuĠi în vedere pentru inserarea
212 Analiza úi prelucrarea digitală a semnalelor video

watermark-ului. Aceste cuvinte VLC au proprietatea interesantă că există un alt cuvânt VLC
care are:
x aceeaúi valoare run (lungime)
x o diferenĠa de level (nivel) de 1
x aceeaúi lungime VLC
Conform tabelelor B.14 úi B.15 ale standardului MPEG, există multe astfel de cuvinte
VLC, câteva exemple fiind date în Tabelul 9.3. Simbolurile reprezintă bitul de semn care
indică semnul nivelului coeficientului DCT. Pentru inserarea biĠilor de watermark într-un flux
video MPEG, sunt testate toate cuvintele VLC din toate macro-blocurile, exceptând
coeficienĠii DC din motive de vizibilitate. Dacă este găsit un cuvânt lc-VLC úi LSB-ul
nivelului său nu este egal cu bitul bi al watermark-ului, atunci acest cuvânt VLC este înlocuit
cu altul, al cărui nivel are LSB-ul egal cu bitul de watermark de inserat. Altfel, dacă LSB-ul
cuvântului lc-VLC original este egal cu bitul bi al watermark-ului, cuvântul VLC nu este
modificat. Această procedură este repetată până la inserarea tuturor biĠilor watermark-ului. În
Figura 9.31 este prezentat acest proces pentru 3 biĠi de watermark inseraĠi într-un flux MPEG.
La detector biĠii watermark-ului sunt extraúi testând toate cuvintele VLC din fiecare macro-
bloc. Dacă este găsit un lc-VLC, este extras LSB-ul său úi adăugat úirului de biĠi ai
watermark-ului. Procedura este repetată până când nu mai sunt găsite cuvinte lc-VLC. Chiar
dacă astfel de algoritmi sunt destul de sensibili la atacuri prin editare video, ei sunt complet
adaptaĠi aplicaĠiilor de ascundere de date.
Formatul MPEG-4 poate fi, de asemenea, folosit pentru aplicaĠii specifice. MPEG-4
conĠine, pe lângă compresia video obiúnuită, funcĠionalităĠi adiĠionale, ca de exemplu
animaĠia bazată pe model a suprafeĠei 3-D a capului uman folosind aúa numiĠii parametrii de
animaĠie facială (PAF). Aceúti parametrii sunt, de exemplu: „rotire cap”, „deschidere gură”
sau „ridicarea colĠului din dreapta a buzei”. Modelul capului folosit la decodor este fie un cap
obiúnuit predefinit úi un model al feĠei, fie un model specific ce poate fi transmis folosind aúa
numiĠii parametrii de definire facială (PDF).

Flux video MPEG original

BiĠi etichetă b0 0 b1 0 b2 1
Flux video MPEG cu watermark

Figura 9.31. Proces de inserare a watermark-ului în cuvinte VLC.


9. Tehnici de watermarking pentru imagini ‫܈‬i video 213

Modificarea parametrilor de model ai obiectelor video

Figura 9.32. Cadru cu watermark dintr-o secvenĠa video randată folosind (a) un model 3-D al capului
úi parametrii de animaĠie úi (b) un cadru similar după compresie video MPEG-2 la 600 kbiĠi/s

Unealta de animaĠie a feĠei permite compresia scenelor cu cap úi umeri, ca de exemplu


în aplicaĠii de video-telefonie, la o rată de bit de 1000 biĠi/s. În [278] Hartung úi al. propun o
metodă de watermarking cu spectru împrăútiat, cu inserarea watermark-ului în parametrii
PAF. Watermark-urile sunt inserate aditiv în parametrii de animaĠie. Filtrarea watermark-ului
cu spectru împrăútiat prin filtre trece-jos úi atenuarea adaptivă a amplitudinii previn
distorsiuni ale modelelor animate ale capetelor. Watermark-urile pot fi extrase prin calcularea
corelaĠiei cu parametrii cu watermark, dar úi cu secvenĠe video ce conĠin modele 3-D de
capete animate folosind parametrii cu watermark, chiar úi după modificări survenite după o
compresie bazată pe blocuri. Figura 9.32 arată un exemplu de cadre video dintr-o secvenĠă
randată folosind un model 3-D úi parametrii de animaĠie. În acest caz, parametrii trebuie să fie
mai întâi estimaĠi din secvenĠă. O observaĠie interesantă este că watermark-ul nu este conĠinut
în reprezentarea obiectului vizualizat (în pixeli), ci în semantică (modul în care se miúcă capul
úi faĠa).
Inserarea watermark-ului direct în domeniul fluxului video comprimat permite de multe
ori procesarea video în timp real. Totuúi, dezavantajul constă în faptul că watermark-ul este
legat definitiv de standardul de compresie folosit úi nu supravieĠuieúte unei conversii de
format.

9.4. Concluzii

Watermarking-ul digital a fost extins de la imagini la conĠinut video. Cercetări viitoare


în acest domeniu sunt motivate puternic de nevoia crescândă a deĠinătorilor proprietăĠii
intelectuale de a-úi proteja drepturile. Datorită mizei economice mari, watermarking-ul digital
214 Analiza úi prelucrarea digitală a semnalelor video

este un domeniu de viitor. ApariĠia de aplicaĠii noi este inerentă, la fel ca úi combinarea
diferitelor abordări existente. De exemplu, un watermark poate fi separat în două părĠi: una
pentru protecĠia drepturilor de autor úi a doua pentru amprenta clientului. Totuúi, mai multe
provocări trebuie avute în vedere. RobusteĠea schemei trebuie abordată cu multă atenĠie.
Există o serie de metode de procesare video neagresive ce ar putea altera semnalul watermark.
S-ar putea să nu fie posibilă imunizarea la toate aceste atacuri úi vor trebui definite
constrângeri corespunzătoare aplicaĠiei dorite. În ciuda tuturor acestor probleme, mulĠi
algoritmi au fost deja propuúi în literatura de specialitate. Pornesc de la simpla adaptare a
algoritmilor watermarking pentru imagini la conĠinut video úi merg până la scheme de
watermarking specifice pentru video.
Mai există încă drumuri deschise în watermarking-ul video. Această tehnologie nu este
încă atât de matură ca úi cea pentru imagini. Aproape toate procesările posibile au fost
investigate pentru imagini. În schimb, algoritmii video au rămas relativ simpli. Multe
procesări video nu au fost încă încercate úi domeniul e departe de a fi epuizat. Mai mult,
există modalităĠi de măsură a calităĠii perceptuale a secvenĠelor video, dar marea provocare
constă în a le putea exploata în timp real.

S-ar putea să vă placă și