Sunteți pe pagina 1din 30

1.

O introducere în detecția semnalelor

Problemele de detecție apar în: RADAR, telecomunicații, sonar, medicină, prelucrarea și recunoașterea
imaginilor, seismologie, automatizări ș. a.

În RADAR și în SONAR trebuie să detectăm prezența țintei pentru ca apoi să măsurăm distanța la care
este poziționată și viteza radială cu care se deplasează. În telecomunicații trebuie să detectăm prezența
unui mesaj, în medicină trebuie să detectăm prezența unor tumori, în recunoașterea imaginilor trebuie
să detectăm prezența unui obiect, etc.

Putem vorbi despre două ipoteze, una care presupune prezența obiectului pe care dorim să-l detectăm
și cealaltă care presupune absența acestuia. Detecția prezenței obiectului revine la validarea primei
ipoteze. Aceasta este urmată de luarea deciziei că ipoteza este confirmată. În consecință, se poate lua o
decizie prin testarea unor ipoteze. În toate domenile de aplicare a detecției amintite deja trebuie să
decidem dacă un eveniment este prezent sau nu și apoi să obținem mai multă informație despre el.
Detectarea evenimentelor ține de “teoria detecției”, cunoscută și sub denumirea de “testarea
ipotezelor” sau “teoria deciziilor statistice”. De cele mai multe ori datele disponibile pentru luarea
deciziei sunt afectate de zgomot. Întrucât, pentru caracterizarea zgomotului se folosesc unelte statistice,
teoria detecției se mai numește și teoria deciziilor statistice.

Dacă trebuie să decidem doar între două ipoteze (prezent, absent) vorbim despre decizie binară. Acesta
este cazul detecției unei ținte prin RADAR. Alteori trebuie să decidem între mai multe ipoteze, situație în
care se vorbește despre ipoteze multiple. Astfel de cazuri apar în telecomunicații, în clasificarea și
recunoașterea formelor (pattern recognition) ș. a.

Nu întotdeauna decizia luată este corectă. Vorbim în aceste cazuri despre erori. Scopul teoriei detecției
este ca probabilitatea deciziilor corecte să fie cât mai mare iar numărul erorilor de decizie să fie cât mai
mic.

În cazul abordării Neyman-Pearson nu avem cunoștințe a priori despre date, în cazul abordării Bayes
avem cunoștințe a priori despre date.

1.1. Detecția unui semnal constant în date perturbate aditiv cu zgomot Gaussian

Ne punem problema detecției prezenței unui semnal util într-un amestec compus din semnal util și
zgomot Gaussian de medie nulă și de dispersie σ 2 . Semnalul util este o componentă continuă de valoare
A=1. Prelevăm la momentul 0 un eșantion din semnalul achiziționat. Avem acces experimental doar la
eșantionul x[0] . Sunt posibile două cazuri, ca semnalul util să fie prezent la momentul 0 sau să nu fie
prezent. De aceea putem formula două ipoteze : H0 – semnal util absent, caz în care x[0] = w[0] și H1 –
semnal util prezent, caz în care x[0] = 1 + w[0] . Cunoscând doar eșantionul x[0] și caracteristicile statistice
ale eșantionului de zgomot alb, Gaussian, trebuie să spunem care dintre cele două ipoteze este
adevărată. Se poate vorbi și despre detectarea nivelului continuu de A=1 Volt din zgomot. Problema
detecției semnalului util
u revine la a decide care dintre celle două ipoteeze este adeevărată. Am putea
e baza comparării valorii eșșantionului x[0] cu un pragg de valoare A
decide pe A/2. Dacă valoarea eșantio
onului
x[0] este mai unci este mai probabilă ippoteza H1, în caz contrar ffiind mai prob
m mare decât 0,5 V atu babilă
ipoteza H0. Decidem căă:
x[0] ≥ 0.5 Volt, semnnalul A=1Voolt este prezeent sau H1 esste ipoteza adevărată
a
x[0]< 0.55 Volt, semnnalul A=1Voolt nu este prrezent sau H0 este ipotezza adevărată
Se observvă că în ambe partițiile lui x[0] sunt Gausssiene, dar dee valori mediii statistice differite:
ele ipoteze rep
0 în cazul ipotezei H0 și 1 în cazul ipotezei H1.

(210
0)

(211)

În ecuațiaa (210) este exprimată


e den
nsitatea de probabilitate a eșantionuluui x[0] în cazu ul ipotezei H0 iar în
ecuația (2
211) este prezzentată densitatea de proobabilitate a eeșantionului xx[0] în cazul ipotezei H1. P
Pentru
a decide care este ip poteza adevărată ar trebu ui să stabilim
m conform căăreia dintre cele două leegi de
repartiție a fost gene erat eșantionul x[0]. Amândouă legile de repartiție reprezintă particularizăări ale
densității de probabilittate depende
entă de parammetrul A din eecuația (212).

(212
2)

Cele douăă densități de probabilitaate precum și


ș histogrameele aferente ssunt reprezentate în figu
ura 41
pentru σ 2 de valoare 0,25.
0 Legea de
d repartiție corespunzăto
c oare ipotezei H0 (reprezenttată cu negru
u) este
cea din sttâga (corespu unde histograamei reprezentată cu borrdo) iar legeaa de repartițiee corespunzăătoare
ipotezei H1 (reprezentată cu verde)) este cea din n dreapta (coorespunzătoare histogramei reprezentaată cu
galben). Cele
C două Gaussiene dife eră doar prin
n valoarea m medie, cea d din stânga arre valoarea mmedie
statistică μ = 0 iar cea din dreapta are
a valoarea medie
m statistiică μ = 1 .

ogramele afereente celor două ipoteze dacăă σ 2 = 0,25 .


Figgura 41. Densittățile de probaabilitate și histo
Problema a de detecție
e devine unaa de testare a valorii parremetrului A
A. Având dată observațiaa x[0],
trebuie să
ă testăm dacă
ă A=0, sau A=
=1. Testul se descrie
d prin:
(213 3)

1.2. Detecția binară

Am definiit astfel un te
est al parameetrului din densitatea de pprobabilitate (repartiție). P
Pentru o mai bună
înțelegere
e a detecției binare,
b exemplificăm cu un flux de datte binare, la rrecepția căruia apar două erori,
ca urmare a zgomotu ului. În figuraa 42 este prrezentat un exemplu de detecție bin nară în cazull unei
comunicaații de date.

Figura 42. Un exe


emplu de deteccție binară penntru o comuniccație de date.

Pe prima linie este pre


ezentată secvvența de simboluri (biți) ccare trebuie ttransmisă. Pee a doua liniee este
reprezenttată forma de undă a semnalului em mis de blocul PAM (vezi ffigura 24). Câând simbolul care
trebuie trransmis are valoarea
v 1, semnalul
s emis are valoarre maximă. C Când simbolu ul de transmis are
valoarea 0, semnalul emis are valoarea
v 0. În
Î consecințăă suntem în n cazul descrris mai sus, când
transmite
em un 0 sunteem în ipoteza H0 iar când trransmitem unn 1 suntem înn ipoteza H1.

Pe cea de e a treia linie este


e prezentaată forma de undă a zgom motului termicc generat de eetajul de intrare în
receptor. Pe cea de a patra linie este prezen ntată forma dde undă a ssemnalului reecepționat. P Pentru
detecția simbolurilor
s transmise
t se eșantioneazăă semnalul reecepționat și fiecare eșan ntion al semn nalului
r (t ) obțin
nut se compaară (în blocu ul comparator) cu un praag de deciziee care în acest exemplu a fost
consideraat de valoare 0,5. Momentele de eșanttionare coresspund mijlocu ului fiecărui iinterval de simbol.
Pe ultimaa linie sunt prezentate datele obțin nute în urm ma comparațiiei. Comparâându-le cu d datele
transmisie e (copiate pe p penultimaa linie pentrru a facilita comparația) se constattă că majoritatea
simbolurilor transmise ectate corect.. Există două excepții : cel de al șapteleea bit și penultimul
e au fost dete
bit. S-au produs,
p așadaar, două erori de transmisie.
1.3. Detecția în cazzul mai multo
or ipoteze

Pentru creeșterea debittului de date transmise,


t ad
desea, în com
municațiile de date, se asocciază mai mulți biți
în cadrul unui
u simbol. Procedeul de e transmisie a grupului de biți se numeșște modulațiee digitală. Celle mai
frecvent utilizate
u tipurri de modulaație digitală sunt M-PSK (PPhase Shift KKeying) și M-QAM (Quadrrature
Amplitude e Modulation n) în care se transmit sim mboluri form ate din M biți. Numărul de simboluri care
compun unu alfabet correspunzător unei
u astfel de modulații esste de 2 la putterea M. În caazul în care M este
egal cu 2 se obțin patru simboluri iar dacă M este mai maare decât 2 atunci se ob bține un num măr de
simboluri mai mare decât
d 4. Fieccare simbol vav ocupa o anumită pozziție în aceasstă constelațție de
e. Folosind, de exemplu, 4 biți, putem forma
modulație f 2 4 = 166 simboluri disstincte.

1.3.1. Modulația de amplitudine în cuadratură

Modulațiaa de amplitudine în cuad drature Amp litude Modulation - QAM


dratură (Quad M) este denumirea
unei clase de metod de de modullație digitală și a unei cclase de meetode de mo odulație analogică
corespunzzătoare, folossite frecvent în
î telecomunicații.

QAM perrmite transmmiterea simultană a douăă mesaje anaalogice sau a două secvvențe digitalee prin
ea în amplitudine a două purtătoare. Cele două puurtătoare au aceeași frecvență ωc darr sunt
modulare
c 90° (una fiind cos ωc t iar cea de a do
defazate cu oua sin ωc t ), ccondiție cuno
oscută cu num
mele de ortoggonală
sau cuadrratură. Fiind de aceași fre ecvență purtăătoarele mod ulate se adun
nă, dar pot fi separate cooerent
(demodullate) datorită proprietății de ortogonalitate. Demoddulare coeren ntă se realizeează prin înm
mulțire
cu cos ωc t respectiv cu sin ωc t urmattă de filtrare trece-jos.

O altă proprietate
p importantă este că sem mnalele moddulatoare au u forme dee undă de joasă
frecvență/bandă îngusstă prin comp
parație cu sem
mnalele purtăătoare, ceea cce este cunosscută ca ipoteeza de
bandă înggustă.

Modelul matematic
m al QAM analogiice este:

(214
4)

Cu I (t ) s-a
s notat com M iar cu Q(t ) s-a notat ccomponenta sa în
mponenta în fază a semnalului QAM
cuadraturră.

d fază și modulația digitaală de fază (PPhase Shift Keeying – PSK) pot fi privitee ca și
Modulațiaa analogică de
cazuri particulare de QAM unde amplitudinea
a a semnalelor modulatoaree este consttantă dar sem mnele
acestor co
onstante se modifică.
m

QAM se fo
olosește exte
ensiv în WiFi, WiMAX
W și LTEE.

Eficiențe spectrale arb bitrar de maari pot fi atinnse folosind QAM alegân nd o constelaație de modulație
potrivită (limitată
( doarr de nivelul de
e zgomot și de liniaritatea canalului de comunicații).
Dând dife ui a(t ) și lui ϕ(t ) se obțiin diferite puuncte în plan
erite valori lu nul care are pe axa orizo
ontală
componenta în fază și pe axa verticcală compone enta în cuadraatură. Mulțim
mea acestor p
puncte se num
mește
constelațiie de modulaație. În figuraa 43 este prrezentată connstelația de modulație peentru 16 QAAM. În
interiorul cercului roșu
u este conținu
ută constelația de modulațție pentru 4 Q
QAM.

Figura 43. Co
onstelațiile de modulație penntru 16 QAM șii 4 QAM.

În cazul modulației
m 16 QAM simbolurile sunt se ecvențe de 4 biți. Amplasaarea simbolurrilor în planul (I,Q)
se face în funcție de vaalorile lui a(t ) și ϕ(t ) . Un exxemplu este pprezentat în ttabelul următtor.

mbol
Sim a Φ I Q
0000 1/ 2 2 π/ 4 1//4 1/4
0011 3/ 2 2 π/ 4 3//4 3/4
1100 1/ 2 2 5π / 4 -11/4 -1/4
1111 3/ 2 2 5π / 4 -33/4 -3/4

În cazul modulației
m 4 QAM
Q simbolurile sunt secvvențe de 2 bițți. Amplasareea simbolurilo
or în planul (I,,Q) se
face în conformitate cu
u tabelul urm
mător.

Sim
mbol a Φ I Q
00 1/ 2 2 π/ 4 1//4 1/4
01 1/ 2 2 −π / 4 1//4 -1/4
10 1/ 2 2 3π / 4 -11/4 1/4
11 1/ 2 2 5π / 4 -11/4 -1/4

Deoarece fiecare dintrre aceste sim mboluri este perturbat


p de zgomot când d se face transmisia sa, p putem
vorbi despre densitate ea de probabbilitate a fieccărui simbol. ÎÎn figura 44 sunt prezenttate densitățile de
probabilittate ale celorr patru simbo
oluri care pott apărea în caazul în care sse asociază cââte doi biți în
ntr-un
simbol.
Figura 44.
4 Densitățile de probabilitaate ale simboluurilor transmisee în cazul 4 QA
AM.

Axele plaanului de baază sunt dou uă semnale ortogonale, notate cu x și y. Ele reeprezintă dee fapt
componenta în fază șii componentaa în cuadratu ură. Datele reecepționate ssunt puncte pe suprafețele din
figură. Pe
entru a putea face detecțiaa simbolurilor corespunzăătoare, acestee date se pro oiectează pe p
planul
de bază. Proiecția se realizează prin
p calculul intercorelațieei dintre dattele recepționate și cele două
semnale x și y.

4 se prezintăă un exemplu de date care


În figura 45 modulații de tipul 16 QAM
e pot apărea îîn cazul unei m M.

Figu
ura 45. Exemplu de transmisi e cu 16 QAM.
Cele 16 simboluri posibile reprezintă centrele celor 16 pătrate în care este împărțit planul de bază (xOy).
În cazul modulațiilor în cuadratură semnalele asociate simbolurilor formate din grupuri de 4 biți sunt
complexe, partea lor reală se numește componentă în fază iar partea lor imaginară se numește
componentă în cuadratură. Un exemplu de asociere a 4 biți la câte un simbol este prezentat în figură.
Simbolului din stânga sus i s-a asociat grupul de 4 biți 0000. Următoarelor trei simboluri de pe linia de
sus li s-au asociat simbolurile: 0001, 0010 și 0011. Simbolurilor de pe a doua linie de sus li s-au asociat
următoarele grupuri de 4 biți: 0100, 0101, 0110 și 0111. Simbolurilor de pe a treia linie li s-au asociat
simbolurile: 1000, 1001, 1010 și 1011. În sfârșit, simbolurilor de pe ultima linie li s-au asociat simbolurile:
1100, 1101, 1110 și 1111. Deoarece componenta în fază a semnalului modulat în amplitudine în
cuadratură, x, reprezintă partea reală a acestui semnal iar componenta în cuadratură a semnalului
modulat în amplitudine în cuadratură reprezintă partea imaginară a acestui semnal, planul xOy poate fi
considerat planul complex. Semnalele complexe corespunzătoare unor simboluri au aceeași amplitudine
(același modul). De exemplu semnalele asociate simbolurilor desenate pe fond galben au modulul egal
cu 2 . Semnalele corespunzătoare simbolurilor desenate pe fond roz au modulul egal cu 10 iar
semnalele corespunzătoare simbolurilor desenate pe fond gri au modulul egal cu 18 . Aceste semnale
se diferențiază prin fazele lor inițiale. Întrucât diferența dintre semnalele care corespund claselor de
simboluri desenate pe fonduri de culori diferite constă în valoarea diferită a amplitudinii (modulului), 16-
QAM este o modulație de amplitudine. Punctele verzi din figură corespund datelor recepționate. Se
observă că acestea se grupează în jurul fiecăruia dintre cele 16 simboluri dar că datorită zgomotului care
perturbă transmisia punctele verzi nu se suprapun exact peste centrele pătratelor. În figură este
prezentat rezultatul unei simulări în care raportul semnal pe zgomot (SNR) al semnalului recepționat a
fost de 20 dB. Se remarcă o quasi simetrie circulară a dispunerii punctelor de date. În această simulare
au fost transmise 6520 de simboluri. Detecția simbolurilor se poate face prin proiecția punctelor verzi pe
axele de coordonate fie prin măsurarea distanței dintre punctele verzi și punctele roșii (care reprezintă
centrele pătratelor). În cazul în care detecția se face prin măsurarea proiecțiilor pe axele de coordonate,
se ridică la pătrat valorile obținute, se adună și se extrage radical din rezultatul obținut. Valoarea
rezultată se compară cu 2 , respectiv cu 10 , respectiv cu 18 . Dacă rezultatul obținut este mai mic
decât 2 atunci se decide că s-a transmis unul dintre simbolurile desenate pe fond galben. Dacă
rezultatul obținut este cuprins între 2 și 10 , se decide că s-a transmis unul dintre simbolurile
desenate pe fond roz. Dacă rezultatul obținut este mai mare decât 10 se decide că s-a transmis unul
dintre simbolurile desenate pe fond gri. Discriminarea între simbolurile desenate pe fond de aceeași
culoare se face pe baza argumentului numărului complex cu partea reală x și partea imaginară y.

În cazul experimentului din figură, detecția a fost făcută pe baza calculului distanței dintre fiecare punct
verde și centrele pătratelor. Rezultatul simulării transmisiei cu 16 QAM a fost că din cele 6520 de
simboluri transmise, 16 au fost recepționate eronat. Cele 16 simboluri recepționate eronat sunt marcate
cu pătrate roșii și sunt unite cu linii roșii cu simbolurile care au fost transmise în realitate. Probabilitatea
teoretică de eronare a unui simbol este de 0,002347 iar probabilitatea de eroare determinată pe baza
simulării este de 0,002454. Se constată că prin simulare s-a obținut o valoare foarte apropiată de
valoarea teoretică. De asemenea se remarcă faptul că valoarea probabilității de eroare este mare în
cazul moddulației 16 QA
AM, avînd în vedere
v faptull că raportul ssemnal pe zgomot al semn
nalului recepțționat
este destu
ul de mare.

1.4. Abordări ale detecției binarre

Există dou
uă abordări ale detecției: abordarea
a Ne
eyman-Pearsoon și abordareea Bayes.

În cazul abordării Neym man-Pearson parametrii sunt


s consider ați determiniiști dar de valoare necuno oscută
iar în cazuul abordării Bayesiene se consideră
c că parametrii ia u valori din m
mulțimi posibile de valori d
dar că
aceste valori sunt luate aleator. Infformația a priori care se foolosește în caazul abordării Bayesiene cconstă
în modelu ul statistic folo
osit. În contin
nuare ne referim din nou l a problema d detecției componentei con ntinue
A = 1 , perrturbată aditiv de un zgom mot alb Gaussian de mediee nulă.

Dacă putem asocia probabilități


p apriorice
a celo
or două ipotteze (H1 - co
omponenta ccontinuă A=1 1 este
prezentă în
î semnalul analizat
a și H0 – componentta continuă nnu este prezentă în semnalul analizat A = 0 ),
vom recurge la cele do d repartiție condiționată :
ouă densități de

(215
5)

Densitateea de probabiilitate din prima ecuație este e densitateea de probab bilitate a lui xx[0] condițion
nat de
ipoteza H0. Pentru utilizarea acestei densități de e probabilitatee trebuie cun
noscută probaabilitatea aprriorică
P(H0). În cea
c de a doua ecuație apaare densitatea de probabiilitate a lui x[[0] condiționaat de H1. De aceea
trebuie făăcută distincțiia dintre notaațiile din ultim
ma ecuație:

1.5. Comportări asimptotice în detecție


d

În unele aplicații
a uie să detectăm prezența unor semnaale “slabe”, cee au un rapo
trebu ort semnal/zggomot
(Signal to
o Noise Ratio - SNR) de valoare redusă. De multe ori succesul în astfel de cazuri depind de de
lungimea N a secvențței de semnaal de date, x[n],
x disponibbilă. Pentru a exemplificaa comportam
mentul
asimptotic în detecțiee, vom considdera că dispu
unem nu de unul, ci de m mai multe eșșantioane de date,

Considerăăm că vrem să rezolvăm problema de etecției prez enței semnalului constan


nt de valoaree A în
datele afe
ectate aditiv ded zgomot alb b Gaussian de
e valoare meedie nulă, dar că avem maii multe eșanttioane
la dispoziiție, x[0], x[1
1],…,x[N-1]. Se formuleazăă aceleași ipooteze : H0 – semnalul esste absent șii H1 –
semnalul este prezent..

(216)
Repartițiaa zgomotului w[n ] este acceeași ca și în
n cazul anterrior. Zgomotu
ul ce afectează datele, esste un
zgomot allb, Gaussian, deci cu eșanttioane IID:

(217)
.
Având la dispoziție maai mult decâtt un eșantion, am putea aameliora deteecția prezențeei semnaluluii dacă
am reduce dispersia daatelor, calculâând media ce
elor N eșantiooane. În acestt fel am obțin
ne o nouă stattistică
a datelor după calculu
ul mediei, pe care o vom numi
n mediere am putea
în contiinuare statisttică T. După m
detecta prezența
p semnalului comp parând mediaa cu un prag ( γ ) de valoaare A/2. Vom decide că H1 este
ipoteza ad
devărată, daccă:

(218)

.
=1 și γ de valoare ½ regăsim problem
Pentru N= ma detecției prezenței semnalului pe care am amiintit-o
deja.

Comparăm m detecția re ealizată folossind un singu


ur eșantion cuu detecția reealizată folosind un număăr mai
mare de eșantioane
e (d
de exemplu 5). În figura 46 6 sunt prezenntate repartițiile datelor în
n cele 2 ipoteze, H0
și H1, atunci când se folosește un singur
s eșantio
on iar în figu ra 47 sunt prrezentate reppartițiile dateelor în
cazul în caare se folosessc 5 eșantioanne, după ce s--a făcut mediierea.

Figura 46
6. Repartițiile datelor
d în cele două
d ipoteze (H1 – verde și H 0 - negru) în caazul în care se folosește un siingur
eșantion.

În figura 46,
4 cele douăă repartiții su
unt normale, de medie nu lă și de dispeersie 0,25. See observă că există
multe valori din cadrul ipotezei H0 mai mari deccât pragul γ egal cu 0,5. Pentru acestee valori detecctorul
va decidee că semnalul este prezentt deși ne aflăm în cadrul i potezei H0. C Cu alte cuvintte se vor înreegistra
erori de detecție.
d De asemenea, în figura 46 exisstă multe valoori din cadrull ipotezei H1 m mai mici decâât 0,5.
Pentru acceste valori, detectorul
d vaa decide că se emnalul estee absent, deși suntem în ccadrul ipotezzei H1,
înregistrându-se alte erori
e de deteccție. În figura 47 sunt repreezentate repaartițiile T coreespunzătoaree celor
două ipotteze.
Figura 47. Repartițiile T în cele dou
uă ipoteze (H1 – verde și H0 - negru) în cazu
ul în care se folosește media a 5
eșantioane.
e

Acestea sunt tot reparrtiții normale dar au o dispersie de N oori mai mică (de valoare σ 2 / N ). Pentru σ 2
de valoarre 0,25 și N de valoare 5, 5 dispersiile repartițiilor T vor fi egale cu 0,05. D De aceea numărul
valorilor repartiției
r dattelor din cadrrul ipotezei H0 mai mari deecât pragul vaa fi mai mic decât în cazul figurii
46. De asemenea, num mărul valorilo or repartiției corespunzăto
c oare ipotezei H1 mai mici d decât 0,5 va fi mai
mic decâtt în cazul figurrii 46. Deci nu
umărul deciziilor incorectee din cazul deetecției bazatee pe un număăr mai
mare de eșatioane este mai mic decât număărul deciziiloor incorecte din cazul deetecției bazatte pe
cunoașterrea unui singu ur eșantion. Crește,
C în schiimb, timpul nnecesar luării unei decizii!

Se repetă experimentu ul anterior pe


entru un num măr de N=1000 de eșantioane cunoscutee. În figura 48 8 sunt
prezentatte repartițiile datelor în ce
ele două ipoteeze pentru caazul în care esste cunoscut un singur eșaantion
iar în figura 49 sunt pre
ezentate repaartițiile datelo
or obținute d upă mediere în cazul celor două ipotezze.

Figura 48
8. Repartițiile datelor
d în cele două
d ipoteze (H1 – verde și H 0 - negru) în caazul în care se folosește un siingur
eșantion.
Figura 49.. Repartițiile T în cele două ipoteze
i (H1 – verde
v n care se foloseește media a 100 de
și H0 - ne gru) în cazul în
eșantioane.
e

În acest caz
c dispersia statisticilor T este egalăă cu 0,25/1000=0,0025 iarr abaterea sttandard este 0,05.
Triplul abaterii standard este 0,15 care este maai mic decât vvaloarea de p prag 0,5. În coonsecință aproape
toate valoorile repartițiiei T din cazu
ul ipotezei H0 sunt situate în stânga prragului iar maajoritatea vallorilor
repartiției T din cazul ipotezei H1 sunt
s situate în
î dreapta p ragului. Eroriile de detecțție sunt extreem de
rare. Decii dacă facem ca numărul de d eșantioane e să tindă la infinit, număărul de erori sscade ASIMPTTOTIC
la zero.

1.6. In
ndicatori de calitate
c a dete
ecției

otate în contiinuare μ 0 peentru repartițția datelor în cazul


e celor două repartiții (no
Intuim că dacă mediile
ipotezei H0 și μ1 pentrru repartiția datelor
d în cazzul ipotezei H 1) diferă mult între ele, n
numărul detecțiilor
e repartiție ddepinde de σ , abaterea standard, caree este
corecte este mare. Daar “întindereaa” curbelor de
aceeași înn ambele ipooteze. Pe măăsură ce valo oarea lui σ este mai red dusă, scade numărul decciziilor
incorecte. Frecvența erorilor de detecție scaade cu creștterea diferen nței dintre vvalorile med dii ale
e ( μ1 și μ 2 ) șii cu scăderea dispersiei ceelor două repaartiții.
or corespunzătoare celor două ipoteze
repartițiilo
Raportul:

(219)

numit și coeficient
c dee deflexie, estte un indicattor, pentru caazul de față, al “detectab
bilității”. Uneori se
folosește în loc de d vaaloarea pătrattului său:

(220)

Valoarea sa în cazul detecției


d semmnalului consttant în datel e perturbatee de zgomot alb Gaussian n este
calculată în
î ecuațiile următoare. În cazul acesteii probleme dee detecție disspersia reparttițiilor T este egală
cu σ 2 / N :

(221)
partiției T ( μ1 ) în cazul ipo
media rep otezei H1 este A

E{T ; H1} = A (222)


iar media repartiției T în ezei H0 ( μ 0 ) este 0:
î cazul ipote

E{T ; H 0 } = 0 . (223)
Valoarea coeficientulu
ui de deflexie este:

(224)

Se constaată că aceasttă valoare este egală cu


u produsul d intre raportu
ul semnal pee zgomot (SN NR) și
numărul de
d eșantioane cunoscute, N. În conseccință, perform
manțele de deetecție pot fi îmbunătățitee prin
creșterea lui N (ASIMPTOTIC).

enea performanțele detecțției pot fi îmb


De aseme bunătățite pri n creșterea raportului sem
mnal pe zgom
mot.

d eșantioane cunoscute permite îmbbunătățirea p


Creștereaa numărului de performanțelo or detecției aatunci
când eșaantioanele su unt IID iar datele sunt repartizate normal. Dee fapt chiarr dacă reparrtițiile
eșantioannelor nu suntt normale, poate
p nută pentru statistica T o repartiție normală, pe baza
fi obțin
teoremei limită centrală, dacă N estte foarte marre. Teorema l imită centralăă are următorul enunț.

1.6.1. Teorema limită centralăă

Se consideră N variabile aleatoare,, x[0], x[1],…,,x[N-1], IID, aavând media μ și varianțaa σ 2 , care nu
u sunt
neapărat normal repaartizate. Cu ajutorul
a acesttor variabile aleatoare see construieștee o nouă varriabilă
aleatoare, y:

1 N −1 x[n] − μ (225)
y= ∑ .
N n=0 σ
Este vorbba despre o sumă poderaată a celor N variabile aleeatoare. În conformitate cu teorema limită
centrală, dacă N tinde la infinit atun
nci repartiția variabilei aleeatoare y tind
de la o Gaussiană de mediee nulă
și de dispe
ersie unitară,,

N →∞ (226)
y → ℵ(0,1) .
Există și o formulare mai
m generală a teoremei lim mită centrală care afirmă ccă suma a N vvariabile aleaatoare
chiar repaartizate diferrit una de altta tinde la o Gaussiană attunci când N tinde la infinit, dacă nici unul
dintre termenii sumei nu este predo ominant.

În continuuare se prezintă câteva exemple


e de aplicare a teooremei limită centrală. Un n prim exempplu se
referă la experimente e cu zaruri. În
Î primul expperiment se aruncă un singur zar de 10000 de o ori. Se
înregistrează de câte ori
o a fost obțținută fiecare dintre cele 6 valori posib
bile și se obține histogram
ma din
figura 50.
Figuraa 50. Histogram
ma experimenttului de aruncaare a unui zar d
de 10000 de orri.

Se constată că este voorba de o variiabilă aleatoaare repartizattă uniform. În n cel de al doilea experimeent se
aruncă deoadată 5 zaruri.
z Experiimentul se repetă
r tot d e 10000 de ori, dar dee data aceassta se
înregistrează suma valorilor obținutte la fiecare aruncare.
a Val oarea sumei este un întreeg cuprins întrre 5 și
30. Se trasează histogrrama din figurra 51. Se consstată că s-a oobținut o variaabilă aleatoarre Gaussiană.. Deci,
teorema limită
l centrală a fost confirmată chiar dacă
d s-a folossit o valoare relativ mică peentru N (5).

Figuraa 51. Histogram


ma experimenttului de însumaare a valorilor obținute arunccând 5 zaruri d
de 10000 de orri.

În continu
uare se prezin
ntă un al doillea exemplu ded verificare a teoremei limită centralăă. De aceastăă dată
se conside c faza inițiallă o variabilă aleatoare un
eră un semnaal sinusoidal cu niformă. Este deci vorba d
despre
transform
marea funcțională y=sinxx, unde variabila aleattoare X estte repartizattă uniform (vezi
transform
marea funcțio onală a unei variabile aleatoare
a în cursul introoductiv). Histtograma variiabilei
aleatoare Y este prezentată în figura 52.
Figura 52. Histtograma unei sinusoide
s cu faaza repartizatăă uniform.

Ea nu seaamănă cu o Gaussiană.
G Se adună 15 astfel de sinusooide având frrecvențe caree nu sunt în rraport
armonic și
ș care nu au amplitudini foarte
f diferite. Variabila aaleatoare sum
mă obținută aare histogram
ma din
figura 53.

Figura 53. Histogram


ma sumei de 15 sinusoide cuu frecvențe în rraport armonicc.

Se constată că s-a obținut o variabillă aleatoare Gaussiană.


G

2. Te
eoria deciziei statistice

Considerăăm că repartiițiile datelor sunt


s cunoscu
ute în toate ippotezele posiibile. Așa cumm s-a amintitt deja,
putem utiliza una dinttre cele două abordări possibile : Neym
man-Pearson ssau Bayes. Ab bordarea Neyyman-
Pearson se
s folosește în n RADAR, SONAR, căutări în baze de daate,...adică în
n cazurile în ccare nu cunoaaștem
probabilittățile apriorice ale ipoteezelor. Cea de
d a doua abordare, ceea Bayesianăă se foloseșște în
telecomunicații, în reecunoașterea formelor,... adică în ca zurile în carre probabilităățile statisticce ale
ipotezelorr sunt cunosccute.

2.1. Te
eorema Neym
man-Pearson

Pentru introducerea teoremei Neyyman-Pearson n începem cuu un exemplu u de testare a ipotezelor.. Vom
e a unei variaabile aleatoarre, care poatte fi repartizaată normal, ℵ(0,1) ,
presupune că observăm o realizare
sau ℵ(1,1) . Cele două ip
poteze referittoare la preze
ența semnaluului H1 și resp
pectiv la abseența semnalullui H0,
e medii satisttice ale dateloor. Trebuie săă decidem daacă μ = 0 sau μ = 1 ,
se pot forrmula în funcție de valorile
pe baza unui singur eșantion de datte, x[0]. Fiecaare dintre celee două valori ale mediei p
poate fi privităă ca și
o ipoteză.. Trebuie deci să decidem care dintre ippotezele

(227)

este adevvărată, având


d la dispoziție
e un singur eșantion
e de ddate, x[0]. Caa terminologgie, H0 se num
mește
“ipoteza nulă” iar H1 se numește “ipoteza alte ernativă”. Prroblema de d decizie pe caare o discutăm, se
numește și
ș problemă de
d “test al ipo
otezei binare””.

Repartițiille datelor în cele


c două ipoteze sunt pre
ezentate în figgura 54.

Figura 54.. Repartițiile daatelor în cele două


d ipoteze diin problema deetecției unei co
omponente co
ontinue de valo
oare 1
în date
d perturbatte de zgomot aalb Gaussian.

Cu violet este trasatăă densitatea de probabilitate a dateloor în ipotezaa H0 iar cu vverde este trrasată
densitatea de probab bilitate a datelor în ipote
eza H1. Dacă trebuie să d decidem, pe baza unui ssingur
eșantion de date, estee greu de spus care dintrre cele două ipoteze l-a ggenerat, sau cărei densităăți de
el eșantion. Dacă pragul de decizie see ia γ = 1 / 2 , detecția preezenței semn
repartiție aparține ace nalului
constant se face comp parând valoarea eșantionului x[0] cu vvaloarea praggului de ½. D Dacă x[0] este mai
mare sau egal cu ½ atunci densitaatea de probaabilitate coreespunzătoaree ipotezei H1 are o valoare mai
mare decât densitateaa de probabilitate corespunnzătoare ipottezei H0 și deccidem că sem
mnalul este prrezent
(ipoteza H1 este adevărată). Daccă x[0] este mai mic deecât ½ atuncci densitateaa de probabilitate
corespunzzătoare ipote
ezei H0 este mai
m mare decâât densitatea de probabilittate a ipotezeei H1 și decideem că
semnalul constant este
e absent (ipotteza H0 este adevărată).
a R egula de deciizie este:
(228
8)

2.1.1. Probabilitaatea de eroarre

decizie. Notâând cu P{H i ; H j }


Procesul de detecție descris anterior este susceptibil dee erori de d
probabilittatea de eroare care aparee când decideem că ipotezaa Hi este adevvărată dar în rrealitate ipoteeza Hj
era adevăărată, constattăm că există două tipuri de
d erori:

e tipul I – P{H1 ; H 0 } = P{x[0] ≥ 1 / 2; H 0 } și eroare dee tipul II – P{H 0 ; H1} = P{x[0] < 1 / 2 H1} . Dacă
eroare de
declarăm:

- ip
poteza H1 ca adevărată,
a atunci când ipooteza H0 este aadevărată, co
omitem o ero
oare de tipul I,
- ip
poteza H0 ca adevărată, attunci când ipo
oteza H1 este adevărată, comitem o erooare de tipul II.

Probabilittățile corespu or două tipurri de eroare suunt egale cu aariile hașurate în figura 55
unzătoare celo 5.

Figu
ura 55. Vizualizzarea celor dou obabilitate de eroare prin arii hașurate în ccazul γ = 0,5 .
uă tipuri de pro

Într-adevăăr, probabilitaatea ca valoaarea eșantionului x[0] să fi e mai mică d decât ½ în cazzul ipotezei H1 este
egală cu integrală de la −∞ la 0,5 din densitate ea de probab ilitate coresp punzătoare ippotezei H1 adică cu
aria supraafeței de sub curba verde mărginită la dreapta de vverticala ridiccată prin punctul de abscissă 0,5
(marcată cu galben în figură). De assemenea, pro obabilitatea cca valoarea eșșantionului x[[0] să fie mai mare
decât ½ înî cazul ipote ezei H0 este egală
e din densitateea de probabilitate
cu integrală de la 00,5 la infinit d
corespunzzătoare ipote ezei H0 care este
e egală cu aria suprafeeței de sub grraficul funcțieei reprezentaată cu
violet limiitată la stîngaa de verticala ridicată prin punctul de a bscisă 0,5 (mmarcată cu turrcoaz în figurăă). Se
observă că cele două ariia sunt egale e deoarece ce ele două supraafețe corespu unzătoare sun nt identice.

În figura 56 sunt reprrezentate ariiile de probab


bilitate de erroare în cazu
ul în care valloarea pragului de
detecție a fost crescutăă de la 0,5 la 1,1.
Figura 56. Vizualizarea celor două tipuri de prrobabilitate de eroare prin arrii hașurate în ccazul γ = 1,1 .

Se observvă că aria gaalbenă a cresscut și că ariia turcoaz a scăzut față dde situația ddin figura 55.. Deci
probabilittatea de a co
omite erori de
d tipul I a sccăzut dar proobabilitatea dde a comite erori de tipu ul II a
crescut. Nu
N pot fi reduuse ambele tipuri de eroaare prin simplla modificaree a valorii praagului. Adoptând o
terminoloogie din RADAAR vorbim desspre:

Eorile de tipul I se num


mesc alarme false
f deoarecce ele presupuun că semnallul constant aar fi prezent ddeși el
este abseent. Erorile de tipul II se numesc erorri de pierderee a țintei deoarece ele afirmă că sem mnalul
constant (ținta în cazu ul RADAR-ului sau al SONA AR-ului) este absent deși îîn realitate eel este prezen
nt. Cu
ajutorul probabilității
p de pierdere a țintei poatee fi calculată probabilitateea de detectaare corectă a țintei
PD. O cattegorie mode ernă de detecctoare optimale sunt celee cu alarmă ffalsă constantă (Constant False
Alarm Ratte – CFAR). În Î cazul acestora, valoare ea pragului d e decizie se alege în așa fel încât valoarea
probabilittății de alarmă falsă să fie egală
e cu o valoare impusă , α . Impunem m:

9)
(229
Optimizarrea detecției se realizeazăă în acest cazz prin minimi zarea erorii d
de tip II. În aacest mod po
oate fi
maximizată valoarea probabilității
p de
d detecție co orectă:

(230
0)

2.1.1.1. Legătura dintre


d probabilitatea de alaarmă falsă și pprobabilitatea de detecțiee corectă

Probabilittatea de alarrmă falsă estte numeric egală


e cu ariaa marcată cu u turcoaz iar probabilitateea de
detecție corectă
c este numeric
n egalăă cu aria marccată cu roz în figura 57.
Figura 57. Vizualizarea probabilităților de
e alarmă falsă șși detecție coreectă prin arii hașurate.

s întind la dreapta verticcalei ridicate prin valoareaa de prag, γ . Așa după cu


Ambele arii hașurate se um se
vede în figgura 57, dacăă se crește vaaloarea praguului de detecțție, atât probabilitatea de alarmă falsă cât și
probabilittatea de deteecție corectă scad. În figu ura 57 sunt inndicate și reggiunile de deecizie, în caree dacă
intră eșanntionul de seemnal, x[0], luăm decizia arătată. Dac ă valoarea eșantionului xx[0] este mai mică
decât valoarea de praag atunci se decide că semnalul con stant nu estte prezent (ccă ipoteza H0 este
adevăratăă). Dacă valoaarea eșantion nului x[0] estte mai mare decât valoareea de prag atunci se deciide că
semnalul constant este e prezent (ipooteza H1 este adevărată).

2.1.1.2. Calculul prrobabilitățilorr de alarmă faalsă și de deteecție corectă

În cazul considerat,
c re
epartițiile dattelor în cele două
d ipotezee sunt normaale. De aceeaa probabilitatea de
alarmă falsă se poate calcula
c ca

(231)

Probabilittatea de alarm
mă falsă repre bilitatea ca vaaloarea eșanttionului x[0] îîn cazul ipotezei H0
ezintă probab
e valoarea γ șși este numeric egală cu in
să fie mai mare decât pragul de deccizie care are ntegrala de laa γ la
∞ din de
ensitatea de probabilitate
e corespunzătoare ipotez ei H0 (care ccarespunde u
unei Gaussien
ne de
medie nulă). Această integrală
i ncție specială care se noteează cu Q(γ ) și care se găăsește
reprezintă o fun
ea 0,5 în 0 și are propriettatea Q(− x ) = 1 − Q(x ) . Fun
tabelată. Această funccție ia valoare ncția Q(x ) po
oate fi
place notată Φ(x ) respecctiv cu ajutorrul funcției ccompelmentaare de
exprimatăă cu ajutorul funcției Lap
otată erfc(x ) . Funcția lui Laplace este definită
eroare, no d ca

t2 2)
(232
x 1 −
Φ (x ) = ∫ e 2 dt
−∞ 2π
iar funcția complemen or este definită ca
ntară a erorilo

∞ 2 2 (233
3)
e (x ) = ∫
erfc e −t dt
x π
Relațiile de
d legătură dintre aceste trei
t funcții sunt

Q(x ) = 1 − Φ (x ) , (234
4)
1 ⎛ x ⎞ (235
5)
Q(x ) = erfc⎜⎜ ⎟⎟ ,
2 ⎝ 2⎠
și

( )
erfc(x ) = 2Q 2 x . (236
6)
5 se prezintăă graficul funccției lg{Q(x )} .
În figura 58

Figura 58. Graaficul funcției llg{Q(x )} .

Se observvă că este o funcție


f strict descrescătoaare și, prin uurmare, este inversabilă. ÎÎn MATLAB fu
uncția
Q(x ) se ca
alculează cu qfunc(x).
q

Reluăm exemplul
e de calcul
c al celoor două probaabilități de a larmă falsă șși de detecțiee corectă discutat.
Impunem o valoare a probabilității
p de alarmă fallsă de α prin :

PFA = Q(γ ) = α , 7)
(237
ul testului γ prin:
ecuație diin care se dettermină pragu

γ = Q −1 (α ) . (237
7)
Pentru α de valoare 0,001 se obțține de pe graficul
g funcțiiei Q −1 o valoare a pragului de decizzie de
3,0902, γ =qfuncinv(0
0.001)=3,0902
2. Probabilitaatea de deteccție corectă, PD, este datăă de probabilitatea
ca eșantio
onul x[0] să aibă
a o valoarre mai mare decât 3,09022, atunci cândd datele au rrepartiție stattistică
corepunzăătoare ipotezei H1. Aceaastă probabilitate este e gală cu inteegrala de la 3,0902 la ∞ din
densitatea de probabilitate normală de medie 1 (dacă considderăm că valo oarea constanntă a semnalului A
este egalăă cu 1) și de abatere stanndard 1 (daccă considerăm
m că dispersiia zgomotului perturbatorr este
egală cu 1):
1

∞ 1 ⎛ (t − 1)2 ⎞ (238
8)
PD = P{H1 ; H1} = P{x[0] ≥ 3,09; H1} = ∫ expp⎜ − ⎟dt .
2π ⎜ 2 ⎟
3,09 ⎝ ⎠
Făcând scchimbarea dee variabilă u=tt-1 se obține integrala din relația urmăătoare, care reprezintă valoarea
funcției Q în 3,0902-1
1. Aceasta estte (în conforrmitate cu grraficul funcțieei Q) de 1,833 înmulțit cu 10 la
puterea -2
2.

∞ 1 ⎛ u2 ⎞ (239
9)
PD = ∫ eexp⎜ − ⎟du = Q(2,09) ≅ 1,883 ⋅ 10 − 2 .
2π ⎜ 2 ⎟
2,09 ⎝ ⎠
Această valoare
v a prrobabilității de
d detecție corectă estee destul de mică. În consecință preezența
semnaluluui constant nu
n va fi detecctată prea co orect. Valoareea probabilităății de detecție corectă se mai
numește și puterea tesstului. Valoarrea probabilității de detecțție corectă po ută dacă detecctorul
oate fi crescu
dispune de
d mai multe eșantioane de d valoare cunoscută. În a cest caz, însăă, nu mai lucrrăm cu scalari ci cu
vectori N dimensionali. Ne putem pune întrebaarea dacă va loarea de maai sus pentru u probabilitatea de
detecție este
e tot ce se e poate obține ectorul dispu ne de N datee observate, {x[0], x[1],..., x[N − 1]}
e ? Dacă dete
situația se
e poate înbun
nătăți radical.

2.2. Ip
potezele teore
emei Neyman
n-Pearson

Acum dattele sunt form


mate din vecto
ori N dimensiionali. Se deffinesc două reegiuni pe mullțimea vectorrilor N
dimension
nali notată cu
u RN:

- egiunea critică,
re

fo
ormată din accei vectori N dimensionalii pentru caree se decide căă ipoteza H1 eeste adevărată (se
re
ejectează ipotteza H0) și
- re
egiunea R0,

fo
ormată din accei vectori N dimensionalii pentru caree se decide căă ipoteza H0 eeste adevărată (se
re
ejectează ipotteza H1).

Se constată că reuniun
nea regiunilorr R1 și R0 este chiar mulțim ea RN,
și că interrsecția regiunilor R1 și R0 esste mulțimea vidă,

Acum pro obabilitatea de alarmă falsă f se calculează ca inntegrala multtiplă pe R1 d


din densitateea de
probabilittate a datelorr în ipoteza căă este adevăraată ipoteza H 0,

PFA = ∫ p (x; H 0 )dx = α (240


0)
R1
care se notează tot cu u α și se numește și nive elul de semn ificație al tesstului. Există mai multe reegiuni
critice pen
ntru care relaația de constrrîngere (240) dată de egal area probabilității de alarmă falsă cu n nivelul
de semnifficație al testului este satissfăcută. Dintrre aceste reg iuni critice tr ebuie aleasă aceea pentru
u care
este maximizată probaabilitatea dete ecției corecte
e, PD,

PD = ∫ p (x; H1 )dx . (241)


R1
Teorema Neyman-Peaarson ne arattă cum trebuie aleasă reggiunea critică dacă se cun nosc densitățile de
probabilittate a datelorr în cele douăă ipoteze p(x; H 0 ) și p(x; H1 ) și dacă se impune niveelul de semnifficație
a testului α .

nunțul teorem
2.3. En mei Neyman--Pearson

Pentru a maximiza pro


obabilitatea de
d detecție corectă,
c la o probabilitatee impusă a alarmei false, α , se
decide H1 dacă,

p(x; H1 ) 2)
(242
L(x ) = > γ , x fixxat dar oareccare.
p(x; H 0 )
Pragul tesstului, γ , este
e soluția ecuaației,

PFA = ∫ p(x; H 0 )dx = α ; unde I = {x : L(x ) > γ} . (243


3)
I
În enunț apare
a ul de plauzibilitate L(x), de
raportu efinit ca rapo rtul densitățiilor de probabilitate ale daatelor
dacă se consideră ip potezele H1 și H0. Acestte densități de probabilitate reprezzintă densităăți de
probabilittate comune ale datelor dependente de paramettru (valoareaa constantei cu care estee egal
semnalul a cărui prezență o dete ectăm). Dar în partea dee estimare aam numit acceste densităăți de
probabilittate comune dependente de paramettru funcții dee plauzibilitatte. Acesta esste motivul p pentru
care num
mim funcția L(x)
L raport de plauzibilitaate. Teoremaa Neyman-Peearson ne sp pune că puteem să
determinăăm pragul de e detecție, γ , rezolvând ecuația
e (243) în care probbabilitatea dee alarmă falsăă este
impusă de valoare α . Apoi putem m să calculăm m raportul d e plauzibilitaate și să deteerminăm reggiunea
critică (în care raportul de plauzibiliitate este mai mare decât pragul de dettecție) rezolvvând ecuația ((242).

2.4. Demonstrația teoremei Neyyman-Pearson (facultativ)

Pentru deemonstrație aplicăm


a metoda multiplicatorilor lui Laggrange, pentrru a maximizaa probabilitattea de
detecție, PD cu constrrângerea impusă de valoarrea admisă peentru probab mei false ( PFA = α ).
bilitatea alarm
Alegerea pragului de detecție γ pentru maximizarea probabilității de detecție PD cu constrângerea ca
probabilitatea de alarmă falsă să ia valoarea impusă α presupune în cazul metodei multiplicatorilor lui
Lagrange construcția lagrangeanului și alegerea lui λ pentru maximizarea acestuia. Se construiește
lagrangeanul F:

F = PD + λ(PFA − α ) . (244)
unde λ reprezintă multiplicatorul lui Lagrange. Exprimând în formă integrală cele două probabilități: PD
și PFA , lagrangeanul ia forma:

⎛ ⎞ (245)
F = ∫ p (x; H1 )dx + λ⎜ ∫ p (x; H 0 )dx − α ⎟ ,
⎜R ⎟
R1 ⎝ 1 ⎠
sau, ținând seama de liniaritatea operației de integrare:

F = ∫ [ p (x; H1 ) + λp(x; H 0 )]dx − λα (246)


R1
Maximizarea lagrangeanului revine la maximizarea descăzutului din membrul drept al ecuației (246) prin
alegerea regiunii critice R1 și la minimizarea scăzătorului. Pentru a maximiza descăzutul, vom include în
regiunea critică doar acei vectori x pentru care integrandul este pozitiv; integranzii pozitivi cresc
valoarea integralei, în timp ce integranzii negativi scad valoarea integralei. În consecință:

R1 = {x se decide H1 si p(x; H1 ) + λp(x; H 0 ) > 0}. (247)


Prin urmare:

x ∈ R1 și p(x; H1 ) + λp(x; H 0 ) > 0 (248)


Deoarece densitățile de probabilitate sunt pozitive, inegalitatea de mai sus se pune sub forma:

p(x; H1 ) (249)
x ∈ R1 și > −λ ,
p(x; H 0 )
sau, ținând seama de definiția raportului de plauzibilitate din relația (242):

x ∈ R1 și L(x ) > −λ . (250)


Pentru a minimiza scăzătorul din membrul drept al relației (246) vom folosi un multiplicator al lui
Lagrange de valoare negativă (deorece α este pozitiv). Alegând multiplicatorul lui Lagrange de valoare
− γ , relația (250) devine:

x ∈ R1 și L(x ) > γ , (251)


identică cu relația (242) din enunțul teoremei Neyman-Pearson. Constrângerea impusă la aplicarea
metodei multiplicatorilor lui Lagrange, PFA = α , ne permite să determinăm valoarea pragului de decizie
γ pe baza valorii alese pentru α :

PFA = ∫ p(x; H 0 )dx = α ; unde I = {x : L(x ) > γ} , (252)


I
deoarece vectorul x trebuie să satisfacă condițiile din relația (251). Teorema Neyman-Pearson a fost în
acest fel demonstrată.
2.5. Verificarea teoremei Neyman-Pearson

În continuare verificăm corectitudinea teoremei Neyman-Pearson, aplicând-o la rezolvarea problemei


detecției prezenței semnalului constant de valoare 1 în date afectate aditiv de zgomot Gaussian de
medie nulă și dispersie unitară, pentru cazul în care se cunoaște un singur eșantion x[0]. Raportul de
plauzibilitate are expresia:

1 ⎧⎪ (x[0] − 1)2 ⎫⎪
exp⎨− ⎬
p (x; H1 ) 2π ⎪⎩ 2 ⎪⎭
L(x ) = = . (253)
p(x; H 0 ) 1 ⎧⎪ (x[0])2 ⎫⎪
exp⎨− ⎬
2π ⎪⎩ 2 ⎪⎭
În conformitate cu teorema Neyman-Pearson, se decide că ipoteza H1 este cea corectă, dacă:

L(x ) > γ . (254)


Decidem că H1 este adevărată dacă:

1 ⎧⎪ (x[0] − 1)2 ⎫⎪
exp ⎨− ⎬ (255)
2π ⎪⎩ 2 ⎪⎭
>γ.
⎪⎧ (x[0]) ⎫⎪
2
1
exp ⎨− ⎬
2π ⎪⎩ 2 ⎪⎭
În urma efectuării calculelor, condiția pe baza căreia decidem că ipoteza H1 este adevărată devine:

exp{x[0] − 1 / 2} > γ .
(256)
Logaritmând, obținem valoarea pragului de detecție γ' :

x[0] > ln γ + 1 / 2 = γ ' .


(256)
Impunând valoarea probabilității de alarmă falsă de 0,001, putem determina valoarea pragului de
detecție, γ' , din ecuația de constrângere,

PFA = P(exp{x[0] − 1 / 2} > γ; H 0 ) = α = 0,001 , (257)


sau ținând seama de (256):

PFA = P(x[0] > γ ' ; H 0 ) = α = 0,01 , (258)


știind că repartiția eșantionului x[0] în ipoteza nulă este:

1 ⎧⎪ x 2 [0]⎫⎪ (259)
p(x[0]; H 0 ) = exp⎨− ⎬.
2π ⎪⎩ 2 ⎪⎭
Înlocuind această expresie în expresia probabilității de alarmă falsă (din relația (258)) obținem:

PFA = ∫
∞ 1

( )
exp − x 2 [0]/ 2 dx[0] = Q (γ ') = 0,001 .
(260)
γ'
Se constată că integrala pe care trebuie să o calculăm este egală cu valoarea funcției Q în punctul γ' .
Folosind graficul inversei funcției Q obținem pentru γ' valoarea de 3,09. Aceeași valoare a pragului de
detecție a fost obținută și mai devreme când am făcut calculul probabilităților de alarmă falsă și de
detecție corectă. În consecință am verificat teorema Neyman-Pearson pe un exemplu.

În cele ce urmează vom utiliza frecvent propoziția:

( )
Dacă x : ℵ μ, σ 2 , atunci P(x > γ ') = Q⎜
⎛ γ '−μ ⎞
⎝ σ ⎠
⎟ (261)

Pentru a demonstra această propoziție, exprimăm probabilitatea de depășire a pragului γ' P(x > γ ') cu
integrala de la valoarea pragului la infinit din densitatea de probabilitate Gaussiană de medie μ și
dispersie σ 2 ,

⎧⎪ (x − μ )2 ⎫⎪
∞ 1
P ( x > γ ') = ∫
exp ⎨− ⎬dx . (262)
γ ' 2πσ ⎪⎩ 2σ 2 ⎪⎭
x −μ
Facem schimbarea de variabilă u = , obținem o nouă integrală:
σ

∞ ⎧⎪ (u )
1 2 ⎫⎪
P ( x > γ ') = ∫exp ⎨− ⎬du . (263)
(γ '− μ ) / σ 2 π ⎪⎩ 2 ⎪⎭
care este egală cu funcția Q de argument (γ '−μ ) / σ ,

⎛ γ '−μ ⎞ (264)
P ( x > γ ') = Q ⎜ ⎟,
⎝ σ ⎠
(c.c.t.d).

2.6. Al doilea exemplu de aplicare a teoremei Neyman-Pearson. Cazul datelor N dimensionale

În continuare dăm al doilea exemplu de aplicare a teoremei Neyman-Pearson. De data aceasta pentru
detecția semnalului constant din date afectate aditiv de zgomot Gaussian avem la dispoziție N
eșantioane cunoscute. Ipotezele legate de absența respectiv prezența semnalului se formulează ca:

H 0 : x[n] = w[n]; n = 0,1,..., N − 1


H1 : x[n] = A + w[n]; n = 0,1,..., N − 1 si A > 0 ,
( )
H 0 si H1 - w[n] : ℵ 0, σ 2 ; C w = σ 2 I u
(265)

Vectorul de N eșantioane de zgomot este repartizat normal cu media statistică nulă și matricea de
covarianță ca în (265). Cu I u s-a notat matricea unitate (care are elementele de pe diagonală de valoare
1 și toate celelalte elemente de valoare 0). Media statistică a datelor în ipoteza H0 este zero:

H 0 : μ = [00...0 ]T = 0 , (266)
iar media datelor în ipoteza H1 este proporțională cu vectorul coloană care are toate elementele egale
cu A:
H1 : μ = [AA... A]T = A1 . (267)
Maricea de covarianță a zgomotului este egală cu σ 2 I u . Rezultă că repartițiile vectorilor de date, în cele
două ipoteze sunt:

H 0 - x : ℵ⎛⎜ 0, σ 2 I u ⎞⎟ (268)
⎝ ⎠ .
H1 - x : ℵ⎜ A1, σ I u ⎞⎟
⎛ 2
⎝ ⎠
Datele sunt distribuite după o lege Gaussiană de medie nulă și de varianță egală cu covarianța
zgomotului în cazul ipotezei H0 respectiv după o lege Gaussiană de medie A1 și de aceeași varianță în
cazul ipotezei H1. Ipoteza H0 presupune ca valoarea medie statistică a variabilei aleatoare N
dimensională care descrie datele să fie egală cu vectorul nul iar ipoteza H1 presupune ca valoarea medie
statistică a variabilei aleatoare N dimensională care reprezintă datele să fie egală cu produsul A1.

H0 : μ = 0 (269)
H1 : μ = A1
.

Ținând seama de expresiile densităților de probabilitate din cele două ipoteze, putem calcula raportul de
plauzibilitate și să punem condiția ca să fie mai mare decât pragul de detecție, γ

1 ⎧ 1 N −1 2⎫
exp⎨− ∑ (x[n] − A) ⎬
L(x ) =
p(x; H1 )
=
(2πσ 2 N/2
) 2
⎩ 2σ n = 0 ⎭
> γ, (270)
p(x; H 0 ) 1 ⎧ 1 N −1 2⎫
exp⎨− ∑ (x[n]) ⎬
(2πσ 2
N / 2
) 2
⎩ 2σ n = 0 ⎭
adică:

⎧ 1 ⎡ N −1 N −1
2 ⎤⎫ (271)
exp⎨−
2 ⎢− 2 A ∑ x[n] + ∑ A ⎥ ⎬ > γ .
⎩ 2σ ⎣ n=0 n=0 ⎦⎭
Logaritmând în ambii membri se obține inecuația:

1 ⎡ N −1 ⎤ (272)
− ⎢ − 2 A ∑ x[n] + NA 2 ⎥ > ln γ .
2
2σ ⎣ n=0 ⎦
Separând în membrul stâng suma eșantioanelor de date se obține

A N −1 NA 2 (273)
∑ x[n] > ln γ + ..
σ2 n=0 2σ 2
Împărțind în ambii membri cu cantitatea pozitivă NA / σ 2 se obține în final că media eșantion a datelor
trebuie să fie mai mare decât un prag γ' :

1 N −1 σ2 A (274)
x= ∑ x[n] > ln γ + = γ ' .
N n=0 NA 2
În cazul în care media eșantion este mai mare decât pragul γ' se decide că semnalul constant este
prezent iar în caz contrar se decide că semnalul constant este absent. Ajustând valoarea pragului se
fixează valoarea probabilității de alarmă falsă și respectiv a probabilității de detecție corectă. Arătăm în
continuare cum se poate face această ajustare, calculând cele două probabilități. În cazul mediei
eșantion, T (x ) = x , statistica T (egală cu media eșantion) are o repartiție Gaussiană. Calculăm mediile și
dispersiile statisticii T în cele două ipoteze. În ipoteza H0, semnalul constant este absent și trebuie să
calculăm media statistică (E) a mediei eșantion a zgomotului Gaussian. Media statisticii T în cazul
ipotezei H0 este:

⎧ 1 N −1 ⎫ 1 N −1 (275)
E{T (x ); H 0 } = E ⎨ ∑ w[n]⎬ = ∑ E{w[n]} = 0 ,
⎩ N n=0 ⎭ N n=0
deoarece operatorul de mediere statistică este liniar comutând cu constanta 1/N și cu suma. Întrucât
media statistică a zgomotului este 0 rezultă că media statistică a statisticii T în ipoteza H0 este egală cu 0.

Dispersia statisticii T în cazul ipotezei H0 este:

⎧ 1 N −1 ⎫ 1 N −1 σ2 (276)
Disp{T (x ); H 0 } = Disp ⎨ ∑ w[n ]⎬ = 2 ∑ Disp{w[n]} = .,
⎩ N n=0 ⎭ N n=0 N
Calculul dispersiei statisticii suficiente T revine la a calcula dispersia mediei eșantion a zgomotului și este
egală cu media statistică a pătratului mediei eșantion, care este egală cu suma pătratelor dispersiilor
fiecărui eșantion de zgomot împărțită la N 2 . Se obține valoarea σ 2 / N . Valoarea medie statistică a
statisticii T în ipoteza H1 este egală cu media statistică a mediei eșantion a datelor obținute prin
adunarea la constanta A a zgomotului w,

⎧ 1 N −1 ⎫ 1 N −1 (277)
E{T (x ); H1} = E ⎨ ∑ ( A + w[n])⎬ = ∑ E{A + w[n]} = A .
⎩ N n=0 ⎭ N n=0
Datorită liniarității operatorului de mediere statistică se obține suma mediilor statistice ale
esantioanelor A+w[n] împărțită la N, care este egală cu A. În sfârșit, dispersia statisticii T în cazul ipotezei
H1 este egală cu σ 2 / N ,

⎧ 1 N −1 ⎫ σ2 (278)
Disp{T (x ); H1} = Disp ⎨ ∑ ( A + w[n])⎬ = ... = .
⎩ N n =0 ⎭ N
În ambele ipoteze statistica T este normală cu dispersia de valoare σ 2 / N . În cazul ipotezei H0, valoarea
medie a statisticii T este 0 iar în cazul ipoezei H1, valoarea medie a statisticii T este A:

.
T (x ) :
( )
ℵ 0, σ 2 / N în ipoteza H 0 . (279)
ℵ(A, σ / N )
2
în ipoteza H1
Pentru determinarea probabilităților de alarmă falsă și de detecție corectă, putem aplica relația (261). În
cazul probabilității de alarmă falsă, așa după cum se vede în relația următoare, trebuie să folosim
ipoteza H0, în care valoarea medie este μ = 0 iar abaterea standard este σ2 / N ,

⎛ γ '−0 ⎞
PFA = P{T (x ) > γ '; H 0 } = Q⎜ ⎟=α. (280)
⎜ 2 ⎟
⎝ σ /N ⎠
În consecință valoarea probabilității de alarmă falsă este Q(γ ' N / σ ) . Impunând valoarea α pentru
probabilitatea de alarmă falsă se poate calcula valoarea pragului de detecție γ ' . Se calculează
probabilitatea de detecție corectă pe baza statisticii T din cazul ipotezei H1. În acest caz valoarea medie
este A.

⎛ γ '− A ⎞
PD = P{T (x ) > γ '; H1} = Q⎜ ⎟. (281)
⎜ 2 ⎟
⎝ σ /N ⎠
S-a obținut Q(N (γ '− A) / σ ) , în care trebuie să înlocuim pragul de detecție γ ' cu valoarea determinată
anterior. Valoarea pragului de detecție poate fi determinată ca funcție de probabilitatea de alarmă falsă
folosind relația (280):

σ 2 −1
γ' = Q (PFA ) . (282)
N
Valoarea corespunzătoare a probabilității de detecție corectă rezultă substituind (282) în (281) și este,

⎛ NA 2 ⎞⎟
PD = Q⎜⎜ Q −1 (PFA ) −
σ 2 ⎟⎠
= (
Q Q −1
( PFA ) − )
ENR ; ENR =
NA 2
σ2
, (283)

în care intervine raportul dintre NA2 care reprezintă energia celor N eșantioane de semnal util și σ 2 ,
care reprezintă puterea zgomotului. Acest raport reprezintă deci raportul dintre energia semnalului util
și puterea zgomotului, motiv pentru care a fost notat cu ENR (Energy to Noise Ratio). El este de fapt
raportul semnal pe zgomot (SNR).

În figura 59 este reprezentată dependența porbabilității de detecție corectă de ENR (exprimat în


decibeli) pentru diferite valori ale probabilității de alarmă falsă.
5 Dependența probabilității de detecție corectă PD de ENR (măsurat îîn dB), pentru diferite valori ale
Figura 59.
probabilitățiii de alarmă falssă PFA .

Dacă prob babilitatea de


e alarmă falsăă are valoareaa 0,1 atunci s e obține curb
ba albastră. D
Dacă probabilitatea
de alarmăă falsă are vaaloarea de 0,001 atunci se obține curba verde. Dacă probabilitateea de alarmăă falsă
are valoarrea 0,001 atu e curba roșie. Se observă ccă atunci când
unci se obține d probabilitattea de alarmăă falsă
are valori mari și probabilitatea de detecție core ectă va avea valori mari. DDe exemplu laa un ENR de 10 dB
probabilittatea de deteecție corectă ia valoarea de d 0,975 în ccazul în care probabilitateea de alarmăă falsă
este de 0,,1 și probabilitatea de dettecție corectăă ia valoarea de 0,8 atuncii când probab bilitatea de alarmă
falsă este de 0,01.

De aseme enea, se obse ervă că pentrru o valoare fixată a probbabilității de alarmă falsă,, probabilitatea de
detecție corectă
c crește
e cu creștereea ENR. De exxemplu pent ru o probabilitate de alarrmă falsă de 0,001
(curba roșie), la o valo oare a ENR ded 14 dB (carre corespund e la o valoarre liniară de 2 25,12) se obțține o
probabilittate de detecție corectă de 0,975, iar la o valoarre a ENR dee 16 dB se o obține o valo oare a
probabilittății de detecțție corectă de
e 1.

A și că σ 2 =1,
Dacă conssiderăm că A=1 = atunci penntru N=1 obțținem un ENR R de 0 dB. Daacă considerăăm că
probabilittatea de alarmă falsă este nci obținem o probabilitaate de detecțție corectă de 0,4.
e de 0,1 atun
Dacă considerăm că N=10,
N atunci, pentru aceeleași valori aale A și σ 2 obținem un ENR de 10. La o
probabiltaate de alarm
mă falsă de 0,1 obținem o probabilitatte de detecțție corectă dee 0,975. Decci prin
creșterea lui N poate fi crescută mu
ult valoarea probabilității dde detecție co
orectă.

2.7.Proble
ema repartițiilor Gaussiene de valori medii statisticee diferite
Observând repartițiile statisticii T din problema pe care tocmai am studiat-o putem să o generalizăm la
problema repartițiilor Gaussiene cu valori medii diferite,

ℵ⎛⎜ μ 0 , σ 2 ⎞⎟ în ipoteza H 0
T: ⎝ ⎠ ; μ1 > μ 0 . (284)
⎛ 2 ⎞
ℵ⎜ μ1, σ ⎟ în ipoteza H1
⎝ ⎠
Atât repartiția din cazul ipotezei H0 cât și repartiția din cazul ipotezei H1 sunt normale, de aceeași
dispersie, dar de medii diferite, cu μ1 mai mare decât μ 0 . Se calculează valoarea statisticii T (care era
media eșantion în exemplul analizat anterior) și se compară rezultatul obținut cu un prag, γ ' . Dacă
valoarea statisticii T depășește pragul atunci se decide că ipoteza H1 este corectă iar în caz contrar se
decide că ipoteza H0 este corectă. Probabilitatea de alarmă falsă se calculează în cazul problemei
repartițiilor Gaussiene cu valori medii diferite ca în relația următoare:

⎛ γ '−μ 0 ⎞ (285)
PFA = P (T > γ '; H 0 ) = Q⎜ ⎟=α. .
⎝ σ ⎠
Impunând o anumită valoare pentru probabilitatea de alarmă falsă rezultă valoarea corespunzătoare a
pragului de decizie,

γ '−μ 0 (286)
= Q −1 (PFA ) ⇒ γ ' = μ 0 + σQ −1 (PFA ) .
σ
Probabilitatea de detecție corectă se calculează cu relația:

⎛ γ '−μ1 ⎞ (287)
PD = P (T > γ '; H1 ) = Q⎜ ⎟.
⎝ σ ⎠
în care se substituie valoarea pragului de detecție obținută anterior,

⎛ μ − μ0 ⎞ (288)
PD = Q⎜ Q −1 (PFA ) − 1 ⎟.
⎝ σ ⎠
Probabilitatea de detecție corectă poate fi calculată și în funcție de coeficientul de deflexie. Ținând
seama de faptul că mediile statisticii T în cele două ipoteze sunt egale cu μ1 și μ 2 și că dispersia
statisticii T este în ambele ipoteze egală cu σ 2 , valoarea coeficientului de deflexie pentru problema
repartițiilor Gaussiene cu medii diferite devine:

d2 =
(E{T ; H1} − E{T ; H 0 })2 = (μ1 − μ 0 )2 . (289)
Disp{T ; H 0 } σ2
Ținând seama de faptul că ultimul termen din argumentul funcției Q din (288) este tocmai d, această
probabilitate de detecție corectă poate fi pusă în forma:

PD = Q⎛⎜ Q −1 (PFA ) − d 2 ⎞⎟ .
(290)
⎝ ⎠
Întrucât Q(x)
Q este o funcție
f descrrescătoare se
e constată căă probabilitattea de deteccție corectă ccrește
odată cu creșterea
c lui d,
d așa cum se
e vede în figurra 60.

orul

2
Figura 60 orectă PD de faactorul de deflexie d
0. Dependența probabilității de detecție co (măsurat în dB), peentru
obabilității de alarmă falsă PFA în cazul reppartițiilor Gausssiene de valorri medii diferite.
diferitte valori ale pro

S-ar putea să vă placă și