Documente Academic
Documente Profesional
Documente Cultură
Problemele de detecție apar în: RADAR, telecomunicații, sonar, medicină, prelucrarea și recunoașterea
imaginilor, seismologie, automatizări ș. a.
În RADAR și în SONAR trebuie să detectăm prezența țintei pentru ca apoi să măsurăm distanța la care
este poziționată și viteza radială cu care se deplasează. În telecomunicații trebuie să detectăm prezența
unui mesaj, în medicină trebuie să detectăm prezența unor tumori, în recunoașterea imaginilor trebuie
să detectăm prezența unui obiect, etc.
Putem vorbi despre două ipoteze, una care presupune prezența obiectului pe care dorim să-l detectăm
și cealaltă care presupune absența acestuia. Detecția prezenței obiectului revine la validarea primei
ipoteze. Aceasta este urmată de luarea deciziei că ipoteza este confirmată. În consecință, se poate lua o
decizie prin testarea unor ipoteze. În toate domenile de aplicare a detecției amintite deja trebuie să
decidem dacă un eveniment este prezent sau nu și apoi să obținem mai multă informație despre el.
Detectarea evenimentelor ține de “teoria detecției”, cunoscută și sub denumirea de “testarea
ipotezelor” sau “teoria deciziilor statistice”. De cele mai multe ori datele disponibile pentru luarea
deciziei sunt afectate de zgomot. Întrucât, pentru caracterizarea zgomotului se folosesc unelte statistice,
teoria detecției se mai numește și teoria deciziilor statistice.
Dacă trebuie să decidem doar între două ipoteze (prezent, absent) vorbim despre decizie binară. Acesta
este cazul detecției unei ținte prin RADAR. Alteori trebuie să decidem între mai multe ipoteze, situație în
care se vorbește despre ipoteze multiple. Astfel de cazuri apar în telecomunicații, în clasificarea și
recunoașterea formelor (pattern recognition) ș. a.
Nu întotdeauna decizia luată este corectă. Vorbim în aceste cazuri despre erori. Scopul teoriei detecției
este ca probabilitatea deciziilor corecte să fie cât mai mare iar numărul erorilor de decizie să fie cât mai
mic.
În cazul abordării Neyman-Pearson nu avem cunoștințe a priori despre date, în cazul abordării Bayes
avem cunoștințe a priori despre date.
1.1. Detecția unui semnal constant în date perturbate aditiv cu zgomot Gaussian
Ne punem problema detecției prezenței unui semnal util într-un amestec compus din semnal util și
zgomot Gaussian de medie nulă și de dispersie σ 2 . Semnalul util este o componentă continuă de valoare
A=1. Prelevăm la momentul 0 un eșantion din semnalul achiziționat. Avem acces experimental doar la
eșantionul x[0] . Sunt posibile două cazuri, ca semnalul util să fie prezent la momentul 0 sau să nu fie
prezent. De aceea putem formula două ipoteze : H0 – semnal util absent, caz în care x[0] = w[0] și H1 –
semnal util prezent, caz în care x[0] = 1 + w[0] . Cunoscând doar eșantionul x[0] și caracteristicile statistice
ale eșantionului de zgomot alb, Gaussian, trebuie să spunem care dintre cele două ipoteze este
adevărată. Se poate vorbi și despre detectarea nivelului continuu de A=1 Volt din zgomot. Problema
detecției semnalului util
u revine la a decide care dintre celle două ipoteeze este adeevărată. Am putea
e baza comparării valorii eșșantionului x[0] cu un pragg de valoare A
decide pe A/2. Dacă valoarea eșantio
onului
x[0] este mai unci este mai probabilă ippoteza H1, în caz contrar ffiind mai prob
m mare decât 0,5 V atu babilă
ipoteza H0. Decidem căă:
x[0] ≥ 0.5 Volt, semnnalul A=1Voolt este prezeent sau H1 esste ipoteza adevărată
a
x[0]< 0.55 Volt, semnnalul A=1Voolt nu este prrezent sau H0 este ipotezza adevărată
Se observvă că în ambe partițiile lui x[0] sunt Gausssiene, dar dee valori mediii statistice differite:
ele ipoteze rep
0 în cazul ipotezei H0 și 1 în cazul ipotezei H1.
(210
0)
(211)
(212
2)
Am definiit astfel un te
est al parameetrului din densitatea de pprobabilitate (repartiție). P
Pentru o mai bună
înțelegere
e a detecției binare,
b exemplificăm cu un flux de datte binare, la rrecepția căruia apar două erori,
ca urmare a zgomotu ului. În figuraa 42 este prrezentat un exemplu de detecție bin nară în cazull unei
comunicaații de date.
QAM perrmite transmmiterea simultană a douăă mesaje anaalogice sau a două secvvențe digitalee prin
ea în amplitudine a două purtătoare. Cele două puurtătoare au aceeași frecvență ωc darr sunt
modulare
c 90° (una fiind cos ωc t iar cea de a do
defazate cu oua sin ωc t ), ccondiție cuno
oscută cu num
mele de ortoggonală
sau cuadrratură. Fiind de aceași fre ecvență purtăătoarele mod ulate se adun
nă, dar pot fi separate cooerent
(demodullate) datorită proprietății de ortogonalitate. Demoddulare coeren ntă se realizeează prin înm
mulțire
cu cos ωc t respectiv cu sin ωc t urmattă de filtrare trece-jos.
O altă proprietate
p importantă este că sem mnalele moddulatoare au u forme dee undă de joasă
frecvență/bandă îngusstă prin comp
parație cu sem
mnalele purtăătoare, ceea cce este cunosscută ca ipoteeza de
bandă înggustă.
Modelul matematic
m al QAM analogiice este:
(214
4)
Cu I (t ) s-a
s notat com M iar cu Q(t ) s-a notat ccomponenta sa în
mponenta în fază a semnalului QAM
cuadraturră.
d fază și modulația digitaală de fază (PPhase Shift Keeying – PSK) pot fi privitee ca și
Modulațiaa analogică de
cazuri particulare de QAM unde amplitudinea
a a semnalelor modulatoaree este consttantă dar sem mnele
acestor co
onstante se modifică.
m
QAM se fo
olosește exte
ensiv în WiFi, WiMAX
W și LTEE.
Eficiențe spectrale arb bitrar de maari pot fi atinnse folosind QAM alegân nd o constelaație de modulație
potrivită (limitată
( doarr de nivelul de
e zgomot și de liniaritatea canalului de comunicații).
Dând dife ui a(t ) și lui ϕ(t ) se obțiin diferite puuncte în plan
erite valori lu nul care are pe axa orizo
ontală
componenta în fază și pe axa verticcală compone enta în cuadraatură. Mulțim
mea acestor p
puncte se num
mește
constelațiie de modulaație. În figuraa 43 este prrezentată connstelația de modulație peentru 16 QAAM. În
interiorul cercului roșu
u este conținu
ută constelația de modulațție pentru 4 Q
QAM.
Figura 43. Co
onstelațiile de modulație penntru 16 QAM șii 4 QAM.
În cazul modulației
m 16 QAM simbolurile sunt se ecvențe de 4 biți. Amplasaarea simbolurrilor în planul (I,Q)
se face în funcție de vaalorile lui a(t ) și ϕ(t ) . Un exxemplu este pprezentat în ttabelul următtor.
mbol
Sim a Φ I Q
0000 1/ 2 2 π/ 4 1//4 1/4
0011 3/ 2 2 π/ 4 3//4 3/4
1100 1/ 2 2 5π / 4 -11/4 -1/4
1111 3/ 2 2 5π / 4 -33/4 -3/4
În cazul modulației
m 4 QAM
Q simbolurile sunt secvvențe de 2 bițți. Amplasareea simbolurilo
or în planul (I,,Q) se
face în conformitate cu
u tabelul urm
mător.
Sim
mbol a Φ I Q
00 1/ 2 2 π/ 4 1//4 1/4
01 1/ 2 2 −π / 4 1//4 -1/4
10 1/ 2 2 3π / 4 -11/4 1/4
11 1/ 2 2 5π / 4 -11/4 -1/4
Axele plaanului de baază sunt dou uă semnale ortogonale, notate cu x și y. Ele reeprezintă dee fapt
componenta în fază șii componentaa în cuadratu ură. Datele reecepționate ssunt puncte pe suprafețele din
figură. Pe
entru a putea face detecțiaa simbolurilor corespunzăătoare, acestee date se pro oiectează pe p
planul
de bază. Proiecția se realizează prin
p calculul intercorelațieei dintre dattele recepționate și cele două
semnale x și y.
Figu
ura 45. Exemplu de transmisi e cu 16 QAM.
Cele 16 simboluri posibile reprezintă centrele celor 16 pătrate în care este împărțit planul de bază (xOy).
În cazul modulațiilor în cuadratură semnalele asociate simbolurilor formate din grupuri de 4 biți sunt
complexe, partea lor reală se numește componentă în fază iar partea lor imaginară se numește
componentă în cuadratură. Un exemplu de asociere a 4 biți la câte un simbol este prezentat în figură.
Simbolului din stânga sus i s-a asociat grupul de 4 biți 0000. Următoarelor trei simboluri de pe linia de
sus li s-au asociat simbolurile: 0001, 0010 și 0011. Simbolurilor de pe a doua linie de sus li s-au asociat
următoarele grupuri de 4 biți: 0100, 0101, 0110 și 0111. Simbolurilor de pe a treia linie li s-au asociat
simbolurile: 1000, 1001, 1010 și 1011. În sfârșit, simbolurilor de pe ultima linie li s-au asociat simbolurile:
1100, 1101, 1110 și 1111. Deoarece componenta în fază a semnalului modulat în amplitudine în
cuadratură, x, reprezintă partea reală a acestui semnal iar componenta în cuadratură a semnalului
modulat în amplitudine în cuadratură reprezintă partea imaginară a acestui semnal, planul xOy poate fi
considerat planul complex. Semnalele complexe corespunzătoare unor simboluri au aceeași amplitudine
(același modul). De exemplu semnalele asociate simbolurilor desenate pe fond galben au modulul egal
cu 2 . Semnalele corespunzătoare simbolurilor desenate pe fond roz au modulul egal cu 10 iar
semnalele corespunzătoare simbolurilor desenate pe fond gri au modulul egal cu 18 . Aceste semnale
se diferențiază prin fazele lor inițiale. Întrucât diferența dintre semnalele care corespund claselor de
simboluri desenate pe fonduri de culori diferite constă în valoarea diferită a amplitudinii (modulului), 16-
QAM este o modulație de amplitudine. Punctele verzi din figură corespund datelor recepționate. Se
observă că acestea se grupează în jurul fiecăruia dintre cele 16 simboluri dar că datorită zgomotului care
perturbă transmisia punctele verzi nu se suprapun exact peste centrele pătratelor. În figură este
prezentat rezultatul unei simulări în care raportul semnal pe zgomot (SNR) al semnalului recepționat a
fost de 20 dB. Se remarcă o quasi simetrie circulară a dispunerii punctelor de date. În această simulare
au fost transmise 6520 de simboluri. Detecția simbolurilor se poate face prin proiecția punctelor verzi pe
axele de coordonate fie prin măsurarea distanței dintre punctele verzi și punctele roșii (care reprezintă
centrele pătratelor). În cazul în care detecția se face prin măsurarea proiecțiilor pe axele de coordonate,
se ridică la pătrat valorile obținute, se adună și se extrage radical din rezultatul obținut. Valoarea
rezultată se compară cu 2 , respectiv cu 10 , respectiv cu 18 . Dacă rezultatul obținut este mai mic
decât 2 atunci se decide că s-a transmis unul dintre simbolurile desenate pe fond galben. Dacă
rezultatul obținut este cuprins între 2 și 10 , se decide că s-a transmis unul dintre simbolurile
desenate pe fond roz. Dacă rezultatul obținut este mai mare decât 10 se decide că s-a transmis unul
dintre simbolurile desenate pe fond gri. Discriminarea între simbolurile desenate pe fond de aceeași
culoare se face pe baza argumentului numărului complex cu partea reală x și partea imaginară y.
În cazul experimentului din figură, detecția a fost făcută pe baza calculului distanței dintre fiecare punct
verde și centrele pătratelor. Rezultatul simulării transmisiei cu 16 QAM a fost că din cele 6520 de
simboluri transmise, 16 au fost recepționate eronat. Cele 16 simboluri recepționate eronat sunt marcate
cu pătrate roșii și sunt unite cu linii roșii cu simbolurile care au fost transmise în realitate. Probabilitatea
teoretică de eronare a unui simbol este de 0,002347 iar probabilitatea de eroare determinată pe baza
simulării este de 0,002454. Se constată că prin simulare s-a obținut o valoare foarte apropiată de
valoarea teoretică. De asemenea se remarcă faptul că valoarea probabilității de eroare este mare în
cazul moddulației 16 QA
AM, avînd în vedere
v faptull că raportul ssemnal pe zgomot al semn
nalului recepțționat
este destu
ul de mare.
Există dou
uă abordări ale detecției: abordarea
a Ne
eyman-Pearsoon și abordareea Bayes.
(215
5)
Densitateea de probabiilitate din prima ecuație este e densitateea de probab bilitate a lui xx[0] condițion
nat de
ipoteza H0. Pentru utilizarea acestei densități de e probabilitatee trebuie cun
noscută probaabilitatea aprriorică
P(H0). În cea
c de a doua ecuație apaare densitatea de probabiilitate a lui x[[0] condiționaat de H1. De aceea
trebuie făăcută distincțiia dintre notaațiile din ultim
ma ecuație:
În unele aplicații
a uie să detectăm prezența unor semnaale “slabe”, cee au un rapo
trebu ort semnal/zggomot
(Signal to
o Noise Ratio - SNR) de valoare redusă. De multe ori succesul în astfel de cazuri depind de de
lungimea N a secvențței de semnaal de date, x[n],
x disponibbilă. Pentru a exemplificaa comportam
mentul
asimptotic în detecțiee, vom considdera că dispu
unem nu de unul, ci de m mai multe eșșantioane de date,
(216)
Repartițiaa zgomotului w[n ] este acceeași ca și în
n cazul anterrior. Zgomotu
ul ce afectează datele, esste un
zgomot allb, Gaussian, deci cu eșanttioane IID:
(217)
.
Având la dispoziție maai mult decâtt un eșantion, am putea aameliora deteecția prezențeei semnaluluii dacă
am reduce dispersia daatelor, calculâând media ce
elor N eșantiooane. În acestt fel am obțin
ne o nouă stattistică
a datelor după calculu
ul mediei, pe care o vom numi
n mediere am putea
în contiinuare statisttică T. După m
detecta prezența
p semnalului comp parând mediaa cu un prag ( γ ) de valoaare A/2. Vom decide că H1 este
ipoteza ad
devărată, daccă:
(218)
.
=1 și γ de valoare ½ regăsim problem
Pentru N= ma detecției prezenței semnalului pe care am amiintit-o
deja.
Figura 46
6. Repartițiile datelor
d în cele două
d ipoteze (H1 – verde și H 0 - negru) în caazul în care se folosește un siingur
eșantion.
În figura 46,
4 cele douăă repartiții su
unt normale, de medie nu lă și de dispeersie 0,25. See observă că există
multe valori din cadrul ipotezei H0 mai mari deccât pragul γ egal cu 0,5. Pentru acestee valori detecctorul
va decidee că semnalul este prezentt deși ne aflăm în cadrul i potezei H0. C Cu alte cuvintte se vor înreegistra
erori de detecție.
d De asemenea, în figura 46 exisstă multe valoori din cadrull ipotezei H1 m mai mici decâât 0,5.
Pentru acceste valori, detectorul
d vaa decide că se emnalul estee absent, deși suntem în ccadrul ipotezzei H1,
înregistrându-se alte erori
e de deteccție. În figura 47 sunt repreezentate repaartițiile T coreespunzătoaree celor
două ipotteze.
Figura 47. Repartițiile T în cele dou
uă ipoteze (H1 – verde și H0 - negru) în cazu
ul în care se folosește media a 5
eșantioane.
e
Acestea sunt tot reparrtiții normale dar au o dispersie de N oori mai mică (de valoare σ 2 / N ). Pentru σ 2
de valoarre 0,25 și N de valoare 5, 5 dispersiile repartițiilor T vor fi egale cu 0,05. D De aceea numărul
valorilor repartiției
r dattelor din cadrrul ipotezei H0 mai mari deecât pragul vaa fi mai mic decât în cazul figurii
46. De asemenea, num mărul valorilo or repartiției corespunzăto
c oare ipotezei H1 mai mici d decât 0,5 va fi mai
mic decâtt în cazul figurrii 46. Deci nu
umărul deciziilor incorectee din cazul deetecției bazatee pe un număăr mai
mare de eșatioane este mai mic decât număărul deciziiloor incorecte din cazul deetecției bazatte pe
cunoașterrea unui singu ur eșantion. Crește,
C în schiimb, timpul nnecesar luării unei decizii!
Figura 48
8. Repartițiile datelor
d în cele două
d ipoteze (H1 – verde și H 0 - negru) în caazul în care se folosește un siingur
eșantion.
Figura 49.. Repartițiile T în cele două ipoteze
i (H1 – verde
v n care se foloseește media a 100 de
și H0 - ne gru) în cazul în
eșantioane.
e
În acest caz
c dispersia statisticilor T este egalăă cu 0,25/1000=0,0025 iarr abaterea sttandard este 0,05.
Triplul abaterii standard este 0,15 care este maai mic decât vvaloarea de p prag 0,5. În coonsecință aproape
toate valoorile repartițiiei T din cazu
ul ipotezei H0 sunt situate în stânga prragului iar maajoritatea vallorilor
repartiției T din cazul ipotezei H1 sunt
s situate în
î dreapta p ragului. Eroriile de detecțție sunt extreem de
rare. Decii dacă facem ca numărul de d eșantioane e să tindă la infinit, număărul de erori sscade ASIMPTTOTIC
la zero.
1.6. In
ndicatori de calitate
c a dete
ecției
(219)
numit și coeficient
c dee deflexie, estte un indicattor, pentru caazul de față, al “detectab
bilității”. Uneori se
folosește în loc de d vaaloarea pătrattului său:
(220)
(221)
partiției T ( μ1 ) în cazul ipo
media rep otezei H1 este A
E{T ; H 0 } = 0 . (223)
Valoarea coeficientulu
ui de deflexie este:
(224)
Se consideră N variabile aleatoare,, x[0], x[1],…,,x[N-1], IID, aavând media μ și varianțaa σ 2 , care nu
u sunt
neapărat normal repaartizate. Cu ajutorul
a acesttor variabile aleatoare see construieștee o nouă varriabilă
aleatoare, y:
1 N −1 x[n] − μ (225)
y= ∑ .
N n=0 σ
Este vorbba despre o sumă poderaată a celor N variabile aleeatoare. În conformitate cu teorema limită
centrală, dacă N tinde la infinit atun
nci repartiția variabilei aleeatoare y tind
de la o Gaussiană de mediee nulă
și de dispe
ersie unitară,,
N →∞ (226)
y → ℵ(0,1) .
Există și o formulare mai
m generală a teoremei lim mită centrală care afirmă ccă suma a N vvariabile aleaatoare
chiar repaartizate diferrit una de altta tinde la o Gaussiană attunci când N tinde la infinit, dacă nici unul
dintre termenii sumei nu este predo ominant.
Se constată că este voorba de o variiabilă aleatoaare repartizattă uniform. În n cel de al doilea experimeent se
aruncă deoadată 5 zaruri.
z Experiimentul se repetă
r tot d e 10000 de ori, dar dee data aceassta se
înregistrează suma valorilor obținutte la fiecare aruncare.
a Val oarea sumei este un întreeg cuprins întrre 5 și
30. Se trasează histogrrama din figurra 51. Se consstată că s-a oobținut o variaabilă aleatoarre Gaussiană.. Deci,
teorema limită
l centrală a fost confirmată chiar dacă
d s-a folossit o valoare relativ mică peentru N (5).
În continu
uare se prezin
ntă un al doillea exemplu ded verificare a teoremei limită centralăă. De aceastăă dată
se conside c faza inițiallă o variabilă aleatoare un
eră un semnaal sinusoidal cu niformă. Este deci vorba d
despre
transform
marea funcțională y=sinxx, unde variabila aleattoare X estte repartizattă uniform (vezi
transform
marea funcțio onală a unei variabile aleatoare
a în cursul introoductiv). Histtograma variiabilei
aleatoare Y este prezentată în figura 52.
Figura 52. Histtograma unei sinusoide
s cu faaza repartizatăă uniform.
Ea nu seaamănă cu o Gaussiană.
G Se adună 15 astfel de sinusooide având frrecvențe caree nu sunt în rraport
armonic și
ș care nu au amplitudini foarte
f diferite. Variabila aaleatoare sum
mă obținută aare histogram
ma din
figura 53.
2. Te
eoria deciziei statistice
2.1. Te
eorema Neym
man-Pearson
Pentru introducerea teoremei Neyyman-Pearson n începem cuu un exemplu u de testare a ipotezelor.. Vom
e a unei variaabile aleatoarre, care poatte fi repartizaată normal, ℵ(0,1) ,
presupune că observăm o realizare
sau ℵ(1,1) . Cele două ip
poteze referittoare la preze
ența semnaluului H1 și resp
pectiv la abseența semnalullui H0,
e medii satisttice ale dateloor. Trebuie săă decidem daacă μ = 0 sau μ = 1 ,
se pot forrmula în funcție de valorile
pe baza unui singur eșantion de datte, x[0]. Fiecaare dintre celee două valori ale mediei p
poate fi privităă ca și
o ipoteză.. Trebuie deci să decidem care dintre ippotezele
(227)
Cu violet este trasatăă densitatea de probabilitate a dateloor în ipotezaa H0 iar cu vverde este trrasată
densitatea de probab bilitate a datelor în ipote
eza H1. Dacă trebuie să d decidem, pe baza unui ssingur
eșantion de date, estee greu de spus care dintrre cele două ipoteze l-a ggenerat, sau cărei densităăți de
el eșantion. Dacă pragul de decizie see ia γ = 1 / 2 , detecția preezenței semn
repartiție aparține ace nalului
constant se face comp parând valoarea eșantionului x[0] cu vvaloarea praggului de ½. D Dacă x[0] este mai
mare sau egal cu ½ atunci densitaatea de probaabilitate coreespunzătoaree ipotezei H1 are o valoare mai
mare decât densitateaa de probabilitate corespunnzătoare ipottezei H0 și deccidem că sem
mnalul este prrezent
(ipoteza H1 este adevărată). Daccă x[0] este mai mic deecât ½ atuncci densitateaa de probabilitate
corespunzzătoare ipote
ezei H0 este mai
m mare decâât densitatea de probabilittate a ipotezeei H1 și decideem că
semnalul constant este
e absent (ipotteza H0 este adevărată).
a R egula de deciizie este:
(228
8)
e tipul I – P{H1 ; H 0 } = P{x[0] ≥ 1 / 2; H 0 } și eroare dee tipul II – P{H 0 ; H1} = P{x[0] < 1 / 2 H1} . Dacă
eroare de
declarăm:
- ip
poteza H1 ca adevărată,
a atunci când ipooteza H0 este aadevărată, co
omitem o ero
oare de tipul I,
- ip
poteza H0 ca adevărată, attunci când ipo
oteza H1 este adevărată, comitem o erooare de tipul II.
Probabilittățile corespu or două tipurri de eroare suunt egale cu aariile hașurate în figura 55
unzătoare celo 5.
Figu
ura 55. Vizualizzarea celor dou obabilitate de eroare prin arii hașurate în ccazul γ = 0,5 .
uă tipuri de pro
Într-adevăăr, probabilitaatea ca valoaarea eșantionului x[0] să fi e mai mică d decât ½ în cazzul ipotezei H1 este
egală cu integrală de la −∞ la 0,5 din densitate ea de probab ilitate coresp punzătoare ippotezei H1 adică cu
aria supraafeței de sub curba verde mărginită la dreapta de vverticala ridiccată prin punctul de abscissă 0,5
(marcată cu galben în figură). De assemenea, pro obabilitatea cca valoarea eșșantionului x[[0] să fie mai mare
decât ½ înî cazul ipote ezei H0 este egală
e din densitateea de probabilitate
cu integrală de la 00,5 la infinit d
corespunzzătoare ipote ezei H0 care este
e egală cu aria suprafeeței de sub grraficul funcțieei reprezentaată cu
violet limiitată la stîngaa de verticala ridicată prin punctul de a bscisă 0,5 (mmarcată cu turrcoaz în figurăă). Se
observă că cele două ariia sunt egale e deoarece ce ele două supraafețe corespu unzătoare sun nt identice.
Se observvă că aria gaalbenă a cresscut și că ariia turcoaz a scăzut față dde situația ddin figura 55.. Deci
probabilittatea de a co
omite erori de
d tipul I a sccăzut dar proobabilitatea dde a comite erori de tipu ul II a
crescut. Nu
N pot fi reduuse ambele tipuri de eroaare prin simplla modificaree a valorii praagului. Adoptând o
terminoloogie din RADAAR vorbim desspre:
9)
(229
Optimizarrea detecției se realizeazăă în acest cazz prin minimi zarea erorii d
de tip II. În aacest mod po
oate fi
maximizată valoarea probabilității
p de
d detecție co orectă:
(230
0)
În cazul considerat,
c re
epartițiile dattelor în cele două
d ipotezee sunt normaale. De aceeaa probabilitatea de
alarmă falsă se poate calcula
c ca
(231)
Probabilittatea de alarm
mă falsă repre bilitatea ca vaaloarea eșanttionului x[0] îîn cazul ipotezei H0
ezintă probab
e valoarea γ șși este numeric egală cu in
să fie mai mare decât pragul de deccizie care are ntegrala de laa γ la
∞ din de
ensitatea de probabilitate
e corespunzătoare ipotez ei H0 (care ccarespunde u
unei Gaussien
ne de
medie nulă). Această integrală
i ncție specială care se noteează cu Q(γ ) și care se găăsește
reprezintă o fun
ea 0,5 în 0 și are propriettatea Q(− x ) = 1 − Q(x ) . Fun
tabelată. Această funccție ia valoare ncția Q(x ) po
oate fi
place notată Φ(x ) respecctiv cu ajutorrul funcției ccompelmentaare de
exprimatăă cu ajutorul funcției Lap
otată erfc(x ) . Funcția lui Laplace este definită
eroare, no d ca
t2 2)
(232
x 1 −
Φ (x ) = ∫ e 2 dt
−∞ 2π
iar funcția complemen or este definită ca
ntară a erorilo
∞ 2 2 (233
3)
e (x ) = ∫
erfc e −t dt
x π
Relațiile de
d legătură dintre aceste trei
t funcții sunt
Q(x ) = 1 − Φ (x ) , (234
4)
1 ⎛ x ⎞ (235
5)
Q(x ) = erfc⎜⎜ ⎟⎟ ,
2 ⎝ 2⎠
și
( )
erfc(x ) = 2Q 2 x . (236
6)
5 se prezintăă graficul funccției lg{Q(x )} .
În figura 58
Reluăm exemplul
e de calcul
c al celoor două probaabilități de a larmă falsă șși de detecțiee corectă discutat.
Impunem o valoare a probabilității
p de alarmă fallsă de α prin :
PFA = Q(γ ) = α , 7)
(237
ul testului γ prin:
ecuație diin care se dettermină pragu
γ = Q −1 (α ) . (237
7)
Pentru α de valoare 0,001 se obțține de pe graficul
g funcțiiei Q −1 o valoare a pragului de decizzie de
3,0902, γ =qfuncinv(0
0.001)=3,0902
2. Probabilitaatea de deteccție corectă, PD, este datăă de probabilitatea
ca eșantio
onul x[0] să aibă
a o valoarre mai mare decât 3,09022, atunci cândd datele au rrepartiție stattistică
corepunzăătoare ipotezei H1. Aceaastă probabilitate este e gală cu inteegrala de la 3,0902 la ∞ din
densitatea de probabilitate normală de medie 1 (dacă considderăm că valo oarea constanntă a semnalului A
este egalăă cu 1) și de abatere stanndard 1 (daccă considerăm
m că dispersiia zgomotului perturbatorr este
egală cu 1):
1
∞ 1 ⎛ (t − 1)2 ⎞ (238
8)
PD = P{H1 ; H1} = P{x[0] ≥ 3,09; H1} = ∫ expp⎜ − ⎟dt .
2π ⎜ 2 ⎟
3,09 ⎝ ⎠
Făcând scchimbarea dee variabilă u=tt-1 se obține integrala din relația urmăătoare, care reprezintă valoarea
funcției Q în 3,0902-1
1. Aceasta estte (în conforrmitate cu grraficul funcțieei Q) de 1,833 înmulțit cu 10 la
puterea -2
2.
∞ 1 ⎛ u2 ⎞ (239
9)
PD = ∫ eexp⎜ − ⎟du = Q(2,09) ≅ 1,883 ⋅ 10 − 2 .
2π ⎜ 2 ⎟
2,09 ⎝ ⎠
Această valoare
v a prrobabilității de
d detecție corectă estee destul de mică. În consecință preezența
semnaluluui constant nu
n va fi detecctată prea co orect. Valoareea probabilităății de detecție corectă se mai
numește și puterea tesstului. Valoarrea probabilității de detecțție corectă po ută dacă detecctorul
oate fi crescu
dispune de
d mai multe eșantioane de d valoare cunoscută. În a cest caz, însăă, nu mai lucrrăm cu scalari ci cu
vectori N dimensionali. Ne putem pune întrebaarea dacă va loarea de maai sus pentru u probabilitatea de
detecție este
e tot ce se e poate obține ectorul dispu ne de N datee observate, {x[0], x[1],..., x[N − 1]}
e ? Dacă dete
situația se
e poate înbun
nătăți radical.
2.2. Ip
potezele teore
emei Neyman
n-Pearson
- egiunea critică,
re
fo
ormată din accei vectori N dimensionalii pentru caree se decide căă ipoteza H1 eeste adevărată (se
re
ejectează ipotteza H0) și
- re
egiunea R0,
fo
ormată din accei vectori N dimensionalii pentru caree se decide căă ipoteza H0 eeste adevărată (se
re
ejectează ipotteza H1).
Se constată că reuniun
nea regiunilorr R1 și R0 este chiar mulțim ea RN,
și că interrsecția regiunilor R1 și R0 esste mulțimea vidă,
nunțul teorem
2.3. En mei Neyman--Pearson
p(x; H1 ) 2)
(242
L(x ) = > γ , x fixxat dar oareccare.
p(x; H 0 )
Pragul tesstului, γ , este
e soluția ecuaației,
F = PD + λ(PFA − α ) . (244)
unde λ reprezintă multiplicatorul lui Lagrange. Exprimând în formă integrală cele două probabilități: PD
și PFA , lagrangeanul ia forma:
⎛ ⎞ (245)
F = ∫ p (x; H1 )dx + λ⎜ ∫ p (x; H 0 )dx − α ⎟ ,
⎜R ⎟
R1 ⎝ 1 ⎠
sau, ținând seama de liniaritatea operației de integrare:
p(x; H1 ) (249)
x ∈ R1 și > −λ ,
p(x; H 0 )
sau, ținând seama de definiția raportului de plauzibilitate din relația (242):
1 ⎧⎪ (x[0] − 1)2 ⎫⎪
exp⎨− ⎬
p (x; H1 ) 2π ⎪⎩ 2 ⎪⎭
L(x ) = = . (253)
p(x; H 0 ) 1 ⎧⎪ (x[0])2 ⎫⎪
exp⎨− ⎬
2π ⎪⎩ 2 ⎪⎭
În conformitate cu teorema Neyman-Pearson, se decide că ipoteza H1 este cea corectă, dacă:
1 ⎧⎪ (x[0] − 1)2 ⎫⎪
exp ⎨− ⎬ (255)
2π ⎪⎩ 2 ⎪⎭
>γ.
⎪⎧ (x[0]) ⎫⎪
2
1
exp ⎨− ⎬
2π ⎪⎩ 2 ⎪⎭
În urma efectuării calculelor, condiția pe baza căreia decidem că ipoteza H1 este adevărată devine:
exp{x[0] − 1 / 2} > γ .
(256)
Logaritmând, obținem valoarea pragului de detecție γ' :
1 ⎧⎪ x 2 [0]⎫⎪ (259)
p(x[0]; H 0 ) = exp⎨− ⎬.
2π ⎪⎩ 2 ⎪⎭
Înlocuind această expresie în expresia probabilității de alarmă falsă (din relația (258)) obținem:
PFA = ∫
∞ 1
2π
( )
exp − x 2 [0]/ 2 dx[0] = Q (γ ') = 0,001 .
(260)
γ'
Se constată că integrala pe care trebuie să o calculăm este egală cu valoarea funcției Q în punctul γ' .
Folosind graficul inversei funcției Q obținem pentru γ' valoarea de 3,09. Aceeași valoare a pragului de
detecție a fost obținută și mai devreme când am făcut calculul probabilităților de alarmă falsă și de
detecție corectă. În consecință am verificat teorema Neyman-Pearson pe un exemplu.
( )
Dacă x : ℵ μ, σ 2 , atunci P(x > γ ') = Q⎜
⎛ γ '−μ ⎞
⎝ σ ⎠
⎟ (261)
Pentru a demonstra această propoziție, exprimăm probabilitatea de depășire a pragului γ' P(x > γ ') cu
integrala de la valoarea pragului la infinit din densitatea de probabilitate Gaussiană de medie μ și
dispersie σ 2 ,
⎧⎪ (x − μ )2 ⎫⎪
∞ 1
P ( x > γ ') = ∫
exp ⎨− ⎬dx . (262)
γ ' 2πσ ⎪⎩ 2σ 2 ⎪⎭
x −μ
Facem schimbarea de variabilă u = , obținem o nouă integrală:
σ
∞ ⎧⎪ (u )
1 2 ⎫⎪
P ( x > γ ') = ∫exp ⎨− ⎬du . (263)
(γ '− μ ) / σ 2 π ⎪⎩ 2 ⎪⎭
care este egală cu funcția Q de argument (γ '−μ ) / σ ,
⎛ γ '−μ ⎞ (264)
P ( x > γ ') = Q ⎜ ⎟,
⎝ σ ⎠
(c.c.t.d).
În continuare dăm al doilea exemplu de aplicare a teoremei Neyman-Pearson. De data aceasta pentru
detecția semnalului constant din date afectate aditiv de zgomot Gaussian avem la dispoziție N
eșantioane cunoscute. Ipotezele legate de absența respectiv prezența semnalului se formulează ca:
Vectorul de N eșantioane de zgomot este repartizat normal cu media statistică nulă și matricea de
covarianță ca în (265). Cu I u s-a notat matricea unitate (care are elementele de pe diagonală de valoare
1 și toate celelalte elemente de valoare 0). Media statistică a datelor în ipoteza H0 este zero:
H 0 : μ = [00...0 ]T = 0 , (266)
iar media datelor în ipoteza H1 este proporțională cu vectorul coloană care are toate elementele egale
cu A:
H1 : μ = [AA... A]T = A1 . (267)
Maricea de covarianță a zgomotului este egală cu σ 2 I u . Rezultă că repartițiile vectorilor de date, în cele
două ipoteze sunt:
H 0 - x : ℵ⎛⎜ 0, σ 2 I u ⎞⎟ (268)
⎝ ⎠ .
H1 - x : ℵ⎜ A1, σ I u ⎞⎟
⎛ 2
⎝ ⎠
Datele sunt distribuite după o lege Gaussiană de medie nulă și de varianță egală cu covarianța
zgomotului în cazul ipotezei H0 respectiv după o lege Gaussiană de medie A1 și de aceeași varianță în
cazul ipotezei H1. Ipoteza H0 presupune ca valoarea medie statistică a variabilei aleatoare N
dimensională care descrie datele să fie egală cu vectorul nul iar ipoteza H1 presupune ca valoarea medie
statistică a variabilei aleatoare N dimensională care reprezintă datele să fie egală cu produsul A1.
H0 : μ = 0 (269)
H1 : μ = A1
.
Ținând seama de expresiile densităților de probabilitate din cele două ipoteze, putem calcula raportul de
plauzibilitate și să punem condiția ca să fie mai mare decât pragul de detecție, γ
1 ⎧ 1 N −1 2⎫
exp⎨− ∑ (x[n] − A) ⎬
L(x ) =
p(x; H1 )
=
(2πσ 2 N/2
) 2
⎩ 2σ n = 0 ⎭
> γ, (270)
p(x; H 0 ) 1 ⎧ 1 N −1 2⎫
exp⎨− ∑ (x[n]) ⎬
(2πσ 2
N / 2
) 2
⎩ 2σ n = 0 ⎭
adică:
⎧ 1 ⎡ N −1 N −1
2 ⎤⎫ (271)
exp⎨−
2 ⎢− 2 A ∑ x[n] + ∑ A ⎥ ⎬ > γ .
⎩ 2σ ⎣ n=0 n=0 ⎦⎭
Logaritmând în ambii membri se obține inecuația:
1 ⎡ N −1 ⎤ (272)
− ⎢ − 2 A ∑ x[n] + NA 2 ⎥ > ln γ .
2
2σ ⎣ n=0 ⎦
Separând în membrul stâng suma eșantioanelor de date se obține
A N −1 NA 2 (273)
∑ x[n] > ln γ + ..
σ2 n=0 2σ 2
Împărțind în ambii membri cu cantitatea pozitivă NA / σ 2 se obține în final că media eșantion a datelor
trebuie să fie mai mare decât un prag γ' :
1 N −1 σ2 A (274)
x= ∑ x[n] > ln γ + = γ ' .
N n=0 NA 2
În cazul în care media eșantion este mai mare decât pragul γ' se decide că semnalul constant este
prezent iar în caz contrar se decide că semnalul constant este absent. Ajustând valoarea pragului se
fixează valoarea probabilității de alarmă falsă și respectiv a probabilității de detecție corectă. Arătăm în
continuare cum se poate face această ajustare, calculând cele două probabilități. În cazul mediei
eșantion, T (x ) = x , statistica T (egală cu media eșantion) are o repartiție Gaussiană. Calculăm mediile și
dispersiile statisticii T în cele două ipoteze. În ipoteza H0, semnalul constant este absent și trebuie să
calculăm media statistică (E) a mediei eșantion a zgomotului Gaussian. Media statisticii T în cazul
ipotezei H0 este:
⎧ 1 N −1 ⎫ 1 N −1 (275)
E{T (x ); H 0 } = E ⎨ ∑ w[n]⎬ = ∑ E{w[n]} = 0 ,
⎩ N n=0 ⎭ N n=0
deoarece operatorul de mediere statistică este liniar comutând cu constanta 1/N și cu suma. Întrucât
media statistică a zgomotului este 0 rezultă că media statistică a statisticii T în ipoteza H0 este egală cu 0.
⎧ 1 N −1 ⎫ 1 N −1 σ2 (276)
Disp{T (x ); H 0 } = Disp ⎨ ∑ w[n ]⎬ = 2 ∑ Disp{w[n]} = .,
⎩ N n=0 ⎭ N n=0 N
Calculul dispersiei statisticii suficiente T revine la a calcula dispersia mediei eșantion a zgomotului și este
egală cu media statistică a pătratului mediei eșantion, care este egală cu suma pătratelor dispersiilor
fiecărui eșantion de zgomot împărțită la N 2 . Se obține valoarea σ 2 / N . Valoarea medie statistică a
statisticii T în ipoteza H1 este egală cu media statistică a mediei eșantion a datelor obținute prin
adunarea la constanta A a zgomotului w,
⎧ 1 N −1 ⎫ 1 N −1 (277)
E{T (x ); H1} = E ⎨ ∑ ( A + w[n])⎬ = ∑ E{A + w[n]} = A .
⎩ N n=0 ⎭ N n=0
Datorită liniarității operatorului de mediere statistică se obține suma mediilor statistice ale
esantioanelor A+w[n] împărțită la N, care este egală cu A. În sfârșit, dispersia statisticii T în cazul ipotezei
H1 este egală cu σ 2 / N ,
⎧ 1 N −1 ⎫ σ2 (278)
Disp{T (x ); H1} = Disp ⎨ ∑ ( A + w[n])⎬ = ... = .
⎩ N n =0 ⎭ N
În ambele ipoteze statistica T este normală cu dispersia de valoare σ 2 / N . În cazul ipotezei H0, valoarea
medie a statisticii T este 0 iar în cazul ipoezei H1, valoarea medie a statisticii T este A:
.
T (x ) :
( )
ℵ 0, σ 2 / N în ipoteza H 0 . (279)
ℵ(A, σ / N )
2
în ipoteza H1
Pentru determinarea probabilităților de alarmă falsă și de detecție corectă, putem aplica relația (261). În
cazul probabilității de alarmă falsă, așa după cum se vede în relația următoare, trebuie să folosim
ipoteza H0, în care valoarea medie este μ = 0 iar abaterea standard este σ2 / N ,
⎛ γ '−0 ⎞
PFA = P{T (x ) > γ '; H 0 } = Q⎜ ⎟=α. (280)
⎜ 2 ⎟
⎝ σ /N ⎠
În consecință valoarea probabilității de alarmă falsă este Q(γ ' N / σ ) . Impunând valoarea α pentru
probabilitatea de alarmă falsă se poate calcula valoarea pragului de detecție γ ' . Se calculează
probabilitatea de detecție corectă pe baza statisticii T din cazul ipotezei H1. În acest caz valoarea medie
este A.
⎛ γ '− A ⎞
PD = P{T (x ) > γ '; H1} = Q⎜ ⎟. (281)
⎜ 2 ⎟
⎝ σ /N ⎠
S-a obținut Q(N (γ '− A) / σ ) , în care trebuie să înlocuim pragul de detecție γ ' cu valoarea determinată
anterior. Valoarea pragului de detecție poate fi determinată ca funcție de probabilitatea de alarmă falsă
folosind relația (280):
σ 2 −1
γ' = Q (PFA ) . (282)
N
Valoarea corespunzătoare a probabilității de detecție corectă rezultă substituind (282) în (281) și este,
⎛ NA 2 ⎞⎟
PD = Q⎜⎜ Q −1 (PFA ) −
σ 2 ⎟⎠
= (
Q Q −1
( PFA ) − )
ENR ; ENR =
NA 2
σ2
, (283)
⎝
în care intervine raportul dintre NA2 care reprezintă energia celor N eșantioane de semnal util și σ 2 ,
care reprezintă puterea zgomotului. Acest raport reprezintă deci raportul dintre energia semnalului util
și puterea zgomotului, motiv pentru care a fost notat cu ENR (Energy to Noise Ratio). El este de fapt
raportul semnal pe zgomot (SNR).
De aseme enea, se obse ervă că pentrru o valoare fixată a probbabilității de alarmă falsă,, probabilitatea de
detecție corectă
c crește
e cu creștereea ENR. De exxemplu pent ru o probabilitate de alarrmă falsă de 0,001
(curba roșie), la o valo oare a ENR ded 14 dB (carre corespund e la o valoarre liniară de 2 25,12) se obțține o
probabilittate de detecție corectă de 0,975, iar la o valoarre a ENR dee 16 dB se o obține o valo oare a
probabilittății de detecțție corectă de
e 1.
A și că σ 2 =1,
Dacă conssiderăm că A=1 = atunci penntru N=1 obțținem un ENR R de 0 dB. Daacă considerăăm că
probabilittatea de alarmă falsă este nci obținem o probabilitaate de detecțție corectă de 0,4.
e de 0,1 atun
Dacă considerăm că N=10,
N atunci, pentru aceeleași valori aale A și σ 2 obținem un ENR de 10. La o
probabiltaate de alarm
mă falsă de 0,1 obținem o probabilitatte de detecțție corectă dee 0,975. Decci prin
creșterea lui N poate fi crescută mu
ult valoarea probabilității dde detecție co
orectă.
2.7.Proble
ema repartițiilor Gaussiene de valori medii statisticee diferite
Observând repartițiile statisticii T din problema pe care tocmai am studiat-o putem să o generalizăm la
problema repartițiilor Gaussiene cu valori medii diferite,
ℵ⎛⎜ μ 0 , σ 2 ⎞⎟ în ipoteza H 0
T: ⎝ ⎠ ; μ1 > μ 0 . (284)
⎛ 2 ⎞
ℵ⎜ μ1, σ ⎟ în ipoteza H1
⎝ ⎠
Atât repartiția din cazul ipotezei H0 cât și repartiția din cazul ipotezei H1 sunt normale, de aceeași
dispersie, dar de medii diferite, cu μ1 mai mare decât μ 0 . Se calculează valoarea statisticii T (care era
media eșantion în exemplul analizat anterior) și se compară rezultatul obținut cu un prag, γ ' . Dacă
valoarea statisticii T depășește pragul atunci se decide că ipoteza H1 este corectă iar în caz contrar se
decide că ipoteza H0 este corectă. Probabilitatea de alarmă falsă se calculează în cazul problemei
repartițiilor Gaussiene cu valori medii diferite ca în relația următoare:
⎛ γ '−μ 0 ⎞ (285)
PFA = P (T > γ '; H 0 ) = Q⎜ ⎟=α. .
⎝ σ ⎠
Impunând o anumită valoare pentru probabilitatea de alarmă falsă rezultă valoarea corespunzătoare a
pragului de decizie,
γ '−μ 0 (286)
= Q −1 (PFA ) ⇒ γ ' = μ 0 + σQ −1 (PFA ) .
σ
Probabilitatea de detecție corectă se calculează cu relația:
⎛ γ '−μ1 ⎞ (287)
PD = P (T > γ '; H1 ) = Q⎜ ⎟.
⎝ σ ⎠
în care se substituie valoarea pragului de detecție obținută anterior,
⎛ μ − μ0 ⎞ (288)
PD = Q⎜ Q −1 (PFA ) − 1 ⎟.
⎝ σ ⎠
Probabilitatea de detecție corectă poate fi calculată și în funcție de coeficientul de deflexie. Ținând
seama de faptul că mediile statisticii T în cele două ipoteze sunt egale cu μ1 și μ 2 și că dispersia
statisticii T este în ambele ipoteze egală cu σ 2 , valoarea coeficientului de deflexie pentru problema
repartițiilor Gaussiene cu medii diferite devine:
d2 =
(E{T ; H1} − E{T ; H 0 })2 = (μ1 − μ 0 )2 . (289)
Disp{T ; H 0 } σ2
Ținând seama de faptul că ultimul termen din argumentul funcției Q din (288) este tocmai d, această
probabilitate de detecție corectă poate fi pusă în forma:
PD = Q⎛⎜ Q −1 (PFA ) − d 2 ⎞⎟ .
(290)
⎝ ⎠
Întrucât Q(x)
Q este o funcție
f descrrescătoare se
e constată căă probabilitattea de deteccție corectă ccrește
odată cu creșterea
c lui d,
d așa cum se
e vede în figurra 60.
orul
2
Figura 60 orectă PD de faactorul de deflexie d
0. Dependența probabilității de detecție co (măsurat în dB), peentru
obabilității de alarmă falsă PFA în cazul reppartițiilor Gausssiene de valorri medii diferite.
diferitte valori ale pro