Sunteți pe pagina 1din 15

Terminologia de procesrii digitale a semnalelor

Semnale i grafice
n literatura de limba englez acest domeniu este referit prin DSP - Digital Signal
Processing.
Un semnal este o descriere a modului n care un parametru este dependent de un
alt parametru. De exemplu, cel mai des ntalnit tip de semnal n electronica analogic este
o tensiune care depinde de timp. Deoarece ambii parametrii pot acoperii un interval
continuu de valori, acest tip de semnal il vom numi semnal continuu. n contrast,
trecerea acestui semnal printr-un convertor analog digital foreaz quantizarea ambilor
parametrii. Spre exemplu, dac conversia se face cu un convertor de 12 biti la o rat de
de 1000 de eantioane pe secund, tensiunea va putea lua doar 4096 valori posibile, iar
timpul este definit doar la incremente de o milisecund. Semnalele formate din parametrii
care sunt cuantizai n acest mod se numesc semnale discrete sau semnale digitale. Sunt
de asemenea posibile semnale la care unul dintre parametrii este continuu iar cellalt este
discret. ntruct acest gen de semnale sunt rar folosite ele n-au primit un nume explicit. n
aceste cazuri tipul celor dou semnale trebuie precizat explicit.
Figura 2.1 prezint dou semnale aa cum ar putea rezulta dintr-un sistem de
achiziii de date.

Fig. 2.1.
Axa vertical poate reprezenta tensiunea, intensitatea luminii, presiunea sunetului, sau
oricare alt mrime despre care deinem aceast informaie. Deoarece nu tim ce
reprezint n acest caz particular, i vom da numele generic: amplitudine. Acest parametru
este apelat i cu alte denumiri precum: axa y, variabila dependent, gama sau ordonata.
Axa orizontal reprezint cellalt parametru al semnalului, care are i el diferite
denumiri precum: axa x, variabila dependent, domeniu sau abscisa. Timpul este cel mai
des ntlnit parametru pe axa orizontal a unui semnal achiziionat. Cu toate acestea se
pot ntlni i alte mrimi fizice pe aceast ax. Spre exemplu, geofizicienii pot achiziiona
semnale referitoare la densitatea unei roci la distane echidistante pe suprafaa
pmntului. Pentru a pstra lucrurile la un grad ridicat de generalitate noi vom denumi
axa orizontal: numr eantion. Dac acesta ar fi fost un semnal continuu aceeast axa ar
fi fost denumit corespunztor: timp, distan, x, etc.

1
Cei doi parametrii care formeaz un semnal sunt de regul neinterschimbabili.
Parametrul de pe axa y (variabila dependent) se spune c este o funcie de parametrul de
pe axa x (variabila independent). Cu alte cuvinte, variabila independent descrie cum i
cnd fiecare eantion este prelevat, n timp ce variabila dependent reprezint valoarea
msurat efectiv. O caracteristic a acestor reprezentri funcionale este c unei valori de
pe axa x i este ntotdeauna asociat o valoare pe axa y. Reciproca nu este adevrat
ntotdeauna.
Trebuie acordat o atenie particular cuvntului domeniu, un foarte larg utilizat termen
n DSP. Spre exemplu, un semnal care utilizeaz drept variabil independent timpul, se
spune c aparine domeniului timp (time domain). O alt clas de semnale usuale n
DSP utilizeaz frecvena ca variabil independent, rezultnd termenul de domeniu
frecven (frequency domain). Analog, semnalele care utilizeaz distana drept parametru
independent aparin domeniului spaial (spatial domain). n concluzie tipul parametrului
de pe axa orizontal reprezint domeniul acelui semnal.
Dei semnalele din Fig. 2.1 sunt discrete, ele sunt reprezentate n aceast figur
prin linii continue. Aceasta deoarec exist prea multe eantioane apropiate pentru a fi
percepute ca separate. n graficele unor semnale scurte, s zicem 100 de eantioane,
marcherii eantioanelor se pot vedea separat. Linii continue care s conecteze aceti
marcheri pot fi sau nu trasate ntre marcherii consecutivi, dup cum autorul graficului
dorete sau nu acest lucru.
Variabila N este larg utilizat in DSP pentru a reprezenta numrul total de
eantioane ale unui semnal. Spre exemplu, pentru semnalul din Fig. 2.1. N = 512. Pentru
a pstra datele n ordine, fiecrui eantion i este atribuit un numr, numit uneori index.
Aceste numere sunt cele ce apar de-a lungul axei orizontale. Dou notaii sunt de regul
folosite pentru atribuirea numerelor de eantion. n prima notaie indexul eantioanele
merge de la 1 la N (de exemplu de la 1 la 512). A doua notaie, indexul merge de la 0 la
N-1 (de ex., de la 0 la 511). Matematicienii o folosesc de regul prima notaie, n timp ce
n DSP este folosit mai mult a doua notaie. Aceast dubl notaie poate crea uneori
probleme. De aceea un bun obicei atunci cnd sunt parcurse diferite materiale este
identificarea nc de la nceput a notaiei pe care o folosete autorul respectivului
material. n literatura de limb englez pentru desemnarea celor dou notaii de folosesc
termenii: one based index, respectiv zero based index.

Media i abaterea standard


Media (mean), notat cel mai adesea cu , este numele prescurtat a ceea ce
statisticienii numesc valoare medie (average value) a valorilor luate de o variabil
aleatoare, definit cu ajutorul mediei aritmetice a tuturor eantioanelor disponibile
1 N
= N = xk .
N k=1
Pentru simplificarea scrierii vom utiliza bara superioar pentru desemnarea mediilor
aritmetice ale unor funcii de variabila aleatoare
1 N
f (x ) = f (x k ) .
N

N k =1

2
N
n acest sens, N = x .
n electronic, media unui semnal este numit componenta continu a semnalului
(Direct Current DC). Similar, AC (alternating current) se refer la modul n care
fluctueaz un semnal n jurul valorii sale medii. Dac semnalul are o form de und
simpl, precum unda sinusoidal sau ptrat, pentru a msura excursia acestui semnal se
folosete amplitudinea vrf la vrf ( peak-to-peak amplitude).

Fig. 2.2. Raportul dintre amplitudinea vrf la vrf i abaterea standard pentru cteva
forme de und comune. Pentru unda ptrat, acest raport este 2; pentru unda
triunghiular este 12 3.46 ; pentru unda sinusoidal este 2 2 2.83 , n timp ce
pentru o und aleatoare nu are un raport exact. n funcie de distribuia acestui
semnal acest poate lua diferite valori de regul ntre 6 i 8.
n practic, calculul mediei se poate face chiar n timpul colectrii datelor (fie
printr-un proces de achiziie a datelor, fie de calcul, al doilea caz fiind specific
modelrii). Rata cu care sunt obinute datele poate fi mare astfel nct, n scurt timp,
volumul datelor ajunge impresionant i stocarea lor devine o problem chiar i pentru
calculatoare performante din acest punct de vedere. De aceea se prefer estimarea
dinamic a mediilor (running averaging) fr ns a se reine toate aceste valori. Aceste
lucru este posibil dac se remarc relaia de recuren ce leag dou medii consecutive
mm + x m+1 = (m + 1)m+1 .
Aceast relaie arat c, pentru calculul mediei curente, este necesar memorarea
m e d i e i a n t e r i o a r e , a n u m r u l u i d e e a n t i o a n e i cunoaterea u l t i m e i
v a l o r i luat de variabila aleatoare.
Abaterea medie (average deviation). Evident, expresia x k arat ct de mult se
abate (deviates) valoarea x k de la medie. Media aritmetic a acestor abateri reprezint,
cum este de ateptat, abaterea medie. n multe cazuri, parametrul important nu este
abaterea de la medie, ci puterea acetei abateri. Spre exemplu, atunci cnd semnale de
zgomot aleator afecteaz un circuit electronic, puterea zgomotului resultat este suma

3
puterilor semnalelor individuale. Prin urmare mrimi legate de amplidudinea semnalelor
componente caracterizeaz mai slab astfel de semnale. De aceea n locul abaterii medii
este folosit abaterea standard atunci cnd se dorete o informaie medie legat de
amplitudinea unui semnal.
Abaterea standard (standard deviation) sau eroarea ptratic medie este
rdcina ptrat a mediei aritmetice a ptratelor abaterilor de
la medie.
1 N
N = (x k )2 .
N 1 k =1
Abaterea standard este o msur a distanei pn la care variabila aleatoare
(semnalul) fluctueaz fa de medie deci a dispersiei. Observm n expresia de mai sus o
neconcordan, n loc de N s-a luat N-1. Aceasta apare din urmtorul motiv: la momentul
n care noi estimm abaterea standard nu cunoatem media adevrat , ci numai o
estimare a sa n acel moment. Aceasta conduce la o subevaluare a abaterii standard. De
aceea, pentru valori mici ale lui N este bine s se mpart la N-1 n loc de N pentru a
compensa aceast diferen. Evident la valori mari ale lui N diferena ntre cele dou
estimri nu mai conteaz.
Estimarea dinamic a abaterii standard beneficiaz i ea de o relaie ce permite
estimarea dinamic a sa. ntr-adevr, suma de sub radical se poate scrie
N N N

(x k N ) = x k2 2N x k + mN2 ,
2

k =1 k =1 k =1

N
cum ns x
k =1
k = mN rezult

1 N 2 1 N
2
1 suma 2
= k k =
2
x x suma ptratelor .
N k =1 N 1 N
N
N 1 k =1

Prin urmare, calculul abaterii standard curente necesit memorarea a trei numere:
s u m e i , a s u m e i p t r a t e l o r , a n u m r u l u i e a n t i o a n e l o r i cunoaterea
u l t i m e i v a l o r i luat de variabila aleatoare.
Mrimea 2 este cunoscut n statistic sub numele de varian sau dispersie. n
teoria semnalelor, variana reprezint puterea acestor fluctuaii de la valoare medie a
semnalului. ntr-adevr, puterea medie disipat de un semnal de tensiune U(t ) a crui
component alternativ (alternative current AC) este u(t ) pe un rezistor R este

1 u2 (t )
T
T
P = dt .
T0 R

ns media din formula precedent se calculeaz pe baza eantioanelor discrete colectate


cu perioada h pe un interval temporal de lungime T = Nh , spre exemplu. Dac se
consider un rezistor de valoare unitar R = 1 i se noteaz eantioanele tensiunii U(t ) cu
x k formula de mai nainte conduce imediat la definiia dat varianei.

4
Folosind notaiile prescurtate ale mediilor variana se poate scrie sub forma

()
2 = x 2 x .
2

O alt mrime legat de varian este rdcina mediei ptratelor (root-mean-


square rms) definit prin

1 N 2
rms(x ) = xk = x 2 .
N k =1

Prin definiie, abaterea standard msoar doar parte AC a unui semnal, n timp ce
rms msoar ambele componente (AC i DC). Evident, rms coincide cu abaterea
standard atunci cnd semnalul are medie nul.
n mecanic exist o alt semnificaie interesant a abaterii standard legat de
noiunea de raz de giraie. Prin definiie, raza de giraie este distana faa de axa de
rotaie unde ar trebui concentrat toat masa corpului pentru a da acelai moment de
inerie fa de acea ax [HRI 82, p. 108]. Astfel, pentru un corp constituit din N puncte
materiale de mase mk plasate la distane rk de axa de rotaie, raza de giraie este

1 N
Rg =
m k =1
mkrk2 ,

N
unde m = mk este masa total.
k =1
Considerm acum corpul constituit din N mase elementare toate egale cu unitatea,
plasate pe o singur dreapt. ntr-un reper liniar, definit pe suportul punctelor materiale,
poziiile punctelor materiale sunt precizate prin coordonatele x k , iar poziia centrului de
mas prin coordonata . Alegem drept ax de rotaie o dreapt perpendicular pe
suportul punctelor materiale ce trece prin centrul de mas al corpului. Dac distanele
particulelor la aceast ax sunt rk = x k rezult imediat c raza de giraie coincide cu
definiia abaterii standard.
Atunci cnd setul de date provine dintr-un proces de msurare asupra valori unei
mrimi fizice, media reprezint o e s t i ma r e a v a l o r i i m r i mi i m s u r a t e , iar
abaterea standard caracterizeaz procesul de msurare calificnd precizia cu s-au
efectuat msurrile.
n figura 2.3a este reprezentat evoluia mediei dinamice ctre media adevrat n
cazul unei variabile cu repartiie uniform (U) n intervalul [0,1), iar n figura 7b evoluia
varianei dinamice ctre variana aceleiai variabile.

5
0.7
0.15
0.6

0.5 0.10

2
k
k

0.4
x

0.05
0.3

0.2
0.00
0.1 0 100 200
0 100 200 kk
k
(a) (b)

Fig. 2.3. Evoluia: (a) mediei dinamice ctre media unei variabile cu repartiie
uniform n intervalul [0,1); (b) varianei dinamice ctre variana aceleiai
variabile.
n anumite situaii, media caracterizeaz rezultatul unei msurri (n esen
valoarea msurat a unei mrimi), n timp ce abaterea standard caracterizeaz zgomotul i
alte elemente perturbatoare ce pot afecta procesul de msurare. n aceste situaii, abaterea
standard nu este important prin ea nsei ci prin comparaie cu media. Aa a fost ntrodus
termenul de raport semnal zgomot (signal-to-noise-ratio SNR).
n teoria semnalelor avem de a face cu alt situaie: un semnal lent variabil n
timp, peste care este suprapus un zgomot, a crei variaie este mai rapid dect a
semnalului. n aceast situaie, medierea (actul de msurare propriuzis) se face pe un
interval de timp intermediar, adic suficient de lung pentru a atenua zgomotul ns
suficient de scurt pentru a surprinde variaia lent a semnalului. Acestui domeniu i este
propriu termenul de raport semnal zgomot, care este egal cu me d i a mp r i t l a
abaterea standard
x
SNR (x ) = .
x
Simultan cu SNR coexist termenul coeficient de variaie (coefficient of variation
CV) definit prin
x
CV (x ) = .
x
n mod clar cei doi termeni calific acelai lucru. Un proces de msurare corect
presupune o valoare mare a SNR (sau o valoare mic a CV).
Evoluia mrimilor statistice dinamice ctre valorile adevrate
Staionaritate. Un fenomen (proces) este considerat staionar dac proprietile
statistice ale sale sunt aceleai oricare ar fi originea timpului. Considerm necesare
cteva comentarii referitor la aceast definiie. n fapt, toate informaiile despre un sistem
(fenomen) pe care experimentul la furnizeaz cercettorului sunt limitate la timpul ct
dureaz experimentul. n esen, un experiment nseamn colectarea mai multor seturi de

6
date referitoare la una sau mai multe mrimi fizice. Ipoteza staionaritii presupune
identitatea tuturor proprietilor statistice ale seturilor de date colectate ntr-un
experiment.
Prin definiie, un proces care nu satisface ipoteza anterioar este nestaionar.
Realitatea experimental este crud. Dintr-o multitudine de cauze, nu prea exist
procese staionare. Rezult c un proces staionar este un proces ideal din categoria
multor concepte ideale din fizic (vezi de exemplu conceptul de ciclul Carnot).
Deosebim dou surse primare de nestaionaritate. Prima se refer chiar la
nestaionaritatea fenomenului de studiat, iar a doua la nestaionaritatea procesului de
msurare.
Nestaionaritatea fenomenului de studiat (ca i a procesului de msurare) poate fi
proprie (sau intrinsec) sau indus de interacia cu mediul exterior.
De aceea, o bun parte din efortul unui experimentator este focalizat ctre
aducerea interaciei sistemului investigat cu exteriorul la un nivel ct mai sczut prin
ecranri, stabilizri, izolri, etc., scopul acestui demers fiind izolarea fenomenului de
studiat i a procesului de msurare de influenele mediului exterior.
Odat realizat acest deziderat rmn n studiu fenomenele nestaionare intrinseci.
O situaie experimental ntlnit des este urmtoarea. Din investigaii prealabile
se cunosc constantele de timp ale proceselor nestaionare. Exist dou situaii
experimentale limit. (i) Pentru procese nestaionare cu constant mare de timp
experimentatorul va cuta s obin o cantitate ct mai mare de date ntr-un timp ct mai
mic n comparaie cu constanta de timp a procesului nestaionar. (ii) Dac
nestaionaritile au constant de timp mic ele se vor trata ca fluctuaii ale mrimilor de
interes. n aceast situaie intervalul de timp de colectare a datelor va fi mult mai mare
dect perioada "fluctuaiilor" procesului nestaionar. Scopul ambelor demersuri este
aducerea procesului de msurare ct mai aproape de un proces staionar. Un proces
experimentat n astfel de condiii se va numi evident cuasistaionar.
n concluzie, ideal pentru experimentator este obinerea unor date staionare din
indiferent ce conjunctur experimental s-ar afla. Nici un efort nu va fi prea mic pentru
atingerea acestui ideal.

y (k) = 0.5 / k0.75

0.1

Fig. 2.4.
|x k - |

0.01

= 0.5
1E-3
1 10 100
k
O alt situaie experimental este urmtoarea. La orice moment al achiziiei de
date pot fi calculate mrimile statistice cu datele deja disponibile (noi le-am numit
generic medii dinamice deoarece ele depind de timp, sau ceea ce e totuna, de numrul de

7
eantioane). Experimentatorul dorete s tie ct de aproape este media sa de media
adevrat. Pentru aceasta este nevoie de un estimator al abaterii maxime de la media
adevrat.
Spre ilustrare, reprezentm n figura 2.4 evoluia abaterii de la media adevrat
pentru media reprezentat n figura 2.3a. Ce constatm? Abaterea de la media adevrat
devine din ce n ce mai mic pe msur ce crete numrul eantioanelor. La marginea
superioar a datelor reprezentate n figura 2.4 este reprezentat funcia
0.5
y(k ) = .
k 0.75
Aceast funcie reprezint estimatorul gsit de noi, n acest caz particular, pentru abaterea
maxim de la mrimea adevrat.
Desigur, fiecrei medii i se poate asocia cte un estimator al abaterii maxime de la
medie. Pornind de la aceste observaii se poate defini eroarea tipic (typical error TE). n
esen ne ateptm ca dup un numr oarecare de msurri media obinut s difere de
media adevrat a procelului studiat. Mrimea ce caracterizeaz aceast eroare se
numete eroare tipic. n particular, pentru semnale aleatoare, eroarea tipic TE, dintre
media calculat folosind datele a N msurtori i media adevrat a procesului studiat
este dat de:

TE = .
N 1/ 2
Proprieti ale mediei i dispersiei.
Evident, media unei constante este chiar constanta
c = c.
Orice constant multiplicativ poate fi scoas factor n procesul de mediere
cx = cx
Media sumei a dou variabile aleatoare este egal cu suma mediilor
x+ y = x+ y.
Media produsului a dou variabile aleatoare este
x y = x y + cov ( x, y ) .
Atunci cnd cele dou variabile sunt independente rezult imediat
x y = x y.
Dispersia unei constante este nul.

()
c2 = c 2 c = 0 .
2

Un factor constant iese de sub operatorul dispersie ridicat la ptrat.


2
( )
2cx = (cx ) cx = c 2 2x .
2

8
Not. Statisticienii noteaz operatorul de mediere aplicat unei variabile aleatoare
x cu M ( x ) , ceea ce n notaiile noastre nseamn

M (x ) = x ,
n timp ce operatorul dispersie este definit prin
(
D ( x ) = M [x M ( x )] .
2
)
Noi am preferat notaia cu bar datorit simplitii scrierii.
Dispersia unei sume de dou variabile aleatoare este egal cu suma dispersiilor
celor dou variabile plus dublul covarianei lor.
2x + y = 2x + 2y + 2 cov ( x, y ) .
Deoarece
cov (ax, y ) = cov ( x, ay ) = a cov ( x, y ) ,
rezult generalizarea
2ax +by = a 2 2x + b 2 2y + 2ab cov ( x, y )

Corelaie, convoluie, covarian


Coeficientul de corelaie. Fie dou seturi de date provenind de la dou variabile
aleatorii {X}, {Y}. n analiza zgomotelor se dorete, spre exemplu, s se identifice gradul
n care dou semnale sunt afectate de aceeai surs de zgomot.
O metod de comparaie se poate obine presupunnd existena unei legturi de
proporionalitate ntre cele dou seturi de date, de exemplu de forma y x . Metoda
celor mai mici ptrate (least squares method) permite estimarea acestei constante de
proporionalitate prin minimalizarea sumei
N
S = (y k x k ) .
2

k =1

Minimul acestei sume n raport cu parametrul se caut rezolvnd ecuaia


S / = 0 . Rezult astfel
N N
= x k y k / x k2 .
k =1 k =1
Dac substituim aceast valoare a parametrului n suma precedent obinem

( ) y
N
Smin = 1 2 2
k ,
k =1

unde

N N N
= x k yk / x k2 y k2 ,
k =1 k =1 k =1

9
se numete coeficient de corelaie. Teorema Schwarz-Buniakovski, din matematica
elementar, arat c
2
N N N
x k y k x k2 y k2 ,
k =1 k =1 k =1
i prin urmare 0 1. Sintetic, coeficientul de corelaie este

xy
= .
2 2
x y
Atunci cnd = 0 se spune c cele dou procese sunt necorelate sau independente, iar
cnd = 1 corelaia este total ( = 1 i prin urmare x k = yk , k = 1,2,K,N ). Iat de ce, o
msur a gradului de proporionalitate a celor dou variabile o reprezint acest coeficient
de corelaie. Mai remarcm irelevana semnului acestui coeficient.
Covariana. Prin definiie covariana a dou seturi de valori luate de dou
variabile aleatoare este

cov (x, y ) =
1 N
( )( ) (
x k x yk y = x x y y .
N k =1
)( )
Pe baza celor prezentate pn acum, remarcm c
[cov (x, y )]2 2x 2y .
Evident, c o v a r i a n a c a l i f i c g r a d u l d e c o r e l a r e a l a b a t e r i l o r d e l a me d i e .
n electronic, acea parte a semnalului care reprezint abaterea de la medie se
numete component alternativ (alternative current AC).
Precizia i acurateea.
Precizia i acurateea sunt termeni utilizai pentru a descrie procese (sisteme i
metode) care msoar, estimeaz sau prezic valoarea adevrat pe care o mrime fizic o
are. Dup cum se cunoate, procesul de msurare furnizeaz o valoare msurat pe care
o dorim ct mai apropiat de valoarea adevrat. Prin urmare acurateea i precizia sunt
moduri de a descrie erorile care exist ntre aceste dou valori.
Acurateea specific a b a t e r e a valorii m s u r a t e de la valoarea
a d e v r a t a m r i mi i m s u r a t e .
Precizia reprezint o m s u r a d i s p e r s i e i v a l o r i l o r m r i mi i m s u r a t e
o b i n u t e n p r o c e s u l d e m s u r a r e . n procesul de msurare dou sisteme sunt
puse n interacie: (i) sistemul asupra cruia se efectueaz msurarea (furnizorul mrimii
de msurat) i (ii) sistemul care efectueaz msurarea.
Dispersia valorilor mrimii msurate i prin urmare precizia pot fi calificate
statistic n mai multe moduri. n prezent, cel mai utilizat calificator al preciziei l
constituie abaterea standard.

10
Deoarece valorile individuale obinute prin msurare pot diferi substanial una de
alta pot fi utilizate drept calificatori ai preciziei de msurare abaterea standard, SNR sau
CV, toate trei calificnd dispersia valorilor msurate (Fig. 2.5).
Pentru ilustrarea acestor definiii, am reprezentat n figura 2.5. histograma
valorilor luate de media dinamic reprezentat n figura 2.3a.
valoare
adevrat medie

acuratee

60
Fig. 2.5. Acuratee, precizie,
valoare adevrat.
40
precizie

20

0
0.45 0.50 0.55

Ponderi, funcii densitate de repartiie.


ntr-o histogram a unei variabile aleatoare discrete o anumit valoare x k apare
nk ori. n aceast situaie media variabilei se calculeaz cu
N

x n k k N
x= k =1
= x k pk ,
N k =1

unde N reprezint numrul de valori pe care le poate lua variabila aleatoare, iar raportul
pk = n k / N se numete ponderea cu care valoarea x k apare n spectrul de valori al
variabilei. Un exemplu de variabil cu spectru finit este rspunsul unui convertor analog
numerice CNA (Digital Analog Converter DAC) de 8 bii. Spectrul de valori al unui
astfel de convertor acoper 256 numere ntregi n gama 0..255.
n general, o variabil aleatoare este asociat unui fenomen (proces) staionar. n
aceast situaie ponderile p k tind, pentru un numr foarte mare de eantioane ale
variabilei aleatoare, ctre numere reale unice Pk , numite probabiliti de apariie a
valorilor x k .

n
Pk = lim k .
N N

Atunci cnd variabila aleatoare este cu variaie continu media se calculeaz
analog

11
x = xf ( x )dx ,
I

unde I este intervalul n care ia valori variabila aleatoare, iar funcia f ( x ) se numete
complet funcia densitate de repartiie/probabilitate (probability density/distribution
function pdf). Evident, pdf pstreaz semnificaia ponderii i de aceea uneori mai este
numit funcie pondere.
Dac notm cu P(X < x) probabilitatea ca variabila X s ia valori mai mici dect o
valoare x precizat funcia definit n acest fel
F (x ) = P( X < x ) ,
se numete funcie de repariie (cumulative distribution function cdf). Pe baza acestei
funcii este uor acum s definim pdf prin
dF ( x )
f (x ) = ,
dx
avnd semnificaia imediat: dac dF ( x ) este probabilitatea ca variabila aleatoare s ia
valori n intervalul ( x, x + dx ) , atunci f ( x ) este probabilitatea pe unitatea de lungime.

Teorema limit central


Semnalele obinute din procese aleatorii au de regul o foarte frumoas funcie de
distribuie. Aceasta este distribuia normal, sau distribuia Gauss, sau pe scurt
Gaussian. Motivul pentru care se ntmpl acest lucru este explicat de o teorem foarte
important: Teorema limit central.
Teorema limit central, n forma sa cea mai simpl afirm c o sum de numere
aleatoare devine normal distribuit pe msur ce crete numrul de numere aleatoare care
sunt adunate. De remarcat c teorema nu specific necesitatea ca numerele nsumate s
aparin unei legi de distribuie anume.
Distribuia normal (The normal distribution)
O variabil aleatoare, avnd media nul, are o distribuie/repartiie normal dac
funcia sa densitate este
f ( x ) = Ae x ,
2

unde A este constanta de normare, iar un parametru specific.


Constanta de normare se calculeaz imediat impunnd ca

Ae
x 2
dx = 1 .

Exist o foarte frumoas i util demonstraie a formulei de calcul a integralei de


mai sus. Se nmulesc dou astfel de integrale, una n variabil x iar cealalt n variabil y,
apoi se trece n coordonate polare

12
2
(x )dxdy =
I 2 ( ) = e dx e dy = e e
2 2 2
x y + y2 r 2
rdrd = .
0 0

Prin urmare, rezult A = / .


Distribuia normal mai este cunoscut sub numele de distribuie Gauss, sau
simplu Gaussian dup numele marelui matematician german Karl Friedrich Gauss
(1777-1855).
Generalizm aceast distribuie pentru o funcie a crei medie nu este nul
f ( x ) = / e ( x a ) .
2

S calculm media x

= x = / xe ( x a ) dx = a .
2

n vederea calculrii dispersiei s calculm i



1
x 2 = / x 2 e ( x ) dx =
2
+ 2 ,

2
de unde

2 = x 2 x () 2
=
1
2
.

Deci, n funcie de medie i dispersie gaussiana se poate scrie


( x )2
1
g ( x ; , ) = e 2 2
.
2

Momente iniiale i momente centrate


Se numete moment de ordinul s al unei variabile aleatoare X media
x kPk , X discret
k
(x a )s = M[(x a )s ] = ,
(x a ) f (x )dx,X continu
s


dac a = 0 obinem momentul iniial de ordinul s (pe care-l notm s ), iar dac a =
obinem momentul centrat de ordinul s (notat s ). n aceste notaii avem 1 = = x , i
2 = 2 = ( x ) . Legturile dintre ele se deduc imediat
2

1 = ( x ) = 0 ,
() 2
2 = 2 = x 2 x = 2 12 ,
3 = ( x ) = 3 3 21 + 3112 13 = 3 3 21 + 213 , etc.
3

13
n cazul distribuiei gauss momentele centrate capt expresia
( x )2
1
( )
2
s
s = x e 2 2
dx ,

n care efectum schimbarea de variabil x = 2t = t / h . Obinem astfel



1
t e
s t 2
s = dt ,
h s

care integrat o dat prin pri conduce la relaia de recuren


s = (s 1) 2 s 2 .
Cum 0 = 1 i 1 = 0 rezult toate momentele centrate impare nule 2k1 = 0 iar cele pare
sunt

2k =
(2k 1)! 2 k 2 .
2 k k!
Coeficientul de asimetrie i de aplatizare. Prin definiie coeficientul de asimetrie
(pe scurt, asimetria) al unei distribuii oarecare este definit ca
3
a= ,
3
iar coeficientul de aplatizare (excesul)
4
e= 3.
4
Din relaia de recuren specific distribuiei gaussiene rezult c ambii
coeficieni sunt nuli pentru o variabil aleatoare cu distribuie normal.
Generarea numerelor aleatoare n calculatoare numerice
Cea mai simpl distribuie care se poate implementa n diferite limbaje de
programare este distribuia uniform (uniform deviate) n intervalul [0,1) a crei funcie
de distribuie este
1, pentru x [0,1)
U (x ) = .
0, in rest
Pornind cu un numr ntreg, precizat ntr-un mod oarecare nainte de fiecare apel
(numit n literatura de limb englez seed - smn), rutina care genereaz numere
aleatoare (random number generator) utilizeaz relaia liniar de generare
RND = (aS + b ) mod c ,
unde a, b i c sunt constante ntregi alese convenabil. Numrul ntreg obinut astfel este
considerat mantisa unui numr real n reprezentarea virgul mobil. Se obine astfel un
numr real n intervalul [0,1). Modul cel mai uzual de a alege "smna" este utilizarea

14
constantei ntregi care memoreaz timpul curent nregistrat de ceasului calculatorului.
Acest mod de generare nu produce, din punct de vedere riguros matematic, secvene de
numere absolut aleatoare. Secvena de numere caracterizeaz o variabil
pseudoaleatoare. Spectrul acestei variabile este discret i depinde att de numrul de bii
alocai pentru un numr real n virgul mobil n calculator, precum i de (foarte
important) alegerea particular a numerelor a, b i c. Exist alegeri defectuase celebre
pentru cele trei constante. n principiul pentru numrul c trebuie ales un numr prim ct
mai mare. Cea mai rspndit alegere, considerat drept un generator standard minimal
este cea propus de Park i Miller [PAR 88]
a = 7 5 = 16807 , b = 0 i c = 2 31 1 = 2147483647
n unele variante de implementare a rutinei RND se utilizeaz o relaia de
recuren
RND = (aOLDRND + b ) mod c ,
iar utilizatorul precizeaz el care este numrul iniial.

15

S-ar putea să vă placă și