Sunteți pe pagina 1din 5

1.2.2.

Caracteristicile de baz ale variabilelor aleatoare Autor: Daniela FLOREA Pentru modelarea statistic a fenomenelor descrise de variabile aleatoare sunt folosite anumite mrimi statistice. Pentru nelegerea acestor caracteristici, este util definirea funciei de repartiie. Fie o variabil aleatoare X, un numr real xi i F(xi) probabilitatea ca X s ia valori mai mici dect x, adic F (x i ) = P ( X < x i ) . Funcia F definit prin ecuaia precedent poart numele de funcie de repartiie a variabilei aleatoare X. Dac X este o variabil discret avnd repartiia [x i , p(x i )] , pentru i = 0,1,2,..., atunci se poate scrie

F (x i ) = P {X x i } =

xi x

p X (x i )

sau n alte cuvinte, funcia de repartiie n punctual x este dat de suma probabilitilor valorilor n stnga lui x sau suma probabilitilor (frecvenelor relative) cumulate n sens cresctor. Avem:

F (x i + 0 ) =

j =0

p(x j ) , F (x i 0 ) =
i

i 1

j =0

p(x j ) i

P (a X < b ) = F (b ) F (a ) .

Trebuie reinut c, n cazul variabilelor aleatoare discrete, funcia de distribuie cumulat este o funcie n trepte care pornete de la valoarea x=0 cu valoarea p0. Valoarea maxim tinde la valoarea 1 corespunztoare lui xi=xmax. n cazul variabilelor de tip continuu, probabilitatea discret pi devine densitate ~ de probabilitate p X (x ) , iar variabila aleatoare X este definit astfel:
~ x X = p (x ) , X

iar semnul

devine integral

Dac se noteaz F (x ) funcia de distribuie, densitatea de probabilitate are proprietatea c dF (x ) , iar p X (x ) dx 0 , p X (x ) = dx rezult,

F (x ) =

p X (x ) dx ,

similar cu frecvena cumulat n sens cresctor,

P (x1 x 2 ) =

x2 x1

p X (x ) dx = F (x2 ) F (x1 ) , iar

p X (x ) = 1 similar cu

i =0

pi

=1.

Densitatea de probabilitate n acest caz este interpretat ca probabilitatea msurrii unei valori x n intervalul x = x 2 x1 . Aria total de sub curba densitii de probabilitate este unitar, iar probabilitatea msurrii este de 100%. 1.2.2.1. Indicatorii tendinei centrale Simpla analiz a valorilor variabilelor aleatoare pe baza frecvenelor i a graficelor ofer o imagine sumar asupra modului n care variaz valorile unei caracteristici statistice, fr a putea formula nici o ipotez privind tendina general a acestei. n vederea analizei trsturilor eseniale ale fenomenului studiat trebuie determinate anumite valori tipice reprezentative sub forma indicatorilor sintetici generalizatori. Tendina central reprezint punctul n jurul creia se grupeaz valorile variabilei aleatoare respective i necesit definirea mai multor tipuri de indicatori: 1. mrimile medii; 2. indicatorii medii de poziie numii i medii de structur. a). Media variabilei aleatoare X notat M(X) sau x n cazul concret al cercetrii experimentale. n cazul variabilelor aleatoare discrete,

M (X ) = x =

xi = 0

x i pi

n cazul variabilelor aleatoare de tip continuu,

M (X ) = x =

x p X (x ) dx

Dac media este definit ca moment, ea reprezint momentul teoretic necentrat de ordinul nti. Momentul teoretic necentrat de ordinul k este,

M k (X ) = M X k =

( )

p X (x ) dx .

b). Indicatorii medii de poziie sunt reprezentai de quantile i modul. Quantilele sunt valori concrete ale variabilei aleatoare care mpart graficul funciei de repartiie (graficul frecvenei cumulate n sens cresctor) n pri egale. Se numete quantila de ordinul , valoarea x astfel nct: F (x ) = P ( X < x ) = . n cazul n care X este o variabil aleatore discret egalitatea enunat nu poate fi asigurat pentru orice valoare a lui . Dac exist o soluie x a ecuaiei F (x ) = , exist o infinitate cuprinse n intervalul ce separ dou valori posibile. Quantila de ordinul poart numele de median teoretic a variabilei aleatoare X, notat 1 x me = . 2

Prin median se nelege acea valoare a argumentului variabilei aleatoare pentru care probabilitatea ca variabila aleatoare X s ia valori inferioare lui xme este egal cu probabilitatea ca s ia valori superioare lui xme. Matematic: P ( X < x me ) = P ( X > x me ) . Quantila de ordinul poart numele de quantila inferioar , iar cea de ordinul se numete quantila superioar. Modulul sau moda variabilei aleatoare discrete X, este acea valoare a argumentului xi pentru care funcia de probabilitate pX(xi) este maxim. O repartiie poate avea un singur modul fiind numit unimodal sau mai multe module, caz n care se numete multimodal. n cazul variabilei de tip continuu, modulul notat xmo reprezint valoarea lui x pentru care densitatea este maxim, deci dp X (x ) =0 dx dac funcia este derivabil. n general ecuaia are o singur soluie, deci repartiia este unimodal. dF (x ) Cum p X (x ) = , innd seama de relaia anterioar, rezult c modulul dx verific ecuaia

dF 2 (x ) =0. dx 2 Aceasta ne arat c n punctul x = x mo , graficul funciei de repartiie are un punct de inflexiune. 1.2.2.2. Indicatorii variaiei Indicatorii tendinei centrale nu dau nici o indicaie asupra mprtierii, respectiv a modului n care valorile variabilei aleatoare se abat ntre ele sau fa de medie ca centru de grupare. Centrul de grupare pentru dou variabile aleatoare poate fi acelai, dar gradul de mprtiere s fie diferit. Indicatorii variaiei pot fi grupai astfel: a) Amplitudinea absolut a variaiei, A se obine ca diferen ntre valoarea maxim i valoarea minim a valorilor xi ale variabilei aleatoare, A = x max x min .
Amplitudinea relativ, A% se calculeaz raportnd amplitudinea absolut la media aritmetic a valorilor nregistrate, x min x A A% = 100 = max 100 . x x Amplitudinea relativ permite compararea gradului de variaie a dou variabile aleatoare n care caracteristica de grupare se exprim n uniti de msur diferite i n special la alegerea numrului de grupe i a mrimii intervalului de grupare deoarece nu ofer posibilitatea cunoaterii structurii interioare a variabilei. Abaterile individuale absolute, di sunt determinate ca diferena dintre fiecare valoare xi i medie: d i = xi x .

Abaterile individuale relative, di% calculate ca raport ntre abaterea absolut i nivelul mediu al caracteristicii studiate: d x x d % = i 100 = i 100 . x x Abaterile individuale pot fi pozitive sau negative n funcie de mrimea fiecrui termen n raport cu media, n practic fiind utilizate valorile extreme, abaterea individual minim i cea maxim. Deoarece indicatorii enunai nu caracterizeaz ntreaga variaie a caracteristicii studiate, se vor utiliza indicatorii sintetici ai variaiei. b) Indicatorii sintetici ai variaiei caracterizeaz gradul de variaie lund n considerare toate valorile caracteristice ale variabilei aleatoare. n cercetrile statistice ale diferitelor fenomene sunt folosii indicatorii prezentai n continuare. Abaterea medie liniar, d calculat ca o medie aritmetic simpl sau ponderat a abaterilor termenilor fa de medie, luate n valoare absolut:

d =

xi
i i

x
.

Ni

Dispersia variabilei aleatoare X, notat D2(X) sau D2, se calculeaz ca o medie aritmetic simpl sau ponderat a ptratelor abaterilor valorilor argumentului xi fa de media lor i se reprezint momentul teoretic centrat de ordinul al doilea. Momentul teoretic centrat de ordinul k este dat de relaia:

D ( X ) = Dk =
k

i =0

[x i

M ( X )] pi ,

sau

=
pentru cazul variabilelor discrete, i

(x i x )
i

Ni

Ni
i
+

D k ( X ) = Dk = M [x M ( X )]k =

[xi

M ( X )]k p X (x ) dx ,

pentru cazul variabilelor de tip continuu; Deci, dispersia, ca moment teoretic centrat de ordinul al doilea, are expresia general:
D 2 ( X ) = D2 = M [ X M ( X )] =
2 + +

[x M ( X )]
2

p X (x ) dx =

+ = x 2 p X (x ) dx x p X (x ) dx

Dispersia este notat n mod frecvent notat i cu simbolul 2 . Dispersia este un X indicator abstract, nu are form concret de exprimare i arat modul n care valorile caracteristicii graviteaz n jurul mediei.

Abaterea medie ptratic sau abaterea standard notat D(X) sau X se calculeaz ca rdcina ptrat a dispersiei. Fa de abaterea medie liniar, abaterea standard ia n considerare importana fiecrei valori a caracteristicii xi. Este util n calculele de corelaie, la estimarea erorilor, la verificarea semnificaiei unor indicatori statistici. Inconvenientul const n faptul c nu permite compararea variaiei a dou variabile aleatoare avnd caracteristici exprimate n uniti diferite. Coeficientul de variaie C X reprezint o mrime cantitativ adimensional determinat ca raportul dintre abaterea standard i media variabilei aleatoare. CX = X x sau exprimat n procente, C X = X 100 [%] x n cazul n care coeficientul de variaie se poate calcula ca raport ntre abaterea medie liniar i media variabilei aleatoare,

d 100 [%] , x iar raportul ntre cei doi coeficieni de variaie este C 'X =

X d 100 > 100 . x x Coeficientul de variaie, indiferent de relaia de calcul poate lua valori ntre 0 100%. Pentru valoarea zero, toate valorile caracteristicii fiind egale ntre ele i respectiv cu valoarea medie, variabila aleatoare descrie un fenomen omogen i datele sunt bine grupate. Valorile caracteristicii prezint un grad ridicat de omogenitate pentru valori ale coeficientului de variaie mai mici de 35%, iar pentru valori mai mari de 70 - 75% variaia este foarte mare, media nu este semnificativ i nu caracterizeaz seria de date analizate.
1.2.2.4. Funcia generatoare, PX (t )

PX (t ) = M e xt =

( )

i =0

pi e x i t

pentru variabile aleatoare discrete,

PX (t ) = M e xt =
Funcia generatoare are proprietatea:
d k PX (t ) dt k

( )

p X (x ) e

xt

dt .

t =0

n k k pi x i = M X = M k pentru VAD i =1 . = + p (x ) x k dx = M X k = M pentru VAC k X

( )

( )