Sunteți pe pagina 1din 50

Curs de Probabiliti i Statistic at s a

Sectia: Informatic anul II a


Lect.dr. Raluca Vernic June 1, 2006

PROBABILITATI
1
1.1

Introducere
Scurt istoric
Aprut din practica jocurilor de noroc a a Problemele cavalerului De Mr ee Dezvoltare vertiginoas: Pascal, Bernoulli, Moivre, Laplace, Ceb^sev, Leapunov, a i Markov, Kolmogorov etc. Aplicatii ^ foarte multe domenii in

1.2

Obiectul de studiu al teoriei probabilitilor at

Denitii: - Modelul matematic - descrie un fenomen, proces, experiment, eveniment sau obiect cu ajutorul notiunilor i formulelor matematice, ^ scopul cercetrii lor. s in a - Experiment aleator - rezultatele sale nu pot anticipate cu certitudine i posed pros a prietatea regularitii statistice. Toate rezultatele posibile ale unui experiment at se numesc cazuri posibile i se noteaz : s a - Teoria probabilitilor - studiaz modelele matematice ale experimentelor (fenomenelor) a at aleatoare.

1.3

Evenimente aleatoare

Denitie. Se numete eveniment aleator (sau pe scurt eveniment) ataat unui s s experiment orice situatie care se poate realiza ^ decursul experimentului. Se noteaz in a cu A; B; ::: Fiecrui eveniment ^ corespunde o multime de cazuri favorabile, care este o a ii submultime a multimii cazurilor posibile. Tipuri de evenimente aleatoare. Evenimentele care au un singur caz favorabil se numesc evenimente elementare, celelalte evenimente compuse. Cazuri particulare de evenimente: - evenimentul sigur, care se realizeaz~ prin oricare dintre probe, notat cu a deoarece ^ corespunde multimea tuturor cazurilor posibile; ii - evenimentul imposibil, care nu se poate realiza ^ nici o prob~. El nu are nici in a un caz favorabil i se noteaz~ cu ; (multimea vid~). s a a 2

Operatii cu evenimente aleatoare. - Reuniunea evenimentelor. Se numete reuniunea a dou~ evenimente A i s a s B evenimentul care se realizeaz atunci c^nd se realizeaz~ cel putin unul dintre a a a evenimentele A i B; se noteaz A [ B. s a - Intersectia evenimentelor. Se numete intersectia a dou~ evenimente A i B s a s evenimentul care se realizeaz atunci c^nd se realizeaz~ simultan evenimentele A i a a a s B; se noteaz A \ B. a - Diferenta evenimentelor. Se numete diferenta a dou~ evenimente A i B s a s evenimentul care se realizeaz~ atunci c^nd se realizeaz~ A, dar nu se realizeaz~ B; a a a a se noteaz~ A B. a Relatii ^ intre evenimente aleatoare. - Evenimentul cotrar lui A, sau non A; este evenimentul care se realizeaz~ atunci a i numai atunci c^nd nu se realizeaz~ A. Se noteaz~ cu A. s a a a - Echivalenta evenimentelor. Dou~ evenimente sunt echivalente dac~ se reala a izeaz~ simultan. Aceasta revine la egalitatea multimilor de cazuri favorabile care a corespund evenimentelor; se noteaz~ A = B. a - Implicatia evenimentelor. Se spune c~ evenimentul A implic~ evenimentul a a B, dac~ realizarea lui A atrage dup~ sine i realizarea lui B; se noteaz~ A B. a a s a ^ ^ multimea Aceasta inseamn~ c~ multimea cazurilor favorabile lui A este inclus~ in a a a cazurilor favorabile lui B. - Evenimente incompatibile. Evenimentele A i B sunt incompatibile dac~ s a ^ nici o efectuare a experientei. Aceasta se poate scrie nu se pot realiza simultan in A \ B = ;: - Evenimente compatibile. Evenimentele A i B sunt compatibile dac~ se s a pot realiza simultan, deci dac~ au cel putin un caz favorabil comun. Se noteaz~ a a A \ B 6= ;: Dualitate de limbaj: evenimente-multimi. Deoarece orice eveniment legat de un experiment cu un num~r nit de cazuri posibile poate interpretat ca o a submultime a multimii , avem urm~toarea dualitate de limbaj: a Limbajul evenimentelor Limbajul multimilor - Eveniment - Submultime a lui - Eveniment sigur - Multimea (total~) a - Eveniment imposibil - Multimea vid~, ; a - A implic~ B a AB - A sau B A[B A\B - A i B s - non A (evenimentul contrar lui A) A - A; B incompatibile A\B = ; - Eveniment elementar !2 Exemple: aruncarea unui zar; aruncarea unei monede; aruncarea unei monede 3

de dou ori; aruncarea unei monede p^n la aparitia stemei; msurarea ^ altimii a a a a in elevilor dintr-o coal. s a

1.4

Corp borelian de evenimente aleatoare

Denitii: - Spatiu msurabil discret (corp/c^mp borelian de evenimente discret) - perechea a a (; F) ; unde este o multime discret, iar F = P () este multimea tuturor a submultimilor lui . - Corp borelian (-algebr). Fie o multime oarecare i F P () : Atunci F este s a a corp S borelian peste dac: (1) 2 F ; (2) 8A 2 F )A 2 F; (3) 8 (An )n F ) An 2 F:
n

- Spatiu msurabil (corp/c^mp borelian de evenimente) - perechea (; F ) ; unde a a este o multime oarecare i F este un corp borelian pe . s

Exemple: - Cel mai \srac" corp borelian: F = f;; g a - Cel mai \bogat" corp borelian: F = P () - Corpul borelian al numerelor reale, BR , este corpul borelian generat de multimea M = f(a; 1) ja 2 Rg : - Corpul borelian pe Rn , BRn , este corpul borelian generat de multimea ai ; bi 2 R; i = 1; n : M = (a1 ; b1 ) ::: (an ; bn )

Probabilitatea
Probabilitatea ^ sens larg in

Fie (; F) spatiu msurabil. a

2.1

Denitie. Aplicatia P : F ! R este o probabilitate ^ sens larg dac~ veric a a in axiomele: A1) P (A) 0; 8A 2 F, A2) P () = 1, A3) 8A; B 2 F ; A \ B 6= ;; atunci P (A [ B) = P (A) + P (B) : Proprieti: 8A; B 2 F; at 1) P A = 1 P (A) ; 2) P (;) = 0; 3) 0 P (A) 1; 4) A B ) P (A) P (B) ; 5) P (A B) = P (A) P (A \ B) ; 6) P (A [ B) = P (A) + P (B) P (A \ B) ; 7) P (A [ B) P (A) + P (B) :

2.2

Denitia axiomatic a probabilitii (A.N. Kolmogorov, 1930) a at

Denitie. Aplicatia P : F ! R este o probabilitate (^ sens restr^ns) dac~ a in a veric axiomele (A1), (A2) de mai sus, plus a S P A3) 8 (An )n F; Ai \ Aj 6= ;; 8i 6= j; atunci P An = P (An ) : (axioma
n n

aditivitii complete) at

Obs. Probabilitatea ^ sens restr^ns in a

) probabilitatea ^ sens larg. in :

Denitie. Tripletul (; F; P ) se numete spatiu de probabilitate. s Alte proprieti: at P S 8) 8 (An )n F; P An P (An ) ;


n n i2I i2I

10) Proprietatea de continuitate. Fie (An )n F ir ascendent (descendent) de s S multimi, adic An An+1 ; 8n (An An+1 ). Atunci P a An = lim P (An ) n!1 n T An = lim P (An ) : P
n n!1

9) Inegalitatea Boole. Fie I multime cel mult numrabil i (Ai )i2I F. a a s lui P T Ai 1 P (Ai ) : Atunci P

2.3

Denitia clasic a probabilitii (sec. XVI) a at

Fie (; F ) cu = f! 1 ; :::; ! n g i F = P () (spatiu msurabil discret). Presupunem s a c evenimentele elementare sunt echiprobabile, adic P (! 1 ) = ::: = P (! n ). Rezult a a a P (! i ) = 1=n; iar pentru orice eveniment A 2 F; P (A) = card (A) nr. cazuri favorabile lui A = : card () nr. cazuri posibile

Aceasta este denitia clasic a probabilitii, care este un caz particular al denitiei a at axiomatice.

2.4

Denitia geometric a probabilitii a at

Fie (; F ) unde 2 BRn de msur Lebesgue nit (mes < 1), iar F = B () = a a a fB \ jB 2 BRn g : mes (A) Denim probabilitatea geometric pe acest spatiu ca P (A) = a : mes () Cazuri particulare: n = 1 ) mes =lungimea; n = 2 ) mes =aria; n = 3 ) mes =volumul.

3
3.1

Scheme clasice de probabilitate i probabilitatea s conditionat a


Schema binomiala (a bilei revenite)
Schema general. ^ urma efectu~rii unui experiment poate s~ se produc~ evenia a a a In cu probabilitatea q = 1 p. Se mentul A cu probabilitatea p, sau evenimentul A repet~ experimentul de n ori, ^ conditii identice. Probabilitatea P (n; k) ca ^ cele a in in n experimente s~ se realizeze evenimentul A de exact k ori este a
k P (n; k) = Cn pk qnk ;

adic~ tocmai coecientul lui xk din dezvoltarea binomului (px + q)n . a Caz particular. Fie o urn~ ^ care avem a bile albe i b bile negre. Efectu~m n a in s a ^ ^ urn~. Probabilitatea extrageri, pun^nd dup~ ecare extragere bila extras~ inapoi in a a a a a ca la o extragere s~ obtinem o bil~ alb~ este p = a a a , iar probabilitatea ca din n a+b extractii s~ obtinem k bile albe este P (n; k). De aceea schema se mai numete i a s s schema bilei revenite.

3.2

Generalizare: schema multinomial (cu mai multe stri) a a

Schema general. ^ urma efectu~rii unui experiment poate ap~rea unul i numai a a s a In unul dintre evenimentele A1 ; :::; Am , care formeaz~ un sistem complet de evenimente. a m P pj = 1. Fie pj = P (Aj ) ; j = 1; m, atunci
j=1

Se repet~ experimentul de n ori, ^ conditii identice. Probabilitatea P (n; k1 ; :::; km ) a in ca ^ cele n experimente evenimentul Aj s~ apar~ de kj ori, j = 1; m, este in a a P (n; k1 ; :::; km ) = n! pk1 ::: pkm : m k1 ! ::: km ! 1

Caz particular. O urn ^ care avem bile de mai multe culori. a in

3.3

Schema lui Poisson

Schema general. Se execut n experimente independente. ^ urma experimena In a tului de rang j, poate s~ apar~ evenimentul Aj cu probabilitatea pj sau Aj cu a a probabilitatea qj = 1 pj ; j = 1; n. Probabilitatea Pk , s~ se realizeze k dintre cele a n evenimente (Aj )j=1;n ; este coecientul lui xk din polinomul P (x) = (p1 x + q1 ) ::: (pn x + qn ) :

Caz particular. Schema lui Poisson poate obtinut consider^nd un ir de n urne a a s cu bile de dou~ culori (albe i negre), cu compozitii diferite. Se extrage pe r^nd c^te a s a a o bil~ din ecare urn~. Atunci probabilitatea s~ obtinem k bile albe este Pk . a a a Particularizarea la schema binomial. Schema binomial se obtine ca un caz para a ticular al schemei lui Poisson c^nd p1 = ::: = pn : a

3.4

Schema hipergeometric (a bilei nerevenite) a

Prezentarea schemei. Dintr-o urn~ cu a bile albe i b bile negre (a + b = N ) a s se extrag n bile, n N, f~r~ a pune bila extras~ ^ aa a inapoi ^ urn~. Probabilitatea, in a P (; a; b), ca dintre bilele extrase s~ e albe i negre, + = n, este a s
Ca Cb P (; a; b) = + : Ca+b

3.5

Probabilitatea conditionat a

Fie (; F; P ) un spatiu de probabilitate i A; B 2 F cu P (B) > 0: s Denitie. Probabilitatea evenimentului A conditionat de realizarea evenimentului a B este PB (A) = P (A jB ) = P (A \ B) : P (B)

Formula de ^ inc^ inmultire a probabilitilor. Fie A1 ; :::; An 2 F astfel ^ at at P (A1 \ ::: \ An ) > 0. Atunci n1 ! n ! \ \ Ai = P (A1 ) P (A2 jA1 ) ::: P An Ai : P
i=1 i=1

Formula lui Bayes. ^ conditiile (1)-(3) de la FPT, In P (Aj jB ) =

Formula probabilitii totale (FPT). Fie B; A1 ; :::; An ; ::: 2 F astfel ^ at inc^ at 8 S > 1) B An < X n P (B jAn ) P (An ) : : Atunci P (B) = > 2) Ai \ Aj = ;; 8i 6= j : n 3) P (Ai > 0) ; 8i P (B jAj ) P (Aj ) : P (B)

3.6

Evenimente independente. Denitii:

-Evenimentele A; B 2 F sunt independente dac P (A \ B) = P (A) P (B) : a - Evenimentele A1 ; :::; An 2 F sunt independente dou c^te dou dac P (Ai \ Aj ) = a a a a P (Ai ) P (Aj ) ; 8i 6= j: a - Evenimentele A1 ; :::; An 2 F sunt independente ^ totalitate dac 8k = 1; n; 8I = in ! k k T Q fi1 ; :::; ik g 1; n; atunci P Aij = P Aij :
j=1 j=1

in Proprietate. A1 ; :::; An independente ^ totalitate

) independente dou c^te dou. a a a :

4
4.1

Variabile aleatoare
Imaginea invers a unei functii a
Denitie. Fie X : ! i A : Denim X 1 (A) = f! 2 jX (!) 2 Ag : s Proprieti. at 8 X A > 1) X 1 = 1 (A): > > > T T 1 S S < 1 1 2) X Ai = X (Ai ) i X s Ai = X 1 (Ai ) : i i i i > > 3) Dac G este un corp borelian peste , atunci X 1 (G) este corp borelian peste . > a > : 4) X 1 (B (M)) = B (X 1 (M)) ; 8M P () :

4.2

Variabile aleatoare

Denitii: - Fie (; F ) i (; G) dou spatii msurabile. Atunci X : ! este o functie s a a a msurabil dac 8A 2 G; X 1 (A) 2 F : a a - Dac = R i G = BR ; atunci functia msurabil X : ! R se numete variabil a s a a s a aleatoare (v.a.). - Dac = Rn i F = BRn ; atunci o functie msurabil pe acest spatiu se numete a s a a s a a borelian (Borel msurabil). a Teorem. X : ! R este variabil aleatoare d.s.n.d. pentru 8a 2 R are loc una a a dintre urmtoarele conditii: a 1) f! 2 jX (!) < ag 2 F 2) f! 2 jX (!) ag 2 F 3) f! 2 jX (!) > ag 2 F 4) f! 2 jX (!) ag 2 F:

Proprietate. Dac X : ! R este variabil aleatoare i ' : R ! R este a a s msurabil Borel, atunci ' (X) este o variabil aleatoare. a a a Dac X1 ; :::; Xn : ! R sunt variabile aleatoare i ' : Rn ! R este msurabil a s a a a Borel, atunci ' (X1 ; :::; Xn ) este o variabil aleatoare. Consecint. Dac X; Y : ! R sunt variabile aleatoare i c 2 R, atunci functiile a s a 2 1 urmtoare sunt tot variabile aleatoare: c + X; cX; jXj ; X ; a pentru X 6= 0; X X X Y; XY; pentru Y 6= 0; min (X; Y ) ; max (X; Y ) : Y

4.3

Variabile aleatoare de tip discret

Denitii: - V.a. X : ! R se numete simpl dac ia un numr nit de valori nite. s a a a - V.a. X : ! R se numete discret dac multimea valorilor sale este discret. s a a a 10

Tabel de distributie x1 X p1
not:

a distributie. O v.a. discret se poate reprezenta printr-un tabel de astfel: x2 ::: xn ::: ; unde x1 ; x2 ::: sunt toate valorile pe care la ia v.a., p2 ::: pn :::

Exemple de v.a.:

iar pi = P (f! 2 PjX (!) = xi g) = P (X = xi ) ; i = 1; 2; :::; deci 0 pi 1: Se pi = 1: remarc faptul c a a


i1

1; ! 2 A 1. V.a. indicator IA a unui eveniment A 2 F se denete ca IA (!) = s . 0; ! 2 A = 0 1 Deci IA : q = 1 p p = P (A) 0 a 2. V.a. Bernoulli: X ; unde a 2 R; p + q = 1 i 0 p 1: s q p 0 ::: k ::: n 3. V.a. Binomial: X a ; unde n 2 N; p + q = 1 i s k ::: Cn pk q nk ::: 0 p 1. Se noteaz X Bin (n; p) : a

4. V.a. asociat schemei lui Poisson. a ! 0 1 ::: n ::: n 5. V.a. Poisson: X ; unde > 0. Se noteaz X a ::: e ::: n! P () : 6. V.a. Hipergeometric - se asociaz schemei hipergeometrice. a a 0 1 ::: n ::: 7. V.a. Geometric: X a ; unde p + q = 1 i 0 p 1. s p pq ::: pq n :::

Independenta. V.a. X; Y sunt independente d.s.n.d. P (X = x \ Y = y) = P (X = x) P (Y = y) ; 8x; y: x1 x2 ::: xn ::: Operatii cu variabile aleatoare. Fie X p1 p2 ::: pn ::: a + x1 a + x2 ::: a + xn ::: 1. Adunarea: a + X = p2 ::: pn ::: p1 ax1 ax2 ::: axn ::: 2. Inmultirea: aX = p1 p2 ::: pn ::: n n x1 x2 ::: xn ::: n n 3. Ridicarea la putere: X = : p1 p2 ::: pn ::: 11

i a 2 R: s

Functii de repartitie
s a Denitie. FX : R ! R se numete functie de repartitie (f.r.) asociat v.a. X not: 1 dac FX (x) = P (X < x) = P (X (1; x)) : a x1 x2 ::: xn ::: ; este Exemplu: f.r. asociat v.a. discrete, X a p1 p2 ::: pn ::: 8 > 0; x x1 > > > p1 ; x1 < x x2 < :::: FX (x) = : > > p1 + ::: + pn ; xn < x xn+1 > > : ::: Proprieti caracteristice. F.r. F a unei v.a. are urmtoarele proprieti: a at at 1) 8a < b 2 R; F (a) F (b) 2) 8a 2 R; F (a 0) = F (a) (continu la st^nga) a a 3) F (1) = 0; F (+1) = 1:

Fie (; F; P ) un spatiu de probabilitate i v.a. X : ! R. s

Teorema de existent. Fie F : R ! R av^nd proprietile (1)-(3) de mai sus. a at a Atunci exist un spatiu de probabilitate (; F ; P ) i o v.a. X : ! R astfel ^ at a s inc^ F = FX : Teorem. O f.r. are numai discontinuiti de speta I, iar multimea lor este cel at a mult numrabil. a a Alte proprieti: formule de legtur ^ a a intre probabilitate i f.r. s at (1) P (X a) = 1 FX (a) (2) P (X = a) = FX (a + 0) FX (a 0) = FX (a + 0) FX (a) (saltul functiei) (3) P (a X < b) = FX (b) FX (a) (4) P (a X b) = FX (b + 0) FX (a) (5) P (a < X b) = FX (b + 0) FX (a + 0) (6) P (a < X < b) = FX (b) FX (a + 0) :

V.a. de tip continuu


Tipuri de functii de repartitie - F.r. de tip discret - corespunde v.a. de tip discret - F.r. de tip absolut continuu - ^ corespunde v.a. continu ii a ^ corespunde v.a. singular. - F.r. de tip singular - ii a

12

Denitii: - O f.r. F esteR de tip absolut continuu dac 9f : R ! R msurabil Borel astfel a a a ^ at F (x) = x f (u) du: Atunci f se numete densitate de repartitie. inc^ s 1 - O v.a. este de tip continuu dac functia sa de repartitie este de tip absolut a continuu. - O f.r. continu, care nu este absolut continu, este de tip singular. Multimea a a punctelor sale de cretere este de msur Lebesgue nul. s a a a Teorem (Lebesgue). Orice f.r. F se poate descompune ^ mod unic sub forma in a F (x) = p1 Fd (x) + p2 Fc (x) + p3 Fs (x) ; unde p1 + p2 + p3 = 1, iar Fd este o f.r. discret, Fc este o f.r. absolut continu i a as a Fs este o f.r. singular. Proprieti (d.r.) at 1) 8x; f (x) 0 R1 2) 1 f (u) du = 1 3) 8x punct de continuitate al lui f; f (x) = F 0 (x) : R1 Rb 4) P (a X < b) = a f (u) du; P (X b) = b f (u) du:

Exemplu de f.r. continu, care nu este absolut continu (Cantor). a a

6.1
6.1.1

Cele mai importante modele probabiliste de tip absolut continuu


Repartitia Uniform a 8 <

1 ; x 2 [a; b] Denitie. X U [a; b] , f (x) = : Caz particular X U [0; 1]: ba : 0; ^ rest in

Exemplu. X=valoarea obtinut la aruncarea la ^ amplare a unui punct ^ inter a int^ in valul [a; b]:

Proprietate. Fie X v.a. i ' : R ! R functie borelian (v.a.). Atunci: s a a) Dac exist '1 , atunci v.a. Y = ' (X) are f.r. FY = FX ('1 ) : a a a a b) Fie ' = FX continu. Atunci v.a. Y = FX (X) este repartizat U [0; 1]: 1 c) Fie v.a. Y U[0; 1] i F o f.r. continu. Atunci v.a. X = F (Y ) are f.r. chiar s a F . (aceast proprietate d o modalitate de a construi v.a. cu f.r. continu dat, a a a a pornind de la o v.a. U [0; 1]) 6.1.2 Repartitia Exponential a ex ; x > 0 : 0; ^ rest in

Denitie. X Exp () ; > 0 , f (x) = 13

Exemple. X=durata de functionare a unei lmpi electronice; durata de timp dintre a sosirea a dou persoane consecutive la un ghieu. a s Proprietatea lipsei de memorie a repartitiei Exp. Dac X Exp () atunci a P (X < t + a jX t ) = P (X < a jX 0) = FX (a) : 6.1.3 Repartitia Normal (Laplace-Gauss) a ! 1 (x m)2 Denitie. X N (m; 2 ) ; m 2 R; > 0 , f (x) = p exp ;x 2 2 2 2 R: Forma standard (redus): m = 0; = 1: a Functia lui Laplace este f.r. a repartitiei normale standard N (0; 1). Se noteaz a : R ! R i are forma s Z a 1 2 (a) = p ex =2 : 2 1 Proprieti ale functiei lui Laplace. at 1) (a) + (a) = 1 2) (0) = 1=2 3) Dac X N (0; 1) ; atunci P (jXj < 3) = 0:99: (ca urmare, functia este tabelat a a doar pentru intervalul (3; 3) deoarece aici este cuprins aproape toat masa sa de a a probabilitate). Proprietate. (legtura dintre rep. normal standard i cea general) a a s a 2 a) Dac X N (0; 1) ; atunci Y = m + X N (m; ) ; a Y m b) Dac Y N (m; 2 ) ; atunci X = a N (0; 1) :

Variabile aleatoare multidimensionale


Denitie. Aplicatia X : ! Rn ; n 1; se numete v.a. n-dimensional dac s a a X1 (B) 2 F ; 8B 2 BRn : Teorem de caracterizare. X = (X1 ; :::; Xn ) : ! Rn este o v.a. n-dimensional a a d.s.n.d. 8i = 1; n; Xi : ! R este v.a. Functia de repartitie multidimensional. FX : Rn ! R; a FX (a1 ; :::; an ) = P (X1 < a1 ; :::; Xn < an ) : 14

Fie (; F; P ) un spatiu de probabilitate.

Proprieti caracteristice f.r. at 1) Este nedescresctoare ^ raport cu ecare argument. a in 2) Este continu la st^nga ^ raport cu ecare argument. a a in 3) lim F (a1 ; :::; an ) = 0; 8i = 1; n: 4) alim F (a1 ; :::; an ) = 1: !1
::: an !1
1

ai !1

F.r. marginal, corespunztoare v.a. Xi : Fi (ai ) = alim F (a1 ; :::; an ) : a a !1


j

j6=i

Independenta v.a.
Denitii. - X este o familie de v.a. independente (^ totalitate) dac 8J I; J nit, in a a 8 (Bj )j2J BR ; atunci P \
1 Xj (Bj )

Fie (; F; P ) un spatiu de probabilitate i X = (Xi )i2I o familie de v.a. pe el. s

j2J

Y
j2J

1 P Xj (Bj ) :

- X este o familie de v.a. independente m c^te m dac orice subfamilie a sa a a ^ totalitate. format din m v.a. este independent in a a Teorem. C.n.s. ca familia X s e o familie de v.a. independente (^ totalitate) a in a este ca 8n 1; 8J = fj1 ; :::; jn g I; 8 fx1 ; :::; xn g R; Fj1 ;:::;jn (x1 ; :::; xn ) =
n Y i=1

Fji (xi ) ;

unde Fj1 ;:::;jn este f.r. a v.a. (Xj1 ; :::; Xjn ), iar Fji este f.r. a v.a. Xji ; i = 1; n.

15

Caracteristici numerice ale variabilelor aleatoare

Fie (; F; P ) un spatiu de probabilitate i X o v.a. pe el. s

9.1

Valoarea medie

R R Denitie. Se numete media v.a. X cantitatea EX = X (!) dP (!) = R xdFX (x), s cu conditia ca ea s existe. (prima integral este de tip Lebesgue, a doua este Stielt a a jes). Proprieti. at 1) Dac X = a = const:, atunci Ea = a: a 2) E (aX) = aEX; a = const: 3) E (X + Y ) = EX + EY: 4) Dac X; Y sunt v.a. independente, atunci E (XY ) = EX EY: a Interpretare. Media unei v.a. este acea valoare ^ jurul creia se grupeaz valorile in a a variabilei. Cazuri particulare: P x1 x2 ::: xn ::: -X v.a. discret, atunci EX = xn pn; a p1 p2 ::: pn ::: n R - X v.a. continu av^nd d.r. f, atunci EX = R xf (x) dx: a a

9.2

Momente

Momentul (initial) de ordin k; k (X) = E X k Momentul absolut de ordin k; k (X) = E jXjk

a Caz particular: dispersia (varianta) este momentul centrat de ordin 2. Se noteaz DX = V arX = 2 (X) : p Abaterea medie ptratic este DX: a a

Momentul centrat de ordin k; k (X) = E (X EX)k

9.3

Dispersia

Proprieti. at 1) Dac X = a = const:, atunci Da = 0: a 2) D (aX) = a2 DX; a = const: 3) Dac X; Y sunt v.a. independente, atunci D (X Y ) = DX + DY: a 4) DX = E (X 2 ) (EX)2 : 16

Interpretare. Dispersia unei v.a. msoar gradul de ^ a a imprtiere al valorilor acelei as ^ jurul mediei sale. v.a. in

9.4

Covariant. Coecient de corelatie a

Denitii. - Covarianta v.a. X i Y este cov (X; Y ) = E ((X EX) (Y EY )) = E (XY ) s EXEY: cov (X; Y ) - Denitie. Coecientului de corelatie al v.a. X i Y este (X; Y ) = p s : DXDY - V.a. X i Y sunt necorelate dac (X; Y ) = 0: s a Proprietate. a) V.a. X i Y independente s ) necorelate. :

b) j (X; Y )j 1: c) (X; Y ) = 1 , ^ intre X i Y exist o dependent de tip liniar. s a a

10
10.1

Inegaliti. Tipuri de convergent at a


Inegaliti at

Fie (; F; P ) un spatiu de probabilitate i X o v.a. pe el. s Inegalitate lui Markov. 8a > 0; 8r > 0; P (jXj a) r (X) : ar

(X) Inegalitatea lui Ceb^sev. 8a > 0; P (jXj a) 2 2 : i a Diverse forme ale inegalitii lui Ceb^sev. 8a > 0; P (jX EXj a) at i DX DX , P (jX EXj < a) 1 2 : a2 a p 8 Consecint. (regula celor 3 sigma) P jX EXj < 3 DX : Altfel spus, maa 9 joritatea valorilor v.a. X se grupeaz ^ jurul valorii medii ^ a in intr-un interval de lungime p not: 6 DX = 6:

10.2

Tipuri de convergent a irurilor de v.a. a s

Fie (; F; P ) un spatiu de probabilitate, X v.a. pe el i (Xn )n ir de v.a. pe el. s s n o def: a:s: Convergenta aproape sigur. Xn ! X , P ! 2 lim Xn (!) = X (!) = a n!1 n!1 1: 17

Convergenta ^ probabilitate. Xn ! X , 8" > 0; lim P (jXn Xj ") = in n!1 n!1 0: Convergenta ^ medie de ordinul r 1: Xn ! X , E (jXn Xjr ) ! 0: in
n!1 n!1 Lr def:

def:

Convergenta ^ repartitie (slab). Sirul de functii de repartitie (Fn )n converge in a a a slab ctre f.r. F dac lim Fn (x) = F (x) ; 8x punct de continuitate al lui F . Atunci
n!1

Xn ! X , irul de functii de repartitie corespunztor lui (Xn )n converge slab s a n!1 ctre f.r. a lui X. a Legtura dintre tipurile de convergent. a a Xn ! X ) Xn ! X ) Xn ! X
n!1 n!1 n!1 a:s: P rep:

rep:

def:

Xn

n!1

* Lr ! X

18

11

Legea numerelor mari


i=1 n P

Fie (; F; P ) un spatiu de probabilitate, (Xn )n ir de v.a. pe el i Sn = s s

Xi :

a a Denitie. Sirul (Xn )n este supus (urmeaz) legea slab/tare a numerelor mari dac a Sn ESn P =a:s: ! 0: n!1 n

11.1

n P 1 s Teorema Markov. Dac lim 2 D a Xi = 0, atunci irul (Xn )n este supus n!1 n i=1 LSNM. n 1 P s inc^ Consecinta 1. Fie (Xn )n ir de v.a. independente, astfel ^ at lim 2 DXi = 0. n!1 n i=1 Atunci irul este supus LSNM. s s Consecinta 2. (LSNM ^ forma Ceb^sev) Fie (Xn )n ir de v.a. independente, astfel in i ^ at DXi c < 1; 8i; c = const:. Atunci irul este supus LSNM. inc^ s Consecinta 3. (LSNM ^ forma Poisson) Fie Xn nr. de aparitii ale unui eveniment in ^ n experimente independente i pk = P (A) ^ experimentul nr. k. Atunci A in s in Xn
n P

Forme ale LSNM

pi
n!1

i=1

! 0:

Consecinta 4. (LSNM ^ forma Bernoulli) Fie Xn nr. de aparitii ale unui eveniment in A ^ n experimente independente i p = P (A) indiferent de experiment. Atunci in s Xn P ! p: n n!1 s a Teorema Hincin. Fie (Xn )n ir de v.a. care veric conditiile: (1) Sunt independente dou c^te dou; a a a (2) Sunt identic repartizate; (3) Exist EXn = a < 1: a Atunci irul este supus LSNM. s

11.2

Aplicatii ale LSNM

Utilitatea frecventei relative Utilitatea mediei aritmetice: Teorema lui Hincin justic folosirea mediei aritmetice a a unor msurtori pentru a aproxima media necunoscut a v.a. studiate. a a a 19

11.3

Forme ale LTNM

Teorema Kolmogorov. Fie (Xn )n ir de v.a. care veric conditiile: s a ^ totalitate; (1) Sunt independente in (2) DXn < 1; 8n; 1 P DXn (3) < 1: 2 n=1 n Atunci irul este supus LTNM. s Consecinta 1. Dac irul (Xn )n veric conditiile: as a ^ totalitate; (1) Sunt independente in (2) DXn c < 1; 8n, atunci irul este supus LTNM. s Consecinta 2 (Borel). Fie Xn nr. de aparitii ale evenimentului A ^ n experimente in independente i p = P (A) indiferent de experiment. Atunci s Xn a:s: ! p: n n!1

20

12
12.1

Functia caracteristic a
Denitie i proprieti s at

Fie (; F; P ) un spatiu de probabilitate i X o v.a. pe el. s S.n. functie caracteristic (f.c.) a v.a. X, 'X : R ! C; denit prin 'X (t) = a a itX : E e

Obs. Reamintim eit = cos t + i sin t; jeit j = 1:

Cazuri particulare: P x1 x2 ::: xn ::: v.a. discret, atunci 'X (t) = eitxn pn ; a -X p1 p2 ::: pn ::: n R - X v.a. continu av^nd d.r. f, atunci 'X (t) = R eitx f (x) dx: a a Proprieti ale f.c. at 1) ' (0) = 1 2) j' (t)j 1 3) ' (t) = ' (t) 4) 'aX+b (t) = eitb 'X (at) ; 8a; b 2 R; a 6= 0 5) ' este uniform continu pe R a

6) Dac X1 ; :::; Xn sunt independente, atunci 'X1 +:::+Xn (t) = a

j=1

12.2

Teorem (formula de legtur dintre f.c. i momente). Dac exist n 2 N a a a a a s astfel ca n (X) < 1; atunci a) 'X este de n ori derivabil; a k '(k) (0) b) E X = X k ; 81 k n: i

n Q

'Xj (t) :

Formula de inversiune i teorema de unicitate a f.c. s

Teorem (formula de inversiune). Fie ' f.c. i F f.r. pentru v.a. X. Atunci, s a a dac x1 < x2 sunt dou puncte de continuitate ale lui F , avem a Z c itx1 1 e eitx2 F (x2 ) F (x1 ) = lim ' (t) dt: 2 c!1 c it Consecint. Dac f.c. ' este absolut integrabil pe R, atunci f.r. corespunztoare a a a a este absolut continu, iar densitatea sa este dat de a a Z 1 eitx ' (t) dt: f (x) = 2 R Teorema de unicitate. F.r. este determinat ^ mod unic de f.c. corespunztoare. a in a 21

12.3

Teorema de convergent a irurilor de f.c. a s


a a s i '; ('n )n1 f.c. corespunztoare. Dac Fn ! F; atunci 'n ! ' i convergenta s n!1 n!1 este uniform ^ orice interval mrginit. a in a
slab

Teorema de convergent (de continuitate). Fie F o f.r., (Fn )n1 un ir de f.r. s a

12.4

Alte functii generatoare

Functia generatoare a probabilitilor at Functia generatoare a momentelor

22

13
13.1

Teorema Limit Central a a


Generaliti at

Teorema Limit Central (TLC) este o teorem fundamental ^ teoria probabilitilor i a a a a in at s ^ statistic, care rspunde la ^ in a a intrebrile: a - Care este viteza (rata) de convergent ^ legea numerelor mari? a in - C^t de bun este aproximarea mediei unei v.a. prin intermediul mediei de selectie? a a ^ general, termenul de TLC se aplic pentru armatiile referitoare la convergenta In a repartitiilor sumelor de v.a. ctre repartitia normal, atunci c^nd numrul termenilor din a a a a sum tinde la 1. TLC explic aplicabilitatea pe scar larg a repartitiei normale pentru a a a a a aproxima rezultatul unui experiment stocastic inuentat de un numr mare de factori a aleatori.

13.2

Forme ale TLC

Teorem. Fie (Xn )n ir de v.a. indep., identic repartizate, pentru care 9 EXi = a s a X1 + ::: + Xn na p i DXi = 2 ; > 0. Atunci irul de v.a. s s converge slab ctre o a n v.a. repartizat normal standard. a Sn ESn converge slab ctre a Obs. Cu notatia Sn = X1 + ::: + Xn , TLC se mai scrie: p DSn o v.a. repartizat normal standard. a s Consecint (TLC ^ forma Moivre-Laplace). Fie (Xn )n ir de v.a. indep., a in identic repartizate Bernoulli(p) ; p 2 (0; 1) : Atunci ! X1 + ::: + Xn np p P < x ! (x) ; 8x 2 R: n!1 np (1 p)

13.3

Aplicatii ale TLC

Problem. Fie (Xn )n ir de v.a. indep., identic repartizate. S se determine s a a probabilitatea ca Sn = X1 + ::: + Xn 2 [; ] : Rezolvare. ESn Sn ESn ESn p P ( Sn ) = P p p DSn DSn DSn n mare ESn ESn p p : DSn DSn Aplicatie (regula celor 3 sigma ^ forma TLC). ^ conditiile de mai sus, avem in In p Sn ESn P jSn ESn j 3 DSn = P 3 p 3 DSn 8 (3) (3) = 2 (3) 1 = 0:997 > ; 9 23

unde ultima valoare s-a obtinut la inegalitatea lui Ceb^sev. i Utilitatea mediei arimetice: estimarea numrului minim de observatii necesar a pentru a obtine o eroare foarte mic cu o probabilitate foarte mare a Fie X1 ; :::; Xn rezultatele a n observatii independente asupra v.a. X de medie a n 1P Xi . Ne intereseaz care ar numrul minim a a necunoscut. Estimm a prin X = a a n i=1 de observatii necesar pentru a obtine o precizie foarte bun (altfel spus, o eroare a foarte mic), cu o probabilitate foarte mare. Pentru simplicare, e DX = 2 = 1: a Alegem eroarea " = 0:1; iar probabilitatea minim egal cu 0:99: Deci, vrem ca a a P X a < 0:1 0:99: - Rezolvarea problemei cu TLC: Sn Sn na P X a < 0:1 = P a < 0:1 = P n n < 0:1 = Sn ESn p p p < 0:1 n 2 0:1 n 1: = P DSn Punem conditia ca p 2 0:1 n 1 0:99 ) n 676: DX ; P X a < 0:1 1 0:12 1 DX 0:99 ) 0:01 ) n 104 : 2 0:1 n0:01

- Rezolvarea problemei cu inegalitatea lui Ceb^sev: i

deci punem conditia 1

i a a a Concluzie. Inegalitatea lui Ceb^sev este mai \grosier" dec^t TLC, care d rezultate mai exacte.

24

14
14.1

Repartitii clasice derivate din repartitia normal a


Repartitia 2
1 2n=2 (n=2) xn=21 ex=2 ; x > 0:

Denitie. X 2 (n) , f (x) = Proprieti. at 1) EX = n; DX = 2n;

2) Dac X1 ; :::; Xn sunt v.a.i.i.r. N (0; 1), atunci a

3) Dac X 2 (n) indep. de Y 2 (m) ; atunci X + Y 2 (n + m) : a

i=1

n P

Xi2 2 (n) ;

14.2

Repartitia Student (t)


X n 1P 2 X n i=1 i

Denitie. Dac X; X1 ; :::; Xn sunt v.a.i.i.r. N (0; 1), atunci v.a. Tn = r a Student (n) : Proprietate. Tn are d.r.

Caz particular. T1 Cauchy; cu d.r. f (x) =

n+1 2 1 n+1 x2 2 n f (x) = p 1+ ; x 2 R: n 2 n 1 : (1 + x2 )

14.3

Repartitia F

Denitie. Dac X1 ; :::; Xm ; Y1 ; :::; Yn sunt v.a.i.i.r. N (0; 1), atunci v.a. Fm;n = a m 1 P 2 X m i=1 i F (m; n) : n 1P 2 Y n i=1 i Proprietate. Tn are d.r. f (x) = n m m=2 m+n m m+n 2 2 m=21 m n x ; x > 0: 1+ x n 2 2

25

14.4
14.4.1

Repartitia normal multidimensional a a


Repartitia normal bidimensional a a

Denitie. Vectorul aleator (X; Y ) N (m1 ; m2 ; 2 ; 2 ; ) ; m1 ; m2 2 R; 1 ; 2 > 1 1 0; jj < 1; dac are d.r. a ( " 2 2 1 y m2 x m1 1 p exp + f (x; y) = 2 (1 2 ) 1 2 2 1 2 1 2 (x m1 ) (y m2 ) 2 : 12 Proprieti. at 1) Repartitiile marginale sunt X N (m1 ; 2 ) ; Y N (m2 ; 2 ) : 1 2 2) este coecientul de corelatie dintre X i Y . s 14.4.2 Repartitia normal multidimensional a a

Fie X = (X1 ; :::; Xn )0 o v.a. n-dimensional. a Denitie. S.n. matrice de covariant v.a. X; matricea cov (X) = (cov (Xi ; Xj ))i;j=1;n : a Denitie. V.a. X urmeaz o repartitie normal standard n-dimensional, a a a a X Nn (0; In ), unde 0 este vectorul alctuit din n de 0, iar In este matricea unitate n-dimensional, dac are d.r. a a ( ) n 1 1X 2 f (x1 ; :::; xn ) = exp x : 2 k=1 k (2)n=2 Proprieti. at In 1) Repartitiile marginale sunt Xk N (0; 1) ; k = 1; :::; n: ^ plus, X1 ; :::; Xn sunt independente. 2) cov (X) = In : 3) F.c. a vectorului X este P ! n n P 'X (t1 ; :::; tn ) = E e
def: i tk Xk
k=1

=e

1 2

k=1

t2 k

Denitie. V.a. X urmeaz o repartitie normal n-dimensional, X Nn (m; ), a a a 0 s a a a unde m = (m1 ; :::; mn ) i este o matrice n-dimensional simetric, pozitiv denit, dac are d.r. a 1 1 0 1 f (x) = exp (x m) (x m) ; p 2 (2)n=2 det unde am notat x = (x1 ; :::; xn )0 : 26

Proprieti. at a 1) Descompun^nd = AA0 ; A matrice nesingular n n, atunci A1 (X m) a Nn (0; In ) : 2) cov (X) = : 3) F.c. a vectorului X este, pentru t = (t1 ; :::; tn )0 , 1 0 0 'X (t) = exp it m t t : 2 4) Aplic^nd o transformare liniar unei v.a. normale multidimensionale se obtine a a tot o v.a. normal. a 5) Suma a dou v.a. independente, normal repartizate de aceeai dimensiune, este a s tot o v.a. normal pentru care se adun parametrii corespunztori. a a a 6) Orice combinatie liniar a componentelor unei v.a. normale multidimensionale a este repartizat normal unidimensional. a 7) Dac X Nn (m; ) cu matrice diagonal, atunci componentele lui X sunt v.a. a a independente i Xk N (mk ; kk ) ; k = 1; n: s 8) Repartitiile marginale ale v.a. X Nn (m; ) sunt tot de tip normal.

27

STATISTICA DESCRIPTIVA
15
15.1

Introducere
Scurt istoric

Primele notiuni de statistic le gsim la ^ a a inceputul erei noastre, cu ocazia numrrii aa ^ legtur cu impozitele i necesitile rzboaielor. Dar abia ^ secolul diferitelor obiecte, in a a s at a in al XVIII-lea a ^ inceput statistica s se dezvolte ca o tiint de sine stttoare, folosind la a s a aa descrierea diferitelor trsturi care caracterizeaz statul. Mult timp statistica s-a ocupat aa a numai de acest domeniu, ind denumit i aritmetic politic. Termenul de statistic a as a a a ^ Germania, ca urmare a lucrrilor lui Gottfried Achenwall (1719-1772). fost introdus in a Statistica matematic modern a luat natere ^ secolul al XIXlea, din ^ a a s in imbinarea a dou orientri: aritmetica politic i calculul probabilitilor.Unul dintre principalii a a a s at artizani ai acestei unicri este ^ mod incontestabil mate- maticianul i zicianul belgian a in s Lambert Adolphe Quetelet (1796-1874). ^ prima jumtate a secolului al XX-lea, statistica se remarc ^ In a a indeosebi prin dez^ ce mai numeroase i prin aplicarea acestor metode ^ voltarea unor metode din ce in s in sectoare tot mai variate, cum ar : tiintele politice i sociale, biologie (apare biometria), s s psihologie (psihometria), agronomie (dezvoltarea planurilor de experimente), economie (econometria), industrie (prin contolul de calitate), problemele de gestiune (prin cercetrile a operationale) etc. Cea de-a doua jumtate a secolului al XX-lea este marcat ^ special de dezvoltarea a a in informaticii. Aceasta a permis nu numai efectuarea mult mai rapid a calculelor, dar a i utilizarea unor metode statistice care, dei destul de vechi, nu putuser aplicate ^ s s a in ^ acest sens metodele de practic din cauza volumului de calcule necesitat. Amintim in a analiz statistic multidimensional. Pe de alt parte, calculatorul a inuentat predarea a a a a statisticii, prin aparitia unor programe statistice specializate.

15.2

Denitie. Terminologie

Termenul statistic este derivat din substantivul latin status (stare). a Ca tiint general, statistica reprezint multimea procedeelor prin care se studiaz s a a a a proprieti, caracteristici ale unor populatii numeroase. Acest studiu este bazat pe date at numerice observate asupra populatiei respective. Statistica matematic realizeaz acelai obiectiv, folosind ^ a instrumentul matematic a a s ins ^ analiz i interpretare. Mai pe larg, avem urmtoarea denitie: in as a a a a Def. Statistica matematic este o ramur a matematicii care se ocup cu studierea modelelor matematice ce vizeaz gruparea, analiza i interpretarea datelor referitoare la a s anumite fenomene aleatoare, precum i cu realizarea de previziuni privind producerea lor s viitoare.

28

Pe de alt parte, termenul statistic mai este folosit i pentru a desemna un parametru a a s (precum media), calculat pe baza datelor numerice, ca valoare a unei functii de aceste date. Utilizat la plural, termenul statistici se refer la multimea datelor numerice culese a asupra unui grup oarecare de indivizi. Se vorbete astfel despre statistici demograce s (natalitate, mortalitate etc.), statistici ale productiei agricole sau industriale (cantitti a produse, preturi de v^nzare etc.), statistici ale omajului etc. a s

15.3

Etapele unui studiu statistic

Orice studiu statistic poate descompus ^ dou etape principale: etapa de colectare i in a s de organizare a datelor i etapa de analiz i interpretare a lor. s as Colectarea datelor se poate realiza e prin observarea direct a fenomenelor de interes, a ^ mod natural, e prin experimentare, adic provoc^nd ^ mod aa cum se produc ele in s a a in controlat aparitia anumitor fenomene. Statistica se descompune la r^ndul su ^ dou ramuri: statistica descriptiv i inferenta a a in a as statistic. a Statistica descriptiv este etapa deductiv a studiului statistic. Ea se ocup cu orgaa a a nizarea datelor observate sub o form c^t mai accesibil i mai clar, de exemplu a a as a gruparea lor ^ tabele i reprezentarea grac. in s a Inferenta statistic este etapa inductiv, care permite extinderea sau ge- neralizarea ^ a a in anumite conditii a concluziilor obtinute de statistica descriptiv. Spre exemplu, a observarea sau experimentarea se pot efectua doar asupra unei fractiuni din indi vizii studiati. Concluziile relative la aceast fractiune, denumit eantion, trebuiesc a a s extinse pe c^t posibil la ansamblul indivizilor, care formeaz populatia. Aceast a a a faz inductiv presupune, desigur, anumite riscuri de eroare, care pot msurate a a a cu ajutorul teoriei probabilitilor. at Etapele unui studiu statistic nu sunt independente una de cealalt. Datorit conditiilor a a restrictive care pot aprea la inferenta statistic, observarea i experimentarea trebuiesc a a s organizate astfel ^ at s rspund c^t mai bine acestor conditii. inc^ a a a a

29

16
16.1

Populatie i caracteristici. Eantion s s


Denitii i clasicri s a

Pentru ^ inceput, vom introduce notiunile (termenii) de baz care se vor regsi ^ toate a a in etapele unui studiu statistic. s a a Def. Se numete populatie (colectivitate) statistic orice multime nevid de elemente ^ legtur cu un anumit fenomen. Elementele sale se mai numesc indivizi supus studiului in a a a sau uniti statistice. at Populatia statistic o vom nota cu , iar elementele sale cu ! 1 ; ! 2 ; ::: a a Obs. 1 Din punct de vedere matematic, populatia este modelat prin intermediul notiunii de multime. a a insu aa a Def. Caracteristica statistic reprezint ^ sirea, proprietatea sau trstura comun tuturor indivizilor unei populatii, i care st la baza studiului acelei populatii. Se noteaz s a a cu litere mari, X; Y;... i se mai numete variabil statistic sau variabil aleatoare. s s a a a Exemple a) Pentru populatia alctuit din studentii unei faculti, se pot studia caracteristici a a at precum: sex, v^rst, stare civil, notele la examene, media, etc. a a a b) Dac populatia este reprezentat de un anumit bun realizat ^ serie, atunci caractera a in isticile pot : calitatea (control de calitate), dimensiunea, pretul, etc. c) ^ cazul ^ care populatia este constituit din bunurile desfcute pe piat de o rm, In in a a a a caracteristicile considerate vor : sortimentele desfcute, cantitatea din ecare tip a de bun, pretul la desfacere, etc. d) Populatia dintr-o anumit zon geograc poate studiat din punct de vedere al: a a a a sex, v^rst, numr de ani de colarizare, stare civil, grupa socio-profesional, stare a a a s a a de sntate, culoare ochi, culoare pr, etc. a a a in a Obs. 2 Pentru ecare populatie se poate lua ^ studiu un numr mai mare sau mai ^ functie de cerintele analizei. Numrul caracteristicilor poate mic de caracteristici, in a limitat din considerente de ecient i de rationalitate. a s Caracteristicile determin descompunerea populatiei ^ grupe omogene, care pot a in studiate separat. Fiecare caracteristic are mai multe forme de manifestare numite i a s modaliti sau valori, care trebuie s satisfac urmtoarele principii: at a a a - principiul completitudinii: ecare individ al populatiei apartine unei clase denit de a una dintre modaliti; at - principiul unicitii : un individ apartine unei singure clase; at

30

- principiul organizrii ierarhice a claselor: clasele pot unicate prin mrirea gradului a a de generalitate al modalitilor. at Vom nota modalitile cu litere mici: x; y; ::: at a a a a Obs. 3 Din cele spuse mai sus rezult c variabila statistic poate modelat matematic prin intermediul notiunii de functie, av^nd ca domeniu de denitie multimea , iar a ca domeniu de valori o multime nevid de orice natur (numeric sau nu). a a a a a Clasicarea caracteristicilor se poate face dup mai multe criterii. Prezentm dou criterii: a a) Clasicare dup forma de prezentare: a - caracteristici cantitative: valorile lor sunt exprimate numeric. Exemple: nota, v^rsta, a greutatea, numrul de aruncri ale unei monede p^n la prima aparitie a stemei, a a a a etc. - caracteristici calitative: valorile lor nu se exprim numeric. Exemple: culoare ochi, a profesie, sex. a intr-o caracteristic de cellalt a a Obs. 4 O caracteristic de un tip se poate transforma ^ ^ cel cantitativ, prin nutip. Cea mai frecvent transformare este din tipul calitativ in a merotarea modalitilor. Spre exemplu, putem codica sexul astfel: 1-masculin, 2-feminin. at Invers, pentru a trece de la tipul cantitativ la cel calitativ, se pot deni grupe tipice de valori pentru caracteristica studiat. a b) Clasicare dup numrul modalitilor : a a at - caracteristici discrete: iau o multime cel mult numrabil de valori. Exemple: sex, a a nota. - caracteristici de tip continuu: iau valori ^ intr-un interval; pot doar de tip cantitativ. Exemplu: dimensiunile unei piese. a s s a Def. O submultime nit 1 se numete eantion sau selectie. Cardinalul su poart numele de volum de selectie. ^ general, eantionul este alctuit din acei indivizi a In s a ai populatiei pentru care s-a observat efectiv valoarea caracteristicii studiate.

16.2

Elemente de teoria scalrii a

Aa cum s-a vzut mai sus, caracteristicile pot msurate ^ mai multe moduri. Exist s a a in a patru tipuri principale de scal: scala nominal, scala ordinal, scala de interval i cea de a a a s raport.

31

16.2.1

Scala nominal a

Valorile unei caracteristici msurat pe scala nominal pot nume, numere sau simboluri, a a a ^ a nu se pot ordona. Ca urmare, caracteristicile exprimate ^ aceast scal sunt care ins in a a de tip calitativ i trebuiesc ^ s indeplinite conditiile: 1. Valorile scalei nominale sunt exhaustive i mutual exclusive; ecare observatie tres buie s corespun unei singure valori. Indivizii care iau aceeai valoare se consider a a s a echivalenti ^ raport cu caracteristica studiat. in a 2. Numele sau simbolurile care desemneaz valorile pot interschimbate fr a altera a aa informatiile transmise de scal. a a Exemple. Grupa sanguin (O, A, B, AB); culoarea ochilor, sex, etc. 16.2.2 Scala ordinal a

Valorile unei caracteristici msurat pe scala ordinal pot ordonate dup un anumit a a a a ^ a nu permit efectuarea de operatii aritmetice cu ele. Caracteristicile exprimate criteriu, ins ^ aceast scal sunt tot de tip calitativ i veric conditiile: in a a s a 1. Diferentele dintre valori nu sunt neaprat egale i pot chiar imposibil de msurat. a s a 2. Simbolurile asociate valorilor nu sunt importante at^ta timp c^t relatia de ordine a a este pstrat. a a a inr at a a imbuntit. a at a Exemplu. Starea unui pacient poate clasicat ca ^ autit, stabil sau ^ Referitor la prima conditie de mai sus, se observ c diferenta dintre starea \^ autit" a a inr at a i \stabil" nu este neaprat aceeai ca cea dintre \stabil" i \^ s a a s a s imbuntit". a at a 16.2.3 Scala de interval

Valorile unei caracteristici msurat pe scala de interval sunt numere echidistante. Scala a a nu are un \punct zero" (o origine care s reprezinte absenta caracteristicii msurate). Cu a a ajutorul acestei scale se poate determina c^t de mult (sau c^t de putin) din caracteristica a a msurat reprezint ecare valoare. Sunt permise operatii de adunare i de scdere ^ a a a s a intre ^ aceast scal sunt de tip cantitativ. valori. Caracteristicile exprimate in a a a in a Exemplu. Temperatura exprimat ^ grade Celsius (obervati c valoarea 0 este cea ^ la care ingheat apa i nu reprezint absenta temperaturii). a s a 16.2.4 Scala de raport

Pe scala de raport, msurtorile ^ a a incep dintr-un punct zero (origine) i valorile sunt echidiss tante. Sunt permise toate operatiile aritmetice, iar caracteristicile exprimate ^ aceast in a scal sunt de tip cantitativ. a 32

a in Exemple. Temperatura exprimat ^ grade Kelvin, lungimea, greutatea, volumul etc. (Chapter head:)Tabele de distributie. Gruparea datelor ^ vedere observatia 4 din sectiunea anterioar, ^ cele ce urmeaz vom considAv^nd in a a in a era numai caracteristici statistice cantitative.

16.3

Serii statistice (date brute)

Forma cea mai simpl de prezentare a datelor statistice provenind dintr-o singur varia a abil statistic este prin enumerarea observatiilor efectuate asupra variabilei: x1 ; x2 ; :::; xn . a a Aceast enumerare se numete serie statistic sau eantion, n ind volumul su. Unele a s a s a valori ale eantionului se pot repeta. s Dac datele din eantion se ordoneaz cresctor, rezult un ir variational, x(1) ; x(2) ; :::; x(n) ; a s a a a s unde 1) fx1 ; x2 ; :::; xn g = x(1) ; x(2) ; :::; x(n) : 2) x(1) x(2) ::: x(n) a in in s a a Exemplu. S-a msurat ^ altimea (^ cm) a 20 de copii dintr-o coal, obtin^ndu-se urmtoarea serie statistic: a a 133 130 136 131 120 125 138 144 133 128 131 134 127 141 127 143 135 137 133 129

Sirul variational corespunztor este: a 120 133 125 133 127 134 127 135 128 136 129 137 130 131 131 133 138 141 143 144

a a Obs. 1 Deoarece numrul datelor dintr-o serie statistic poate foarte mare (de ordinul miilor), aceasta devine greu de prelucrat i de studiat. Ca urmare, datele se s prezint i sub form de tabele de distributie. as a

17
17.1

Tabele de distributie. Tipuri de frecvente


Tabel de distributie a frecventelor absolute

Acest tip de tabel se obtine dintr-o serie statistic astfel: dac (x1 ; :::; xn ) este un eantion a a s de volum n de observatii fcute asupra variabilei statistice X, atunci: a 1. Se formeaz irul variational: x(1) ; x(2) ; :::; x(n) : as 2. Pe o coloan (linie) se trec doar valorile distincte din irul variational, e ele a s 0 0 0 x(1) ; x(2) ; :::; x(k) ; k n.

33

3. Pe a doua coloan (linie), ^ dreptul ecrei valori, se trece numrul su de aparitii a in a a a a din eantionul initial: n1 ; :::; nk . Acest numr de aparitii al unei valori observate x0(i) s se numete frecvent absolut, notat ni . s a a a Tabelul astfel obtinut se numete tabel de distributie a frecventelor absolute sau distributie s empiric (statistic, observat ) sau seria statistic a frecventelor absolute. a a a a Este uor de observat c, dac avem ^ total k valori distincte ^ irul variational, s a a in in s frecventele absolute veric relatia a n1 + ::: + nk = n: (1)

17.2

Tabel de distributie a frecventelor relative

Frecventele se pot exprima i ^ valori relative la numrul total de observatii. Aceste s in a frecvente se numesc relative i sunt denite prin s ni fn X = x0(i) = n0i = : n

ni a s Uneori se exprim ^ procente, sub forma 100 %. Tabelul corespunztor se numete al a in n frecventelor relative sau seria statistic a frecventelor relative. a ^ acest caz Relatia (1) devine in n01 + ::: + n0k = 1: a a Obs. 2 C^nd n este foarte mare, fn X = x0(i) = n0i P X = x0(i) , adic probabilitatea ca variabila statistic X rezultat ^ urma observatiilor s ia a i-a valoare distinct a a in a a din irul variational. s

17.3

Frecvente cumulate cresctor i descresctor a s a

^ scopul reprezentrii c^t mai compacte, inclusiv ^ form grac, a datelor statistice, ^ In a a in a a in statistic sunt utilizate frecventele cumulate. Acestea se obtin prin adunarea din aproape a ^ aproape a frecventelor absolute sau relative. in s a a a a a a Def. Se numete frecvent absolut cumulat cresctor (descresctor) corespunztoare unei valori x, suma frecventelor absolute ale tuturor valorilor variabilei mai mici sau egale cu x (mai mari sau egale cu x), anume ! X X ny ny :
yx yx

s a a a a a a Def. Se numete frecvent relativ cumulat cresctor (descresctor) corespunztoare unei valori x a variabilei, suma frecventelor relative ale tuturor valorilor variabilei mai 34

mici sau egale cu x (mai mari sau egale cu x), anume ! X X n0y n0y :
yx yx

a s a a a Obs. 3 Se observ uor c frecventa relativ cumulat este raportul dintre frecventa absolut cumulat i volumul populatiei. a as a in a Exemplu. Relu^nd datele de mai sus (^ altimile celor 20 de copii), avem urmtorul tabel cu frecventele absolute, relative i cumulate: s
^ al In imea t Frecv. abs. Frecv. relat. Frec. abs. cumul. cresc. Frec. abs. cumul. descresc. Frec. rel. cumul. cresc. Frecv rel. cumul. descresc.

120 125 127 128 129 130 131 133 134 135 136 137 138 141 143 144

1 1 2 1 1 1 2 3 1 1 1 1 1 1 1 1

0.05 0.05 0.1 0.05 0.05 0.05 0.1 0.15 0.05 0.05 0.05 0.05 0.05 0.05 0.05 0.05

1 2 4 5 6 7 9 12 13 14 15 16 17 18 19 20

20 19 18 16 15 14 13 11 8 7 6 5 4 3 2 1

0.05 0.1 0.2 0.25 0.3 0.35 0.45 0.6 0.65 0.7 0.75 0.8 0.85 0.9 0.95 1

1 0.95 0.9 0.8 0.75 0.7 0.65 0.55 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05

17.4

Tabele de distributie grupate

Pentru un volum n foarte mare de date distincte, se recomand gruparea lor ^ clase a in (intervale de valori), sub forma: Intervalul [y1 ; y2 ) [y2 ; y3 ) ::: [ys ;P ) ys+1 Frecv. abs. Frecv. relat. n1 n01 n2 n02 ::: ::: ns n0s n 1

Valoarea central (mijlocul) unei clase este, pentru clasa [yi ; yi+1 ); a ci = yi + yi+1 : 2 35

a a in Exemplu. S grupm datele de mai sus ^ intervale de lungime 5: Intervalul [120; 125) [125; 130) [130; 135) [135; 140) [140; 145) P Frecv. abs. Frecv. relat. 1 0:05 5 0:25 7 0:35 4 0:2 3 0:15 20 1

17.5

Tabele de distributie pentru dou caracteristici a

Dac analiza statistic se face dup dou caracteristici, rezultatele obtinute se trec ^ a a a a intr-o tabel cu dou intrri. a a a a s a Exemplu. Clasicarea a 1500 de persoane dup culoarea ochilor i a prului: Culoare pr a negru castaniu blond P Culoare ochi negri cprui verzi albatri a s 145 285 30 11 62 431 87 67 33 36 185 128 240 752 302 206 P

471 647 382 1500

Din acest tip de tabel sunt uor de obtinut tabelele de distributie ale ecrei caracters a isticii ^ parte, denumite i distributii marginale. Pe exemplul numeric, avem: in s Culoare pr Frecv. abs. a negru 471 castaniu 647 blond 382 P 1500 Culoare ochi Frecv. abs. negri 240 cprui a 752 verzi 302 albatri s 206 P 1500

36

18
18.1

Reprezentri grace a
Diagramele frecventelor necumulate

Se pleac de la seria frecventelor absolute sau relative i se pot trasa trei tipuri de dia s agrame: diagrama cu bastonae, histograma (diagrama cu dreptunghiuri) i poligonul s s frecventelor. Pentru toate cele trei tipuri de diagrame, pe axa OX se trec valorile ob servate, iar dac se lucreaz cu date grupate, se trec limitele intervalelor sau centrele a a lor. 18.1.1 Diagrama cu bastonae s

Acest tip de grac este foarte bun pentru datele negrupate. Astfel, pentru ecare valoare observat distinct se traseaz un segment vertical de lungime egal cu frecventa a a a a corespunztoare valorii respective. a 18.1.2 Histograma

Se aplic pentru datele grupate ^ intervale. Este alctuit din dreptunghiuri av^nd ca a in a a a ^ functie de baz intervalele de valori, iar aria lor este proportional cu frecventele. In a a lungimea intervalelor, avem dou cazuri: a 1. Histograme pentru intervale de lungimi egale, caz ^ care ^ altimea ecrui drepin in a tunghi coincide cu frecventa intervalului care st la baza sa. a 2. Histograme pentru intervale de lungimi inegale; ^ acest caz, pentru calcularea in ^ altimii dreptunghiurilor se aplic urmtorul algoritm: in a a - pe o coloan separat se trec lungimile tuturor intervalelor; a a - se alege o lungime standard (cea care apare mai frecvent sau care este mai mic); a - pentru un interval oarecare, dac lungimea sa este egal cu ( lungimea stana a ^ altimea dreptunghiului corespunztor va dard), atunci in a 1 frecventa corespunztoare acelui interval . a a in in Exemplul 1. Considerm datele anterioare (^ altimile celor 20 de copii) grupate ^ clase de lungime 5. Histograma este cea din g. 1. a a in Exemplul 2. Considerm masele a 35 de obiecte, msurate ^ kg. Datele sunt grupate ca ^ tabelul de mai jos, iar ^ g. 2 este trasat histograma corespunztoare. in in a a Masa Frecvent Lungime interval ^ altime dreptunghi a In [6; 9) 4 3 standard 4 [9; 12) 6 3 standard 6 [12; 18) 10 6 2 standard 10=2 = 5 [18; 21) 3 3 standard 3 [21; 30) 12 9 3 standard 12=3 = 4 37

18.1.3

Poligonul frecventelor

Se obtine unind prin linii (fr^nte) extremitile superioare ale bastonaelor din diagrama a at s cu bastonae sau mijloacele extremitilor superioare ale dreptunghiurilor din histogram. s at a

18.2

Diagramele frecventelor cumulate

Frecventele cumulate se reprezint ca mai ^ a inainte, dar numai prin histograme sau prin poligoanele frecventelor.

18.3

Diagrame circulare ("pie" sau "plcint") a a

Ariile sectoarelor de cerc dintr-o asemenea diagram sunt proportionale cu frecventele. a a a a a a Exemplu. Considerm v^nzrile de benzin de la patru benzinrii, notate A, B, C, D.
Benzinrie a V^nzri a a (sute litri) Unghiul sectorului

A B C D P

90 140 30 20 280

360 90=280 = 115:7 360 140=280 = 180 360 30=280 = 38:6 360 20=280 = 25:7

38

Aceste diagrame se pot utiliza pentru a compara dou sau mai multe seturi de date a similare. Spre exemplu, dac se reprezint structura culturilor agricole pentru un teren a a ^ intr-o diagram circular, putem compara diagramele a dou zone diferite. a a a

39

19
19.1

Valori caracteristice
Parametri de pozitie

Parametrii de pozitie sunt valori de referint la care se raporteaz toate valorile unui a a ^ cele ce urmeaz vom prezenta principalii asemenea parametri, anume media, eantion. In s a mediana i moda (modul). s 19.1.1 Media (de selectie), x

Este vorba despre media aritmetic obinuit. Calculul su depinde ^ a de modul de a s a a ins grupare al datelor. Astfel, cu notatiile din sectiunile anterioare, avem: - pentru un eantion (date brute) x1 ; x2 ; :::; xn , media este s n 1X x= xi ; n i=1 - pentru datele dintr-un tabel de distributie a frecventelor absolute sau relative, media se calculeaz prin a x= - pentru datele grupate ^ intervale, in 1X x= ci ni : n i=1
k

X 1X 0 x(i) ni = x0(i) n0i ; n i=1 i=1

Reamintim i denitia mediei ponderate a eantionului x1 ; x2 ; :::; xn , cu ponderile fi > s s 0; i = 1; n; n P fi xi i=1 xf = P : n fi


i=1

in a a Interpretare. x este valoarea ^ jurul creia se grupeaz valorile caracte-risticii studiate. Proprietate. a) Media veric relatia a s in x b) Dac valorile xi din eantionul initial sunt transformate ^ yi = a+bxi ; atunci y = a+b: a c) Dac se combin (concateneaz, comaseaz) dou eantioane de volume m, n i de medii a a a a a s s x, respectiv y , atunci media eantionului rezultat este s m + ny x z= : m+n 40 x(1) x x(n) :

19.1.2

Mediana

Mediana este acea valoare care are proprietatea c jumtate dintre observatiile din eantion a a s sunt mai mici sau egale cu ea, cealalt jumtate dintre observatii ind mai mari sau egale a a dec^t ea. Cu alte cuvinte, mediana este acea valoare numeric ce ^ a a imparte irul variational s ^ dou prti egale. Calculul su se face tot ^ functie de corespunztor eantionului dat in a s a a a in modul de grupare al datelor: a - pentru un eantion x1 ; x2 ; :::; xn , mediana se calculeaz astfel: s 1. se ordoneaz cresctor eantionul; a a s 2. dac n este impar, atunci mediana este observatia de rang a par, mediana este x n + x n +1 =2: 2 2 n+1 , iar dac n este a 2

s Exemplu. Pentru eantionul 7; 7; 2; 3; 4, mediana este 4, iar pentru 36; 41; 27; 32, este (32 + 36) =2 = 34: - pentru datele dintr-un tabel de distributie: presupunem c se cunoate n, deci putem a s aa frecventele absolute (inclusiv pe baza frecventelor relative). Mediana rezult astfel: a 1. se calculeaz frecventele absolute cumulate cresctor; a a 2. se calculeaz (n + 1) =2; a 3. se determin prima linie din tabel pentru care frecventa absolut cumulat cresctor a a a a este (n + 1) =2; valoarea similar de pe linia precedent ind < (n + 1) =2. Vala a oarea caracteristicii corespunztoare acestei linii este mediana. a O alt metod care se poate aplica ^ acest caz, dac n nu este prea mare, const ^ a a in a a in ^ ordine cresctoare (irul variational) p^n la cea de-a scrierea valorilor caracteristicii in a s a a (n + 1) =2 -a valoare, care va chiar mediana. - pentru datele grupate ^ intervale, aarea medianei se face astfel: in 1. se traseaz grac curba frecventelor absolute cumulate cresctor; a a 2. pentru y = (n + 1) =2; se a prin interpolare x-ul corespunztor de pe curba a a trasat. Acesta este mediana cutat. a a a o n Proprietate. Fie 2 x0(1) ; x0(2) ; :::; x0(k) . Atunci k ! k X X 0 x ni = x0 mediana ni : min (i) (i)
i=1 i=1

41

19.1.3

Moda (modul)

Moda (modul) este valoarea din eantion creia ^ corespunde cea mai mare frecvent s a ii a absolut (relativ). a a s s - pentru un eantion (date brute) x1 ; x2 ; :::; xn , se construiete un tabel de distributie i s se procedeaz ca mai jos; a - pentru datele dintr-un tabel de distributie a frecventelor absolute sau relative, se de termin nx = maxny ; x ind chiar moda; a
y

- pentru datele grupate ^ intervale, se parcurg paii: in s 1. se traseaz histograma; a 2. se alege cel mai ^ inalt dreptunghi din histogram; a 3. cu notatiile din gur, moda = a + a d1 c: d1 + d2

19.1.4

Cuartile i percentile s

Se numesc cuartile cele trei valori care ^ impart irul variational ^ patru prti egale. Cele s in a 99 de valori care ^ impart irul variational ^ s intr-o 100 de prti egale se numesc percentile. a Astfel, consider^nd n elemente aranjate cresctor, avem: a a Cuartila inferioar a Mediana Cuartila superioar a A 10-a percentil a A 90-a percentil a Q1 Q2 Q3 P10 P90 valoarea valoarea valoarea valoarea valoarea 42 a a a a a
1 (n + 1)-a 4 1 (n + 1)-a 2 3 (n + 1)-a 4 10 (n + 1)-a 100 90 (n + 1)-a 100

etc:

Denim i distanta intercuartile = Q3 Q1 , iar semi-distanta intercuartile = (Q3 Q1 ) =2: s Avantajul acestor distante este acela c ele depind exclusiv numai de valorile din mijlocul a irului variational, neind afectate de valorile extreme. s Aarea cuartilelor i percentilelor se face similar cu aarea medianei. s a s a Exemplu. S se ae cuartilele Q1 ; Q3 i semi-distanta intercuartilelor pentru urmtorul eantion: s 3; 2; 3; 9; 6; 6; 12; 11; 8; 2; 3; 5; 7; 5; 4; 4; 5; 12; 9 a a Solutie. Avem 19 numere, pe care le ordonm cresctor: 2; 2; 3; 3; 3; 4; 4; 5; 5; 5; 6; 6; 7; 8; 9; 9; 11; 12; 12 a Cuartila inferioar este valoarea a 5-a, deci Q1 = 3: Cuartila superioar este valoarea a a 15-a, deci Q3 = 9: Rezult c semi-distanta intercuartilelor =(Q3 Q1 ) =2 = 3: a a

19.2

Parametri de ^ imprtiere as

Aceti parametri msoar gradul de ^ s a a imprtiere al valorilor observate fat de parametrul as a de pozitie dat. 19.2.1 Amplitudinea

Amplitudinea absolut este diferenta dintre valoarea cea mai mare i valoarea cea mai a s mic din eantion, deci a s A = xmax xmin = x(n) x(1) : Amplitudinea relativ este raportul dintre amplitudinea absolut i medie, anume A=: a as x ^ intervale. Amplitudinea nu se denete pentru datele grupate in s a a a Obs. Spre deosebire de amplitudinea absolut, amplitudinea relativ poate utilizat pentru compararea gradului de ^ imprtiere a dou eantioane diferite, chiar i atunci c^nd as a s s a valorile acestora au uniti de msur diferite. at a a 19.2.2 Abateri medii

Acestea pot de mai multe tipuri, ^ functie de valoarea de referint: in a - abaterea medie liniar absolut fat de medie este, pentru eantionul x1 ; :::; xn ; a a a s 1X jxi xj ; n i=1
n

43

- abaterea medie liniar absolut fat de median este a a a a 1X jxi medianaj ; n i=1 - abaterea medie liniar absolut fat de mod este a a a a 1X jxi mo daj : n i=1 19.2.3 Dispersia i abaterea medie ptratic s a a s a Dispersia unui eantion se noteaz cu s2 (uneori cu 2 ) i se calculeaz astfel: s a - pentru un eantion (date brute) x1 ; x2 ; :::; xn , s s2 = 1X (xi x)2 ; n i=1
n n n

- pentru datele dintr-un tabel de distributie a frecventelor absolute sau relative, s2 =


k k X 2 2 1 X 0 x(i) x ni = x0(i) x n0i ; n i=1 i=1

- pentru datele grupate ^ intervale, in s2 = 1X (ci x)2 ni : n i=1


k

a a imprtiere al valorilor observate ^ jurul as in Interpretare. Dispersia msoar gradul de ^ ^ mediei. Cu c^t dispersia este mai mare, cu at^t imprtierea valorilor din eantion fat a a as s a de medie este mai mare, i reciproc. s Abaterea medie ptratic se denete ca ind radical din dispersie, deci a a s p s = s2 : a a a a a Interpretare. Abaterea medie ptratic este o msur foarte util a gradului de ^ imprtiere. Pentru cele mai multe distributii, majoritatea observatiilor se situeaz ^ as a in intervalul ( 3s; x + 3s) (regula celor "3"). x Proprieti. at a) Dac x1 = x2 = ::: = xn atunci s2 = 0: a 44

b) O formul alternativ pentru calculul dispersiei este a a x s2 = x2 ()2 : c) Dac valorile xi din eantionul initial sunt transformate ^ yi = a + bxi ; atunci a s in s2 = b2 s2 : y x d) Consider^nd functia a 1X (xi a)2 ; f (a) = n i=1
n

atunci minf (a) = f () = s2 : x


a2R

e) Dac se combin dou eantioane de volume n, m, de medii x0 , respectiv x00 , i de a a a s s 2 2 dispersii s1 , respectiv s2 , atunci media eantionului rezultat o notm cu x (formula s a sa este dat la media de selectie), iar dispersia este a s2 = ns2 + ms2 n (0 x)2 + m (00 x)2 x x 1 2 + : n+m n+m

Primul termen al sumei reprezint dispersia ^ interiorul "grupelor" (eantioanelor), a in s iar al doilea termen reprezint dispersia dintre "grupe" (eantioane). a s

45

20

Aplicatii
47 49 44 75 62 53 71 36 61 60 39 34 37 46 81 72 74 62 65 53 47 52 38 25 42 40 70 63 62 83 19 26 59 52 88 91 51 52 24 80 69 59 32 33 27 18 22 73 59 36 34 31 21 63 72 54 18 71 43 44 18 93 12 15 60 71 82 13 61 64 25 63 82 71 11 58 64 39 16 23 10 92 83 74 43 29 85 65 42 57 70 63 54 55 49 81 47 72 65 63 60

1. Se consider punctajele obtinute de 101 elevi la un test: a

a) S se construiasc un tabel de distributie contin^nd frecvente absolute, relative, a a a absolute cumulate cresctor i descresctor, datele grup^ndu-se ^ intervalele [10,19]; a s a a in [20,29]; [30,39]; ...; [90,99]. b) S se traseze histograma corespunztoare. a a c) S se determine media, mediana, moda i dispersia. a s 2. Se dau urmtoarele date, reprezent^nd distributia a 20 de rme dup cifra de afaceri a a a (^ intr-o unitate monetar corespunztoare): a a Cifra de afaceri Numr de rme a [10,20) 1 [20,30) 3 [30,40) 6 [40,50) 8 [50,60) 2 P 20

a) S se completeze tabelul cu frecventele relative, frecventele relative cumulate a cresctor i cele cumulate descresctor. a s a b) S se traseze histograma corespunztoare. a a c) S se determine media, mediana, moda i dispersia. a s d) Presupunem c se regrupeaz datele astfel ^ at intervalele cifrelor de afaceri a a inc^ devin: [10,30); [30,40); [40,60). S se scrie noul tabel al frecventelor absolute i s a s a se traseze histograma corespunztoare. a 3. ^ Intr-un studiu menit s determine efectul fumatului asupra metabolismului fenacetinei, a s-a administrat fenacetin la dou grupuri de persoane: primul alctuit din 12 a a a fumtori i al doilea grup alctuit din 14 nefumtori. Dup 2 ore, s-a msurat a s a a a a ^ tabelul nivelul fenacetinei din plasm la toate persoanele. Acesta este trecut in a de mai jos, alturi de v^rsta i statutul de fumtor (+ pentru fumtor, - pentru a a s a a nefumtor) al ecrui participant la studiu. a a a) S se calculeze media, mediana i moda fenacetinei pentru ecare grup de pera s soane. Sugereaz aceste valori ceva despre forma distributiei frecventelor din ecare a grup?

46

b) S se calculeze dispersia, abaterea medie ptratic i amplitudinea absolut a a a a s a fenacetinei pentru ecare grup. c) S se construiasc tabelul frecventelor absolute ale fenacetinei pentru ecare grup a a ^ parte, grup^nd datele ^ intervale c^t mai convenabile. S se traseze histograma. in a in a a Care este forma ecrei distributii? a d) Ce sugereaz rezultatele acestui studiu statistic ^ legtur cu efectul calitativ al a in a a fumatului asupra concentratiei de fenacetin? a e) Este valoarea medie a fenacetinei o msur exact a valorii centrale din grupul a a a fumtorilor? De ce? a f) Presupunem c este cunoscut faptul c metabolismul fenacetinei crete cu v^rsta. a a s a Cum afecteaz acest factor concluzia punctului (d)? a Participant 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 V^rsta Fumtor/Nefumtor Nivel fenacetin a a a a 25 0.45 22 + 0.03 38 { 0.75 45 1.40 25 + 0.01 28 + 0.01 28 1.28 38 + 0.02 48 1.83 32 + 0.61 32 + 0.52 35 1.69 32 1.91 69 2.15 72 2.30 43 + 1.12 58 2.48 49 2.75 55 + 1.01 42 2.81 25 + 1.52 26 + 2.55 55 3.28 65 3.55 28 + 0.01 71 + 3.80

4. 100 de persone au fost rugate s noteze c^te programe TV au urmrit ^ timpul a a a in unei sptm^ni. S se reprezinte datele din tabel sub forma de histogram. a a a a a

47

Nr. de programe [0,10) [10, 18) [18,30) [30,35) [35,45) [45,50) [50,60) Nr. de telespectatori 3 16 36 21 12 9 3 5. ^ tabelul de mai jos sunt trecute v^nzrile din anul 1978 pentru cinci companii care In a a alctuiesc un consortiu. a Companie V^nzri (^ mii de $) a a in A B C D E 55 130 20 35 60

a) S se reprezinte aceste date printr-o diagram circular de raz 5 cm. a a a a b) ^ anul 1979, v^nzrile totale au crescut cu 20%, iar aceast cretere s-a mentinut In a a a s ^ anul 1980. Dac s-ar trasa diagrame circulare pentru a compara v^nzrile totale i in s a a a pentru ecare dintre anii 1979 i 1980 cu v^nzrile totale din 1978, care ar raza s a a ecreia dintre cele dou diagrame? a a c) Dac v^nzrile companiei E ar ^ anul 1980 de 60000$, care ar unghiul a a a in sectorului corespunztor? a 6. S-a efectuat un sondaj printre gospodinele casnice, pentru a stabili c^t au cheltuit a acestea pe diverse produse. Doamna X a raspuns conform tabelului urmtor: a Produs A B C Dna X 1.50$ 3.50$ 3.00$ a) S se reprezinte datele printr-o diagram circular de raz 4 cm. a a a a b) S-a efectuat o comparatie cu diagrama circular care ilustreaz rspunsurile a a a doamnei Y. Aceasta este de raz 5 cm, sectorul corespunztor cheltuielilor cu proa a dusul A are un unghi de 72 , iar cheltuielile cu produsul B se ridic la valoarea a de 4$. Aati c^t a cheltuit doamna Y cu produsul C i trasati diagrama circular a s a corespunztoare cheltuielilor sale. a 7. Vericarea ansamblrii a 34 de avioane a condus la depistarea unor nituri lips, a a datele ind cele din tabelul de mai jos.
Nituri lips a Frecv. abs. [0,2] 4 [3,5] 9 [6,8] 11 [9,11] 6 [12,14] 2 [15,17] 1 [18,20] 0 [21,23] 1

S se reprezinte diagrama frecventelor cumulate cresctor. Pe baza curbei obtinute, a a s se estimeze mediana i cuartilele distributiei. a s 8. Dac se consider eantionul (x1 ; :::; xn ), s se demonstreze formula a a s a 1X 2 xi ()2 : x s = n i=1
n 2

^ Anglia s-a efectuat un sondaj de opinie printre adolescentele sub 20 de ani, una In dintre ^ intrebri ind "Care este v^rsta ideal pentru o fat, pentru a avea primul a a a a 48

copil?". Din rspunsurile primite de la un eantion de 165 de fete din zona de nord a s a Angliei, a rezultat o medie de 23.4 ani i o abatere medie ptratic de 1.6 ani. s a a ^ Pe total, intregul eantion (nord i sud) a furnizat o medie de 24.8 ani i o abatere s s s medie ptratic de 2.2 ani. Dac ecare fat a fost ^ a a a a intrebat o singur dat, care a a a este media i abaterea medie ptratic a eantionului alctuit din cele 219 fete din s a a s a zona sudic? a 9. O statie meteorologic a ^ a inregistrat numrul de ore de strlucirea soarelui zilnic, a a timp de 80 de zile. Rezultatele sunt cele din tabel.
Nr. ore lumin a Nr. zile

0 (0,1] (1,2] (2,3] (3,4] (4,5] (5,6] (6,7] (7,8] (8,12] peste 12 10 2 6 17 22 11 5 3 2 2 0

a) S se determine care esta clasa modal. a a b) S se construiasc diagrama frecventelor cumulate cresctor. Pe baza curbei a a a obtinute, s se estimeze: mediana, distanta intercuartile i proportia zilelor ^ care a s in s-au ^ inregistrat mai mult de 3 1 ore de strlucirea soarelui. a 2 10. Tabelul de mai jos contine durata a 60 de drumuri efectuate pe aceeai rut de un s a camion, variatiile ind cauzate de trac.
Durata ^ ore in Nr. drumuri [5.6;5.8) 2 [5.8;6) 7 [6;6.2) 16 [6.2;6.4) 21 [6.4;6.6) 12 [6.6;6.8) 2

a) S se estimeze media i abaterea medie ptratic a duratelor. a s a a b) Consider^ndu-se duratele altor 40 de drumuri, s-au calculat o medie de 6h 24min. a i o abatere medie ptratic de 18min. S se detremine media i abaterea medie s a a a s ptratic pentru toate cele 100 de durate la un loc. a a 11. Tabela urmtoare contine productia de lapte dintr-o zi, ^ litri, de la 131 de vaci a in dintr-o ferm. a Litri [5,10] [11,16] [17,22] [23,28] [29,34] [35,40] Frecventa 15 28 37 26 18 7 a) Determinati clasa modal i estimati moda. as b) Estimati, prin calcule, productia medie de lapte. c) Construiti diagrama frecventelor cumulate cresctor i, pe baza ei, estimati semi a s distanta intercuartile. d) Calculati media i dispersia distributiei. s 12. ^ Intr-o anumit ramur industrial, repartizarea angajatilor pe clase de v^rst este a a a a a cea din tabel (^ mii de persoane). in

49

V^rsta a

Nr. ^ mii in

V^rsta a

Nr. ^ mii in

[15,19] [20,24] [25,29] [30,34] [35,39]

66 65 56 50 42

[40,44] [45,49] [50,54] [55,59] [60,64]

37 35 30 24 22

a) Calculati media, mediana, dispersia i abaterea medie ptratic a v^rstei anagajatilor. s a a a b) Estimati proportia angajatilor a cror v^rst este cuprins ^ a a a a intre medie abaterea medie ptratic. a a

BIBLIOGRAFIE
1. Dumitrescu, M. (1989)- Curs de statistic matematic. Universitatea din Bucureti. a a s 2. Feller, W. (1966)- Introduction to probability theory and its applications. Willey, New York. 3. Leahu, A. (2000)- Probabiliti. \Ovidius" University Press. at 4. Mihoc, Gh i Craiu, V. (1976{1979)- Tratat de statistic matematic. Vol. I-IV. s a a Ed. Academiei. 5. Vernic, R. (2003) - Statistica. Editura Adco, Constanta.

50

S-ar putea să vă placă și