Sunteți pe pagina 1din 125

Mihai Boleantu

STATISTICA
(manual electronic - anul I - studenti economisti)
2016

grupul yahoo:
https://groups.yahoo.com/neo/groups/matstat12/info

CUPRINS

Introducere
I. Elemente de teoria probabilitilor ..................................................................... pag. 1
II. Variabile aleatoare discrete i continue ..............................................................pag. 21
III. Repartiii clasice ................................................................................................. pag. 53
IV. Serii statistice ....................................................................................................... pag. 76
V. Elemente de Teoria Estimaiei ..............................................................................pag. 100
VI. Verificarea ipotezelor statistice ...........................................................................pag. 110
Formular cu formule utile ........................................................................................ pag.122
Bibliografie - la sfarsitul fiecarui capitol.

Introducere

Materialul acesta este format din ase capitole (I.Elemente de teoria


probabilitilor, II. Variabile aleatoare discrete i continue, III. Repartiii clasice,
IV. Serii statistice, V. Elemente de Teoria Estimaiei i VI. Verificarea ipotezelor
statistice), teorie i aplicaii practice. Materialul reprezint o introducere
elementar n domeniul extrem de important pentru economiti - Statistica !! Vei
utiliza pri din acest material att sub form electronic (link-uri, soft) ct i ca
text ("carte"). Prin urmare se salveaz, se listeaz i se leag urgent !!

Materialul a fost conceput astfel nct s fie util i pentru studenii care vor
s nvee mai mult dect se cere pentru examenul de Statistic. Pentru a nelege
bine prile din material cerute la examen este obligatorie prezena la cursuri. La
cursuri vom studia n plus i alte aplicaii practice. Urmrii sptmnal mesajele
de pe grup (pe care le vei primi i n csua personal de mail). Putei pune
ntrebri de Statistic la cursuri dar i prin email.

Vei primi teme de cas i vei susine un test scris n timpul semestrului.
Nota final se stabilete pe baza activitii din timpul semestrului (20%) i a
rezultatului de la examenul final (scris). Detaliile le vom stabili la curs.

I. Elemente de teoria probabilitilor

O experien aleatoare este o experien ale crei rezultate se cunosc numai


dup efectuarea sa. De exemplu, aruncarea unui zar sau alegerea la ntmplare a unui
produs dintr-un stoc de produse ale unei firme. Vom nota cu (E) o experien aleatoare
i vom folosi formulri de tipul
(E): se arunc un zar cu 6 fee
sau
(E): se alege la ntmplare un student din seria 5, etc.

Efectuarea o singur dat a unei experiene aleatoare se numete prob.

Un eveniment aleator este un eveniment care se poate produce (realiza) sau nu


la o efectuare a experienei. Realizarea sau nerealizarea unui eveniment aleator nu poate
fi prezis nainte de efectuarea experienei. Unei experiene aleatoare i se pot asocia mai
multe evenimente aleatoare. Un eveniment aleator oarecare se exprim, n probleme,
dup cum este convenabil, fie printr-un enun logic sau printr-o mulime. De exemplu,
pentru experiena de aruncare a zarului (pe care o vom folosi pentru ilustrare mai jos),
putem considera evenimentul aleator

A: "se obine un numr par"


sau
A {2, 4, 6} .

2
Evenimentul imposibil este un eveniment care nu se realizeaz niciodat, ori de
cte ori repetm aceeai experien. Poate fi formulat n multe feluri. Ca mulime, se
exprim ntotdeauna prin mulimea vid, i se noteaz cu (litera "fi"). De exemplu,
B: "se obine un numr mai mare ca 10". Deci B = .

Evenimentul sigur este un eveniment care se realizeaz la fiecare efectuare


identic a unei anumite experiene. Poate fi formulat n mai multe feluri i se noteaz cu
("omega" mare). De exemplu, : "se obine un numr natural din intervalul [1, 6] ".

Deci {1, 2, 3, 4, 5, 6} .

Evenimente echivalente: fie X i Y dou evenimente aleatoare asociate aceleiai


experiene aleatoare. Spunem c X implic pe Y dac ori de cte ori se realizeaz X se
realizeaz i Y. Scriem X Y i citim "X inclus n Y" sau "X l implic pe Y". De
exemplu, fie X: "se obine faa 2" i Y: "se obine un numr par". Avem
X {2} Y {2, 4, 6} . Dac evenimentele X i Y se implic unul pe cellalt atunci

spunem c ele sunt echivalente i scriem X Y . Prin convenie avem X , pentru


orice eveniment aleator X i X , de asemenea.

Eveniment elementar (simplu): este un eveniment aleator implicat numai de el


nsui i de evenimentul imposibil. De exemplu, A: "se obine faa 3" adic A {3} este
un eveniment elementar deoarece A i A A i nu avem alte incluziuni n A.
Spaiul de selecie asociat unei anumite experiene aleatoare este mulimea tuturor
evenimentelor elementare asociate unei experiene aleatoare. Se identific de obicei cu

3
evenimentul sigur i de aceea se noteaz tot cu . De obicei este o mulime finit dar
uneori poate fi i infinit. n exemplul nostru {{1}, {2}, ..., {6}} {1, 2, ..., 6} .

Un eveniment compus este un eveniment implicat de mai multe evenimente


elementare. De exemplu, A: "se obine un numr mai mic dect 4" sau A {1, 2, 3} , este
un eveniment compus. Pentru orice experien aleatoare, se poate demonstra c exist n
total 2n evenimente aleatoare asociate acesteia, unde n card este numrul de
elemente ale spaiului de selecie. n cele 2n evenimente aleatoare intr toate
evenimentele elementare, toate cele compuse, evenimentul imposibil i evenimentul
sigur.

Observaie. Expresia "se poate demonstra" va apare des n acest curs. Aceasta
nseamna c nu v cer demonstraiile matematice ale rezultatelor folosite (fiind un curs
elementar de statistic) dar vom aplica n probleme aceste rezultate, deci trebuie tiute.

Evenimente incompatibile: sunt dou evenimente X i Y care nu se pot realiza


simultan la o efectuare a unei experiene. Scriem X Y = . n caz contrar X i Y se
numesc evenimente compatibile. De exemplu A: "se obine un numr par" i B: "se
obine faa 3 sau faa 5" sunt incompatibile, A={2, 4, 6} i B {3, 5} , A B . Dar
C: "se obine faa 3 sau faa 6" i D: "se obine un numr impar" sunt evenimente
compatibile deoarece C D={3} .

Evenimente opuse (sau contrare, complementare): dac A este un eveniment


aleator asociat unei experiene aleatoare, notm cu A - A opusul lui A. Evenimentul

4
A se realizeaz atunci i numai atunci cnd nu se realizeaz A. De exemplu, dac

considerm X: "se obine faa 4" atunci X ={1, 2, 3, 5, 6} . Evident, n general, dac dou
evenimente sunt contrare atunci ele sunt i incompatibile. Reciproca este fals: de
exemplu, A {1, 2, 3} i B ={4, 6} sunt incompatibile dar nu sunt opuse, deoarece
A {4, 5, 6} B .

Reuniunea a dou evenimente aleatoare A i B este tot un eveniment aleator,


notat cu A B , care se realizeaz atunci cnd se realizeaz cel puin unul din
evenimentele A i B. Intersecia a dou evenimente aleatoare A i B este un
eveniment aleator care se realizeaz atunci i numai atunci cnd se realizeaz simultan
A i B. Se noteaz cu A B . Diferena a dou evenimente aleatoare A i B este
evenimentul aleator care se realizeaz atunci cnd se realizeaz A i nu se realizeaz B.
l notm cu A B i evident avem c A B A B .

Observaie: se pot considera reuniuni i intersecii de mai multe evenimente


aleatoare, n numr finit sau chiar infinit. Operaiile cu evenimente definite mai sus
corespund la operaiile obinuite cu mulimi dac A i B sunt exprimate ca mulimi.

Definiia clasic a probabilitii. Fie (E) o experien aleatoare oarecare i


{1 , 2 , ..., n } spaiul de selecie asociat acesteia. Presupunem c evenimentele

elementare 1 , 2 , ..., n sunt echiprobabile (egal probabile), adic au aceeai ans de


realizare la o efectuare a experienei. (Cum ar fi de exemplu cele 6 evenimente
elementare de la experiena de aruncare a zarului, dac zarul este bineneles perfect
omogen i simetric). Fie A un eveniment aleator, simplu sau compus, format din

5
k din cele n evenimente echiprobabile ale lui , adic A {i1 , i2 , ..., ik } , 1 k n .

Se definete probabilitatea de realizare a evenimentului A i se noteaz cu P ( A)


(citim
P ( A)

"pe

de

A")

ca

fiind

raportul

P ( A)

k
.
n

Se

mai

spune

numarul de cazuri favorabile realizarii evenimentului A


.
numarul total de cazuri posibile ale experientei

De exemplu, pentru experiena de aruncare a zarului, dac considerm A: "se


obine cel puin 5", atunci P ( A)

2 1
33% .
6 3

Definiia statistic (sau empiric) a probabilitii. Considerm o experien


aleatoare (E) i A un eveniment asociat acesteia. S presupunem c experiena se repet
de n ori n condiii identice i c evenimentul A se realizeaz de k ori (n cele n repetri).
Evident c 0 k n . "k" se numete frecvena absolut de realizare a evenimentului A
iar raportul

k
se numete frecvena relativ de realizare a lui A. Practica ne arat c
n

dac n crete foarte mult, n anumite condiii pe care le presupunem ndeplinite (peste
tot n acest curs), raportul

k
tinde spre o anumit valoare p . Numrul p [0, 1] se
n

numete probabilitatea statistic sau empiric de realizare a lui A i vom folosi


aproximarea p

k
, pentru valori mari ale lui n. Vom aborda mai precis aceast idee
n

mai trziu (vezi "legea numerelor mari").

6
Observaie. De multe ori n probleme apar formulri de genul "se tie c ... un
anumit eveniment se realizeaz cu probabilitatea cunoscut p ". n astfel de situaii se
subnelege c p a fost calculat cu definiia empiric a probabilitii.

Funcia de probabilitate i proprietile sale. Considerm o experien


aleatoare oarecare (E), spaiul de selecie asociat acesteia (sau evenimentul sigur) i
notm cu K mulimea tuturor evenimentelor aleatoare asociate experienei, adic
mulimea format din toate submulimile lui . K conine evenimentele aleatoare
simple sau compuse i include i evenimentul imposibil i cel sigur, . Din cele
discutate mai sus, am vzut c putem construi de fapt o funcie P : K [0, 1] care
asociaz la fiecare eveniment A K un numr real din intervalul [0, 1] i anume
probabilitatea de realizare a evenimentului A , adic P ( A) [0, 1] . Se poate demonstra
c aceast funcie are urmtoarele proprieti:

P () 1 ; P ( ) 0

P ( X ) 1 P ( X ) , pentru orice eveniment X K

Dac X Y atunci P ( X ) P (Y ) , pentru orice evenimente aleatoare X , Y K


P ( X Y ) P ( X ) P (Y ) P ( X Y ) , () X , Y K
P ( X Y ) P ( X ) P ( X Y ) , () X , Y K
n

i 1

i 1

P ( Ai ) P ( Ai ) , adic "probabilitatea reuniunii este egal cu suma probabilitilor",

care are loc numai dac evenimentele aleatoare respective sunt incompatibile cte dou,
adic Ai A j , dac i j .

Tripletul (, K , P ) l numim cmp de probabilitate asociat experienei (E).

Probabiliti condiionate. Considerm o experien aleatoare oarecare (E) i


A , B dou evenimente aleatoare asociate acesteia. Spunem c evenimentele A i B

sunt dependente din punct de vedere probabilistic dac realizarea sau nerealizarea
evenimentului A influeneaz ansa (probabilitatea) de realizare sau de nerealizare a
evenimentului B . n caz contrar evenimentele se numesc independente din punct de
vedere probabilistic. De exemplu, ntr-o urn sunt 6 bile albe i 10 bile negre. Mai nti,
s presupunem c extragem la ntmplare dou bile, una dup alta, fr revenire (adic
nu mai punem bila extras napoi). Fie evenimentele A : "prima bil extras este alb" i
B : "a doua bil extras este alb". Atunci, utiliznd definiia clasic a probabilitii de

mai sus, avem c P ( A)

6
. Dar, probabilitatea de realizare a lui B depinde de
16

realizarea sau nerealizarea lui A . Dac la prima extragere s-a realizat A , atunci
probabilitatea de realizare a lui B este egal cu
forma P ( B A)

5
. Scriem pe scurt aceast idee sub
15

5
i citim "probabilitatea de realizare a evenimentului B condiionat
15

de realizarea evenimentului A este egal cu

5
". Dac la prima extragere s-a obinut o
15

bil neagr (adic s-a realizat evenimentul A , opus lui A ), atunci probabilitatea ca la a
doua extragere s obinem o bil alb este egal cu

6
6
. Scriem P ( B A) . S
15
15

presupunem acum c extragerile se fac cu revenire, adic alegem la ntmplare o bil,


apoi o punem napoi n urn i extragem la ntmplare nc o bil. n acest caz,

8
probabilitatea de a obine o bil alb la prima extragere este aceeai cu probabilitatea de
a obine o bil alb la a doua extragere, adic P ( A) P ( B )

6
. Evenimentele A i B
16

sunt independente din punct de vedere probabilistic.


n cazul general, pentru o experien aleatoare oarecare (E) i dou evenimente
aleatoare asociate acesteia, A i B , se poate demonstra c:

P( A B) P( A) P ( B A) , dac A i B sunt dependente


P ( A B ) P ( A) P ( B ) , dac A i B sunt independente.

Probabilitile condiionate de tipul P( B A) se calculeaz practic presupunnd c


evenimentul A s-a realizat i calculnd n aceast ipotez probabilitatea de realizare a
lui B .

Inegalitatea lui Boole. Exist situaii n practic cnd nu putem stabili dac un
grup de evenimente aleatoare sunt independente sau dependente probabilistic. n acest
caz putem determina o margine inferioar (limit inferioar) a probabilitii de realizare
simultan a mai multor evenimente. Fie (E) o experien aleatoare oarecare i
A1 , A2 , ..., An un set de evenimente arbitrare asociate experienei. Atunci are loc

inegalitatea:
n

i 1

i 1

P ( Ai ) P ( Ai ) n 1 .

9
Observaii. Toate formulele probabilistice de mai sus pot fi generalizate (vezi
facultativ bibliografia de la sfritul acestui capitol. "Facultativ" se refer la cei care
doresc s nvee mai mult dect se cere la examen). Referitor la independena
(dependena) a dou evenimente A i B , dac ele sunt independente (sau dependente)
atunci exact la fel rmn i perechile A, B sau A, B sau A, B .

Recapitulare liceu. Numrul natural notat cu " Cnk " se numete "combinri din

luate

Cnk

n!
n(n 1)(n 2) ... (n k 1)
, unde 0 k n . n probleme NU vom

(k !) (n k )!
k!

cte

k ".

Acest

numr

se

calculeaz

cu

formula

calcula pn la capt aceste numere!! Mai important ns este ceea ce reprezint acest
numr. Dac M {a1 , a2 , ..., an } este o mulime de n elemente atunci Cnk reprezint
numrul total de submulimi ale lui M formate din cte k elemente fiecare.

Schema binomial (Bernoulli). n anumite situaii este dificil s utilizm


definiia clasic a probabilitii. S-au dezvoltat n timp anumite metode mai rapide de
calcul. Schemele probabilistice se aplic n situaii des ntlnite n practic. Pentru a
nelege ideea de baz a acestei scheme, s ne reamintim cele dou experiene aleatoare
de mai sus, aruncarea zarului i extragerea la ntmplare, cu revenire, a unei bile dintr-o
urn cu 6 bile albe i 10 negre. La fiecare aruncare a zarului, probabilitatea de a obine
faa 5 este aceeai, p

1
. Sau, la fiecare extragere (cu revenire) a unei bile din urn,
6

probabilitatea de a obine o bil alb este aceeai, p

6
. n ambele situaii este vorba
16

de o experien aleatoare care se repet n condiii identice, de un anumit eveniment

10
aleator asociat experienei care are aceeai probabilitate de realizare la fiecare repetare a
experienei. Ne-am putea pune ntrebri de tipul: care este probabilitatea ca la o mie de
aruncri ale zarului s obinem faa 5 de exact 432 de ori (per total) ? Sau, care este
probabilitatea ca n 675 de extrageri cu revenire s obinem exact 45 de bile albe (per
total) ? Se poate demonstra urmtorul rezultat care ne d raspunsul.

"Fie (E) o experien aleatoare arbitrar i A un eveniment aleator asociat acesteia.


Presupunem c probabilitatea de realizare a lui A este cunoscut, P ( A) p . Experiena
se repet de n ori, n condiii identice. Atunci, probabilitatea ca evenimentul A s se
realizeze exact de k ori (per total) este P (n; k ) Cnk p k q n k unde q 1 p P ( A) este
probabilitatea de realizare a opusului lui A i evident 0 k n . "

Deci

rspunsurile

432 1
P (1000; 432) C1000

6

la
432

cele
5

6

568

dou

ntrebri

puse

mai
45

45 6 10
i respectiv P (675; 45) C675

16 16

sus

sunt

630

Schema prezentat aici se mai numete schema bilei revenite pentru urna cu bile de
dou culori.

Schema bilei nerevenite. S presupunem c ntr-o urn sunt N bile dintre care

m sunt albe i N m sunt negre. Se extrag la ntmplare, fr revenire, n bile din urn.
Atunci, probabilitatea ca exact k bile din cele n extrase s fie albe (per total) este
P ( N ; m; n; k )

Cmk CNn km
.
CNn

11
n formula de mai sus avem c 1 n N , 1 m N i 0 k n . Atenie, n teoria
probabilitilor se consider echivalente experienele de extragere la ntmplare a celor

n bile, una cte una fr revenire sau toate simultan.

Observaie. i aceste scheme se pot generaliza. Exist multe alte scheme i


formule probabilistice. Facultativ putei consulta bibliografia de la sfritul acestui
capitol.

Probleme

Problema 1. Pentru ca un produs al unei firme s fie acceptat pe pia el trebuie s


ndeplineasc 3 condiii, C1 , C2 i C3 . Verificnd un numr mare de loturi de produse
de acest tip, firma a stabilit c 98% din produse ndeplinesc prima condiie, 96%
ndeplinesc a doua condiie i 93% pe a treia. S se estimeze probabilitatea ca un produs
oarecare al firmei s fie corespunztor.
Soluie. Putem reformula problema altfel, echivalent. (E): se alege un produs la
ntmplare din stocul (depozitul, producia) firmei. Acestei experiene aleatoare i
asociem evenimentele aleatoare X: "produsul ales este corespunztor", A: "produsul ales
ndeplinete prima condiie", B: "produsul ales ndeplinete a doua condiie" i C:
"produsul ales ndeplinete a treia condiie". Deoarece X se realizeaz numai atunci
cnd se realizeaz simultan A , B i C avem c X A B C . Din context nu putem
preciza dac evenimentele

A, B

i C

sunt independente (sau dependente)

probabilistic, deci putem folosi doar inegalitatea lui Boole pentru estimare. Avem:

12
P ( X ) P ( A B C ) P ( A) P ( B ) P (C ) 3 1 0,98 0,96 0,93 2 0,87 .

Prin urmare probabilitatea cerut este de cel puin 87%. Altfel exprimat, cel puin 87%
din produsele firmei sunt corespunztoare, deci acceptate de pia.

Problema 2. ntr-un lot format din 300 de produse se afl 36 de produse defecte. Se
mparte lotul n trei pri egale, alegnd la ntmplare produsele. Care este probabilitatea
ca n fiecare parte s fie exact 12 produse defecte?
Soluie. Fie evenimentele aleatoare X : "n fiecare din cele dou pri (extrase) sunt 12
produse defecte", A: "n prima parte sunt 12 produse defecte" i B : "n a doua parte
sunt 12 produse defecte". Deoarece X se realizeaz cnd se realizeaz simultan A i
B , avem X A B . Evenimentele A i B sunt dependente probabilistic, deoarece

extragerile se fac fr revenire. Deci P( X ) P ( A B ) P ( A) P ( B A) . (Dac se


realizeaz X atunci automat n a treia parte rmas sunt 12 produse defecte). Aplicm
schema
P ( A)

bilei

nerevenite,

produse

300 36 264

corespunztoare.

Deci

12
88
C36
C264
. Pentru a calcula a doua probabilitate ne imaginm c s-a realizat
100
C300

evenimentul A la prima extragere. Au rmas n stoc 200 de produse, dintre care 24


defecte

176

corespunztoare.

Deci

P ( B A)

12
88
C24
C176
.
100
C200

Deci

12
88
12
88
C36
C264
C24
C176
P( X )

, probabilitatea cerut.
100
100
C300
C200

Problema 3. O firm are 5 filiale, notate cu Fi , i 1, 5 . Numrul lunilor n care profitul


a crescut n anul trecut, pentru fiecare filial, este dat de tabelul:

13

Fi

F1

F2

F3

F4

F5

Numrul de luni

10

( ni )

Estimai probabilitatea ca profitul filialei Fi s creasc n anul urmtor, i 1, 5 .


Soluie. Pe baza datelor disponibile putem folosi definiia empiric a probabilitii i
anume aproximm probabilitile prin frecvene relative, pi

ni
, unde n 12 (luni) i
n

i 1, 5 . Deci obinem:

Fi

F1

F2

F3

F4

F5

Numrul de luni

10

7
12

8
12

5
12

10
12

9
12

( ni )
( pi )

Problema 4. O firm are trei filiale care funcioneaz n mod independent (una fa de
alta). Consiliul de administraie al firmei a fixat o valoare S fa de care se raporteaz
profitul fiecrei filiale. Din datele statistice ale firmei se tie c probabilitile cu care
fiecare filial obine un profit ce depete suma S sunt p1 0,5 , p2 0, 6 i respectiv
p3 0,8 . S se afle probabilitatea ca:

a) profitul tuturor filialelor s depeasc S

14
b) nici o filial s nu aib un profit mai mare ca S
c) cel puin o filial s aib un profit mai mare ca S .
Soluie.
a) Considerm evenimentele Ai : "profitul filialei i depete S", i 1, 3 . Evenimentele
definite sunt independente probabilistic. Fie X : "profitul tuturor filialelor depete
S ". Evident c X A1 A2 A3 i deci P ( X ) P ( A1 A2 A3 ) P ( A1 ) P ( A2 ) P ( A3 ) ,

deci P ( X ) 0,5 0, 6 0,8 0, 24 .


b) Evenimentul aleator Y : "nici o filial nu are un profit mai mare ca S " se scrie

Y A1 A2 A3 .

Deci

obinem

P(Y ) P( A1 A2 A3 ) P ( A1 ) P ( A2 ) P ( A3 )

(1 0,5)(1 0, 6)(1 0,8) 0,5 0, 4 0, 2 0, 04 .

c) Evenimentul Z : "cel puin o filial are un profit mai mare ca S " se realizeaz cnd
se realizeaz cel puin unul din evenimentele A1 , A2 i A3 . Deci Z A1 A2 A3 . Dar
deoarece evenimentele A1 , A2 i A3 sunt compatibile, este mai greu de urmat aceast
cale. (Vezi "formula lui Poincare", facultativ, n bibliografia de la sfritul capitolului).
Mai simplu ar fi s observm c Z Y i deci P ( Z ) P (Y ) 1 P (Y ) 1 0, 04 0,96 .

Problema 5. n medie, din 5 vizitatori ai unui supermarket, 2 cumpr i restul nu.


Aflai care este probabilitatea ca din 1000 de persoane care intr n supermarket:
a) exact 654 de persoane s cumpere
b) cel mult 654 s cumpere
c) cel puin 654 s cumpere.
Soluie.

15
a) nelegerea primei propoziii din enun este cheia problemei. Dac la 5 vizitatori sunt
2 care cumpr, la un numr N (neprecizat, mare) de vizitatori avem

2N
persoane
5

care cumpr, cu regula de trei simpl din gimnaziu. Atunci, folosind definiia clasic a
2N
2
probabilitii, probabilitatea ca un vizitator oarecare s cumpere este p 5 0, 4 .
N
5

Deoarece p este aceeai pentru oricare vizitator, suntem n cazul schemei binomiale
(recitii !!) , cu n 1000 , k 654 i p 0, 4 . Deci probabilitatea cerut este
654
P (1000; 654) C1000
(0, 4)654 (0, 6)346 .

b) Evenimentul aleator X : "cel mult 654 de persoane cumpr" se poate scrie ca o


reuniune a evenimentelor aleatoare Ak : "exact k persoane cumpr", unde 0 k 654 .
Aceste evenimente aleatoare sunt incompatibile cte dou (nu se pot realiza simultan),
deci avem (recitii proprietile funciei de probabilitate):

654

654

654

k 0

k 0

k 0

k
P ( X ) P ( Ak ) P ( Ak ) C1000
(0, 4) k (0, 6)1000 k .

c) Fie evenimentul aleator Y : "cel puin 654 de persoane cumpr". Analog ca mai sus,
P (Y ) P (

1000

k 654

Ak )

1000

k 654

P ( Ak )

1000

k 654

k
1000

(0, 4) k (0, 6)1000 k .

Problema 6. La deschiderea bursei se pun n vnzare 100 de aciuni cu aceeai valoare


nominal, dintre care 30 sunt ale firmei A i 70 ale firmei B . Se tie c pn la
nchiderea bursei s-au vndut 10 aciuni. S se afle probabilitatea ca:
a) (Exact) 3 aciuni (din cele vndute) s aparin societii A

16
b) Cel mult 3 aciuni s aparin societii A
c) Cel puin 3 aciuni s aparin societii A .
Soluie.
C303 C707
a) Folosim schema bilei nerevenite. P (100; 30;10; 3)
.
10
C100

b) Fie evenimentele aleatoare Ak : " k aciuni din cele vndute aparin societii A " ,
0 k 10 . Aceste evenimente sunt 2 cte 2 incompatibile i evenimentul X : "cel mult

aciuni

aparin

societii

A"

se

scrie

X Ak .

Deci

k 0

k 0

k 0

10 k
C30k C70
.
10
C100
k 0
3

P ( X ) P ( Ak ) P ( Ak )

10

c) Analog evenimentul Y : "cel puin 3 aciuni aparin societii A " se scrie Y Ak


k 3

10

10

k 3

k 3

10 k
C30k C70
.
10
C100
k 3
10

i deci P (Y ) P ( Ak ) P ( Ak )

Problema 7. ntr-un depozit la sfritul unei luni (oarecare) stocul din produsul P1 se
termin cu probabilitatea 30%, stocul din produsul P2 se termin cu probabilitatea 40%
iar ambele stocuri se termin cu probabilitatea 10%. Aflai probabilitatea ca, ntr-o lun
oarecare de activitate a depozitului:
a) s se termine cel puin unul din stocuri
b) s se termine numai stocul cu produse P1
c) s nu se termine nici un stoc
Soluie.

17
a) Definim evenimentele X : "se termin stocul cu produse P1 " i Y : "se termin stocul
cu produse P2 ". Evenimentele acestea sunt compatibile. De asemenea sunt dependente
probabilistic,

deoarece,

din

datele

problemei

avem

P ( X Y ) 0,1 P ( X ) P (Y ) 0,3 0, 4 0,12 . Evenimentul Z : "se termin cel puin

unul din stocuri" se exprim Z X Y . Deci (revedei proprietile date la nceput),


P ( Z ) P ( X Y ) P ( X ) P (Y ) P ( X Y ) 0,3 0, 4 0,1 0, 6 .

b) Evenimentul H : "se termin numai stocul cu P1 " se exprim H X Y , deci


P ( H ) P ( X Y ) P ( X ) P ( X Y ) 0,3 0,1 0, 2 .

c) Evenimentul T : "nu se termin nici un stoc"

este opusul lui Z , deci

P (T ) P ( Z ) 1 P ( Z ) 1 0, 6 0, 4 .

Problema 8. O brutrie dintr-un mall utilizeaz stocul de rezerv de fin cu


probabilitatea de 25%, ntr-o zi oarecare de lucru. Aflai probabilitatea ca ntr-o
sptmn (7 zile lucrtoare) stocul de rezerv s fie utilizat:
a) exact n 3 zile
b) cel mult n 3 zile.
Soluie.
a) Deoarece probabilitatea de utilizare a stocului este aceeai n orice zi lucrtoare,
p 0, 25 , suntem n cazul schemei binomiale, cu n 7 , k 3 iar q 1 p 0, 75 .

Probabilitatea cerut este P (7; 3) C73 (0, 25)3 (0, 75) 4 .

18
b) Fie evenimentelea aleatoare Ak : "stocul este utilizat n (exact) k zile", 0 k 7 .
Aceste evenimente sunt incompatibile cte dou i evenimentul X : "stocul este utilizat
3

k 0

k 0

k 0

n cel mult 3 zile" se scrie X Ak . Deci P ( X ) P ( Ak ) C7k (0, 25) k (0, 75) 7 k .

Problema 9. Din anii anteriori se tie c procentul de promovare la examenul de


statistic este de aproximativ 70%. Care este probabilitatea ca dintr-un grup de 132 de
studeni s promoveze 78 ?
Soluie. Alegnd un student la ntmplare dintr-un grup neprecizat (mare) N de
studeni, 70%N promoveaz examenul. Deci, probabilitatea ca un student ales la
70
N
ntmplare s promoveze este, cu definiia clasic a probabilitii, p 100 0, 7 . Ne
N

aflm n cazul schemei binomiale, cu n 132 , k 78 i q 1 p 0,3 . Deci


78
probabilitatea cerut este P (132; 78) C132
(0, 7)78 (0,3)54 .

Problema 10. Probabilitatea ca o persoan juridic s gseasc o banc dispus s o


crediteze este p 0,8 . Aflai probabilitatea ca persoana s obin o creditare dup patru
ncercri.
Soluie. Considerm evenimentele aleatoare Ak : "persoana obine creditul la ncercarea
k ", k 1 i X : 'persoana obine creditul (exact) la a patra ncercare". Atunci

X A1 A2 A3 A4 i, cum evenimentele Ak sunt independente probabilistic, avem


c P( X ) P( A1 ) P( A2 ) P ( A3 ) P ( A4 ) 0, 23 0,8 0, 0064 .

19
Problema 11. n medie, 3% din produsele unei firme au defeciuni. Un lot de 100 de
produse este supus controlului de calitate. Condiia ca lotul s fie respins const n
depistarea a cel puin unui produs defect n dou verificri consecutive la ntmplare.
Aflai probabilitatea ca:
a) lotul s fie acceptat
b) lotul s fie respins
Soluie.
a) Fie evenimentele A : "primul produs verificat este corespunztor" i B : "al doilea
produs verificat este corespunztor". Extragerile se fac fr revenire (evident) i deci
evenimentele acestea sunt dependente probabilistic. Fie X : "lotul este acceptat". Atunci
X A B i P ( X ) P ( A B ) P ( A) P ( B A)

b)

Evenimentul

Y:

"lotul

P (Y ) P ( X ) 1 P ( X ) 0, 06 .

este

97 96
0,94 .
100 99

respins"

este

opusul

lui

X,

deci

20
Bibliografie (la acest capitol)

1. Charles M. Grinstead, J. Laurie Snell, Introduction to Probability:Second Revised


Edition, American Mathematical Society, 1997
2. C. Chilrescu, N. Surulescu, et al., Bazele Statisticii, Ed. Universitii de Vest, 2002
3. http://www.biblioteca-digitala.ase.ro/biblioteca/carte2.asp?id=21&idb=20
(curs gratuit online A.S.E. Bucureti - ncepnd cu capitolul 7)

21

II. Variabile aleatoare discrete i continue

Conceptul de variabil aleatoare. Fie (, K , P ) un cmp de probabilitate


asociat unei experiene aleatoare (vezi capitolul precedent). ntr-un sens mai general
dect cel prezentat n capitolul anterior, K poate fi un corp de pri oarecare ("pri"
nseamn submulimi ale lui ), adic pentru orice pereche de evenimente aleatoare
X , Y K reuniunea lor X Y este tot un element din K , X Y K , i opusul

oricrui eveniment din K este un eveniment tot din K , adic () X K avem c


X K . Elementele A K le numim evenimente aleatoare, mulimea este spaiul de

selecie i P : K [0, 1] este funcia de probabilitate. O funcie X : se numete


variabil aleatoare dac pentru orice numr real x mulimea M { X ( ) x}
este un eveniment aleator asociat acestui cmp de probabilitate, adic M K .

Dac X este o variabil aleatoare, atunci putem considera i alte evenimente


aleatoare din corpul K de tipul A { a X b} sau B { X ( ) x} ,
unde a , b i x sunt numere reale oarecare. Evenimentele aleatoare M , A i B le
vom nota respectiv cu " X x ", " a X b " i " X x ". Se pot considera i alte
evenimente aleatoare similare i pentru fiecare dintre ele putem pune problema
calculului probabilitii respective. n loc de P ( M ) , P ( A) sau P ( B ) vom scrie (de aici
nainte) P ( X x) , P (a X b) i respectiv P ( X x) . Citim: "probabilitatea ca
variabila aleatoare X s ia valori mai mici ca x ", "probabilitatea ca v.a. X s ia valori
mai mari sau egale cu a i mai mici ca b " i respectiv "probabilitatea ca v.a. X s ia

22
valoarea x ". Pentru a doua probabilitate mai putem scrie P ( X [a, b)) , este acelai
lucru.

Exemple. Variabilele aleatoare (variabile statistice) pot descrie proprieti ale


elementelor (unitilor) unei populaii (colectiviti) statistice, ca de exemplu venitul
anual, cifra de afaceri, durata de funcionare, nota de la examenul de matematic,
nlimea unui om, etc. Proprietatea (mrimea sau caracteristica) respectiv X are
valori care variaz de la o unitate aleas la ntmplare la alt unitate a colectivitii
statistice i de aici apare conceptul de variabil "aleatoare". n cel mai general sens o
variabil aleatoare X descrie rezultatele unei experiene aleatoare, adic valorile lui X
sunt rezultate posibile ale experienei. Pentru calculul diferitelor probabiliti se folosesc
metode ca cele introduse n capitolul anterior. De exemplu, dac X reprezint valoarea
obinut la aruncarea unui zar atunci X {1, 2, 3, 4, 5, 6} i probabilitatea ca X s ia
1
valoarea 3 este P ( X 3) .
6

Sau, alt exemplu, se extrag 5 bile cu revenire dintr-o urn care conine 9 bile albe i 4
bile negre. Definim variabila aleatoare Y care reprezint numrul de bile albe extrase
(din cele 5). Care este probabilitatea ca 2 bile din cele extrase s fie albe? n acest caz,
evenimentul aleator A : "2 bile din cele extrase sunt albe" se scrie pe scurt " Y 2 ".
Deci, cu schema bilei

revenite
2

9 4
P ( A) P (Y 2) C52 .
13 13

( n 5,

k 2,

9
,
13

4
),
13

obinem

23
n al treilea exemplu, se consider un eantion format din n 10 studeni i notm cu
Z variabila aleatoare care reprezint nota obinut la examenul de matematic. S

presupunem c valorile lui Z sunt date de urmtoarea serie statistic (ir de valori)
Z : 4, 5, 5, 4, 4, 4, 7, 6, 8, 7 .

Seria statistic poate fi scris ca o distribuie de frecvene ntr-un tabel de forma

Nota

Numrul de studeni

Frecvena

(valorile

(sau frecvena absolut)

relativ

lui Z )

( ni )

( zi )
4

4/10

2/10

1/10

2/10

1/10

Total

n 10

(volumul eantionului)

Probabilitile, n astfel de situaii, sunt chiar frecvenele relative (vezi definiia


statistic a probabilitii n capitolul anterior). De exemplu, probabilitatea ca un student
oarecare s obin nota 5 este P ( Z 5)

2
. Sau, probabilitatea ca un student s obin
10

o not n intervalul [5, 10] se scrie P (5 Z 10) P ( Z 5) P ( Z 6) P ( Z 7)

24
P ( Z 8) P ( Z 9) P ( Z 10) 0, 2 0,1 0, 2 0,1 0 0 0, 6 60% . Am utilizat

faptul c evenimentul aleator " 5 Z 10 " se scrie ca o reuniune a evenimentelor


aleatoare

" Z k " cu k 5,10 care sunt dou cte dou incompatibile i deci

probabilitatea reuniunii este egal cu suma probabilitilor. De asemenea, " Z 9 " i


" Z 10 " sunt evenimente imposibile, deci P ( Z 9) P ( Z 10) P ( ) 0 . Aceast
probabilitate nseamn de fapt c 60% din studeni promoveaz examenul, ceea ce se
poate vedea i din coloana a doua a tabelului, 2 1 2 1 6 60% din 10.

Variabil aleatoare discret. O variabil aleatoare X se numete discret


daca are un numr finit de valori (sau un numr infinit dar numrabil de valori, adic
mulimea valorilor poate fi pus n bijecie cu mulimea numerelor naturale). O astfel de
variabil este descris printr-un tabel de repartiie (sau lege de repartiie) de forma

x
X : 1
p1

x2

...

p2 ...

xn

pn

unde xi sunt valorile distincte (scrise n ordine cresctoare preferabil) pe care le poate
lua variabila aleatoare X iar pi sunt probabilitile respective cu care X ia aceste
valori, adic pi P ( X xi ) , i 1, n . n general pi (0, 1] , i 1, n . Cazul banal este cel
x
n care tabelul are forma X : , caz n care v.a. X se identific cu numrul real x ,
1
X x . Obligatoriu, n orice tabel de acest fel trebuie ndeplinit condiia

p
i 1

1.

Aceasta deoarece evenimentele aleatoare " X xi ", cu i 1, n sunt incompatibile dou

25
cte

dou

iar

reuniunea

lor

este

i 1

i 1

i 1

evenimentul

sigur,

Deci

1 P () P ( " X xi ") P ( X xi ) pi .

Exemple. Pentru seria statistic anterioar (eantionul de studeni), tabelul de


repartiie asociat variabilei aleatoare

care reprezint nota obinut este

5
6
7
8
4
Z :
. O astfel de variabil aleatoare ( Z ) discret asociat
0, 4 0, 2 0,1 0, 2 0,1

unei serii statistice se numete variabil aleatoare de selecie.


Pentru variabila aleatoare Y din exemplul de mai sus referitor la extragerea de

0
bile cu revenire, tabelul de repartiie are forma Y :
p0

p1

p2

p3

p4

5
.
p5

Valorile lui Y sunt 0, 1, 2, 3, 4 sau 5. Evenimentul aleator " Y k " se citete " k bile
din cele 5 extrase sunt albe" i probabilitatea de realizare a sa, cu schema bilei revenite,
k

9 4
este pk P (Y k ) C
13 13

5 k

k
5

, k 0, 5 .

Un exemplu de variabil aleatoare discret cu o infinitate de valori:


"probabilitatea ca o linie de montaj s furnizeze un produs defect este p 0,1 . Aflai
repartiia variabilei aleatoare X care indic numrul de produse testate pn la apariia
primului produs defect". n acest caz nu putem ti dinainte cte produse trebuie testate
pn cnd gsim unul defect. Deci X poate lua orice valoare (numr natural) n 1 .
Evenimentul aleator " X 1 " se citete "primul produs testat este defect", " X 2 " se
citete "primul produs testat este corespunztor i al doilea testat este defect", etc. n
general, " X n " se citete "primele n 1 produse testate sunt corespunztoare i al n lea

este

defect".

Legea

de

repartiie

lui

este

de

forma

26

1
X :
p1

2
p2

3 ...
p3 ...

n ...
. Evenimentul " X n " se scrie ca o intersecie de n
pn ...

evenimente independente probabilistic A 1 A2 ... An 1 An , unde Ak se citete "al


k -lea

produs

testat

este

P( X n) P ( A1 ) P ( A2 ) ... P ( An 1 ) P ( An ) .

k 1, n .

corespunztor",

P ( Ak ) 1 p 0,9

Deoarece

P( An ) p 0,1 obinem pn P ( X n) 0,9

n 1

Deci,
i

(0,1) unde n 1 .

Ultimul exemplu n care se cere construirea unui tabel de repartiie: "ntr-un lot
de 100 de produse 10 sunt defecte. La un control de calitate se extrag la ntmplare 5
produse, fr revenire. Determinai repartiia variabilei aleatoare X care reprezint
numrul de produse defecte din cele 5 extrase". Evident, valorile lui X pot fi 0, 1, 2, 3,
4 sau 5. Legea de repartiie cutat este

0
X :
p0

Probabilitile le calculm cu schema bilei nerevenite.


probabilitatea

ca

din

pk P ( X k ) P (100;10; 5; k )

bile

extrase

1
p1

2
p2

3
p3

P( X k )

fie

4
p4

5
.
p5

nseamn

defecte.

Deci

C10k C905 k
, k 0, 5 .
5
C100

Funcii importante asociate unei repartiii discrete. Considerm un cmp de

x
probabilitate (, K , P ) oarecare i o variabil aleatoare discret X : 1
p1

x 2 ...
p2 ...

xn
,
pn

cu valorile xi ordonate strict cresctor. Funcia de frecvene este f : ,

pi , daca x x i
f ( x)
, unde x . Funcia de repartiie a variabilei aleatoare X
0,
daca
x

x
i

27
se definete prin F : [0, 1] , F ( x) P ( X x ) , pentru orice numr real x . Se pot
demonstra urmtoarele proprieti ale funciei de repartiie:
- F

este cresctoare pe , adic pentru orice numere reale x1 x2 avem

F ( x1 ) F ( x2 ) .

- F este continu la stnga n orice punct real , adic lim F ( x) F ( ) .


x
x

- lim F ( x) 0 i lim F ( x) 1 .
x

Din definiie se deduce c pentru v.a. discret X dat mai sus funcia de repartiie
0, daca x (, x1 ]
p , x (x , x ]
1
2
1
p1 p2 , x ( x2 , x3 ]

are expresia: F ( x) p1 p2 p3 , x ( x3 , x4 ]
.
...

p1 p2 ... pn 1 , x ( xn 1 , xn ]

1, x ( xn , )

Alte proprieti importante ale funciei de repartiie, utile la calculul unor probabiliti
sunt:
- P (a X b) F (b) Fa ) , pentru orice numere reale a i b
- P (a X b) F (b) Fa ) P ( X a )
- P (a X b) F (b) Fa ) P ( X a ) P ( X b)
- P ( X ) (lim F ( x)) F ( ) , pentru orice numr real .
x
x

2
4
2 1 0
Exemplu. Se d v.a. discret X :
. Se cere:
0,1 0,1 0, 4 0, 2 0, 2

a) Funcia frecvenelor

28
b) Funcia de repartiie i graficul su.
c) P ( X 0,5) i P ( X 1, 75) , utiliznd funcia de repartiie.
d) P(2,55 X 3 1,88 X 3, 77) , utiliznd funcia de repartiie.
Soluie.
0,1 daca x {2, 1}
0, 2 daca x {2, 4}

a) Cu definiia de mai sus, f : , f ( x)


.
0,
4
daca
x

0, in rest
0, x 2
0,1 daca 2 x 1

0, 2 daca 1 x 0
b) Funcia de repartiie este F : [0, 1] , F ( x)
.
0,
6
daca
0<x

0,8 daca 2<x 4

1 daca x 4

Graficul su arat ca o scar, de aceea astfel de funcii se mai numesc "funcii scar".

29

c) Folosim definiia funciei de repartiie i expresia gsit mai sus la b).


P ( X 0,5) F (0,5) 0, 6 . De asemenea, P ( X 1, 75) 1 P ( X 1, 75)
1 [ P ( X 1, 75) P ( X 1, 75)] 1 [ F (1, 75) P ( )] 1 (0, 6 0) 0, 4 .

(Opusul evenimentului aleator " X 1, 75 " este evenimentul " X 1, 75 " ).


d) Reamintim (primul capitol) c P( A B) P( A) P ( B A) , pentru dou evenimente
oarecare A i B . De unde deducem c P ( B A)

P( A B)
. Prin urmare avem:
P ( A)

30

P (2,55 X 3 1,88 X 3, 77)

P ( X [2,55; 3] (1,88; 3, 77])


P (1,88 X 3, 77)

P (1,88 X 3)
F (3) F (1,88) P ( X 1,88) P ( X 3)

P (1,88 X 3, 77) F (3, 77) F (1,88) P ( X 1,88) P ( X 3, 77)

0,8 0,1
1.
0,8 0,1

Notaie. De acum nainte vom folosi notaia P (a X b, c X d ) n loc de


P ( X (a, b) [c, d )) i n alte cazuri similare. Adic vom folosi "," (virgula) n loc de

simbolul pentru intersecie " ". Din punct de vedere logic, intersecia o asociem (n
raionamente) cu cuvntul "i" iar reuniunea cu "sau" ct i cu "cel puin".

Vectori aleatori - cazul discret. Presupunem date dou variabile aleatoare

x
asociate unui cmp de probabilitate (, K , P ) avnd repartiiile X : 1
p1
y
i Y : 1
q1

x2

...

p2 ...

xn

pn

y2 ... ym
. Spunem c aceste variabile sunt independente probabilistic
q2 ... qm

dac este ndeplinit condiia P ( X xi , Y y j ) P ( X xi ) P (Y y j ) , pentru orice


pereche de indici i 1, n i j 1, m . Dac notm membrul stng al condiiei anterioare
cu ij P ( X xi , Y y j ) , condiia se rescrie ij pi q j . Dac pentru cel puin o
pereche de indici i , j condiia nu este ndeplinit, atunci variabilele se numesc
dependente

probabilistic.

Perechea

Z (X , Y)

se

cheam

vector

aleator

bidimensional. n general un vector aleator de acest tip este dat prin tabelul de
repartiie comun. Acest tabel conine repartiiile marginale (adic individuale) ale

31
variabilelor X i Y ct i valorile probabilitilor ij . Valorile ij se calculeaz pe
baza datelor problemei i innd seama de natura variabilelor X i Y , adic dependente
sau independente.

Exemplu. Se d vectorul aleator Z ( X , Y ) prin tabelul de repartiie comun

pi

-1

1/3

1/6

1/12

7/12

1/12

1/12

1/4

5/12

qj

5/12

3/12

4/12

ntr-un astfel de tabel, ntotdeauna au loc condiiile:

p q
i

ij

1,

ij

q j i

pi , pentru orice i i j , ceea ce se poate verifica imediat n tabel. Repartiiile

2
1 1
0 1

marginale sunt X : 7 5 i respectiv Y : 5 3 4 . Pe linia lui "-1" apar, n

12 12
12 12 12

1
1
1
1
centru, valorile 11 , 12 i 13 . Pe a doua linie apar valorile 21 ,
3
6
12
12

22

1
1
i 23 . Deci cnd scriem " ij ", indicele i indic linia iar indicele j
12
4

indic coloana.

32
Exemplu. Un proces economic financiar este rezultanta a dou componente
eseniale (mrimi financiare) A i B caracterizate prin nedeterminare i incertitudine.
Modelul probabilistic al procesului este o variabil bidimensional discret Z ( X , Y ) ,
unde X modeleaz probabilistic componenta A i Y modeleaz componenta B . Se
cunoate repartiia lui Z :
Y

0,2

0,3

0,1

0,1

0,1

0,2

a) S se calculeze probabilistic componentele A i B


b) S se stabileasc dac exist o interdependen ntre A i B .
Soluie.
a) Completm tabelul, utiliznd formulele din exemplul anterior.
Y

pi

0,2

0,3

0,1

0,6

0,1

0,1

0,2

0,4

qj

0,3

0,4

0,3

Mrimile A i B sunt descrise probabilistic prin variabilele aleatoare X i respectiv Y


3
1
2
2
0
care au repartiiile marginale X :
i Y :
.
0, 6 0, 4
0,3 0, 4 0,3

33
b) Studiem natura variabilelor aleatoare X i Y , adic verificm relaiile ij pi q j .
Observm c 11 P ( X 2, Y 0) 0, 2 p1q1 0, 6 0,3 . Deci variabilele aleatoare
X i Y sunt dependente probabilistic. Prin urmare, mrimile financiare A i B se

intercondiioneaz.

Exemplu. n producia unei mari companii sunt n medie 3% rebuturi din cauza
defectului A i 4% rebuturi din cauza defectului B . Producia este corespunztoare n
proporie de 95%. S se stabileasc dac cele dou tipuri de defecte se
intercondiioneaz.
Soluie. Putem descrie situaia aceasta astfel: se alege un produs dintr-un stoc al firmei.
Definim

variabila aleatoare X care indic prezena sau absena defectului A la

produsul ales. i anume notm cu " X 0 " evenimentul aleator "produsul ales nu are
defectul A " i cu " X 1 " evenimentul "produsul ales are defectul A ". Cum enunul
1
0
ne d c P ( X 1) 3% , repartiia lui X este X :
. Analog construim
0,97 0, 03
1
0
variabila aleatoare Y cu repartiia Y :
. (Enunul ne-a dat probabilitatea ca
0,96 0, 04

un produs oarecare s aib defectul B , i anume P (Y 1) 4% ) . Construim tabelul de


repartiie comun al vectorului Z ( X , Y ) :

34
Y

pi

0,95

0,02

0,97

0,01

0,02

0,03

qj

0,96

0,04

Ordinea de completare a fost: mai nti valorile variabilelor X i Y cu probabilitile


respective. Apoi, probabilitatea ca un produs oarecare s fie fr rebuturi este dat n
enun, P ( X 0, Y 0) 0,95 (este 11 , cu notaiile de mai sus). Restul tabelului se
completeaz

pe

baza

regulilor

tiute

deja

de

mai

sus.

Observm

11 0,95 P( X 0, Y 0) 0,97 0,96 P( X 0) P(Y 0) . Deci cele dou tipuri de


defecte se intercondiioneaz.

Produsul dintre o variabil aleatoare discret i un numr real. Mai nti s


x
reamintim c o variabil aleatoare constant are tabelul de repartiie de forma X : i
1
X se identific cu numrul real x . De exemplu variabila aleatoare nul (notat tot cu 0)

x
0
are tabelul . Dac legea de repartiie a lui X este X : 1
1
p1

x2 ...
p2 ...

xn
i dac
pn

x1 x2 ... xn
.
p2 ... pn
p1

, atunci se definete o nou variabil aleatoare, X :

Evident, 0 X 0 (n membrul drept apare variabila aleatoare nul).

35
Ridicarea la o putere a unei variabile aleatoare discrete. n acest caz, se
ridic la acea putere fiecare valoare a lui X , se rein valorile distincte, scrise cresctor.
Apoi se calculeaz probabilitile corespunztoare. Atenie, trebuie ca s aib sens
ridicarea la putere !

1
1 0
Exemple. Fie v.a. X :
. Atunci v.a. Y 5 X are repartiia
0, 2 0,5 0,3
5
5 0
2
2
2
2
Y :
. V.a. X are ca valori posibile: (1) , 0 , 1 , adic 0 i 1. Tabelul
0,
2
0,5
0,3

su este

1
0
X 2 :
. Am calculat astfel:
0,5 0,5

P ( X 2 0) P ( X 0) 0,5

P ( X 2 1) P ( X 1) P ( X 1) 0, 2 0,3 0,5 . Dar, X 1/ 2 nu are sens, deoarece


(1)1/ 2 1 nu are sens.

Suma a dou variabile aleatoare discrete. Mai nti, s presupunem c

x
repartiiile variabilelor sunt X : 1
p1
constant).

x
Z : 1
p1

Atunci

v.a.

x2 ...
p2 ...

Z X

xn
i Y (variabil aleatoare
pn

(sau

Z X Y )

x2 ... xn
y1
. Dac Y are repartiia Y :
p2
...
pn
q1

are

repartiia

y2 ... ym
, atunci
q2 ... qm

pentru a calcula suma Z X Y se adun fiecare valoare a lui X cu fiecare valoare a


lui Y (deci sunt n m adunri de fcut). Se rein valorile distincte ordonate cresctor i
apoi calculm probabilitile respective. Dac variabilele aleatoare sunt dependente
probabilistic atunci trebuie s folosim tabelul de repartiie comun pentru a calcula

36
probabiliti

de

forma

P ( X a, Y b) .

Dac

sunt

independente,

atunci

P ( X a, Y b) P ( X a ) P (Y b) .

Produsul i ctul a dou variabile aleatoare discrete. Pentru a calcula


produsul Z XY , se nmulete fiecare valoare a lui X cu fiecare valoare a lui Y , se
rein valorile distincte, ordonate cresctor

X
poate fi privit ca o combinaie de ridicare la putere i apoi un
Y

respective. Ctul
produs, adic

i apoi se calculeaz probabilitile

X
X (Y ) 1 . Evident trebuie ca v.a. Y s nu ia valori nule !
Y

Exemplu. Se d vectorul aleator Z ( X , Y ) prin tabelul de repartiie comun:


Y

pi

-1

1/3

1/6

1/12

7/12

1/12

1/12

1/4

5/12

qj

5/12

3/12

4/12

Se cere:
a) Determinai repartiia variabilei aleatoare T X Y .
b) Idem pentru U XY .
Soluie.
Variabilele X i Y sunt dependente probabilistic, vezi mai sus acelai tabel i
justificarea.

37
a) Adunm 1 cu 0, 1 i 2: 1 , 0, 1. Adunm 1 cu 0, 1 i 2: 1, 2, 3. Scriem valorile
distincte n ordine cresctoare:

1 , 0, 1, 2 i 3. Repartiia lui T

este

1 0 1 2 3
T :
. Calculm probabilitile respective.
a b c d e
1
a P (T 1) P ( X 1, Y 0) . Am gndit astfel: cum s-a obinut T 1 ? Cnd
3
X 1 i Y 0 . Din tabelul comun de repartiie am citit probabilitatea

b P (T 0) P ( X 1, Y 1)

1
.
3

1
. c P (T 1) P ( X 1, Y 2) P ( X 1, Y 0)
6

1 1 1
. Aici, au fost dou posibiliti i reamintim c "sau" nseamn reuniune
12 12 6

de evenimente (incompatibile aici) iar probabilitatea reuniunii este egal cu suma


probabilitilor dac evenimentele ce se reunesc sunt incompatibile. Deci tabelul final
1
2
3
1 0
este T :
.
1/ 3 1/ 6 1/ 6 1/12 1/ 4

b) nmulim 1 cu 0, 1 i 2: 0, 1 , 2 . Apoi nmulim pe 1 cu 0, 1 i 2: 0, 1 i 2. Deci


2 1 0 1
tabelul de repartiie cutat este U :
a b c d
a P (U 2) P ( X 1, Y 2)

1
.
12

1
.
6

2
. Gndim la fel ca mai sus.
e
c P (U 0) P ( X 1, Y 0)

1
0
1
2
2
1 1
5
P ( X 1, Y 0) . n final gsim U :
.
3 12 12
1/12 1/ 6 5 /12 1/12 1/ 4

38

Exemplu. Se dau variabilele aleatoare independente

3
2
X :
i
0, 4 0, 6

1
0
Y :
. Se cere:
0,5 0,5

a) Tabelul de repartiie comun a vectorului aleator Z ( X , Y )


b) Repartiia variabilei aleatoare V

Y
.
X

Soluie.
a) Deoarece variabilele date sunt independente, putem scrie: ij P ( X xi , Y y j )
P ( X xi ) P (Y y j ) pi q j , pentru orice pereche de indici i, j 1, 2 . Tabelul cerut

este:
Y

pi

0,2

0,2

0,4

0,3

0,3

0,6

qj

0,5

0,5

b) mprim prima valoare a lui Y la fiecare valoare a lui X : 0/2, 0/3. Apoi a doua
0 1/ 3 1/ 2
valoare: 1/2; 1/3. Reinem valorile distincte. Tabelul cerut este V :
.
c
a b
a P (V 0) P (Y 0, X 2) P (Y 0, X 3) 0, 2 0,3 0,5 . Etc. Deci n final

0 1/ 3 1/ 2
obinem V :
.
0,5 0,3 0, 2

39
n continuare vom defini anumii parametri (sau indicatori) importani asociai
unei variabile aleatoare discrete. Mai nti parametrii de poziie (parametrii tendinei
centrale) : valoarea medie, moda, momente iniiale. Apoi parametrii de variaie:
dispersia, abaterea standard, momente centrate.

Valoarea medie (media) i proprieti ale sale. Fie X o variabil aleatoare

x
discret cu legea de repartiie X : 1
p1

x2 ...
p2 ...

numrul real M ( X ) xi pi . Vom folosi notaia


i 1

xn
. Valoarea medie a lui X este
pn

x p
i

de acum nainte. Proprieti:

- valoarea medie a unei variabile aleatoare constante este constanta respectiv,


M (a ) a , pentru orice a .

- M ( X Y ) M ( X ) M (Y ) , valoarea medie a sumei este suma valorilor medii, pentru


orice variabile aleatoare X i Y .
- M (aX ) aM ( X ) , pentru orice numr real a i pentru orice variabil aleatoare X .
-

min x M ( X ) max x
i
i
i
i

- dac X i Y sunt variabile aleatoare independente atunci M ( XY ) M ( X ) M (Y ) .


Reciproca este fals !!

Moda (sau modul). O notm cu M o ( X ) i este valoarea cea mai probabil a lui
X (adic valoarea cu cea mai mare probabilitate de realizare). Vezi exemplul de mai

jos.

40
Momente iniiale (sau necentrate) de ordinul r ( r numr natural). Fie X o
v.a. discret. Momentul iniial (sau necentrat) de ordinul r este prin definiie valoarea
medie a variabilei aleatoare X r : M r ( X ) M ( X r ) . Se calculeaz cu formula dedus
din definiie: M r ( X ) xir pi . Dac r 0 atunci M 0 ( X ) 1 iar dac r 1 , atunci
i

M 1 ( X ) M ( X ) , evident.

Momente centrate de ordinul r ( r numr natural). Dac X este o variabil


aleatoare oarecare, momentul centrat de ordinul r este valoarea medie a variabilei
( X M ( X )) r .

aleatoare

Se

deduce

de

aici

formula

de

calcul:

r ( X ) ( xi M ( X )) r pi . Dac r 0 , 0 ( X ) 1 iar dac r 1 atunci 1 ( X ) 0 ,


i

ceea ce se poate demonstra imediat.

Dispersia (sau variana) i proprietile sale. Dispersia unei variabile


aleatoare X msoar gradul de mprtiere a valorilor ( xi ) ale variabilei aleatoare fa
de valoarea sa medie, M ( X ) . Prin definiie, dispersia este momentul centrat de ordinul
doi. Formula de calcul este D 2 ( X ) ( xi M ( X )) 2 pi . Proprieti importante sunt:
i

- D 2 (a ) 0 , pentru orice numr real a (adic v.a. constant).


- D 2 (aX ) a 2 D 2 ( X ) , pentru orice numr real a i orice v.a. X .
- Dac X i Y sunt v.a. independente, atunci D 2 ( X Y ) D 2 ( X ) D 2 (Y ) .
- D 2 ( X ) M 2 ( X ) ( M ( X )) 2 , pentru orice v.a. X .

41
Abaterea standard (sau abaterea medie ptratic).

O notm cu

D( X ) D 2 ( X ) .

Exemplu.

Se

dau

variabilele

aleatoare

3
3 1
X :

0, 2 0,1 0, 7

2 3
6 7, 65
Y :
. Se cere:
0, 4 0,1 0, 4 0,1

a) Media v.a. X
b) Moda v.a. X i Y
c) Modulul variabilei aleatoare X
d) Momentul iniial de ordinul doi al v.a. X
e) Momentul centrat de ordinul trei al v.a. X
f) Dispersia v.a. X (calculat n dou feluri)
g) Abaterea standard a v.a. X .
Soluie.
a) M ( X ) (3) 0, 2 1 0,1 3 0, 7 1, 6 .
b) M o ( X ) 3 , deoarece valoarea 3 are cea mai mare probabilitate de realizare: 0,7.
V.a. X este unimodal. Dar v.a. Y este plurimodal deoarece cea mai mare
probabilitate (adic 0,4) apare de dou ori. Cele dou mode sunt

2 i 6.

c) A nu se confunda moda (modul) unei v.a. X cu modulul X al lui X !! Modulul lui


X este o variabil aleatoare!! Pentru a calcula

X , calculm valorile absolute

(modulele) xi i le ordonm cresctor pe cele distincte. Apoi calculm probabilitile

42
respective. Se obine: 3 3 , 1 1 i 3 3 . Deci tabelul de repartiie al modulului lui
1 3
X este X :
. a P( X 1) P ( X 1) P ( X 1) 0,1 P ( ) 0,1 0 0,1 .
a b

b P( X 3) P ( X 3) P ( X 3) 0, 2 0, 7 0,9 .
d) M 2 ( X ) (3) 2 0, 2 12 0,1 32 0, 7 8, 2 .
e) 3 ( X ) (3 1, 6)3 0, 2 (1 1, 6)3 0,1 (3 1, 6)3 0, 7 17,568 .
f) D 2 ( X ) M 2 ( X ) ( M ( X )) 2 8, 2 (1, 6) 2 5, 64 .
Sau, D 2 ( X ) (3 1, 6) 2 0, 2 (1 1, 6) 2 0,1 (3 1, 6) 2 0, 7 5, 64 .
g) Abaterea standard este D ( X ) 5, 64 2,37 .

Variabile aleatoare continue - introducere. O variabil aleatoare continu X


are o infinitate de valori grupate ntr-un interval sau ntr-o reuniune de intervale ale axei
reale. De exemplu X poate s reprezinte (s descrie) durata de funcionare a unui
produs de un anumit tip. Dac astfel de produse funcioneaz ntre 3 i 4,5 ani, scriem
X (3; 4,5) sau 3 X 4,5 . Sau, X poate reprezenta salariul mediu nominal, cifra de

afaceri, nlimea unui individ, temperatura corpului unei persoane, diametrul unei
piese, timpul de ateptare pentru un client care se adreseaz cu o cerere unei firme, etc.
Intervalul n care X ia valori poate fi nchis sau deschis, mrginit sau nemrginit.
O v.a. continu X nu mai este descris printr-un tabel de repartiie ca n cazul discret.
Informaiile despre o v.a. continu X sunt date de dou funcii importante, funcia de
repartiie a lui X i funcia densitate de repartiie (sau funcia densitate de
probabilitate) a lui X . Dou variabile aleatoare continue X i Y sunt independente

43
probabilistic dac P ( X I , Y J ) P ( X I ) P ( X J ) , pentru orice dou intervale I
i J ale axei reale.

Funcia de repartiie a unei v.a. continue X . Funcia de repartiie este


F : [0, 1] , F ( x) P ( X x ) , pentru orice x numr real. Adic, valoarea lui F n

punctul x reprezint probabilitatea ca v.a. X s ia valori mai mici dect x .


Proprietile funciei de repartiie sunt aceleai ca n cazul funciei de repartiie a unei
variabile aleatoare discrete, vezi mai sus. Vom presupune n acest curs c pentru
variabilele aleatoare continue funcia de repartiie este continu pe , adic limita la
stnga este egal cu limita la dreapta i egal cu valoarea F ( x) , pentru orice numr real

x . De aceea, probabilitile ca X

s ia o anumit valoare sunt nule, adic

P ( X x) 0 , pentru orice numr real x . De aceea, n inegaliti vor apare numai "<"

sau ">" i avem: P (a X b) F (b) F (a ) , pentru orice numere reale a i b .

Despre integrale improprii sau generalizate. Nu vom calcula astfel de


integrale n acest curs dar este util de tiut ce reprezint ele. S presupunem c avem o
funcie f : derivabil i c graficul su (de ecuaie y f ( x) ) arat ca n figura
de mai jos, unde a i b sunt dou numere reale fixate pe axa Ox . Presupunem c axa
Ox este o asimptot pentru grafic.

44

Aria zonei haurate, mrginit de axa Ox i de graficul funciei f ( x) este egal cu


valoarea integralei Riemann simple (tip "liceu") din funcia f ( x) , de la a la b , adic:
b

aria f ( x)dx . Imaginai-v c punctul a st pe loc i punctul b ncepe s se


a

deplaseze spre dreapta. Zona haurat devine din ce n ce mai mare. Numrul real, spre
care tinde aria zonei haurate cnd b tinde spre , se noteaz cu

f ( x)dx . Pe scurt
a

exprimm ideea aceasta prin:

lim
b a

f ( x)dx f ( x)dx . Acest numr, intuitiv,


a

reprezint "aria" zonei nemrginite "de la a la " haurat n figura urmtoare.

45

Analog se poate defini, intuitiv, i numrul real

f ( x)dx , dac ne imaginm c punctul

b st pe loc i a tinde spre . Sau,

f ( x)dx , dac a tinde spre i b spre ,

numr care reprezint, intuitiv, aria ntregii zone delimitate de axa Ox i de graficul
funciei f ( x) . Integralele generalizate (improprii) care apar n statistic sunt n general
tabelate, deci nu este necesar (n acest curs) s le calculm.

Funcia densitate de repartiie (sau densitate de probabilitate). O funcie


f : se numete densitate de repartiie dac ndeplinete ambele condiii:

1)

f ( x) 0 pentru orice numr real x

46

2)

f ( x)dx 1 (adic, intuitiv, aria zonei mrginite de axa Ox i de graficul funciei

f ( x) este egal cu 1).

Dac X este o variabil aleatoare continu, atunci funcia de repartiie a lui X i


funcia densitate de repartiie a lui X sunt definite prin relaia (vezi figura urmtoare):
area zonei haurate P ( X x) F ( x )

f ( y )dy , ()x .

47

De asemenea, are loc relaia f ( x) F '( x ) , exceptnd eventual un numr finit de puncte

x (n care F ( x) nu este derivabil). Graficul funciei densitate de repartiie f ( x) se


numete curba frecvenelor (sau curb de repartiie, curba densitii de repartiie).
Dac a i b sunt dou numere reale oarecare, atunci P (a X b) F (b) F (a ) = aria
zonei haurate delimitate de axa Ox i de curba de repartiie, vezi figura care urmeaz.

48

Parametri importani asociai unei variabile aleatoare continue. Fie X o


variabil aleatoare continu i f ( x) , F ( x) funcia densitate de repartiie i respectiv
funcia de repartiie a lui X . Parametrii de poziie (sau parametrii tendinei
centrale) sunt: media, moda, momentele iniiale (sau necentrate), cuantilele.
Parametrii de variaie sunt: dispersia, abaterea standard, momentele centrate.
Parametrii de caracterizare a formei curbei frecvenelor: coeficientul de asimetrie i
coeficientul de exces (sau de aplatizare).
Toi aceti parametri se exprim prin integrale generalizate dar nu vom face calcule de
acest tip n acest curs (pentru repartiiile clasice ei sunt cunoscui).

Valoarea medie (sau media lui X ) este M ( X )

xf ( x)dx . Rmn valabile

proprietile pentru medie de la cazul variabilelor aleatoare discrete (vezi mai sus).

Modul sau moda este M o ( X ) , un punct de maxim al funciei f ( x) . i n acest


caz o v.a. continu poate fi unimodal sau plurimodal, ca n cazul v.a. discrete. Intuitiv,
figura:

49

Deci moda M o ( X ) este abscisa punctului celui mai nalt poziionat pe graficul
densitii de repartiie f ( x) .

Momentele
Mr (X )

iniiale

sau

necentrate

de

ordinul

sunt

f ( x)dx . Evident, M 0 ( X ) 1 i M 1 ( X ) M ( X ) .

Cuantilele de ordinul sunt numere reale, notate cu x . se numete


ordinul cuantilei x i trebuie s fie un numr raional din intervalul (0, 1) . Exist mai
multe modaliti de a defini cuantilele n literatura de specialitate. Vom defini aici
cuantila x ca fiind unicul numr real (de pe axa Ox ) astfel nct are loc relaia:
F ( x ) P ( X x )

f ( y )dy = aria zonei haurate (figura care urmeaz).

50

Cuantilele de ordinul 1/2, 1/4, 3/4 se mai numesc quartile. Cuantila de ordinul 1/2 = 0,5
se mai numete median i o notm cu x0,5 sau cu M e ( X ) . Mediana mparte zona
delimitat de axa Ox i graficul densitii de repartiie n dou zone de arii egale cu 0,5.
Atenie, nu confundai media unei variabile aleatoare cu mediana !! Cuantilele de
ordinul k /10 , unde k 1, 9 , se mai numesc decile iar cuantilele de ordinul k /100 ,
unde k 1, 99 , se mai numesc percentile.

Dispersia (sau variana) este definit prin


2

D ( X ) M (( X M ( X )) ) M 2 ( X ) ( M ( X ))

( x M ( X ))

f ( x )dx .

Variabila aleatoare X M ( X ) se numete abaterea de la medie. Proprietile


dispersiei sunt aceleai ca la variabile aleatoare discrete (vezi mai sus). Abaterea medie
ptratic sau abaterea standard este D( X ) D 2 ( X ) .

51
Momentele centrate de ordinul r sunt definite prin relaia:

r ( X ) M (( X M ( X )) r )

( x M ( X ))

f ( x)dx .

Pentru r 0 , 0 ( X ) 1 . Pentru r 1 , 1 ( X ) 0 iar pentru r 2 , 2 ( X ) D 2 ( X ) .

Coeficientul de asimetrie (al lui Pearson) l notm cu c.a.s. i se definete prin


c.a.s.

M (X ) Mo(X )
.
D( X )

Dac

c.a.s. 0

curba

frecvenelor

este

simetric

(aproximativ), admite o ax de simetrie paralel cu axa Oy . Dac c.a.s. 0 atunci


curba frecvenelor admite o asimetrie spre stnga (sau asimetrie pozitiv). Dac
c.a.s. 0 atunci curba densitii de repartiie f ( x) admite o asimetrie spre dreapta

(sau negativ), vezi figurile de mai jos. ("skew" = asimetrie).

Coeficientul de boltire (de aplatizare sau de exces), al lui Pearson este


c.b.

4 ( X )
. Dac c.b. 3 atunci curba densitii de repartiie este mai ascuit la
( 2 ( X )) 2

vrf dect curba normal (vezi curba verde din figur) iar dac c.b. 3 atunci are vrful
mai plat ("flat" - cea albastr) dect la curba normal. Curba normal este graficul
densitii de repartiie normale pe care o vom studia n capitolul urmtor. Pentru curbele
din familia normal c.b. 3 (vezi curba de culoare rou nchis din figur).

52

Bibliografie (pentru acest capitol)

1. Konrad Menzel, Introduction to statistical methods in Economics, Lecture Notes,


MIT, 2009
2. C. Chilrescu, N. Surulescu, et al., Bazele Statisticii, Ed. Universitii de Vest, 2002
3. http://www.biblioteca-digitala.ase.ro/biblioteca/carte2.asp?id=166&idb=11
(curs online Academia de Studii Economice, Bucureti)

53

III. Repartiii clasice

Repartiia binomial. Fie X o variabil aleatoare discret. Spunem c X


urmeaz o repartiie binomial de parametri n i p dac tabelul de repartiie al lui X

0
este de forma X :
p0

1
p1

2 ...
p2 ...

n
k k nk
unde pk P ( X k ) Cn p q , k 0, n ,
pn

q 1 p , p (0, 1) i n . Scriem: X B (n, p ) . Se demonstreaz c media,

variana i moda unei astfel de repartiii sunt:


M ( X ) np

D 2 ( X ) npq
(n 1) p 1 M o ( X ) (n 1) p .

Exemplu. Din datele statistice ale unei agenii de turism se tie c probabilitatea
ca un client ce se adreseaz ageniei s cumpere un anumit pachet de servicii este egal
cu 0,85 . Care este numrul cel mai probabil de clieni care ncheie un contract de acest
tip din 1000 de clieni ai ageniei?
Soluie. Notm cu X variabila aleatoare care indic numrul de clieni care ncheie un
contract turistic de acest tip, din cei 1000. Valorile posibile ale lui X sunt numerele
naturale de la 0 la 1000. Evenimentul aleator " X k " se citete " k clieni (din cei
1000) ncheie contractul respectiv". Deoarece p 0,85 nu depinde de client (este
constant),

suntem

cazul

schemei

binomiale.

Deci

k
pk P ( X k ) C1000
(0,85) k (0,15)1000 k , k 0, 1000 . Prin urmare tabelul de repartiie

54

k
al lui X este de forma X : , unde k 0, 1000 i pk se calculeaz cu formula
pk
anterioar. Deci X B (n 1000; p 0,85) i prin urmare numrul cel mai probabil de
clieni care ncheie contract de acel tip este moda (modul) lui X . Obinem:
(1000 1) (0,85) 1 M o ( X ) (1000 1) (0,85) ,

adic 849,85 M o ( X ) 850,85 . Cum moda este printre valorile lui X , ea trebuie s
fie numr natural, deci M o ( X ) 850 clieni.

Exemplu. ntr-un transport de fructe sunt 10.000 de lzi. Din datele statistice ale
companiei se cunoate c probabilitatea ca fructele s se strice ntr-o lad este egal cu
0, 00065 . Aflai:

a) numrul mediu de lzi cu fructe stricate ntr-un astfel de transport.


b) numrul cel mai probabil de lzi cu fructe stricate.
Soluie.
a) Raionamentul este identic cu cel din problema anterioar - deci TEM (dar trebuie
justificarea !!). Variabila aleatoare X care indic numrul de lzi cu fructe stricate
urmeaz tot o repartiie binomial de parametri n 10000 i p 0, 00065 . Numrul
mediu de lzi cu fructe stricate este media lui X , deci M ( X ) np 6,50 .
b) Numrul cel mai probabil de lzi cu fructe stricate este moda lui X . Deci avem:
(10000 1) 0, 00065 1 M o ( X ) (10000 1) 0, 00065 , 5,50065 M o ( X ) 6,50065 .

Prin urmare n acest caz M o ( X ) 6 (moda este o valoare a lui X , deci trebuie s fie
numr natural).

55
Exemplu. O companie de asigurri deine 1000 de polie de asigurare pentru
brbai n vrst de 70 de ani. Compania estimeaz c probabilitatea ca un brbat de
aceast vrst s decedeze ntr-un an este de 0,01. Se cere:
a) estimai numrul mediu de decese pentru aceast categorie de asigurai n anul
respectiv .
b) care este probabilitatea ca nici un asigurat s nu decedeze n anul respectiv ?
Soluie.
a) Justificarea faptului c X B (n 1000, p 0, 01) se face ca mai sus (TEM).
Avem: M ( X ) np 10 asigurai.
b) Deoarece probabilitatea p 0, 01 nu depinde de asigurat, suntem n cazul schemei
binomiale, cu n 1000 , k 0 i q 1 p 0,99 . Deci probabilitatea cerut este
0
P (1000; 0) C1000
(0, 01) 0 (0,99)1000 (0,99)1000 .

Repartiia hipergeometric. Fie X o variabil aleatoare discret. Spunem c


X urmeaz o repartiie hipergeometric de parametri N , m i n (numere naturale

fixate)

dac

0
X :
p0

1
p1

tabelul

2 ...
p2 ...

k
pk

de

...
...

repartiie

al

lui

este

de

forma

n
Cmk C Nn km
unde
p

P
(
X

k
)

, k 0, n , iar

k
pn
CNn

relaiile dintre k , N , m i n sunt la fel ca n schema bilei nerevenite (astfel nct s


aib sens experiena respectiv i combinrile din formul). Se demonstreaz c media
M ( X ) np i dispersia este D 2 ( X ) npq
X Hiperg ( N , m, n) .

N n
m
, unde p
i q 1 p . Scriem
N 1
N

56
Observaie. Se poate arta c, n anumite condiii, diferena dintre "fr
revenire" i "cu revenire" este neglijabil, adic c repartiia hipergeometric se poate
aproxima cu repartiia binomial. Aceasta se poate face dac N i m sunt mari fa de

n iar p

m
nu este apropiat de 0 i nici de 1. n astfel de situaii probabilitile pk de
N

mai sus le putem calcula cu formula de la repartiia binomial, lund n acea formul
p

m
i acelai n .
N

Exemplu. Se aleg la ntmplare 10 produse dintr-un stoc de 200 n care se tie


c sunt 13% produse care nu se ncadreaz n limitele de funcionare. Se cere:
a) Legea de repartiie a v.a. care indic numrul de produse necorespunztoare din cele
10 extrase (fr revenire).
b) Valoarea medie i dispersia acestei variabile aleatoare.
Soluie.
Probabilitatea pk P ( X k ) , adic probabilitatea ca din 10 produse extrase k s fie
necorespunztoare, se calculeaz cu schema bilei nerevenite. Deci pk
unde

k 0, 10 .

M ( X ) np 10

Prin

urmare

X Hiperg (200, 26, 10) .

10 k
C26k C174
,
10
C200

Atunci

26
N n
26 174 200 10
1,30 i D 2 ( X ) npq
10

1, 08 .
200
N 1
200 200 200 1

Observaie. Exist i alte repartiii discrete importante. Facultativ, putei consulta


bibliografia de la sfritul acestui capitol.

57
n continuare vom prezenta cteva repartiii clasice continue. Reamintim (vezi
capitolul anterior) c o variabil aleatoare continu X este descris prin dou funcii
importante, funcia densitate de repartiie a lui X i funcia de repartiie a lui X .

Repartiia normal (Gauss - Laplace). Spunem c o variabil aleatoare


continu X urmeaz o repartiie normal dac densitatea de repartiie a lui X este de

1
forma f ( x)
e
2

( x m )2
2 2

, pentru orice x numr real. Scriem X N (m, ) iar

numerele reale m i 0 se numesc parametrii repartiiei normale. Dac


m 0 i 1 , spunem c X urmeaz o repartiie normal standard, i scriem

X N (0, 1) . n figura care urmeaz avei cteva exemple de grafice ale unor astfel de

densiti de repartiie, pentru diverse valori ale parametrilor m i . (Nu trebuie


memorat pentru examen aceast figur. Restul figurilor de mai jos se memoreaz !!).

58

1
Curbele din figur au ecuaia y f ( x)
e
2

( x m )2
2 2

pentru diferite valori ale lui m

(notat cu n figur) i . Curba roie are ecuaia y

1 x2 / 2
i reprezint
e
2

graficul repartiiei normale standard (se mai cheam i clopotul lui Gauss). Pentru orice
curb "normal", axa Ox este asimptot orizontal spre i, dreapta paralel cu Oy ,
de ecuaie x m , este ax de simetrie. Punctele de inflexiune sunt x m i aria
zonei mrginite de axa Ox i de curba normal este egal cu 1, vezi figura urmtoare:

Se demonstreaz (vezi capitolul precedent pentru notaii) c pentru orice


repartiie normal M ( X ) M e ( X ) M o ( X ) m i c abaterea standard D ( X ) . De
asemenea, coeficientul de asimetrie este zero iar coeficientul de boltire este egal cu 3,
pentru orice curb normal.
Foarte important este repartiia normal standard. Funcia de repartiie a unei
variabile aleatoare repartizat normal standard o vom nota cu ( x) (n loc de F ( x) ) i

59
se numete funcia lui Laplace. Valorile acestei funcii sunt tabelate i se gsesc n
orice carte i n orice soft utilitar de statistic. Intuitiv, dac x este un numr real fixat
pe axa Ox , ( x) reprezint aria zonei "de la pn la x " delimitate de clopotul lui
Gauss i de axa Ox .

n unele cri (sau soft-uri utilitare), funcia lui Laplace este definit ca reprezentnd
aria zonei "de la zero la x ". O vom nota cu ( x) . Atenie, aceasta nu mai este funcia
de repartiie a variabilei aleatoare X N (0, 1) !! Recapitulnd cele spuse anterior, i
folosind figura de mai sus ca suport intuitiv, avem:
( x) P( X x)

1
2

y2 / 2

dy aria zonei "de la la x "

1
( x) P (0 X x)
2

y2 / 2

dy aria zonei "de la 0 la x "

( x) ( x) 0,5 .

60
Pentru a vedea, ntr-o surs bibliografic sau ntr-un program utilitar, care din cele dou
funcii este folosit, putem folosi observaia c (0) 0,5 dar (0) 0 .
Tabelele funciei Laplace sunt construite n general pentru x 0 . Se poate uor vedea
c are loc relaia ( x) ( x) 1 , pentru orice x numr real. De aici rezult c
( x) 1 ( x) , relaie pe care putem s o folosim pentru cazul n care argumentul

este negativ. Vezi figura:

n cazul n care o variabil aleatoare urmeaz o repartiie normal oarecare (adic


X N (m, ) ) putem standardiza aceast repartiie. Se poate demonstra propoziia:

"dac X N (m, ) atunci variabila aleatoare Y

X m

urmeaz o repartiie normal

standard, adic Y N (0, 1) ."

Problem. Fie X N (m, ) o variabil aleatoare continu repartizat normal


cu parametrii m i 0 cunoscui. Aflai probabilitatea ca valorile lui X s fie n
intervalul (a, b) , unde a i b sunt numere reale date i a b .

61
Soluie.
P ( a X b) P (a m X m b m) P (

aleatoare Y

X m

P (a X b) P (

am

X m

bm

) . tim c variabila

urmeaz o repartiie normal standard, deci putem continua:

am

bm

) (

bm

) (

am

) tabel.

"= tabel" nseamn c mai departe putem folosi un tabel cu valorile funciei Laplace.

Problem. Fie X N (m, ) o variabil aleatoare continu repartizat normal


cu parametrii m i 0 cunoscui. Care este probabilitatea ca valorile lui X s se
abat de la valoarea sa medie cu nu mai mult de un 0 dat ?
Soluie.
Reformulnd, trebuie s aflm probabilitatea ca valorile lui X s fie n intervalul
[ M ( X ) , M ( X ) ] . Deoarece funcia de repartiie a unei variabile aleatoare

repartizat normal este continu, probabilitile de forma P ( X ) sunt nule, deci


ntrebarea se rescrie " P ( M ( X ) X M ( X ) ) ? ".

tim c M ( X ) m , deci ntrebarea se mai rescrie i sub forma (des ntlnit n


practic): " P( X m ) ? ". Avem:

62

P ( X m ) P (m X m ) P ( X m ) P (

( ) ( ) 2 ( ) 1 tabel. Am folosit faptul c

X m

X m

N (0, 1) i c

( ) 1 ( ) .

Observaie. Aa arat un tabel cu valorile funciei Laplace pentru distribuia


(sau repartiia) normal standard:

63
Se observ c (0) 0,500 deci este vorba de funcia Laplace notat i n acest curs cu
. i figura ne arat acelai lucru. De exemplu, (0.52) 0, 6985 . Am descompus pe
z : z 0,5 0, 02 i am mers la intersecia dintre linia lui 0,5 i coloana lui 0,02. Un

calculator online putei gsi de exemplu gratuit la adresa


http://stattrek.com/online-calculator/normal.aspx . Acolo introducei n csua lui z pe
0.52 (cu punct n loc de virgul) i obinei 0, 69847 0, 6985 . Acest calculator online
este pentru funcia Laplace notat cu la noi n curs.

Problem. Se cunoate c profitul anual al unei firme este o variabil aleatoare


X repartizat normal de parametri m 20.000 u.m. i 2500 u.m. Se cere:

a) Care este probabilitatea ca profitul anual s depeasc 25.000 u.m. ?


b) Care este probabilitatea ca profitul anual s fie cuprins ntre 19.500 u.m. i 20.500
u.m. ?
Soluie.
a) P ( X 25.000) 1 P ( X 25.000) 1 P ( X 25.000)
1 P(

X 20.000 25.000 20.000

) 1 (2) 1 0,97725 0, 02 .
2500
2500

19500 20000 X 20000 20500 20000


b) P (19500 X 20500) P (

)
2500
2500
2500
P (0, 2 Y 0, 2) 2 (0, 2) 1 2 0,57926 1 0,16 .

Problem. Durata de funcionare a unui produs este o variabil aleatoare


repartizat normal de parametri m 120 de zile i 10 zile. Se cere:
a) Presupunnd c 97% din produse au o durat de funcionare mai mare dect t , care
este valoarea lui t ?

64
b) Procentul de produse a cror durat de funcionare este de peste 140 de zile.
Soluie.
a)

ntrebarea se poate scrie: P ( X t ) 0,97 , t ? . De unde deducem c

P ( X t ) 0, 03 . Standardizm i obinem c P (

rezult c (

X 120 t 120

) 0, 03 . De unde
10
10

t 120
) 0, 03 . Din tabelele funciei Laplace gsim c (1,88) 0, 03 .
10

(Introducei n csua "cumulative probability" pe 0.03 la adresa de mai sus).


Deducem c
b)

t 120
1,88 , de unde t 10 1,88 120 120 18,8 101, 2 zile.
10

Procedm

analog,

P ( X 140) P (

X 120 140 120


X 120

) 1 P(
2)
10
10
10

1 (2) 1 0,98 0, 02 2% .

Urmtoarele repartiii (distribuii) clasice continue se vor utiliza n urmtoarele


capitole. Nu dm expresia (foarte complicat) a densitilor lor de repartiie f ( x) dar ne
ocupm de cuantilele (vezi capitolul precedent) acestor repartiii. Facultativ, cei care
doresc, pot consulta bibliografia de la sfritul acestui capitol. Notm cu X o variabil
aleatoare care urmeaz una din aceste repartiii.

Repartiia Student (repartiia t sau t-distribution). Graficul acestei legi de


repartiie este simetric fa de axa Oy i axa Ox este asimptot orizontal. O cuantil
a repartiiei Student se noteaz cu t (r ) . r reprezint numrul de grade de libertate i
este un numr natural iar se cheam ordinul cuantilei i este un numr raional din
intervalul (0, 1) . Cuantila t (r ) este un numr real de pe axa Ox , unic definit prin

65
relaia

P( X t (r )) aria

zonei

"de

la

t (r )

la

".

Prin

urmare,

P ( X t (r )) 1 aria zonei "de la la t (r ) ". Vezi figura urmtoare care

conine graficul acestei densiti de repartiie i o parte dintr-un tabel cu cuantilele


acestei repartiii.

De exemplu, cuantila cu 4 grade de libertate i de ordinul 0,025 este egal cu 2,776.


Vezi n tabel intersecia dintre linia r 4 i coloana t0.025 (r ) . Aria zonei de la stnga
cuantilei este egal cu 0,975 i aria zonei de la dreapta cuantilei este egal cu 0,025.

66
(Aria ntregii zone delimitate de grafic i de axa Ox este egal cu 1, ca la orice lege de
repartiie). Vezi i figura de mai jos.

La adresa http://stattrek.com/online-calculator/t-distribution.aspx

gsii un calculator

online de cuantile Student. Pentru exemplul de mai sus, introducei la "degrees of


freedom" 4 i la "cumulative probability" 0.975 (cu punct n loc de virgul). Apoi click
pe "Calculate" i obinei t 2.776 . Atenie, la "cumulative probability" trebuie
introdus aria zonei de la stnga cuantilei, adic 1 ordinul cuantilei !!

Repartiia Helmert-Pearson (chi-square sau hi-ptrat sau 2 -distribution).


Cuantilele acestei repartiii se noteaz cu 2 (r ) . Notaiile i r au aceeai
semnificaie ca mai sus. Sunt adevrate i relaiile P ( X 2 (r )) aria zonei de la

67
dreapta cuantilei i P ( X 2 (r )) 1 aria zonei de la stnga cuantilei. Mai jos
avei schia graficului densitii de repartiie de tip hi-ptrat i o parte dintr-un tabel de
cuantile.

De exemplu, cuantila cu r 8 grade de libertate i de ordinul 0, 05 este un numr


2
real de pe axa Ox , 0.05
(8) 15,51 . (Axa Ox este asimptot la grafic, numai spre ).

Aria zonei "de la 15,51 spre " este egal cu 0,05 iar aria zonei "de la 0 pn la
15,51"

este egal cu 0,950. Putei folosi i calculatorul online de la adresa

http://stattrek.com/online-calculator/chi-square.aspx . Introducei la "degrees of

68
freedom" 8 i la "cumulative probability" pe 0.950 (adic 1 ordinul cuantilei !!). Click
"Calculate" i gsii "15.5".

Repartiia Fisher-Snedecor (sau f-distribution, repartiia f). Aceast


densitate de repartiie depinde de dou grade de libertate, m i n . Cuantilele acestei
repartiii se noteaz cu F (m, n) . Avem P ( X F (m, n)) aria zonei "de la
cuantila F (m, n) la " i P ( X F (m, n)) 1 aria zonei de la 0 la cuantil.
Mai jos avei un grafic al densitii de repartiie Fisher pentru m 5 i n 2 .

De exemplu, pentru calculul cuantilei Fisher de ordinul 0,025 cu m 28 i n 33 grade


de libertate, putem folosi calculatorul online de la adresa
http://stattrek.com/online-calculator/f-distribution.aspx . Introducei la "degrees of
freedom" pe rnd, prima dat pe 28 (la 1 , notat cu m n curs) i apoi pe 33 (la 2 ,
notat la noi cu n ). Atenie, nu putem comuta pe m cu n !! Apoi, la "cumulative
probability" introducei 1 ordinul cuantilei, adic pe 0.975. Click "Calculate" i

69
obinei "2.04". Aria de la 0 pn la 2,04 este egal cu 0,975 iar aria de la 2,04 la
este egal cu 0,025. Sau, alt exemplu, cuantila F0,975 (28, 33) 0.478 . Aria de la stnga
ei este egal cu 0,025 i aria de la dreapta ei (spre ) este egal cu 0,975. Calculatorul
online v d (cu rotunjire) 0,48. Vezi poza de mai jos:

Observaie. Dac o variabil aleatoare are ca densitate de repartiie una din


densitile de repartiie de tipul celor de mai sus, scriem respectiv X t (r ) ( X
urmeaz o repartiie Student cu r grade de libertate), sau X 2 (r ) ( X urmeaz o
repartiie hi-ptrat cu r grade de libertate), sau X F (m, n) ( X urmeaz o distribuie
Fisher cu m i n grade de libertate). Pentru toate aceste repartiii, la Examen vei
primi cuantilele respective sau valorile funciei Laplace.

70
n ncheiere prezentm trei rezultate importante foarte des utilizate n practic,
cu exemple.

Inegalitatea lui Cebev. Fie X o variabil aleatoare oarecare (discret sau


continu) avnd dispersia D 2 ( X ) i media M ( X ) (finite). Atunci, pentru orice numr
real 0 are loc inegalitatea: P ( X M ( X ) ) 1

D2 ( X )

Inegalitatea ne furnizeaz n practic o margine inferioar a probabilitii ca valorile


variabilei aleatoare X s se abat de la valoarea medie a lui X cu cel mult un dat.

Exemplu. Fie X o variabil aleatoare avnd M ( X ) 1 i D 2 ( X ) 0, 04 .


Evaluai probabilitatea ca valorile lui X s fie n intervalul (0, 75;1, 25) .
Soluie.
P (0, 75 X 1, 25) P (0, 75 1 X 1 1, 25 1) P (0, 25 X 1 0, 25)
0, 04
. De unde rezult c P (0, 75 X 1, 25) 0,36 . Deci
P ( X 1 0, 25) 1
0, 252

probabilitatea cerut este de cel puin 0,36. Sau, echivalent, cel puin 36% din valorile
lui X sunt n intervalul (0, 75;1, 25) .

Legea numerelor mari. Vom prezenta o variant simplificat a legii numerelor


mari i anume teorema lui Bernoulli. Cei care doresc s nvee mai mult dect se cere
la examen pot consulta bibliografia de la sfritul acestui capitol. Fie ( E ) o experien
aleatoare, A un eveniment aleator asociat acestei experiene, cu probabilitatea de
realizare p P ( A) , cunoscut. Notm cu X variabila aleatoare care reprezint numrul
de apariii ale evenimentului A n n repetri identice ale experienei ( E ) ( n probe

71

independente). Variabila aleatoare

X
reprezint frecvena relativ de realizare a
n

evenimentului A n cele n probe independente. Teorema ne spune c irul frecvenelor


relative tinde "n probabilitate" ctre constanta

p , adic are loc egalitatea

X
p ) 1 , pentru orice numr 0 .
n

lim P(

Aceast teorem justific matematic folosirea frecvenei relative de realizare a unui


eveniment aleator A n cazul n care nu putem determina exact p P ( A) . n astfel de
situaii, se alege p

X
.
n

Exemplu. O firm productoare ncheie un contract pentru livrarea a 30.000 de


produse unui beneficiar. Un produs este acceptat de beneficiar numai dac valoarea
caracteristicii produsului se ncadreaz n intervalul (9,8;10, 2) . Se tie c variabila
aleatoare X care reprezint valoarea caracteristicii respective a produselor urmeaz o
repartiie normal, X N (10; 0,15) . n aceste condiii, s se determine numrul de
produse care ar trebui fabricate pentru onorarea contractului.
Soluie.
Putem reformula problema astfel. Din producia firmei se alege la ntmplare un produs.
Notm cu

A evenimentul aleator "produsul ales este corespunztor". Atunci

P ( A) p P (9,8 X 10, 2) . Pe de alt parte, dac repetm de n ori aceast

experien (adic se fabric n produse), i dintre acestea 30.000 sunt corespunztoare,


atunci frecvena de realizare a evenimentului A este egal cu
numerelor mari, putem face aproximaia p

30.000
. Pe baza legii
n

30.000
30.000
. De unde rezult n
. Deci
n
p

72

trebuie gsit

p . Avem:

p P (9,8 X 10, 2) P (

20
20
) (
) 2 (1,3333) 1 .
15
15

De

la

adresa

9,8 10 X 10 10, 2 10

)
0,15
0,15
0,15

dat

mai

sus,

gsim

(1,3333) 0,90878 . Deci p 0,81756 . De unde n 36695 produse.

Teorema DeMoivre - Laplace. Teorema aceasta ne spune (n esen) c, dac


X este o variabil aleatoare care urmeaz o repartiie binomial, adic X B (n, p ) ,

atunci, pentru valori mari ale lui n , variabila aleatoare Z

X np
urmeaz
npq

aproximativ o repartiie normal standard, adic Z N (0, 1) . Pentru enunul general,


vezi bibliografia de la sfritul acestui capitol, facultativ. ( q 1 p ).

Exemplu. Probabilitatea apariiei ntr-o prob a evenimentului A este egal cu


p 0, 005 . S se estimeze probabilitatea ca, n 10.000 de probe independente, abaterea

n modul a frecvenei relative de realizare a lui A fa de p s fie sub o miime.


Folosii:
a) Inegalitatea lui Cebev
b) Teorema DeMoivre-Laplace.
Soluie.
a) Fie X variabila aleatoare care indic numrul de apariii ale evenimentului A n
10.000 de probe independente. Deoarece p P ( A) este aceeai n fiecare prob suntem
n cazul schemei binomiale. Deci P ( X k ) , adic probabilitatea ca A s se realizeze
k
de k ori n 10.000 de probe este P ( X k ) C10000
(0, 005) k (0,995)10000 k , unde

73
k 0, 10.000 . Deci X B (n 10.000; p 0, 005) . Prin urmare M ( X ) np 50 i

D 2 ( X ) npq 49, 75 . Ni se cere s evalum

M(

P(

X
p 0, 001) . Deoarece
n

X
1
1
) M ( X ) np p i
n
n
n

D2 (

X
1
1
pq
) 2 D 2 ( X ) 2 npq
0, 0000004975 , putem aplica inegalitatea lui
n
n
n
n

Cebev:
P(

X
0, 0000004975
p 0, 001) 1
0,5025 . Deci probabilitatea cerut este de cel
n
0, 0012

puin 0,5025.
b) P (

X
X np
p 0, 001) P (0, 001
0, 001)
n
n

P(0, 001

n
X np

0, 001
pq
npq

n
) 2 (0, 001
pq

n
) 1 2 (1, 41776) 1
pq

0,84 . Rezultatul de la b) este sprijinit de a) i este cel mai aproape de realitate.

Funcia generatoare de momente. Se utilizeaz pentru calculul momentelor


iniiale (necentrate) ale unei variabilea aleatoare X . Prin definiie, funcia aceasta este
g (t ) M (etX ) , pentru orice t aparinnd unui interval care-l conine pe zero. Din

definiie se deduce formula de calcul practic. Dac X este o variabil aleatoare

x
discret, cu tabelul de repartiie X : 1
p1

x2

...

p2 ...

xn
txi
, atunci g (t ) e pi . Dac X
pn
i

este o variabil aleatoare continu avnd densitatea de repartiie


g (t )

tx

f ( x) atunci

f ( x)dx , pentru orice t aparinnd unui interval care-l conine pe zero. n

74
ambele situaii, momentul iniial de ordinul r al lui X este egal cu derivata de ordinul
r a funciei g n punctul zero, adic M r ( X ) g ( r ) (0) , pentru orice r .

1 0
Exemplu. Se d variabila aleatoare discret X : 1 1

6 2

1 . Se cere:

a) Funcia generatoare de momente g (t )


b) Valoarea medie i momentul iniial de ordinul doi, utiliznd g (t )
c) Dispersia lui X , utiliznd punctul b).
Soluie.
1
1
1 e t 1 et
a) g (t ) e t e0 et
, t .
6
2
3 6 2 3

b) M ( X ) M 1 ( X ) g (1) (0) (

M2(X ) (

e t et
1 1 1
) .
6 3 t 0
6 3 6

e t et
1 1 1
) .
6 3 t 0 6 3 2
2

c) D 2 ( X ) M 2 ( X ) ( M ( X )) 2

1 1 17
.

2 6 36

75
Bibliografie (la acest capitol)

1. Laura Simon, Scott Roths, STAT 414 - 415, Lecture Notes, Dept. of Statistics,
PennState University , 2012
2. C. Chilrescu, N. Surulescu, et al., Bazele Statisticii, Ed. Universitii de Vest, 2002
3. http://www.biblioteca-digitala.ase.ro/biblioteca/carte2.asp?id=166&idb=11
(curs online Academia de Studii Economice, Bucureti)
4. http://www.math.uah.edu/stat (Virtual Laboratories)
5. http://stattrek.com/online-calculator/normal.aspx (calculator online - funcia Laplace
i cuantile repartiii)

76

IV. SERII STATISTICE

Introducere. n acest capitol vom prezenta cteva idei legate de culegerea,


prezentarea i caracterizarea datelor statistice (domeniu numit Statistic descriptiv).
Facultativ, cei care doresc s nvee mai mult dect se cere la examen, pot consulta
bibliografia de la sfritul acestui capitol. O populaie statistic (sau colectivitate
statistic) este o mulime de elemente avnd (cel puin) o proprietate (sau
caracteristic) comun. Elementele acestea se numesc uniti statistice (sau indivizi).
Caracteristica respectiv se exprim (este modelat matematic) printr-o variabil
aleatoare X , discret sau continu. Pentru a obine informaii i a deduce concluzii
(sau pentru a face prognoze) despre caracteristica respectiv la nivelul ntregii populaii,
se studiaz submulimi ale populaiei. Aceste submulimi, numite eantioane,

se

selecteaz prin diferite metode, vezi facultativ bibliografia de la sfritul capitolului.


Metodele de selecie (sondaj) sunt specifice fiecrui domeniu de activitate economic,
social sau tiinifico-tehnic n care se ncadreaz populaia respectiv. Numrul de
uniti statistice dintr-un eantion se numete volumul eantionului ( n ). O valoare
numeric a caracteristicii studiate, pentru o anumit unitate statistic din eantion, se
numete valoare observat sau observaie, pe scurt. Datele numerice furnizate de
eantioane sunt prelucrate prin diferite metode matematice i apoi se formuleaz
concluzii referitoare la ntreaga populaie studiat. Statistica inferenial se ocup cu
interpretarea datelor oferite de statistica descriptiv i cu utilizarea acestora pentru a
formula concluzii referitoare la ntreaga populaie, pentru a face prognoze, pentru a lua
decizii. O decizie, o estimare, o predicie sau o generalizare privitoare la o colectivitate

77
general, bazat pe informaiile obinute din analizarea eantioanelor, se numete o
inferen statistic. Raportul descriptiv-inferenial n cercetarea statistic este
evideniat n figura de mai jos.

Prelucrarea primar a datelor statistice. S presupunem c a fost selectat un


eantion de volum n 20 dintr-o populaie statistic. Notm cu X variabila aleatoare
care descrie o anumit caracteristic a unitilor din populaia respectiv. O parte din

78
valorile lui X , corespunztoare unitilor din eantionul selectat, formeaz seria
statistic de mai jos:
X : 12; 15; 17; 12; 14; 21; 21; 17; 19; 24; 15; 11; 11; 14; 19; 21; 21; 15; 18; 17.

Aceste date se pot scrie ordonat ntr-o distribuie de frecvene cu valori individuale,
ca n tabelul de mai jos. Pe prima coloan se trec valorile distincte ale variabilei
aleatoare X , notate cu

( xi ), n ordine cresctoare. Pe a doua coloan scriem

frecvenele absolute ( ni ) asociate acestor valori. Tabelul se mai poate completa cu a


treia coloan, cea a frecvenelor relative ( f i ), f i

f
i

ni
. Avem, ntotdeauna,
n

n
i

n i

1 . A patra coloan, eventual, poate fi cea a frecvenelor absolute cumulate,

( N i ). Primul numr de pe coloana a patra este N1 n1 , al doilea este N 2 N1 n2 , apoi


N 3 N 2 n3 , etc. Ultimul este ntotdeauna egal cu n . Ultima coloan este coloana

frecvenelor relative cumulate, ( Fi ). Numerele de acolo se calculeaz asemntor cu


cele din coloana a patra, ultimul numr fiind ntotdeauna egal cu 1.

79

( xi )

( ni )

( fi )

( Ni )

( Fi )

11

0,1

0,1

12

0,1

0,2

14

0,1

0,3

15

0,15

0,45

17

0,15

12

0,60

18

0,05

13

0,65

19

0,1

15

0,75

21

0,2

19

0,95

24

0,05

20

Total

n 20

Pentru eantioane de volum mare, dac X este privit ca o variabil aleatoare continu,
datele se pot grupa pe intervale, ca mai jos. S presupunem c avem o serie statistic
simpl cu n 50 de valori ale lui X scrise n tabelul:

80
Vom considera intervalele de forma (a, b] iar ultimul interval de forma [a, b] . Primul
interval trebuie s conin cea mai mic valoare din serie, adic pe xmin 138 iar ultimul
interval trebuie s conin cea mai mare valoare din serie, adic pe xmax 201 . Fiecare
interval (a, b] are o limit inferioar, adic pe " a " i o limit superioar, adic pe
"b". Limita inferioar a primului interval se alege convenabil. Poate fi zero, sau poate fi
o valoare apropiat de xmin , mai mic sau egal cu xmin . Lungimea fiecrui interval, h ,
o calculm cu formula lui Sturges, adic h

xmax xmin
, unde " lg n " nseamn
1 3,322 lg n

logaritm n baza 10 din n . Putem rotunji pe h la o valoare convenabil. n exemplul


dat avem h

201 138
63

9, 49 . Deci vom alege h 10 i limita inferioar


1 3,322 lg 50 6, 64

a primului interval o alegem a 135 . Se obine distribuia de frecvene cu valorile


grupate pe intervale de mai jos. Pe prima coloan avem grupele de valori. Primul
interval, cu conveniile fcute mai sus, este (135, 145] . Am adunat h 10 la 135.
Urmtorul interval subnelegem c este (145, 155] , etc. Ultimul, care include pe
xmax 201 , este [195, 205] . Pe coloana a doua avem frecvenele absolute. Prima este

egal cu 4. Aceasta nseamn c exact 4 din cele 50 de valori de mai sus se afl n
intervalul (135, 145] . Ele sunt: 140; 138; 142; 142. (142 apare de dou ori !!). Sau, n
intervalul (155, 165] apar 13 observaii (valori observate). Atenie, 155 nu aparine
acestui interval!! Celelalte coloane, care se pot aduga dac este necesar, se construiesc
la fel mai sus. Formulele, notaiile i denumirile sunt la fel ca n tabelul anterior celui cu
50 de valori.

81
( xi )

( ni )

( fi )

( Ni )

( Fi )

135 - 145

0,08

0,08

145 - 155

0,1

0,18

155 - 165

13

0,26

22

0,44

165 - 175

11

0,22

33

0,66

175 - 185

0,16

41

0,82

185 - 195

0,12

47

0,94

195 - 205

0,06

50

Total

n 50

Unei distribuii de frecvene ca cea din ultimul tabel i se poate asocia o


histogram. Histograma este o reprezentare grafic sub form de dreptunghiuri. Pe axa
Ox , bazele dreptunghiurilor sunt formate din intervalele de grupare sau clasele de

valori (vezi prima coloan a tabelului). Pe axa Oy , nlimile dreptunghiurilor sunt


egale sau proporionale cu frecvenele absolute ( ni ) sau cu frecvenele relative ( f i ).
Unitile de msur se aleg convenabil pe fiecare ax (nu trebuie s fie aceeai unitate
de msur pe ambele axe). Avem deci o histogram a frecvenelor absolute i
respectiv o histogram a frecvenelor relative (pentru cazul n care intervalele au
lungimi egale).

82

n figura de mai sus avei o histogram a frecvenelor relative, pentru distribuia din
tabelul anterior. Am folosit softul utilitar gratuit de la adresa
http://www.zweigmedia.com/RealWorld/stats/histogram.html .
Unind mijloacele bazelor superioare ale dreptunghiurilor se obine poligonul
frecvenelor relative, de culoare roie. Dac pe axa Oy reprezentm frecvenele
absolute (ni ) , atunci se obin respectiv histograma frecvenelor absolute i poligonul
frecvenelor absolute. TEM !!
Dac pe axa Oy reprezentm frecvenele absolute cumulate ( N i ) sau
frecvenele relative cumulate ( Fi ) , obinem respectiv poligonul frecvenelor absolute
cumulate sau poligonul frecvenelor relative cumulate (se mai cheam ogive).
Unitatea de msur se alege convenabil pe fiecare ax. n figura de mai jos avei
histograma frecvenelor relative cumulate i, cu rou, ogiva frecvenelor relative (sau
poligonul frecvenelor relative cumulate). Ogivele sunt poligoane cresctoare, continue.

83

Pentru (multe !!) alte metode de reprezentare grafic a datelor i de prelucrare primar,
facultativ, putei consulta bibliografia de la sfritul acestui capitol.

Problema fundamental a Statisticii. S ne imaginm c dintr-o populaie de


volum foarte mare selectm eantioane de volum n din ce n ce mai mare. Pentru
fiecare eantion se poate construi o histogram i respectiv un poligon de frecvene.
Dac micorm lungimile bazelor dreptunghiurilor pe msur ce n crete, aceste
histograme devin din ce n ce mai "fine", adic numrul de dreptunghiuri din care sunt
formate este tot mai mare i bazele dreptunghiurilor sunt de lungime ( h ) din ce n ce
mai mic. Corespunztor acestor histograme, se obine un ir de poligoane de frecvene

84
care ncep s semene din ce n ce mai mult ca form cu o anumit curb. Dac
histogramele acestea sunt histograme de frecvene relative (adic pe axa Oy
reprezentm frecvenele relative ( f i )) atunci se obine un ir de poligoane de frecvene
relative care "tinde" ctre o anumit curb. Dac notm cu X variabila aleatoare
(continu) care modeleaz matematic caracteristica comun unitilor statistice din
populaia studiat, atunci curba respectiv este de fapt graficul densitii de repartiie
f ( x) a variabilei aleatoare X . Aceast curb se numete curb de repartiie sau curba

(de distribuie a) frecvenelor i are ecuaia y f ( x) . n practic, problema


fundamental este gsirea acestei funcii

f ( x) al crei grafic trebuie s aproximeze

ct mai "bine" poligonul frecvenelor relative pentru volume n foarte mari. n mod
analog ne putem imagina un ir de poligoane de frecvene relative cumulate (ogive ( Fi ) pe axa Oy ) construite pentru distribuii de frecvene de volum n din ce n ce mai

mare i cu lungimea intervalelor (n care sunt grupate valorile) din ce n ce mai mic.
Acest ir de ogive tinde, ca form, ctre graficul funciei de repartiie F ( x) a variabilei
aleatoare X . Determinarea ct mai exact a acestor funcii, f ( x) i F ( x) reprezint
problema principal a Statisticii i aceast problem va fi abordat n cursurile viitoare
de Statistic i Econometrie.
Mai jos, avei cteva figuri care ilustreaz (intuitiv) aceste idei. Histogramele i
poligoanele de frecvene au fost construite pentru eantioane de volume de la 1000 la
10.000 de valori. (Nu trebuie, evident, memorate aceste figuri).

85

86

Indicatori (parametri) importani asociai unui eantion. Acetia sunt


indicatori de poziie (indicatori ai tendinei centrale), de variaie i de caracterizare a
formei curbei frecvenelor.
Indicatori de poziie importani: media aritmetic, media ptratic, media
armonic, media geometric, momentele iniiale (necentrate) de ordinul r ( r ),
moda (sau modul), cuantilele de ordinul ( - numr raional din intervalul (0, 1) ),
mediana (cuantila de ordinul 0,5 ).
Indicatori de variaie importani: amplitudinea, abaterea individual, abaterea
medie, momentele centrate de ordinul r , variana i abaterea standard, variana
modificat i abaterea standard modificat, coeficientul de variaie.
Indicatori de caracterizare a formei curbei frecvenelor sunt: coeficientul de
asimetrie i coeficientul de boltire. n continuare ne vom ocupa de indicatorii n bold de

87
mai sus. Ceilali vor fi studiai la seminar. Pentru fiecare parametru vom prezenta
modalitatea de calcul n trei situaii.

Media aritmetic. S considerm seria statistic de volum n 20 (ir de


numere) de mai sus (de la nceputul capitolului):
X : 12; 15; 17; 12; 14; 21; 21; 17; 19; 24; 15; 11; 11; 14; 19; 21; 21; 15; 18; 17.

Media aritmetic se noteaz cu x i se calculeaz cu formula x

1
xi . Deci, n
n i

acest caz gsim


x

1
(12+15+17+12+14+21+21+17+19+24+15+11+11+14+19+21+21+15+18+17) =
20

16,7.
Dac aceast serie se scrie ca o distribuie de frecvene cu valori individuale, adic

88

atunci formula de calcul este x

( xi )

( ni )

11

12

14

15

17

18

19

21

24

Total

n 20

1
( ni xi ) . Deci, obinem:
n i

1
(2 11 2 12 2 14 2 14 3 15 3 17 118 2 19 4 21 1 24) = 16,7.
20

n sfrit, dac avem o distribuie de frecvene cu valorile grupate pe intervale


(vezi mai sus), ca de exemplu

89
( xi )

( ni )

135 - 145

145 - 155

155 - 165

13

165 - 175

11

175 - 185

185 - 195

195 - 205

Total

n 50

atunci trebuie mai nti s calculm mijloacele intervalelor ( xi ). Mijlocul unui interval
(a, b] este numrul

ab
. Adugm la tabel coloana cu mijloacele intervalelor,
2

( xi )

( ni )

( xi )

135 - 145

140

145 - 155

150

155 - 165

13

160

165 - 175

11

170

175 - 185

180

185 - 195

190

195 - 205

200

Total

n 50

90

i folosim formula x

1
( ni xi ) . Deci obinem:
n i

1
(4 140 5 150 13 160 11 170 8 180 6 190 3 200) = 168,80.
50

Momente iniiale (necentrate) de ordin r . Corespunztor celor trei situaii


de mai sus, formulele de calcul sunt :
xr

1
1
1
xir , xr ni xir i respectiv xr ni ( xi ) r .

n i
n i
n i

Exemplu. Vom calcula momentul iniial de ordinul doi pentru seria statistic
X : 12; 15; 17; 12; 14; 21; 21; 17; 19; 24; 15; 11; 11; 14; 19; 21; 21; 15; 18; 17.

Avem:
x2

1
(122 152 17 2 122 142 212 212 17 2 192 24 2 152
20

112 112 142 192 212 212 152 182 17 2 ) = 292,50.

Pentru distribuia de frecvene

91

calculele pot fi aranjate astfel:

( xi )

( ni )

11

12

14

15

17

18

19

21

24

Total

n 20

92

Deci x2

( xi )

( ni )

( xi2 )

( ni xi2 )

11

121

242

12

144

288

14

196

392

15

225

675

17

289

867

18

324

324

19

361

722

21

441

1764

24

576

576

Total

n 20

5850

5850
292,50 .
20

n sfrit, dac se d o distribuie de frecvene cu valorile grupate pe intervale, ca de


exemplu

93
( xi )

( ni )

135 - 145

145 - 155

155 - 165

13

165 - 175

11

175 - 185

185 - 195

195 - 205

Total

n 50

atunci calculele se pot aranja astfel:

Deci x2

( xi )

( ni )

( xi )

( ( xi ) 2 ) ( ni ( xi ) 2 )

135 - 145

140

19600

78400

145 - 155

150

22500

112500

155 - 165

13

160

25600

332800

165 - 175

11

170

28900

317900

175 - 185

180

32400

259200

185 - 195

190

36100

216600

195 - 205

200

40000

120000

Total

n 50

1437400

1437400
28748 .
50

94
Dispersia (sau variana). O vom nota cu 2 de aceast dat. Corespunztor
celor trei situaii de mai sus, se calculeaz cu (una din) formulele:

1
1
( xi x ) 2 x2 ( x ) 2 , 2 ni ( xi x ) 2 x2 ( x ) 2 i respectiv

n i
n i

1
ni ( xi x ) 2 x2 ( x ) 2 . Diferenele " xi x " se numesc abateri individuale

n i

(de la medie) i adesea este necesar calcularea lor n practic.

Exemplu. Dac se d o serie statistic sub forma


X : 12; 15; 17; 12; 14; 21; 21; 17; 19; 24; 15; 11; 11; 14; 19; 21; 21; 15; 18; 17,

atunci (vezi mai sus) x 16, 70 i avem:

1
[(12-16,7) 2 +(15-16,7) 2 +(17-16,7) 2 +(12-16,7) 2 +(14-16,7) 2 +(21-16,7) 2 +
20

+(21-16,7) 2 +(17-16,7) 2 +(19-16,7)2 +(24-16,7)2 +(15-16,7) 2 +(11-16,7)2 +


+(11-16,7) 2 +(14-16,7) 2 +(19-16,7)2 +(21-16,7)2 +(21-16,7) 2 +

+ (15-16,7) 2 +(18-16,7) 2 +(17-16,7) 2 ] = 13,61.


Acelai rezultat se putea obine i cu cealalt formul de mai sus:

2 292,50 (16, 7) 2 292,50 278,89 13, 61 .


Dac se d o distribuie de frecvene de forma

95
( xi )

( ni )

11

12

14

15

17

18

19

21

24

Total

n 20

pentru care x 16, 7 (a fost calculat mai sus), atunci calculele se pot aranja astfel:

96

Deci 2

( xi )

( ni )

( xi x )

( xi x ) 2

ni ( xi x ) 2

11

-5,7

32,49

64,98

12

-4,7

22,09

44,18

14

-2,7

7,29

14,58

15

-1,7

2,89

8,67

17

0,3

0,09

0,27

18

1,3

1,69

1,69

19

2,3

5,29

10,58

21

4,3

18,49

73,96

24

7,3

53,29

53,29

Total

n 20

272,20

272, 20
13, 61 . Rezultat pe care-l puteam obine i cu cealalt formul care
20

pune n eviden momentul iniial de ordinul doi: 2 292,50 (16, 7) 2 13, 61 .


n final, dac valorile sunt grupate pe intervale ca n exemplul

97
( xi )

( ni )

135 - 145

145 - 155

155 - 165

13

165 - 175

11

175 - 185

185 - 195

195 - 205

Total

n 50

pentru care s-a calculat x 168.80 , calculele se pot aranja astfel:

Deci 2

( xi )

( ni )

( xi )

( xi x )

( xi x ) 2

ni ( xi x ) 2

135 - 145

140

-28,80

829,44

3317,76

145 - 155

150

-18,80

353,44

1767,20

155 - 165

13

160

-8,80

77,44

1006,72

165 - 175

11

170

1,20

1,44

15,84

175 - 185

180

11,20

125,44

1003,52

185 - 195

190

21,20

449,44

2696,64

195 - 205

200

31,20

973,44

2920,32

Total

n 50

12728

12728
254,56 . Cu a doua formul, care pune n eviden momentul iniial
50

de ordinul doi, obinem 2 28748 (168,80) 2 254,56 .

98
Abaterea standard (sau abaterea medie ptratic). Se definete (n toate cele
trei cazuri de care am vorbit mai sus) prin 2 .
Deci, corespunztor celor trei forme de mai sus de prezentare a datelor, avem respectiv:

13, 61 3, 68 , idem i 254,56 15,95 .

Variana (dispersia) modificat (sau de selecie). Se definete, n toate trei


situaiile de mai sus, prin s 2

n
2.
n 1

Deci, pentru primele dou situaii de mai sus, s 2


treia situaie, s 2

20
13, 61 14,32 . Iar pentru a
20 1

50
254,56 259, 75 .
50 1

Abaterea standard (sau abaterea medie ptratic) modificat (sau de


selecie). Indiferent de forma de prezentare a datelor, acest indicator se definete prin

s s 2 . Deci, pentru primele dou situaii de mai sus, s 14,32 3, 78 i respectiv


s 259, 75 16,11 .

Atenie: despre proprietile acestor indicatori prezentai aici ct i despre


ceilali indicatori importani VEZI seminar !! Chiar dac acest capitol pare uor, dac nu
ncercai s rezolvai singuri exemplele (ducnd calculele pn la sfrit, cu un
calculator de buzunar), nu vei face fa examenului de Statistic !!

99

Bibliografie (pentru acest capitol)

1. Laura Simon, Scott Roths, STAT 414 - 415, Lecture Notes, Dept. of Statistics,
PennState University, (2012)
2. ipo Ciprian, Preda Ciprian, Statistic Economic, Editura Mirton, Timioara, 2004
3. http://www.biblioteca-digitala.ase.ro/biblioteca/carte2.asp?id=116&idb=21
(Curs online gratuit, Academia de Studii Economice Bucureti; click pe fiecare capitol
din cuprins)

100

V. Elemente de Teoria Estimaiei

Introducere. Presupunem dat o anumit populaie (sau colectivitate) statistic


ale crei uniti (sau elemente, indivizi) au o anumit proprietate (sau caracteristic)
comun. S mai presupunem n plus c aceast caracteristic a indivizilor din populaie
se modeleaz printr-o variabil aleatoare X care urmeaz o repartiie normal de
parametri m i , X N (m, ) (vezi capitolul III). Valoarea medie a lui X , adic
m M ( X ) , o numim media teoretic sau media populaiei. Abaterea standard a lui
X , adic D ( X ) , o numim abaterea standard teoretic sau abaterea standard a

populaiei. Analog, dispersia (sau variana) D 2 ( X ) 2 o numim dispersia teoretic


sau dispersia populaiei. Parametrii m i sunt necunoscui n practic i trebuie
estimai. Pentru diferite metode de estimare ct i pentru justificarea matematic a
metodelor ce vor fi prezentate mai jos vezi, facultativ, bibliografia de la sfritul acestui
capitol. Procesul de estimare este una din tehnicile utilizate pentru realizarea inferenei
statistice (vezi capitolul IV). Vom prezenta aici estimarea prin intervale de ncredere.
Presupunem c dispunem de un eantion de volum n selectat din populaie pe baza unui
sondaj aleator simplu (pentru diferite tipuri de sondaje vezi, facultativ, bibliografia de
la sfritul acestui capitol). Datele primare din eantion pot fi prezentate sub una din
cele trei forme de care am vorbit n capitolul IV. Pentru fiecare din aceste situaii tim
deja cum se calculeaz media aritmetic x , abaterea standard modificat s i variana
modificat s 2 . Parametrii acetia, calculai la nivel de eantion, se numesc parametri
de selecie.

101
Estimarea mediei ( m ) n cazul n care n 30 i variana ( 2 ) a populaiei
este cunoscut.

Intervalul de ncredere se determin pe baza relaiei


P( x z

m x z

) 1 p 2 ( z ) ,

unde x este media de selecie, este abaterea standard a populaiei, n este volumul
eantionului, m este media populaiei iar ( z ) este funcia lui Laplace (redus - aria de
la "0 la z " de sub clopotul lui Gauss). " " se numete nivel de semnificaie iar
p 1 se numete coeficient de ncredere. " z " se determin din tabelele funciei

Laplace, din egalitatea ( z )

p
.
2

Atenie, este foarte greit s spunem c "media


[x z

, x z

aparine intervalului

] cu probabilitatea p ", afirmaie gsit n multe cri !! Aceasta

deoarece media (m) a populaiei este o constant i nu o variabil aleatoare !! Relaia


de mai sus se interpreteaz dup cum urmeaz (pentru p 95% de exemplu). S
presupunem c alegem un numr oarecare (mare) de eantioane din populaia
respectiv, cu aceeai metod de selecie de mai sus. S zicem 1000 de eantioane. Apoi
calculm cte un interval de ncredere [ x z

, x z

] cu coeficientul de

ncredere p 95% , pentru fiecare eantion separat. Obinem 1000 de intervale de


ncredere. Ne ateptm ca 95% din cele 1000 de intervale, adic 950 de intervale s fie
corecte, adic s conin valoarea adevrat (real) a mediei m a populaiei. n
practic, se alege doar un singur eantion. Intervalul de ncredere pe care-l obinem este

102
fie corect fie incorect. Cum nu tim valoarea adevrat a lui m , nu putem ti cu
siguran absolut dac intervalul gsit este corect sau nu. Adic dac m se afl n acel
interval sau nu. Putem fi doar foarte ncreztori c am gsit un interval corect, deoarece
95% din toate intervalele pe care le-am fi putut obine sunt corecte.
De aceea, vom spune c " m aparine intervalului

[x z

, x z

] cu un

coeficient de ncredere de 95%". Aceste observaii rmn valabile pentru tot ceea ce
urmeaz mai jos, n acest capitol.
n general, dac [a, b] este un interval de ncredere, jumtate din lungimea sa,
adic
z

ba
se cheam marj de eroare. n cazul nostru, marja de eroare este egal cu
2

Exemplu. Compania de asigurri a poliiei din LAPD dorete s evalueze


concentraia nivelului de plumb din snge pentru poliitii care se ocup cu circulaia
rutier. Printr-un sondaj aleator au fost alei 126 de poliiti i s-a gsit c media de
selecie este x 29, 2 u ( u o unitate de msur pentru concentraia nivelului de
plumb din snge). Se cunoate c X , concentraia nivelului de plumb din snge a unui
poliist ales la ntmplare, este o variabil aleatoare cu o repartiie normal, cu abaterea
standard 7,5 u . Estimai concentraia medie a nivelului de plumb din snge a
poliitilor, cu un coeficient de ncredere de 95%.

103
Soluie.
Folosim relaia dat mai sus. Avem: ( z )

0,95
0, 475 . Gsim z 1,96 . Atenie ce
2

tabel folosii !! Dac dorii s utilizai softul de la adresa (dat i n capitolul III)
http://stattrek.com/online-calculator/normal.aspx ,
acela lucreaz cu ( z ) ( z ) 0,5 . Deci va trebui s introducei acolo 0,975
( 0,975 0, 475 0,5 ).

asemenea,

x z

x z

Calculm

29, 2 1,96

29, 2 1,96

7,5
27,89 u .
126

De

7,5
30,51 u . Deci, concentraia medie a
126

nivelului de plumb din snge a populaiei format din poliitii de la circulaie rutier
din LAPD este m [27,89 u; 30,51 u ] , cu un coeficient de ncredere de 95%.

Observaie.
z

1,96

Marja

de

eroare

("margin

of

error")

este

egal

cu

7,5
1,30 . n mrime relativ, marja de eroare se poate calcula ca
126

procent din valoarea estimatorului punctual, adic din x . Avem:

1,30
4% .
29, 2

Estimarea mediei ( m ) n cazul n care n 30 i variana ( 2 ) a populaiei


este necunoscut.

Intervalul de ncredere se determin pe baza relaiei


P( x t

s
s
m x t
) 1 p ,
n
n

104
n care t este cuantila (vezi capitolul III) repartiiei Student cu n 1 grade de libertate i
de ordinul

, adic t t (n 1) , s este abaterea standard de selecie (vezi capitolul


2

IV) iar restul notaiilor folosite sunt deja cunoscute.


Relaia se interpreteaz la fel ca cea anterioar i ipotezele fcute n Introducere sunt
aceleai. Marja de eroare este egal cu t

s
.
n

Exemplu. S-au obinut 16 valori care reprezint cantitatea (exprimat n


"pounds") de carne de vit consumat anual de 16 persoane selectate aleator dintr-o
anumit regiune a SUA: 118; 115; 125; 110; 112; 130; 117; 112; 115; 120; 113; 118;
119; 122; 123; 126. Care este cantitatea medie consumat anual de o persoan din acea
regiune? (Coeficientul de ncredere este de 95%).
Soluie.
Media de selecie este x 118, 44 iar abaterea standard de selecie este s 5, 66 .
TEM!! (Revedei capitolul IV; putei s v verificai cu softul gratuit online de la
adresa http://www.calculator.net/standard-deviation-calculator.html .
La Examen putei s aducei un calculator de buzunar simplu). Mai departe,

1 p 1 0,95 0, 05 i

0, 05
0, 025 . Cuantila t t0,025 (15) 2,131 . Am
2

gsit-o cu calculatorul de la adresa cunoscut deja din capitolul III,


http://stattrek.com/online-calculator/t-distribution.aspx ,

105
unde trebuie s introducei la "cumulative probability" pe 0,975 1 0, 025 (aria de la
"
x t

la

t"

de

sub

graficul

repartiiei

Student).

Mai

departe,

s
5, 66
118, 44 2,131
118, 44 3, 015 115, 42
n
16

i x t

s
118, 44 3, 015 121, 45 . Deci, cu un coeficient de ncredere de 95%, o
n

persoan din regiunea respectiv consum n medie anual o cantitate de carne de vit
m [115, 42 u;121, 45 u ] , unde " u " nseamn "pounds". (1 pound = 453,5 grame, deci

de aceea obezitatea face ravagii acolo....). Marja de eroare este de 3,015. TEM:
calculai marja de eroare relativ, ca procent din x .

Estimarea varianei ( 2 ) i a abaterii standard ( )

a unei populaii

statistice.

Cu aceleai ipoteze ca n Introducere i cu aceeai interpretare ca mai sus, vom utiliza


relaia
P(

(n 1) s 2
(n 1) s 2
2
) 1 p ,
b
a

n care b 2 (n 1) i a 2 (n 1) sunt cuantilele repartiiei Helmert-Pearson, cu


2

n 1 grade de libertate i de ordinul

i respectiv 1

. Restul notaiilor sunt

cunoscute deja. Pentru abaterea standard a populaiei, intervalul de ncredere este:

[s

n 1
n 1
,s
] , cu coeficientul de ncredere p .
b
a

106
Exemplu. Un mare productor de dulciuri produce, mpacheteaz i vinde un
anumit tip de pachete de 52 grame cu dulciuri. Un manager responsabil cu controlul de
calitate este ngrijorat c variaia greutii reale a pachetelor este prea mare. Adic, el
este ngrijorat c unele pachete cntresc mai mult sau mai puin de 52 grame, cu o
cantitate semnificativ. Pentru a estima abaterea standard ( ) a greutilor tuturor
pachetelor de acest tip fabricate de companie, el alege printr-un sondaj aleator simplu 10
pachete din linia de producie a fabricii. Pentru acest eantion el calculeaz variana de
selecie s 2 4, 2 . Utilizai aceste date ca s gsii un interval de ncredere pentru ( ),
cu un coeficient de ncredere de 95%.
Soluie.
Avem:
1

n 1 10 1 9 ,

1 p 1 0,95 0, 05 ,

iar

0, 025

1 0, 025 0,975 . Din tabelele repartiiei hi-ptrat (de exemplu de la adresa

http://stattrek.com/online-calculator/chi-square.aspx

gsim

2
b 0,025
(9) 19

2
a 0,975
(9) 2, 7 . Atenie, dup cum tii deja din capitolul III, n softul acesta online

trebuie s introducei la "cumulative probability" aria de la stnga cuantilei, deci 0,975


pentru b i 0,025 pentru a !!
Mai departe, obinem: s

i s

n 1
9
4, 2
2, 05 0, 69 1, 41
b
19

n 1
9
4, 2
2, 05 1,83 3, 75 .
a
2, 7

Deci, abaterea standard a greutilor tuturor pachetelor de acest tip din producia fabricii
este [1, 41g ; 3, 75 g ] , cu un coeficient de ncredere de 95%.

107
Estimarea unui procent (proporie) dintr-o populaie (colectivitate) statistic.

Prin procent al unei populaii nelegem un raport dintre numrul indivizilor


care posed un anumit atribut i numrul total de indivizi ai populaiei. De exemplu,
dac populaia este format din 100.000 de produse de un anumit tip ale unei companii
i 1000 dintre ele sunt defecte atunci procentul produselor defecte, la nivel de populaie,
este de

1000
1% . Pentru a estima un procent al unei populaii printr-un interval de
100000

ncredere, avem nevoie de un eantion de volum ct mai mare, selectat din populaie
printr-un sondaj aleator simplu, de procentul (s zicem " r ") al eantionului, referitor la
atributul urmrit i de un coeficient de ncredere ( p ) corespunztor unui nivel de
semnificaie 1 p . De asemenea, eantionul trebuie s conin cel puin 10 uniti
care au atributul respectiv i cel puin 10 uniti care nu-l au.
n aceste condiii, relaia pe care o putem utiliza cu o bun aproximaie este

P(r z

r (1 r )
r (1 r )
R r z
) 1 p 2 ( z ) ,
n
n

n care am notat cu R procentul (real, adevrat) la nivel de populaie al unitilor care


au atributul respectiv iar restul notaiilor sunt deja cunoscute de mai sus.
Atenie, interpretarea acestei relaii se face la fel ca n cazul celorlalte similare de mai
sus !!
Marja de eroare este egal cu z

r (1 r )
.
n

Exemplu. Printr-un sondaj aleator simplu se obine un eantion de 418 de


locuitori cu drept de vot ai unui ora dintre care 280 sprijin un anumit candidat la

108
alegeri. Estimai, cu un coeficient de ncredere de 95%, procentul locuitorilor cu drept
de vot din ora care sprijin acel candidat.
Soluie.
Avem r

280
0, 67 67% (proporia sau procentul la nivel de eantion). De
418

asemenea, din relaia ( z )


z 1,96 .

p 0,95

0, 475 deducem, din tabelele funciei Laplace


2
2

Calculm

marja

de

eroare:

r (1 r )
0, 67(1 0, 67)
1,96
0, 045 4,5% .
n
418

Intervalul de ncredere are extremele: r z

i r z

r (1 r )
0, 67 0, 045 0, 625 62,5%
n

r (1 r )
) 0, 67 0, 045 0, 715 71,5% .
n

n concluzie, procentul R de locuitori din ora care sprijin candidatul respectiv se afl
n intervalul [62,5%; 71,5%] , cu un coeficient de ncredere de 95%. Sau, se mai poate
spune c 67% din locuitori sprijin candidatul, cu o marj de eroare de 4,5% i un
coeficient de ncredere de 95%.
(De multe ori la TV nu se precizeaz coeficientul de ncredere i intervalul de
ncredere....).

Observaie. Toate metodele de estimare de mai sus sunt foarte des aplicate n
practic. Estimarea direct a parametrilor la nivel de populaie este imposibil n
practic, deoarece procesul ar fi foarte costisitor sau imposibil tehnic, chiar distructiv.
De aceea se folosete estimarea prin intervale de ncredere. Metodele prezentate se

109
bazeaz pe teoreme importante din Statistic. Facultativ, le putei gsi n bibliografia de
mai jos. Tot acolo v-am pus i dou link-uri ctre materiale practice.

Bibliografie (la acest capitol)

1. Laura Simon, Scott Roths, STAT 414 - 415, Lecture Notes, Dept. of Statistics,
PennState University, (2012)
2. ipo Ciprian, Preda Ciprian, Statistic Economic, Editura Mirton, Timioara, 2004
3. http://www.biblioteca-digitala.ase.ro/biblioteca/carte2.asp?id=116&idb=21
(Curs online gratuit, Academia de Studii Economice Bucureti; click pe fiecare capitol
din cuprins. Acolo putei citi i despre diferite tipuri de sondaje)
4. http://stattrek.com/ (foarte util, teorie i exemple, ct i un calculator pentru funcia
Laplace i cuantile ale repartiiilor clasice)
5. http://www.statsoft.com/textbook/ (teorie i soft profesional)
6. http://www.calculator.net/standard-deviation-calculator.html

(Calculator online,

abateri, medii, etc).


7. http://www.numberempire.com/statisticscalculator.php (Calculator online, diverse)
8. http://www.scribd.com/doc/56058624/Cercetari-de-Marketing
9. http://www.scribd.com/doc/57956764/19/CLASIFICAREA-SONDAJELOR

110

VI. Verificarea ipotezelor statistice

Introducere. Procesul de testare a ipotezelor statistice este o alt tehnic


general pentru realizarea inferenei statistice. Vom prezenta mai jos cteva situaii
importante. Pentru detalii, vezi, facultativ, bibliografia de la sfritul acestui capitol.
Presupunem c variabila aleatoare X care descrie o anumit caracteristic comun a
unitilor unei colectiviti statistice urmeaz o repartiie normal, X N (m, ) . Deci
media teoretic sau media populaiei este M ( X ) m i abaterea standard teoretic (sau
a populaiei) este D ( X ) . Ne punem ntrebarea dac media m are (sau nu) o
anumit valoare m0 , cu un anumit nivel de ncredere p . Sau, dac abaterea are o
anumit valoare 0 cu un anumit nivel de ncredere p . Procedeul de verificare a unei
ipoteze statistice (cum ar fi presupunerea c m m0 sau c 0 , de exemplu) se
numete test. Ipoteza statistic ce urmeaz a fi testat poart numele de ipotez nul i
se noteaz cu H 0 . Vom nota cu H a o ipotez diferit de ipoteza nul i o vom numi
ipoteza alternativ. Testele n care ipoteza alternativ este exact contrariul ipotezei
nule se numesc teste bilaterale. De exemplu, contrariul ipotezei m m0 este m m0 .
Testele n care ipoteza alternativ este de forma m m0 sau m m0 se numesc
unilaterale (dreapta sau respectiv stnga).
n fiecare test se alege un nivel (prag) de semnificaie i un nivel de
ncredere al testului, p 1 . Concluzia unui test poate fi: "acceptm ipoteza nul
H 0 cu nivelul de ncredere p " sau "acceptm ipoteza alternativ H a (deci respingem

ipoteza nul) cu nivelul de ncredere p ". Atenie, este greit s spunem "probabilitatea

111
ca m s ia valoarea m0 este egal cu p ", explicaia fiind similar cu cea dat n
capitolul precedent (la "estimarea parametrilor").
n fiecare test de verificare a unei ipoteze statistice apare o valoare calculat a
testului ct i o valoare critic a testului. Valoarea calculat se determin utiliznd
datele oferite de un eantion obinut printr-un sondaj aleator simplu. Valoarea critic se
determin din tabelele cu cuantile ale repartiiilor clasice nvate n capitolele
anterioare. Dup denumirea repartiiei clasice utilizate n test, avem teste de tip " z -test"
(repartiia normal sau Gauss-Laplace), de tip " t -test" (repartiia Student), de tip " 2 test" (repartiia Helmert-Peason) sau de tip " f -test" (repartiia Fisher-Snedecor).
Pentru justificarea matematic a metodelor prezentate mai jos, vezi, facultativ,
bibliografia de la sfritul acestui capitol.

(M1) Testarea ipotezelor privind media unei populaii statistice cnd se


cunoate variana ( 2 ) a populaiei i volumul eantionului este n 30

(test

bilateral).

Etapele testului sunt:


- ( H 0 ): m m0 i ( H a ): m m0 ( m0 este un numr real dat).
- Valoarea calculat a testului: zc

x m0

n .

( x este media de selecie - vezi capitolul despre "serii statistice").


- Valoarea critic a testului: din relaia ( z )

p
se determin " z " utiliznd tabelele
2

repartiiei Laplace i notm cu z z valoarea critic gsit (am spus mai sus,
2

112
p 1 este dat). ( z ) este funcia lui Laplace din capitolul despre "repartiii

clasice". Se poate utiliza softul online de la


http://stattrek.com/online-calculator/normal.aspx
probability" valoarea ( z ) ( z ) 0,5

, unde introducei la "Cumulative

p
0,5 i gsii pe z z .
2
2

- Dac zc z atunci acceptm ipoteza nul ( H 0 ), cu nivelul de ncredere p . n caz


2

contrar, respingem ipoteza nul (deci acceptm ipoteza alternativ), cu nivelul de


ncredere p .

(test M1) Exemplu. Un grup de 50 de persoane care folosesc Internetul pentru


cumprturi sunt ntrebate ct cheltuiesc anual pe Internet. Se dorete testarea ipotezei
c o persoan dintr-o anumit regiune cheltuie (sau nu) n medie 325$ pe Internet anual,
cu un prag de semnificaie 0, 05 . Media eantionului este de 304,60$ iar abaterea
standard a sumelor anuale cheltuite pe Internet n acea regiune este de aproximativ
101,50$. Care este concluzia ?
Soluia.
- ( H 0 ) : m m0 325 i ( H a ): m 325
- Valoarea calculat: zc

x m0

- Valoarea critic: ( z )
gsim z z 1,96 .
2

304, 60 325
50 1, 42 .
101,50

p 1 1 0, 05

0, 475 . Din tabelele funciei Laplace


2
2
2

113
- Deoarece zc z , acceptm (cu un nivel de ncredere de 95%) c o persoan din acea
2

regiune cheltuie n medie 325$ pentru a cumpra produse pe Internet.

(M2) Testarea ipotezelor privind media unei populaii statistice cnd se


cunoate variana ( 2 ) a populaiei i volumul eantionului este n 30 .

(test

unilateral dreapta)

- ( H 0 ): m m0 i ( H a ): m m0
- Valoarea calculat: zc

x m0

n.

- Valoarea critic: o gsim din relaia ( z ) p 1 , i din tabele aflm z z .


- Dac zc z acceptm ipoteza nul cu nivelul de ncredere p 1 . n caz contrar,
se accept ( H a ) cu nivelul de ncredere p .

(test M2) Exemplu. Patronul unei firme de prestri de servicii dorete s


fluidizeze servirea clienilor. Pn n prezent el presupunea c timpul de servire a
clienilor este normal distribuit, de medie 130 de minute i cu abaterea standard de 15
minute. El este de acord cu abaterea standard dar acum crede c durata medie de servire
a unui client este mai mare de 130 de minute. Pentru a studia aceast problem el
nregistreaz timpii de servire pentru 100 de clieni. Timpul mediu obinut pentru acest
eantion este de 120 de minute. Poate patronul s concluzioneze, cu un nivel de
ncredere de 99%, c timpul mediu de servire a clienilor firmei este mai mare de 130 de
minute?

114
Soluie.
- ( H 0 ) : m m0 130 i ( H a ) : m 130 minute.
- zc

120 130
100 6, 67 .
15

- ( z ) p 0,99 . Din tabele sau de la adresa


http://stattrek.com/online-calculator/normal.aspx (folosit i n capitolele precedente)
gsim z z 2,326 .
- Deoarece zc z acceptm ipoteza nul i deci timpul mediu de servire a unui client
NU este mai mare de 130 de minute, cu un nivel de ncredere de 99%.

(M3) Testarea ipotezelor privind media unei populaii statistice cnd se


cunoate variana ( 2 ) a populaiei i volumul eantionului este n 30 .

(test

unilateral stnga)

- ( H 0 ): m m0 i ( H a ): m m0
- Valoarea calculat: zc

x m0

n.

- Valoarea critic: folosim relaia ( z ) 1 , i din tabele gsim z z dar valoarea


critic este aici z .
- Dac zc z acceptm ipoteza nul cu nivelul de ncredere p 1 .

115
(M4) Testarea ipotezelor privind media unei populaii statistice cnd NU se
cunoate variana ( 2 ) a populaiei i volumul eantionului este n 30 .

(test

bilateral)

- ( H 0 ): m m0 i ( H a ): m m0 ( m0 este un numr real dat).


- Valoarea calculat a testului: tc

x m0
n , unde s este abaterea standard de
s

selecie (vezi capitolul despre "serii statistice").


- Valoarea critic a testului: este t t (n 1) , cuantila repartiiei Student cu n 1 grade
2

de libertate i de ordinul

- Dac tc t (n 1) se accept ipoteza nul cu nivelul de ncredere p 1 .


2

(M5) Testarea ipotezelor privind media unei populaii statistice cnd NU se


cunoate variana ( 2 ) a populaiei i volumul eantionului este n 30 .

(test

unilateral dreapta)

- ( H 0 ): m m0 i ( H a ): m m0 ( m0 este un numr real dat).


- Valoarea calculat a testului: tc

x m0
n , unde s este abaterea standard de
s

selecie (vezi capitolul despre "serii statistice").


- Valoarea critic a testului: este t t (n 1) , cuantila repartiiei Student cu n 1 grade
de libertate i de ordinul .
- Dac tc t (n 1) se accept ipoteza nul cu nivelul de ncredere p 1 .

116

(test M5) Exemplu. Conducerea unei companii alege 5 experi care i exprim
opiniile privind preul unui produs, n anul viitor. Valorile previzionate de ctre experi
sunt (respectiv) de 2,60u.m.; 3,32u.m.; 1,80u.m.; 3,43u.m.; 2,00u.m. . tiind c anul
acesta preul mediu al produsului este de 2,01u.m., sunt motive suficiente pentru a
susine (cu un nivel de ncredere de 95%) ipoteza c anul viitor preul mediu va fi
semnificativ mai mare fa de cel din anul acesta?
Soluie.
Volumul eantionului este n 5 30 deci folosim testul (de tip Student) M5 de mai
sus.
La nivel de eantion obinem:
s2

2,60+3,32+1,80+3,43+2,00
2, 63 u.m. i
5

1
1
( xi x ) 2
[(2,60-2,63) 2 +(3,32-2,63) 2 +(1,80-2,63) 2

n 1 i
5 1

+(3,43-2,63) 2 +(2-2,63) 2 ] 0,5507 .

Abaterea

(modificat)

de

selecie

este

s s 2 0,5507 0, 74 .

Deci, etapele testului sunt:


- ( H 0 ): m m0 2, 01 i ( H a ): m 2, 01
- Valoarea calculat: tc

x m0
2, 63 2, 01
n
5 1,87 .
s
0, 74

- Valoarea critic: t t (n 1) t0,05 (4) 2,132 ( p 1 , de unde 0, 05 ).


- Deoarece tc t (n 1) acceptm ipoteza nul !! Deci respingem ipoteza alternativa, cu
nivelul de ncredere p 95% . Prin urmare, ne ateptm (cu un nivel de ncredere de

117
95%) ca n anul viitor preul mediu s NU fie semnificativ mai mare fa de cel din anul
acesta (adic de 2,01u.m.).

(M6) Testarea ipotezelor privind media unei populaii statistice cnd NU se


cunoate variana ( 2 ) a populaiei i volumul eantionului este n 30 .

(test

unilateral stnga)

- ( H 0 ): m m0 i ( H a ): m m0 ( m0 este un numr real dat).


- Valoarea calculat a testului: tc

x m0
n , unde s este abaterea standard de
s

selecie (vezi capitolul despre "serii statistice").


- Valoarea critic a testului: este t t (n 1) , unde t (n 1) este cuantila repartiiei
Student cu n 1 grade de libertate i de ordinul .
- Dac tc t (n 1) se accept ipoteza nul cu nivelul de ncredere p 1 .

S presupunem acum c dorim s comparm mediile ( m1 i m2 ) a dou


populaii diferite. Presupunem c variabilele aleatoare X 1 i X 2 respective urmeaz
fiecare o repartiie normal, adic X i N (mi , i ) , i 1, 2 i c, prin cte un sondaj
aleator simplu, am obinut dou eantioane independente de volume n1 i respectiv n2 .

118
(M7) Testarea ipotezelor privind mediile a dou populaii statistice n cazul
n care n1 30 i n2 30 iar varianele 12 i 22 ale celor dou populaii sunt
cunoscute (test bilateral).

- ( H 0 ): m1 m2 i ( H a ): m1 m2
- Valoarea calculat: zc

x1 x2

12
n1

22

(unde x1 i x2 sunt mediile celor dou

n2

eantioane)
- Valoarea critic: din relaia ( z )

p
se determin " z " utiliznd tabelele repartiiei
2

Laplace i notm cu z z valoarea critic gsit ( p 1 este dat).


2

- Dac zc z atunci acceptm ipoteza nul ( H 0 ) cu nivelul de ncredere p iar n caz


2

contrar acceptm ipoteza alternativ ( H a ), cu nivelul de ncredere p .

(M8) Testarea ipotezelor privind mediile a dou populaii statistice n cazul


n care n1 30 i n2 30 iar varianele 12 i 22 ale celor dou populaii sunt
cunoscute (test unilateral dreapta).

- ( H 0 ): m1 m2 i ( H a ): m1 m2
- Valoarea calculat: zc

x1 x2

12
n1

eantioane)

22
n2

(unde x1 i x2 sunt mediile celor dou

119
- Valoarea critic: din relaia ( z ) 1 p se determin " z " utiliznd tabelele
repartiiei Laplace i notm cu z z valoarea critic gsit ( p 1 este dat).
- Dac zc z atunci acceptm ipoteza nul ( H 0 ) cu nivelul de ncredere p iar n caz
contrar acceptm ipoteza alternativ ( H a ), cu nivelul de ncredere p .

(M9) Testarea ipotezelor privind mediile a dou populaii statistice n cazul


n care n1 30 i n2 30 iar varianele 12 i 22 ale celor dou populaii sunt
cunoscute (test unilateral stnga).

- ( H 0 ): m1 m2 i ( H a ): m1 m2
- Valoarea calculat: zc

x1 x2

12
n1

22

(unde x1 i x2 sunt mediile celor dou

n2

eantioane)
- Valoarea critic: din relaia ( z ) 1 p se determin " z " utiliznd tabelele
repartiiei Laplace i notm cu z z valoarea gsit ( p 1 este dat). Dar valoarea
critic este aici z .
- Dac zc z atunci acceptm ipoteza nul ( H 0 ) cu nivelul de ncredere p iar n caz
contrar acceptm ipoteza alternativ ( H a ), cu nivelul de ncredere p .

(test M9) Exemplu. O firm a lansat o campanie promoional cu ajutorul


mijloacelor mass-media i dorete s studieze impactul acesteia asupra mediei
vnzrilor sale zilnice. Pentru aceasta, s-au nregistrat aleator vnzrile n 40 de zile

120
nainte de campanie i respectiv n 40 de zile dup campanie. Pentru cele dou
eantioane s-au calculat mediile de selecie, acestea fiind respectiv: x1 82, 45 u.m. i
x2 84,98 u.m. .

Varianele vnzrilor zilnice ale firmei nainte i dup campanie sunt respectiv

12 8, 20 i 22 5,13 . Se cere s se determine dac politica promoional a firmei a


influenat semnificativ creterea vnzrilor zilnice, cu un nivel de ncredere de 95%.
Soluie.
- ( H 0 ): m1 m2 i ( H a ): m1 m2
- Valoarea calculat: zc

x1 x2

12
n1

22
n2

82, 45 84,98
4,36 .
8, 20 5,13

40
40

- Valoarea critic: din egalitatea ( z ) 1 p 0,95 gsim z z 1, 645 i deci


valoarea critic a testului este z 1, 645 .
- Concluzia: deoarece zc z , acceptm ipoteza alternativ, cu nivelul de ncredere
p 95% , deci exist motive suficiente ca firma s concluzioneze c media vnzrilor

sale zilnice a crescut n urma campaniei de publicitate.

121

Bibliografie (la acest capitol)

1. Konrad Menzel, Introduction to statistical methods in Economics, Dept. of


Economics, MIT, (2009)
2. Laura Simon, Scott Roths, STAT 414 - 415, Lecture Notes, Dept. of Statistics,
PennState University, (2012)
3. ipo Ciprian, Preda Ciprian, Statistic Economic, Editura Mirton, Timioara,
(2004)
4. C. Chilrescu, N. Surulescu, et al., Bazele Statisticii, Ed. Universitii de Vest, (2002)
5. http://www.biblioteca-digitala.ase.ro/biblioteca/carte2.asp?id=116&idb=21
(Curs online gratuit, Academia de Studii Economice Bucureti; click pe fiecare capitol
din cuprins)
6. http://stattrek.com/ (foarte util, teorie i exemple, ct i un calculator online pentru
cuantile ale repartiiilor clasice)
7. http://www.statsoft.com/textbook/ (teorie i soft profesional)
8. http://www.calculator.net/standard-deviation-calculator.html

(Calculator online,

abateri, medii, etc)


9. http://www.numberempire.com/statisticscalculator.php (Calculator online, diverse)
10. http://www.scribd.com/doc/56058624/Cercetari-de-Marketing
11. http://www.scribd.com/doc/57956764/19/CLASIFICAREA-SONDAJELOR

Formular acceptat la Examenul de Statistica

P( x z

P( x t

P(

m x z

) 1 p 2( z )

s
s
m x t
) 1 p , t t ( n 1)
n
n
2

(n 1) s 2
(n 1) s 2
2
) 1 p ,
b
a

P(r z

b 2 (n 1) i a 2 (n 1)
1

r (1 r )
r (1 r )
R r z
) 1 p 2 ( z )
n
n

( H0 ): m m0 i ( H a ): m m0 ; zc

( H0 ): m m0 i ( H a ): m m0 ; zc

( H0 ): m m0 i ( H a ): m m0 ; tc

x m0

x m0

n ; ( z)

p
; z z ; p 1 ; zc z .
2
2
2

n ; ( z ) p 1 ; z z ; zc z .

x m0
n ; t t (n 1) ; tc t (n 1) ; p 1 .
s

( H0 ): m1 m2 i ( H a ): m1 m2 ; zc

x1 x2

12
n1

22
n2

; ( z ) 1 p ; z z ; zc z .

S-ar putea să vă placă și