Sunteți pe pagina 1din 15

9 Statistică matematică

Teoria probabilităţilor elaborează modele matematice ale proceselor şi sistemelor influenţate de factori aleatori.
Statistica matematică confruntă aceste modele cu realitatea, pentru a determina dacă ele sunt potrivite pentru
diverse scopuri practice. Aceasta se face prin predicţii, decizii şi acţiuni, spre exemplu în analiza pieţei, planificarea
producţiei, cumpărarea de echipamente, investiţii, etc. Procesul de verificare a modelelor matematice se numeşte
deducţie statistică.
În acest scop, din populaţia studiată se aleg selecţii aleatoare (sau eşantioane), acestea fiind o submulţime
a populaţiei studiate. Spre exemplu, se măsoară diametrele a 10 şuruburi dintr-un lot de şuruburi, se înregistrează
venitul mediu a 100 familii dintr-o anumită zonă, sau se înregistrează valorile aruncării de 5 ori a unui zar.
Cele mai importante dintre deducţii statistice sunt estimarea parametrilor şi testarea ipotezelor, cu apli-
caţii în controlul calităţii producţiei şi al acceptării/respingerii loturilor de produse.

9.1 Introducere
Statistica matematică constă în diverse metode având ca scop de a obţine informaţii despre diverse probleme
practice (spre exemplu explorarea legăturilor dintre conţinutul de fier şi densitatea unui zăcământ de fier, calitatea
produselor, eficienţa anumitor aparate, performanţele anumitor maşini, reacţia consumatorilor la apariţia unui nou
produs, etc).
Variabilele aleatoare apar în mod natural în diverse probleme statistice practice în inginerie. Spre exemplu,
proprietăţile produselor (becuri, şuruburi, etc) au întotdeauna variaţii aleatoare de la valorile exacte, datorită unor
variaţii mici, incontrolabile, în materia brută folosită sau datorită procesului de producţie. Spre exemplu, diametrul
unui şurub este o variabilă aleatoare , şi considerăm că şurubul este fără defecţiuni dacă diametrul este în limitele
de toleranţă sau cu defecţiuni, dacă diametrul acestuia depăşeşte limitele de toleranţă admise. În acest caz, ne
putem pune problema determinării distribuţiei variabilei aleatoare , a procentului mediu de şuruburi defecte/fără
defecte produse, sau a necesităţii îmbunătăţirii calităţii producţiei (spre exemplu prin achiziţionarea de echipamante
cu o precizie mai bună).
În acest scop, alegem un eşantion din populaţia în cauză (20 de şuruburi dintr-un lot de 1000, 100 de votanţi
din întreaga populaţie de 5000, etc), deoarece inspectarea întregii populaţii ar fi prea costisitoare (atât din punct
de vedere financiar cât şi al timpului necesar), imposibilă, sau fără rost (spre exemplu testarea întregii producţii de
becuri a unei fabrici ar duce la falimentarea acesteia!).
Pentru ca rezultatele statistice obţinute să fie valide, eşantionul trebuie ales în mod aleator. Aceasta înseamnă
spre exemplu că fiecare din cele 1000 de şuruburi ar trebui să aibă aceeaşi probabilitate de a fi ales în eşantionul
de 20 de şuruburi selectat. Numai în acest caz media de selecţie  = 1 ++ 20
20
a valorilor selectate va fi o bună
estimare a medie reale  a întregii populaţii de şuruburi. Crescând voumul  al eşantionului, aproximarea va deveni
în general mai bună.
De asemenea, valorile eşantionului trebuie să fie independente. Valorile selectate sunt în general independente
dacă populaţia studiată este infinită şi dacă selecţia se face cu înlocuire. În cazul unei populaţii mari (finite), dacă
se alege un eşantion de volum mic (spre exemplu 5 sau 10 din 1000 obiecte), valorile obţinute sunt de asemenea
aproximativ independente. Dacă însă se alege un eşantion de volum mare dintr-o populaţie finită, sau dacă alegerea
eşantionului se face fără înlocuire, efectul dependenţei este considerabil (deducţiile statistice obţinute pot fi în acest
caz eronate).
Diversele generatoare de numere aleatoare (din Excel, Maple, Mathematica, sau din alte produse software)
sunt utile în alegerea unei eşantion care să reprezinte o selecţie aleatoare din populaţia considerată. Spre exemplu,
dacă celor 1000 obiecte ale unei populaţii le sunt atribuite numere de la 1 la 1000 şi se generează 20 de numere
aleatoare din mulţimea {1 2     1000}, alegând obiectele corepunzătoare din populaţie se obţine o selecţie aleatoare
de volum 20 din populaţia considerată.
Diversele caracteristici ale eşantionului ales pot fi descrise prin reprezentări grafice (histograme, reprezentări prin
puncte, etc) sau prin caracteristici numerice (spre exemplu prin media de selecţie  = ++ 

sau prin dispersia
2 1
P 2
de selecţie  = −1 =1 ( − ) , unde 1       sunt valorile numerice ale selecţiei, iar  reprezintă volumul
selecţiei).

9.2 Estimarea parametrilor


Una din problemele statisticii matematice este estimarea parametrilor. În problemele practice se presupune în
general că populaţia studiată are o distribuţie cunoscută ce depinde de anumiţi parametrii ce urmează a fi estimaţi.
Spre exemplu, parametrul  în cazul distribuţiei binomiale, sau parametrii  şi  2 în cazul distribuţiei normale.

36
Un estimator punctual al unui parametru este un număr (un punct pe axa reală) calculat folosind valorile
eşantionului considerat, ce serveşte ca o aproximare a parametrului necunoscut.
Un interval de estimare este un interval (numit şi interval de încredere) calculat folosind valorile eşantionului
considerat, şi care conţine parametrul necunoscut cu o anumită probabilitate.
Spre exemplu, ca o aproximare a mediei  a unei populaţii putem considera media de selecţie . Aceasta conduce
la estimatorul ̂ =  al lui , adică
1 +    + 
̂ =  =  (44)

unde 1       sunt valorile observate ale selecţiei iar  este volumul acesteia.
Similar, un estimator  c2 al dispersiei 2 al unei populaţii este dispersia de selecţie 2 , adică

c2 = 2 = 1 X 2
 ( − ) (45)
 − 1 =1

Formulele anterioare sunt estimatori ai parametrilor pentru distribuţii în care  şi 2 apar explicit ca parametrii,
spre exemplu în cazul distribuţiei normale sau a distribuţiei Poisson. În cazul distribuţiei binomiale avem parametru
necunoscut , şi cum în acest caz avem  =  (sau echivalent  =  ) obţinem pentru  estimatorul

̂ =  (46)

Formulele anterioare sunt cazuri particulare de estimatori obţinuţi prin metoda momentelor. În această
metodă de estimare a parametrilor, parametrul necunoscut se scrie în funcţie de momentele distribuţiei populaţiei.
Înlocuind în formula rezultată momentele de ordin  prin momentele de ordin  ale selecţiei

1X 
 = 
 =1 

se obţine un estimator al parametrului necunoscut.

9.3 Metoda verosimilităţii maxime


O altă metodă de estimare a parametrilor este metoda verosimilităţii maxime, metodă introdusă de R. A.
Fischer.
Să considerăm o variabilă aleatoare discretă (sau continuă)  având funcţia de probabilitate (densitate)  ()
ce depinde de un anumit parametru  necunoscut. Pentru a-l estima pe , considerăm un eşantion 1       de
volum .
În cazul discret, probabilitatea ca  valori ale variabilei aleatoare  să fie exact valorile 1       ale eşantionului
ales este
 =  ( = 1 ) ·    ·  ( =  ) =  (1 ) ·    ·  ( )  (47)
În cazul continuu, probabilitatea ca variabila aleatoare  să ia  valori în intervalele [   + ∆] este
Z 1 +∆ Z 1 +∆
 (1 ≤  ≤ 1 + ∆)·  · ( ≤  ≤  + ∆) =  ()      ()  ≈  (1 ) ∆·  · ( ) ∆ =  (∆
1 1
(48)
Cum funcţia  depinde de , funcţia  depinde de 1       şi de . Funcţia
 =  (1        ) =  (1 ) ·    ·  ( )
se numeşte funcţia de verosimilate.
Metoda verosimilităţii maxime presupune estimarea parametrului necunoscut  prin acea valoare ∗ ce maxi-
mizează valoarea funcţiei de verosimilate .
În ipoteza că  este o funcţie derivabilă, valoarea ∗ ce maximizează pe  este o soluţie a ecuaţiei

=0 (49)

(adică este un punct critic al funcţiei ).
Rezolvând ecuaţia anterioară în raport cu  se obţine o soluţie ∗ = ∗ (1       ). Un estimator de verosim-
ilate maximă pentru  este în acest caz ̂ = ∗ (1       ).

37
Observaţia 9.1 În practică este deseori utilă următoarea observaţie. Deoarece funcţia logaritm este o funcţie strict
crescătoare, funcţia ln  îşi atinge maximul în acelaşi punct cu funcţia . Pentru determina punctul ∗ în care
funcţia  îşi atinge maximul, putem echivalent determina punctul în care funcţia ln  îşi atinge maximul. Putem
deci înlocui ecuaţia (49) prin ecuaţia
 ln 
= 0 (50)

ecuaţie care este echivalentă cu (49), dar este în general mai uşor de rezolvat.
În cazul în care funcţia  depinde de mai mulţi parametrii necunoscuţi 1       , rezolvăm ecuaţiile (49)
corespunzătoare fiecăruia din parametrii necunoscuţi 1          , sau echivalent ecuaţiile (50), adică rezolvăm
sistemul ⎧ 
⎨ 1 = 0
 (51)
⎩ 
 = 0
sau echivalent sistemul ⎧  ln 
⎨ 1 =0
 (52)
⎩  ln 
 = 0
în raport cu 1       .
Valorile astfel determinate dau estimatorii de verosimilitate maximă b1      b pentru parametrii necunoscuţi
1       .
Exemplul 9.2 Să se determine estimatorii de verosimilitate maximă pentru media  şi abaterea pătratică medie 
în cazul distribuţiei normale. ¡ ¢
În acest caz, folosind faptul că funcţia de densitate a variabilei aleatoare N   2 este
1 (−)2
 () = √ − 22 
 2
obţinem că funcţia de verosimilitate este
 =  (1 ) ·    ·  ( )
1 (1 −)2 1 ( −)2
= √ − 22 ·    · √ − 22
 2  2
µ ¶
1 (1 −)2 ++( −)2
= √ − 22 
 2
Logaritmând, obţinem
√ (1 − )2 +    + ( − )2
ln  = − ln 2 −  ln  − 
2 2
Sistemul (52) devine în acest caz
½  ln  (
(1 −)++( −)
 =0 2 =0
 ln  ⇐⇒  (1 −)2 ++( −)2
 =0 − + 3 = 0
Din prima ecuaţie din sistem se obţine 1 +    +  −  = 0, şi deci estimatorul ̂ al lui  este dat de
1 +    + 
̂ = = 

Din a doua ecuaţie din sistem se obţine
(1 − )2 +    + ( − )2
2 = 

şi înlocuind pe  prin estimatorul ̂ din relaţia anterioară obţinem pentru  estimatorul
s
2 2
(1 − ) +    + ( − )
̂ = 

38
Exerciţii
¡ ¢
Exerciţiul 9.1 Să se determine estimatorul de verosimilitate maximă al dispersiei distribuţiei normale N 0  2
cu medie  = 0.
¡ ¢
Exerciţiul 9.2 Să se determine estimatorul de verosimilitate maximă al medie  a distribuţiei normale N   20
cu dispersie cunsocută  0 .

Exerciţiul 9.3 Să se estimeze parametrul  al distribuţiei Poisson prin metoda verosimilităţii maxime.

Exerciţiul 9.4 Să se determine estimatorul de verosimilitate maximă a parametrului necunoscut  al densităţii
½
−   ≥ 0
 () = 
0 0

Exerciţiul 9.5 Să se calculeze estimatorul punctual obţinut în exerciţiul anterior în cazul eşantionului 19, 04,
07, 06, 14. Să se reprezinte grafic funcţia de distribuţie ̂ () corepunzătoare eşantionului şi funcţia de distribuţie
 () a variabilei aleatoare pentru  = . Sunt cele două grafice aproximativ egale?

Exerciţiul 9.6 Acelaşi exerciţiu în cazul eşantionului 04, 07, 02, 11, 01.

Exerciţiul 9.7 Considerăm funcţia de densitate


½
−  ≥0
 () = 
0 0

a) Să se determine media  a variabilei aleatoare corepunzătoare.


b) Să se scrie densitatea  în funcţie de media  determinată la punctul anterior.
c) Să se estimeze  folosind metoda verosimilităţii maxime.

Exerciţiul 9.8 Să se estimeze parametrul  al distribuţiei binomiale prin metoda versoimilităţii maxime.

Exerciţiul 9.9 În exerciţiul anterior, să presupunem că în 4 încercări succesul a apărut de 2 ori, în alte 4 încercări
succesul a apărut de 3 ori, iar în alte 4 încercări experimentul a apărut de 2 ori. Să se estimeze probabilitatea  de
apariţie a succesului.

Exerciţiul 9.10 Mai general, să presupunem că s-au efectuat de  ori câte  încercări, şi că în primele  încercări
succesul a apărut de 1 ori, în următoarele  încercări succesul a apărut de 2 ori, . . . , în ultimele  încercări
succesul a apărut de  ori. Să se estimeze probabilitatea  de apariţie a succesului.

Exerciţiul 9.11 Într-un şir de încercări de tip Bernoulli, considerăm variabila aleatoare  reprezentând numărul
de încercări până la apariţia succesului.
a) Să se arate că funcţia de probabilitate a variabilei aleatoare  este
½
 −1   ∈ {1 2 3   }
 () = 
0 rest

unde  este probabilitatea de apariţie a succesului şi  = 1 − .


b) Să se estimeze parametrul  prin metoda verosimilităţii maxime folosind un eşantion de volum 1, 1 .

Exerciţiul 9.12 În exerciţiul anterior, să se estimeze parametrul  folosind un eşantion 1       .

Exerciţiul 9.13 La aruncarea unui zar, să presupunem că primul şase a apărut la a şaptea încercare, şi că repetând
din nou experimentul, primul şase a apărut la a şasea încercare. Să se estimeze probabilitatea  de apariţie a feţei
şase.
Indicaţie: a se vedea cele două exerciţii anterioare.

39
10 Estimarea parametrilor: intervale de încredere
Intervalele de încredere pentru un parametru necunoscut  al unei distribuţii (spre exemplu pentru media unei
populaţii) sunt intervale (1  2 ) ce conţin parametrul , nu cu certitudine, si cu anumită probabilitate  (spre
exemplu cu probabilitate  = 95% sau  = 99%). Valoarea lui  se numeşte nivel de încredere/nivel de
semnificaţie iar 1 şi 2 se numesc limita de încredere inferioară şi superioară.
Un astfel de interval (1  2 ) este calculat folosind o selecţie din populaţie. Valoarea  = 95% înseamnă că
probabilitatea ca intervalul (1  2 ) să nu-l conţină pe  este 1 −  = 5% = 005, adică aproximativ unul din 20 de
intervale astfel determinate nu îl va conţine pe . Cu cât valoarea lui  este mai apropiată de 1, cu atât este mai
mică probabilitatea erorii 1 −  ca intervalul de încredere să nu-l conţină parametrul , dar în acelaşi timp lungimea
2 − 1 a intervalului de încredere devine mai mare (tinde la infinit pentru  → 1).
Intervalele de încredere sunt mai utile decît estimatorii punctuali ai parametrilor necunoscuţi, deoarece având
intervalul de încredere putem considera ca estimator mijlocul 1 + 2
2
al intervalului (în acest caz, probabilitatea ca
2 −1
 să difere faţă de estimatorul considerat cu mai puţin de 2 este egală cu ).
Pentru a determina capetele 1 şi 2 ale intervalului de încredere, considerăm un eşantion 1       din populaţia
dată. Aceste valori sunt valorile observate ale unei variabile aleatoare  (reprezentând populaţia studiată), dar
ele pot fi privite ca valori ale  variabile aleatoare independente 1       având aceeaşi distribuţie cu variabila
aleatoare .
Atunci 1 = 1 (1       ) şi 2 = 2 (1       ) sunt valorile observate ale variabilelor aleatoare Θ1 =
Θ1 (1       ) şi Θ2 = Θ2 (1       ). Condiţia ca intervalul (1  2 ) să-l conţină parametrul  cu probabilitate
 se poate scrie deci sub forma
 (Θ1 ≤  ≤ Θ2 ) =  (53)
Pentru a determina variabilele aleatoare Θ1 şi Θ2 folosim următoarea.

Teorema 10.1 (Suma de variabile aleatoare normale independente) Fie 1       variabile aleatoare nor-
male independente, având fiecare medie  şi dispersie  2 . Atunci au loc următoarele.

a) Suma 1 +    +  este o variabilă aleatoare normală cu medie  şi dispersie  2 .


b) Variabila aleatoare
1 +    + 
= (54)

este o variabilă aleatoare normală cu medie  şi dispersie  2 .
c) Variabila aleatoare
 −
= (55)
√

este o variabilă aleatoare normală standard (cu medie 0 şi dispersie 1).

Demonstraţie. a) Este suficient să demonstrăm afirmaţia din enunţ în cazul  = 2 (demonstraţia poate fi apoi
completată prin inducţie matematică).
Se poate arăta că deoarece variabilele aleatoare normale 1 şi 2 sunt independente, variabila aleatoare 1 +2
este de asemenea o variabilă aleatoare normală.
Avem
 (1 + 2 ) =  (1 ) +  (2 ) =  +  = 2
şi deci variabila aleatoare 1 + 2 are medie 2.
De asemenea, deoarece variabilele aleatoare 1 şi 2 sunt independente, se poate arăta că dispersia sumei
1 + 2 este egală cu suma dispersiilor variabilelor aleatoare 1 şi 2 , adică

2 (1 + 2 ) =  2 (1 ) +  2 (2 ) =  2 +  2 = 2 2 


2
şi deci variabila aleatoare 1 + 2 are
¡ dispersie¢ 2 .
2
Am arătat deci că 1 + 2 ∈ N 2 2 , încheiând astfel prima parte ¡ a demonstraţiei.
¢
b) Conform primei părţi a demonstraţie avem că 1 +    +  ∈ N   2 este o variabilă aleatoare
³ normală
´
1 ++   2
cu medie  şi dispersie  2 . Folosind Teorema 6.4 rezultă că variabila aleatoare  =  ∈N   2 =
³ 2
´ 2
N   este o variabilă aleatoare normală cu medie  şi dispersie  .

40
³ 2
´
−
c) Cum  ∈ N   , folosind din nou Teorema 6.4 obţinem că variabila aleatoare standardizată  = √ ∈

N (0 1) este o variabilă aleatoare normală cu medie 0 şi dispersie 1.
Folosind teorema anterioară, putem acum determina intervale de încredere pentru media şi dispersia unei pop-
ulaţii normale după cum urmează.

10.1 Intervale de încredere pentru media  unei populaţii normale cu dispersie 2


cunoscută
¡ ¢
Dacă populaţia  ∈ N   2 este normală cu medie  (necunoscută) şi dispersie 2 (cunoscută), conform Teoremei
10.1 rezultă că variabila aleatoare
 −
=  ∈ N (0 1)

este o variabilă aleatoare normală standard.


Pentru un nivel de încredere  fixat, folosind Anexa 2 determinăm valoarea constantei  astfel încât

 =  (− ≤  ≤ ) = Φ () − Φ (−) 

Relaţia anterioară se poate scrie sub forma


à !
 −
 − ≤ ≤ = 
√

sau echivalent (rezolvând dubla inegalitate în raport cu )


µ ¶
 
  − √ ≤  ≤  + √ = 
 

Considerând Θ1 =  −  √ şi Θ2 =  +  √ , relaţia anterioară se poate scrie echivalent sub forma

 (Θ1 ≤  ≤ Θ2 ) = 

Înlocuind variabilele aleatoare 1       prin valorile observate 1       ale eşantionului obţinem că un
interval de încredere pentru media necunoscută  a populaţiei este
µ ¶
 
(1  2 ) =  −  √   +  √ (56)
 

Exemplul 10.2 Să se determine un interval de 95% încredere pentru media necunoscută  a unei populaţii normale
cu dispersie cunoscută  2 = 9, folosind un eşantion de volum  = 100 cu medie  = 5.
Folosind Anexa 2 determinăm valoarea  corespunzătoare probabilităţii  = 095 astfel încât

Φ () − Φ (−) =  = 095

şi obţinem  = 1960.


Folosind formula (56) determinăm intervalul de încredere pentru media necunoscută  a populaţiei
µ ¶ µ ¶
  3 3
(1  2 ) =  −  √   +  √ = (1  2 ) = 5 − 1960 √  5 + 1960 √ = (4412 5588) 
  100 100
O altă problemă în determinarea unui interval de încredere este legată de alegerea volumului selecţiei, ca în
exemplul următor.

Exemplul 10.3 Cât de mare trebuie ales volumul  al selecţiei în exemplu anterior dacă se doreşte obţinerea unui
interval de 95% încredere de lungime cel mult  = 04?
Intervalul de încredere pentru media  a populaţiei din formula (56) are lungimea
µ ¶ µ ¶
  
2 − 1 =  +  √ −  − √ = 2 √ 
  

41
Egalând această expresie cu valoarea  dorită, obţinem

 = 2 √ 

de unde rezolvând în raport cu  se obţine


µ ¶2 µ ¶2
2 2 · 1960 · 3
= = = 86436
 04

Pentru a obţine intervalul de încredere dorit, trebuie să alegem un volum de selecţie  = 865.

Observaţia 10.4 Se poate arăta că pentru un nivel de încredere  → 1, lungimea intervalului de încredere core-
spunzător tinde câtre infinit 2 − 1 → ∞.

10.2 Intervale de încredere pentru media  unei populaţii normale cu dispersie 2


necunoscută
În cazul în care dispersia  2 a populaţiei este necunoscută, nu mai putem utiliza formula (56) pentru a determina
un interval de încredere pentru media necunoscută  a populaţiei.
Deoarece valoarea abaterii pătratice medii  din această formulă este necunoscută, înlocuim pe  prin estimatorul
s
P 2
=1 ( − )
= (57)
−1

al lui .
Fâcând însă această înlocuire, variabila aleatoare corespunzătoare

 −
=
√

nu mai este o variabilă aleatoare normală (este o variabilă aleatoare   cu  − 1 grade de libertate, având
funcţia de distribuţie  () tabelată în Anexa 3), şi deci valoarea  trebuie determinată folosind acest tabel astfel
încât
 () −  (−) = 
Ca şi în cazul distribuţiei normale standard, distribuţia Student are o funcţie de densitate simetrică faţă de
origine, şi deci  (−) = 1 −  () pentru orice  ∈ R. Înlocuind în relaţia ant6erioară  (−) prin 1 −  ()
obţinem echivalent
 () − (1 −  ()) = 
sau
1+
 () =  (58)
2
Obţinem deci că în cazul unei populaţii având dispersie necunoscută  2 , pentru un nivel de încredere  fixat,
intervalul de încredere pentru media necunoscută  a populaţiei este
µ ¶
 
(1  2 ) =  −  √   +  √ (59)
 

unde  este volumul selecţiei,  = 1 ++




este media eşantionului, estimatorul  al abaterii pătratice medii  este
dat de formula (57), iar  este determinat din Anexa 3 astfel conform relaţiei (58) pentru  − 1 grade de libertate.

Exemplul 10.5 Cinci măsurători pentru temperatura de aprindere a motorinei (în grade Fahrenheit) sunt

144 147 146 142 144

Presupunând că temperatura de aprindere a motorinei este o variabilă aleatoare normală, să se determine un
interval de 99% încredere pentru temperatura medie  de aprindere a motorinei.

42
În acest caz, deoarece dispersia 2 este necunoscută, pentru a determina intervalul de încredere vom folosi
formula (59).
Folosind datele din eşantion determinăm media de selecţie
1 + 2 + 3 + 4 + 5
= = 1446
5
şi estimăm abaterea pătratică medie  folosind formula (57):
s
P5 2
=1 ( − )

= = 38 = 195
5−1

Folosind Anexa 3 pentru a determina valoarea lui  astfel încât să aibă loc relaţia (58), adică  () = 1+099
2 =
0995 (alegem  − 1 = 5 − 1 = 4 grade de libertate), şi obţinem  = 460.
Înlocuind aceste valori în formula (59), obţinem că un interval de 99% pentru temperatura medie de aprindere
a motorinei este
µ ¶ µ ¶
  195 195
(1  2 ) =  −  √   +  √ = 1446 − 460 √  1446 + 460 √ = (1405 1487) 
  5 5

10.3 Intervale de încredere pentru dispersia  2 unei populaţii normale


Procedând similar Teoremei 10.1, şi folosind în acest caz estimatorul

1 X¡ ¢2
2 =  − 
 − 1 =1

al dispersiei, se poate arăta că variabila aleatoare

2
 = ( − 1)
2
are o distribuţie 2 cu  − 1 grade de libertate (valorile funcţiei de distribuţie sunt tabelate în Anexa 4).
Deoarece această distribuţie nu este simetrică (ca în cazul distribuţiei normale), în loc de − şi  determinăm
două constante 1 şi 2 astfel încât  2 se află între 1 şi 2 cu probabilitate , adică

 (1 ≤  ≤ 2 ) = . (60)

Spre exemplu, determinăm constantele 1 şi 2 astfel încât


1− 1+
 (1 ) = şi  (2 ) =  (61)
2 2
unde  () este în acest caz funcţia de distribuţie a variabilei aleatoare 2 cu  − 1 grade de libertate din Anexa 4
(procedând astfel, aria de sub densitatea variabilei aleatoare 2 cuprinsă între 1 şi 2 va fi egală cu 1+ 1−
2 − 2 = ,
şi are deci loc relaţia (60) de mai sus).
Relaţia (60) se mai poate scrie echivalent sub forma
µ ¶
2
 1 ≤ ( − 1) 2 ≤ 2 = 

de unde rezolvând inegalităţile în raport cu  2 obţinem


µ ¶
−1 2 −1 2
  ≤ 2 ≤  = 
2 1
sau
 (Θ1 ≤  ≤ Θ2 ) = 
−1 2 −1 2
unde Θ1 = 2  şi Θ2 = 1  .

43
Înlocuind variabilele aleatoare 1       prin valorile observate 1       ale eşantionului obţinem că un
interval de încredere pentru dispersia necunoscută 2 a populaţiei este
µ ¶
−1 2 −1 2
(1  2 ) =     (62)
2 1
1
P 2
unde  este volumul selecţiei, 2 = −1 2
=1 ( − ) este estimatorul dispersiei  , iar 12 sunt determinate din
Anexa 4 pentru  − 1 grade de libertate conform relaţiilor (61).

Exemplul 10.6 Să se determine un interval de 95% încredere pentru dispersia necunoscută 2 a eşantionului

89 84 87 81 89 86 91 90 78 89 87 99 83 89

reprezentând rezistenţa la rupere (kg/mm2 a unei table de metal).


1 ++14
Folosind valorile eşantionului ( = 14 valori) determinăm media selecţiei  = 14 = 8728 şi estimatorul
2 al dispersiei
14
1 X
2 = ( − ) = 2515
14 − 1 =1
Folosind Anexa 4 (cu  − 1 = 14 − 1 = 13 grade de libertate), determinăm constantele 12 astfel încât  (1 ) =
1−
2 = 0025 şi  (2 ) = 1+2 = 0975. Obţinem 1 = 501 şi 2 = 2474.
Folosind formula (62) determinăm intervalul de încredere pentru dispersia necunoscută  2
µ ¶ µ ¶
−1 2 −1 2 14 − 1 14 − 1
(1  2 ) =    = 2515 2515 = (1321 6525) 
2 1 2474 501

10.4 Intervale de încredere pentru alte distribuţii


Intervalele de încredere pentru media  şi dispersia  2 determinate în secţiunile anterioare se aplică în cazul unei
distribuţii normale.
Pentru a obţine aceste formule s-a folosit faptul că dacă 1       sunt variabile aleatoare normale independente
cu medie  şi dispersie  2 , atunci variabila aleatoare

 −
=
√

este o variabilă aleatoare normală standard.


Una din teoremele fundamentale ale Teoriei probabilităţilor (Teorema Limită centrală) afirmă că dacă 1      
sunt variabile aleatoare independente cu medie  şi dispersie  2 (nu neapărat normale), atunci pentru valori ale lui
 ale volumului selecţiei suficient de mari, variabila aleatoare

 −
=
√

este aproximativ o variabilă aleatoare normală standard.


Acest fapt permite ca formulele pentru intervalele de încredere pentru media  şi dispersia  2 a unei populaţii
normale din secţiunile anterioare să poată fi folosite şi în cazul altor distribuţii, nu neapărat normale. Pentru ca
aproximarea să fie bună, volumul  al selecţiei trebuie să fie cel puţin 20 în cazul intervalelor de încredere pentru
medie, şi cel puţin 50 în cazul intervalelor de încredere pentru dispersie.

Exerciţii

Exerciţiul 10.1 De ce sunt intervalele de încredere mai utile decât estimatorii punctuali?

Exerciţiul 10.2 Ce se întâmplă cu intervalul de încredere din Examplul 10.2 dacă se foloseşte un nivel de încredere
de 99% în loc de 95%? Dar dacă media de eşantionului este 8 în loc de 5?

Exerciţiul 10.3 Să se determine un interval de 99% încredere pentru media  a unei populaţii normale cu abatere
pătratică medie 25, folosind eşantionul

308 300 299 301 317 340

44
Exerciţiul 10.4 Să se determine un interval de 95% încredere pentru media  a unei populaţii normale cu abatere
pătratică medie 12, folosind eşantionul
10 10 8 12 10 11 10 11

Exerciţiul 10.5 Să se determine un interval de 95% încredere pentru media  a unei populaţii normale cu dispersie
 2 = 16, folosind un eşantion de volum 200 având medie 7481.

Exerciţiul 10.6 Ce se întâmplă cu intervalul de încredere din exerciţiul anterior dacă volumul eşantionului se
reduce la 50?

Exerciţiul 10.7 Ce volum al eşantionului este necesar pentru ca intervalul de 95% încredere pentru medie să aibă
o lungimea 2? ?

Exerciţiul 10.8 Să se determine un interval de 99% încredere pentru media unei populaţii normale cu dispersie
 2 = 036 folosind un eşantion de volum 290 cu medie 1630.

Presupunând că populaţia din care următoarele eşantioane au fost extrase este normală, să se determine un
interval de 99% încredere pentru media  a populaţiei.

Exerciţiul 10.9 Un eşantion de 20 de şuruburi cu medie 1550 cm şi dispersie 009 cm2 .

Exerciţiul 10.10 Temperatura de topire a aluminiului (în grade Celsius) în cazul eşantionului

658 665 652 661 660

Exerciţiul 10.11 Conţinutul de cupru (în procente) a unui aliaj de alamă în cazul eşantionului

65 65 64 63 65 66 63 64 62 63

Exerciţiul 10.12 Un interval de 99% încredere pentru parametrul  al distribuţiei binomiale folosind un eşantion
de volum 24 000 cu frecvenţă relativă de apariţie a succesului 12012
24000 = 05005.

Exerciţiul 10.13 Să se determine un interval de 95% încredere pentru procentul de maşini aflate pe o autostradă
care au frâne aflate în condiţii necorespunzătoare, folosind folosind faptul că din 500 maşini verificate în mod aleator,
87 au avut frâne aflate în condiţii necorespunzătoare.

Presupunând că populaţia din care următoarele eşantioane au fost extrase este normală, să se determine un
interval de 95% încredere pentru dispersia  2 a populaţiei.

Exerciţiul 10.14 Rezistenţa la rupere (kpsi) a unui aliaj de oţel aflat la temperatura camerei, folosind eşantionul

251 255 258 253 253 252 250 252 255 256

Exerciţiul 10.15 Emisia de monoxid de carbon (grame pe km) a unui anumit tip de maşină (având viteză medie
de 55 km/h), folosind eşantionul
173 178 180 177 182 174 176 181

Exerciţiul 10.16 Dacă  este o variabilă aleatoare normală cu medie 40 şi dispersie 4, ce fel de distribuţie au
variabilele aleatoare 3 şi 5 − 2?

Exerciţiul 10.17 Dacă 1 şi 2 sunt variabile aleatoare normale independente, cu medii 16, respectiv 12, şi
dispersii 8, respectiv 2, care este distribuţia variabilei aleatoare 41 − 2 ?

Exerciţiul 10.18 O maşină umple cutii cântărind  kg cu  kg de sare, unde  şi  sunt variabile aleatoare
nromale cu medii 200 kg, respectiv 10 kg, şi dispersii 2 kg, respectiv 0.5 kg. Ce procent de cutii rezultate vor cântări
între 208 kg şi 212 kg?

Exerciţiul 10.19 Dacă greutatea  a sacilor de ciment este distribuită normal cu medie 40 kg şi dispersie 2 kg,
câţi saci de ciment poate căra un camion dacă probabilitatea ca greutatea totală să depăşească 2 000 kg este de 5%?

45
11 Testarea ipotezelor
Un test statistic constă în obţinerea unei deducţii bazată pe o selecţie din populaţie prin testarea unei anumite
ipoteze (rezultată din experienţa anterioară, din observaţii, din teorie, sau din cerinţe legate de calitatea produselor,
etc).
În multe cazuri, rezultatul testului este apoi folosit pentru luarea unei anumite decizii, cum ar fi decizia de
cumpărare a unui anumit automobil (bazată pe testul priving consumul de carburant), de administrare a unui
anumit medicament (bazată pe testul privind eficienţa acestuia), de aplicare a unei anumite strategii de marketing
(bazată pe testul privind reacţia consumatorilor la această strategie), etc.

11.1 Teste statistice


Pentru a înţelege modul de aplicare a testului statistic, considerăm următorul exemplu.

Exemplul 11.1 Dorim să cumpărăm 100 km de cablu de un anumit tip, cu condiţia că specificaţia producătorului
că acest cablu are o rezistenţă de rupere de  = 0 = 200 kg este îndeplinită. Aceasta reprezintă testarea ipotezei
(numită ipoteza nulă)  = 0 = 100. Decidem să nu cumpărăm cablul dacă testul statistic arată că valoarea reală
 = 1  100, deoarece aceasta arată că acest tip de cablu are o rezistenţă la rupere mai mică decât cea dorită.
Valoarea 1 se numeşte ipoteza alternativă a testului.
Dacă rezultatul testului sugerează că ipoteza nulă este adevărată, vom accepta această ipoteză, iar în caz contrar
o vom respinge. Trebuie să luăm însă în considerare luarea unei decizii greşite: vom nota prin  probabilitatea de
a respinge ipoteza nulă când de fapt aceasta este adevărată. Valoarea  se numeşte nivelul de semnificaţie al
testului.
Selectând în mod aleator 25 de role de cablu, şi tăiând câte o bucată din fiecare, obţinem un eşantion de volum
 = 25 din populaţia considerată. Dacă se măsoară rezistenţa la rupere a fiecărei bucâţi de cablu, obţinem spre
exemplu rezistenţa medie de rupere  = 197 kg, şi abaterea pătratică medie  = 6 kg.
Ne punem problema dacă diferenţa 197 − 200 = −3 este datorată anumitor factori aleatori (erori de măsurare,
spre exemplu), sau dacă ea este semnificativă pentru populaţia studiată. ¡ ¢
Presupunem că rezistenţa cablului este o variabilă aleatoare normală N   2 , şi deci în ipoteza că  = 0
(adică daca ipoteza nulă este adevărată), variabila aleatoare

 − 0
 =
√

este o variabilă aleatoare Student cu  − 1 grade de libertate.


Considerând un nivel de semnificaţie  = 5%, folosind Anexa 3 determinăm valoarea constantei  astfel încât
 () =  ( ≤ ) =  = 005, obţinând  = −171 (deoarece valoarea 005  05, pentru a determina pe 
folosind Anexa 3, folosim faptul că distribuţia Student este simetrică faţă de origine, şi determinăm ̃ astfel încât
 (̃) = 1 − 005 = 095 adică ̃ = 171. Valoarea lui  este deci  = −̃ = −171. A se vedea Figura 8).

F (c) = α = 0.05 1 − F (c̃) = α = 0.05

c = −1.71 0 c̃ = 1.71

Figure 8: Funcţia de densitate a distribuţiei Student este simetrică faţă de origine.

Ideea testului este următoarea: dacă ipoteza nulă este adevărată, probabilitatea ca o valoare calculată  a lui  să
fie mai mică decât  = −171 este  = 005 (probabilitatea este aproape nulă). Deci, dacă pentru selecţia considerată
observăm ca valoarea  este mai mică decât  = −171, afirmăm că ipoteza nulă nu poate fi adevărată şi respingem
această ipoteză, adică acceptăm ipoteza alternativă. Dacă însă  ≥ , atunci acceptăm ipoteza nulă.

46
În cazul concret prezentat avem1
 − 0 197 − 200 5
= = =− = −25  −171
√ 6 2
25 5

şi deci respingem ipoteza nulă  = 0 = 200 şi acceptăm ipoteza aleternativă  = 1  200.

Exemplul anterior ilustrează etapele parcurse în elaborarea unui test statistic, şi anume:

1. Se formulează ipoteza nulă ( = 0 = 0 în exemplul anterior)


2. Se formulează ipoteza alternativă ( = 1 = 1 în exemplul anterior)
3. Se alege un nivel de semnificaţie  dorit (spre exemplu 5% 1%, 01%, etc)
4. Se determină o variabilă aleatoare Θ̂ =  (1       ) ce depinde de parametrul necunoscut  al populaţiei,
dar a cărei distribuţie nu depinde de . Folosind distribuţia variabilei aleatoare Θ̂ se determină valoarea critică
 ( ( ≤ ) =  în exemplul anterior)

5. Pentru valori 1       ale eşantionului, se determină valoarea observată ̂ =  (1       ) a lui Θ̂.

6. Se acceptă sau se respinge ipoteza nulă, în funcţie de valorile concrete a lui ̂ şi  (în exemplul anterior, se
respinge ipoteza nulă dacă   )

11.2 Diferite ipoteze alternative


Să presupunem parametrul necunoscut al populaţiei studiate este , şi că ipoteza nulă testată este  = 0 . În
principiu, în acest caz există trei ipoteze alternative, şi anume:

(1)   0
(2)   0
(3)  6= 0

(1) şi (2) se numesc ipoteze alternative unilaterale, iar (3) se numeşte ipoteză alternativă bilaterală.
În cazul ipotezei alternative (1), valoarea critică  trebuie aleasă la dreapta lui 0 , pentru că în acest caz valorile
 din ipoteza alternativă se află la dreapta lui 0 (a se vedea Figura 9). Regiunea de respingere (la dreapta lui )
se numeşte regiune critică.

Regiune de acceptare Regiune de respingere


(Se accepta ipoteza nula) (Se respinge ipoteza nula)
θ0 c

Regiune de respingere Regiune de acceptare


(Se respinge ipoteza nula) (Se accepta ipoteza nula)
c θ0

Regiune de respingere Regiune de acceptare Regiune de respingere


(Se respinge ipoteza nula) (Se accepta ipoteza nula) (Se respinge ipoteza nula)
c1 θ0 c2

Figure 9: Cele trei tipuri de ipoteze alternative: (1)   0 (sus), (2)   0 (mijloc) şi (3)  6= 0 (jos).

În mod similar, în cazul ipotezei (2), valoarea critică  trebuie aleasă la stanga lui 0 , iar în cazul ipotezei
aletrnative (3), valorile critice 1 şi 2 trebuie alese de o parte şi de alta a lui 0 .
Toate cele trei ipoteze alternative prezentate apar în probleme practice, cum ar fi:


1 Înlocuim 1 ++ =1 ( − )
= 
(media selecţiei) şi  = −1
(dispersia selecţiei) prin valorile observate  = 197 şi  = 6.

47
- atunci când este important ca valoarea lui  să nu depăşească o valoarea maximă admisă 0 (spre exemplu
tensiunea maximă de alimentare a unui circuit electric), se alege ipoteza alternativă (1)
- atunci când este important ca valoarea lui  să nu fie mai mică decât o valoare minimă admisă 0 (ca în
exmplul anterior), se alege ipoteza alternativă (2)
- atunci când este important ca valoarea lui  să aibă exact dimensiunea dorită (spre exemplu diametrul unui
şurub trebuie să aibă o dimensiune precisă pentru a putea fi înfiletat), se alege ipoteza alternativă (3).

11.3 Erori în testarea ipotezelor


În testarea ipotezelor apare riscul a două tipuri de decizii eronate:

(I) Respingerea ipotezei nule atunci când ea este adevărată (numită eroare de tip I). Notăm cu  probabilitatea
unei erori de tip I.
(II) Acceptarea ipotezei nule atunci când ea este falsă (numită eroare de tip II). Notăm cu  probabilitatea unei
erori de tip II.

Cu toate că nu putem elimina apariţia acestor două tipuri de erori, putem alege nivele acceptabile de apariţie a
acestor erori,  şi .
Spre exemplu, să considerăm cazul testării ipotezei  = 0 în cazul ipotezei alternative  = 1  0 (celelate
cazuri sunt similare).
Alegem o valoare critică corespunzătoare, şi pentru un eşantion fixat 1       calculăm valoarea ̂ =  (1       )
pentru o anumită funcţie  (spre exemplu, în cazul în care  reprezintă media, alegem  (1       ) =  = 1 ++


).
Dacă ̂   respingem ipoteza nulă, iar dacă ̂ ≤  o acceptăm.
Valoarea ̂ este valoarea observată a variabilei aleatoare Θ̂ =  (1       ), deoarece 1       sunt valorile
observate ale selecţiei 1       .
În cazul unei erori de tip I, ipoteza nulă este respinsă deşi ea este adevărată (adică  = 0 ), şi deci probabilitatea
acestei erori este ³ ¯ ´
¯
 Θ̂ (1       )  ¯  = 0 = 

iar  se numeşte nivelul de semnificaţie al testului.


În cazul unei erori de tip II, ipoteza nulă este acceptată deşi ea este falsă (adică  = 1 ), şi deci probabilitatea
acestei erori este ³ ¯ ´
¯
 Θ̂ (1       ) ≤ ¯  = 1 = 

iar  = 1 −  se numeşte puterea testului ( este probabilitatea de a respinge ipoteza nulă atunci când ea este
falsă).
Probabilităţile  şi  din formulele anterioare depind de valoarea lui , şi este dorit ca valoarea lui  să fie
astfel aleasă încât ambele probabilităţi să fie cât mai mici. Acest lucru nu este însă posibil, deoarece pentru ca
probabilitatea  să fie minimă,  trebuie ales cât mai mare (spre dreapta lui 0 ), şi atunci probabilitatea  creşte.
În practică, se alege o valoare convenabilă pentru  (spre exemplu  = 5% sau 1%), se determină valoarea lui ,
şi apoi se calculează valoarea lui . Dacă valoarea  obţinută este prea mare, atunci se repetă testul, considerând
o selecţie de volum mai mare.
Dacă ipoteza alternativă nu este de forma  = 1 ci de una din formele (1) — (3), atunci probabilitatea  este o
funcţie de  (numită caracteristică de operare). Graficul acestei funcţii (numit curbă caracteristică) permite
determinarea probabilităţii  pentru o anumită valoarea a lui  (şi al volumului  al selecţiei).

11.4 Test pentru media  a unei populaţii normale cu dispersie cunoscută


Exemplul 11.2 Fie  o populaţie cu o distribuţie normală având dispersie cunoscută  2 = 9. Folosind un eşantion
de volum  = 10 cu medie  să se testeze ipoteza nulă  = 0 = 24 în cazul ipotezei alternative

(a)   0 (b)   0 (c)  6= 0 

Considerăm nivelul de semnificaţie  = 5%. Un estimator al mediei  este


1 +    + 
= 

48
iar dacă ipoteza nulă este adevărată, atunci  este o variabilă aleatoare normală cu medie  = 24 şi dispersie
2
 = 09, şi folosind Anexa 2 se determină valoarea lui . ¡ ¯ ¢
Cazul (a). În acest caz, determinăm valoarea lui  astfel încât    ¯  = 24 =  = 005, adică
µ ¶
 − 24
 (  ≤ |  = 24) = Φ √ = 1 −  = 095
09
Folosind Anexa 2 se determină −24√
09
= 1645, şi deci  = 2556. Dacă media eşantionului  ≤ 2556, ipoteza
nulă este acceptată, iar dacă   2556 ea este respinsă.
Puterea testului este dată de
µ ¶
¡ ¯ ¢ ¡ ¯ ¢ 2556 − 
 () =    2556¯  6= 24 = 1 −   ≤ 2556¯  6= 24 = 1 − Φ √ 
09
Cazul (b). În acest caz, determinăm valoarea lui  astfel încât
µ ¶
 − 24
 (  ≤ |  = 24) = Φ √ =  = 005
09
Folosind Anexa 2 se determină −24 √
09
= −1645, şi deci  = 2244. Dacă media eşantionului  ≥ 2244, ipoteza
nulă este acceptată, iar dacă   2244 ea este respinsă.
Puterea testului este µ ¶
¡ ¯ ¢ 2244 − 
 () =   ≤ 2244¯  6= 24 = Φ √ 
09
Cazul (c).Cum distribuţia normală este simetrică faţă de origine, determinăm constantele 1 şi 2 astfel încât
să fie egal depărtate faţă de media 0 = 24, adică vom considera 1 = 24 −  şi 2 = 24 +  şi determinăm constanta
 astfel încât µ ¶ µ ¶
¡ ¯ ¢  
¯
 24 −  ≤  ≤ 24 +   = 24 = Φ √ − Φ −√ = 1 −  = 095.
09 09
Folosind Anexa 2, obţinem √09 = 1960, sau  = 186, şi deci 1 = 24 − 186 = 2214 şi 2 = 24 + 186 = 2586.
Dacă media  a eşantionului este cuprinsă între 1 şi 2 , acceptăm ipoteza nulă, iar în caz contrar o respingem.
Puterea testului este
¡ ¯ ¢ ¡ ¯ ¢
 () =    2214¯  6= 24 +    2586¯  6= 24
µ ¶ µ ¶
2214 −  2586 − 
= Φ √ +1−Φ √ 
09 09
În practică, dacă creştem volumul  al eşantionului (spre exemplu de la  = 10 la  = 100), valoarea erorii
 () = 1 −  () scade. În funcţie de problema în cauză, volumul  al selecţiei se alege astfel încât valoarea erorii
 () să fie acceptabilă (în caz contrar, se alege un eşantion de volum mai mare şi se repetă testul).

11.5 Test pentru media  a unei populaţii normale cu dispersia necunoscută


În cazul când dispersia populaţiei este necunoscută, procedăm în mod similar cazului dispersiei cunoscute, înlocuind
abaterea pătratică medie  (necunoscută) prin valoarea estimată  a abaterii pătratice medii a eşantionului.
Exemplul 11.3 Testând rezistenţa la rupere a unor frânghii pentru un eşantion de volum  = 16, s-a determinat
valoarea medie  = 4482 kg şi abaterea pătratică medie  = 115 kg. Presupunând că rezistenţa la rupere este o
variabilă aleatoare normală, să se testeze ipoteza  = 0 = 4500 kg.
Considerăm nivelul de semnificaţie  = 5%. Dacă ipoteza nulă este adevărată, atunci variabila aleatoare
 − 0  − 4500
 = 
= 
√ √
 

este are o distribuţie student cu  − 1 = 15 grade de libertate.


Cum în această problemă este important dacă media  are (sau nu) valoarea minimă admisă 0 = 4500, alegem
ca ipoteză alternativă   0 = 4500.
Determinăm valoarea critică  astfel încât  (   |  = 4500) =  = 005. Folosind Anexa 3 determinăm
 = −175.
Valoarea observată a variabilei aleatoare  în cazul eşantionului selectat este  = 4482−4500
√115 = −0626. Deoarece
16
 = −0626  −175 = , acceptăm ipoteza nulă  = 0 = 4500 kg.

49
11.6 Test pentru dispersia  2 a unei populaţii normale
Considerăm următorul exemplu.
Exemplul 11.4 Folosind un eşantion dintr-o populaţie normală, de volum  = 15 având dispersie 2 = 13, să se
testeze ipoteza nulă  2 =  20 = 10 în cazul ipotezei alternative 2 =  21 = 20.
Considerăm un nivel de semnificaţie  = 5%. Dacă ipoteza nulă este adevărată, atunci variabila aleatoare
2 2
 = ( − 1) = 14 = 14 2
20 10
este o variabilă aleatoare 2 cu  − 1 = 14 grade de libertate.
Folosind Anexa 4 cu  − 1 = 14 grade de libertate determinăm valoarea constantei  astfel încât  (  ) =
 = 005, sau echivalent  ( ≤ ) = 1 −  = 095. Obţinem  = 2386.
În cazul eşantionului selectat obţinem valoarea  = 142 = 14 · 13 = 182  2386 = , şi deci în acest caz
acceptăm ipoteza nulă 2 =  20 = 10.
Observaţia 11.5 Atât în cazul testului pentru media unei populaţii normale cu dispersie necunoscută, cât şi în cazul
testului pentru dispersia unei populaţii normale, pentru a calcula puterea testului este nevoie de tabele suplimentare
(pentru distribuţia Student, respectiv pentru distribuţia 2 ). În acest curs nu vom studia aceste probleme.
Exerciţii
Exerciţiul 11.1 Să se testeze ipoteza  = 0 în cazul ipotezei alternative   0, presupunînd că populaţia este
normală şi considerând eşantionul
1 −1 1 3 8 6 0
pentru un nivel de semnificaţie  = 5%.
Exerciţiul 11.2 Pnetru un număr de 4 040 de aruncări ale unei monede s-a determinat că stema a apărut de
2 048 de ori.Să se testeze ipoteza că moneda este corectă cu ipoteza alternativă că moneda este măsluită în aşa fel
încât stema apare de mai multe ori decât banul.
Exerciţiul 11.3 Să se repete exerciţiul anterior în cazul a 12 000 de aruncări ale monedei, pentru care s-a deter-
minat că stema a apărut de 6 019 ori.
Exerciţiul 11.4 Presupunând că populaţia este normală şi are dispersie cunoscută 2 = 9, să se testeze ipoteza
 = 60 cu alternativa  = 57 folosind un eşantion de volum 20 având medie  = 5805 şi considerând  = 5%.
Exerciţiul 11.5 Ce se întâmplă în exerciţiul anterior dacă volumul selecţiei este micşorat, spre exemplu la  = 5?
Exerciţiul 11.6 Să se determine puterea testului în Exerciţiul 11.4.
Exerciţiul 11.7 Care este regiunea de respingere în Exerciţiul 11.4 în cazul unui test bilateral cu  = 5%?
Exerciţiul 11.8 Dacă o selecţie de 25 de cauciucuri are o durată de viaţă de 37000 kilometri şi o abatere pătratică
medie de 5000 kilometri, este posibil ca producătorul să afirme că durata medie de viată a acestui tip de cauciucuri
este mai mare decât 35000 kilometri? Verificaţi folosind un test cu nivel de semnificaţie 5% şi presupunând că
durata de viaţă a cauciucurilor este o variabilă aleatoare normală.
Exerciţiul 11.9 O firmă vinde ulei ambalat în cutii de 5000 grame şi este interesată să ştie dacă greutatea medie
diferă semnificativ faţă de 5000 grame la un nivel de semnificaţie de 5%, pentru a regla maşinile folosite în procesul
de producţie. Să se elaboreze un test pentru această problemă, şi să se verifice rezultatul testului în cazul unui
eşantion de 50 de cutii pentru care greutatea medie este de 4990 grame iar abaterea pătratică medie 20 grame.
Exerciţiul 11.10 Dcaă un medicament este eficient pentru aproximativ 75% din bolnavi, iar un nou medicament
a tratat 310 din cei 400 pacienţi pe care a fost testat, se poate trage concluzia că noul medicament este mai bun?
Ghiciţi, apoi calculaţi folosind un nivel de semnificaţie  = 5%.
Exerciţiul 11.11 Într-un anumit proces de producţie se produc anumite produse ce cântăresc fiecare 100 grame,
iar abaterea pătratică medie a greutăţilor este 08 grame. Să se testeze ipotea nulă  = 08 cu alternativă   08, în
cazul unui eşantion de 20 de produse având o abatere pătratică de 1 gram şi presupunând că populaţia este normal
distribuită (se va folosi  = 5%).

50

S-ar putea să vă placă și