Documente Academic
Documente Profesional
Documente Cultură
Un test statistic constă în obţinerea unei deducţii bazată pe o selecţie din populaţie prin testarea unei anumite
ipoteze (rezultată din experienţa anterioară, din observaţii, din teorie, sau din cerinţe legate de calitatea produselor,
etc). De multe ori această ipoteză este o afirmaţie referitoare la valoarea parametrului necunoscut al densităţii
populaţiei, spre exemplu media sau dispersia populaţiei.
Rezultatul testării este apoi folosit pentru luarea unei anumite decizii, cum ar fi decizia de cumpărare a unui
anumit automobil (bazată pe testul priving consumul de carburant), de administrare a unui anumit medicament
(bazată pe testul privind eficienţa acestuia), de aplicare a unei anumite strategii de marketing (bazată pe testul
privind reacţia consumatorilor la această strategie), etc.
Testarea unei ipoteze statistice este procedeul prin care folosind informaţia dintr-o selecţie a populaţiei se ajunge
la o decizie asupra ipotezei în cauză. Dacă informaţia dată de selecţie este consistentă cu ipoteza, atunci se acceptă
ipoteza, iar în caz contrar aceasta este respinsă.
Pentru a înţelege modul de aplicare a testului statistic, considerăm următorul exemplu.
Exemplul 9.1 Dorim să cumpărăm 100 km de cablu de un anumit tip, cu condiţia că specificaţia producătorului
că acest cablu are o rezistenţă de rupere de = 0 = 200 kg este îndeplinită. Aceasta reprezintă testarea ipotezei
(numită ipoteza nulă) = 0 = 200. Decidem să nu cumpărăm cablul dacă testul statistic arată că valoarea reală
= 1 200, deoarece aceasta arată că acest tip de cablu are o rezistenţă la rupere mai mică decât cea dorită.
Valoarea 1 se numeşte ipoteza alternativă a testului. Formalizăm aceasta prin
0 : = 200
1 : 200
Dacă rezultatul testului sugerează că ipoteza nulă 0 este adevărată, vom accepta această ipoteză, iar în caz
contrar o vom respinge (şi vom accepta deci ipoteza alternativă 1 ).
Trebuie avut însă în vedere că verificarea cu siguranţă a ipotezei considerate este imposibilă în practică (cu
excepţia cazului când se poate selecta întreaga populaţie), şi deci verificarea ipotezelor statistice trebuie avută în
vedere probabilitatea luării unei decizii greşite: vom nota prin probabilitatea de a respinge ipoteza nulă 0 când
de fapt aceasta este adevărată. Valoarea se numeşte nivelul de semnificaţie al testului.
Selectând în mod aleator 25 de role de cablu, şi tăiând câte o bucată din fiecare, obţinem un eşantion de volum
= 25 din populaţia considerată. Dacă se măsoară rezistenţa la rupere a fiecărei bucâţi de cablu, obţinem spre
exemplu rezistenţa medie de rupere = 197 kg şi abaterea pătratică medie = 6 kg.
Ne punem problema dacă diferenţa 197 − 200 = −3 este datorată anumitor factori aleatori (erori de măsurare,
spre exemplu), sau dacă ea este semnificativă pentru populaţia studiată. ¡ ¢
Dacă presupunem că rezistenţa cablului este o variabilă aleatoare normală N 2 , în ipoteza că = 0 = 200
(adică dacă ipoteza nulă este adevărată), variabila aleatoare
− 0
=
√
61
F (c) = α = 0.05 1 − F (c̃) = α = 0.05
c = −1.71 0 c̃ = 1.71
Figure 15: Funcţia de densitate a distribuţiei Student este simetrică faţă de origine.
şi deci respingem ipoteza nulă = 0 = 200 şi acceptăm ipoteza alternativă = 1 200.
Exemplul anterior ilustrează etapele parcurse în elaborarea unui test statistic, şi anume:
5. Pentru valori 1 ale eşantionului, se determină valoarea observată ̂ = (1 ) a lui Θ̂.
6. Se acceptă sau se respinge ipoteza nulă, în funcţie de valorile concrete a lui ̂ şi (în exemplul anterior, se
respinge ipoteza nulă dacă )
(1) 0
(2) 0
(3) 6= 0
(1) şi (2) se numesc ipoteze alternative unilaterale, iar (3) se numeşte ipoteză alternativă bilaterală.
În cazul ipotezei alternative (1), valoarea critică trebuie aleasă la dreapta lui 0 , pentru că în acest caz valorile
din ipoteza alternativă se află la dreapta lui 0 (a se vedea Figura 16). Regiunea pentru care se acceptă ipoteza
nulă (la stânga lui în acest caz) se numeşte regiune de acceptare, iar regiunea pentru care se respinge ipoteza
nulă (la dreapta lui în acest caz) se numeşte regiune de respingere. Valoarea care separă aceste regiune se
numeşte valoare critică.
În mod similar, în cazul ipotezei (2), valoarea critică trebuie aleasă la stanga lui 0 , iar în cazul ipotezei
alternative (3), valorile critice 1 şi 2 trebuie alese de o parte şi de alta a lui 0 .
Toate cele trei ipoteze alternative prezentate apar în probleme practice, cum ar fi:
- atunci când este important ca valoarea lui să nu depăşească o valoarea maximă admisă 0 (spre exemplu
tensiunea maximă de alimentare a unui circuit electric), se alege ipoteza alternativă (1)
- atunci când este important ca valoarea lui să nu fie mai mică decât o valoare minimă admisă 0 (ca în
exmplul anterior), se alege ipoteza alternativă (2)
- atunci când este important ca valoarea lui să aibă exact dimensiunea dorită (spre exemplu diametrul unui
şurub trebuie să aibă o dimensiune precisă pentru a putea fi înfiletat), se alege ipoteza alternativă (3).
62
Regiune de acceptare Regiune de respingere
(Se accepta ipoteza nula) (Se respinge ipoteza nula)
θ0 c
Figure 16: Cele trei tipuri de ipoteze alternative: (1) 0 (sus), (2) 0 (mijloc) şi (3) 6= 0 (jos).
(I) Respingerea ipotezei nule atunci când ea este adevărată (numită eroare de tip I). Notăm cu probabilitatea
unei erori de tip I, adică
(se respinge 0 | 0 este adevărată) =
(II) Acceptarea ipotezei nule atunci când ea este falsă (numită eroare de tip II). Notăm cu probabilitatea unei
erori de tip II, adică
(se acceptă 0 | 0 este falsă) =
Cu toate că nu putem elimina apariţia acestor două tipuri de erori, putem alege nivele acceptabile de apariţie a
acestor erori, şi .
Spre exemplu, să considerăm cazul testării ipotezei = 0 în cazul ipotezei alternative = 1 0 (celelate
cazuri sunt similare).
Alegem o valoare critică corespunzătoare, şi pentru un eşantion fixat 1 calculăm valoarea ̂ = (1 )
pentru o anumită funcţie (spre exemplu, în cazul în care reprezintă media, alegem (1 ) = = 1 ++
).
Dacă ̂ respingem ipoteza nulă, iar dacă ̂ ≤ o acceptăm.
Valoarea ̂ este valoarea observată a variabilei aleatoare Θ̂ = (1 ), deoarece 1 sunt valorile
observate ale selecţiei 1 .
În cazul unei erori de tip I, ipoteza nulă este respinsă deşi ea este adevărată (adică = 0 ), şi deci probabilitatea
acestei erori este ³ ¯ ´
¯
Θ̂ (1 ) ¯ = 0 =
iar = 1 − se numeşte puterea testului ( este probabilitatea de a respinge ipoteza nulă atunci când ea este
falsă).
Probabilităţile şi din formulele anterioare depind de valoarea lui , şi este dorit ca valoarea lui să fie
astfel aleasă încât ambele probabilităţi să fie cât mai mici. Acest lucru nu este însă posibil, deoarece pentru ca
probabilitatea să fie minimă, trebuie ales cât mai mare (spre dreapta lui 0 ), şi atunci probabilitatea creşte.
În practică, se alege o valoare convenabilă pentru (spre exemplu = 5% sau 1%), se determină valoarea lui ,
şi apoi se calculează valoarea lui . Dacă valoarea obţinută este prea mare, atunci se repetă testul, considerând
o selecţie de volum mai mare.
Dacă ipoteza alternativă nu este de forma = 1 ci de una din formele (1) — (3), atunci probabilitatea este o
funcţie de (numită caracteristică de operare). Graficul acestei funcţii (numit curbă caracteristică) permite
determinarea probabilităţii pentru o anumită valoarea a lui (şi al volumului al selecţiei).
63
9.3 Test pentru media a unei populaţii normale cu dispersie cunoscută
¡ ¢
Presupunem că populaţia ∈ N 2 este normală cu dispersie 2 cunoscută, şi considerăm spre exemplu cazul
testului
0 : = 0
1 : =6 0
pentru media a populaţiei (cazul ipotezelor alternative¡ ¢0 , respectiv 0 este similar).
Dacă 1 este o selecţie
³ a´populaţiei ∈ N 2 , rezultă că media de selecţie = 1 ++
este o
2 2
variabilă aleatoare normală N cu medie şi dispersie . Dacă ipoteza nulă este adevărată (adică = 0 ),
variabila aleatoare
− 0
= ∈ N (0 1)
√
Exemplul 9.2 Fie o populaţie cu o distribuţie normală având dispersie cunoscută 2 = 9. Folosind un eşantion
de volum = 10 cu medie să se testeze ipoteza nulă = 0 = 24 în cazul ipotezei alternative
64
¡ ¯ ¢
Cazul (a). În acest caz, determinăm valoarea lui astfel încât ¯ = 24 = = 005, adică
µ ¶
− 24
( ≤ | = 24) = Φ √ = 1 − = 095
09
În practică, dacă creştem volumul al eşantionului (spre exemplu de la = 10 la = 100), valoarea erorii
() = 1 − () scade. În funcţie de problema în cauză, volumul al selecţiei se alege astfel încât valoarea erorii
() să fie acceptabilă (în caz contrar, se alege un eşantion de volum mai mare şi se repetă testul).
0 : = 0
1 : =6 0
65
are în acest caz o distribuţie Student cu − 1 grade de libertate, şi procedând în mod analog cazului anterior,
determinăm punctul 2−1 astfel încât aria de sub densitatea Student cu − 1 grade de libertate, la dreapta
acestui punct este egală cu 2 , adică
¡ ¢
2−1 = 1 −
2
unde este funcţia de distribuţie Student cu − 1 grade de libertate (se va folosi Anexa 3).
Testul este următorul: pentru valori observate 1 ale selecţiei 1 se calculează valoarea = −
√
0
,
q P ¡ ¢
2
unde = 1 ++
şi = −1 1
=1 ( − ) . Dacă ∈ −2−1 2−1 se respinge ipoteza nulă = 0 ,
iar în caz contrar aceasta este acceptată.
Exemplul 9.3 Testând rezistenţa la rupere a unor frânghii pentru un eşantion de volum = 16, s-a determinat
valoarea medie = 4482 kg şi abaterea pătratică medie = 115 kg. Presupunând că rezistenţa la rupere este o
variabilă aleatoare normală, să se testeze ipoteza = 0 = 4500 kg.
Considerăm nivelul de semnificaţie = 5%. Dacă ipoteza nulă este adevărată, atunci variabila aleatoare
− 0 − 4500
=
=
√ √
0 : 2 = 20
1 : 2 =6 20
66
Exemplul 9.4 Folosind un eşantion dintr-o populaţie normală, de volum = 15 având dispersie 2 = 13, să se
testeze ipoteza nulă 2 = 20 = 10 în cazul ipotezei alternative 2 = 21 = 20.
Considerăm un nivel de semnificaţie = 5%. Dacă ipoteza nulă este adevărată, atunci variabila aleatoare
2 2
= ( − 1) = 14 = 14 2
20 10
Observaţia 9.5 Atât în cazul testului pentru media unei populaţii normale cu dispersie necunoscută, cât şi în cazul
testului pentru dispersia unei populaţii normale, pentru a calcula puterea testului este nevoie de tabele suplimentare
(pentru distribuţia Student, respectiv pentru distribuţia 2 ). În acest curs nu vom studia aceste probleme.
0 : = 0
1 : =6 0
67