Documente Academic
Documente Profesional
Documente Cultură
Volumul n 30 n 30
eșantionului
Nu este cazul - populaţia statistică este normal
Presupuneri distribuită
speciale - dispersia variabilei nu este
cunoscută
media eşantionului x este media eşantionului x este normal
Distribuția mediei aproximativ normal distribuită distribuită numai dacă populaţia
de eșantionare indiferent de tipul distribuţiei statistică este normal distribuită
variabilei în populația statistică
Distribuția testului
Distribuția normală Distribuția Student cu (n − 1) grade de
(distribuția z) libertate (distribuția t)
x − 0 x − 0 x − 0 x − 0 x − 0
Statistica testului z= = t= =
x n s n sx s n
Testarea ipotezelor statistice privind media populatiei
C) DETERMINAREA VALORII TESTULUI STATISTIC PE BAZA DATELOR DE SONDAJ
- z 2 și z 2 z - z
Valorile critice
ale testului - t și t t ;n−1 - t ;n −1
2;n −1 2;n −1
Întrucât z = −6,67 −1.96 = z 0.025 , rezultă că sunt suficiente dovezi pentru a respinge ipoteza
nulă H0 şi a accepta ipoteza alternativă, aceea că timpul mediu de servire a unei persoane este diferit de
130 minute.
Testarea ipotezelor statistice privind media populatiei
Exemplul 2.
Testarea ipotezei privind media populatiei pentru esantioane de volum redus (Testul t)
În scopul creșterii producției, o fermă pomicolă aplică un nou fertilizator, în cinci dintre livezile de cireși
ale fermei, livezi ce au aceeași suprafață. Producția înregistrată după aplicarea fertilizatorului este: 2,60;
3,32; 1,80; 3,43; 2,00 (mii kg.). Ştiind că producția medie la nivelul celor 5 livezi în anul anterior a fost
de 2,01 mii kg, sunt suficiente dovezi pentru a concluziona că recolta medie obținută după aplicarea
fertilizatorului este semnificativ mai mare față de producția anului anterior, pentru un nivel de încredere
de 5%?
Producția medie obținută după aplicarea fertilizatorului este x = 2,63 mii kg., cu dispersia:
(x )
2
− x 2,203
= = = 0,5507 şi abaterea standard: s x = s x2 = 0,74 mii kg.
2 i
s
n −1
x
4
Ipotezele testate sunt:
H0: μ = 2,01
H1: μ > 2,01 (test unilateral dreapta).
Testul utilizat, în ipoteza distribuției normale a populației din care a fost extras eșantionul în raport
În cazul variabilelor alternative, dacă eșantionul este de volum mare ( n 100 ), media în
eşantion (f - proporţia succeselor) urmează o distribuție normală, de medie p şi abatere standard
p (1 − p ) / n . Întrucât eșantionul este volum mare dispersia populației poate fi aproximată prin
H 1 : p p0 H 1 : p p0 H 1 : p p0
Aşadar, regula de decizie este: se acceptă ipoteza alternativă dacă valoarea testului se situează în
regiunea critică stabilită în funcţie de probabilitatea dorită de garantare a rezultatelor 100 (1 − )% .
Testarea ipotezei privind proporția (media variabilei alternative)
Exemplu. Un târg de prezentare a echipamentelor agricole este considerat de succes dacă cel puțin 12%
dintre vizitatori încheie un contract de achiziție a unui echipament. A fost selectat un eșantion de 400
de vizitatori ai târgului internațional de produse și echipamente în domeniul agriculturii INDAGRA,
ediția 2018 și s-a constatat că 56 dintre aceștia au încheiat un contract pentru achiziția unui echipament
agricol. Pentru o probabilitate de 99% poate fi considerată ediția 2018 a târgului INDAGRA un succes?
Ipotezele sunt:
H 0 : p = 0,12
Cum z = z 0.01 = 2,33 şi z z , rezultă că nu ne aflăm în regiunea critică (Rc), nu avem suficiente
dovezi să respingem ipoteza nulă, deci procentul nu este mai mare de 12%.
Testarea ipotezei privind egalitatea dintre două medii
1. Testarea ipotezei privind egalitatea dintre două medii
Există multe situații în care se dorește compararea a două populații statistice din
perspectiva unei anumite variabile. De exemplu, o asociație de fermieri dorește să vadă dacă
există o diferență semnificativă între producția medie la hectar obținută pentru o anumită cultură
prin aplicarea a două tipuri de fertilizanți. Într-o astfel de situație, ipotezele testate sunt:
Test bilateral Test unilateral dreapta Test unilateral stânga
H 0 : 1 = 2 sau H 0 : 1 = 2 sau H 0 : 1 = 2 sau
1 − 2 = d 1 − 2 = d 1 − 2 = d
H1 : 1 2 sau H 1 : 1 2 sau H1 : 1 2 sau
1 − 2 d 1 − 2 d 1 − 2 d
Diferenţa ipotetică dintre mediile populaţiilor, notată cu d este, de cele mai multe ori,
egală cu zero. Această diferenţă dintre mediile eşantioanelor ( x1 − x 2 ) reprezintă un estimator
al diferenţei ( 1 − 2 ).
Testarea ipotezei privind egalitatea dintre două medii
12 22
(x 1 −x 2 )= + ,
n1 n2
unde 12 şi 22 sunt dispersiile celor două populaţii eşantionate, iar n1 şi n2 sunt volumele
eşantioanelor. Estimatorul dispersiei distribuției de eșantionare este:
s12 s22
)= n +n
2
s( x1 −x 2
1 2
1 1
(x 1 −x 2 )
= + .
n1 n2
Testarea ipotezei privind egalitatea dintre două medii
Testarea diferenței (egalității) dintre două medii trebuie precedată, așadar, de testarea
diferenței (egalității) dintre două dispersii.
(x − x ) + (x )
n1 n2
2 2
i 1 i − x2
sc2 = i =1 i =1
sau
n1 + n2 − 2
sc2 =
(n1 − 1)s12 + (n2 − 1)s22
=
(n1 − 1)s12 + (n2 − 1)s22
(n1 − 1) + (n2 − 1) n1 + n2 − 2
(n − 1) s 2
2 = ~ 2 ;n −1
2
Distribuţia hi-pătrat are domeniul de variaţie (0,+) și este pozitiv înclinată, forma
distribuţiei fiind dată de numărul gradelor de libertate ( n − 1) . Valoarea lui χ 2 pentru care
aria de sub curbă, situată la dreapta ei, este egală cu α și se notează χ 2α . Valoarea lui χ 2
pentru care aria de sub curbă, situată la stânga ei, este egală cu 1 − și se notează 2
1− .
Testarea ipotezei privind dispersia unei populaţii
H 1 : 2 02 H 1 : 2 02 H 1 : 2 02
Testarea ipotezei privind dispersia unei populaţii
Testul statistic utilizat în testarea ipotezei privind dispersia 2 este:
(n − 1) s 2
2
= .
2
H1 : 2
100 .
Deoarece ,n −1 vom respinge ipoteza nulă şi vom accepta ipoteza alternativă, conform
2 2
căreia, adică abaterea cantității cerute este semnificativ mai mare de 10 kg.
Testarea ipotezei privind egalitatea dintre două dispersii
Aplicabilitatea imediată a acestui tip de testare a fost evidențiată în verificarea ipotezei
privind egalitatea dintre două medii. Compararea a două dispersii are utilitate în multe situații
de tipul: decizia de investire într-un portofoliu cu risc mai mare sau mai mic, adaptarea ofertelor
turistice în funcție de variabilitatea veniturilor pentru diferite tipuri de turism etc.
Pentru a compara dispersiile a două populaţii se determină raportul dintre ele. Raportul
s12 / s 22 este estimator punctual al raportului de dispersii 12 / 22 , distribuţia de eşantionare a
raportului s12 / s 22 fiind o distribuţie Fisher (distribuție F), dacă eşantioanele au fost extrase
independent din populaţii normal distribuite.
Testarea ipotezei privind egalitatea dintre două dispersii
Raportul dintre două variabile hi-pătrat independente corectate cu gradele de libertate
aferente are o distribuţie Fisher. Gradele de libertate ale distribuţiei F sunt identice cu gradele
de libertate ale celor două distribuţii hi-pătrat.
Așadar:
(n1 − 1) s12 / 12 (n2 − 1) s22 / 22 s12 / 12
F= : = 2 2 , cu ( n1 −1) şi (n 2 − 1) grade de libertate.
(n1 − 1) (n2 − 1) s2 / 2
Valoarea lui F pentru care aria de sub curbă, situată la dreapta ei, este α, se notează Fα,, cu gradele
de libertate gl1 =n1 −1 și gl2 =n 2 −1 . De asemenea, trebuie știut că:
1
F1−α,gl1,gl 2 = .
Fα,gl1,gl 2
Testarea ipotezei privind egalitatea dintre două dispersii
Ipotezele testate sunt:
Delimitarea regiunii critice, pentru un nivel de semnificație α, în funcție de tipul testului este
prezentată în tabelul de mai jos:
Test bilateral Test unilateral Test unilateral
Tipul testului
dreapta stânga
Valorile critice F1− / 2,n −1,n și F / 2, n1 −1, n2 −1 F , n1 −1, n2 −1 F1− ,n −1,n
1 2 −1 1 2 −1
ale testului
Funcții Excel F.INV ( / 2; gl1 ; gl 2 ) și F , gl1 , gl2 = F1− , gl1 , gl2 =
pentru determinarea F.INV.RT ( / 2; gl1 ; gl 2 ) F.INV.RT ( ; gl1 ; gl 2 ) F.INV
valorilor critice ( ; gl1 ; gl 2 )
Regiunea critică F F / 2,n1 −1,n2 −1 sau F F ,n1 −1,n2 −1 F F1− ,n −1,n
1 2 −1
( de respingere
F F1− / 2,n −1,n
a ipotezei H0 ) 1 2 −1
Testarea ipotezei privind egalitatea dintre două dispersii
Exemplu: A fost realizat un studiu pentru identificarea principalilor factori ce influențează tipul de turism
(extern sau intern) preferat de clienții unei agenții. Unul dintre factorii identificați îl reprezintă variabilitatea
veniturilor. Știind că distribuţia veniturilor (mii lei) în cele două populații analizate (populația clienților ce
preferă turismul extern, respectiv cea a clienților ce prefer turismul intern) este aproximativ normală, au fost
selectate două eşantioane, de volum 60, respective 50 de personae. Abaterile standard ale veniturilor (mii lei)
sunt: s1 = 2,84 şi s 2 = 1,86 . Se utilizează o probabilitate de garantare a rezultatelor de 95%.
Ipotezele statistice sunt:
H 0 : 12 / 22 = 1 ,
H 1 : 12 / 22 1 .
Testarea ipotezei privind egalitatea dintre două dispersii
Testul statistic are valoarea:
s12 2,84 2 8,0686
F= 2 = = = 2,3314 .
s 2 1,86 2 3,4596
În general, dacă la numărător se trece dispersia cea mai mare testul F este un test unilateral dreapta.
Cum F F0.05;59; 49 ipoteza nulă se respinge (aceea că raportul dintre dispersii este 1) şi se acceptă
ipoteza alternativă. Acest lucru înseamnă că se acceptă ipoteza conform căreia împrăştierea veniturilor
pentru turiştii ce preferă turismul extern este semnificativ mai mare decât cea a turiştilor ce preferă
turismul intern.
Testarea ipotezei privind normalitatea unei distribuţii
• Întrucât procedeele grafice sunt intuitive, pe baza lor putem doar să ne facem o ideee privind
forma distribuţiei variabilei.
• De regulă, se utilizează teste specifice, numite teste de concordanţă, pentru verificarea ipotezei de
normalitate a distribuţiei variabilei în populaţia statistică considerată.
• Testele de concordanţă (goodness of fit test, în engl.) ne arată modul în care o anumită
distribuţie statistică teoretică (uzual, distribuţia normală) “se potriveşte” cu distribuţia datelor
empirice obţinute pe baza unui eşantion.
• Această analiză pune în evidenţă “concordanţa” dintre modelul empiric, furnizat de histogramă, şi
modelul teoretic considerat adecvat pentru populaţia din care provin datele statistice observate.
Testarea ipotezei privind normalitatea unei distribuţii
1. Testul 2 (Hi pătrat), aplicat în cazul datelor grupate pe interval de variaţie, constă
Utilitatea testului, bazat pe prorietățile matematice demonstrate de cei doi matematicieni ruși, derivă
posibilitatea de a decide asupra ipotezei normalității printr-o abordare atât analitică, cât și grafică.
Testul, utilizat în cazul datelor negrupate, este relativ dificil de aplicat fără automatizarea calculelor.
Ipotezele testate și regula de decizie a testului Kolmogorov-Smirnov sunt similare testului 2
(Hi pătrat).
Atât testul 2 (Hi pătrat), cât și testul Kolmogorov-Smirnov sunt implementate de
majoritatea pachetelor software specializate în analiza datelor, cum este cazul programului
SPSS.
În cazul în care, după testarea ipotezei privind normalitatea distribuţiei în populația statistică cu
ajutorul testelor prezentate anterior, ipoteza nulă nu este acceptată, pot fi utilizate metode statistice
neparametrice, în cadrul cărora nu se fac presupuneri speciale asupra formei distribuţiei.
Testarea ipotezei privind normalitatea unei distribuţii
Exemplul 2. Una dintre caracteristicile de interes în previzionarea activității realizate de o
agenție de turism este vârsta medie a clienților ce preferă destinații exotice. Directorul unei agenții de
turism dorește să știe, pentru un nivel de încredere de 95%, dacă distribuția clienților ce achiziționează
pachete turistice în regiuni exotice, în funcție de vârstă este aproximativ normală. Pentru un eșantion de
54 de clienți, selectați aleator, se înregistrează datele referitoare la vârsta acestora.
Rezolvare:
Pe baza datelor referitoare la vârsta respondenților introduse în SPSS se aplică testul Kolmogorov-
Smirnov, rezultatele obținute fiind prezentate în output-ul de mai jos:
Testarea ipotezei privind normalitatea unei distribuţii