Sunteți pe pagina 1din 34

Curs 3

1. Testarea ipotezelor statistice privind media populatiei


2. Testarea ipotezei privind proporția (media variabilei alternative)
3. Testarea ipotezei privind egalitatea dintre două medii
4. Testarea ipotezei privind dispersia unei populaţii
5. Testarea ipotezei privind egalitatea dintre două dispersii
6. Testarea ipotezei privind normalitatea unei distribuţii
Testarea ipotezelor statistice privind media populatiei

A) FORMULAREA IPOTEZELOR TESTATE

Formularea ipotezelor reprezintă primul pas în procesul de testare a ipotezelor statistice.


Cele două ipoteze pot avea una dintre forme, în funcție de tipul de testare impus de problema
ce urmează a fi soluționată:
Test bilateral Test unilateral dreapta Test unilateral stânga
H0: μ = μ0 sau H0: μ - μ0=0 H0: μ = μ0 sau H0: μ - μ0=0 H0: μ = μ0 sau H0: μ - μ0=0
H1: μ ≠ μ0 sau H1: μ - μ0≠0 H1: μ > μ0 sau H1: μ - μ0>0 H1: μ < μ0 sau H1: μ - μ0<0
Testarea ipotezelor statistice privind media populatiei
B) IDENTIFICAREA STATISTICII TESTULUI UTILIZAT
Distribuția statisticii testului depinde de volumul eșantionului utilizat și a
presupunerilor făcute asupra populației din care a fost extras eșantionul.
Pentru testarea ipotezei privind media populației avem următoarele situații:

Volumul n  30 n  30
eșantionului
Nu este cazul - populaţia statistică este normal
Presupuneri distribuită
speciale - dispersia variabilei  nu este
cunoscută
media eşantionului x este media eşantionului x este normal
Distribuția mediei aproximativ normal distribuită distribuită numai dacă populaţia
de eșantionare indiferent de tipul distribuţiei statistică este normal distribuită
variabilei în populația statistică
Distribuția testului
Distribuția normală Distribuția Student cu (n − 1) grade de
(distribuția z) libertate (distribuția t)
x − 0 x − 0 x − 0 x − 0 x − 0
Statistica testului z= =  t= =
x  n s n sx s n
Testarea ipotezelor statistice privind media populatiei
C) DETERMINAREA VALORII TESTULUI STATISTIC PE BAZA DATELOR DE SONDAJ

D) STABILIREA NIVELULUI (PRAGULUI) DE SEMNIFICAȚIE ȘI A PROBABILITĂȚII DE


GARANTARE A REZULTATELOR (NIVELUL DE ÎNCREDERE)

E) DELIMITAREA REGIUNII CRITICE (REGIUNEA DE RESPINGERE A IPOTEZEI NULE)


E) DELIMITAREA REGIUNII CRITICE (REGIUNEA DE RESPINGERE A IPOTEZEI NULE)
Test bilateral Test unilateral Test unilateral stânga
Tipul testului
dreapta

- z 2 și z 2 z - z
Valorile critice
ale testului - t și t t ;n−1 - t ;n −1
2;n −1 2;n −1

Funcții Excel z 2 =NORM.S.INV( 1 −  ) z =NORM.S.INV( 1 −  )


2
pentru
determinarea
t 2;n −1 =T.INV.2T ( , n − 1) ( −
t ;n −1 =T.INV(1 −𝑛
, n𝛼, 1)− 1)
valorilor critice

Regiunea critică z  − z 2 sau z  z 2 z  z z  − z


( de respingere
a ipotezei H0 ) t  −t 2;n −1 sau t  t 2;n −1 t  t ;n −1 t  −t ;n−1
Testarea ipotezelor statistice privind media populatiei
Exemplul 1.
Testarea ipotezei privind media populatiei pentru esantioane de volum mare (Testul Z)
Conducerea Direcției Regim Permise de Conducere și Înmatriculare a Vehiculelor din București dorește
să fluidizeze servirea persoanelor care solicită un anumit serviciu. Din analize anterioare se cunoaște că
timpul de servire a este normal distribuit, de medie 130 de minute şi abatere standard 15 minute.
Conform informațiilor actualizate, conducerea instituției se îndoieşte de faptul că timpul mediu de
servire a unei persoane este de 130 minute. Pentru a studia această problemă, se înregistrează timpii de
servire pentru un eșantion aleator de 100 de persoane. Timpul mediu obţinut în eşantion este 120 minute.
Poate conducerea instituției să concluzioneze, pentru o probabilitate de 95%, că timpul mediu este diferit
de 130 minute?

Ipotezele testate sunt:


H 0 :  = 130
H 1 :   130
Trebuie, aşadar, să răspundem la întrebarea: “Este media de 120 minute suficient de diferită de
valoarea 130, pentru a ne permite să concluzionăm că media populaţiei nu este egală cu 130 minute?”
Vom putea să respingem ipoteza nulă dacă media eşantionului este suficient de diferită, relativ
la valoarea 130. Dar, interpretările nu sunt evidente. Dacă în eşantion obţineam media 1300 sau 13
atunci diferenţele erau clare. De asemenea, dacă media eşantionului era 130,5 atunci egalitatea era şi ea
evidentă.
Testarea ipotezelor statistice privind media populatiei
Fiind vorba de un eșantion de volum mare, distribuţia de eşantionare a mediei x este normală,

cu media  şi abaterea standard s / n și vom utiliza testul z:

x − 130 x − 130 120 − 130


z= = = = −6,67 .
15 / 100 1,5 1,5
Regiunea critică, de respingere a ipotezei nule, pentru testul bilateral este:
z  − z 2 sau z  z 2 .

Valoarea critică a testului z / 2 = z 0.025 = 1.96

Întrucât z = −6,67  −1.96 = z 0.025 , rezultă că sunt suficiente dovezi pentru a respinge ipoteza

nulă H0 şi a accepta ipoteza alternativă, aceea că timpul mediu de servire a unei persoane este diferit de
130 minute.
Testarea ipotezelor statistice privind media populatiei
Exemplul 2.
Testarea ipotezei privind media populatiei pentru esantioane de volum redus (Testul t)

În scopul creșterii producției, o fermă pomicolă aplică un nou fertilizator, în cinci dintre livezile de cireși
ale fermei, livezi ce au aceeași suprafață. Producția înregistrată după aplicarea fertilizatorului este: 2,60;
3,32; 1,80; 3,43; 2,00 (mii kg.). Ştiind că producția medie la nivelul celor 5 livezi în anul anterior a fost
de 2,01 mii kg, sunt suficiente dovezi pentru a concluziona că recolta medie obținută după aplicarea
fertilizatorului este semnificativ mai mare față de producția anului anterior, pentru un nivel de încredere
de 5%?

Producția medie obținută după aplicarea fertilizatorului este x = 2,63 mii kg., cu dispersia:

 (x )
2
− x 2,203
= = = 0,5507 şi abaterea standard: s x = s x2 = 0,74 mii kg.
2 i
s
n −1
x
4
Ipotezele testate sunt:
H0: μ = 2,01
H1: μ > 2,01 (test unilateral dreapta).

Testul utilizat, în ipoteza distribuției normale a populației din care a fost extras eșantionul în raport

x− x− 2,63 − 2,01


cu producția, este t = = = = 1,874 . Valoarea critică a testului pentru un
sx sx n 0,74 / 5
nivel de semnificație de 5% și un 4 grade de libertate este 2,132. Regiunea critică este dată de t>tα,n-1. Cum
t=1,874< t0,05;4=2,132, nu putem concluziona că producția obținută după aplicarea fertilizatorului este
semnificativ mai mare decât producția anului anterior de 2,01 mii kg.
Testarea ipotezei privind proporția (media variabilei alternative)
1. Testarea ipotezei privind proporția (media variabilei alternative)

În cazul variabilelor alternative, dacă eșantionul este de volum mare ( n  100 ), media în
eşantion (f - proporţia succeselor) urmează o distribuție normală, de medie p şi abatere standard
p (1 − p ) / n . Întrucât eșantionul este volum mare dispersia populației poate fi aproximată prin

dispersia din eșantion.


Ipotezele testate sunt construite similar testării ipotezei privind media unei variabile
numerice:
Test bilateral Test unilateral dreapta Test unilateral stânga
H 0 : p = p0 H 0 : p = p0 H 0 : p = p0

H 1 : p  p0 H 1 : p  p0 H 1 : p  p0

Testul statistic, calculat pe baza datelor de selecție, pentru proporţia p este:


f − p0 f − p0
z=  .
p (1 − p / n) f (1 − f ) / n
Testarea ipotezei privind proporția (media variabilei alternative)

Delimitarea regiunii critice în funcție de tipul testului:


Test bilateral Test unilateral Test unilateral
Tipul testului
dreapta stânga
Valorile critice - z 2 și z 2 z - z
ale testului
Funcții Excel z 2 =NORM.S.INV( 1 −  ) z =NORM.S.INV( 1 −  )
pentru determinarea 2
valorilor critice
Regiunea critică z  − z 2 sau z  z 2 z  z z  − z
(de respingere
a ipotezei H0 )

Aşadar, regula de decizie este: se acceptă ipoteza alternativă dacă valoarea testului se situează în
regiunea critică stabilită în funcţie de probabilitatea dorită de garantare a rezultatelor 100 (1 −  )% .
Testarea ipotezei privind proporția (media variabilei alternative)
Exemplu. Un târg de prezentare a echipamentelor agricole este considerat de succes dacă cel puțin 12%
dintre vizitatori încheie un contract de achiziție a unui echipament. A fost selectat un eșantion de 400
de vizitatori ai târgului internațional de produse și echipamente în domeniul agriculturii INDAGRA,
ediția 2018 și s-a constatat că 56 dintre aceștia au încheiat un contract pentru achiziția unui echipament
agricol. Pentru o probabilitate de 99% poate fi considerată ediția 2018 a târgului INDAGRA un succes?

Ipotezele sunt:
H 0 : p = 0,12

H 1 : p  0,12 (test unilateral dreapta).

f − 0,12 0,14 − 0,12 0,02


Testul statistic este: z = = = = 1,15 .
f (1 − f ) / n 0,14  0,86 / 400 0,017

Cum z = z 0.01 = 2,33 şi z  z , rezultă că nu ne aflăm în regiunea critică (Rc), nu avem suficiente

dovezi să respingem ipoteza nulă, deci procentul nu este mai mare de 12%.
Testarea ipotezei privind egalitatea dintre două medii
1. Testarea ipotezei privind egalitatea dintre două medii
Există multe situații în care se dorește compararea a două populații statistice din
perspectiva unei anumite variabile. De exemplu, o asociație de fermieri dorește să vadă dacă
există o diferență semnificativă între producția medie la hectar obținută pentru o anumită cultură
prin aplicarea a două tipuri de fertilizanți. Într-o astfel de situație, ipotezele testate sunt:
Test bilateral Test unilateral dreapta Test unilateral stânga
H 0 : 1 =  2 sau H 0 : 1 =  2 sau H 0 : 1 =  2 sau
1 −  2 = d 1 −  2 = d 1 −  2 = d
H1 : 1   2 sau H 1 : 1   2 sau H1 : 1   2 sau
1 −  2  d 1 −  2  d 1 −  2  d

Diferenţa ipotetică dintre mediile populaţiilor, notată cu d este, de cele mai multe ori,
egală cu zero. Această diferenţă dintre mediile eşantioanelor ( x1 − x 2 ) reprezintă un estimator
al diferenţei ( 1 −  2 ).
Testarea ipotezei privind egalitatea dintre două medii

Distribuţia de eşantionare a diferenţei ( x1 − x 2 ) are următoarele proprietăţi:


1. Diferenţa dintre mediile eşantioanelor ( x1 − x 2 ) urmează o distribuție normală pentru
eşantioane de volum mare (n1 > 30 şi n2 > 30);
2. Diferenţa dintre mediile eşantioanelor ( x1 − x 2 ) urmează o distribuție Student pentru
eşantioane de volum redus ( n1  30 şi n2  30 ), dacă variabila analizată are o distribuție
normală în populațiile cercetate;
3. Media distribuţiei de eşantionare a lui ( x1 − x 2 ) este (μ1 – μ2);
Testarea ipotezei privind egalitatea dintre două medii
4. Abaterea standard a distribuţiei de eşantionare, în cazul în care cele două eşantioane sunt
independente, este:

 12  22
 (x 1 −x 2 )= + ,
n1 n2
unde  12 şi  22 sunt dispersiile celor două populaţii eşantionate, iar n1 şi n2 sunt volumele
eşantioanelor. Estimatorul dispersiei distribuției de eșantionare este:

s12 s22
)= n +n
2
s( x1 −x 2
1 2

Dacă dispersiile celor două populații sunt egale (  12 =  22 =  ), abaterea standard a


distribuției (care cuantifică variabilitatea diferenței mediilor datorată întâmplării) este:

1 1
 (x 1 −x 2 )
= + .
n1 n2
Testarea ipotezei privind egalitatea dintre două medii
Testarea diferenței (egalității) dintre două medii trebuie precedată, așadar, de testarea
diferenței (egalității) dintre două dispersii.

Dacă că cele două populații statistice cercetate au dispersii egale (  12 =  22 =  ), un


estimator al dispersiei totale din cele două populaţii combinate este media aritmetică
ponderată a dispersiilor celor două eşantioane, s12 şi s 22 :

 (x − x ) +  (x )
n1 n2
2 2
i 1 i − x2
sc2 = i =1 i =1
sau
n1 + n2 − 2

sc2 =
(n1 − 1)s12 + (n2 − 1)s22
=
(n1 − 1)s12 + (n2 − 1)s22
(n1 − 1) + (n2 − 1) n1 + n2 − 2

Indicatorul sc2 se numește dispersia combinată a celor duă eșantioane.


Testarea ipotezei privind dispersia unei populaţii
Dacă populația eșantionată este normal distribuită, atunci raportul dintre suma
n
pătratelor abaterilor valorilor de la media lor (  ( xi − x ) 2 ), egală cu (n − 1)  s 2 , și dispersia
i =1

populaţiei statistice urmează o distribuţie  2 (hi-pătrat):

(n − 1) s 2
2 = ~  2 ;n −1
2
Distribuţia hi-pătrat are domeniul de variaţie (0,+) și este pozitiv înclinată, forma
distribuţiei fiind dată de numărul gradelor de libertate ( n − 1) . Valoarea lui χ 2 pentru care
aria de sub curbă, situată la dreapta ei, este egală cu α și se notează χ 2α . Valoarea lui χ 2
pentru care aria de sub curbă, situată la stânga ei, este egală cu 1 −  și se notează  2
1− .
Testarea ipotezei privind dispersia unei populaţii

Figura 5.1 Distribuția  2


Ipotezele testate sunt:
Test bilateral Test unilateral dreapta Test unilateral stânga
H 0 :  2 =  02 H 0 :  2 =  02 H 0 :  2 =  02

H 1 :  2   02 H 1 :  2   02 H 1 :  2   02
Testarea ipotezei privind dispersia unei populaţii
Testul statistic utilizat în testarea ipotezei privind dispersia  2 este:
(n − 1) s 2
 2
= .
2

Delimitarea regiunii critice, pentru un nivel de semnificație α, în funcție de tipul testului


este prezentată în tabelul de mai jos:
Test bilateral Test unilateral Test unilateral
Tipul testului
dreapta stânga
Valorile critice
χ12− α și χ α2 χ 2α  2 1−
2
ale testului 2

Funcții Excel χ 2α = CHISQ.INV (1 −  ;


χ α2 = CHISQ.INV (1 −  / 2; n − 1) n − 1)
2
pentru determinarea
valorilor critice
Regiunea critică  2   12− / 2, n −1 sau  2   2 , n −1  2   12− , n −1
( de respingere
 2   2 / 2, n −1
a ipotezei H0 )
Testarea ipotezei privind dispersia unei populaţii
Exemplu: Pentru a dimensiona cantitatea de legume proaspete livrate zilnic la o piață dintr-un cartier
bucureștean, un producător agricol dorește să cunoască cantitatea medie vândută, dar mai ale să știe dacă
variația medie a cantității vândute, pentru un anumit produs, este mai mare de 10 kg. Pentru 10 zile
consecutive au fost înregistrate date referitoare la vânzările înregistrate: 85, 59, 66, 81, 35, 57, 55, 63,
63, 66 kg. Se cunoaște că cererea pentru respectivul produs are o distribuție normală. Să se testeze
pentru o probabilitate de 95% dacă variația cantității cerute este mai mare de 10 kg.

Ipotezele testate sunt:


H 0 :  2 = 100 ,

H1 :  2
 100 .

Abaterea standard în eșantion este de 13,85 kg, iar dispersia s 2 = 191,8 .


Valoarea calculată a testului statistic este:
( n − 1) s 2 1726
 2
= = = 17,26
 2
100

Valoarea critică a testului este   , n −1 =  0.05, 9 = 16 ,92 ,


2 2

Deoarece     ,n −1 vom respinge ipoteza nulă şi vom accepta ipoteza alternativă, conform
2 2

căreia, adică abaterea cantității cerute este semnificativ mai mare de 10 kg.
Testarea ipotezei privind egalitatea dintre două dispersii
Aplicabilitatea imediată a acestui tip de testare a fost evidențiată în verificarea ipotezei
privind egalitatea dintre două medii. Compararea a două dispersii are utilitate în multe situații
de tipul: decizia de investire într-un portofoliu cu risc mai mare sau mai mic, adaptarea ofertelor
turistice în funcție de variabilitatea veniturilor pentru diferite tipuri de turism etc.
Pentru a compara dispersiile a două populaţii se determină raportul dintre ele. Raportul
s12 / s 22 este estimator punctual al raportului de dispersii  12 /  22 , distribuţia de eşantionare a

raportului s12 / s 22 fiind o distribuţie Fisher (distribuție F), dacă eşantioanele au fost extrase
independent din populaţii normal distribuite.
Testarea ipotezei privind egalitatea dintre două dispersii
Raportul dintre două variabile hi-pătrat independente corectate cu gradele de libertate
aferente are o distribuţie Fisher. Gradele de libertate ale distribuţiei F sunt identice cu gradele
de libertate ale celor două distribuţii hi-pătrat.
Așadar:
(n1 − 1) s12 /  12 (n2 − 1) s22 /  22 s12 /  12
F= : = 2 2 , cu ( n1 −1) şi (n 2 − 1) grade de libertate.
(n1 − 1) (n2 − 1) s2 /  2
Valoarea lui F pentru care aria de sub curbă, situată la dreapta ei, este α, se notează Fα,, cu gradele
de libertate gl1 =n1 −1 și gl2 =n 2 −1 . De asemenea, trebuie știut că:
1
F1−α,gl1,gl 2 = .
Fα,gl1,gl 2
Testarea ipotezei privind egalitatea dintre două dispersii
Ipotezele testate sunt:

Test bilateral Test unilateral dreapta Test unilateral stânga


H 0 :  12 =  22 sau  12 /  22 = 1 H 0 :  12 =  22 sau  12 /  22 = 1 H 0 :  12 =  22 sau  12 /  22 = 1

H 0 :  12   22 sau  12 /  22  1 H 0 :  12   22 sau  12 /  22  1 H 0 :  12   22 sau  12 /  22  1

Testul statistic este :


s12 /  12 s12
F = 2 2 , care devine F = 2 în condiţiile ipotezei nule (  12 /  22 = 1 ).
s2 /  2 s2
Testarea ipotezei privind egalitatea dintre două dispersii

Delimitarea regiunii critice, pentru un nivel de semnificație α, în funcție de tipul testului este
prezentată în tabelul de mai jos:
Test bilateral Test unilateral Test unilateral
Tipul testului
dreapta stânga
Valorile critice F1− / 2,n −1,n și F / 2, n1 −1, n2 −1 F , n1 −1, n2 −1 F1− ,n −1,n
1 2 −1 1 2 −1
ale testului
Funcții Excel F.INV ( / 2; gl1 ; gl 2 ) și F , gl1 , gl2 = F1− , gl1 , gl2 =
pentru determinarea F.INV.RT ( / 2; gl1 ; gl 2 ) F.INV.RT ( ; gl1 ; gl 2 ) F.INV
valorilor critice ( ; gl1 ; gl 2 )
Regiunea critică F  F / 2,n1 −1,n2 −1 sau F  F ,n1 −1,n2 −1 F  F1− ,n −1,n
1 2 −1
( de respingere
F  F1− / 2,n −1,n
a ipotezei H0 ) 1 2 −1
Testarea ipotezei privind egalitatea dintre două dispersii

Exemplu: A fost realizat un studiu pentru identificarea principalilor factori ce influențează tipul de turism
(extern sau intern) preferat de clienții unei agenții. Unul dintre factorii identificați îl reprezintă variabilitatea
veniturilor. Știind că distribuţia veniturilor (mii lei) în cele două populații analizate (populația clienților ce
preferă turismul extern, respectiv cea a clienților ce prefer turismul intern) este aproximativ normală, au fost
selectate două eşantioane, de volum 60, respective 50 de personae. Abaterile standard ale veniturilor (mii lei)
sunt: s1 = 2,84 şi s 2 = 1,86 . Se utilizează o probabilitate de garantare a rezultatelor de 95%.
Ipotezele statistice sunt:
H 0 :  12 /  22 = 1 ,

H 1 :  12 /  22  1 .
Testarea ipotezei privind egalitatea dintre două dispersii
Testul statistic are valoarea:
s12 2,84 2 8,0686
F= 2 = = = 2,3314 .
s 2 1,86 2 3,4596

Regiunea critică (pentru  = 0,05 ) este dată de:


F  F0.05;59; 49  1,64 .

În general, dacă la numărător se trece dispersia cea mai mare testul F este un test unilateral dreapta.
Cum F  F0.05;59; 49 ipoteza nulă se respinge (aceea că raportul dintre dispersii este 1) şi se acceptă

ipoteza alternativă. Acest lucru înseamnă că se acceptă ipoteza conform căreia împrăştierea veniturilor
pentru turiştii ce preferă turismul extern este semnificativ mai mare decât cea a turiştilor ce preferă
turismul intern.
Testarea ipotezei privind normalitatea unei distribuţii

• Majoritatea tehnicilor statistice şi a procedeelor de modelare econometrică cer


îndeplinirea condiţiilor de normalitate pentru a putea fi aplicate şi interpretate.
Este, aşadar, foarte important să se determine dacă, eşantionul observat provine
dintr-o populaţie normal distribuită, pentru variabila studiată.

• Tendinţa de normalitate a distribuţiei unei variabile, la nivelul eşantionului


studiat, poate fi evidenţiată, după cum am văzut, fie prin metode grafice
(histogramă, diagrama steam&leaf, diagrama Box-Plot), fie prin intermediul
indicatorilor descriptivi ai formei distribuţiei (coeficienţii de asimetrie, respectiv
de boltire-aplatizare).
Testarea ipotezei privind normalitatea unei distribuţii

• Întrucât procedeele grafice sunt intuitive, pe baza lor putem doar să ne facem o ideee privind
forma distribuţiei variabilei.

• De regulă, se utilizează teste specifice, numite teste de concordanţă, pentru verificarea ipotezei de
normalitate a distribuţiei variabilei în populaţia statistică considerată.

• Testele de concordanţă (goodness of fit test, în engl.) ne arată modul în care o anumită
distribuţie statistică teoretică (uzual, distribuţia normală) “se potriveşte” cu distribuţia datelor
empirice obţinute pe baza unui eşantion.

• Această analiză pune în evidenţă “concordanţa” dintre modelul empiric, furnizat de histogramă, şi
modelul teoretic considerat adecvat pentru populaţia din care provin datele statistice observate.
Testarea ipotezei privind normalitatea unei distribuţii

1. Testul  2 (Hi pătrat), aplicat în cazul datelor grupate pe interval de variaţie, constă

în compararea frecvenţele absolute observate (empirice) ni cu frecvenţele teoretice f i , estimate

pe baza funcţiei de repartiţie a distribuţiei normale:


 
f i = n  F (z sup(i ) ) − F (z inf (i ) )

F reprezintă funcţia de repartiţie a distribuţiei normale a cărei valoare poate fi


calculate în Excel cu ajutorul funcţiei NORM.S.DIST(z,TRUE);
zsup(i ) reprezintă valoarea standardizată (scorul z) a limitei superioare a intervalului i ;

zinf (i ) reprezintă valoarea standardizată (scorul z) a limitei inferioare intervalului i ;


Testarea ipotezei privind normalitatea unei distribuţii

Ipotezele testate sunt:


H 0 : populaţia din care a fost extras eşantionul este normal distribuită

H 1 : populaţia din care a fost extras eşantionul nu este normal distribuită


r
(ni − f i ) 2
Statistica testului este  = 
2
, unde r reprezintă numărul intervalelor de variaţie.
i =1 fi

Pentru un nivel de semnificaţie de 5% şi (r − 1) grade de libertate se acceptă ipoteza nulă


conform căreia populaţia din care a fost extras eşantionul este normal distribuită dacă:
 calc
2
  2 ;r −1 .
Testarea ipotezei privind normalitatea unei distribuţii
2. Testul Kolmogorov-Smirnov este cel mai cunoscut și utilizat test pentru verificarea distribuției normale a
populației în raport cu variabila studiată.

Utilitatea testului, bazat pe prorietățile matematice demonstrate de cei doi matematicieni ruși, derivă
posibilitatea de a decide asupra ipotezei normalității printr-o abordare atât analitică, cât și grafică.

Testul, utilizat în cazul datelor negrupate, este relativ dificil de aplicat fără automatizarea calculelor.
Ipotezele testate și regula de decizie a testului Kolmogorov-Smirnov sunt similare testului  2
(Hi pătrat).
Atât testul  2 (Hi pătrat), cât și testul Kolmogorov-Smirnov sunt implementate de
majoritatea pachetelor software specializate în analiza datelor, cum este cazul programului
SPSS.

În cazul în care, după testarea ipotezei privind normalitatea distribuţiei în populația statistică cu
ajutorul testelor prezentate anterior, ipoteza nulă nu este acceptată, pot fi utilizate metode statistice
neparametrice, în cadrul cărora nu se fac presupuneri speciale asupra formei distribuţiei.
Testarea ipotezei privind normalitatea unei distribuţii
Exemplul 2. Una dintre caracteristicile de interes în previzionarea activității realizate de o
agenție de turism este vârsta medie a clienților ce preferă destinații exotice. Directorul unei agenții de
turism dorește să știe, pentru un nivel de încredere de 95%, dacă distribuția clienților ce achiziționează
pachete turistice în regiuni exotice, în funcție de vârstă este aproximativ normală. Pentru un eșantion de
54 de clienți, selectați aleator, se înregistrează datele referitoare la vârsta acestora.
Rezolvare:
Pe baza datelor referitoare la vârsta respondenților introduse în SPSS se aplică testul Kolmogorov-
Smirnov, rezultatele obținute fiind prezentate în output-ul de mai jos:
Testarea ipotezei privind normalitatea unei distribuţii

Interpretarea rezultatului obținut se face plecând de la valoarea nivelului de semnificație


observat - Pvalue (Asymp.Sig (2-tailed)) de aproximativ 0.000, mult mai mic decât nivelul de
semnificație stabilit de 0,05. Valoarea indicatorului Asymp.Sig (2-tailed) (Pvalue=0.000<0.05) conduce
la decizia de respingere a ipotezei nule conform căreia populaţia din care a fost extras eşantionul este
normal distribuită în raport cu variabila vârstă.
Așadar, variabila vârsta clienților ce achiziționează pachete turistice în regiuni exotice nu
urmează o distribuție normală de medie 45,63 ani și abatere standard 17,8 ani.

S-ar putea să vă placă și