Sunteți pe pagina 1din 10

Testarea ipotezelor statistice

Toate deciziile economice se bazeaz explicit sau implicit pe un anumit numr de


ipoteze ce sunt verificate. Alegerea unei ipoteze este o etap fundamental n problematica
decizional. Ipoteza se formuleaz fie prin cunoaterea parial a realitii sau prin lipsa oricror
informaii. Ipotezele statistice privesc parametrii repartiiilor unidimensionale, ai repartiiilor
multidimensionale i ai seriilor cronologice. n verificarea ipotezelor statistice exist o mare
varietate de teste, ele fiind alese n funcie de obiectivele urmrite i de condiiile de aplicare ale
acestora.
Aspecte metodologice privind construirea unui test de ipoteze
O ipotez poate fi definit ca o presupunere pe care un cercettor sau manager o
face cu privire la caracteristicile unei populaii care a fost investigat. Cercettorul de marketing
se confrunt adesea cu ntrebri n legtur cu faptul dac rezultatele cercetrii sunt destul de
diferite fa de norm, astfel nct s fie necesar schimbarea unui anumit element al strategiei de
marketing. n testarea ipotezei, cercettorul determin dac o ipotez privitoare la anumite
caracteristici ale populaiei este adevrat sau nu. Un test statistic ipotetic ne permite s calculm
probabilitatea observrii unui rezultat particular, dac ipoteza stabilit este adevrat.
Ipotez statistic - presupunere asupra unuia sau mai multor parametrii ce
caracterizeaz populaia studiat.
Ipoteza nul ( H 0 )-este o afirmaie relativ la o distribuie, la valoarea unui
parametru, egalitatea unor parametrii, etc. Orice ipotez nul presupune i existena unei
alternative, care, de regul, contrazice ipoteza nul.
n testarea ipotezelor statistice apar i erori de decizie, care sunt de 2 tipuri:
- eroarea de genul I- eroarea comis la respingerea eronat a ipotezei nule cnd
aceasta este adevrat;
- eroarea de genul II- eroarea comis la acceptarea eronat a ipotezei nule cnd
aceasta este fals.
Ca urmare, n testrile de ipoteze apar 2 riscuri:
- riscul de gradul I- probabilitatea de a respinge ipoteza nul cnd aceasta este
adevrat
- riscul de gradul II- probabilitatea de a accepta ipoteza nul cnd aceasta este fals.
Riscul de gradul II este mult mai grav, n consecin pentru a avea un nivel sczut al acestuia ne
fixm un risc de gradul I mai mare, deoarece ntre cele dou riscuri exist o legtur invers.
Exist dou explicaii de baz pentru observarea diferenei dintre valoarea ipotetic i
un rezultat particular din cercetare: fie ipoteza e adevrat i diferena observat se poate datora
erorilor de eantionare, fie ipoteza este fals i valoarea real adevrat este o alt valoare.

n funcie de ipoteza ce trebuie testat, de natura i volumul datelor, se alege un


anumit test statistic. Sintetic, procedeul general de testare a unei ipoteze statistice presupune
rezolvarea urmtoarelor probleme1:
1. Stabilirea ipotezei. Ipotezele se stabilesc folosind dou forme de baz: ipoteza nul H o i
ipoteza alternativ H 1 . Ipoteza nul H o (uneori denumit hypothesis of the status quo)
este ipoteza testat mpotriva complementului su i ipoteza alternativ H 1 (uneori
denumit research hypothesis of interest). Trebuie menionat c ipoteza nul i ipoteza
alternativ trebuie stabilite n aa fel nct s nu poat fi adevrate ambele, n acelai
timp. Ideea este de a folosi o eviden disponibil pentru a stabili care ipotez este mai
probabil.
2. Alegerea testului statistic potrivit. Analistul trebuie s aleag cel mai potrivit test statistic
n funcie de caracteristicile situaiei care se investigheaz.
3. Dezvoltarea unei reguli de decizie. O astfel de regul este necesar pentru a determina
respingerea ipotezei nule sau, dimpotriv, acceptarea ei. Statisticienii stabilesc reguli de
decizie n funcie de nivelele de semnificaie. Nivelul de semnificaie (q) este critic n
procesul de alegere ntre ipoteza nul i ipoteza alternativ. Nivelul de semnificaie
reprezint probabilitatea care este considerat prea redus de exemplu 0,10; 0,05 sau
0,01 pentru a justifica acceptarea ipotezei nule.
Considernd o situaie n care ne decidem s testm o ipotez la un nivel de semnificaie
de 0,05, acest lucru nseamn c vom respinge ipoteza nul dac testul indic faptul c
probabilitatea realizrii rezultatului observat (de exemplu, diferena dintre media eantionului i
valoarea sa ateptat, datorit ansei sau erori de eantionare) este mai mic de 5%. Respingerea
ipotezei nule este echivalent cu acceptarea ipotezei alternative.
4. Calcularea valorii statistice a testului. n aceast etap se rezolv urmtoarele probleme:
- se va folosi formula adecvat pentru a calcula valoarea statistic pentru testul ales;
- se va compara valoarea calculat anterior cu valoarea critic (din tabelul adecvat) n
funcie de regula de decizie aleas;
- pe baza comparaiei, lum decizia, fie respingnd, fie acceptnd ipoteza nul ( H o ).
5. Stabilirea concluziei. Se formuleaz o declaraie privind concluzia desprins, care s fac
un sumar al rezultatelor testului. Concluzia se stabilete din perspectiva ntrebrii
originale privind cercetarea.
n funcie de ipoteza ce trebuie testat, de natura i volumul datelor, se alege un
anumit test statistic.

Testele de concordan
Sunt teste statistice folosite pentru verificarea concordanei dintre o distribuie
observat i una teoretic de referin. Se folosesc att teste parametrice ct i neparametrice.

Craiu, V., Verificarea ipotezelor statistice, Ed. Didactic i pedagogic, Bucureti, 1972.

Teste de concordan parametrice


Testul Kolmogorov-Smirnov
Se consider o populaie A i o variabila X n legtur cu care se va formula
ipoteza c aparine unei legi de probabilitate de exemplu legea normal, de medie X

i abatere

H 0 : X ( X , X )
H1 : X ( X , X )
( X X )2

1
2
cu f ( X )
e 2
2
Din populaia univers A se constituie un eantion aleator de volum n (n >100),
cruia i se asociaz vectorul aleator ( X 1 , X 2 ,..., X n ) . Repartiia valorilor variabilei X este de
forma urmtoare:
[ x0 ; x1 ) [ x1 ; x2 )... [ x R 1 ; x R ]

X :
n2
nR
n1

Notm cu Fn ( xi ) frecvena relativ cumulat sau valorile funciei empirice de repartiie.

n1 n2
... Fn ( x R ) 1
n
Se tie c variabila z X X (0,1) urmeaz o lege normal normat, a crei valori sunt
Fn ( x1 )

n1
n

Fn ( x 2 )

tabelate, aa nct din tabelul funciei Laplace vom obtine valorile urmtoare:

x X
F ( x1 ) F z1 1

...

x X
F (xR ) F z R R

Se calculeaz diferenele dintre valorile funciei empirice i a


d1 Fn ( x1 ) F ( x1 )

celei teoretice, astfel:

...
d R Fn ( x R ) F ( x R )
d n (d im ax ) max Fn ( xi ) F ( xi )

Kolmogorov a stabilit legea de probabilitate a acestei variabile d n care depinde de


un parametru . Astfel formulm ipoteza nul:
H0 : dn 0

H1 : d n 0

Pentru un q fixat q=1-K()=> din table, astfel nct dac

d n d tab
H 0 acceptata .
n
In mod asemantor acest test poate fi folosit i pentru testarea altor distribuii cum ar
fi: Poisson, uniform, exponenial.
Testul 2
Pentru testarea uniformitii unei distribuii se poate folosi i testul 2 . Astfel
formulm ipoteza nul:
H 0 : X N ( X , X )

H1 : X N ( X , X )
Pentru a verifica aceast ipotez presupunem c dispunem de un eantion de valori
particulare (n>100), de forma:
[ x0 ; x1 ) [ x1 ; x2 )... [ x R 1 ; x R ]

X :
n2
nR
n1

Fie pi P{X I R H 0 } , dac H 0 este adevrat, atunci :


pi F0 ( xi ) F0 ( xi 1 )
F0 ( x) P ( X x)

( x X )2
2 2

dx

2
unde F0 este funcia de repartiie corespunztoare legii normale.
XX
F0 ( X ) (
) pi ( xi ) ( xi 1 )

Numrul mediu de valori aparinnd intervalului I i este determinat din relaia npi .
Condiia ce trebuie respectat este ca npi 5 , n caz contrar se grupeaz intervalele pentru
ndeplinirea acestei restricii.
Pentru testarea ipotezei H 0 se calculeaz statistica 2 unde:
R

2
i 1

(ni npi ) 2
2 ( R k 1)
npi

R-numrul de clase n care este mprit populaia


k-numrul de parametri de care depinde legea pe care o testm.
Practic se calculeaz probabilitile estimate i statistica 2 :
x X
x X
p i ( i
) ( i 1
)
X
X
R

2
i 1

(ni np i ) 2
np i

2
2
(q, ) H 0 acceptata .
pentru un q fixat va rezulta un tab
, iar dac 2 tab
n cazul n care eantionul este de voum mic se recomand aplicarea Testului lui
Massey sau Shapiro Wilk (Florea, I.,, Statistic inferenial, 2000, p. 268-270).

Teste de concordan neparametrice


Ipoteza ce trebuie testat se formuleaz astfel:
H 0 :distribuia observat nu difer semnificativ de o distribuie teoretic specificat
H 1 :distribuia observat difer semnificativ de o distribuie teoretic specificat
n mod practic, punctul de plecare l constituie statisticile rezultate din observarea
eantionului de volum n, care se prezint astfel:
x1 x2 ...xi ... x R

X :
n
n
...
n
...
n
1
2
i
R

Pentru testarea unei astfel de ipoteze se poate folosi att testul 2 , ct i testul lui
2
Kolmogorov-Smirnov. n cazul testului 2 se compar calc

(ni ni' ) 2
ni'
i 1
2
(q, R 1) , unde n i - frecvenele ateptate conform distribuiei testate.
cu tab
R

2
calc

2
2
tab
H 0 acceptat.
Dac Calc

Teste de semnificaie
Testarea semnificaiei unei medii
Fie o populaie A n care variabila X este distribuit conform unei legi normale, de
medie X

i abatere X vom testa ipoteza H 0 cu privire la semnificaia unei medii, de forma :


H 0 : X x0
H 1 : X x0

2
1 n
X N ( X , X )
unde X X i ,
E ( X ) X i V ( X )
n i 1
n
2
2
Deoarece X nu se cunoate, aceasta se va aproxima cu s X
1 n
X2 s X2
( X i X ) 2
n 1 i 1
s2
V ( X ) V ( X ) X
n
X E ( X )

X X

t S ( n 1)
sX
n

Variabila astfel construit este o variabil Student (derivat de la o variabil normal) ce


depinde de un parametru n 1.
Se consider un prag de semnificaie q 0,05 , iar din tabelele relativ la distribuia Student, la
un q dat i n 1 grade de libertate, va rezulta un t tab .
Dac ipoteza nul este adevrat, atunci
X x 0
tc
Sx

n
Este tot o variabil Student, ale crei valori, pentru eantionul format, vor fi situate n intervalul
(t tab ;t tab ) .
Gradele de libertate
n general, prin numr de grade de libertate al unei mrimi se nelege numrul
variabilelor independente a cror variaie nu sufer nici o restricie i care definesc mrimea
considerat. Altfel spus, numrul gradelor de libertate este egal cu numrul variabilelor
independente, care definesc mrimea considerat, minus numrul de restricii la care sunt supuse.
De exemplu, media aritmetic a n numere are n-1 grade de libertate, deoarece pentru a obine o
valoare impus se pot alege arbitrar n-1 valori, a n-a valoare fiind n acel moment fixat de
restricia ca valoarea mediei s fie egal cu valoarea impus (altfel spus, n valori i o restricie,
deci n 1 ).
Un alt punct de vedere este acela c numrul gradelor de libertate este egal cu
numrul valorilor independente care sunt necesare estimrii, minus numrul parametrilor
estimai n paii anteriori: de exemplu, pentru estimarea varianei se consider cele n valori, dar
este necesar estimarea prealabil a mediei, deci n-1 grade de libertate.
5.4.2 Testarea semnificaiei unei proporii (testul binomial).
Fie o populaie univers definit printr-o proporia p, necunoscut de uniti ce sunt
caracterizate de o anumit stare a unei variabile. Un eantion n va fi constituit aleator prin n
extrageri independente din aceeai poulaie. Fie ( X 1 , X 2 ,..., X n ) X i ( p) vectorul aleator
asociat acestui eantion, variabilele urmnd toate aceeai lege a lui Bernoulli de parametru p.
Astfel formulm ipotezele:
H 0 : p p0

H 1 : p p0
Considerd c n este suficient de mare, iar la nivelul eantionului se poate calcula
proporia de eantionare, ale crei caracteristici sunt urmtoarele:
X X 2 ... X n
p 1
n
p(1 p)
cu E ( p ) p i V ( p )
n
.
Pentru un n suficient de mare, proporia de eantionare este distribuit asimptotic
spre o lege normal, respectiv avem:

p (1 p )
n
Aa cum se poate constata proporia de eantionare poate fi considerat un caz
particular al mediei, ca urmare putem elabora variabila Z normal normat de forma:
p p
z
(0,1)
p (1 p )
n
La un nivel al riscului fixat q 0,05 , va rezulta un z tab . Dac ipoteza nul este
adevrat, atunci
p p0
z calc

( z tab ; z tab )
p0 (1 p0 )
n
p ( p;

5.5 Teste de comparare


n cazul aplicrii unor teste statistice, trebuie s se fac distincie ntre eantioane
independente i eantioane dependente (perechi), astfel:
dou eantioane sunt independente dac selecia unitilor unui eantion nu depinde de
selecia unitilor celuilalt eantion;
dou eantioane sunt dependente dac selecia unitilor unui grup determin selecia
unitilor altui grup. Un exemplu frecvent de grupuri dependente apare atunci cnd se
urmrete efectul unui experiment pe acelai eantion, nregistrndu-se reacia indivizilor
nainte i dup experiment. Aceste grupuri se mai numesc i grupuri perechi.
5.5.1 Testarea egalitii a dou medii, cazul eantioanelor independente
Cnd testm o iptez asupra a dou medii ncercm s determinm, cu ajutorul a
dou eantioane dac exist o diferen semnificativ statistic, ntre mediile celor dou populaii.
Ipoteza nul este formulat astfel: nu exist diferene semnificative ntre mediile celor dou
populaii, respective populaiile sunt identice n raport cu parametrul medie.

H 0 : X1 X 2
H1 : X 1 X 2

H 0 : X1 X 2 0
H1 : X 1 X 2 0

X 2 N ( X 2 , 2 )
Fie dou populaii A1 i A2 distribuite normal X 1 N ( X 1 , 1 )
din care se extrag independent dou eantioane de volum n1 i n 2 la nivelul crora se vor calcula
estimaiile variabilelor X i X .
1

1 n1
1 n2
X 1 X i1
X 2 X i 2
n1 i 1
n2 i 1
Variabila de eantionare este ( X 1 - X 2 ), unde sperana matematic i variana au
urmtoarele expresii:

E ( X 1 X 2 ) E ( X 1 ) E ( X 2 ) X 1 X 2

V ( X 1 X 2 ) V ( X 1 ) V ( X 2 ) 1 2
n1 n2
2

X 1 N ( X 1 , 1 )
n1

X 2 N ( X 2 , 2 )
n2

n aplicarea acestor teste apar urmtoarele situaii cu privire la cele dou variane:
b) 12 , 22 -nu se cunosc dar sunt egale 12 22 2
c) 12 , 22 -nu se cunosc i sunt diferite
b) Dac varianele 12 , 22 - nu se cunosc dar sunt presupuse a fi egale
12 22 2 , trebuie s estimm pe 2 .
n ipoteza H 0 de egalitate a mediilor ( X 1 X 2 ) , cele dou eantioane pot fi
considerate ca provenind din aceeai populaie de varian 2 . Ca urmare se recomand s lum
2
2
n considerare estimaiile celor dou variane, astfel va fi exprimat prin s , unde:

( n1 1) s12 ( n2 1) s 22
s
n1 n2 2
2

s12

n
1
( X i1 X 1 ) 2
n1 1 i 1

( X 1 X 2 ) s (
t

s 22

1
1
( X i2 X 2 ) 2
n2 1 i 1

1
1

)
n1 n2

( X 1 X 2 ) ( X 1 X 2 )
S ( n1 n2 2)
1
1
s(

)
n1 n2

pentru
daca

q 0.05 t tab ( q, )
X 1 X 2
t calc
[ t tab ; t tab ] H 0
1
1
s(

)
n1 n2

acceptata

c) Dac 12 , 22 -nu se cunosc i sunt diferite, cele dou varine vor fi estimate prin,

12 s12

1 n1
( xi1 X 1 ) 2
n1 1 i 1

22 s22

1 n2
( xi 2 X 2 ) 2

n2 1 i 1

12 s12 22 s22
( X 1 X 2 )
t

s12 s 22

n1 n2

( X 1 X 2 ) ( X 1 X 2 )
s12 s 22

n1 n2

S ( )

s12
n1

1
; c 2
c
(1 c) 2
s1 s 22

n1 1 n2 1
n1 n2
2

q 0.05 t tab (q, )


( X 1 X 2 )
daca t calc
[t tab ; t tab ] H 0
s12 s 22

n1 n2

acceptata

n situaia n care nu dispunem de informaii referitoare la variane (sunt egale sau sunt
diferite), va trebuie s testm ipoteza privind egalitate a dou variane.
5.5.2 Testarea egalitii a dou variane
X 2 N ( X 2 , 2 )
Fie dou populaii A1 i A2 distribuite normal X 1 N ( X 1 , 1 )
din care se extrag independent dou eantioane de volum n1 i n 2 . Cele dou variane nu sunt
cunoscute, ca urmare ipotezele ce trebuie testate se formuleaz astfel:

H 0 : 12 22
H 1 : 12 22

S presupunem c s12 i s 22 sunt estimatorii celor dou variane 12 , 22 . Pentru


testarea acestei ipoteze se va aplica testul F a lui Fisher-Snedecor.
s12

1 n1
( X i1 X 1 ) 2
n1 1 i 1

s12

s22

12

12 22

s22

1 n2
( X i 2 X 2 ) 2
n2 1 i 1

F ( 1 n1 1; 2 n2 1)

22

n1 1 n2 1

pentru q 0.05 Ftab (q, 1 , 2 )


daca Fcalc

sm2 ax max(s12 ; s22 )

Ftab H 0
s12( 2)
s12( 2)

acceptata

5.5.3 Testarea egalitii a dou medii, cazul eantioanelor perechi.


Eantioane perechi, presupune ca fiecrei uniti din eantionul A s-i corespund o
unitate din eantionul B, cercetndu-se aceeai variabil. Astfel de eantioane sunt folosite atunci
cnd se urmrete evoluia unei variabile n timp sau efectul unei aciuni.
Considerm c variabila studiat este o variabil cantitativ X, astfel pentru
fiecrui cuplu i se calculeaz diferena
d i X Ai X Bi
unde X Ai X Bi sunt valorile variabilei X pentru cuplu i . Astfel vom obine n valori pentru
variabila d, aferente fiecrui cuplu i, i 1, n .
1 n
Ca urmare se poate calcula media estimat a acestor valori, d d i i variana estimat
n i 1
n
1
s d2
(d i d ) 2 .

n 1 i 1
Dac d i sunt observaii aferente variabilei d aferent unei populaii normale, atunci
raportul
d ( X A X B )
S ( n 1)
sd

n
urmeaz o distribuie Student cu n-1 grade de libertate.
Astfel putem formula ipoteza nul c variabila X nu s-a modificat intre cele dou momente
studiate, respectiv:
H0 : d 0

H1 : d 0
Se va aplica testul t, unde
t

d d
sd
n

pentru

q 0,05 t tab ( n 1)

daca t calc

(t tab ;t tab ) H 0
sd
n

acceptata

S-ar putea să vă placă și

  • Expertiza Biblio
    Expertiza Biblio
    Document1 pagină
    Expertiza Biblio
    Brian Anderson
    Încă nu există evaluări
  • Jack&Robert
    Jack&Robert
    Document2 pagini
    Jack&Robert
    Brian Anderson
    Încă nu există evaluări
  • Chestionar (1) (1) Masterat
    Chestionar (1) (1) Masterat
    Document5 pagini
    Chestionar (1) (1) Masterat
    Brian Anderson
    Încă nu există evaluări
  • Teorie Analiza Discriminanta
    Teorie Analiza Discriminanta
    Document5 pagini
    Teorie Analiza Discriminanta
    Diana Marton
    Încă nu există evaluări
  • Curs 5
    Curs 5
    Document26 pagini
    Curs 5
    Brian Anderson
    Încă nu există evaluări
  • Cerinte Proiect Analiza Multidimensionala
    Cerinte Proiect Analiza Multidimensionala
    Document1 pagină
    Cerinte Proiect Analiza Multidimensionala
    Brian Anderson
    Încă nu există evaluări
  • Curs 5
    Curs 5
    Document26 pagini
    Curs 5
    Brian Anderson
    Încă nu există evaluări
  • Curs 4
    Curs 4
    Document10 pagini
    Curs 4
    Brian Anderson
    Încă nu există evaluări
  • Curs 5
    Curs 5
    Document26 pagini
    Curs 5
    Brian Anderson
    Încă nu există evaluări
  • Curs 5
    Curs 5
    Document26 pagini
    Curs 5
    Brian Anderson
    Încă nu există evaluări
  • Expertiza Biblio
    Expertiza Biblio
    Document1 pagină
    Expertiza Biblio
    Brian Anderson
    Încă nu există evaluări