Sunteți pe pagina 1din 12

ANALIZA MULTIDIMENSIONALA A DATELOR

APLICATII IN SPSS
Conf. univ. ANUTA BUIGA

Testarea ipotezelor statistice


Toate deciziile economice se bazeaz explicit sau implicit pe un anumit numr
de ipoteze ce sunt verificate. Alegerea unei ipoteze este o etap fundamental n problematica
decizional. Ipoteza se formuleaz fie prin cunoaterea parial a realitii sau prin lipsa
oricror informaii. Ipotezele statistice privesc parametrii repartiiilor unidimensionale, ai
repartiiilor multidimensionale i ai seriilor cronologice. n verificarea ipotezelor statistice
exist o mare varietate de teste, ele fiind alese n funcie de obiectivele urmrite i de
condiiile de aplicare ale acestora.

Aspecte metodologice privind construirea unui test de ipoteze

O ipotez poate fi definit ca o presupunere pe care un cercettor sau manager o


face cu privire la caracteristicile unei populaii care a fost investigat. Cercettorul de
marketing se confrunt adesea cu ntrebri n legtur cu faptul dac rezultatele cercetrii
sunt destul de diferite fa de norm, astfel nct s fie necesar schimbarea unui anumit
element al strategiei de marketing. n testarea ipotezei, cercettorul determin dac o ipotez
privitoare la anumite caracteristici ale populaiei este adevrat sau nu. Un test statistic
ipotetic ne permite s calculm probabilitatea observrii unui rezultat particular, dac ipoteza
stabilit este adevrat.
Ipotez statistic - presupunere asupra unuia sau mai multor parametrii ce
caracterizeaz populaia studiat.
H0
Ipoteza nul ( )-este o afirmaie relativ la o distribuie, la valoarea unui
parametru, egalitatea unor parametrii, etc. Orice ipotez nul presupune i existena unei
alternative, care, de regul, contrazice ipoteza nul.
n testarea ipotezelor statistice apar i erori de decizie, care sunt de 2 tipuri:
- eroarea de genul I- eroarea comis la respingerea eronat a ipotezei nule cnd
aceasta este adevrat;
- eroarea de genul II- eroarea comis la acceptarea eronat a ipotezei nule cnd
aceasta este fals.
Ca urmare, n testrile de ipoteze apar 2 riscuri:
- riscul de gradul I- probabilitatea de a respinge ipoteza nul cnd aceasta este
adevrat
- riscul de gradul II- probabilitatea de a accepta ipoteza nul cnd aceasta este
fals.
Riscul de gradul II este mult mai grav, n consecin pentru a avea un nivel sczut al acestuia
ne fixm un risc de gradul I mai mare, deoarece ntre cele dou riscuri exist o legtur
invers.
Exist dou explicaii de baz pentru observarea diferenei dintre valoarea
ipotetic i un rezultat particular din cercetare: fie ipoteza e adevrat i diferena observat
se poate datora erorilor de eantionare, fie ipoteza este fals i valoarea real adevrat este o
alt valoare.
ANALIZA MULTIDIMENSIONALA A DATELOR
APLICATII IN SPSS
Conf. univ. ANUTA BUIGA
n funcie de ipoteza ce trebuie testat, de natura i volumul datelor, se alege un
anumit test statistic. Sintetic, procedeul general de testare a unei ipoteze statistice presupune
rezolvarea urmtoarelor probleme1:
1. Stabilirea ipotezei. Ipotezele se stabilesc folosind dou forme de baz: ipoteza nul
Ho H1 Ho
i ipoteza alternativ . Ipoteza nul (uneori denumit hypothesis of the
status quo) este ipoteza testat mpotriva complementului su i ipoteza alternativ
H1
(uneori denumit research hypothesis of interest). Trebuie menionat c ipoteza
nul i ipoteza alternativ trebuie stabilite n aa fel nct s nu poat fi adevrate
ambele, n acelai timp. Ideea este de a folosi o eviden disponibil pentru a stabili
care ipotez este mai probabil.
2. Alegerea testului statistic potrivit. Analistul trebuie s aleag cel mai potrivit test
statistic n funcie de caracteristicile situaiei care se investigheaz.
3. Dezvoltarea unei reguli de decizie. O astfel de regul este necesar pentru a determina
respingerea ipotezei nule sau, dimpotriv, acceptarea ei. Statisticienii stabilesc reguli
de decizie n funcie de nivelele de semnificaie. Nivelul de semnificaie (q) este critic
n procesul de alegere ntre ipoteza nul i ipoteza alternativ. Nivelul de semnificaie
reprezint probabilitatea care este considerat prea redus de exemplu 0,10; 0,05 sau
0,01 pentru a justifica acceptarea ipotezei nule.
Considernd o situaie n care ne decidem s testm o ipotez la un nivel de
semnificaie de 0,05, acest lucru nseamn c vom respinge ipoteza nul dac testul indic
faptul c probabilitatea realizrii rezultatului observat (de exemplu, diferena dintre media
eantionului i valoarea sa ateptat, datorit ansei sau erori de eantionare) este mai mic de
5%. Respingerea ipotezei nule este echivalent cu acceptarea ipotezei alternative.
4. Calcularea valorii statistice a testului. n aceast etap se rezolv urmtoarele
probleme:
- se va folosi formula adecvat pentru a calcula valoarea statistic pentru testul ales;
- se va compara valoarea calculat anterior cu valoarea critic (din tabelul adecvat) n
funcie de regula de decizie aleas;
Ho
- pe baza comparaiei, lum decizia, fie respingnd, fie acceptnd ipoteza nul ( ).
5. Stabilirea concluziei. Se formuleaz o declaraie privind concluzia desprins, care s
fac un sumar al rezultatelor testului. Concluzia se stabilete din perspectiva ntrebrii
originale privind cercetarea.

n funcie de ipoteza ce trebuie testat, de natura i volumul datelor, se alege un


anumit test statistic.

1 Craiu, V., Verificarea ipotezelor statistice, Ed. Didactic i pedagogic, Bucureti, 1972.
ANALIZA MULTIDIMENSIONALA A DATELOR
APLICATII IN SPSS
Conf. univ. ANUTA BUIGA
Testele de concordan
Sunt teste statistice folosite pentru verificarea concordanei dintre o distribuie
observat i una teoretic de referin. Se folosesc att teste parametrice ct i neparametrice.

Teste de concordan parametrice


Testul Kolmogorov-Smirnov
Se consider o populaie A i o variabila X n legtur cu care se va formula
X
ipoteza c aparine unei legi de probabilitate de exemplu legea normal, de medie i
X
abatere
H 0 : X ( X , X )
H 1 : X ( X , X )

( X X )2
1
f (X ) e 2 2

2
cu
Din populaia univers A se constituie un eantion aleator de volum n (n >100),
( X 1 , X 2 ,..., X n )
cruia i se asociaz vectorul aleator . Repartiia valorilor variabilei X este de
forma urmtoare:
[ x ; x ) [ x1 ; x 2 )... [ x R 1 ; x R ]
X : 0 1
n
1 n 2 n R

Fn ( xi )
Notm cu frecvena relativ cumulat sau valorile funciei empirice de repartiie.
n n n2
Fn ( x1 ) 1 Fn ( x 2 ) 1 ... Fn ( x R ) 1
n n
X X
z (0,1)

Se tie c variabila urmeaz o lege normal normat, a crei valori sunt
tabelate, aa nct din tabelul funciei Laplace vom obtine valorile urmtoare:

x X
F ( x1 ) F z1 1
X

...
x X
F ( xR ) F z R R
X

Se calculeaz diferenele dintre valorile funciei empirice i a celei teoretice, astfel:


ANALIZA MULTIDIMENSIONALA A DATELOR
APLICATII IN SPSS
Conf. univ. ANUTA BUIGA

d1 Fn ( x1 ) F ( x1 )
...
d R Fn ( x R ) F ( x R )

d n (d imax ) max Fn ( xi ) F ( xi )

dn
Kolmogorov a stabilit legea de probabilitate a acestei variabile care depinde

de un parametru . Astfel formulm ipoteza nul:
H 0 : dn 0
H1 : d n 0

Pentru un q fixat q=1-K()=> din table, astfel nct dac



d n d tab H 0 acceptata
n
.
In mod asemantor acest test poate fi folosit i pentru testarea altor distribuii
cum ar fi: Poisson, uniform, exponenial.

2
Testul
2
Pentru testarea uniformitii unei distribuii se poate folosi i testul . Astfel
formulm ipoteza nul:
H 0 : X N ( X , X )
H 1 : X N ( X , X )

Pentru a verifica aceast ipotez presupunem c dispunem de un eantion de


valori particulare (n>100), de forma:
[ x ; x ) [ x1 ; x 2 )... [ x R 1 ; x R ]
X : 0 1
n1 n2 nR

pi P{ X I R H 0 } H0
Fie , dac este adevrat, atunci :
p i F0 ( xi ) F0 ( xi 1 )
x ( x X )2
1
F0 ( x) P ( X x )
2 e

2 2
dx

F0
unde este funcia de repartiie corespunztoare legii normale.
X X
F0 ( X ) ( ) pi ( xi ) ( xi 1 )

ANALIZA MULTIDIMENSIONALA A DATELOR
APLICATII IN SPSS
Conf. univ. ANUTA BUIGA

Ii
Numrul mediu de valori aparinnd intervalului este determinat din relaia
npi npi 5
. Condiia ce trebuie respectat este ca , n caz contrar se grupeaz intervalele
pentru ndeplinirea acestei restricii.
H0 2
Pentru testarea ipotezei se calculeaz statistica unde:
R
(n npi ) 2
2 i 2 ( R k 1)
i 1 npi

R-numrul de clase n care este mprit populaia


k-numrul de parametri de care depinde legea pe care o testm.

2
Practic se calculeaz probabilitile estimate i statistica :
x X x X
p i ( i ) ( i 1 )
X X
R
(ni np i ) 2
2
i 1 np i

tab
2
2 tab
2
(q, ) H 0 acceptata
pentru un q fixat va rezulta un , iar dac .
n cazul n care eantionul este de voum mic se recomand aplicarea Testului lui
Massey sau Shapiro Wilk (Florea, I.,, Statistic inferenial, 2000, p. 268-270).

Teste de concordan neparametrice


Ipoteza ce trebuie testat se formuleaz astfel:
H0
:distribuia observat nu difer semnificativ de o distribuie teoretic
specificat
H1
:distribuia observat difer semnificativ de o distribuie teoretic specificat
n mod practic, punctul de plecare l constituie statisticile rezultate din
observarea eantionului de volum n, care se prezint astfel:
x x 2 ...xi ... x R
X : 1
n1 n 2 ...ni ... n R

2
Pentru testarea unei astfel de ipoteze se poate folosi att testul , ct i testul
2 calc
2

lui Kolmogorov-Smirnov. n cazul testului se compar


ANALIZA MULTIDIMENSIONALA A DATELOR
APLICATII IN SPSS
Conf. univ. ANUTA BUIGA
R
(ni ni' ) 2
2
calc
i 1 ni'

tab
2
(q, R 1) ni
cu , unde - frecvenele ateptate conform distribuiei testate.
2
Calc 2
tab H0
Dac acceptat.

Teste de semnificaie
Testarea semnificaiei unei medii
Fie o populaie A n care variabila X este distribuit conform unei legi normale,
X X H0
de medie i abatere vom testa ipoteza cu privire la semnificaia unei medii, de
forma :
H 0 : X x0

H 1 : X x0

1 n 2
X X i V ( X )
n i 1 X N ( X , X E ( X ) X n
unde , ) i
2
X s X2
Deoarece nu se cunoate, aceasta se va aproxima cu
1 n
X2 s X2 ( X i X ) 2
n 1 i 1
s2
V ( X ) V ( X ) X
n

X E ( X ) X X
t S ( n 1)
X sX
n

Variabila astfel construit este o variabil Student (derivat de la o variabil normal) ce


n 1
depinde de un parametru .
q 0,05
Se consider un prag de semnificaie , iar din tabelele relativ la distribuia Student,
n 1 t tab
la un q dat i grade de libertate, va rezulta un .
Dac ipoteza nul este adevrat, atunci
X x0
tc
Sx
n
ANALIZA MULTIDIMENSIONALA A DATELOR
APLICATII IN SPSS
Conf. univ. ANUTA BUIGA
Este tot o variabil Student, ale crei valori, pentru eantionul format, vor fi situate n
(t tab ;t tab )
intervalul .
Gradele de libertate
n general, prin numr de grade de libertate al unei mrimi se nelege numrul
variabilelor independente a cror variaie nu sufer nici o restricie i care definesc mrimea
considerat. Altfel spus, numrul gradelor de libertate este egal cu numrul variabilelor
independente, care definesc mrimea considerat, minus numrul de restricii la care sunt
supuse. De exemplu, media aritmetic a n numere are n-1 grade de libertate, deoarece pentru
a obine o valoare impus se pot alege arbitrar n-1 valori, a n-a valoare fiind n acel moment
fixat de restricia ca valoarea mediei s fie egal cu valoarea impus (altfel spus, n valori i
n 1
o restricie, deci ).
Un alt punct de vedere este acela c numrul gradelor de libertate este egal cu
numrul valorilor independente care sunt necesare estimrii, minus numrul parametrilor
estimai n paii anteriori: de exemplu, pentru estimarea varianei se consider cele n valori,
dar este necesar estimarea prealabil a mediei, deci n- 1 grade de libertate.

5.4.2 Testarea semnificaiei unei proporii (testul binomial).

Fie o populaie univers definit printr-o proporia p, necunoscut de uniti ce


sunt caracterizate de o anumit stare a unei variabile. Un eantion n va fi constituit aleator
( X 1 , X 2 ,..., X n ) X i ( p )
prin n extrageri independente din aceeai poulaie. Fie vectorul
aleator asociat acestui eantion, variabilele urmnd toate aceeai lege a lui Bernoulli de
parametru p.
Astfel formulm ipotezele:
H 0 : p p0
H 1 : p p0

Considerd c n este suficient de mare, iar la nivelul eantionului se poate


calcula proporia de eantionare, ale crei caracteristici sunt urmtoarele:
X X 2 ... X n
p 1
n

p (1 p )
V ( p )
E ( p ) p n
cu i .
Pentru un n suficient de mare, proporia de eantionare este distribuit
asimptotic spre o lege normal, respectiv avem:
p (1 p )
p ( p;
n

Aa cum se poate constata proporia de eantionare poate fi considerat un caz


particular al mediei, ca urmare putem elabora variabila Z normal normat de forma:
ANALIZA MULTIDIMENSIONALA A DATELOR
APLICATII IN SPSS
Conf. univ. ANUTA BUIGA

p p
z (0,1)
p (1 p )
n

q 0,05 z tab
La un nivel al riscului fixat , va rezulta un . Dac ipoteza nul este
adevrat, atunci
p p 0
z calc ( z tab ; z tab )
p 0 (1 p 0 )
n

5.5 Teste de comparare

n cazul aplicrii unor teste statistice, trebuie s se fac distincie ntre


eantioane independente i eantioane dependente (perechi), astfel:
dou eantioane sunt independente dac selecia unitilor unui eantion nu depinde
de selecia unitilor celuilalt eantion;
dou eantioane sunt dependente dac selecia unitilor unui grup determin selecia
unitilor altui grup. Un exemplu frecvent de grupuri dependente apare atunci cnd se
urmrete efectul unui experiment pe acelai eantion, nregistrndu-se reacia
indivizilor nainte i dup experiment. Aceste grupuri se mai numesc i grupuri
perechi.

5.5.1 Testarea egalitii a dou medii, cazul eantioanelor independente


Cnd testm o iptez asupra a dou medii ncercm s determinm, cu ajutorul a
dou eantioane dac exist o diferen semnificativ statistic, ntre mediile celor dou
populaii. Ipoteza nul este formulat astfel: nu exist diferene semnificative ntre mediile
celor dou populaii, respective populaiile sunt identice n raport cu parametrul medie.

H 0 : X1 X 2 H0 : X1 X 2 0

H1 : X 1 X 2 H1 : X 1 X 2 0

A1 A2
Fie dou populaii i distribuite normal
X 1 N ( X 1 , 1 ) X 2 N ( X 2 , 2 )
din care se extrag independent dou eantioane de volum
n1 n2 X X 1 2
i la nivelul crora se vor calcula estimaiile variabilelor i .
n1 n2
1 1
X 1 X i1 X 2 X i 2
n1 i 1 n2 i 1
ANALIZA MULTIDIMENSIONALA A DATELOR
APLICATII IN SPSS
Conf. univ. ANUTA BUIGA

X 1 X 2
Variabila de eantionare este ( - ), unde sperana matematic i variana au
urmtoarele expresii:
E ( X X ) E ( X ) E ( X ) X X
1 2 1 2 1 2
2
2
V ( X 1 X 2 ) V ( X 1 ) V ( X 2 )
1
2
n1 n2

X 1 N ( X 1 , 1 ) X 2 N ( X 2 , 2 )
n1 n2

n aplicarea acestor teste apar urmtoarele situaii cu privire la cele dou


variane:

12 , 22 12 22 2
b) -nu se cunosc dar sunt egale
,
2
1
2
2
c) -nu se cunosc i sunt diferite
12 , 22
b) Dac varianele - nu se cunosc dar sunt presupuse a fi egale
1 2
2 2 2
2
, trebuie s estimm pe .

H0 ( X1 X 2 )
n ipoteza de egalitate a mediilor , cele dou eantioane pot fi
2

considerate ca provenind din aceeai populaie de varian . Ca urmare se recomand s


2
s2
lum n considerare estimaiile celor dou variane, astfel va fi exprimat prin , unde:
ANALIZA MULTIDIMENSIONALA A DATELOR
APLICATII IN SPSS
Conf. univ. ANUTA BUIGA

(n1 1) s12 ( n2 1) s22


2
s 2

n1 n2 2
n 1
1 1
s12 ( X i1 X 1 ) 2
n1 1 i 1
s22 ( X i2 X 2 ) 2
n2 1 i 1
1 1
( X 1 X 2 ) s ( )
n1 n2
( X 1 X 2 ) ( X 1 X 2 )
t S ( n1 n2 2)
1 1
s( )
n1 n2
pentru q 0.05 t tab ( q, )
X 1 X 2
daca t calc [ t tab ; t tab ] H 0 acceptata
1 1
s( )
n1 n2

12 , 22
c) Dac -nu se cunosc i sunt diferite, cele dou varine vor fi estimate prin,
1 n1
1 s1
2 2
( xi1 X 1 ) 2
n1 1 i 1

1 n2
s
2
2
2
2 ( xi 2 X 2 ) 2
n2 1 i 1

12 s12 22 s 22
s12 s 22
( X 1 X 2 )
n1 n2
( X 1 X 2 ) ( X 1 X 2 )
t S ( )
s12 s 22

n1 n2
s12
1 n1
; c 2
c 2
(1 c ) 2 s1 s 22

n1 1 n2 1 n1 n2
q 0.05 t tab (q, )
( X 1 X 2 )
daca t calc [t tab ; t tab ] H 0 acceptata
s12 s 22

n1 n2
ANALIZA MULTIDIMENSIONALA A DATELOR
APLICATII IN SPSS
Conf. univ. ANUTA BUIGA
n situaia n care nu dispunem de informaii referitoare la variane (sunt egale sau
sunt diferite), va trebuie s testm ipoteza privind egalitate a dou variane.

5.5.2 Testarea egalitii a dou variane


A1 A2
Fie dou populaii i distribuite normal
X 1 N ( X 1 , 1 ) X 2 N ( X 2 , 2 )
din care se extrag independent dou eantioane de volum
n1 n2
i . Cele dou variane nu sunt cunoscute, ca urmare ipotezele ce trebuie testate se
formuleaz astfel:
H 0 : 12 22

H 1 : 12 22

s12 s 22 12 , 22
S presupunem c i sunt estimatorii celor dou variane . Pentru
testarea acestei ipoteze se va aplica testul F a lui Fisher-Snedecor.

1 n1 1 n2
s
2
1 ( X i1 X 1 ) 2 s
2
2 ( X i 2 X 2 ) 2
n1 1 i 1 n2 1 i1
s12 s22
F 2 : 2 F ( 1 n1 1; 2 n2 1)
1 2
12 22
F :
n1 1 n2 1
pentru q 0.05 Ftab (q, 1 , 2 )
2
smax max( s12 ; s22 )
daca Fcalc Ftab H 0 acceptata
s12( 2 ) s12( 2 )

5.5.3 Testarea egalitii a dou medii, cazul eantioanelor perechi.

Eantioane perechi, presupune ca fiecrei uniti din eantionul A s-i


corespund o unitate din eantionul B, cercetndu-se aceeai variabil. Astfel de eantioane
sunt folosite atunci cnd se urmrete evoluia unei variabile n timp sau efectul unei aciuni.
Considerm c variabila studiat este o variabil cantitativ X, astfel pentru
fiecrui cuplu i se calculeaz diferena
d i X Ai X Bi

X Ai X Bi
unde sunt valorile variabilei X pentru cuplu i . Astfel vom obine n valori pentru
i 1, n
variabila d, aferente fiecrui cuplu i, .
ANALIZA MULTIDIMENSIONALA A DATELOR
APLICATII IN SPSS
Conf. univ. ANUTA BUIGA

1 n
d di
n i 1
Ca urmare se poate calcula media estimat a acestor valori, i variana estimat
n
1
s d2 (d i d ) 2
n 1 i 1
.
di
Dac sunt observaii aferente variabilei d aferent unei populaii normale,
atunci raportul
d ( X A X B )
S ( n 1)
sd
n

urmeaz o distribuie Student cu n-1 grade de libertate.


Astfel putem formula ipoteza nul c variabila X nu s-a modificat intre cele dou momente
studiate, respectiv:
H0 : d 0
H1 : d 0

Se va aplica testul t, unde


d d
t
sd
n
pentru q 0,05 t tab ( n 1)

d
daca t calc (t tab ;t tab ) H 0 acceptata
sd
n