Sunteți pe pagina 1din 55

5 Introducere n statisticile

infereniale
Cercettorii folosesc statistici infereniale pentru a
trage concluzii despre caracteristicile unei populaii pe
baza caracteristicilor corespunztoare ale unui eantion
din acea populaie.

Strategia inferenial i distribuia de


eantionare


n statisticile infereniale, mrimile statistice pentru populaii se


numesc parametri, iar mrimile statistice pentru eantioane se
numesc pur i simplu statistici.
Vom folosi pentru parametri urmtoarele simboluri: P
(proporie), (media aritmetic), (abaterea standard).
Strategia general a statisticilor infereniale const din
calcularea unor statistici pentru un eantion selectat aleatoriu
dintr-o populaie, pe baza crora, prin intermediul noiunii de
distribuie de eantionare, se infer asupra parametrilor
corespunztori ai populaiei respective.
n cazul cel mai general, un eantion este aleatoriu dac fiecare
caz din populaia de referin are aceeai probabilitate de a fi
selectat n eantion cu a oricrui alt caz i selectarea fiecrui caz
este independent de selectarea tuturor celorlalte cazuri.

Strategia inferenial i distribuia de


eantionare


Distribuia unui eantion este empiric (exist n realitate) i


cunoscut. Distribuia unei populaii este, de asemenea,
empiric, dar este necunoscut.
Distribuia de eantionare este teoretic i cunoscut, ntruct i
se pot determina forma, tendina central i dispersia.
Lund media aritmetic drept o variabil, definim distribuia de
eantionare a mediilor aritmetice ca distribuia mediilor
aritmetice ale tuturor eantioanelor aleatorii de dimensiune
constant, n, din populaia de referin. Similar se definesc
distribuiile de eantionare pentru alte mrimi statistice.
Pentru media aritmetic i abaterea standard a distribuiei de
eantionare se folosesc, respectiv, simbolurile X i X .

Strategia inferenial i distribuia de


eantionare


Teorema limitei centrale. Dac se alctuiesc toate


eantioanele posibile de dimensiune n dintr-o populaie cu media
aritmetic i abaterea standard , atunci distribuia de
eantionare a mediilor aritmetice ale acestor eantioane are
urmtoarele trei proprieti:
 Media sa aritmetic, , este egal cu ;
X
 Abaterea sa standard,
n;
X , este egal cu
 Cu ct n este mai mare, cu att forma sa aproximeaz
mai bine normalitatea, indiferent de forma distribuiei
populaiei.

Strategia inferenial i distribuia de


eantionare


Teorema limitei centrale arat c, indiferent de forma


distribuiei unei variabile ntr-o populaie (care poate
fi asimetric), distribuia de eantionare a mediilor
aritmetice va fi aproximativ normal pentru
eantioane suficient de mari.
Dac distribuia unei variabile este aproximativ
normal, atunci distribuia de eantionare a mediilor
aritmetice va fi aproximativ normal chiar i pentru
valori mai mici ale lui n.
Dac distribuia unei variabile este riguros normal,
atunci distribuia de eantionare a mediilor aritmetice
va fi normal, indiferent de dimensiunea eantionului.
5

6 Proceduri de estimare statistic

Introducere


Statisticile infereniale se clasific n dou categorii principale:


proceduri de estimare, n care se face o apreciere despre un
parametru al populaiei de referin pe baza statisticii
corespunztoare calculat pentru un eantion (estimator) i
testarea ipotezelor, n care se verific o ipotez despre populaie
prin raportare la rezultatele obinute pe un eantion.
Procedurile de estimare sunt de dou tipuri: puncte estimate i
intervale estimate. Un punct estimat este o singur valoare
calculat pentru un eantion i folosit pentru a estima
parametrul corespunztor al populaiei de referin.
Un interval estimat este o amplitudine de valori n care este
probabil s se afle un parametru al populaiei de interes.
7

Caracteristici ale estimatorilor




Un estimator trebuie s satisfac dou condiii: s fie


nedistorsionat i relativ eficient.
Un estimator este nedistorsionat, dac media aritmetic a
distribuiei sale de eantionare este egal cu media aritmetic a
populaiei de referin.
Mediile aritmetice i proporiile eantioanelor sunt estimatori
nedistorsionai ai parametrilor corespunztori.
Un estimator este cu att mai eficient, cu ct distribuia de
eantionare este mai grupat n jurul mediei sale aritmetice sau,
altfel spus, cu ct este mai mic abaterea standard a distribuiei
de eantionare.

Estimarea intervalelor pentru medii


aritmetice cnd este cunoscut


Fie o populaie cu media aritmetic i cu abaterea standard .


Selectm aleatoriu un eantion de dimensiune n din aceast
populaie i calculm media aritmetic pentru eantion, X .
Conform teoremei limitei centrale, distribuia de eantionare a
mediilor aritmetice ale tuturor eantioanelor posibile de
dimensiune n din populaia de referin este aproximativ
normal, cu media aritmetic egal cu cea a populaiei de
referin i cu abaterea standard egal cu n .
Pe baza caracteristicilor distribuiei de eantionare i a tabelului
distribuiei normale standard putem formula enunuri de
probabilitate despre mediile aritmetice ale eantioanelor.

Estimarea intervalelor pentru medii


aritmetice cnd este cunoscut


De exemplu, din tabel aflm c proporia de cazuri


(medii aritmetice ale eantioanelor) cuprinse ntre un
scor Z = 1,96 i media aritmetic este de 0,475:

0,475

1,96

10

Estimarea intervalelor pentru medii


aritmetice cnd este cunoscut


ntruct curba este simetric, proporia de cazuri


cuprinse ntre un scor Z = +1,96 i media aritmetic
este tot de 0,475:

0,475

1,96

0,475

+1,96

11

Estimarea intervalelor pentru medii


aritmetice cnd este cunoscut


Astfel, proporia de cazuri cuprinse ntre 1,96


abateri standard fa de medie este de 0,95 (0,475 +
0,475):

0,475

0,475

0,95
1,96

+1,96

12

Estimarea intervalelor pentru medii


aritmetice cnd este cunoscut


Proporia de cazuri aflate sub 1,96 i peste +1,96


abateri standard fa de medie este de 0,05 (0,025 +
0,025):

0,025

0,475

0,475

0,025

0,95
1,96

+1,96

13

Estimarea intervalelor pentru medii


aritmetice cnd este cunoscut


Acelai lucru ca mai sus poate fi exprimat spunnd c 95% din


mediile aritmetice ale eantioanelor se afl n intervalul
1,96 ( / n )
Structura acestui tip de enun de probabilitate poate fi folosit
pentru a estima valoarea prin construirea unui interval centrat
pe X . Rezultatul este un interval de ncredere estimat (IE) o
amplitudine de valori n care este probabil s se afle .
Astfel, putem estima c exist o probabilitate de 0,95 sau 95%
ca s se afle n intervalul X 1,96 ( n ) .
Aceasta nseamn c probabilitatea ca s nu se afle n acest
interval este de 0,05 sau 5%.

14

Estimarea intervalelor pentru medii


aritmetice cnd este cunoscut


Probabilitatea ca s nu se afle n IE (probabilitatea de eroare


a estimrii) se numete nivel de semnificaie sau nivel alfa (),
iar probabilitatea ca IE s conin se numete nivel de
ncredere.
Nivelul de ncredere este complementarul nivelului , fiind egal
cu 1 sau, n procente, cu (1 ) 100. De exemplu, dac
= 0,05, atunci nivelul de ncredere este de 95%.
ntruct probabilitatea de eroare este mprit n mod egal n
extremitatea inferioar i cea superioar a distribuiei de
eantionare, stabilindu-se astfel limita inferioar i limita
superioar de ncredere, vom nota scorul Z corespunztor
nivelului ales cu Z /2.
Cnd este cunoscut, IE pentru este:
1.

IE = X Z 2 ( n)
15

Estimarea intervalelor pentru medii


aritmetice cnd este cunoscut
Tabelul 1 Niveluri de ncredere i scoruri Z/2
Nivelul de ncredere
(1 ) 100

/2

Z /2

90%

0,10 0,050 1,65

95%

0,05 0,025 1,96

99%

0,01 0,005 2,58

16

Estimarea intervalelor pentru medii


aritmetice cnd este cunoscut


Un eantion aleatoriu de 200 de femei casnice petrec n medie


6 ore pe zi vizionnd programe TV. tim c = 0,7. Care este
media aritmetic zilnic a orelor de vizionare a programelor TV
de ctre femeile casnice la un nivel de ncredere de 90% ( =
0,10)?

IE = X Z 2 (

n) = 6 1,65(0,7 200) = 6 0,08

Pe baza mediei aritmetice a eantionului estimm c femeile


casnice petrec n medie ntre 5,92 (= 6 0,08) i 6,08 (= 6 +
0,08) ore pe zi vizionnd programe TV: 5,92 6,08.
Aceast estimare are o ans de 10% de a fi greit.

17

Estimarea intervalelor pentru medii


aritmetice cnd este necunoscut


n cazul eantioanelor cu n > 30, se poate estima prin s.


2. IE= X Z 2 (s

n 1)

n cazul eantioanelor cu n 30, se folosete distribuia


tStudent. Graficul distribuiei tStudent (curba t) este simetric
i are form de clopot cu ambele extremiti extinse la infinit,
iar forma sa exact depinde de n. Prin urmare, distribuia t este,
de fapt, o familie de distribuii. Exemplu de curb t:

t=0
18

Estimarea intervalelor pentru medii


aritmetice cnd este necunoscut


Distribuia t particular cerut pentru rezolvarea unei anumite


probleme depinde de un concept matematic numit grade de
libertate (gl), care se refer la numrul de valori libere s
varieze ntr-o distribuie.
De exemplu, dac tim c media aritmetic a dou numere (n =
2) este 50, atunci, odat ce unul dintre numere este cunoscut,
cellalt numr este fixat, i.e. gl = n 1 = 2 1 = 1.
n general, pentru media aritmetic a unui eantion de
dimensiune n, o distribuie are n 1 grade de libertate, ceea ce
nseamn c pentru valori specificate ale mediei aritmetice i ale
lui n, n 1 scoruri sunt libere s varieze.

19

Estimarea intervalelor pentru medii


aritmetice cnd este necunoscut


Tabelul valorilor critice ale distribuiei t (Anexa C) specific


valorile pentru t, i.e. valorile lui t pentru care aria aflat la
dreapta sub curba t este egal cu .

Nivelurile sunt dispuse pe primul rnd al tabelului. Valorile t


sunt date pentru gl dispuse pe prima coloan din stnga, de la 1
la 30 i pentru (t cu gl 30 este aproximativ egal cu t
pentru gl = , i.e. cu Z).

20

Estimarea intervalelor pentru medii


aritmetice cnd este necunoscut


Valoarea t/2 se localizeaz nmulind cu 2 valoarea de pe


primul rnd.
De exemplu, dac n = 30 i = 0,05, la intersecia coloanei de
sub t = 0,025 (0,025 2 = 0,05) cu linia pentru gl = 30 1 =
29 gsim valoarea t/2 = 2,045.
Formula pentru cazurile n care este necunoscut i n 30:
3.

IE = X t / 2(s / n)

Aceast formul poate fi aplicat doar dac variabila de interes


este normal distribuit.

21

Estimarea intervalelor pentru medii


aritmetice cnd este necunoscut


Media aritmetic a scorurilor la un test de cunotine aplicat


unui eantion aleatoriu de 20 de adolesceni cu dificulti de
nvare este de 24,45 cu s = 5,42. Care este intervalul estimat
pentru media aritmetic a acestei populaii, la un nivel de
ncredere de 99%?
Avnd = 0,01, la intersecia coloanei t = 0,005 cu linia
pentru gl = 20 1 = 19 gsim valoarea t/2 = 2,861.

IE = X t 2 ( s

n ) = 24,45 2,861(5,42

20 ) = 24,45 3,46

Astfel, estimm c media aritmetic a acestei populaii este


cuprins ntre 21,3 (= 24,5 3,46) i 27,91 (= 24,5 + 3,46) i
exist doar 1% anse ca acest interval s nu conin media
aritmetic a populaiei.
22

Estimarea proporiilor


Proporiile pentru eantioane, p, au distribuii de eantionare


aproximativ normale, cu p = P i p = P(1 P) / n .
Formula teoretic pentru construirea unui IE pentru proporii:
4.

IE = p Z 2

P(1 P)
n

Practic, se stabilete P = 0,5, astfel c P(1 P) = 0,25, aceasta


fiind valoarea maxim pentru P(1 P).
5.

IE = p Z 2

0,25
n
23

Estimarea proporiilor


Dintr-un eantion aleatoriu de 200 de studeni de la


Universitatea X, 30 de studeni sunt la a doua facultate. Care
este intervalul estimat pentru proporia de studeni la a doua
facultate n Universitatea X, la un nivel de ncredere de 95%?
Proporia eantionului pe care ne bazm estimarea este p =
30/200 = 0,15.

IE = p Z 2

0,25
0,25
= 0,15 1,96
= 0,15 0,07
n
200

Pe baza proporiei de 0,15 a eantionului, estimm c proporia


cutat este cuprins ntre 0,08 i 0,22 (ntre 8% i 22% dintre
studenii Universitii X sunt la a doua facultate).
24

7 Testarea ipotezelor despre o


singur populaie
Tehnicile de testare a ipotezelor prezentate n acest
capitol sunt teste despre valoarea parametrilor unei
populaii i cer ndeplinirea unor condiii sau supoziii
despre populaiile respective, cum este, n principal,
normalitatea. Testele de acest fel se numesc teste
parametrice.

Testul scorurilor Z pentru medii


aritmetice cnd este cunoscut


Noiunile fundamentale ale testelor statistice sunt ipotez de


nul, ipotez alternativ, statistic a testului i regul de decizie.
Un cercettor presupune c ntr-un anumit an, media aritmetic
a punctelor obinute la examenul de rezideniat al medicilor este
de 800. Pentru a testa aceast ipotez, cercettorul alctuiete
un eantion aleatoriu de 130 de medici care i-au susinut
rezideniatul n acel an i constat c la nivelul acestui eantion
media aritmetic a punctajului obinut este de 755. Prin
investigaii extensive, cercettorul tie c 152.
Problema care se pune este dac diferena dintre media
aritmetic a eantionului i valoarea presupus pentru populaie
este sau nu statistic semnificativ. Dac rspunsul este
afirmativ, atunci ipoteza fcut poate fi respins. Dac
rspunsul este negativ, atunci diferena poate fi pus pe seama
ntmplrii i ipoteza nu poate fi respins.
26

Testul scorurilor Z pentru medii


aritmetice cnd este cunoscut


Ipoteza de nul, H0, enun c nu exist nici o diferen


semnificativ ntre valoarea efectiv a parametrului de interes i
valoarea presupus a acelui parametru
Pentru media aritmetic a unei populaii:

H 0 : = H


n exemplul de mai sus,

H0: = 800

27

Testul scorurilor Z pentru medii


aritmetice cnd este cunoscut


Ipoteza alternativ, Ha, enun c exist o diferen


semnificativ ntre valoarea efectiv a parametrului de interes i
valoarea presupus a acelui parametru
Dac sensul diferenei nu poate fi prezis sau nu intereseaz, Ha
ia forma:
Ha: H (test bilateral)
n caz contrar, Ha poate lua una dintre urmtoarele dou forme:

Ha: > H (test unilateral dreapta)


Ha: < H (test unilateral stnga)


n exemplul de mai sus,

Ha: 800
28

Testul scorurilor Z pentru medii


aritmetice cnd este cunoscut


Statistica testului este formula a crei aplicare n testul respectiv


permite obinerea unei valori care formeaz baza de decizie
asupra H0.
Pentru media aritmetic a unei populaii:
1. Z =

X H

n exemplul de mai sus:

Z=

X H

755 800

45
45
=
=
=
= 3,36
n
152 130 152 11,40 13,4

Vom spune c Z (obinut) = 3,36


29

Testul scorurilor Z pentru medii


aritmetice cnd este cunoscut


Regula de decizie se refer la o anumit amplitudine de valori


pentru rezultatul statisticii testului, numit zon critic sau zon
de respingere, care conduce la respingerea H0.
n cazul testului scorurilor Z pentru medii aritmetice, zona critic
se stabilete cu ajutorul distribuiei de eantionare a mediilor
aritmetice pentru un nivel ales.
n cazul unui test bilateral (Ha: H), nivelul ales se mparte
n mod egal n cele dou extremiti ale distribuiei de
eantionare, dup cum ilustreaz urmtoarea figur:

30

Testul scorurilor Z pentru medii


aritmetice cnd este cunoscut
Zona critic pentru un test bilateral (Ha: H)

/2

/2

Z/2

+Z/2

Zona critic = aria de sub Z/2 + aria de peste +Z/2. Dac


scorul Z corespunztor mediei aritmetice a unui eantion cade n
zona critic, se poate respinge H0. Scorurile Z/2 i Z/2 se
numesc scoruri Z critice: Z/2 (critic), Z/2 (critic).
31

Testul scorurilor Z pentru medii


aritmetice cnd este cunoscut


n exemplul de mai sus, dac = 0,05, Z/2 (critic) = 1,96, astfel c Z


(obinut) se afl n zona critic (3,36 < 1,96):

1,96
3,36

+1,96

Ca atare, H0 poate fi respins: diferena dintre media eantionului i


media presupus pentru populaie este statistic semnificativ, i.e. este
prea mare pentru a fi atribuit ntmplrii, (la un nivel de ncredere de
95%).
32

Testul scorurilor Z pentru medii


aritmetice cnd este cunoscut


ntr-un test unilateral, ntreaga zon critic dat de nivelul


ales este plasat n extremitatea de interes a distribuiei de
eantionare.
Dac = 0,05, scdem 0,05 din 0,5 (proporia de cazuri aflate
de o parte i de alta a mediei aritmetice a distribuiei de
eantionare). Rezultatul scderii este 0,4500. Scorul Z
corespunztor acestei proporii este 1,65
Prin urmare, Z (critic) = +1,65, dac este vorba despre
extremitatea superioar (Ha: > H) i Z (critic) = 1,65, dac
este vorba despre extremitatea inferioar (Ha: < H).
n exemplul de mai sus, se poate respinge H0, dac Ha: < 800,
toate celelalte date fiind aceleai?

33

Testul scorurilor Z pentru medii


aritmetice cnd este cunoscut


Reguli de decizie pentru testul scorurilor Z:


1. ntr-un test bilateral, se respinge H0, dac Z (obinut) >
+Z/2 (critic) sau dac Z (obinut) < Z/2 (critic).
2. ntr-un test unilateral dreapta (Ha: > H), se respinge H0,
dac Z (obinut) > +Z (critic).
3. ntr-un test unilateral stnga (Ha: < H), se respinge H0,
dac Z (obinut) < Z (critic).

34

Modelul n 4 pai pentru testarea


ipotezelor statistice
Pasul 1. Enunarea ipotezelor

H0: = 800
Ha: 800
Pasul 2. Selectarea distribuiei de eantionare i stabilirea zonei critice
Distribuia de eantionare = Distribuia Z
= 0,05 (test bilateral)
Z/2 (critic) = 1,96
Pasul 3. Calcularea statisticii testului

Z=

X H

755 800
152

130

45
45
=
= 3,36
152 11,40 13,4

Pasul 4. Luarea deciziei


ntruct Z (obinut) se afl n zona critic (3,36 < 1,96), H0 poate fi respins.
Diferena dintre eantionul de medici rezideni i populaia de referin este statistic
semnificativ, i.e nu poate fi atribuit ntmplrii (la un nivel de ncredere de 95%).

35

Erori n testarea ipotezelor




Rezultatele posibile ale unui test al ipotezelor:

H0 adevrat

H0 fals

Se respinge H0

Eroare de tipul I

Decizie corect

Nu se respinge

Decizie corect

Eroare de tipul
II

H0


n mod normal, n tiinele omului se dorete minimizarea


probabilitii erorii de tipul I, socotit a fi mai grav dect
eroarea de tipul II. Pentru aceasta, se aleg valori mici pentru .
36

Niveluri i scoruri Z critice




n tabelul urmtor sunt prezentate cteva scoruri Z critice


pentru nivelurile mai des folosite:
Niveluri
Test bilateral

Niveluri
Test unilateral

Scoruri Z critice

0,20

0,10

1,29

0,10

0,05

1,65

0,05

0,025

1,96

0,01

0,005

2,58

De regul, = 0,05 este considerat un indicator bun al unui


rezultat semnificativ.
37

Testarea ipotezelor pentru medii


aritmetice cnd este necunoscut


n cazul n > 30, se estimeaz prin s i se folosete formula:


2. Z =

n 1

n cazul n 30, distribuia de eantionare este distribuia tStudent i se folosete formula:


3.

X H

t=

X H
s

n 1

Vom spune c este vorba despre testul scorurilor t pentru medii


aritmetice. Rezultatul aplicrii formulei 3 se numete t (obinut).
38

Testarea ipotezelor pentru medii


aritmetice cnd este necunoscut


Reguli de decizie pentru testul scorurilor t:


1. ntr-un test bilateral, se respinge H0, dac t (obinut) >
+t/2 (critic) sau dac t (obinut) < t/2 (critic).
2. ntr-un test unilateral dreapta (Ha: > H), se respinge H0,
dac t (obinut) > +t (critic).
3. ntr-un test unilateral stnga (Ha: < H), se respinge H0,
dac t (obinut) < t (critic).

39

Testarea ipotezelor pentru medii


aritmetice cnd este necunoscut


Un cercettor presupune c media aritmetic a coeficientului de


inteligen al olimpicilor la matematic n ultimii 5 ani este de
aproximativ 125. Pentru a testa aceast ipotez, selecteaz un
eantion aleatoriu de 20 de olimpici la matematic din ultimii 5
ani i constat c media aritmetic a coeficientului de
inteligen la nivelul eantionului este de 123 cu s = 8.
Cercettorul este interesat s determine dac media aritmetic
a coeficientului de inteligen al olimpicilor la matematic din
ultimii 5 ani este mai mare de 125, la un nivel de ncredere de
99%.
Datele problemei sunt: H = 125, n = 20, X = 123 , s = 20.

40

Testarea ipotezelor pentru medii


aritmetice cnd este necunoscut
Pasul 1. Enunarea ipotezelor

H0: = 125
Ha: > 125
Pasul 2. Selectarea distribuiei de eantionare i stabilirea zonei critice
Distribuia de eantionare = Distribuia t
= 0,01 (test unilateral dreapta)
gl = 20 1 = 19
t (critic) = +2,539
Pasul 3. Calcularea statisticii testului

t=

X H
s

n 1

125 123
8 19

2
= +1,09
8 4,36

Pasul 4. Luarea deciziei


ntruct t (obinut) nu se afl n zona critic (+1,09 < +2,539), H0 nu poate fi
respins. Pe baza mediei aritmetice a eantionului nu se poate conchide c media aritmetic
a coeficientului de inteligen al olimpicilor la matematic din ultimii 5 ani este mai mare de
125 (la un nivel de ncredere de 99%).

41

Testul scorurilor Z pentru proporii




Atunci cnd variabila de interes nu este de interval/raport se


poate utiliza proporia eantionului (p) n locul mediei
aritmetice.
Formula de calcul a testului scorurilor Z pentru proporii:
4.

Z=

p PH
p(1 p) n

Pentru testarea ipotezei conform creia aproximativ 10% din


studenii Universitii X sunt cstorii se selecteaz un eantion
aleatoriu de 200 de studeni de la Universitatea X i se constat
c 24 de studeni din eantion sunt cstorii. n baza acestui
rezultat, se poate spune la un nivel de ncredere de 95% c mai
mult de 10% din studeni sunt necstorii?
Datele problemei: PH = 0,10, n = 200, p = 0,12.
42

Testul scorurilor Z pentru proporii


Pasul 1. Enunarea ipotezelor

H0: P = 0,10
Ha: P > 0,10
Pasul 2. Selectarea distribuiei de eantionare i stabilirea zonei
critice
Distribuia de eantionare = Distribuia Z
= 0,05 (test unilateral dreapta)
Z (critic) = +1,65
Pasul 3. Calcularea statisticii testului
Z=

p PH
p (1 p ) n

0,12 0,10
0,12(1 0,12) 300

0,02
= +1,06
0,0188

Pasul 4. Luarea deciziei


ntruct Z(obinut) nu se afl n zona critic (+1,06 < +1,65), H0 nu poate
fi respins. La un nivel de ncredere de 95% nu se poate spune c mai mult de
10% dintre studeni sunt necstorii.

43

8 Testarea ipotezelor despre


diferenele dintre dou populaii

Introducere


n acest capitol sunt expuse procedee de testare a ipotezelor


privind diferenele dintre mediile aritmetice a dou populaii, 1
2, i dintre proporiile a dou populaii, P1 P2.
Problema cercetrii: diferena dintre dou eantioane sub
aspectul variabilei de interes este suficient de mare pentru a
putea conchide, cu o probabilitate de eroare cunoscut, c
populaiile reprezentate de eantioane sunt diferite sub aspectul
variabilei respective?
Toate testele statistice prezentate n continuare sunt aplicabile
sub supoziia c eantioanele selectate aleatoriu din cele dou
populaii de referin sunt independente. Dou eantioane sunt
independente dac selectarea cazurilor pentru un eantion nu
influeneaz selectarea cazurilor pentru cellalt eantion.

45

Testul scorurilor Z pentru diferena


dintre dou medii aritmetice


Acest test este aplicabil dac sunt satisfcute


urmtoarele dou condiii (i) nivelul de msur al
variabilei de interes este de interval sau de raport i
(ii) cele dou eantioane sunt relativ mari, ceea ce
nseamn n1 > 30 i n2 > 30.
Distribuia de eantionare folosit este distribuia de
eantionare a diferenelor dintre mediile aritmetice.
Atunci cnd eantioanele sunt mari, aceast
distribuie este descris de distribuia Z.

46

Testul scorurilor Z pentru diferena


dintre dou medii aritmetice


Ipoteza de nul enun c nu exist nici o diferen ntre mediile


aritmetice ale celor dou populaii:

H 0 : 1 = 2


Ipoteza alternativ:

Ha: 1 2 (test bilateral)


Ha: 1 > 2 (test unilateral dreapta)
Ha: 1 < 2 (test unilateral stnga)

47

Testul scorurilor Z pentru diferena


dintre dou medii aritmetice


Formula de calcul a testului Z pentru diferena dintre dou medii


aritmetice:
1. Z =

X1 X 2
s12
s 22
+
n1 1 n 2 1

Pentru a verifica ipoteza c brbaii i femeile difer n privina


capacitii de rezolvare de probleme, un cercettor alctuiete
dou eantioane aleatorii, unul de 324 brbai i unul de 317
femei, i le administreaz un test de rezolvare de probleme.
Brbaii obin o medie aritmetic de 62 cu s = 13, iar femeile
obin o medie aritmetic de 65 cu s = 14.
48

Testul scorurilor Z pentru diferena


dintre dou medii aritmetice
Pasul 1. Enunarea ipotezelor

H0 : 1 = 2
Ha: 1 2
Pasul 2. Selectarea distribuiei de eantionare i stabilirea zonei
critice
Distribuia de eantionare = Distribuia Z
= 0,05 (test bilateral)
Z/2 (critic) = 1,96
Pasul 3. Calcularea statisticii testului
Z =

X1 X 2
s 12
s 22
+
n1 1 n 2 1

62 65
13 2 14 2
+
323 316

3
= 2 ,63
1,14

Pasul 4. Luarea deciziei


ntruct Z(obinut) se afl n zona critic (2,63 < 1,96), H0 poate fi
respins. La un nivel de ncredere de 95% se poate spune c brbaii i femeile
difer n privina capacitii de rezolvare de probleme.
49

Testul scorurilor t pentru diferena


dintre dou medii aritmetice


Atunci cnd eantioanele sunt mici (n1 30 sau/i n2 30), se


folosete distribuia t-Student cu gl = n1 + n2 1.
Formula de calcul a testului t pentru diferena dintre dou medii
aritmetice:
2.

t=

X1 X 2
n1 s12 + n2 s22
n +n
1 2
n1 + n2 2
n1n2

Acest test poate fi folosit doar dac cele dou populaii au


abaterile standard egale (1 = 2). Se consider c aceast
supoziie este satisfcut dac s1 = s2.

50

Testul scorurilor t pentru diferena


dintre dou medii aritmetice


Pentru a verifica ipoteza c metoda M1 de predare a


matematicii conduce la rezultate mai bune dect metoda M2, un
cercettor alctuiete dou eantioane aleatorii, unul de 12
elevi, repartizai ntr-o clas n care matematica se pred dup
metoda M1, i unul de 13 elevi, repartizai ntr-o clas n care
matematica se pred dup metoda M2. Dup un an, ambele
eantioane primesc acelai test la matematic. Nota medie
obinut de elevii din primul eantion este 8,80 cu s = 1,70 i
nota medie obinut de elevii din cel de-al doilea eantion este
8,20 cu s = 1,20.

51

Testul scorurilor t pentru diferena


dintre dou medii aritmetice
Pasul 1. Enunarea ipotezelor

H0 : 1 = 2
Ha: 1 > 2
Pasul 2. Selectarea distribuiei de eantionare i stabilirea zonei critice
Distribuia de eantionare = Distribuia t
= 0,05 (test unilateral dreapta)
gl = 12 + 13 2 = 23
t (critic) = +1,714
Pasul 3. Calcularea statisticii testului

t =

X1 X 2

ns + n s

n1 + n2 2
2
1 1

2
2 2

n1 + n2
n1n2

8,80 8,20

12(1,70) + 13(1,20)
25

23
156
2

= +0,31

Pasul 4. Luarea deciziei


ntruct t(obinut) nu se afl n zona critic (+0,31 < +1,714), H0 nu poate
fi respins la un nivel de ncredere de 95%. Diferena dintre cele dou grupuri
nu este statistic semnificativ.
52

Testul scorurilor Z pentru diferena


dintre dou proporii



Acest test este aplicabil dac n1 > 30 i n2 > 30.


Formula de calcul pentru acest test este:
3. Z =

p1 p2
n1 + n2
P (1 P )
n1n2

unde

n1 p1 + n 2 p 2
4. P =
n1 + n 2

Cantitatea P*se numete estimarea combinat a proporiilor.


53

Testul scorurilor Z pentru diferena


dintre dou proporii


S presupunem c au fost alctuite dou eantioane


de studeni, unul de 83 de studeni de la
Universitatea A i cellalt de 103 studeni de la
Universitatea B, fiecare student fiind chestionat n
legtur cu problema interzicerii avorturilor i
clasificat ntr-una dintre categoriile: De acord,
mpotriv, Nedecis. Proporia studenilor care s-au
declarat de acord cu interzicerea avorturilor a fost de
0,34 n primul eantion (A) i de 0,25 n cel de-al
doilea (B). Exist o diferen semnificativ ntre
studenii celor dou universiti sub acest aspect?

54

Testul scorurilor Z pentru diferena


dintre dou proporii
Pasul 1. Enunarea ipotezelor

H0: P1 = P2
Ha: P1 P2
Pasul 2. Selectarea distribuiei de eantionare i stabilirea zonei critice
Distribuia de eantionare = Distribuia Z
= 0,05 (test bilateral)
Z/2 (critic) = 1,96
Pasul 3. Calcularea statisticii testului

n1 p1 + n 2 p 2 83(0,34) + 103(0,25) 28,22 + 25,75 53,97


=
=
=
= 0,29
83 + 103
186
186
n1 + n 2
p1 p 2
0,34 0,25
0,09
Z=
=
=
= +1,29
0
,
07
n + n2
83 + 103
0,29(1 0,29)
P (1 P ) 1
83 103
n1n2

P =

Pasul 4. Luarea deciziei


ntruct Z(obinut) nu se afl n zona critic (+1,29 < +1,96), H0 nu poate fi
respins. La un nivel de ncredere de 95% se poate spune c studenii de la cele dou
universiti nu difer semnificativ n privina acordului cu interzicerea avorturilor.

55

S-ar putea să vă placă și