Sunteți pe pagina 1din 39

CURSUL 5.

CAPITOLUL 7
PROBABILITI I DISTRIBUII DE PROBABILITATE

7.1 EFECTUL NTMPLRII N DENATURAREA REZULTATELOR OBINUTE

S presupunem c administraia unei universiti se gndete la posibilitatea trecerii de la
un sistem de evaluare semestrial la un sistem de evaluare trimestrial. n acest scop, pentru a
evalua reacia studenilor se procedeaz la realizarea unei anchete n care unui numr de 100 de
studeni li se cere prerea n aceast privin. Rezultatele obinute arat c 40% din studeni sunt
favorabili schimbrii iar 60% sunt mpotriva schimbrii. Se poate concluziona c 40% din
studenii universitii sunt favorabili schimbrii? Este foarte probabil ca procentele rezultate n
urma investigrii celor 100 de studeni s difere ntructva de procentele rezultate n urma
investigrii tuturor studenilor din universitate sau c, ansa (sau ntmplarea) a condus la
obinerea celor 40% de studeni favorabili schimbrii. Cnd ne referim la ans avem n vedere
posibilitatea ca n eantionul de 100 de studeni s fi fost mai muli studeni favorabili schimbrii
dect dac ar fi fost investigat ntreaga mas de studeni din universitate. Acest exemplu
ilustreaz urmtorul principiu fundamental: Factorii ans inereni n formarea eantioanelor
afecteaz ntotdeauna rezultatele eantioanelor.
Au fost dezvoltate o serie de tehnici i teorii legate de problemele de eantionare. n
esen, problema eantionrii urmrete s surprind ce caracteristici rmn dac variaia
datorat factorilor ntmpltori a fost eliminat. Cheia rezolvrii problemelor de inferen
statistic se gsete n rspunsul la ntrebarea: Ce fel de rezultate pot fi obinute n eantionul
format dac avem n vedere doar aciunea ntmplrii? Cnd eantioanele sunt formate ntr-o
modalitate care permite ntmplrii s opereze integral, tehnicile de inferen statistic pot sesiza
acest lucru. ntmplarea este de obicei tratat n termeni de probabilitate iar teoria care se ocup
de studiul ntmplrii i a efectelor ei poart numele de teoria probabilitii.

7.2 PROBABILITATE. STUDIUL NTMPLRII

Este relativ greu de vzut msura n care raionamentul probabilistic este implicat n viaa
de zi cu zi. Toi trim ntr-o lume a incertitudinii. Pentru a lua decizii bune trebuie s distingem
ntre evenimentele care se produc, cele care nu au anse de a se produce i cele care se gsesc
ntre (evenimente probabile). De exemplu, pori umbrela n dimineile n care cerul este acoperit
de nori i se prognozeaz ploaie, dar poi decide s nu o iei dac cerul dimineii nu arat
amenintor i sunt anse doar de 20% ca ploaia s nceap. Sau, te duci la coala de oferi doar
pe presupunerea c acolo l vei ntlni pe instructorul X. i exemplele pot continua. Ceea ce este
de reinut este faptul c toate deciziile implic estimri ale probabilitii producerii
evenimentelor. Aa cum putem constata, evalurile probabilitilor sunt subiective i conin ceva
mai mult dect o impresie general asupra felului n care ceva probabil se produce.
Construirea unei baze tiinifice a inferenei statistice cere (impune) tratarea
probabilitilor ntr-o manier precis i obiectiv.




7.3 DEFINIIA PROBABILITII

Deja avem fr ndoial o impresie asupra felului n care noiunea de probabilitate
lucreaz. De exemplu, care este probabilitatea ca aruncnd o dat o moned aceasta s pice pe
stem? Probabilitatea este de 50% pentru c sunt doar dou rezultate posibile care pot surveni
n urma aruncrii monedei, respectiv stem sau ban iar un astfel de rezultat nu este mai
probabil dect cellalt. Mai mult, suntem siguri c la o aruncare a monedei, stema sau banul
va aprea (probabilitate 1), dup cum suntem convini c ambele rezultate nu pot s apar
simultan (probabilitate 0). Dar s revenim la chestiunea a ceea ce nseamn probabilitatea ca un
eveniment particular s se produc. S presupunem c la un concurs, un sritor urmeaz s sar
n lungime, de nou ori. Rezultatele obinute sunt cele de mai jos:

Numr
sritur
Lungimea
sriturii
1 3,00
2 3,10
3 2,90
4 3,10
5 3,00
6 3,10
7 3,00
8 2,90
9 2,90

Probabilitatea ca un eveniment s se produc este dat de proporia cazurilor n care
evenimentul ateptat se produce ntr-o serie infinit de lung i identic de experimente. n cazul
de fa, se constat existena a trei tipuri de srituri - de evenimente - (de 2,9 m., 3m., 3,1m.),
fiecare nregistrndu-se de cte trei ori. Probabilitatea evenimentului sritur de 2,9 m. este de
33%, la fel ca i pentru evenimentele sritur de 3,1 m., respectiv sritur de 3 m.. Trebuie
reinut o concluzie important: Dac toate realizrile posibile sunt egal probabile,
probabilitatea de apariie a unui eveniment este egal cu proporia de apariie a evenimentului.
Exist o oarecare similaritate ntre acest exemplu i cel legat de aruncarea monedei.
S presupunem c la cursul de psihologie clinic sunt 100 de studeni i profesorul d
fiecruia un calificativ, rezultnd urmtoarea situaie statistic.

Calificativ Numr
de
studeni
Frecvena relativ
f. bine 20 20%
bine 30 30%
satisfctor 30 30%
nesatisfctor 20 20%

Problema care se pune este de a gsi probabilitatea ca alegnd la ntmplare un student din cei
100, acesta s fie un student cu calificativul foarte bine. n termenii definiiei de mai sus,
problema se poate reformula astfel: n ce procent ne putem atepta s selectm un student cu
calificativul foarte bine din irul de 100 de studeni examinai, dac selectm un student la
ntmplare, l reaezm la locul lui, selectm un altul, l reaezm .a.m.d.. Rspunsul este de
20/100=20%.

7.4 DISTRIBUII DE PROBABILITATE

Distribuia frecvenelor relative poate fi considerat ca distribuie de probabilitate.
Fiecare distribuie arat toate realizrile posibile i evenimentele la care sunt asociate realizrile.
Folosind exemplul de mai sus, frecvenele relative ne permit s stabilim probabilitile de
selecie aleatoare a unui student cu un anumit calificativ. Atta timp ct se cunoate distribuia de
probabilitate sau o distribuie de probabilitate apropiat este uor de rspuns la orice ntrebare
legat de probabilitate.
Abilitatea de a face inferene statistice are la baz cunotine legate de distribuia de
probabilitate apropiat situaiei analizate.
Revenind la exemplul cu aruncarea monedei, care este probabilitatea ca n urma aruncrii
acesteia de patru ori s cad numai ban, o singur dat stema, de dou ori stema, de trei ori
stema sau de patru ori stema? Nu este nevoie s repetm aruncarea de patru ori ntr-o
infinitate de experimente pentru a rspunde la aceste ntrebri. ntruct se lucreaz cu o variabil
dihotomic (ban sau stem), pentru a rspunde la ntrebare se face apel la dezvoltarea
binomial. Aplicat situaiei aruncrii monedei de patru ori, cunoscndu-se probabilitatea de
apariie a banului de 50% i a stemei de 50%, dezvoltarea identific probabiliti teoretice
care n cazul de fa sunt:

Evenimentul
Numr de steme
Frecvene absolute Frecvene
relative
0 1 0,0625
1 4 0,25
2 6 0,375
3 4 0,25
4 1 0,0625
Total 16

Coloana 1 din tabel arat c sunt posibile cinci evenimente asociate aruncrii monedei de patru
ori. Astfel se pot obine 0 steme, 1 stem, 2 steme, 3 steme sau 4 steme. Coloana 2 de frecvene
absolute indic numrul de realizri asociate evenimentului particular. Distribuia celor 16
realizri de-a lungul celor cinci evenimente arat c unele evenimente sunt mai probabile dect
altele. De exemplu exist o singur modalitate de a nu obine nici o stem i anume situaia n
care n toate cele patru aruncri rezult numai ban. Cu alte cuvinte, repetnd experimentul de
aruncare a monedei de patru ori, ne putem atepta s obinem numai ban n 6% din cazuri.
Opus este situaia n care se dorete s se afle probabilitatea de apariie a unui numr de dou
steme, situaie n care identificm ase cazuri posibile. Notnd cu s evenimentul stem i cu
b evenimentul ban, situaia numr de cazuri, n sensul celor menionate poate fi redat
grafic astfel:





p=37,5%
6/16
p=25% sbbs p=25%
4/16 sbsb 4/16
sbbb bsbs bsss
p=6,25% bsbb bbss sbss p=6,25
1/16 bbsb bssb ssbs 1/16
bbbb bbbs ssbb sssb ssss
0 1 2 3 4

Probabilitatea de apariie a unui eveniment sau a altuia se obine prin adunarea
probabilitilor individuale.
n exemplul de mai sus, P
0steme sau 4steme
=0,0625+0,0625=0,125 sau, probabilitatea de
obinere a cel puin trei steme este egal cu P
3steme
+P
4steme
=25%+6,25%=31,25%, sau,
probabilitatea de a obine cel mult o stem este egal cu P
0steme
+P
1stem
=31,25%.
Dac vorbim de producerea evenimentului i i a evenimentului j i a evenimentului k
.a.m.d. atunci calcularea probabilitii de realizare necesit nmulirea probabilitilor. S
admitem c se administreaz unor studeni un test cuprinznd cinci itemi, fiecare item avnd
patru opiuni de rspuns. Dorim s aflm probabilitatea ca un student total nepregtit s
ghiceasc ntmpltor rspunsul corect la toi cei cinci itemi. Probabilitatea unui rspuns corect
pe item este de 25% (1/4). Atunci probabilitatea de a da rspuns corect pe itemii 1, 2, 3, 4 i 5
este de 0,25 0,25 0,25 0,25=0,004. ntr-adevr improbabil! Aceasta nseamn c studentul n
cauz poate da rspuns corect la toi cei cinci itemi n numai 4 teste din 1000 administrate!

7.5 CURBA NORMAL CA DISTRIBUIE DE PROBABILITATE

Curba normal poate fi privit ca o distribuie teoretic de probabilitate. Aa cum am
vzut, curba normal este un model matematic care specific relaia dintre suprafa i unitile
de deviaie standard. Frecvenele relative ale curbei normale ca i cele ale dezvoltrii binomiale
sunt valori teoretice obinute prin aplicarea legilor probabilitii. Dac o distribuie de frecvene
poate fi aproximat fidel printr-o curb normal, atunci proporia cazurilor ntlnite ntre dou
valori (scoruri) poate fi determinat folosind anexa A. Mai mult, aa cum o frecven teoretic
este echivalent unei probabiliti obinute din tabelul valorilor teoretice, tot aa putem privi
curba normal ca o distribuie teoretic de probabilitate. n situaiile de mai jos vom explica cum
poate fi utilizat curba normal pentru a rspunde ntrebrilor care se pot pune n legtur cu
probabilitile evenimentelor.

PROBLEMA 1

S presupunem c avem o distribuie normal de medie 100 i abatere standard de 15.
Care este probabilitatea de selecie aleatoare a unui scor mai mare sau egal cu 115?

Calculm cota z:
00 , 1
15
100 115
+ =

=
s
x x
z
n anexa A cutm corespunztor cotei z=1,00 valoarea asociat din coloana a treia i
gsim c aceasta este de 0,1587. Deci, probabilitatea selectrii unui scor mai mare sau egal cu
115 este de 15,87%. Reprezentarea grafic corespunztoare acestei situaii este cea de mai jos:



Fig. 7.1 Distribuia normal a scorurilor pentru 100 x = i s 15 = . Probabilitatea de selecie
aleatoare a unui scor mai mare sau egal cu 115.

PROBLEMA 2

Care este probabilitatea de selecie aleatoare a unui scor mai mic sau egal cu 91?
Cota z corespunztoare este:
6 , 0
15
100 91
=

= z
Se caut valoarea corespunztoare cotei 6 , 0 = z n coloana a treia a anexei A i gsim
valoarea de 0,2743. Deci probabilitatea de selecie aleatoare a unui scor mai mic sau egal cu 91
este de 27,43%.



Fig. 7.2 Probabilitatea de selecie aleatoare a unui scor mai mic sau egal cu 91.
PROBLEMA 3

Care este probabilitatea de selecie aleatoare a scorurilor situate la o distan mai mare de
dou abateri standard de medie pentru o distribuie N( 15 s , 100 = = x )?

Cutm valorile corespunztoare n coloana a treia a anexei A i gsim c probabilitatea cutat
este de 0,0456 0,0228 0,0228 = + sau de 4,56%.



Fig. 7.3 Probabilitatea de selecie aleatoare a scorurilor situate la o distan mai mare de
dou abateri standard fa de medie.





















CAPITOLUL 8
DISTRIBUIILE DE SELECIE

Un eantion aleator poate fi gndit n termeni generali ca unul pentru care ansa face
selecia. Scala Stanford-Binet, dup cum se tie, este normat avnd media de 100 i abaterea
standard de 16. Astfel, un IQ de 116 pentru o vrst de 10 ani reprezint o deviaie standard
deasupra mediei n distribuia tuturor scorurilor IQ corespunztoare vrstei de 10 ani.
S presupunem c am selectat aleator un eantion de volum n=64 din populaia naional
a scorurilor IQ pentru 10 ani i calculm media. Reaezm eantionul n populaie i selectm
aleator un al doilea eantion de acelai volum pentru care calculm media. Repetm
experimentul de mai multe ori. Mediile eantioanelor vor diferi de media scorurilor din scala
Stanford-Binet. ntruct fiecare eantion din populaia naional a fost selectat aleator, ne
ateptm ca cele mai multe medii ale eantioanelor s fie foarte apropiate de 100. ns anumite
medii rezultate ca urmare a variaiei de selecie se pot situa departe de media 100 (mai sus sau
mai jos). Se pune ntrebarea la ce medii de eantion ne putem atepta dac procesul de selecie
continu? Care este probabilitatea de obinere a unei medii IQ de eantion mai mari sau egale cu
110? Dar a unei medii mai mici sau egale cu 90? Dar a unei medii situate ntre 95 i 105?
Rspunsurile la aceste ntrebri constituie chei n evaluarea variaiei de selecie cnd se fac
inferene asupra unui grup mai mare, pornind de la datele pariale ale grupului.

8.1 EANTIOANE I POPULAII

Numim populaie mulimea indivizilor care au n comun cel puin o caracteristic. Un
eantion este o submulime a populaiei. Pentru scorurile statistice, eantioanele i populaiile in
de resortul observaiilor. Dac ne preocup evaluarea inteligenei se are n vedere eantionul i
populaia din care a fost selectat eantionul. Mai mult, populaia nu se refer n mod necesar la o
ntreag ar, jude, sau ora. O populaie simpl se refer la orice grup despre care dorim s
facem inferene, nu conteaz ct de mare sau ct de mic este. De asemenea, o populaie poate
reflecta o mulime teoretic de observaii. ntrebarea care se pune este de ce totui avem nevoie
de eantion? Rspunsul este c n multe cazuri este prea scump sau chiar imposibil de colectat
fiecare observaie din ntreaga populaie.

8.2 PARAMETRII I STATISTICI

O statistic sintetizeaz o caracteristic a unui eantion. Un parametru sintetizeaz o
caracteristic a unei populaii. Dac de exemplu 34% din studenii unei faculti n numr de
1000 sunt favorabili trecerii sistemului de evaluare de la note la calificative, acest fapt ne relev
o statistic care rezum caracteristica unui eantion, i anume, cum au reacionat cei 1000 de
studeni la ideea schimbrii sistemului de evaluare. Statistica este utilizat ca indicator al
parametrului corespondent procentul tuturor studenilor favorabili schimbrii.
Statisticile i parametri se noteaz folosind diverse simboluri. De exemplu, x
simbolizeaz statistica media eantionului , parametrul corespondent, media populaiei se
reprezint prin simbolul grecesc , s reprezint abaterea standard a eantionului, o
abaterea standard a populaiei, r valoarea coeficientului de corelaie n eantion iar
valoarea coeficientului de corelaie n populaie. Relaia dintre aceste simboluri este cea redat
mai jos:



8.3 MODELUL SELECIEI ALEATOARE

Modelul seleciei aleatoare este folosit pentru a evalua influena factorilor ntmplrii
atunci cnd rezultatele eantioanelor sunt supuse interpretrii. Trebuie s ne asigurm c
eantionul a fost selectat aleator dintr-o anumit populaie de interes. Eantionul este studiat n
detaliu, i pe baza statisticilor i a ceea ce tim despre modul n care ntmplarea afecteaz
eantioanele aleatorii putem face inferene despre caracteristicile populaiei.
Un eantion aleator este un eantion obinut dintr-o populaie n aa fel nct fiecare
eantion posibil de mrimea specificat s aib aceeai ans de a fi extras.

8.3.1 REPARTIIA (DISTRIBUIA) DE SELECIE A MEDIILOR

Se pune ntrebarea des formulat n statistica inferenial: ce rezultate probabile se pot
obine n selecia aleatoare ca efect al implicrii factorilor ntmpltori? Revenim la scorurile IQ
Stanford-Binet pentru care media este de 100 i abaterea standard de 16.
S presupunem c la primul eantion aleator de mrime n=64 nregistrm o medie a
scorurilor 7 , 103 1 = x . La al doilea eantion de aceeai mrime nregistrm o medie 100 2 = x .
Pentru al treilea eantion 11 , 100 3 = x i procesul se poate continua la infinit.
Putem obine repartiia de selecie a mediilor dac pentru mediile eantioanelor se
calculeaz frecvenele relative corespunztoare. O repartiie de selecie a mediilor este o
distribuie de probabilitate. n esen, este vorba de distribuia de frecvene relative ale mediilor
obinute de la un numr nelimitat de serii de experimente de selecie, fiecare experiment,
constnd din extragerea unui eantion dintr-o anumit populaie. Mai jos este prezentat intuitiv
modul de formare a repartiiei de selecie a mediilor.



Fig. 8.1 Formarea repartiiei de selecie a mediilor.

Aa cum se poate observa din figur, repartiia de selecie a mediilor urmeaz o
distribuie normal, cu mediile distribuite n jurul mediei populaiei (=100). Este evident c
suntem n imposibilitatea de a construi distribuia din figura de mai sus datorit numrului infinit
de experimente de selecie care sunt necesare acestui demers. Din fericire, matematicienii au fost
capabili s obin caracteristicile definitorii ale distribuiei (media, abaterea standard i forma) i
s spun ce se ntmpl dac se realizeaz un ir infinit de experimente de selecie aleatoare.

8.3.2 CARACTERISTICILE REPARTIIEI DE SELECIE A MEDIILOR

Orice repartiie de selecie a mediilor este complet definit prin caracteristicile sale:
media, abaterea standard i forma.


8.3.2.1 MEDIA REPARTIIEI DE SELECIE A MEDIILOR

Simbolizat prin
x
, media repartiiei de selecie a mediilor este egal cu media
populaiei scorurilor, adic =
x
. Intuim c prin efectul ntmplrii, anumite medii de eantion
se vor situa deasupra mediei populaiei i vor echilibra mediile inferioare mediei populaiei.

8.3.2.2 ABATEREA STANDARD A REPARTIIEI DE SELECIE A MEDIILOR

Abaterea standard a mediei ntr-o repartiie de selecie este cunoscut sub numele de
eroarea standard a mediei i reflect mrimea variaiei dintre mediile eantioanelor. Eroarea
standard a mediei se calculeaz din relaia:

n
x
o
o =

Pentru exemplul de mai sus unde o=16 i n=64, eroarea standard a mediei este:

2
64
16
= = =
n
x
o
o
Efectele mrimii eantioanelor asupra repartiiei de selecie a mediilor sunt redate grafic n figura
de mai jos.



Fig. 8.2 Distribuia scorurilor populaiei i distribuiile de selecie ale mediilor pentru
eantioane de volum 3 i 9.

8.3.2.3 FORMA REPARTIIEI DE SELECIE A MEDIILOR

Dac populaia observaiilor este distribuit normal, repartiia de selecie a mediilor va fi
de asemenea distribuit normal. Ce se ntmpl ns dac distribuia populaiei nu urmeaz legea
normal? Pentru aceast situaie folosim urmtorul rezultat:

TEOREMA LIMIT CENTRAL

Repartiia de selecie a mediilor tinde ctre forma normal dac mrimea eantioanelor
crete, indiferent de forma distribuiei populaiei de la care eantioanele au fost selectate
aleator.

Cum lucreaz mai exact aceast mrime? Teoria statistic spune c o mrime a eantionului de
n=25, ..,n=30 pare suficient. n figura 8.3 este ilustrat tendina repartiiei de selecie a mediilor
de a se apropia de normalitate cnd n crete.

Distribuia scorurilor
populaiei de medie
i abatere standard o
Repartiia de selecie a
mediilor pentru eantioane
de volum 3.

Repartiia de selecie
a mediilor pentru
eantioane de volum 9.


Fig. 8.3 Teorema limit central. Efectele mrimii eantioanelor n reproducerea
normalitii repartiiilor de selecie a mediilor.

Aa cum se poate constata exist dou populaii de scoruri; una dreptunghiular i cealalt
pozitiv asimetric.
Constatm c pentru diferite volume ale eantioanelor, formele distribuiilor rezultate
difer de distribuiile originale ale scorurilor. Folosind teorema limit central, curba normal
poate fi utilizat la aproximarea repartiiei de selecie a mediilor ntr-o mare varietate de situaii
practice.

8.4 UTILIZAREA REPARTIIEI DE SELECIE A MEDIILOR LA DETERMINAREA
PROBABILITILOR; TIPURI DE PROBLEME

PROBLEMA 1

Care este probabilitatea de obinere a unui scor IQ mediu de eantion mai mare sau egal
cu 105?
Se tie c probabilitatea unui eveniment este egal cu proporia tuturor realizrilor
posibile care favorizeaz producerea evenimentului. ntrebarea de mai sus poate fi reformulat
astfel: Care este proporia tuturor eantioanelor de volum 64 (de exemplu) care au medii mai
mari sau egale cu 105? Presupunnd c distribuia este caracterizat prin parametrii 100 =
x

i 2 =
x
o , situaia grafic pe care o reclam problema este cea prezentat 8.4.

Populaia scorurilor
Repartiia de selecie
a mediilor cnd mrimea
eantioanelor =3
Repartiia de selecie a
mediilor cnd mrimea
eantioanelor =40


Fig. 8.4 Proporia eantioanelor care nregistreaz medii mai mari sau egale cu 105.

Paii necesari pentru a rspunde problemei sunt:

- Calculul erorii standard a mediei

2
8
16
64
16
= = = =
n
x
o
o

- ntruct se utilizeaz curba normal la aproximarea repartiiei de selecie a mediilor,
trebuie stabilit poziia mediei eantionului (=105). ntr-o repartiie de selecie a mediilor,
media eantionului este scorul, media populaiei este media iar eroarea standard a mediei
este abaterea standard. Deci, pentru media eantionului, scorul z se determin din relaia:

x
x
z
o

=
adic

5 , 2
2
100 105
+ =

=
x
x
z
o



Prin urmare, mediile eantioanelor mai mari de 105 vor avea scoruri z mai mari de 2,5.
Din coloana a treia a anexei A se gsete c proporia eantioanelor care nregistreaz medii mai
mari sau egale cu 105 este de 0,62%.

PROBLEMA 2

Care este probabilitatea de obinere a mediilor scorurilor IQ (corespunztoare
eantioanelor formate) care difer de media populaiei (=100) prin cel puin 5 puncte?

Pentru un scor IQ de 105, scorul z corespunztor este de +2,5 (dac 2 =
x
o ) iar proporia
eantioanelor care nregistreaz scoruri mai mari sau egale cu 105 este de 0,62%.



Fig. 8.5 Determinarea proporiei eantioanelor care nregistreaz medii ce se abat de la
media populaiei prin cel puin 5 puncte.

Solicitarea problemei impune s se aib n vedere i zona eantioanelor care nregistreaz medii
mai mici sau egale cu 95. Avnd n vedere simetria curbei normale, probabilitatea de obinere a
mediilor corespunztoare care difer de media populaiei prin cel puin 5 puncte este de
0,62%+0,62%=1,24%.

PROBLEMA 3
Ce medie de eantion se poate obine n aa fel nct probabilitatea de selecie aleatoare a
uneia mai mari sau egale cu aceasta s fie de 0,05? Se cunoate c 100 =
x
i 2 =
x
o .
Procedura este acum inversat n sensul c se tie de probabilitatea de selecie aleatoare i
trebuie determinat media eantionului. Din anexa A identificm scorul z dincolo de care aria
curbei normale este de 5% din aria total. Este vorba de scorul 65 , 1 = z .
Presupunnd c exist interes doar pentru partea dreapt a distribuiei, semnul scorului z
este pozitiv. Media eantionului trebuie s se situeze la 1,65 abateri standard deasupra mediei
populaiei. Relaia de calcul a mediei corespunztoare eantionului are n vedere relaia
menionat mai sus:

x
x
z
o

=
de unde ( ) 3 , 103 2 65 , 1 100 = + = + =
x
z x o .



Fig. 8.6 Determinarea proporiei eantioanelor care nregistreaz medii mai mari sau egale
cu 103,3.

Concluzia este c printr-o selecie aleatoare nelimitat (a eantioanelor de volum 64) ne
ateptm ca 5% din mediile eantioanelor s fie mai mari sau egale cu 103,3.


PROBLEMA 4

ntre ce limite ntlnim 95% din mediile eantioanelor?

Dac 95% din mediile eantioanelor se situeaz n zona central, rezult c celelalte 5%
trebuie s se distribuie n mod egal n celelalte dou zone (proxime zonei de 95%).



Fig. 8.7 Delimitarea zonei n interiorul creia se nregistreaz 95% din mediile
eantioanelor.

n anexa A, trebuie gsite z-turile corespunztoare dincolo de care 5% din eantioane
nregistreaz medii mai mari i mai mici dect mediile corespunztoare identificate. Acestea sunt
96 , 1 = z . n continuare, pentru determinarea celor dou limite ale mediilor ne folosim de
relaia:

x
x
z
o

=

deci: limita inferioar 08 , 96 2 96 , 1 100 = = i x
limita superioar 92 , 103 2 96 , 1 100 = + = s x

Concluzia este c 95% din medii vor fi cuprinse ntre 96,08 i 103,2.

8.5 IMPORTANA MRIMII EANTIONULUI

n exemplul de mai sus, 95% din mediile eantioanelor sunt plasate ntr-un interval de 8
puncte n jurul mediei populaiei. Folosindu-ne de relaia
n
x
o
o = , intervalul n interiorul cruia
se gsesc 95% din mediile eantioanelor posibile va fi cu att mai mare cu ct volumul
eantionului este mai mic. De exemplu, pentru n=16 eroarea standard a mediei este mai mare:

4
4
16
16
16
= = = =
n
x
o
o

i prin urmare, limitele n care sunt cuprinse 95% din medii vor fi:

16 , 92 84 , 7 100 4 96 , 1 100 = = = i x
84 , 107 84 , 7 100 4 96 , 1 100 = + = + = s x

Din motive uor de neles numim acest interval, interval de ncredere pentru media
populaiei. Pentru diferite mrimi ale eantionului sunt prezentate mai jos limitele intervalelor de
ncredere pentru media populaiei, limite estimate cu o cot de risc de 5%



N

x
o
Limitele ntre
care se ntlnesc
95% din medii
4 8 84,32 115,68
9 5,(3) 89,546 110,453
16 4 92,16 107,84
25 3,2 93,684 106,315
49 2,28 95,53 104,46
64 2 96,08 103,92
81 1,(7) 96,51 103,48
100 1,6 96,86 103,14
121 1,45 97,15 102,84
169 1,23 97,58 102,41
256 1 98,04 101,96

Urmrind variaia intervalelor de ncredere ca urmare a variaiei volumului de eantion, rezult
un principiu important utilizat n inferena statistic: creterea volumului eantionului conduce la
creterea acurateei n estimarea parametrilor populaiei.











CAPITOLUL 9
TESTAREA IPOTEZELOR STATISTICE

Dac n capitolul anterior au fost expuse principalele aspecte ale teoriei seleciei, n acest
capitol vom trata modalitatea de aplicare a teoriei n testarea ipotezelor statistice. Este foarte
important felul n care se formuleaz o problem de testare a ipotezelor. Prezentm n continuare
un exemplu.
n ara noastr, nvmntul la distan a devenit nvmnt de mas. Studiind situaiile
rezultatelor la examenul de licen ne-am putea ntreba dac ar trebui ceva schimbat n politica
acestui tip de nvmnt. n msura n care rezultatele obinute la examenul de licen de ctre
studenii de la ID nu difer semnificativ de cele obinute de studenii care urmeaz cursurile n
mod regulat, acest fapt ar putea fi de natur s acrediteze ideea c exigenele la cele dou tipuri
de nvmnt nu difer i prin urmare ne putem atepta la aceeai reuit a absolvenilor celor
dou forme de nvmnt pe piaa muncii. Dac da, atunci raionamentul imediat ne-ar putea
duce la concluzia c scopul nvmntului la distan nu este unul de a oferi anse egale n
reuita pe piaa muncii, urmrindu-se cu totul alte finaliti.
S presupunem c media naional de absolvire la examenul de licen este de 7,5.
Emitem ipoteza c i media absolvenilor nvmntului la distan (ID) este de 7,5. Pot rezulta
dou situaii posibile: acceptarea ipotezei lansate sau respingerea ei.

9.1 IPOTEZELE STATISTICE

Ipoteza nul notat cu H
0
susine c toate msurtorile pe care dorim s le comparm
sunt egale iar eventualele diferene se datoreaz exclusiv ntmplrii. Este ipoteza care se
testeaz statistic. n funcie de rezultatul testrii se ia decizia de acceptare sau respingere a ei.
Pentru exemplul de mai sus, ipoteza nul este H
0
: =7,5.
Ipoteza alternativ notat cu H
1
. n situaia n care ipoteza este acceptat, decizia susine
faptul c variaia fenomenului studiat nu se datoreaz doar ntmplrii ci i unor factori
manipulai. Cu alte cuvinte, diferenele constatate sunt att de mari nct nu pot fi explicate
integral doar prin efectul ntmplrii. Pentru exemplul dat, ipoteza alternativ se scrie: H
1
:7,5.
Exist o anumit legtur ntre acceptarea sau respingerea ipotezei nule i riscul de eroare
(pragul de semnificaie) asumat de cercettor n luarea deciziei. n statistic riscul de eroare se
fixeaz de obicei la 5%.
Aa cum se poate constata, ambele ipoteze se refer la populaie i parametru i nu la
eantioane i statistic. Prin urmare n ambele ipoteze se menioneaz parametrul populaiei .
S presupunem c am selectat aleator un eantion de 100 studeni care urmeaz cursurile
ID. Parametrii rezultatelor naionale la examenul de licen sunt: 5 , 7 = i 7 , 1 = o . Media
rezultatelor pentru cei 100 studeni investigai este de 6,3. Ct de probabil este media acestui
eantion dac n realitate media populaiei este de 7,5? Altfel spus, dac eantioane repetate de
100 studeni sunt selectate aleator din populaia naional n care media absolvirii este de 7.5,
ne ntrebm care sunt proporiile mediilor care se abat de la media naional?
Pentru a rspunde la aceast ntrebare avem nevoie s determinm poziia relativ a
mediei eantionului ntre toate mediile eantioanelor posibile dac ipoteza H
0
este adevrat.
Cum 1, 7 o = putem determina uor eroarea standard a mediei
x
o . Pentru distribuia de selecie
se gsete:

17 , 0
10
7 , 1
100
7 , 1
= = = =
n
x
o
o

n continuare, convertim media eantionului de 6,3 n scor z.

059 , 7
17 , 0
2 , 1
17 , 0
5 , 7 3 , 6
0
=

=
x
x
z
o



Numrtorul fraciei ne arat c media eantionului de 6,3 se situeaz la 1,2 puncte sub
media ateptat a tuturor mediilor eantioanelor posibile iar aceste 1,2 puncte sunt echivalente cu
7,059 erori standard. Avnd determinat cota z, putem localiza poziia mediei eantionului n
distribuia de selecie i mai mult, putem evalua probabilitatea asociat valorii z calculate.
Cunoscnd probabilitatea asociat mediei de 6,3 se pune ntrebarea dac aceasta are
vreun efect n ceea ce privete ipoteza H
0
. O medie de eantion care se abate la fel de mult ca
media eantionului de 6,3 este extrem de puin probabil. ntr-adevr, avnd un numr infinit
de mare de eantioane obinute din populaia pentru care media naional este de 7.5, un procent
extrem de mic din mediile eantioanelor se vor abate mai mult sau la fel de mult ca media de 6,3.
Poate fi aceasta o sugestie c H
0
este fals? Pentru a da un rspuns la aceast ntrebare avem
nevoie n sensul celor enunate mai sus de o cot de risc cu care vom lua decizia. n esen, cota
arat ct de rare trebuie s fie rezultatele eantioanelor pentru a susine respingerea ipotezei
nule. S presupunem c se alege o cot de risc de 5%.



Fig. 9.1 Regiunile de respingere pentru testul bilateral la valoarea critic 05 , 0 = o .

Media eantionului de 6,3 se plaseaz n afara regiunii de acceptare (7,50,171,96). Decizia
statistic se formuleaz n termenii respingerii ipotezei nule. Concluzia este c rezultatele
obinute de absolvenii formei de nvmnt ID difer semnificativ de media naional,
concluzie susinut la o cot de risc de 5%.

9.2 NIVELUL DE SEMNIFICAIE I EROAREA DECIZIEI

Decizia de acceptare sau respingere a ipotezei nule depinde de criteriul de raritate a
apariiei i de faptul c nivelurile de semnificaie de 0,05 i 0,01 sunt valori comune n aceast
privin. ntr-un anumit sens aceste valori sunt arbitrare. Nivelul de semnificaie este de fapt
riscul cercettorului de a-i asuma luarea unei decizii n privina ipotezei nule. n figura de mai
jos se prezint comportarea unui test bilateral n condiiile unei cote de risc de 5%. Dac H
0
este
adevrat, acest lucru nseamn c 5% din mediile eantioanelor posibile vor conduce la
concluzia c H
0
este fals!



Fig. 9.2 Test bilateral pentru 05 , 0 = o . 5% din rezultate arat ca eronat decizia de
respingere a ipotezei H
0
cnd de fapt H
0
este adevrat.

Cnd stabilim 0.05 o = , ne asumm de fapt riscul ca 5% din rezultate s cad n zona de
respingere a ipotezei nule. Respingerea unei ipoteze nule adevrate este o eroare de decizie i,
exceptnd revelaia divin, nu avem nici o idee cnd o asemenea eroare se produce. Toate aceste
aspecte ne conduc la urmtoarea concluzie:
Nivelul de semnificaie d probabilitatea de respingere a lui H
0
cnd n realitate aceasta este
adevrat.
Pentru a reduce riscul lurii unei decizii eronate, cercettorul poate stabili la un nivel
mai sczut, de pild =0,01 sau 0,0001. S presupunem c am obinut un rezultat care se abate
att de mult de la medie nct probabilitatea de producere (apariie) este doar de p=0,002. n baza
acestui criteriu putem spune c valoarea obinut nu este suficient de rar nct s ne conduc la
respingerea lui H
0
(0,002 > 0,0001). De cele mai multe ori ns, admitem ipoteza nul chiar dac
intuim c decizia este fals. Deci coborrea lui crete probabilitatea de a face un alt gen de
eroare; acceptarea ipotezei nule cnd de fapt aceasta este fals. Nu este surprinztor faptul c
acest comportament decizional este cunoscut ca un alt tip de eroare. Putem rezuma formularea
acestei erori astfel: Reinerea unei ipoteze H
0
false.
Pentru a concretiza cele spuse ntr-un exemplu, s presupunem c ipoteza nul (H
0
:
=150) este testat bilateral la un nivel de semnificaie =0,05. Media eantionului extras este de
152. Este ns posibil ca media real a populaiei s fie de 154. n figura de mai jos, repartiia
trasat prin linia continu este repartiia de selecie corespunztoare mediei de 150.




Fig. 9.3 Ipoteza nul este fals dar x conduce la acceptarea ipotezei nule!

Repartiia corect este cea reprezentat punctat, avnd media de 154. n testarea ipotezei
nule pentru care =150, reprezentm media eantionului de 152 n repartiia desenat cu linie
ngroat. Relativ la aceast distribuie, valoarea 152 = x nu se abate att de mult nct s se
plaseze n zona de respingere a ipotezei H
0
. Vom fi deci n situaia acceptrii ipotezei nule. Dar
acceptarea este o decizie eronat. Putem constata c nivelurile (pragurile) de semnificaie =0,05
i =0,001 sunt ntr-un anume sens valori compromise. Aceste valori tind s ne dea asigurarea c
H
0
nu va fi respins cnd n realitate se respinge (primul tip de eroare) sau c ele nu sunt
suficient de mici s ridice probabilitatea de acceptare a ipotezei nule (al doilea tip de eroare).
Trebuie s fim contieni de faptul c n orice testare de ipotez nul nu putem ti dac a fost
fcut o eroare de decizie.




















Repartiia de
selecie adevrat
Repartiia de
selecie
150 :
0
= H

150 :
1
= H

05 , 0 = o



CAPITOLUL 10
ESTIMAREA STATISTIC

10.1 TESTAREA IPOTEZELOR VERSUS ESTIMAREA

Inferena statistic este procesul de extrapolare a rezultatelor nregistrate, de la nivelul
eantioanelor selectate la nivelul ntregii populaii (din care au fost selectate eantioanele). Pe
lng testarea ipotezelor statistice, inferena statistic are n vedere estimarea statistic. Am vzut
n paragraful anterior modul n care c am testat o medie de eantion pe ipoteza nul H
0
: =7,5.
Cum media eantionului a fost de 6,3 am respins ipoteza nul la pragul de semnificaie o=0,05.
ns ntrebrile nu sunt epuizate. Ne-am putea ntreba ct de mult s-ar putea abate media
eantionului de la media populaiei pentru a accepta ipoteza nul? Sau, ar putea fi valoarea de 7,6
o valoare plauzibil pentru media populaiei? Ce putem spune despre valorile 8, 8.5,.., .a.m.d.?
Ce estimri rezonabile am putea da pentru media populaiei? Cele mai multe din ntrebrile
statisticii pentru care testrile de ipoteze ar putea oferi soluii mulumitoare i gsesc rspuns i
prin tratarea estimrii. Totui, exist probleme pentru care testarea ipotezelor nu este indicat iar
singura abordare relevant rmne estimarea statistic.
S presupunem c directorul unei biblioteci universitare dorete s afle ct de muli bani
pe cap de student, n medie, sunt necesari pentru cumprarea cursurilor. Procedurile de estimare
sunt mult mai potrivite pentru a rspunde acestei ntrebri. S ncercm s ne gndim asupra
nelesului pe care l-ar putea avea formularea urmtoarelor ipoteze nule: H
0
: =50 sau H
0
:
=100 sau De fapt interesul directorului de bibliotec este mai mult unul de ordin explorator.
El dorete s estimeze media veniturilor studenilor, pornind de la rezultatele eantionului i nu
testarea unei valori specifice mediei veniturilor indicat de H
0
.

10.2 ESTIMAREA CARACTERISTICII VERSUS ESTIMAREA INTERVALULUI

Am vzut anterior c o statistic este o estimare a unui parametru ( x estimeaz ; s
estimeaz o ;
2
s estimeaz
2
o i r estimeaz ). Exist numeroase exemple din viaa
cotidian care solicit estimarea caracteristicilor. De exemplu, dac n urma unui sondaj de
opinie printre subiecii care s-au drogat rezult c 60% dintre acetia ar reveni la consumul de
droguri, de fapt, dispunem de o estimare a caracteristicii preferina celor care au consumat
droguri. O privire corect asupra unei estimri fcute trebuie s aib n vedere i alte aspecte,
cum ar fi cele datorate variaiei de selecie. Este de acum un fapt bine cunoscut n statistic c
eroarea de selecie genereaz eroare n estimarea caracteristicii. Dar ct de mult afecteaz eroarea
de selecie estimarea caracteristicii? Am vzut c media de 6,3 nu este o estimare a mediei
naionale i c, fr ndoial, aceasta se situeaz fie de o parte, fie de cealalt parte a mediei
populaiei.
n esen, un interval estimat este o plaj de valori n interiorul crora pot fi stabilite cu
ncredere rezonabil poziiile parametrilor populaiei. De exemplu, am putea spune c media
absolvenilor ID la examenul de licen se situeaz ntre 5,8 i 6,9.
Exist un raport de invers proporionalitate ntre mrimea intervalului estimat i riscul cu
care facem aceast estimare. Cu ct intervalul estimat este mai strns cu att i riscul pe care ni-l
asumm n a afirma c o caracteristic va lua valori n acest interval este mai mare.

10.3 ESTIMAREA INTERVALULUI DE NCREDERE PENTRU MEDIE

n distribuia normal a scorurilor individuale, 95% din observaii nu se situeaz la o
distan mai mare de 1,96 deviaii standard fa de medie. Sau, cu alte cuvinte media1,96
abateri standard cuprinde 95% din toate scorurile. Examinnd figura de mai jos, se constat c
media se poziioneaz n interiorul intervalului
x
X o 96 , 1 .




Fig. 10.1 Distribuia mediilor eantioanelor de volum n=100 extrase de la o populaie
pentru care 100 = i 20 = o .

n figura de mai jos sunt prezentate intervalele
x
X o 96 , 1 pentru fiecare din cele 10
posibile eantioane aleatoare de volum n=100, extrase din populaia ale crei caracteristici sunt
menionate n figura de mai sus.



Fig. 10.2 Intervalul
x
X o 96 , 1 pentru fiecare din cele 10 eantioane aleatoare de volum
n=100 extrase dintr-o populaia pentru care 100 = .

00 , 2
100
20
= =
x
o

Revenind la exemplul cu media de absolvire a examenului de licen se pune ntrebarea
care ar fi plaja de valori n interiorul creia se apreciaz cu o probabilitate de 95% c se gsete
media populaiei? Procedura este cea indicat mai jos.

Pasul I. Determinm eroarea standard a mediei (
x
o ):
... = =
n
x
o
o
Pasul II. Evalum relaia:
... 96 , 1 =
x
x o

Pasul III. Specificm limitele intervalului

... =
i
L ... =
s
L
Pentru o cot de risc de 1%, intervalul de ncredere corespunztor este
x
X o 58 , 2 . n
general, relaia pentru calcularea intervalului de ncredere al mediei, relaie corespunztoare unui
nivel de semnificaie
0
o o = este
x
z X o
o
.

10.4 ESTIMAREA INTERVALULUI DE NCREDERE I TESTAREA IPOTEZELOR

Estimarea intervalului de ncredere pentru medie i testarea ipotezelor statistice sunt dou
faete ale aceleiai probleme.
S presupunem c pentru un set particular de date statistice am aplicat un test bilateral
ipotezei nule H
0
: =
0
i am construit un interval de ncredere pentru medie cu o cot de risc de
5%. Dou lucruri interesante rezult din aceast practic:

1. dac media se situeaz n afara limitelor de ncredere ale intervalului pentru valoarea
specificat, atunci ipoteza nul se respinge.
2. dac media se situeaz n interiorul intervalului de ncredere pentru valoarea specificat,
ipoteza nul se accept.

S revenim nc o dat la exemplul cu media de licen a absolvenilor nvmntului la
distan. Ipoteza testat a fost H
0
: =7,5 cu ipoteza alternativ H
1
: 7,5. Media eantionului
studiat 6, 3 x = corespunde unui z statistic de -7.059, ceea ce conduce la respingerea ipotezei
nule. S comparm aceast decizie cu intervalul de ncredere de 95% pentru media absolvenilor
ID, respectiv6, 3 1, 96 0,17 . Observm c intervalul construit nu cuprinde media naional ceea
ce ne plaseaz n situaia primei observaii menionate mai sus.
















Fig. 10.3 Testarea ipotezelor statistice i estimarea intervalului de ncredere pentru
valoarea specificat; ipoteza nul H
0
: =7,5 este respins.

S presupunem acum c media naional nregistrat la examenul de licen este de 6,4. Ea
se regsete n intervalul de ncredere (5.96 ; 6.63) i prin urmare putem concluziona c este
o valoare rezonabil pentru media absolvenilor ID. Calculnd din nou cota z, obinem:
588 , 0
17 , 0
4 , 6 3 , 6
0
=

=
x
x
z
o


Cum -0,588>-1,96 ipoteza nul se accept, ceea ce ncadreaz acest caz n cea de-a doua
observaie menionat.






Fig. 10.4 Testarea ipotezei statistice i estimarea intervalului de ncredere pentru media
absolvenilor ID. Ipoteza nul H
0
: =6,4 este acceptat.
3 , 6 = x
059 , 7 = z
96 , 1
05 , 0
= z
valoare critic
96 , 1
05 , 0
+ = z
valoare critic

( ) 63 , 6 ; 96 , 5
96 , 1
=
=
x
X o

3 , 6 = x
588 , 0 = z
Ipoteza
0
H
se accept
6, 4 =
0,17
x
o =


CAPITOLUL 11
TESTAREA IPOTEZELOR STATISTICE PENTRU MEDIE CND
ABATEREA MEDIE PTRATIC ESTE NECUNOSCUT

11.1 ESTE RAREORI CUNOSCUT

n paragrafele anterioare au fost prezentate principalele aspecte referitoare la testarea
ipotezelor statistice i la estimare, lund n considerare o situaie ideal n care abaterea standard
a populaiei () este cunoscut. Situaia ideal menionat este nerealist pentru c n practic
este necunoscut, mai ales n cazul aspectelor comportamentale explorate de cercettori. n cazul
n care este necunoscut, procedurile pentru verificarea ipotezelor statistice se schimb, dar,
secvena de etape este similar situaiei cnd este cunoscut, respectiv:
- precizarea ipotezei nule, a celei alternative i stabilirea nivelului de semnificaie;
- construirea eantionului i calcularea statisticilor necesare;
- stabilirea cotei de risc pentru analiza statisticii testului;
- luarea deciziei referitoare la ipoteza nul.
S presupunem c n urma unei examinri la scar naional n care s-a urmrit motivaia
pentru studiu a studenilor, s-a constatat c n medie, studentul romn dedic zilnic 4 ore
pregtirii. Rectorul unei anumite universiti este interesat de a avea un punct de vedere
argumentat cu privire la motivarea studenilor din universitatea sa. n acest scop el gsete c
fiecare student aloc din timpul su 3,2 ore studiului (a se vedea tabelul de mai jos) i pornind de
la aceast constatare dorete s afle dac motivarea manifestat se abate sau nu de la motivarea
naional.

Student Numr de ore
dedicate studiului
X

X
2

1 3 9
2 5 25
3 2 4
4 1 1
5 4 16
6 6 36
7 3 9
8 3 9
9 1 1
10 4 16
n=10 x=32;
(x)
2
=1024
x
2
=126
Media eantionului
este de 3,2 ore


11.2 ESTIMAREA ERORII STANDARD A MEDIEI

Dac ar fi cunoscut, rectorul ar putea lua fr dificultate decizia cu privire la ipoteza nul,
folosind relaia:
x
x
z
o

0

=

Cum este necunoscut, rectorul nu poate calcula
|
|
.
|

\
|
=
n
x
o
o i din acest motiv nu poate
determina cota z corespunztoare. ns o estimare a lui poate fi utilizat pentru estimarea lui
x
o . Relaia:

( )
n
SS
n
x x
s =

=

2


unde SS este suma ptratelor abaterilor de la medie este o bun estimare a abaterii
standard a populaiei. ns n general, abaterea standard a populaiei se calculeaz din relaia:

( )
1
2

=

n
x x
s


Folosind datele exemplului prezentat mai sus, rezult:

( )
( )
6 , 23 4 , 102 126
10
1024
126
2
2
2
= = = = =


n
x
x x x SS
62 , 1
9
6 , 23
1
~ =

=
n
SS
s

Estimarea erorii standard a mediei este:

512 , 0
10
62 , 1
= = =
n
s
s
x



x
s ca eroare standard a mediei este abaterea standard estimat a tuturor mediilor
eantioanelor posibile de volum n=10, extrase aleator din populaie.

11.3 TESTUL STATISTIC t

Cnd nu este cunoscut, trebuie utilizat un alt test statistic iar acest test este testul t.
Relaia corespunztoare statisticii t este:

x
s
x
t
0

=

Folosind datele exemplului, obinem pentru t
calculat
valoarea:

563 , 1
512 , 0
4 2 , 3
0
=

=
x
s
x
t



Aa cum se poate constata, singura diferen n calcularea lui t i z este substituirea lui
x
o prin
x
s . Din acest punct de vedere, ambele formule (pentru z i t) sunt aproape similare n
sensul c fiecare reflect diferena dintre media eantionului ( x ) i valoarea mediei populaiei n
uniti de eroare standard a mediei (
x
s sau
x
o ). Putem constata c t folosete dou statistici ( x
i
x
s ) n timp ce z folosete o singur statistic ( x ). Aceste aspecte ne arat c repartiia de
selecie a lui t se abate semnificativ de la distribuia normal n cazul eantioanelor mici.
Distribuia (repartiia t) este cunoscut i sub numele de repartiia Student.
Calculul prezentat anterior arat c diferena dintre media eantionului de care dispune
rectorul i media populaiei este de 1,563 erori standard.

11.3.1 GRADE DE LIBERTATE

nainte de a continua discuia pe marginea distribuiei Student este nevoie s clarificm
problema gradelor de libertate.
Gradele de libertate (gdl) indic numrul de informaii independente dintr-un eantion. n
calcularea statisticii t trebuie utilizate informaiile provenite din eantion pentru evaluarea
estimrilor s i
x
s . Cte informaii independente poate furniza eantionul pentru acest scop?
Rspunsul l gsim n faptul c s i deci
x
s se bazeaz pe abaterile observaiilor de la media
eantionului.
S presupunem c avem un eantion constituit din trei observaii 3; 3 i 9. Media
eantionului este egal cu 5 iar deviaiile de la medie sunt 2; 2 i 4. Sunt aceste deviaii
independente ntre ele? Rspunsul este negativ pentru c suma lor trebuie s fie ntotdeauna
egal cu zero. Cu alte cuvinte, n msura n care cunoatem dou dintre abaterile scorurilor (2 i
2), a treia abatere trebuie s fie egal cu +4 pentru ca suma lor s fie nul. Rezult c ultima
abatere este ntotdeauna complet determinat de celelalte. n cazul nostru, din cele trei scoruri
doar dou sunt independente care sunt i gradele de libertate pe care ne bazm n estimarea lui s
i
x
s . Generaliznd, gradele de libertate disponibile ntr-un eantion de volum n sunt n numr de
n-1.

11.3.2 REPARTIIA DE SELECIA A LUI STUDENT

Cnd eantioanele aleatoare sunt de volum mare, s este un bun estimator a lui o ,
x
s
estimeaz bine pe
x
o i n consecin, t este apropiat de z. n acest caz, distribuia t va avea o
comportare foarte asemntoare cu distribuia normal. Pe de alt parte, cnd volumul
eantionului este mic, valoarea corespunztoare
x
s va diferi substanial de
x
o , deci i distribuia
lui t n raport cu distribuia normal. Fcnd legtura cu gradele de libertate, trebuie spus c pe
msur ce numrul gradelor de libertate scade, aplatizarea distribuiei t este mai pronunat (a se
urmri graficul de mai jos).



Fig. 11.1 Trei distribuii Student pentru 5, 11 i grade de libertate.

Pentru volume de eantion 200 > , distribuia t nu se deosebete practic de distribuia normal iar
pentru un volum nelimitat, distribuia t i distribuia normal sunt una i aceeai.

11.3.2.1 OBINEREA VALORILOR CRITICE PENTRU STATISTICA t
n anexa B este prezentat tabelat repartiia lui Student utilizat pentru obinerea valorilor
critice ale lui t. Tabelul cuprinde valorile critice dincolo de care se gsesc zonele de respingere
att n cazul unilateral ct i n cel bilateral. Prezentm mai jos o secven a acestui tabel,
corespunznd unui numr de 8 grade de libertate.


Grade de
libertate
BILATERAL
.50 .20 .10 .05 .02 .01
UNILATERAL
.25 .10 .05 .025 .01 .005
8 0,706 1,397 1,860 2,306 2,896 3,355

n figura de mai jos se poate constata c 2,5% din aria plasat sub distribuia lui Student se
afl dincolo de cota t=2,306 n cazul unilateral i 5% n cazul bilateral. Similar i pentru cota
t=3,355.

Fig. 11.2 Zonele critice ale repartiiei lui Student pentru un numr de 8 grade de libertate
(gdl=8).
gdl=5
gdl=11
gdl=

EXEMPLU

Presupunem c dorim s testm ipoteza nul H
0
: =7,3 versus ipoteza alternativ H
1
: 7,3
n condiiile n care media eantionului este 7.01 x = , volumul eantionului n=10, eroarea
standard estimat a mediei 1, 04
x
s = iar t
calculat
=-0,278. Cota de risc pentru luarea deciziei o
fixm la =0,05. n anexa B, valorile critice ale lui t pentru 9 grade de libertate sunt 2,262.
Aceste valori delimiteaz zonele de respingere de zona de acceptare (vezi figura de mai jos).



Fig. 11.3 Decizia asupra ipotezei nule H
0
bazat pe distribuia Student cu nou grade de
libertate.

Cum |t
calculat
|<t
critic
se accept ipoteza nul ceea ce nseamn c media eantionului ( 01 , 7 = x )
nu difer semnificativ de media populaiei (=7,3).

11.4 NIVELURILE DE SEMNIFICAIE VERSUS VALORILE PROBABILITII P

S admitem c ne aflm ntr-un demers de testare a ipotezei nule H
0
: =100 iar pentru un
eantion de 25 observaii obinem un t
calculat
de +2,00. Distribuia t pentru 24 grade de libertate
arat c un t de +2,00 este poziionat ntre valorile 1,711 i 2,064 (a se vedea figura de mai jos).



Fig. 11.4 Determinarea valorii P pentru un t
calculat
cnd gdl=24.

Prin urmare dac adoptm ipoteza alternativ H
1
: >100, valoarea probabilitii P se afl
undeva ntre 2,5% i 5%. Pentru ipoteza H
1
: 100 valoarea P se situeaz ntre 5% i 10%. Dac
un rezultat este semnificativ din punct de vedere statistic, valoarea P este plasat sub nivelul
reperelor de semnificaie (=0,05 sau 0,1) n timp ce dac rezultatul este nesemnificativ, P-ul se
plaseaz peste nivelul reperelor (a se vedea tabelul de mai jos).

VALOAREA P
Cercettorul consider c rezultatul este:

Valoarea P Semnificativ statistic Nesemnificativ statistic
.003 P<.05 sau P<.01 P>.001
.02 P<.05 P>.01
.08 P<.10 P>.05
.15 - P>.10 sau P>.05

Limbajul utilizat de anumii cercettori n descrierea rezultatelor poate fi confuz, tinznd
s estompeze distincia dintre valoarea P i nivelul de semnificaie. Spre exemplu putem ntlni
un cercettor care s afirme c primul set de rezultate a fost semnificativ la un nivel de .05, al
doilea set a fost semnificativ la un nivel de .001 iar pentru al treilea set, datele nu au fost
semnificative la un nivel de .10. nseamn oare acest lucru c =0,05 sau =0,10 au fost utilizate
pentru evaluarea celor trei seturi de rezultate? Aproape sigur nu, mai degrab aceasta este o
modalitate de raportare a celor trei valori P: P<.05 sau P<.001 i P>.10.

11.5 CONSTRUCIA UNUI INTERVAL DE NCREDERE PENTRU MEDIE CND
NU ESTE CUNOSCUT

Dac este cunoscut, intervalul de ncredere pentru medie se construiete folosind
formula
x
z X o
o
. Aceast relaie necesit dou modificri cnd nu este cunoscut; respectiv
x
s care substituie pe
x
o i
o
t

care substituie pe
o
z , aa nct relaia general pentru construirea
intervalului de ncredere al mediei devine
x
s t X
o
.

Exemplu:

Se cunosc urmtoarele date statistice: ; 7 = X 3 , 1 =
x
s ; 262 , 2 =
o
t . Media populaiei se
va gsi n intervalul 94 , 2 7 3 , 1 262 , 2 7 = =
x
s t X
o
la un prag de semnificaie 0, 05 o = .







CAPITOLUL 12
COMPARAREA MEDIILOR A DOU POPULAII N CAZUL
EANTIOANELOR INDEPENDENTE

12.1 DE LA O MEDIE LA DOU MEDII

Exist vreo deosebire ntre femei i brbai n ceea ce privete abilitile matematice?
Afieaz pacienii obsesiv - compulsivi simptome de febr atunci cnd primesc un medicament
experimental comparativ cu cei ce primesc un placebo? Aceste ntrebri i multe altele conduc la
cele mai importante modaliti de investigare statistic, constnd n studierea diferenei dintre
grupurile de observaii. n fiecare caz trebuie selectate dou eantioane iar aceste eantioane vor
face obiectul comparrii celor dou populaii corespunztoare. Demersul este oarecum n
contrast cu construirea ipotezelor pentru o singur populaie, folosind un eantion prelevat. Chiar
dac demersul pare oarecum schimbat (trecerea de la o medie la dou) logica general a testrii
ipotezelor statistice nu se schimb.
nainte de a ncepe compararea populaiilor, s clarificm ce nseamn faptul c
eantioanele sunt independente. Dou eantioane spunem c sunt independente dac nici una din
observaiile unui grup nu se afl n vreun raport cu observaiile celuilalt grup. n contrast cu
eantioanele independente exist eantioanele dependente asupra crora vom reveni mai trziu.
S presupunem c sunt selectate aleator dou grupuri de studeni pentru a fi supuse unui
test de memorie. Primului grup i se prezint elemente ajuttoare (relaii, poziii etc.) care
favorizeaz memorarea itemilor. Cel de-al doilea grup nu beneficiaz de o asemenea asisten.
Testul de memorie administrat const n memorarea unui numr de 50 de itemi pe o durat de
dou zile. Dup ce grupurilor li s-au prezentat itemii, la dou zile testul este reluat, de data
aceasta cu sarcina de a solicita membrilor celor dou grupuri reproducerea lor verbal sau scris.
Mediile itemilor memorai de cele dou grupuri sunt: 17 1 = x i 12 2 = x . n medie, primul grup
reine mai muli itemi dect al doilea. nseamn oare n mod necesar c diferena dintre cele dou
populaii ( 5 12 17 + = ) este o diferen adevrat ntre cele dou condiii n care s-a
desfurat experimentul, deci o diferen ntre mediile a dou populaii teoretice de observaii?
Dac da, atunci ar trebui s susinem concluzia c memoria este ajutat de stabilirea unor
relaii ntre itemi. Dac nu, putem fi siguri de acest lucru prin simpla inspectare a datelor pentru
care suntem convini c au fost afectate de variaia de selecie ntmpltoare. Pentru a determina
dac diferena dintre cele dou medii 2 1 x x este suficient de mare pentru a indica diferena
dintre
1 2
, vom folosi aceeai logic general ca i n cazul testrii ipotezelor statistice
referitoare la mediile populaiilor individuale.

12.2 IPOTEZELE STATISTICE
Folosind exemplul de mai sus, cele dou ipoteze statistice sunt:

H
0
:
1
-
2
=0
H
1
:
1
-
2
0

Cea de-a doua ipotez poate fi detaliat astfel:
H
1
:
1
-
2
>0 sugereaz un efect pozitiv al nelegerii relaiei dintre itemi.
H
1
:
1
-
2
<0 sugereaz un efect negativ al acumulrii de informaie suplimentar despre
itemi.

12.3 REPARTIIA DE SELECIE A DIFERENELOR DINTRE MEDII

Noiunea de repartiie de selecie a diferenelor dintre medii nu este diferit de repartiia
de selecie a mediilor. Vom admite c prezentarea relaiilor dintre itemi nu difereniaz cele dou
populaii (
1 2
0 = ) i repetm experimentul de mai multe ori. Reluarea experimentului de un
numr nelimitat de ori conduce la distribuia de selecie a diferenelor dintre medii, care
schematic este prezentat n figura de mai jos. Ceea ce trebuie reinut este faptul c distribuia de
selecie a diferenelor dintre medii este dat de distribuia frecvenelor relative a diferenelor
2 1 x x .



Fig. 12.1 Formarea repartiiei de selecie a diferenelor dintre medii.

12.3.1 PROPRIETILE REPARTIIEI DE SELECIE A DIFERENELOR DINTRE
MEDII

Distribuia de selecie a mediilor este definit prin medie, abatere standard i form.
Situaia este similar i n cazul distribuiei diferenelor dintre medii. Repartiia reprezentat mai
sus descrie diferenele ateptate dintre mediile eantioanelor dac ipoteza nul este adevrat.
Utilizarea lui
2 1 x x
ca simbol pentru distribuia de selecie a diferenelor 2 1 x x , impune ca
0
2 1
=
x x
.
Abaterea standard a diferenei dintre cele dou medii (
1 2
x x ) se calculeaz prin relaia:

2 2
2 1 2 1 x x x x
o o o + =



Expresia de mai sus, care se aplic doar la eantioanele independente, arat c abaterea standard
depinde de eroarea standard a fiecrei medii de eantion. Dar
n
x
o
o = , i, ridicnd la ptrat,
obinem
n
x
2
2
o
o = . Prin urmare relaia de calcul pentru
1 2
x x
o

poate fi scris n termeni de
dispersii astfel:

1 2
2 2
1 2
1 2
x x
n n
o o
o

= +

12.4 ESTIMAREA
1 2 x x
o



Sunt rare situaiile n care este cunoscut. n consecin trebuie calculat o estimare
pentru eroarea standard (
x
s ) a mediei. Chiar dac sunt implicate dou eantioane, necesitatea
estimrii erorii standard rmne actual. O important presupunere pe care o facem n demersul
de estimare este aceea c dispersiile populaiilor sunt egale (
2 2
1 2
o o = ). O extensie logic a acestei
presupuneri este folosirea unei estimaii a varianei combinate care s ia n considerare
2
1
o i
2
2
o i pe care o vom utiliza n evaluarea lui
1 2 x x
s

.

CALCULAREA LUI
2
combinat
s

Variana este ptratul abaterii standard. Prin urmare variana se calculeaz ca abaterea
standard, exceptnd extragerea rdcinii ptrate. Deci

( )
2
1
x x
s estimeaz
n
o


i
( )
2
2
2
1
o estimeaz
n
x x
s



Pentru situaia de fa n care se lucreaz cu dispersiile a dou eantioane este nevoie de o
singur estimaie
2
combinat
s . n acest sens va trebui s adunm sumele ptratelor din ambele
eantioane i s mprim rezultatul obinut la numrul gradelor de libertate
1 2
2 n n + . Deci

( ) ( )
2 2
2 1 2
1 2
2
combinat
x x x x
s
n n
+
=
+



sau altfel exprimat

( ) ( )
2 2
1 1 2 2 2
1 2
1 1
2
combinat
n s n s
s
n n
+
=
+




CALCULAREA LUI
1 2 x x
s



nlocuind n relaia
1 2
2 2
1 2
1 2
x x
n n
o o
o

= + ,
i
o prin
2
combinat
s , rezult:
1 2
2 2
1 2
combinat combinat
x x
s s
s
n n

= + sau
1 2
2
1 2
1 1
combinat
x x
s s
n n

| |
= +
|
\ .
sau
1 2
1 2
1 2 1 2
1 1
2
x x
SS SS
s
n n n n

| | +
= +
|
+
\ .


unde sumele ptratelor SS
1
i SS
2
se pot calcula din relaiile:

( )


=
1
2
1 2
1 1
n
x
x SS respectiv
( )


=
2
2
2 2
2 2
n
x
x SS .

12.5 TESTUL t PENTRU DOU EANTIOANE INDEPENDENTE

Valoarea t
calculat
pentru un singur eantion depinde de diferena
0
x i de eroarea
standard (
x
s ).

x
s
x
t
0

=
Statistica t pentru dou eantioane independente are aceeai structur general n sensul
c se compar rezultatul 2 1 x x cu condiia specificat de ipoteza nul (
1 2
) iar ceea ce
rezult se mparte la eroarea standard (
1 2 x x
s

).

( )
( )
1 2
1 2
1 2
x x
x x
t
s


=

Cum ns
1 2
= , rezult c statistica t se scrie:

1 2
1 2
x x
x x
t
s

=

i urmeaz distribuia Student cu
1 2
2 n n + grade de libertate.

12.6 TESTAREA IPOTEZELOR STATISTICE PENTRU MEDIILE A DOU
POPULAII INDEPENDENTE

Paii necesari testrii ipotezelor statistice sunt urmtorii:
Pasul 1
Formularea ipotezelor i stabilirea nivelului de semnificaie o.
H
0
:
1
-
2
=0
H
1
:
1
-
2
0
Pentru pragurile de semnificaie se iau n considerare de regul valorile =0,05 i =0,01.
Pasul 2
Stabilirea mrimii eantionului i selectarea acestuia.
Pasul 3
Calculul statisticilor necesare.
Pasul 4
Identificarea regiunilor de respingere.
Pasul 5
Formularea deciziei statistice i a concluziei.

EXEMPLU

Succesul profesional al profesorilor este semnificativ influenat de trsturile individuale
de personalitate. Folosind scalele CPI, o serie de cercetri au relevat ca semnificative pentru
succesul profesional scalele de responsabilitate i comunalitate. Pentru a verifica acest rezultat
presupunem c se extrag aleator dou eantioane de profesori (unul de profesori performani
(prin rezultate), iar cellalt de profesori ne-performani). Rezultatele testrilor pentru un
numr de 30 de profesori/eantion au condus la obinerea urmtoarelor valori standard ale
scalelor prezentate n tabelul de mai jos.


Profesori performani Profesori ne-performani
Responsabilitate Comunalitate Autocontrol Responsabilitate Comunalitate Autocontrol
1 57,91 53,91 67,18 53,31 28,91 60,95
2 57,91 57,03 56,28 48,71 57,03 50,05
3 51,01 57,03 40,7 45,07 48,09 42,53
4 57,91 63,28 50,05 54,16 57,47 42,53
5 62,51 50,78 50,05 48,71 47,66 46,93
6 49,61 51,22 39,2 60,21 53,91 48,49
7 67,1 53,91 59,39 53,31 47,66 53,16
8 57,91 57,03 48,49 53,31 32,03 51,6
9 46,41 53,91 40,7 28,02 47,66 43,82
10 47,34 63,72 34,42 46,41 50,78 51,6
11 57,91 63,28 45,37 45,07 26,22 50,65
12 55,61 44,53 43,82 60,98 54,34 50,65
13 47,34 51,22 37,66 53,31 53,91 46,93
14 56,43 57,47 62,01 51,01 50,78 50,05
15 56,43 63,72 55,52 51,01 57,03 54,72
16 39,52 41,41 32,91 60,21 35,16 43,82
17 63,25 51,22 62,01 39,52 38,28 54,72
18 37,22 53,91 50,05 44,11 57,03 42,26
19 44,11 41,41 46,93 51,01 44,53 56,28
20 46,41 47,66 53,16 45,07 51,22 36,04
21 51,01 47,66 42,26 44,11 38,28 46,93
22 57,91 53,91 54,72 41,82 57,03 40,7
23 46,41 35,16 56,28 39,55 35,16 50,05
24 51,01 50,78 37,59 53,31 44,53 46,93
25 60,21 57,03 51,6 46,41 60,16 48,49
26 48,71 47,66 37,59 46,41 57,03 37,59
27 55,61 50,78 46,93 51,01 63,28 34,47
28 39,52 41,41 37,59 46,41 50,58 46,93
29 62,51 66,41 54,72 48,71 32,03 42,26
30 49,61 54,34 44,16 41,82 38,28 45,37
Medii 52,74533 52,75967 47,978 48,40267 47,202 47,25

Calcule necesare pentru evaluarea statisticii t
x1 (x1)^2 x2 (x2)^2 x3 (x3)^2 y1 (y1)^2 y2 (y2)^2 y3 (y3)^2
57,91 3353,6 53,91 2906,3 67,18 4513,2 53,31 2842 28,91 835,79 60,95 3714,9
57,91 3353,6 57,03 3252,4 56,28 3167,4 48,71 2372,7 57,03 3252,4 50,05 2505
51,01 2602 57,03 3252,4 40,7 1656,5 45,07 2031,3 48,09 2312,6 42,53 1808,8
57,91 3353,6 63,28 4004,4 50,05 2505 54,16 2933,3 57,47 3302,8 42,53 1808,8
62,51 3907,5 50,78 2578,6 50,05 2505 48,71 2372,7 47,66 2271,5 46,93 2202,42
49,61 2461,2 51,22 2623,5 39,2 1536,6 60,21 3625,2 53,91 2906,3 48,49 2351,28
67,1 4502,4 53,91 2906,3 59,39 3527,2 53,31 2842 47,66 2271,5 53,16 2825,99
57,91 3353,6 57,03 3252,4 48,49 2351,3 53,31 2842 32,03 1025,9 51,6 2662,56
46,41 2153,9 53,91 2906,3 40,7 1656,5 28,02 785,12 47,66 2271,5 43,82 1920,19
47,34 2241,1 63,72 4060,2 34,42 1184,7 46,41 2153,9 50,78 2578,6 51,6 2662,56
57,91 3353,6 63,28 4004,4 45,37 2058,4 45,07 2031,3 26,22 687,49 50,65 2565,42
55,61 3092,5 44,53 1982,9 43,82 1920,2 60,98 3718,6 54,34 2952,8 50,65 2565,42
47,34 2241,1 51,22 2623,5 37,66 1418,3 53,31 2842 53,91 2906,3 46,93 2202,42
56,43 3184,3 57,47 3302,8 62,01 3845,2 51,01 2602 50,78 2578,6 50,05 2505
56,43 3184,3 63,72 4060,2 55,52 3082,5 51,01 2602 57,03 3252,4 54,72 2994,28
39,52 1561,8 41,41 1714,8 32,91 1083,1 60,21 3625,2 35,16 1236,2 43,82 1920,19
63,25 4000,6 51,22 2623,5 62,01 3845,2 39,52 1561,8 38,28 1465,4 54,72 2994,28
37,22 1385,3 53,91 2906,3 50,05 2505 44,11 1945,7 57,03 3252,4 42,26 1785,91
44,11 1945,7 41,41 1714,8 46,93 2202,4 51,01 2602 44,53 1982,9 56,28 3167,44
46,41 2153,9 47,66 2271,5 53,16 2826 45,07 2031,3 51,22 2623,5 36,04 1298,88
51,01 2602 47,66 2271,5 42,26 1785,9 44,11 1945,7 38,28 1465,4 46,93 2202,42
57,91 3353,6 53,91 2906,3 54,72 2994,3 41,82 1748,9 57,03 3252,4 40,7 1656,49
46,41 2153,9 35,16 1236,2 56,28 3167,4 39,55 1564,2 35,16 1236,2 50,05 2505
51,01 2602 50,78 2578,6 37,59 1413 53,31 2842 44,53 1982,9 46,93 2202,42
60,21 3625,2 57,03 3252,4 51,6 2662,6 46,41 2153,9 60,16 3619,2 48,49 2351,28
48,71 2372,7 47,66 2271,5 37,59 1413 46,41 2153,9 57,03 3252,4 37,59 1413,01
55,61 3092,5 50,78 2578,6 46,93 2202,4 51,01 2602 63,28 4004,4 34,47 1188,18
39,52 1561,8 41,41 1714,8 37,59 1413 46,41 2153,9 50,58 2558,3 46,93 2202,42
62,51 3907,5 66,41 4410,3 54,72 2994,3 48,71 2372,7 32,03 1025,9 42,26 1785,91
49,61 2461,2 54,34 2952,8 44,16 1950,1 41,82 1748,9 38,28 1465,4 45,37 2058,44
1582,4 85118 1582,79 85120 1439,34 71386 1452,1 71648 1416,1 69830 1417,5 68027,3

Pentru profesorii performani, sumele ptratelor abaterilor sunt:
( )
( )
677 , 1651
30
4 , 1582
85118
2
1
2
1 2
1 1
= = =

n
x
x SS
( )
( )
1613
30
79 , 1582
85120
2
2
2
2 2
2 2
= = =

n
x
x SS
( )
( )
1 , 2329
30
34 , 1439
71386
2
3
2
3 2
3 3
= = =

n
x
x SS

Pentru profesorii ne-performani, sumele ptratelor abaterilor sunt:
( )
( )


= = = 52 , 1361
30
1 , 1452
71648
2
1
2
1 2
1 1
n
y
y TT
( )
( )


= = = 36 , 2985
30
1 , 1416
69830
2
2
2
2 2
2 2
n
y
y TT
( )
( )


= = = 43 , 1050
30
5 , 1417
3 , 68027
2
3
2
3 2
3 3
n
y
y TT
n continuare se obine:
952 , 51
58
52 , 1361 677 , 1651
2
1 1
1 1 2
1
=
+
=
+
+
=
-
n n
TT SS
s
combinat

282 , 79
58
36 , 2985 1613
2
2 2
2 2 2
2
=
+
=
+
+
=
-
n n
TT SS
s
combinat

268 , 58
58
43 , 1050 1 , 2329
2
3 3
3 3 2
3
=
+
=
+
+
=
-
n n
TT SS
s
combinat


861 , 1
30
2
952 , 51
1 1
1 1
2
1
1
1
= =
|
|
.
|

\
|
+ =
-

n n
s s
combinat
y x

299 , 2
30
2
282 , 79
1 1
2 2
2
2
2
2
= =
|
|
.
|

\
|
+ =
-

n n
s s
combinat
y x

971 , 1
30
2
268 , 58
1 1
3 3
2
3
3
3
= =
|
|
.
|

\
|
+ =
-

n n
s s
combinat
y x


978 , 47
30
34 , 1439
75967 , 52
30
79 , 1582
746 , 52
30
4 , 1582
3 2 1
= = = = = = x x x
25 , 47
30
5 , 1417
203 , 47
30
1 , 1416
403 , 48
30
1 , 1452
3 2 1
= = = = = = y y y
334 , 2
861 , 1
403 , 48 746 , 52
1
1
1
1
1
=

=
y x
calculat
s
y x
t
41699 , 2
299 , 2
203 , 47 75967 , 52
2
2
2
2
2
=

=
y x
calculat
s
y x
t
36935 , 0
971 , 1
25 , 47 978 , 47
3
3
3
3
3
=

=
y x
calculat
s
y x
t
Numrul gradelor de libertate este de 30+30-2=58
00 , 2
05 , 0
~ t

Deciziile statistice: Se respinge ipoteza nul H
0
:
01
-
02;

Se respinge ipoteza nul H
0
:
11
-
12;
Se accept ipoteza nul H
0
:
21
-
22.

CONCLUZII:

Responsabilitatea i comunalitatea influeneaz succesul profesional al profesorilor. Nu acelai
lucru se poate spune despre autocontrol, cele dou populaii nregistrnd valori sensibil egale.



Figura 12.2 Testarea ipotezelor nule H
0i
:
i1
-
i2
=0 versus ipotezele alternative H
1i
:
i1
-
i2
0
pentru o distribuie Student cu 58 grade de libertate.


12.7 ESTIMAREA INTERVALULUI DE NCREDERE PENTRU DIFERENA
1
-
2

Logica care st la baza estimrii intervalului de ncredere pentru diferena
1
-
2
este
aceeai ca i cea care st la baza estimrii intervalului de ncredere pentru . Intervalul de
ncredere pentru diferena
1 2
se determin din relaia:

( )
2 1
2 1
x x
s t x x


o


Formula de mai sus este structural echivalent cu
x
s t x
o
, relaie utilizat n
determinarea intervalului de ncredere pentru .
Folosind datele din exemplul prezentat, intervalele de ncredere pentru diferenele dintre
mediile celor dou populaii (profesori performani i profesori ne-performani) se determin
dup cum urmeaz:

1
1
52, 746 48, 403 4, 343 x y = = +
2
2
52, 75967 47, 203 5, 55667 x y = = +
3
2
47, 978 47, 25 0, 728 x y = =

861 , 1
1
1
=
y x
s
299 , 2
2
2
=
y x
s
971 , 1
3
3
=
y x
s

n cazul scalei de responsabilitate: ) 065 , 8 ; 621 , 0 ( 861 , 1 2 343 , 4
n cazul scalei de comunalitate: ) 15467 , 10 ; 9587 , 0 ( 299 , 2 2 55667 , 5
n cazul scalei de autocontrol: ) 67 , 4 ; 214 , 3 ( 971 , 1 2 728 , 0

n cazul scalei de responsabilitate, cu o ncredere de 95% se apreciaz c diferena dintre
mediile populaiilor
1 2
se afl cuprins ntre 0,621 i 8,065. Prin urmare efectul
responsabilitii n succesul profesional este cuprins ntre 0,621 i 8,065. Aa cum putem
constata, intervalul de ncredere pe scala de responsabilitate nu include valoarea 0 specificat
n ipoteza nul i deci H
0
se respinge. Raionamente similare se pot face i pentru celelalte dou
scale cu meniunea c pentru scala de autocontrol, intervalul de ncredere cuprinznd i valoarea
0, ipoteza nul se accept.

MRIMEA EFECTULUI

La calculul mrimii efectului se recurge pentru a aprecia statistic diferena dintre dou
medii. Mrimea efectului poate fi evaluat prin exprimarea sa ca msur a abaterii standard
combinate. Relaia de calcul a mrimii efectului este:

2
2 1
2 1
2 1 2 1
+
+

=
n n
SS SS
x x
s
x x
d
combinat


Aa cum este calculat aceast mrime, ea pare a fi un scor z. Presupunnd c fiecare
distribuie este normal, putem utiliza anexa A pentru a interpreta mrimea efectului.

Datele din exemplul de mai sus conduc la urmtoarele rezultate: s
combinat1
=51,952;
s
combinat2
=79,282; s
combinat3
=58,268; d
1
=0,084; d
2
=0,07 i d
3
=0,012. Diferenele dintre medii
corespund unor deviaii standard de 0,084; 0,07 i 0,012. Rezumndu-ne la scala de
responsabilitate, rezultatele obinute arat c media corespunztoare profesorilor performani este
cu +0,084 abateri standard mai ridicat dect media profesorilor ne-performani. Diferena de
+0,084 este ilustrat n figura de mai jos unde se poate observa o nesemnificativ ne-sincronizare
ntre cele dou distribuii.



Fig. 12.3 Mrimea efectului: d=0,084.

Urmrind figura 12.3. b) se constat c 3,39% din subieci, indiferent c sunt profesori
performani sau ne-performani, nregistreaz niveluri cotate pentru scala de responsabilitate
cuprinse ntre cele dou medii.




952 , 51 1
2
= combinat s

084 , 0
952 , 51
403 , 48 746 , 52
+ =

= d

S-ar putea să vă placă și