Sunteți pe pagina 1din 48

I.

Corelația în statistică

Corelația se referă la măsura în care două variabile sunt asociate. Un coeficient de corelație
arată cât de puternică este relația dintre două variabile și care este direcția acestei relații:
pozitivă sau negativă, directă sau inversă.

Un concept asociat corelației este predicția. Dacă două variabile corelează pozitiv, înseamnă
că putem face o predicție mai bună decât fifty-fifty, adică mai bună decât șansa, cu privire la
scorul unei persoane pe o variabilă dacă îi cunoaștem scorul pe cealaltă variabilă. Astfel, o
corelație pozitivă sugerează că cei cu scoruri mari pe una dintre variabile este probabil să aibă
scoruri mari și pe cealaltă variabilă.

Cu excepția unei corelații perfecte, de +1, care este extrem de rară, asociația dintre două
variabile este parțială. Asta înseamnă că nu toți cei cu scoruri mari la variabila A vor avea
scoruri mari și la variabila B. Dar dacă există o corelație între cele două variabile, e mai
probabil ca acest lucru să se întâmple.

Corelația, ca metodă statistică, este utilă în mai multe situații. Spre exemplu, o folosim pentru
a verifica fidelitatea test-retest a unui instrument, dar și pentru a testa validitatea
instrumentului într-un context anume. În prima situație, vom calcula corelația dintre
rezultatele la o primă aplicare și cele obținute la o a doua aplicare, după câteva săptămâni.
Pentru a testa validitatea, vom corela rezultatele la testul nostru cu rezultatele la alte teste sau
măsurători.

Ori de câte ori vrem să vedem dacă există o relație între două variabile, corelația este un
instrument pe care îl putem folosi.

Exprimarea grafică a distribuțiilor bivariate: norul de puncte


Norul de puncte sau scatter plot-ul reprezintă modalitatea standard de reprezentare a datelor
sau distribuțiilor bivariate. Fiecare punct din diagramă reprezintă intersecția scorului la o
variabilă pe axa X cu scorul la cealaltă variabilă pe axa Y.
Construirea unui scatter plot necesită parcurgerea mai multor pași. În primul rând se alocă o
variabilă pe axa X și cealaltă pe axa Y. Dacă una dintre variabile este considerată predictor,
este preferabil ca aceasta să fie axa X, iar cealaltă, criteriul, va fi pe axa Y.

Apoi sunt desenate cele două axe de dimensiuni egale, cu valorile ridicate spre extremități și
valorile mici înspre originea comună (punctul de intersecție a axelor).

Folosind gradațiile fiecărei axe, găsiți intersecția fiecărei perechi de date X-Y. Notați această
intersecție cu un punct.

În final, numiți fiecare axă, dar și graficul.

Odată realizat acest grafic, este ușor de observat natura relației, direcția ei, dacă ea există.

Rețineți că pentru coeficientul de corelație Pearson este presupusă o relație liniară între
variabile, adică o relație care poate fi reprezentată printr-o linie dreaptă. Acesta nu este
întotdeauna cazul, iar o inspecție sumară a norului de puncte poate să indice o relație mai
degrabă curbilinie, în formă de U sau de U inversat.

Corelația: o chestiune de direcție


Dacă punctele sunt așezate pe diagramă astfel încât să sugereze o formă alungită din stânga
jos spre dreapta sus, corelația va fi una pozitivă. În schimb, dacă punctele sunt așezate astfel
încât să sugereze o formă alungită dinspre dreapta sus spre stânga jos, relația este cel mai
probabil una negativă.

În cazul unei corelații care tinde spre 0, punctele vor fi împrăștiate pe tot graficul, fără a
sugereze o formă regulată sau o orientare.

Corelația: o chestiune de grad


Cu cât punctele sunt mai adunate în jurul unei linii drepte imaginare care trece prin mijlocul
lor, cu atât coeficientul de corelație va fi mai mare, ceea ce înseamnă că relația dintre cele
două variabile este mai puternică. Cu cât sunt mai împrăștiate punctele, cu atât coeficientul de
corelație va fi mai mic.

Coeficientul de corelație este notat cu r (r mic). El variază între -1 și +1. Semnul indică doar
direcția relației (este pozitivă sau negativă). Forța relației este dată de mărimea coeficientului,
indiferent dacă e cu + sau minus. Astfel, cu cât e mai aproape de +1 sau -1, cu atât e mai
puternică relația. Cu cât e mai aproape de 0, cu atât e mai slabă.

În situația unei corelații perfect pozitive (+1), toate punctele din scatter plot s-ar așeza pe o
linie dreaptă ascendentă de la stânga spre dreapta. O corelație perfect negativă (-1) ar
presupune că toate punctele din grafic să se alinieze pe o linie dreaptă descendentă de la
stânga spre dreapta.

Ce înseamnă gradul de corelație


Un coeficient de corelație nu indică o relație de cauzalitate între cele două variabile. Nu
înseamnă că variabila A determină variabila B.

Un coeficient de 0,50 nu înseamnă o asociere de 50% între cele două variabile și nu este nici
de două ori mai mare decât un coeficient de 0,25. Corelația nu este un procent și nici nu apare
pe o scală de interval, ceea ce înseamnă că diferența dintre un coeficient de 0,10 și unul de
0,20 nu este egală cu diferența dintre 0,20 și 0,30.

Însă cu cât un coeficient de corelație este mai mare, cu atât predicțiile pe care le facem despre
scorurile unei persoane la variabila B în baza scorurilor pe care le are la variabila A e mai
probabil să fie corecte. Spre exemplu, dacă între nota la bacalaureat și media notelor din
prima sesiune este de 0,40, este mai probabil ca un student cu notă mare la bac să aibă note
mari în prima sesiune decât dacă această corelație este de doar 0,15. Este o chestiune de
calitate a predicției.

Formule pentru coeficientul de corelație Pearson


O primă formulă de calcul al coeficientului de corelație r est:

r = Σ(zxzy)/n

n reprezintă numărul de perechi de scoruri.

Înainte de a folosi formula de mai sus, scorurile brute trebuie transformate în scoruri z. Apoi
sunt înmulțite scouririle z și se adună produsele obținute. Suma produselor se împarte la n,
adică la numărul de perechi de scoruri.

O a doua formulă se bazează pe calcularea abaterilor de la medie.

r = Σ(x-mx)(y-my)/nSxSy

x și y sunt scorurile obținute pe cele două variabile. Mx și my sunt mediile scorurilor pentru
fiecare variabilă, n este totalul perechilor de scoruri, iar Sx și Syreprezintă abaterile standard.

Pentru a aplica această formulă, trebuie parcurși mai mulți pași. În primul rând, sunt listate
toate scorurile pe două coloane. Pentru o mai bună înțelegere, urmăriți tabelul de la pagina
155 din materialul original.

Al doilea pas presupune calcularea mediei scorurilor la prima variabilă (x) și a mediei pentru
a doua variabilă (Y).

Apoi fiecare scor brut este transformat într-un scor de abatere (adică x minus media
eșantionului la prima variabilă, respectiv y minus media scorurilor la a doua variabilă).

Următorul pas necesită calcularea abaterilor standard pentru fiecare variabilă. Acest calcul
presupune ridicarea la pătrat a fiecărei abateri și însumarea pătratelor obținute. Această sumă
este apoi împărțită la n și în final se extrage radicalul din rezultatul împărțirii.
Revenind la formula lui r, pentru a obține numărătorul, se înmulțește fiecare abatere a primei
variabile cu abaterea la cea de-a doua variabilă. Apoi sunt adunate produsele tuturor
respondenților. Suma este împărțită la produsul dintre n și cele două abateri standard.

Calcularea lui r din scorurile brute


Formula computațională pentru coeficientul de corelație:

R = Σ (x-mx)(y-my) / √(ssx*ssy)

ssx și ssy reprezintă suma pătratelor abaterilor lui x, respectiv y. Modul de calcul a acestor
sume ale pătratelor a fost specificată mai sus.

La numărător găsim suma produselor abaterilor lui x, respectiv y. Aceasta mai poate fi
calculată și scăzând din suma produselor x*y suma valorilor lui x ori suma valorilor lui y,
produs împărțit la n.

Adică Σ (x-mx)(y-my) = Σxy – [(Σx* Σy) / n].

Corelația nu implică și cauzalitate


Covariația a două variabile este o condiție necesară, dar nu și suficientă pentru a concluziona
că între cele două există o relație de cauzalitate. Atunci când variabila A și variabila B
corelează, există mai multe posibile explicații. A este cauza lui B. B este cauza lui A. Sau
există una sau mai multe alte variabile care o determină și pe A și pe B.

Efectul transformării scorurilor


Uneori este util să modificăm scorurile unei variabile sau a amândurora înainte de a calcula
coeficientul de corelație.

Este important de știut că transformările liniare ale scorurilor nu modifică deloc valoarea
coeficientului de corelație. O transformare liniară presupune adăugarea, scăderea, înmulțirea
sau împărțirea fiecărui scor cu o valoare constantă.

În schimb alte tipuri de transformări, cum este ridicarea la pătrat a scorurilor brute, spre
exemplu, afectează valoarea lui r.

Precauții privind coeficienții de corelație


Coeficientul de corelație Pearson este adecvat doar pentru relațiile liniare. Cu câd relația
dintre cele două variabile este mai diferită de liniaritate (fiind, spre exemplu, mai degrabă
curbilinie), cu atât coeficientul r va subestima puterea asociației.

Coeficientul de corelație este sensibil la intervalul de variație a scorurilor obținute. Altfel


spus, cu cât intervalul în care variază datele noastre este mai similar cu intervalul de variație a
populației, cu atât coeficientul de corelație va fi mai acurat.
Un alt aspect este că variația eșantionării impactează și ea coeficientul de corelație. Conform
principiului variației eșantionării aleatorii, coeficientul de corelație va diferi de la un eșantion
la altul. Cu cât eșantioanele folosite sunt mai mici, cu atât diferențele între coeficienții de
corelație vor fi mai mari. Prin urmare, este important de stabilit dacă rezultatul pe care l-am
obținut pe un eșantion este semnificativ statistic, adică nu este datorat întâmplării și este cu un
grad mare de probabilitate diferit de 0 și la nivelul populației, nu doar al eșantionului.

Nu există un singur coeficient de corelație între două variabile. Acest coeficient poate să
varieze în funcție de caracteristicile eșantionului, inclusiv dimensiunea lui, dar și în funcție de
instrumentele folosite pentru măsurare sau altor condiții externe. De aceea este esențial ca
raportarea coeficientului să fie acompaniată de cât mai multe detalii despre modul în care
datele au fost obținute și prelucrate.

Alte modalități de a măsura corelația


Când datele noastre reprezintă ranguri sau poziții într-o ierarhie, putem să corelăm aceste date
cu altele folosind coeficientul rho al lui Spearman.

Corelația biserială este adecvată atunci când una dintre variabile este continuă și cantitativă,
iar cealaltă ar putea fi și ea continuă, însă a fost redusă la doar două categorii (are doar două
valori, cum ar fi sub sau peste medie).

Coeficientul tetrachoric este utilizat dacă ambele variabile sunt continue însă au fost reduse la
doar două categorii.

Coeficientul punct biserial se folosește dacă o variabilă este continuă și cantitativă, dar a doua
este calitativă și dihotomică, fără să poată fi continuă (așa cum este cazul la corelația biserială
simplă).

Coeficientul phi este folosit atunci când ambele variabile sunt calitative și dihotomice.

Coeficientul de contingență este folosit atunci când niciuna dintre variabile nu are la bază un
set continuu de date și cel puțin una dintre ele nu este dihotomică, ci are trei sau mai multe
categorii.

Corelația eta este folosită pentru relațiile curbilinii dintre două variabile continue, cantitative.
Acest coeficient nu trebuie folosit atunci când două variabile au o relație liniară.

Corelația multiplă permite evaluarea asocierii dintre mai mulți predictori și un criteriu.
Presupune identificarea ponderii fiecărui predictor astfel încât totalul ponderat al acestor
variabile să aibă cea mai mare corelație posibilă cu variabila criteriu. Coeficientul de corelație
multiplă este notat cu R (r mare), iar pentru a putea fi calculat trebuie să cunoaștem
coeficienții de corelație r pentru fiecare pereche de variabile.

Corelația parțială măsoară asocierea dintre două variabile atunci când efectul altor variabile
este izolat. Este o metodă de eliminare a explicațiilor alternative pentru corelația dintre două
variabile.
Dacă prin corelația parțială eliminăm efectul unei terțe variabile asupra relației dintre cele
două variabile, corelația semiparțială sau parțială presupune doar eliminarea efectului acestei
terțe variabile asupra uneia singure dintre variabilele corelate.

Conspect al capitolului 9, ”Correlation”, din ”Statistical reasoning in psychology and


education”, de Minium, King și Bear.

https://psihoteca.ro/corelatia/

.......................................................................................................................

I.1. Studiul corelational - aplicații


Corelatia este o metoda statistica utilizata pentru a determina relatiile dintre
doua sau mai multe variabile. Exista mai multe tipuri de corelatii atât parametrice
cât si neparametrice.

Coeficientul de corelatie este o valoare cantitativa ce descrie relatia dintre


doua sau mai multe variabile. El variaza între (-1 si +1), unde valorile extreme
presupun o relatie perfecta între variabile în timp ce 0 înseamna o lipsa totala de
relatie liniara. O interpretare mai adecvata a valorilor obtinute se face prin
compararea rezultatului obtinut cu anumite valori prestabilite în tabele de corelatii
în functie de numarul de subiecti, tipul de legatura si pragul de semnificatie dorit.

Corelatii parametrice
Principalele doua conditii ce trebuie a fi îndeplinite pentru a utiliza probe
parametrice sunt:

 distributia normala a variabilei de interes din cadrul esantionului cercetarii;


 omogenitatea dispersiei esntionului cercetarii referitor la variabila supusa
studiului.

Probele parametrice sunt preferate în cazul îndeplinirii acestor conditii


deoarece sunt mai solide, ceea ce înseamna cresterea sansei de a respinge o ipoteza
falsa. Aceste conditii pot fi verificate prin localizarea mediei în cadrul distributiei
normale a datelor cât si prin calcularea indicatorilor de omogenitate a esantionului
cercetat.

Exista mai multe tipuri de corelatii parametrice. Pe parcursul acestui subcapitol ne


vom opri la:

1. - coeficientul de corelatie simpla (Bravais-Pearson);


2. - coeficientul de corelatie eneahoric;
3. - coeficientul de corelatie partiala;
4. - coeficientii de corelatie biserial si triserial.

1. Coeficientul de corelatie simpla r


În acest tip de corelatie sunt implicate doua variabile numerice care îndeplinesc
conditiile parametrice. Pentru fiecare subiect avem doua rezultate. Calculul
coeficientului de corelatie simpla (Bravais-Pearson) implica abaterile relative ale
rezultatelor din cele doua distributii fata de mediile corespunzatoare. Exista mai
multe formule de calcul în acest sens. Una din formulele de calcul a lui r este:

Unde:

N = numarul de subiecti al esantionului;

S x la patrat si S y la patrat se obtin prin ridicarea la patrat a rezultatelor si apoi


sumarea lor.

S x totul la patrat si S y totul la patrat se obtin prin însumarea tuturor x-ilor si y-ilor
si apoi se ridica rezultatul la patrat.
S xy este suma produselor dintre cele doua variabile.

O alta formula de calcul, porneste de la covarianta:

Unde: n este numarul de subiecti; Sx si Sy sunt abaterile standard ale celor doua
variabile; Mx si My sunt mediile celor doua variabile.

Pentru o întelegere mai buna a acestor situatii vom apela la exemplul


urmator: Un cercetator doreste sa stabileasca ce legatura exista între abilitatea unui
individ de a fi îndragostit si altruismul sau social. Sa ne imaginam deci, ca ar exista
un test prin care sa poata fi masurata cantitativ abilitatea de a fi îndragostit, proba
pe care cercetatorul ar corela-o cu o scala de evaluare a gradului de altruism social.
Au fost testati 20 de subiecti. Pentru usurarea calculelor se realizeaza un tabel
ajutator, în care sunt trecute printre altele si valorile obtinute la testare (X=
abilitatea de a fi îndragostit; Y= altruismul).

Sb x y x2 y2 xy Sb x Y x2 y2 xy
1 16 20 256 400 320 11 4 11 16 121 44
2 12 17 144 289 204 12 10 14 100 196 140
3 10 14 100 196 140 13 12 15 144 225 180
4 8 9 64 81 72 14 11 17 121 289 187
5 11 12 121 144 132 15 12 14 144 196 168
6 9 10 81 100 90 16 10 13 100 169 130
7 7 13 49 169 91 17 14 19 196 361 266
8 9 12 81 144 108 18 7 15 49 225 105
9 15 20 225 400 300 19 6 8 36 64 48
10 6 10 36 100 60 20 13 18 169 324 234
S x= 202; S y= 281; S x2= 2232; S y2= 4193; S xy= 3019; (S x)2= 40804; (S y)2=
78961.

În urma rezultatelor obtinute la cele doua teste se poate calcula r simplu


înlocuind în formula data mai sus:

OBSERVATII:

- Suma de x² este diferita de (x) ² ;

- Uneori apare un coeficient de corelatie negativ atunci când relatia dintre


variabile este de fapt pozitiva. Conteaza modul în care sunt evaluate variabilele.
Daca una din variabile implica o valoare mare la un rezultat mare, iar cealalta
variabila indica o valoare mare la un rezultat mic atunci o corelatie negativa între
elemente indica de fapt o asociere pozitiva între variabile.

Interpretarea încrederii lui r

Criteriul dupa care poate fi discutata semnificatia lui r presupune consultarea


unei tabele special construite. Prin acest procedeu se poate respinge ipoteza nula
conform careia ca nu exista o relatie adevarata (semnificativa), între variabile, iar
eventualele asocieri se datoreaza întâmplarii. Daca o relatie este semnificativa din
punct de vedere statistic, adica este de încredere, înseamna ca vom obtine rezultate
similare daca s-ar reface experimentul.

În utilizarea tabelului lui r putem alege diferite praguri de semnificatie.


Exista o întelegere la nivelul comunitatii stiintifice internationale ca pragul minim
acceptat pentru a considera o relatie semnificativa statistic este 0,05. Aceste valori
pot fi însa si mai mici.

Pentru aflarea semnificatiei unui coeficient de corelatie este necesara


parcurgerea urmatorilor pasi:

1. Se alege nivelul de semnificatie dorit, sa zicem de 0,05. Aceasta înseamna ca


la efectuarea a 100 de experimente vom obtine un rezultat bun datorat
întâmplarii în maxim 5 cazuri din 100. În restul cazurilor vom obtine un
rezultat bun datorita asocierii reale dintre variabile. La nivelul de 0,01 relatia
este si mai puternica, iar eroarea are loc numai într-un singur caz din 100.
Deci testul de semnificatie de 0,01 este mai riguros la nivelul de .01 decât la
nivelul de .05 si este nevoie de o corelatie mai puternica pentru a atinge
nivelul de semnificatie de 0,01.
2. Se stabileste tipul de relatie între variabile: bilaterala (two-tailed), respectiv
unilaterala (one-tailed). Cercetatorul este cel care decide ce valoare va
consulta. În cazul în care din punct de vedere teoretic, se urmareste sa se
demonstreze ca doua variabile coreleaza fie direct, fie invers, va fi folosit
testul unilateral. Daca asemenea informatii lipsesc si se doreste relevarea
doar a coefientului de corelatie fara a se preciza directia legaturii, vorbim
despre testul bilateral. Matematic pentru testul unilateral avem r12>0 sau
r12<0, în timp ce pentru testul bilateral avem r12`0. În exemplul dat,
întâlnim situatia unui test bilateral deoarece nu este precizata directia
legaturii între usurinta de a se îndragosti si altruism.
3. Se citeste din tabel valoarea lui lui r pentru coloana corespunzatoare
numarului de grade de libertate (notat cu df). Acestea sunt pentru r de df=N-
2 stabilindu-se în functie de numarul de subiecti N validati.
4. Daca valoarea lui r obtinuta în urma calcularii sale o depaseste pe cea din
tabel, atunci aceasta este semnificativa la pragul de semnificatie ales, în
cazul nostru de 0,05 (notat si cu .05) si numarul de grade de libertate
specificat. Se poate observa ca valoarea coeficientului de corelatie necesara
pentru un r "semnificativ" scade pe masura ce creste numarul de subiecti,
implicit gradele de libertate. Se remarca astfel ca valorile foarte mici ale
coeficientilor de corelatie pot fi semnificative numai daca se lucreaza cu
grupe mari de subiecti. Spre exemplu un r = 0,64 este semnificativ la un prag
de semnificatie p<.05 pentru opt grade de libertate, adica 10 subiecti (N-2),
unde în dreptul valorii de p.05 (0,05) la df=8 se gasea în tabel valoarea de
0.63 pentru testul bilateral. La fel de semnificativ este si un r = 0,20 la un
prag de semnificatie p<.05 pentru df=100, coeficientul obtinut fiind mai
mare decât valoarea de 0,19 tecuta în tabel.

În cazul problemei data spre exemplu am obtinut un r = 0,83 semnificativ la


un parg de semnificatie p<.05 si df = 18. În tabel era trecuta valoarea de 0,44, cifra
mult mai mica decât cea obtinuta de noi. Interpretarea acestui rezultat arata ca
ipoteza nula este respinsa si ca exista o relatie semnificativa din punct de vedere
statistic între capacitatea de a oferi dragoste si gradul de altruism social.

Daca urmarim tabelul de valori ale lui r, observam ca r obtinut (0,83) este
semnificativ si la un parg de semnificatie inferior p<.001 si df = 18, în dreptul
careia era trecuta în tabel valoarea de 0,67.

Interpretarea corelatiei din perspectiva semnificatiei

Statistica poate raspunde la doua întrebari privind datele pe care le avem:


Sunt autentice relatiile (efectele) descoperite? Ce semnificatie au acestea?

Cel mai utilizat criteriu pentru interpretarea semnificatiei coeficientului de


corelatie este coeficientul de determinare (r² – r patrat). Acest criteriu nu are
întotdeauna însemnatate din cauza influentei importante pe care o are marimea
lotului în determinarea coeficientului de corelatie. El trebuie analizat cu grija în
cazurile în care exista un numar relativ mic de subiecti (sub 20). De asemenea,
coeficientul de determinare poate fi aplicat doar daca am obtinut în prealabil un r
semnificativ.

Prin intermediul lui r patrat se determina partea de asociere comuna a


factorilor care influenteaza cele doua variabile. Cu alte cuvinte, coeficientul de
determinare indica partea din dispersia totala a masurarii unei variabile care poate fi
explicata sau justificata de dispersia valorilor din cealalta variabila.

De exemplu, în cazul problemei amintite corelatia gasita a fost de 0,83, ceea


ce înseamna ca r² = (r)² (coeficientul de corelatie la patrat) este de 0,69. Uzual
coeficientul de determinare se înmulteste cu 100 si exprimarea se transforma în
procente din dispersie (69%).

Pentru o corelatie r de 0,83 între capacitatea de a fi îndragostit si gradul de


altruism social, putem spune ca aproximativ 69% din dispersia dintr-un test este
asociata cu celalalt. Urmeaza o analiza psihologica, ce ramâne la interpretarea
fiecaruia atât asupra factorului comun dintre cele doua variabile cât si a diferentelor
dintre ele. Un cercetator adept al teoriei triunghiulare a dragostei a lui Sternberg ar
considera ca cele 69% ce implica comunalitatea celor doua variabile pot fi explicate
prin doi factori: implicarea în relatie respectiv, caldura si deschiderea persoanei. Ce
se poate spune despre dispersia neexplicata? În cazul problemei date este de 1 –
0,69, adica care transformat în procente înseamna 31%. Acelasi cercetator ar
considera ca diferenta dintre cele doua variabile este data de lipsa pasiunii din
componenta altruismului ca element definitoriu al dragostei.

Un alt cercetator ar putea explica aceste cifre pornind de la interpretarea lui


Moreau data dragostei pe care o considera nu numai din perspectiva daruirii ci si
din prisma schimbului avantajos reciproc.

Aceasta comunalitate dintre doua variabile sta si la baza tehnicilor de analiza


factoriala.

OBSERVATIE:

Cînd utilizam coeficientul de determinare pentru a interpreta coeficientii de


corelatie este nevoie de o relatie puternica (r mare) pentru a explica o parte mare
din dispersia comuna. Astfel, un r de 0,71 este necesar pentru a explica jumatate
din dispersia celuilalt test.

Interpretarea coeficientului de corelatie depinde în mare masura si de scopul


corelatiei. De exemplu, daca analizam fidelitatea unui test este necesara o corelatie
mult mai mare decît atunci când vrem sa determinam pur si simplu daca exista o
relatie între doua variabile.
O corelatie de 0,90 nu este pur si simplu de trei ori mai mare decât una de
0,30; ea este de fapt de noua ori mai mare (0,30) la patrat = 0,09 sau 9% si (0,90) la
patrat = 0,81 sau 81%.

2. Coeficientul de corelatie eneahoric


Exista cazuri în care se adopta o clasificare mai grosiera a datelor, acestea
fiind grupate pentru fiecare variabila în câte trei clase. Aranjarea datelor într-un
tabel va capata o înfatisare particulara în care ne intereseaza clasele extreme. În
acest caz vom calcula coeficientul de corelatie eneahoric pentru un numar de 113
subiecti.

Se poate observa ca avem de a face cu doua variabile continue: agresivitatea


verbala si anxietatea sociala. Pentru a surprinde mai clar corelatia dintre ele
renuntam la clasele mediane care ar estompa relatia. În consecinta vom considera
relatia dintre agresivitatea verbala superioara / inferioara si anxietatea sociala
mare / mica.

Anx Agres Superior Mediu Inferior


Mare 18 (n1) 20 5 (n2) A = 43
Medie 5 25 11
Mica 6 (n2) 5 7 (n3) B = 18
D = 29 C = 23 N = 113x

Formula lui r este:

r = 0,28 la df (N-2) = 111.

Valoarea obtinuta este comparata cu valoarea din tabel a lui r de la 111 grade
de libertate într-o maniera asemanatoare cu cea amintita la explicarea interpretarii
semnificatiei coeficientului de corelatie r a lui Bravais-Pearson.
3. Coeficientul de corelatie partiala
Corelatia dintre doua variabile poate induce uneori în eroare si poate fi dificil
de interpretat atunci când între cele doua variabile exista o a treia, responsabila de
dependenta comuna a celor doua.

Spre exemplu, odata cu vârsta, mai multe caracteristici se modifica progresiv


cum ar fi: marimea vocabularului; durata somnului; performantele mentale; gradul
de activism s.a.m.d. Pe un interval mai mare de timp (spre exemplu 10 ani)
corelatia dintre oricare doua variabile enumerate va fi cu certitudine puternica din
cauza factorului comun de maturizare. Corelatia poate sa scada aproape de zero
daca variabilitatea provocata de diferentele de vârsta este eliminata. Acest control
al variabilei vârsta poate fi realizat pe doua cai: fie selectam numai copii de aceeasi
vârsta, fie eliminam partial efectele statistice ale vârstei prin mentinerea constanta a
acesteia. Aceasta ultima solutie presupune utilizarea corelatiei partiale.

Exista câtiva factori generali care pot influenta relatiile dintre variabile:
nivelul de dezvoltare mentala; temperamentul; gradul de sanatate psihica etc.
Simbolul folosit pentru coeficientul de corelatie partiala este r12.3 care semnifica o
corelatie între variabilele 1 si 2 când variabila 3 este mentinuta constanta (se pot
mentine oricâte variabile, simbolul devenind r12.345).

Calculul coeficientului de corelatie partiala dintre trei variabile este destul de


simplu si va fi prezentat în continuare.

Corelatia dintre marimea vocabularului si durata medie de somn este un bun


exemplu de corelatie falsa, fapt ce înseamna ca relatia dintre ele se datoreaza în cea
mai mare parte influentei comune a unei a treia variabile (vârsta). Când efectul
acestei variabile este înlaturat, corelatia dintre variabilele amintite scade sau chiar
dispare. Vom nota variabilele dupa cum urmeaza: 1= marimea vocabularului; 2=
numarul de ore de somn (în medie); 3= vîrsta subiectilor. Coeficientii de corelatie
simpli dintre cele trei variabile au urmatoarele valori: r12= 0,80; r13= 0,90; r23=
0,88.

Formula de clacul a lui r12.3 este:

Observam ca am obtinut un coeficient de corelatie între marimea


vocabularului si numarul de ore de somn aproape de zero în situatia în care
influenta vârstei a fost eliminata. Initial însa, eram tentati sa credem ca între cele
doua variabile exista o legatura puternica (r12= 0,80). Astfel, semnul si marimea
unei corelatii partiale dintre doua variabile poate fi diferita de corelatia directa
(simpla) dintre aceleasi doua variabile.

4. Coeficientii de corelatie biserial si triserial


Se pot ivi situatii când avem o variabila continua pusa în paralel cu o
variabila discontinua (dihotomica, respectiv trihotomica). În aceste cazuri se
utilizeaza un coeficient de corelatie biserial (r bis), respectiv triserial (r tris). Pentru
calcularea acestor coeficienti este necesar ca N (numarul de subiecti) sa fie de peste
50.

4.a. Coeficientul de corelatie biserial


Exemplu: Un lot de 60 de profesori (învatatori) sunt testati pentru a se evalua
printr-o scala experimentala atitudinea pe care o au fata de mainstreaming, ca
masura benefica în vederea integrarii scolare a copiilor cu deficienta mintala.
Cotele obtinute la acesta scala variaza între 10 si 50 de puncte. Variabila
dihotomica consta în clasificarea profesorilor în doua clase: cei care au avut sau
aveau în clasa asemenea copii si cei care nu au avut sau nu aveau în clasa copii cu
deficienta mintala. S-a constatat ca 24 de profesori au lucrat cu cel putin un copil
deficient mintal, iar restul de 36 de profesori nu au avut ocazia sa lucreze direct cu
copii care prezentau asemenea probleme.

Media obtinuta de profesorii care au lucrat cu copiii cu deficienta mintala la


atitudinea fata de mainstreaming a fost de 38,4, în timp ce profesorii care nu au
lucrat cu deficienti mintali a obtinut o medie de 28,4. Abaterea standard a tuturor
celor 60 de profesori supusi studiului este egala cu 8. Formula de calcul a
coeficientului biserial este:

Unde: m1= media valorilor variabilei continue pentru subiectii care ating
valoarea A a variabilei dihotomice (în cazul de fata cei care au lucrat cu copiii
deficienti mintal);
m2= media valorilor variabilei continue pentru subiectii care ating valoarea B
a variabilei dihotomice (în acest caz cei care nu au lucrat cu copii cu deficienti
mintal);
S = abaterea standard generala pe întreg lotul de subiecti;
pq/y = se citeste dintr-un tabel special luând ca reper fie p, fie q.

Pasi în rezolvarea problemei:


1. Se stabileste proportia (p) a celor care au lucrat cu copii cu deficienta
mintala facând raportul dintre numarul acestora si totalul subiectilor din
studiu. În aceeasi masura se stabileste si proportia (q) a celor care nu au
lucrat cu asemenea copii.

p= 24/60 = 0,40; q= 36/60 = 0,60;

2. Se cauta în tabel valoarea lui pq/y pentru p = 0,40 sau q = 0,60. Se observa
ca valoarea lui pq/y corespunzatoare este 0,6212.
3. Se înlocuieste în formula prezentata mai sus:

4.b. Coeficientul de corelatie triserial


Când într-un studiu una din variabile este continua, iar cealalta ne apare sub
forma unei clasificari trihotomice (de exemplu – bun, mediu, slab) atunci se
utilizeaza pentru calculul corelatiei o formula în care m1 si m3 reprezinta mediile la
variabila continua pentru cei buni si cei slabi; p1 si p3 proportia de subiecti care
intra în clasa "buni", respectiv "slabi"; S este abaterea standard a distributiei
complete a datelor, iar valorile rapoartelor y1/p1, respectiv y2/p2 sunt date într-un
tabel special pentru calculul coeficientului de corelatie triserial luând ca reper p sau
q. Se observa ca grupul celor inclusi în categoria mediu nu intra în calculele acestei
formule.

Exemplu: Pornind de la problema anterioara vom împarti profesorii în trei


categorii: cei care au lucrat cu copii cu deficienta mintala; cei care au lucrat cu
copii cu alte deficiente dar nu si cu deficienti mintali; în sfârsit cei care nu au lucrat
pâna în prezent cu copii deficienti.

În prima categorie au fost inclusi 24 profesori, a caror medie la scala de


atitudine fata de mainstreaming a fost de 38,4; în a doua categorie au fost inclusi 14
profesori a caror medie a fost de 29,4, în timp ce în ultima categorie, a profesorilor
care nu au lucrat niciodata cu copii cu deficienta au fost inclusi 22 de profesori care
au obtinut o medie de 28,1 la scala atitudinala. Abaterea standard globala pentru
toti cei 60 de subiecti a fost 8.

Pasi în rezolvarea problemei:


1. Se stabileste proportia (p1) a celor care au lucrat cu copii cu deficienta
mentala facând raportul dintre numarul acestora si totalul subiectilor din
studiu. În aceeasi masura se stabileste si proportia (p2) a celor care nu au
lucrat cu asemenea copii, dar au lucrat cu alte categorii de deficienti,
respectiv proportia (p3) a celor care nu au lucrat cu nici o categorie de
deficienti.

P1= 24/60 =0,40; p2= 14/60 =0,235; p3= 22/60 =0,365

2. Se cauta în tabel valoarea lui y1/p1 pentru p1 = 0,40 sau q1 = 0,60. Se


observa ca valoarea lui y1/p1 corespunzatoare este 0,9659. La fel se cauta
valoarea lui y3/p3 pentru p3 = 0,365 sau q3 = 0,635 si observam ca valoarea
trecuta în tabel este 1,0289.
3. Înlocuim cifrele obtinute în formula coeficientului de corelatie triserial:

OBSERVATIE: Atât în cazul coeficientului de corelatie biserial cât si a celui


triserial sunt necesare doua conditii:

 un numar de subiecti cuprinsi în esantion mai mare de 50;


 marimea claselor de subiecti luate în calcul (p1 si p2 , respectiv p1 si p3) sa
fie în jurul a 33% din totalul de subiecti. În caz contrar vom obtine un
rezultat distorsionat.

Rezumatul coeficientilor de corelatie parametrici:

DOUA VARIABILE CONTINUE

Date numerice continue: coeficientul de corelatie simpla;

Date numerice continue influentate de o alta variabila: coeficientul de corelatie


partiala.

O VARIABILA CONTINUA SI UNA CATEGORIALA

Dihotomica: coeficientul de corelatie biserial;

Trihotomica: coeficientul de corelatie triserial.

DOUA VARIABILE CATEGORIALE


Date numerice grupate apoi pe categorii: coeficientul eneahoric.

PROBLEME

1. Descrieti printr-o fraza cum evolueaza valorile variabilelor X si Y daca între


cele doua exista o corelatie directa (pozitiva). Dar daca ele ar corela negativ?
2. Ce înseamna o corelatie este semnificativa statistic?
3. Cum credeti ca vor corela urmatoarele variabile?

a) inteligenta si memorie; b) depresie si stima de sine;c) tulburari de învatare si


randamentul scolar

4. Desenati cu aproximatie norul de puncte în cazul corelatiilor: a) r = -.20 b) r


= .80

5.Fie urmatoarele valori pentru variabilele: nivelul de sensibilitate corporala si


gradul de anxietate.

Sensibilitate 4 6 8 7 3 5 4 5
Anxietate 10 13 14 11 8 11 9 12

a. Desenati norul de puncte;


b. Se poate calcula r simplu în cazul de fata?;
c. Stabiliti daca exista vreo asociere liniara semnificativa;
d. Calculati procentul de dispersie explicata de prezenta unui factor comun
între cele doua variabile.

6.Fie urmatoarele valori pentru variabilele frica de esec (un scor mic înseamna o
frica redusa) si rezultatele scolare, exprimate în media generala :

Frica de esec Rezultate Frica de esec Rezultate


8 7,80 9 6,00
5 8,20 5 9,00
8 8,00 6 8,90
7 6,50 4 9,25
6 8,30 7 8,00
7 7,70 5 8,80
7 6,90 9 5,80

a. Reprezentati grafic norul de puncte corespunzator;


b. Ce puteti spune despre aceasta corelatie?;
c. Cum interpretati rezultatele gasite.
7. S-a descoperit ca exista o asociere între veniturile mici ale unei persoane si
gradul de delicventa (r =.67). De asemenea a fost observata o legatura între
gradul de delicventa si densitatea populatiei pe metru patrat (r =.58). În
conditiile în care veniturile populatiei coreleaza slab cu densitatea populatiei
(r =.39), stabiliti ce legatura exista între venituri si delicventa atunci când
eliminam influenta variabilei densitatea populatiei.
8. Fie urmatoarele variabile: nivelul de egosintonie (de apropiere între Eul
actual si cel ideal); usurinta de comunicare; si timiditatea. Toate variabilele
sunt cotate astfel: valorile mici înseamna absenta sau prezenta lor în cantitate
redusa, valorile mari înseamna o cantitate înseamnata.

Ego- Comunicare Timiditate Egosintonie Comunicare Timiditate


Sintonie
12 10 9 8 8 7
10 9 7 5 7 3
8 9 4 8 9 8
9 10 8 9 8 9
6 8 6 10 11 7
8 7 10 8 7 6

a. Stabiliti ce asociere exista între nivelul egostintoniei si usurinta în


comunicare;
b. Stabiliti gradul de asociere dintre egosintonie si usurinta în comunicare
tinând constant efectul timiditatii.
c. Interpretati diferentele gasite.

9. Un numar de 100 de sugari în vârsta de trei zile au fost testati aleator


pentru a vedea câte secunde îsi îndreapta privirea spre doua obiecte: unul
care emana un miros familiar (N=50), iar celalalt unul nefamiliar (N=50).
Media primilor 50 a fost 74,1 sec, iar a celorlalti 50 a fost 64 sec. Abaterea
standard a esantionului a fost 10. Determinati daca exista vreo asociere
semnificativa între durata timpului de privire a obiectului si tipul de miros.
Interpretati rezultatele obtinute.

10. Stabiliti daca exista vreo asociere semnificativa între declaratia


subiectilor "dorm bine" vs. "dorm rau" si numarul de miscari corporale din
timpul somnului. Media miscarilor pentru prima categorie este de 123, iar
pentru a doua de 136, abaterea standard globala fiind 15. Au fost observati
un numar de 60 de subiecti, dintre care 25 au afirmat ca au un somn bun, iar
35 s-au plâns de calitatea acestuia. Interpretati rezultatele obtinute.

https://statisticasociala.tripod.com/cor_par.htm
II. Testarea ipotezelor despre medii simple (z
și t)

Când respingem și când acceptăm ipoteza


Ipoteza pe care cercetătorii o testează se numește ipoteza nulă, notată H0. Pentru fiecare
ipoteză nulă există și o ipoteză alternativă, notată cu HA. Dacă rezultatele obținute sunt
contrare ipotezei nule, atunci aceasta este respinsă. În cazul caz contrar, ipoteza nulă este
acceptată.

Decizia de a respinge ipoteza nulă apare atunci când probabilitatea ca diferența observată să
se datoreze șansei este foarte mică. De obicei, ipoteza nulă este respinsă dacă probabilitatea ca
rezultatul să se datoreze șansei este .05 sau mai mică. Acest criteriu reprezintă nivelul de
semnificație și este notat cu alfa.
Generalitatea proceduri de testare a ipotezelor
În procesul de testare a ipotezelor, o ipoteză nulă este formulată cu privire la un parametru al
populației, alături de o ipoteză alternativă. Apoi este selectat un eșantion al populației pentru
observații. Pe baza acestuia sunt obținute mai multe statistici, precum media. Apoi se
calculează care ar fi rezultatele obținute dacă ipoteza nulă ar fi valabilă. În final, ipoteza nulă
este păstrată dacă rezultatul coincide cu cele expectate dacă ipoteza nulă este valabilă.

Asumpțiile inferențelor despre o singură medie


Pentru ca inferențele statistice cu privire la o singură medie să fie valabile, este nevoie ca
anumite condiții să fie îndeplinite. În primul rând, trebuie selectat un eșantion randomizat din
populație. În al doilea rând, eșantionul trebuie să fie selectat prin eșantionare cu înlocuire. În
al treilea rând, distribuția eșantionării trebuie să prezinte o distribuție normală. În final,
abaterea standard a populației trebuie să fie cunoscută. De multe ori, această valoare este
estimată pe baza valorilor eșantionului.

Estimarea erorii standard


Pentru a testa o ipoteză, este necesară calcularea erorii standard a mediei. Pentru a calcula
eroarea standard, este nevoie să cunoaștem abaterea standard a populației. În practică, aceasta
este estimată pe baza eșantionului.

În mod intuitiv, ne putem gândi să înlocuim abaterea standard a populației cu abaterea


standard a eșantionului. Dar această abordare este problematică. Formula nebiasată a varianței
populației este suma pătratelor diferențelor dintre scor și medie, raportate la n-1. Estimarea
abaterii standard este radical din varianță.

Formula pentru estimarea erorii standard abaterea standard, raportată la radical din N.

Distribuția T
Dacă asumpțiile inferențelor sunt respectate, atunci distribuția Z este una normală, deoarece
valorile mediei vor varia de la un eșantion la altul, dar media populației și eroarea standard a
populației rămân constante. Astfel, z este egal cu diferența dintre o variabilă distribuită
normal și o constantă, adică media populație, raportată la o altă constantă, adică eroarea
standard. Deoarece constantele nu modifică distribuția scorurilor, dacă mediile sunt distribuite
normal, atunci și Z va fi.

În ce privește formula T, aceasta este diferența dintre media eșantionului și media populației,
raportată la abaterea standard. Dacă este calculat T-ul pentru toate eșantioanele, atunci
obținem distribuția T. Aceasta nu are o distribuție normală, fiind numită distribuția T student.

Caracteristicile distribuției T Student


Atunci când mărimea eșantionului este mare, atunci t va semăna cu z, iar distribuția se
apropie de cea normală. Atunci când numărul de grade de libertate este mai mic decât infinit,
distribuția t și distribuția z au anumite puncte în comun – ambele au media egală cu 0, sunt
simetrice și sunt unimodale. La nivelul diferențelor, distribuția t este leptokurtică, are o
abatere standard mai mare și depinde de gradele de libertate.

Pentru un număr infinit al gradelor de libertate, t critic coincide cu z critic. Cu cât mai mică
este valoarea gradelor de libertate, cu atât crește t critic. T este foarte similar cu z atâta timp
cât gradele de libertate sunt mai mari de 100. Pe măsură ce gradele de libertate scad, și
distribuția t de schimbă, la început mai încet, apoi mai abrupt.

Gradele de libertate și distribuția t


Atunci când se calculează abaterea standard, gradele de libertate sunt n-1.

Utilizarea distribuției t
Într-o problemă, știm că scorul gradelor de libertate este 20 și alfa setat este .05. Se cere
valorilor t care stabilesc limita respingerii ipotezei nule. Pentru a face asta, se identifică
valoarea t sub care se află 2.5% din populație și valoarea t peste care se află 2.5% din
populație, ținând cont de gradele de libertate. Valoarea indicată de tabel este +/- 2.086.

Folosind aceleași date, se cere identificarea valorii t pentru care probabilitatea este .05 sau
mai mare. Consultând tabelul, se identifică rândul pentru gradele de libertate egale cu 20.
Apoi se identifcă coloana pentru .05. T-ul identificat este 1.725.

Calcularea t cu scoruri brute


Formula utilizată pentru a calcula t cu scoruri brute este un raport. La numărător se află
diferența dintre media eșantionului și media populației. La numitor se află radical din suma
pătratelor, raportată la produsul dintre n și n-1.

Ipoteze alternative direcționale și nondirecționale


Să luăm exemplul unui profesor care vrea să studieze cantitatea de zahar consumată de
studenți, știind că ceilalți consumă în medie 100 de g de zahăr. În acest caz, ipoteza nulă este
H0 μ=100, iar ipoteza alternativă este HA μ≠100. Această ipoteză este una nondirecțională.

Uneori, poate fi folosită și o ipoteza direcțională. Să spunem că profesorul este interesat de


măsura în care studenții consumă mai mult zahar. În acest caz, ipoteza alternativă este HA:
μ>100. Această ipoteză este una direcțională. Dacă ipoteza este că studenții consumă mai
puțin zahăr, HA: μ<100.

Decizia de a alege o ipoteză direcțională este determinată de raționamentul din spatele


studiului și trebuie stabilită înainte de analiza datelor.

Citirea rapoartelor de cercetare


Atunci când în studii apare expresia „nu a fost semnificativ”, atunci ipoteza nulă nu a fost
respinsă. Dacă nu este raportat nivelul alfa, atunci putem asuma că acesta a fost setat la .05.
cuvântul „semnificativ” se referă la un rezultat cu o probabilitate mică de a se datora șansei.

În raportarea rezultatelor, este importantă să specificăm dacă testul a fost unidirecțional sau
bidirecțional.

Metoda bootstrap
Metoda bootstrap generează noi eșantioane pe baza celui original și nu implică asumpții cu
privire la distribuția scorurilor în populație. Să spunem că avem un eșantion selectat
randomizat de 15 persoane. Fiecare dintre aceste scoruri este copiat de un computer de un
număr mare de ori. Aceste copii sunt combinate, rezultând sute de eșantioane adiționale.

Dacă populația inițială prezintă o distribuție normală, metoda bootstrap și metodele


convenționale sunt la fel de bune. Însă dacă populația inițială deviază de la distribuția
normală, atunci metoda bootstrap este superioară.

Probleme în selectarea unui eșantion randomizat și formularea


unor concluzii
O problemă importantă poate fi generalizarea. Rezultatele studiilor pot fi generalizate doar la
eșantioanele asemănătoare cu cele din studiu.

Conspect al capitolului 14, ”Testing hypotheses about single means (z and t)”, din ”Statistical
reasoning in psychology and education”, de Minium, King și Bear

https://psihoteca.ro/testarea-ipotezelor-despre-medii-simple-z-si-t/

II.1. Tehnici de comparatie între grupuri -


aplicații.
Testele parametrice t si z

Pe lânga studiul asocierii dintre variabile, tehnicile statistice pot fi utilizate si


pentru determinarea diferentelor dintre grupuri. Aceste medode se utilizeaza
frecvent în analiza datelor în cercetarile experimentale.
În acest capitol vom prezenta acele tehnici parametrice care ne permit sa
evaluam efectele unei variabile independente (manipulate de cercetator) sau
categoriale (vârsta, sex, etc) asupra unei variabile dependente în situatia în care se
va lucra cu una sau doua grupe de subiecti.

Cu ajutorul acestor teste statistice se ridica problema daca diferentele


constatate între grupele de subiecti sunt datorate interventiei cercetatorului
(variabilei independente), caracteristicilor variabilei categoriale sau dimpotriva,
întâmplarii.

Exista trei tipuri de tehnici principale care vor fi discutate în acest capitol:

1. Tehnici care privesc diferenta dintre un esantion si media populatiei din


care acesta face parte - "the one simple t Test";
2. Tehnici care privesc diferenta dintre doua grupe independente de subiecti –
"the t test for independent samples";
3. Tehnici care privesc diferenta dintre doua grupe dependente de subiecti –
"the t test for correlated samples".

1. Tehnicile t si z pentru un esantion.

În acest caz dorim sa aflam daca un esntion de subiecti difera de o populatie mai
mare. Sa presupunem ca un test de empatie a fost administrat pe o populatie mare
de subiecti elevi abia intrati la liceu (N= 1000), iar media obtinuta pe întreaga
populatie testata a fost de 76. Când s-a efectuat acelasi test pe o clasa de elevi de
n=32 subiecti, s-a obtinut media de 81 si o estimare a abaterii standard de 9(s). Se
pune problema daca elevii din aceasta clasa au un nivel de empatie diferit de media
specifica pentru clasa a IX-a.

Pentru solutionarea acestei probleme exista doua teste statistice adecvate, si anume
testele z si t.

Vom utiliza testul z daca:


- se cunoaste abaterea standard a variabilei dependente la nivelul populatiei;
- daca numarul de subiecti cuprinsi în esantionul comparativ este suficient
de mare (de regula peste 30 de subiecti).

În situatia în care una din cele doua conditii nu sunt îndeplinite, utilizam testul t
pentru un esantion.

În problema de fata se observa ca nu putem aplica testul z desi avem un esantion


comparativ destul de mare n=32 (mai mare decat 30) deoarece nu se cunoaste
abaterea standard a populatiei din care face parte esantionul.
Ca urmare, calculam testul t care valideaza sau infirma ipoteza nula potrivit careia,
nu exista nici o diferenta între media (m) obtinuta pe esantion de subiecti (n= 32) si
media (m ) obtinuta pe populatia din care a fost extras esantionul.

Matematic, ipoteza nula si cea de lucru (alternativa) se formuleaza astfel:

Ho: M = m

H1a: M > m < M

H1b: M > m ori M < m

În cazul H1a ipoteza alternativa specifica ca exista o diferenta între cele doua medii
fara a arata directia acestei diferente. În acest caz avem de a face cu un test t
bilateral (two-tailed test).

În cazul H1b ipoteza alternativa specifica directia diferentei între cele doua medii -
o medie este mai mica (mare) decât cealalta datorita unor considerente teoretice.
Aceasta situatie necesita un test t unilateral (one-tailed).

Cele doua tipuri de test t utilizeaza aceeasi formula, specificul unilateral vs.
bilateral influentând doar valorile comparative prezente în tabelul lui t.

Formula lui t este:

Unde: - M este media esantionului

a. miu este media populatiei din care face parte esantionul;


b. EEM este eroarea standard a mediei esantionului;

Unde: s este estimarea abaterii standard a esantionului (s=9); n este volumul


(marimea) esantionului (n=32)

Înlocuind datele problemei prezentate în formula lui t data mai sus obtinem:
Urmatorul pas care trebuie facut dupa calcularea lui t este de a compara
valoarea obtinuta cu cea corespunzatoare în tabelul lui t. Daca valoarea calculata
este mai mare decât cea din tabel ipoteza nula este respinsa. Pentru aceasta sunt
necesari trei pasi:

a. Stabilirea gradelor de libertate. Numarul de grade de libertate notate cu df se


obtine din numarul de subiecti cuprinsi în esantionul de comparatie, asupra
caruia se opereaza cu o corectie de deviere. Calcularea gradelor de libertate
pentru acesta situatie se face astfel: df = n-1. Pentru exemplul dat avem 31 df
(32-1) grade de libertate.
b. Al doilea pas intermediar este alegerea tipului de situatie a lui t, între t
unilateral sau t bilateral. Aceasta alegere se face dependent de cunostintele
teoretice implicate în problema. Daca avem motive sa credem datorita unor
caracteristici speciale ca media esantionului comparativ este mai mare (sau
mai mica) decât media populatiei din care face parte esantionul vom utiliza
valorile testului t unilateral din tabel. Daca consideram ca cele doua medii
difera semnificativ, fara a putea anticipa ca una ar fi mai mare decât cealalta
dintr-o perspectiva teoretica exprimata în ipoteza de lucru vom utiliza
valorile lui t bilateral din tabelul lui t. În exemplul dat nu exista nici o
premisa care sa ne îndreptateasca sa consideram ca una din medii este mai
mare decât cealalta, de aceea vom consulta valorile lui t bilateral.
c. Stabilirea pragului de semnificatie p. Practica statistica considera necesara
stabilirea unui nivel de încredere de maxim 0,05(.05).

Revenind la problema data, urmeaza sa consultam tabelul lui t pentru a


compara valoarea obtinuta de noi t=3,14 cu valoarea prezentata în tabel pentru 31
df (grade de libertate) pentru t bilateral la un prag de semnificatie de p£ .05.

Deoarece în tabel nu sunt prezentate valorile lui t pentru 31 df, ne uitam la


valoarea cea mai apropiata, dar anterioara acestor grade de libertate. Astfel, la 30
df, valoarea lui t bilateral pentru un p < .05 este 2,042.

Se poate observa ca valoarea obtinuta de noi t=3,14 este mai mare decât
valoarea din tabel t=2,042, situatie care se interpreteaza astfel: ipoteza nula este
respinsa, ca urmare rezultatele obtinute nu pot fi puse în totalitate pe seama
întâmplarii, deci exista o diferenta semnificativa din punct de vedere statistic în ce
priveste diferenta dintre cele doua medii. Rezultatul obtinut se noteaza matematic
astfel:

t(31)=3,14, p < .05.

Marimea efectului

Verificarea ipotezelor raspunde la întrebarea daca esantionul extras are


caracteristici diferite fata de populatia specificata în ipoteza nula. Daca obtinem o
diferenta semnificativa statistic ne putem pune o întrebare suplimentara: Cât de
mare este aceasta diferenta? Pentru aceasta se calculeaza marimea efectului propus
de Cohen si notat cu d.

Indexul marimii efectului pentru testul t în cazul de fata este dependent de


datele oferite în problema:

a) Daca se cunoaste abaterea standard a populatiei, iar esantionul comparativ este


sub 30 de subiecti (testul t), vom utiliza urmatoarea formula:

Unde: - M este media esantionului supus comparatiei;

- m este media populatiei în ce priveste variabila urmarita;

- s este abaterea standard a variabilei de interes la nivelul populatiei.

b) Daca nu se cunoaste abaterea standard a populatiei, iar esantionul de


comparatie are sub 30 de subiecti (testul t) -cazul problemei data exemplu- avem o
formula apropiata de calcul a marimii efectului:

Unde: - M si m au aceeasi semnificatie;

c. s reprezinta estimarea abaterii standard a variabilei de interes la


nivelul populatiei pornind d la grupul comparativ (în problema
data s=9 ).

Putem calcula marimea efectului înlocuind datele problemei prezentate.

Interpretarea acestei valori obtinute se face prin raportarea ei la conventia


propusa de Cohen si adoptata de cercetatori:

d. Efect mic d = .20;


e. Efect mediu d = .50;
f. Efect mare d = .80
Marimea efectului obtinuta de noi a fost de .55 ceea ce înseamna ca am
obtinut o valoare medie. Revenind la întrebare: Cât de mare este aceasta diferenta?
Putem afirma ca diferenta statistica are o valoare medie.

Valoarea lui d are o importanta deosebita în determinarea puterii experimentului si


în calcularea marimii esantionului necesar pentru a da credibilitate cercetarii
efectuate.

Calcularea testului z necesita utilizarea formulei:

Unde: - M este media esantionului comparat;


- m este media populatiei;
- EEm este eroarea standard a mediei populatiei.

Unde: - s (sigma) este abaterea standard a populatiei;


- N este volumul esantionului comparat.

Sa presupunem ca în problema anterioara pe lânga media (m = 76) obtinuta la proba


de empatie la nivelul populatiei era specificata si abaterea standard (s = 8).

În acest caz, se aplica testul z pentru ca stim valoarea abaterii standard a


populatiei , iar volumul esantionului de comparatie n era peste 30 subiecti (n=32).

Interpretarea valorii lui z obtinute se face raportând aceasta valoare la


valorile standardizate ale lui z. Spre deosebire de testul t, care necesita consultarea
tabelului t în vederea admiterii sau respingerii ipotezei nule, în cazul testului z,
valoarea obtinuta se confrunta cu patru valori standardizate:

Testul bilateral: z = 1,96 pentru un p < .05

z = 2,58 pentru un p < .01

Testul unilateral: z = 1,65 pentru un p < .05

z = 2,33 pentru un p < .01


În cazul de fata am obtinut un z = 3,53, valoare superioara celor prezentate mai sus.
Acest fapt înseamna ca ipoteza nula este respinsa, existând o diferenta
semnificativa între mediile celor doua grupe de subiecti care nu poate fi datorata în
întregime întâmplarii.

Si în acest caz poate fi calculata marimea efectului, formula fiind asemanatoare cu


prima cu exceptia înlocuirii abaterii standard a esantionului comparat (s) cu
abaterea standard a populatiei (s ).

Interpretarea lui d se face asemanator cu modelul explicat anterior. Putem trage


concluzia ca rezultatul obtinut, d=0,62, înseamna un efect de valoare medie.

2. Testele t si z pentru doua esantioane independente

Testele t si z aplicate anterior pentru a determina daca un esantion difera de o


populatie nu se aplica prea frecvent. Mai des sunt utilizate testele z si t pentru
esantioane independente pentru a determina daca mediile a doua esantioane difera
semnificativ.

Doua probleme trebuie clarificate de la început. Când aplicam testul t si când


aplicam testul z? Cum diferentiem esantioanele independente de cele dependente?

La prima întrebare, utilizam aceleasi criterii prezentate în cazul unui singur


esantion comparat cu o populatie anume. Se iau în considerare cunoasterea abaterii
standard a celor doua esantioane si a volumului acestora. În cazul esantioanelor
dependente sau independente, prima conditie este atinsa mult mai usor, de aceea
criteriul hotarâtor în alegerea tipului de test (t sau z) este volumul esantionului.
Exista conform teoremei limita centrala o evolutie a distributiei datelor în functie
de numarul de subiecti. Se considera si se accepta de majoritatea cercetatorilor, ca
un esantion de 30 de subiecti sau mai mult are o distributie normala a datelor z. Un
numar mai mic de 30 de subiecti determina o distributie asimetrica a datelor de tip
t. Chiar daca se utilizeaza o împartire grosiera, s-a stabilit de catre cercetatori
urmatoarea clauza pentru cazul a doua esantioane:

a. Daca n1 < 30 (numarul de subiecti din prima grupa) si n2 < 30 (numarul de


subiecti din a doua grupa) se aplica testul t.
b. Daca n1 ³ 30 si n2 ³ 30 se aplica testul z.

În ce priveste diferentierea între testele independente si dependente, aceasta


se face în functie de natura esantionului cuprins în experiment. Apar doua situatii:
a. Daca cele doua esantioane sunt alese la întâmplare pe baza situatiei lor
naturale (ex. Doua clase paralele, doua grupe de vârsta etc) se utilizeaza
testele independente.
b. Daca cele doua esantioane sunt în relatie unul cu celalalt prin interventia
experimentatorului se utilizeaza testele dependente. Uzual, exista doua
situatii în care avem de a face cu esantioane dependente:

 doua grupe de subiecti sunt formate dupa una sau mai multe caracteristic
prealabile. Spre exemplu, aplicam un test preliminar în functie de care
împartim subiectii pe grupe astfel încât grupele sunt echilibrate, fiecarui
subiect din grupa A corespunzându-i un participant din grupa B;
 o grupa de subiecti este testata de doua ori asupra aceleiasi variabile (pre-test
si post-test), experimentatorul fiind interesat de modificarile aparute între
cele doua testari.

Testul t independent
Exemplu: Un cercetator doreste sa studieze daca strategiile sintetice conduc
la rezultate diferite fata de strategiile analitice în ce priveste deprinderea citirii la
elevii de clasa I. El utilizeaza în acest sens 2 clase (esantioane) de câte 15 elevi
fiecare, în care deprinderea citirii s-a facut diferit (într-o clasa analitic, în cealalta
sintetic). Variabila dependenta din acest studiu a constat într-o proba de
performanta de citire (numar de cuvinte pe minut / numarul de erori).

Primul grup de elevi a fost învatat sa citeasca analitic (începând cu litera si


terminând cu cuvântul) a obtinut o medie de 12,4 cuvinte/minut si o abatere
standard de 1,5. Cel de-al doilea grup a fost învatat sa citeasca într-o maniera
sintetica (pornind de la asocierea cuvântului cu o imagine pentru fiecare litera). S-a
obtinut o medie de 10 cuvinte pe minut si o abatere standard de 0,9. Se pune
problema daca exista o diferenta semnificativa între cele doua medii, implicit între
cele doua strategii de învatare a citirii.

Pentru a rezolva aceasta problema trebuie sa identificam mai întâi metoda


statistica care trebuie utilizata. Observam ca grupele sunt independente, ca numarul
subiectilor din fiecare grupa este mai mic decât 30, ca urmare putem utiliza testul t
independent.

Unde: M1 si M2 reprezinta mediile celor doua esantioane; EEM1-M2 reprezinta


eroarea standard a diferentei dintre cele doua medii.
Unde: s1² reprezinta dispersia primului grup (abaterea standard la patrat); s2²
reprezinta dispersia celui de-al doilea grup; n1 - numarul de subiecti din primul
grup; n2 - numarul de subiecti din al doilea grup.

Daca n1 este egal n2 avem o formula (a), aplicabila si în exemplul oferit,


daca n1 este diferit de n2 vom utiliza o alta formula (b).

a)

(b) Pentru n1 diferit de n2 avem:

În cazul problemei date referitoare la deprinderea de a citi în clasa I dupa


cele doua metode, numarul de elevi din cele doua esantioane este egal (n1=n2=15),
de aceea vom aplica una din cele doua formule de calcul a erorii standard a
diferentelor dintre medii (nu si formula prezentata la punctul b). Deoarece se
cunosc dispersiile (patratul abeterii standard) si mediile esntioanelor la proba de
performanta vom aplica prima formula, pe care o vom integra în formula de calcul
al testului t independent.

Dupa calcularea lui t independent va trebui sa comparam valoarea obtinuta


cu valoarea data în tabelul lui t. Pentru aceasta sunt necesari pasii intermediari
descrisi în cazul lui t pentru un esantion:

a. Stabilirea gradelor de libertate (pentru a cunoaste valoarea din tabel a lui t


care va fi comparata cu valoarea obtinuta de noi). Calcularea gradelor de
libertate pentru testul t independent se face astfel: df = (n1 + n2) - 2. În cazul
de fata avem 28 df (15 + 15 - 2) grade de libertate.
b. Al doilea pas intermediar este alegerea tipului de situatie a lui t, adica avem
un test t unilateral sau bilateral. În acest caz se utilizeaza testul t independent
bilateral. Daca cercetatorul dorea sa demonstreze ca strategia analitica este
mai eficienta decât cea sintetica (sau invers), adica M1 > M2 sau M1 < M2
s-ar fi aplicat testul t independent unilateral.
c. Stabilirea valorii lui t conform pragului de semnificatie ales. Practica
statistica considera necesara stabilirea unui nivel de încredere de maximum
0,05(.05).

Urmarind în tabel valoarea lui t bilateral pentru 28 df si p de .05, gasim


valoarea 2,048. Deoarece valoarea gasita de noi t= 5,314 este mult mai mare decât
cea din tabel respingem ipoteza nula Ho: M1 = M2 si concluzionam ca exista o
diferenta semnificativa statistic în ce priveste performantele elevilor în citire în
functie de strategia adoptata în învatarea citirii de catre copii. Matematic vom scrie:

t(28) = 5,314, p< .05 test bilateral.

Inspectând datele problemei se constata ca elevii care au utilizat strategia


analitica în deprinderea citirii, au obtinut rezultate mai bune la citire decât grupul
de elevi care au utilizat o strategie globala (sintetica) în deprinderea citirii.

Deoarece rezultatul obtinut (5,314) este mai mare decât valorile tabelare a lui
t pentru p =.02 (2,467); p=.01 (2,763); sau p=.001 (3,674) putem prezenta rezultatul
obtinut ca fiind semnificativ si la acesta din urma valoare (exista 1 la 1000 sanse ca
rezultatul obtinut sa se datoreze întâmplarii). În acest caz notam: t(28) = 5,314,
p< .001 test bilateral.

În cazul în care numarul de subiecti din cele doua grupe nu era egal
(n1 ¹ n2) am fi aplicat o alta formula pentru calculul lui t (formula ce includea
dispersiile celor doua grupe sau formula prezentata la punctul b). Dupa aflarea
valorii lui t, se urmareste acelasi algoritm prezentat mai sus.

Marimea efectului

Ea ofera informatii importante pe care testul t nu le ofera. Acesta din urma


arata doar daca ipoteza nula este respinsa si daca exista sau nu o diferenta
semnificativa între mediile celor doua grupe de subiecti. Marimea efectului arata
care este efectul variabilei independente în determinarea diferentei dintre medii. În
cazul testului t independent avem mai multe formule de calcul ale marimii efectului
(d):
Unde : M1 si M2 sunt mediile celor doua grupe de subiecti; s înseamna estimarea
abaterii standard (la numnaratorul lui s vom avea N-1).

Întrebarea care se pune este care abatere standard trebuie aplicata. Exista o mare
controversa între statisticieni. Unii cred ca trebuie utilizata abaterea standard a
grupului de control daca acesta exista.

Atunci când nu exista un grup de control (cazul exemplului nostru), se recomanda


utilizarea unor formule mediate de abatere standard.

a) daca n1 = n2, atunci:

Unde: M1 si M2 sunt mediile celor doua grupe; n1 este numarul de subiecti dintr-o
grupa (n1 egal cu n2); s1² si s2² sunt dispersiile celor doua grupe (abaterile standard
la patrat).

În cazul problemei oferite drept model se observa ca cele doua esantioane sunt
egale (n1 = n2) si nu exista un grup de control (strategii analitice vs. strategii
sintetice). Astfel vom obtine:

Interpretarea lui d se face identic cu cea prezentata în cazul lui t pentru un


esantion. Se observa în acest sens ca valoarea obtinuta înseamna un efect mare al
variabilei independente (strategii analitice vs. sintetice) în determinarea rezultatelor
la proba performantiala de citire.

b) daca n1 ¹ n2 se utilizeaza o alta formula de calcul a abaterii standard mediate:

Unde: s1 si s2 sunt dispersiile grupelor 1 respectiv 2; N1 si n2 sunt numarul de


subiecti din grupele 1, respectiv 2.
Pentru a calcula d (marimea efectului) în acest caz se înlocuieste simbolul s de la
numitor cu formula prezentata mai sus.

Testul z pentru esantioane independente


În situatia în care n1 > 30 si n2 > 30 si a doua esantioane independente
aplicam testul z. Formula de calcul este:

Dupa cum se observa formula de calcul a lui z în aceasta situatie este


identica cu cea a lui t independent pentru n1 = n2. Spre deosebire de testul t
independent, testul z are aceeasi formula si în cazul în care n1 ¹ n2.

Rezultatul obtinut este comparat cu cele doua valori standardizate z (1,96


pentru p < .05, respectiv 2,58 pentru p < .01 pentru testul bilateral, respectiv cu
1,65 pentru p < .05, respectiv 2,33 pentru p < .01 pentru testul unilateral).
Algoritmul rezolvarii problemelor care necesita testul z este asemanator cu cel
prezentat în cazul lui z pentru un esantion.

OBSERVATII: Se observa ca formula pentru testul z este identica cu cea a


testului t independent pentru esantioane egale. De altfel, tendinta ultimilor ani este
de a înlocui testul z cu testul t. Acestea sunt si recomandarile revistelor de cercetare
stiintifica patronate de Asociatia Psihologilor Americani. Tot în acest sens
programe de statistica computerizate precum SPSS au renuntat la testul z în
favoarea testului t.

Testul t poate fi utilizat prin formulele prezentate mai sus si în cazul


esantioanelor mai mari decât 30 de subiecti fiecare.

3. Testele t si z pentru esantioane dependente

Pâna acum am luat în considerare utilizarea testelor t si z pentru a evalua


daca un esantion difera de populatia din care se presupune ca face parte (testele t si
z pentru un esantion) si situatia compararii a doua esantioane independente (testele
t si z independent).
O a treia aplicatie este cazul a doua esantioane dependente. Aceasta
înseamna ca elementele componente ale celor doua grupe sunt în relatie de
corespondenta.

Exista trei situatii în care se aplica testele de comparatie dependente (corelate):

a. Perechile naturale: acestea nu sunt realizate de experimentator ci exista în


mod natural. Spre exemplu, o cercetare care ar privi nivelul de rasism pe
doua grupe de subiecti de sex masculin: o grupa formata din tati, iar o alta
din fiii lor. Acestia trebuie grupati în concordanta astfel încât fiecarui tata sa-
i corespunda fiul sau. Apropiat de aceasta situatie este si studiul gemenilor
care trebuie împartiti în mod randomizat în doua grupe. Diferenta care apare
între cele doua exemple este data de simetria relatiei gemenilor (care pot fi
împartiti aleator în grupe, pastrând însa criteriul familial) si asimetria relatiei
tata-fiu (care trebuie sa fie separati în doua grupe tati, respectiv fii, pastrând
însa acelasi criteriu familal).
b. Perechile artificiale: acestea sunt realizate de catre experimentator pentru a
egaliza cât mai mult grupele de subiecti. Daca un cercetator doreste sa
studieze efectul atmosferei de lucru asupra rezolvarii de probleme, el poate
decide sa împarta subiectii pe grupe în perechi. Criteriul de divizare are la
baza rezultatul obtinut la testul de inteligenta deoarece acest factor
influenteaza capacitatea de rezolvare a problemelor. Pentru aceasta
cercetatorul ia primii doi subiecti în ce priveste nivelul de inteligenta si îi
împarte randomizat în cele doua grupe (o grupa care lucreaza într-o
atmosfera amiabila; cealalta grupa care va lucra într-o atmosfera
tensionanta); apoi trece la urmatorii doi subiecti din perspectiva rezultatelor
la testul de inteligenta pe care-i împarte în cele doua grupe. Se continua
algoritmul pâna sunt divizati toti subiectii. Este necesar un numar par de
subiecti, astfel încât grupele obtinute sa fie egale ca volum.
c. Masuratori repetate: reprezinta cazurile mai des întâlnite în special în terapie
si recuperare. Este vorba în aceasta situatie de un singur grup de subiecti care
vor fi testati de doua ori (înainte si dupa introducerea variabilei
independente). Pentru clarificare vom prezenta o problema care necesita
utilizarea testului t dependent si care se încadreaza în aceasta ultima
categorie amintita.

Testul t dependent
(n1 < 30 si n2 < 30)

Un cercetator doreste sa studieze influenta metodelor de relaxare asupra


reducerii conduitelor agresive la adolescenti. O grupa de 12 subiecti cu tulburari
comportamentale este testata initial (pre-test) în ce priveste nivelul agresivitatii.
Dupa acest moment, cei 12 adolescenti sunt învatati sa practice relaxarea si
urmeaza sedinte de relaxare de câte 1 ora de 5 ori pa saptamâna.
Dupa o perioada de 2 luni subiectii sunt retestati (post-test) utilizând aceeasi
proba pentru a observa daca nivelul lor de agresivitate a scazut în urma practicarii
metodelor de relaxare.

Prezentam mai jos datele obtinute de cei 12 adolescenti la chestionarul de


agresivitate pe parcursul celor doua testari.

Subiectul Pre Post Pre-Post Diferenta²


1 21 15 6 36
2 18 13 5 25
3 15 16 -1 1
4 11 13 -2 4
5 24 13 11 121
6 23 12 11 121
7 17 11 6 36
8 19 10 9 81
9 19 15 4 16
10 17 17 0 0
11 20 14 6 36
12 15 16 -1 1

M1=18,25 M2=13,75 S d= 54 S d patrat=478

Formula lui t dependent este:

Unde: M1 si M2 sunt mediile celor doua grupe;

EEd este eroarea standard a diferentei (d)

Pentru a calcula EEd utilizam una din formulele:

Unde: d este diferenta dintre pre-test si post-test, între pozitia unu în prima grupa si
pozitia unu din a doua grua s.a.m.d.;

N este numarul de perechi de subiecti (în cazul problemei date 12).

sau
Unde: s1 patrat si s2 patrat sunt dispersiile celor doua grupe;

n1 si n2 sune egale si reprezinta numarul de perechi de subiecti;

r12 este coeficientul de corelatie între datele celor doua grupe; s1 si s2


sunt abaterile standard a celor doua grupe.

Observând datele care ne sunt cunoscute în problema trebuie sa calculam t


dependent utilizând prima formula a lui EEd.

Dupa calcularea lui t dependent va trebui sa comparam valoarea obtinuta cu


valoarea data în tabelul lui t. Pentru aceasta vom utiliza acelasi algoritm descris în
cazul lui t pentru un esantion si t independent:

a. Stabilirea gradelor de libertate (pentru a cunoaste valoarea din tabel a lui t


care va fi comparata cu valoarea obtinuta de noi). Calcularea gradelor de
libertate pentru testul t dependent se face astfel: df = n-1. În cazul de fata
avem 11 df (12 perechi de date - 1) grade de libertate.
b. Al doilea pas intermediar este alegerea tipului de situatie a lui t, adica avem
un test t unilateral sau bilateral. Observam ca cercetatorul a presupus ca
metodele de relaxare vor conduce la scaderea nivelului agresivitatii. Ipoteza
de lucru (alternativa) este: H1: M1 > M2, în timp ce ipoteza nula este M1 =
M2. În acest caz se utilizeaza testul t independent unilateral. Daca
cercetatorul dorea sa demonstreze ca nivelul agresivitatii înainte de utilizarea
relaxarii este diferit de nivelul agresivitatii post-test adica M1 ¹ M2 ca
ipoteza de lucru, atunci s-ar fi aplicat testul t independent bilateral.
c. Urmarirea valorii lui t conform pragului de semnificatie ales. Practica
statistica considera necesara stabilirea unui nivel de încredere de maxim
0,05(.05).

Se compara valoarea obtinuta de noi t=0,973 cu cea exprimata în tabelul de


distributie a lui t unilateral pentru 11 df (grade de libertate) si un prag de
semnificatie stabilit de p< .05. Valoarea din tabel este de 1,796 (mai mare decât
valoarea gasita de noi) ceea ce înseamna ca ipoteza nula nu poate fi respinsa, deci
nu s-a gasit o diferenta semnificativa statistic între cele doua grupe. Transpusa la
problema de fata înseamna ca relaxarea nu a avut un efect semnificativ în reducerea
nivelului agresivitatii.

Marimea efectului.

Se calculeaza si în cazul testului t dependent dupa urmatoarea formula:

Algoritmul de interpretare a marimii efectului (d) este asemanator cu cel


prezentat la celelalte categorii de test t descrise anterior. Trebuie însa reamintit ca
acest index al efectului variabilei independente asupra celei dependente se
calculeaza numai în situatiile în care testul t a fost semnificativ, iar ipoteza nula a
fost respinsa.

În cazul problemei date anterior nu putem calcula marimea efectului


deoarece rezultatul obtinut de noi nu a fost semnificativ statistic.

Testul z dependent
(n1 > 30; n2 > 30)

Acesta poate fi utilizat în cazul esantioanelor mai mari de 30 de subiecti


fiecare. În aceasta situatie EEd (eroarea standard a diferentei se calculeaza utilizând
formula prezentata pentru t dependent care contine coeficientul de corelatie r12.

Interpretarea rezultatului obtinut se face dupa acelasi algoritm prezentat si la


celelalte teste z pentru un esantion si doua esantioane independente.

Consideratiile facute în cazul testului z independent cu privire la tendinta


actuala de a înlocui testul z cu testul t chiar în cazul esantioanelor mai mari de 30
de subiecti ramâne valida si pentru testelor dependente.

Asumptiile distributiei t

Pentru ca testele t studiate în acest capitol sa fie aplicate trebuie îndeplinite mai
multe conditii:

Testul t pentru un esantion

1. Esantionarea sa fie simpla aleatoare;


2. Datele masurate sa fie pe scala de interval sau raport;
3. Rezultatele variabilei dependente sa fie normal distribuite (în cazul în care n
este mai mic de 30, se urmareste forma distributiei datelor, astfel încât
indicatorii de oblicitate (skewness) si de boltire (kurtosis) sa fie cât mai
apropiate de zero (maxim doi).

Testul t pentru doua esantioane independente

Ramân valabile primele trei asumptii la care se adauga înca doua:

4. Independenta grupurilor;
5. Omogenitatea variantei, adica grupurile trebuie sa provina din esantioane cu
dispersii egale (raportul lor sa fie cât mai apropape de unu).

Testul t pentru doua esantioane dependente

Ramân valabile primele trei asumptii la care se adauga o conditie suplimentara.

4. Normalitatea diferentelor dintre scorurile obtinute la pre-test si post-test.


Aceasta se constata pe baza consultarii indicatorilor de oblicitate
(skewness) si de boltire (kurtosis).

PROBLEME

1. Cititi valorile tabelare ale lui t pentru:


a) alfa = .01 df = 17 (t bilateral);

b) alfa = .05 df = 26 (t bilateral);

c) alfa = .05 df = 7 (t unilateral).

2. Daca un cercetator alege sa utilizeze un nivel alfa de .01 ¾n locul unui alfa
de .05 ¾nseamna ca el stabileste un criteriu:

a) mai conservator; b) la fel de strict; c) mai permisiv.

3. Valoarea medie pentru populatia pe care s-a etalonat o proba de extraversie este
de 50, iar abaterea standard este 10,2. Sa presupunem ca 16 persoane care lucreaza
în comert cu succes au obtinut o medie de 56,10 si o abatere standard de 10 la
acelasi test. Calculati testul t si scrieti concluziile.

4. Un grup de 49 de subiecti au participat timp de un an de zile la un program de


promovare a drepturilor minoritatilor. La final au fost rugati sa completeze o scala
de evaluare a atitudinilor fata de minoritati. Au obtinut o medie de 12,50 si o
abatere de 3. La nivelul populatiei generale media a fost de 12 si abaterea de 2.
Utilizati metoda adecvata pentru a verifica ipoteza urmatoare: programul a fost
eficient (a crescut toleranta fata de minoritati), existând diferente în plan atitudinal
între cele doua rezultate la un prag p de .05.

5. Pentru situatia prezentata la punctul 4, calculati marimea efectului.

6. Identificati variabilele independente si cele dependente în urmatoarele situatii:

a. comparati persoanele cu o personalitate de tip A fata de cea de tip B, în ce


priveste gradul de satisfactie în viata;
b. comparati o metoda didactica noua cu una veche din perspectiva
randamentului scolar.

7. Stabiliti numarul de grade de libertate adecvate pentru testul t în cazul a


doua esantioane independente:

a) N b) N-1 c) N1+N2-2 d) N-2

8. Stabiliti numarul de grade de libertate adecvate pentru testul t în cazul a doua


esantioane dependente:

a) N b) N-1 c) N1+N2-2 d) N-2

9. Decideti daca în urmatoarele cazuri avem nevoie de un test t independent sau de


un test t dependent:

a. compararea rezultatelor la proba de audiometrie pentru fiecare ureche


utilizând aceeasi subiecti;
b. compararea rezultatelor la audiometrie în conditiile în care o parte a
subiectilor au fost testati aleator la urechea stânga, cealalta parte fiind
evaluata la urechea dreapta;
c. comparati stilul de comunicare la gemeni, în conditiile în care acestia au fost
despartiti în doua grupe diferite echivalente;
d. comparati capacitatea de rezolvare a problemelor, în conditiile în care cele
doua grupe au fost formate pe baza unui test de inteligenta dat anterior
pentru a egaliza grupele din perspectiva acestui criteriu.

10. Stabiliti daca valoarea t sau z este semnificativa statistic în conditiile a doua
esantioane independente si în cazul testului bilateral:

a. n1 = 23; n2 = 23; s1 = 4; s2 = 5; m1 = 14,5; m2 = 12,8;


b. n1 = 32; n2 = 31; s1 = 6; s2 = 5; m1 = 20,1; m2 = 23,4;
c. n1 = 31; n2 = 29; s1 = 2; s2 = 2; m1 = 11; m2 = 11,9;
d)

A 7 8 6 8 9 7 8 6 8 6
B 6 7 5 6 7 6 7 6 6 5

e)

A 7 8 6 8 9 7 8 6 8 6
B 6 7 5 6 7 6 7 6

11. Stabiliti daca valoarea t sau z este semnificativa statistic în conditiile a doua
esantioane corelate (dependente) în care:

a) n1 = 28; n2 = 28; s1 = 6; s2 = 5; m1 = 20,1; m2 = 23,5; r = -.61;

b)

A 34 22 25 31 27 32 29 26
B 38 19 36 40 36 31 36 37

c). n1 = 36; n2 = 36; s1 = 1; s2 = 1; m1 = 7; m2 = 6; r = .41.

https://statisticasociala.tripod.com/teh_par.htm

TABELE

1. Valorile z corespunzatoare unei curbe normale


Z unilateral bilateral Z unilateral bilateral
Sub Rest Sub Rest Sub Rest Sub Rest
curba curba curba curba
0.00 .5000 .5000 1 .0000 1.17 .1210 .8790 .2420 .7580
0.01 .4960 .5040 .9920 .0080 1.18 .1190 .8810 .2380 .7620
0.02 .4920 .5080 .9840 .0160 1.19 .1170 .8830 .2340 .7660
0.03 .4880 .5120 .9761 .0239 1.20 .1151 .8049 .2301 .7699
0.04 .4840 .5160 .9681 .0319 1.21 .1131 .8869 .2263 .7737
0.05 .4801 .5199 .9601 .0399 1.22 .1112 .8888 .2225 .7775
0.06 .4761 .5239 .9522 .0478 1.23 .1093 .8907 .2187 .7813
0.07 .4721 .5279 .9442 .0558 1.24 .1075 .8925 .2150 .7850
0.08 .4681 .5319 .9362 .0638 1.25 .1056 .8944 .2113 .7887
0.09 .4641 .5359 .9283 .0717 1.26 .1038 .8962 .2077 .7923
0.10 .4602 .5398 .9203 .0797 1.27 .1020 .8980 .2041 .7959
0.11 .4562 .5438 .9124 .0876 1.28 .1003 .8997 .2005 .7995
0.12 .4522 .5478 .9045 .0955 1.29 .0985 .9015 .1971 .8029
0.13 .4483 .5517 .8966 .1034 1.30 .0968 .9032 .1936 .8064
0.14 .4443 .5557 .8887 .1113 1.31 .0951 .9049 .1902 .8098
0.15 .4404 .5596 .8808 .1192 1.32 .0934 .9066 .1868 .8132
0.16 .4364 .5636 .8729 .1271 1.33 .0918 .9082 .1835 .8165
0.17 .4325 .5675 .8650 .1350 1.34 .0901 .9099 .1802 .8198
0.18 .4286 .5714 .8571 .1429 1.35 .0885 .9115 .1770 .8230
0.19 .4247 .5753 .8493 .1507 1.36 .0869 .9131 .1738 .8262
0.20 .4207 .5793 .8415 .1585 1.37 .0853 .9147 .1707 .8293
0.21 .4168 .5832 .8337 .1663 1.38 .0838 .9162 .1676 .8324
0.22 .4129 .5871 .8259 .1741 1.39 .0823 .9177 .1645 .8355
0.23 .4090 .5910 .8181 .1819 1.40 .0808 .9192 .1615 .8385
0.24 .4052 .5948 .8103 .1897 1.41 .0793 .9207 .1585 .8415
0.25 .4013 .5987 .8026 .1974 1.42 .0778 .9222 .1556 .8444
0.26 .3974 .6026 .7949 .2051 1.43 .0764 .9236 .1527 .8473
0.27 .3936 .6064 .7872 .2128 1.44 .0749 .9251 .1499 .8501
0.28 .3897 .6103 .7795 .2205 1.45 .0735 .9265 .1471 .8529
0.29 .3859 .6141 .7718 .2282 1.46 .0721 .9279 .1443 .8567
0.30 .3821 .6179 .7642 .2358 1.47 .0708 .9292 .1416 .8584
0.31 .3783 .6217 .7566 .2434 1.48 .0694 .9306 .1389 .8611
0.32 .3745 .6255 .7490 .2510 1.49 .0681 .9319 .1362 .8638
0.33 .3707 .6293 .7414 .2586 1.50 .0668 .9332 .1336 .8664
0.34 .3669 .6331 .7339 .2661 1.51 .0655 .9345 .1310 .8690
0.35 .3632 .6368 .7263 .2737 1.52 .0643 .9357 .1285 .8715
0.36 .3594 .6406 .7188 .2812 1.53 .0630 .9370 .1260 .8740
0.37 .3557 .6443 .7114 .2886 1.54 .0618 .9382 .1236 .8764
0.38 .3520 .6480 .7039 .2961 1.55 .0606 .9394 .1211 .8789
0.39 .3483 .6517 .6965 .3035 1.56 .0594 .9406 .1188 .8812
0.40 .3446 .6554 .6892 .3108 1.57 .0582 .9418 .1164 .8836
0.41 .3409 .6591 .6818 .3182 1.58 .0571 .9429 .1141 .8859
0.42 .3372 .6628 .6745 .3255 1.59 .0559 .9441 .1118 .8882
0.43 .3336 .6664 .6672 .3328 1.60 .0548 9452 .1096 .8904
0.44 .3300 .6700 .6599 .3401 1.61 .0537 .9463 .1074 .8926
0.45 .3264 .6736 .6527 .3473 1.62 .0526 .9474 .1052 .8948
0.46 .3228 .6772 .6455 .3545 1.63 .0516 .9484 .1031 .8969
0.47 .3192 .6808 .6384 .3616 1.64 .0505 .9495 .1010 .8990
0.48 .3156 .6844 .6312 .3688 1.65 .0495 .9505 .0989 .9011
0.49 .3121 .6879 .6241 .3759 1.66 .0485 .9515 .0969 .9031
0.50 .3085 .6915 .6171 .3829 1.67 .0475 .9525 .0949 .9051
0.51 .3050 .6950 .6101 .3899 1.68 .0465 .9535 .0930 .9070
0.52 .3015 .8985 .6031 .3969 1.69 .0455 .9545 .0910 .9090
0.53 .2981 .7019 .5961 .4039 1.70 .0446 .9554 .0891 .9109
0.54 .2946 .7054 .5892 .4108 1.71 .0436 .9564 .0873 .9127
0.55 .2912 .7088 .5823 .4177 1.72 .0427 .9573 .0854 .9146
0.56 .2877 .7123 .5755 .4245 1.73 .0418 .9582 .0836 .9164
0.57 .2843 .7157 .5687 .4313 1.74 .0409 .9591 .0919 .9181
0.58 .2810 .7190 .5619 .4381 1.75 .0401 .9599 .0801 .9199
0.59 .2776 .7224 .5552 .4448 1.76 .0392 .9608 .0784 .9216
0.60 .2743 .7257 .5485 .4515 1.77 .0384 .9616 .0767 .9233
0.61 .2709 .7291 .5419 .4581 1.78 .0375 .9625 .0751 .9249
0.62 .2676 .7324 .5353 .4647 1.79 .0367 .9633 .0734 .9266
0.63 .2643 .7357 .5287 .4713 1.80 .0359 .9641 .0719 .9281
0.64 .2611 .7389 .5222 .4778 1.81 .0352 .9649 .0703 .9297
0.65 .2578 .7422 .5157 .4843 1.82 .0344 .9656 .0688 .9312
0.66 .2546 .7454 .5093 .4907 1.83 .0336 .9664 .0672 .9328
0.67 .2514 .7517 .5029 .4971 1.84 .0329 .9671 .0658 .9342
0.68 .2483 .7517 .4965 .5035 1.85 .0322 .9678 .0643 .9357
0.69 .2451 .7549 .4902 .5098 1.86 .0314 .9686 .0629 .9371
0.70 .2420 .7580 .4839 .5161 1.87 .0307 .9693 .0615 .9385
0.71 .2389 .7611 .4777 .5223 1.88 .0301 .9699 .0601 .9399
0.72 .2358 .7642 .4715 .5285 1.89 .0294 .9706 .0588 .9412
0.73 .2327 .7673 .4654 .5346 1.90 .0287 .9713 .0574 .9426
0.74 .2296 .7704 .4593 .5407 1.91 .0281 .9719 .0561 .9439
0.75 .2266 .7734 .4533 .5467 1.92 .0274 .9726 .0549 .9451
0.76 .2236 .7764 .4473 .5527 1.93 .0268 .9732 .0536 .9564
0.77 .2206 .7794 .4413 .5587 1.94 .0262 .9738 .0524 .9476
0.78 .2177 .7823 .4354 .5646 1.95 .0256 .9744 .0512 .9488
0.79 .2148 .7852 .4295 .5705 1.96 .0250 .9750 .05 .9500
0.80 .2119 .7881 .4237 .5763 1.97 .0244 .9756 .0488 .9512
0.81 .2090 .7910 .4179 .5821 1.98 .0239 .9761 .0477 .9523
0.82 .2061 .7939 .4122 .5878 1.99 .0233 .9767 .0466 .9534
0.83 .2033 .7967 .4065 .5935 2.00 .0228 .9772 .0455 .9545
0.84 .2005 .7995 .4009 .5991 2.05 .0202 .9798 .0404 .9596
0.85 .1997 .8023 .3953 .6064 2.10 .0179 .9821 .0357 .9643
0.86 .1949 .8051 .3898 .6102 2.15 .0158 .9842 .0316 .9684
0.87 .1922 .8078 .3843 .6157 2.20 .0139 .9661 .0278 .9722
0.88 .1894 .8106 .3789 .6211 2.25 .0122 .9878 .0244 .9756
0.89 .1867 .8133 .3735 .6265 2.30 .0107 .9893 .0214 .9786
0.90 .1841 .8159 .3681 .6319 2.35 .0094 .9906 .0188 .9812
0.91 .1814 .8186 .3628 .6372 2.40 .0082 .9918 .0164 .9836
0.92 .1788 .8212 .3576 .6424 2.45 .0071 .9929 .0143 .9857
0.93 .1762 .8238 .3524 .6476 2.50 .0062 .9938 .0124 .9876
0.94 .1736 .8264 .3472 .6528 2.55 .0054 .9946 .0108 .9892
0.95 .1711 .8289 .3421 .6579 2.58 .0049 .9951 .0099 .9901
0.96 .1685 .8315 .3371 .6629 2.65 .0040 .9960 .0088 .9912
0.97 .1660 .8340 .3320 .6680 2.70 .0035 .9965 .0069 .9931
0.98 .1635 .8365 .3271 .6729 2.75 .0030 .9970 .0060 .9940
0.99 .1611 .8389 .3271 .6729 2.80 .0026 .9974 .0051 .9949
1.00 .1587 .8413 .3173 .6827 2.85 .0022 .9978 .0044 .9956
1.01 .1562 .8438 .3125 .6875 2.90 .0019 .9981 .0037 .9963
1.02 .1539 .8461 .3077 .6923 2.95 .0016 .9984 .0032 .9968
1.03 .1515 .8485 .3030 .6970 3.00 .0013 .9987 .0027 .9973
1.04 .1492 .8508 .2983 .7017 3.05 .0011 .9989 .0023 .9977
1.05 .1469 .8531 .2937 .7063 3.10 .001 .9900 .0019 .9981
1.06 .1446 .8554 .2891 .7109 3.15 .0008 .9992 .0016 .9984
1.07 .1423 .8577 .2846 .7154 3.20 .0007 .9993 .0014 .9986
1.08 .1401 .8599 .2801 .7199 3.25 .0006 .9994 .0012 .9988
1.09 .1379 .8621 .2757 .7243 3.30 .0005 .9995 .001 .9990
1.10 .1357 .8643 .2713 .7287 3.35 .0004 .9996 .0008 .9992
1.11 .1335 .8665 .2670 .7330 3.40 .0003 .9997 .0007 .9993
1.12 .1314 .8686 .2627 .7373 3.45 .0003 .9997 .0006 .9994
1.13 .1292 .8707 .2585 .7415 3.50 .0002 .9998 .0005 .9995
1.14 .1271 .8729 .2543 .7457 3.65 .0001 .9999 .0003 .9997
1.15 .1251 .8749 .2501 .7499 3.80 .0001 .9999 .0001 .9999
1.16 .1230 .8770 .2460 .7540 4.00 .0000 .9999 .0000 .9994

2. Valorile critice ale coeficientului de corelatie r


Df = Pragul de semnificatie pentru testul unilateral
.05 .025 .01 .005 .0005
N-2 Pragul de semnificatie pentru testul bilateral
.10 .05 .02 .01 .001

1 .9877 .9969 .9995 .9999 1.000


2 .9000 .9500 .9800 .9900 .9990
3 .8054 .8783 .9343 .9587 .9912
4 .7293 .8114 .8822 .9172 .9741
5 .6694 .7545 .8329 .8745 .9507
6 .6215 .7067 .7887 .8343 .9249
7 .5822 .6664 .7498 .7977 .8982
8 .5494 .6319 .7155 .7646 .8721
9 .5214 .6021 .6851 .7348 .8471
10 .4973 .5760 .6581 .7079 .8233
11 .4762 .5529 .6339 .6835 .8010
12 .4575 .5324 .6120 .6614 .7800
13 .4409 .5139 .5923 .6411 .7603
14 .4259 .4973 .5742 .6226 .7420
15 .4124 .4821 .5577 .6055 .7246
16 .4000 .4683 .5425 .5897 .7084
17 .3887 .4555 .5285 .5751 .6932
18 .3783 .4438 .5155 .5614 .6787
19 .3687 .4329 .5034 .5487 .6652
20 .3598 .4227 .4921 .5368 .6524
21 .3520 .4130 .4820 .5260
22 .3440 .4040 .4720 .5150
23 .3370 .3960 .4620 .5050
24 .3330 .3880 .4530 .4960
25 .3233 .3809 .4451 .4869 .5974
26 .3170 .3740 .4370 .4790
27 .3110 .3670 .4300 .4710
28 .3060 .3610 .4230 .4630
29 .3010 .3550 .4160 .4560
30 .2960 .3494 .4093 .4487 .5541
35 .2746 .3246 .3810 .4182 .5189
40 .2573 .3044 .3578 .3932 .4896
45 .2428 .2875 .3384 .3721 .4648
50 .2306 .2732 .3218 .3541 .4433
60 .2108 .2500 .2948 .3248 .4078
70 .1954 .2319 .2737 .3017 .3799
80 .1829 .2172 .2565 .2830 3568
90 .1726 .2050 .2422 .2673 .3375
100 .1638 .1946 .2301 .2540 .3211
Pentru a fi semnificativa valoarea obtinuta trebuie sa fie mai mare sau egala cu
valoarea corespondenta din tabel.

3. Valorile critice ale lui ro(Spearman)


Numar de Nivelul lui alfa
perechi UNILATERAL BILATERAL
.05 .01 .05 .01
N
5 .900 - - -
6 .829 .943 .886 -
7 .714 .893 .786 -
8 .643 .833 .738 .881
9 .600 .783 .683 .833
10 .564 .745 .648 .794
11 .523 .736 .623 .755
12 .497 .703 .591 .727
13 .475 .673 .566 .703
14 .457 .646 .545 .689
15 .441 .623 .525 .679
16 .425 .601 .507 .666
17 .412 .582 .490 .645
18 .399 .564 .476 .625
19 .388 .549 .462 .608
20 .377 .534 .450 .591
21 .368 .521 .438 .576
22 .359 .508 .428 .562
23 .351 .496 .418 .549
24 .343 .485 .409 .537
25 .336 .475 .400 .526
26 .329 .465 .392 .515
27 .323 .456 .385 .505
28 .317 .448 .377 .496
29 .311 .440 .370 .487
30 .305 .432 .364 .478
4. Valorile critice ale distributiei lui t
Pragul de semnificatie pentru testul bilateral
.20 .10 .05 .02 .01 .001
df Pragul de semnificatie pentru testul unilateral
.10 .05 .025 .01 .005 .0005
2 1.886 2.920 4.303 6.965 9.925 31.598
3 1.638 2.353 3.182 4.541 5.841 12.924
4 1.533 2.132 2.776 3.747 4.604 8.610
5 1.476 2.015 2.571 3.365 4.032 6.869
6 1.440 1.943 2.447 3.143 3.707 5.959
7 1.415 1.895 2.365 2.998 3.499 5.408
8 1.397 1.860 2.306 2.896 3.355 5.041
9 1.383 1.833 2.262 2.821 3.250 4.781
10 1.372 1.812 2.228 2.764 3.169 4.587
11 1.363 1.796 2.201 2.718 3.106 4.437
12 1.356 1.782 2.179 2.681 3.055 4.318
13 1.350 1.771 2.160 2.650 3.012 4.221
14 1.345 1.761 2.145 2.624 2.977 4.140
15 1.341 1.753 2.131 2.602 2.947 4.073
16 1.337 1.746 2.120 2.583 2.921 4.015
17 1.333 1.740 2.110 2.567 2.898 3.965
18 1.330 1.734 2.101 2.552 2.878 3.922
19 1.328 1.728 2.093 2.539 2.861 3.883
20 1.325 1.725 2.086 2.528 2.845 3.850
21 1.323 1.721 2.080 2.518 2.831 3.819
22 1.321 1.717 2.074 2.508 2.819 3.792
23 1.319 1.714 2.069 2.500 2.807 3.767
24 1.318 1.711 2.064 2.492 2.797 3.745
25 1.316 1.708 2.060 2.485 2.787 3.725
26 1.315 1.706 2.056 2.479 2.779 3.707
27 1.314 1.703 2.052 2.474 2.771 3.690
28 1.313 1.701 2.048 2.467 2.763 3.674
29 1.311 1.699 2.045 2.462 2.756 3.659
30 1.310 1.697 2.042 2.457 2.750 3.646
40 1.303 1.684 2.021 2.423 2.704 3.551
60 1.296 1.671 2.000 2.390 2.660 3.460
120 1.289 1.658 1.980 2.358 2.617 3.373

Pentru a fi semnificativa valoarea obtinuta trebuie sa fie mai mare sau egala cu
valoarea corespondenta din tabel.

5. Valorile critice ale distributiei hi patrat


df .10 .05 .02 .01 .001
1 2.71 3.84 5.41 6.64 10.83
2 4.60 5.99 7.82 9.21 13.82
3 6.25 7.82 9.84 11.34 16.27
4 7.78 9.49 11.67 13.28 18.46
5 9.24 11.07 13.39 15.09 20.52
6 10.64 12.59 15.03 16.81 22.46
7 12.02 14.07 16.62 18.48 24.32
8 13.36 15.51 18.17 20.09 26.12
9 14.68 16.92 19.68 21.67 27.88
10 15.99 18.31 21.16 23.21 29.59
11 17.28 19.68 22.62 24.72 31.26
12 18.55 21.03 24.05 26.22 32.91
13 19.81 22.36 25.47 27.69 34.53
14 21.06 23.68 26.87 29.14 36.12
15 22.31 25.00 28.26 30.58 37.70
16 23.54 26.30 29.63 32.00 39.25
17 24.77 27.59 31.00 33.41 40.79
18 25.99 28.87 32.35 34.80 42.31
19 27.20 30.14 33.69 36.19 43.82
20 28.41 31.41 35.02 37.57 45.32
21 29.62 32.67 36.34 38.93 46.80
22 30.81 33.92 37.66 40.29 48.27
23 32.01 35.17 38.97 41.64 49.73
24 33.20 36.42 40.27 42.98 51.18
25 34.38 37.65 41.57 44.31 52.62
26 35.56 38.88 42.86 45.64 54.05
27 36.74 40.11 44.14 46.96 55.48
28 37.92 41.34 45.42 48.28 .56.89
29 39.09 42.56 46.69 49.59 58.30
30 40.26 43.77 47.96 50.89 59.70

Pentru a fi semnificativa valoarea obtinuta trebuie sa fie mai mare sau egala cu
valoarea corespondenta din tabel.
6. Valori pentru calculul coeficientilor de corelatie biserial si
triserial
p sau q pq/y radical y/p p sau pq/y radical y/p
pq/y q pq/y
.350 .6142 1.288 1.0583 .426 .6237 1.261 .9203
.351 .6144 1.287 1.0564 .427 .6238 1.261 .9186
.352 .6145 1.287 1.0544 .428 .6239 1.261 .9169
.353 .6147 1.286 1.0525 .429 .6239 1.261 .9152
.354 .6149 1.286 1.0506 .430 .6240 1.260 .9134
.355 .6151 1.285 1.0487 .431 .6241 1.260 .9117
.356 .6152 1.285 1.0468 .432 .6242 1.260 .9100
.357 .6154 1.284 1.0449 .433 .6242 1.260 .9083
.358 .6155 1.284 1.0430 .434 .6243 1.260 .9066
.359 .6157 1.283 1.0411 .435 .6244 1.259 .9049
.360 .6158 1.283 1.0392 .436 .6244 1.259 .9032
.361 .6160 1.283 1.0373 .437 .6245 1.259 .9015
.362 .6162 1.282 1.0354 .438 .6246 1.259 .8998
.363 .6163 1.282 1.0336 .439 .6246 1.259 .8981
.364 .6165 1.281 1.0317 .440 .6247 1.259 .8964
.365 .6166 1.281 1.0298 .441 .6248 1.258 .8947
.366 .6168 1.280 1.0279 .442 .6248 1.258 .8930
.367 .6169 1.280 1.0261 .443 .6249 1.258 .8913
.368 .6171 1.280 1.0242 .444 .6250 1.258 .8896
.369 .6172 1.279 1.0223 .445 .6250 1.258 .8880
.370 .6174 1.279 1.0205 .446 .6251 1.258 .8863
.371 .6175 1.278 1.0186 .447 .6251 1.257 .8846
.372 .6177 1.278 1.0167 .448 .6252 1.257 .8829
.373 .6178 1.278 1.0149 .449 .6253 1.257 .8813
.374 .6179 1.277 1.0130 .450 .6253 1.257 .8796
.375 .6181 1.277 1.0112 .451 .6254 1.257 .8779
.376 .6182 1.276 1.0093 .452 .6254 1.257 .8762
.377 .6184 1.276 1.0075 .453 .6255 1.256 .8746
.378 .6185 1.276 1.0057 .454 .6255 1.256 .8729
.379 .6186 1.275 1.0038 .455 .6256 1.256 .8712
.380 .6188 1.275 1.0020 .456 .6256 1.256 .8695
.381 .6189 1.274 1.0002 .457 .6257 1.256 .8679
.382 .6190 1.274 .9983 .458 .6257 1.256 .8662
.383 .6192 1.274 .9965 .459 .6258 1.256 .8646
.384 .6193 1.273 .9947 .460 .6258 1.256 .8629
.385 .6194 1.273 .9929 .461 .6258 1.256 .8612
.386 .6196 1.273 .9910 .462 .6259 1.255 .8596
.387 .6197 1.272 .9892 .463 .6259 1.255 .8579
.388 .6198 1.272 .9874 .464 .6260 1.255 .8563
.389 .6199 1.272 .9856 .465 .6260 1.255 .8546
.390 .6200 1.271 .9838 .466 .6260 1.255 .8530
.391 .6202 1.271 .9820 .467 .6261 1.255 .8513
.392 .6203 1.271 .9802 .468 .6261 1.255 .8497
.393 .6204 1.270 .9784 .469 .6261 1.255 .8480
.394 .6205 1.270 .9766 .470 .6262 1.255 .8464
.395 .6206 1.270 .9748 .471 .6262 1.255 .8448
.396 .6208 1.269 .9730 .472 .6262 1.254 .8431
.397 .6209 1.269 .9712 .473 .6263 1.254 .8415
.398 .6210 1.269 .9694 .474 .6263 1.254 .8399
.399 .6211 1.268 .9676 .475 .6263 1.254 .8382
.400 .6212 1.268 .9659 .476 .6263 1.254 .8366
.401 .6213 1.268 .9644 .477 .6264 1.254 .8350
.402 .6214 1.267 .9623 .478 .6264 1.254 .8333
.403 .6215 1.267 .9605 .479 .6264 1.254 .8317
.404 .6216 1.267 .9587 .480 .6264 1.254 .8301
.405 .6218 1.267 .9570 .481 .6265 1.254 .8285
.406 .6219 1.266 .9552 .482 .6265 1.254 .8268
.407 .6220 1.266 .9534 .483 .6265 1.254 .8252
.408 .6221 1.266 .9517 .484 .6265 1.254 .8236
.409 .6222 1.265 .9499 .485 .6265 1.254 .8220
.410 .6223 1.265 .9482 .486 .6266 1.254 .8204
.411 .6224 1.265 .9464 .487 .6266 1.254 .8188
.412 .6225 1.265 .9446 .488 .6266 1.254 .8171
.413 .6225 1.264 .9429 .489 .6266 1.253 .8155
.414 .6226 1.264 .9411 .490 .6266 1.253 .8139
.415 .6227 1.264 .9394 .491 .6266 1.253 .8123
.416 .6228 1.264 .9376 .492 .6266 1.253 .8107
.417 .6229 1.263 .9359 .493 .6266 1.253 .8091
.418 .6230 1.263 .9342 .494 .6266 1.253 .8075
.419 .6231 1.263 .9324 .495 .6266 1.253 .8059
.420 .6233 1.263 .9307 .496 .6266 1.253 .8043
.421 .6233 1.262 .9290 .497 .6266 1.253 .8027
.422 .6234 1.262 .9272 .498 .6267 1.253 .8011
.423 .6234 1.262 .9255 .499 .6267 1.253 .7995
.424 .6235 1.262 .9238 .500 .6267 1.253 .7979
.425 .6236 1.261 .9221

S-ar putea să vă placă și