Documente Academic
Documente Profesional
Documente Cultură
- suport de curs -
An universitar 2012-2013
X m
s
Proprietile scorurilor z
1. Media unei distribuii z este ntotdeauna egal cu 0. Aceasta rezult din
proprietatea mediei de a se diminua corespunztor dac se extrage o constant din
fiecare valoare a unei distribuii. Formula de calcul pentru z implic scderea unei
constante din fiecare valoare a distribuiei. Aceasta nseamn c i media noii
distribuii (z) se va reduce cu constanta respectiv. Dar aceast constant este nsi
media distribuiei originale, ceea ce nseamn c distribuia z va avea media egal cu
zero, ca rezultat al diminurii mediei cu ea nsi.
2. Abaterea standard a unei distribuii z este ntotdeauna 1. Acest fapt decurge
prin efectul cumulat al proprietilor abaterii standard. Prima proprietate afirm c n
cazul scderii unei constante (n cazul scorurilor z, media) din valorile unei distribuii,
abaterea standard a acesteia nu se modific. A doua proprietate afirm c n cazul
mpririi valorilor unei distribuii la o constant, noua abatere standard este rezultatul
raportului dintre vechea abatere standard i constant. Dar constanta de care vorbim
este, n cazul distribuiei z, chiar abaterea standard. Ca urmare, noua abatere standard
este un raport dintre dou valori identice al crui rezultat, evident, este 1.
Deci:
Toate variantele sunt obinute prin transformarea operat pe distribuia de note z.
La nici una dintre variante nu mai avem valori negative
Zecimalele nu mai sunt semnificative
Notele standard mari indic valori mari iar notele standard mici indic valori
mici.
Exemple de curbe normale, care respect condiiile de mai sus, chiar dac au
medii i abateri standard diferite.
Curba normal standardizat are cteva caracteristici care sunt figurate n imaginea de
mai sus i pe care este important s le reinem:
aproximativ 34% dintre scorurile distribuiei normale se afl ntre
medie i o abatere standard deasupra mediei (z=+1)
intre 1z i +1z se afl aproximativ 68% dintre valorile distribuiei
aproximativ 96% dintre scoruri se afl ntre 2z i +2z
Curba normal are o importan aparte pentru analiza statistic. Aceasta,
deoarece se accept faptul c variabilele statistice s-ar distribui mai ales sub aceasta
form dac ar fi efectuate un numr mare (tinznd spre infinit) de msurri.
4
sm
N
unde sm este eroarea standard a mediei de eantionare,
standard a populaiei iar N este volumul eantionului.
este abaterea
Deci, prin creterea volumului eantionului, media acestuia se apropie tot mai
mult de media populaiei, cu alte cuvinte, comport o eroare din ce n ce n mai mic
fa de aceasta.
Eroarea standard a mediei (expresie mai greu de retinut, fiind utilizata pentru
a defini un indicator al mprtierii, n timp ce are n compunere cuvntul medie)
este in indicator care msoar ct de departe poate fi media unui eantion fata de
media populaiei din care a fost extras. Avnd n vederea faptul c la numitor avem o
expresie bazat pe N (volumul eantionului), este ca, cu ct eantionul este mai mare
cu att eroarea standard a mediei este mai mic.
ntrebarea care se pune este, ns, ct de mare trebuie s fie un eantion pentru
a putea fi considerat destul de mare? Vom spune c, dac eantionul de referin
cuprinde cel puin 30 de subieci, teoria statistic accept c avem o distribuie
normal a mediei de eantionare. Prin urmare 30 este numarul utilizat de obicei
pentru constituirea eantioanelor minime de cercetare. Dac distribuia variabilei la
nivelul populaiei este normal, atunci distribuia de eantionare atinge o form
normal si pentru eantioane de volum mai mic.
DECI
- distribuia mediei de eantionare are o evoluie diferit fata de distribuia
valorilor individuale ale unei caracteristici. Chiar i atunci cnd acestea din urm nu
se distribuie dup regulile curbei normale, mediile eantioanelor tind spre o
distribuiei normal dac volumul lor este suficient de mare.
- mrimea eantionului trebuie s fie de cel puin 30 de valori pentru a avea
ncredere c teorema limitei centrale se verific.
- chiar i eantioane de volum mai mic pot avea medii ce se plaseaz pe o
distribuie normal, dac provin din populaii normale.
- dar forma distribuiei la nivelul populaiei nu este de regula cunoscut. De
aceea va trebui s utilizm, ori de cte ori ne putem permite cel puin 30 de valori.
m
sm
8.2
8 .2
sm
1.22
N
45 6.70
Calculm apoi scorul z pentru grup:
z
0.98
sm
1.22
1.22
11
Teste statistice
Testul z pentru un singur eantion
Testul z se utilizeaza atunci cnd cunoatem media i abaterea standard a
unei populaii i dorim s tim dac un eantion experimental face parte din aceast
populaie sau nu. Dar pentru c puine variabile de interes pentru psihologie au medii
i abateri standard calculate la nivelul populaiei, acest test statistic nu este printre cele
frecvent utilizate n cercetarea psihologic.
Cu toate acestea exista destule situaii n care testul z i poate dovedi utilitatea
chiar dac variabilele pentru care se cunosc parametrii populaiei nu sunt numeroase.
De exemplu, cazurile n care populaia cercetrii nu este att de extins nct s nu i se
poat afla parametrii.
13
14
Prezentarea rezultatului
La prezentarea testului t pentru diferena dintre mediile a dou eantioane
independente vor fi menionate: mediile fiecrui eantion, volumul eantioanelor sau
gradele de libertate, valoarea testului, nivelul lui p.
n form narativ:
15
(m=),
esantioane aleatoare
eantioane independente (distincte din punctul de vedere al variabilei
independente, care determin constituirea grupurilor)
variabila supus msurrii s se distribuie normal n ambele populaii.
Aceasta ne garanteaz c i distribuia diferenelor dintre medii se
distribuie normal. Totui, teorema limitei centrale ne permite asumarea
normalitii distribuiei mediei de eantionare chiar i n cazul variabilelor
care nu se distribuie normal la nivelul populaiei iar testele t sunt robuste
la nclcarea condiiei de normalitate.
dispersia celor dou eantioane s fie omogen. Iar daca eantioanele sunt
suficient de mari (cel puin 100 fiecare) sau au acelai volum (N1=N2)
problematica omogenitatii dispersiei nici nu trebuie sa ne mai preocupe.
16
Prezentarea rezultatului
La publicare se vor meniona: volumul eantionului, valoarea testului t, pragul
de semnificaie i dac testul a fost unilateral sau bilateral.
Pentru exemplul de mai sus, o prezentare narativ a rezultatului ar putea arta astfel:
Un lot de ? elevi cu probleme de concentrare au intrat intr-un program cu
acordare de recompense. Capacitatea de concentrare a fost evaluat nainte i dup
acordarea de recompense. S-a constatat o crestere / reducere a duratei de
concentrare de la o medie de ? la ? dup acordarea recompenselor. Diferena a
atins / nu a atins pragul semnificaiei statistice t(df)=?, p>0.01, pentru =0.01
bilateral.
18
ASADAR
Esena procedurii de calcul pentru ANOVA se bazeaz pe o dubl estimare a dispersiei
populaiei cercetrii.
raport Fisher, dup numele celui care a fundamentat acest tip de analiz i se scrie
astfel:
s 2 int ergup
F 2
s int ragrup
Distribuia F
Valorile raportului F (sau testul F) se distribuie ntr-un mod particular, numit
distribuia F sau distribuia Fisher, avnd urmtoarele caracteristici:
1. asimetrie pozitiv (tendina valorilor de grupare spre partea stng, cu valori
mici);
2. poate lua o valori orict de mari;
3. forma distribuiei variaz n funcie de cele doua tipuri de grade de libertate:
numrul grupelor (categoriile variabilei independente) i numrul subiecilor.
Prezentarea rezultatului testului F (ANOVA)
Pentru prezentarea ANOVA vor fi descrise grupurile (categoriile) comparate,
mediile lor, valoarea testului F cu numrul gradelor de libertate i pragul de
semnificaie al testului. Narativ un rezultat poate sa apara in urmatoarea forma:
Mediile pentru cele grupuri au fost: gr.1 - ?, gr.2 - ?, gr.3 - ?. Analiza de
varian unifactorial a relevat o diferen semnificativ ntre aceste medii, F (df
numarator, df numitor)=?; p0.05.
Analiza post-hoc
Testul ANOVA ne ofer o imagine global a relaiei dintre categoriile
variabilei independente i valorile variabilei dependente. Cercettorul poate fi, ns,
interesat care dintre grupuri difer ntre ele i n ce sens.
Pentru a rezolva aceast problem, au fost dezvoltate diverse teste, denumite
post-hoc, calculate dup aplicarea procedurii ANOVA. Testele post-hoc
(ex.Bonferoni) se interpreteaz n mod similar testului t. Analiza post-hoc este
permis numai dac a fost obinut un rezultat semnificativ pentru testul F. Asadar n
practic, analiza de varian va cuprinde dou faze: prima, in care se decide asupra
semnificaiei testului F, i a doua, n cazul c acest raport este semnificativ, n care se
analizeaz comparativ diferenele dintre categoriile analizate, pe baza unui test posthoc.
21
z y' z x
Formula de mai sus descrie modul de predicie n valori z pentru variabila Y,
pornind de la valorile variabilei X, numit din acest motiv predictor. Pentru c
valoarea lui Y din formula de mai sus este una prezis, se noteaz cu indicele
prim.
S ne imaginm c am descoperit o corelaie perfect (r=+1) ntre scorul la un
test de inteligen verbal (X) i cel la un test de inteligen abstract (Y). Conform
formulei, pentru o valoare zx=1.5 vom prezice o valoare identic pentru Y, zy=1.5.
Din pcate corelaiile perfecte sunt rare sau de loc ntlnite n realitate. Ca
urmare, predicia suport riscul unei erori. Pentru aceasta formula se modifica:
z y' r * zx
unde r este valoarea coeficientului de corelaie dintre cele dou variabile.
Conceptul de regresie a fost introdus de Francis Galton care, studiind relaia
dintre nlimea copiilor i a prinilor a observat c prinii cu nlimi excesive tind
s aib copii cu nlime mai mic dect a lor, adic mai aproape de medie dect a
prinilor. Galton a denumit aceast tendin ca regresie ctre mediocritate. Dar
pentru ca intra in calcul corelaia de tip liniar se vorbeste de regresie liniar ctre
medie.
Analiza reziduurilor
Linia de regresie se obine, de fapt, prin cutarea unui traseu prin norul de
puncte astfel nct distana nsumat dintre dreapt i punctele de deasupra s fie egal
cu distana nsumat fa de punctele de sub linie.
in cazul unei corelaii perfecte toate punctele de intersecie ale valorilor
celor dou variabile se afl exact pe dreapta de regresie.
in cazul corelaiilor imperfecte distanele dintre puncte i dreapta de
regresie exprim, de fapt, eroarea de estimare a asocierii dintre
variabile. Distana dintre poziia real a punctelor i cea estimat cu
ajutorul liniei de regresie se numete valoare rezidual i exprim,
desigur, o eroare de estimare. .
Cu ct suma distanelor de la fiecare punct la linia de regresie este mai mare,
cu att eroarea de estimare este mai pronunat. Cu ct vor fi mai apropiate punctele
de intersecie de linia de regresie, cu att mai puin eroare vom avea n predicie i,
implicit, o corelaie mai mare. Invers, cu ct punctele de intersecie vor fi mai
ndeprtate de linia de regresie, cu att cu att valoarea rezidual va fi mai mare iar
corelaia va fi mai mic. La limit, pentru o corelaie egal cu 0, linia de regresie va
avea o traiectorie orizontal, nclinarea ei fiind 0.
23
Barbati
25
18
Femei
26
38
Barbati
25
18
43
Femei
26
38
64
total
51
56
107
Vom determina frecventele teoretice ft pentru fiecare casuta din tabel apelind la regula
de trei simpla. Totalul pe coloana inmultit cu totalul pe linie supra total esantion.
In exemplu: 43 x 51 \ 107 = 20,5. Pentru prima celula frecventa teoretica este de 20,5.
Se determina in acest mod ft si pentru celelalte celule obtinindu-se tabelul (cifrele
obtinute se inscriu in casutele corespunzatoare intre paranteze).
24
Toxicomani
Neconsumatori
Barbati
25 ( 20,5)
18 (22,5)
Femei
26 (30,5)
38 (33,5)
Pentru a compara frecventele teoretice cu cele observate se vor lua patratele acestor
diferente (evitindu-se nulitatea sumei diferentelor simple). Astfel se ajunge la
simbolul 2 definit ca suma diferentelor frecventelor observate si teoretice la patrat
impartita la frecventa teoretica.
2 = (fo-ft)2 \ ft 2
Exemplul de mai sus insumam atitia termeni cite casute avem.
2 = (25-20,5)2\20,5 + ........=3,16
Valoarea obtinuta prin calcul se raporteaza la valorile tabelare ale lui 2.
Tabelul indica probabilitatea corespunzatoare diverselor valori ale lui 2 sub ipoteza
nula. Acesta tine seama si de numarul gradelor de libertate. Numarul gradelor de
libertate se stabileste la 2 ca fiind (r-1)(c-1) in care r=nr.rinduri iar c=nr.coloane.
In exemplu, nr, gr.de libertate = 1
Vom citi in tabel valorile lui 2 corespunzatoare diferitelor probabilitati. Daca
valoarea obtinuta prin calcul este mai mica decit cea indicata in tabel, nu putem
respinge ipoteza nula. Daca valoarea calculata este superioara celei din tabel vom
considera diferentele puternic seminificative.
In exemplu: 3.16 la 1 grad libertate valoarea tabelara este de 3.84 la p=0.05 . Valoarea
calculata este mai mica deci nu respingem ipoteza nula.
Criteriul 2 se poate generaliza la tabele cu un numar mare de casute, raminind
valabil acelasi procedee de lucru. Totusi esantioanele trebuie sa fie destul de mari iar
frecventele din casute sa nu fie sub
25
ASADAR..
Analiza statistica presupune
(1) analiza statistic descriptiv i (2) testarea ipotezelor.
Analiza statistic descriptiv
In funcie de obiectivul analizei i de tipul de variabil se va apela la anumite
procedurii descriptive:
tabela de frecvene
distribuie de frecvene
distribuie de frecvene
Histogram
Poligon
Mod
Median
Medie
Median
Amplitudinea
abaterea standard
Amplitudinea
(2) Testarea ipotezelor
Se va alege testul statistic adecvat functie de obiectivul cercetrii (diferenta
intre grupuri, asocierea variabilelor) i scalele de msurare pentru variabila
independent i variabila dependent (categoriale / interval-raport).
de semnificaie (p, sau Sig., cum este prezentat n unele programe statistice). De
reinut c, inclusiv atunci cnd rezultatul obinut nu ndreptete respingerea ipotezei
de nul, ipoteza cercetrii va fi considerat doar neconfirmat i nu respins. Aceast
atitudine este mai potrivit, pe de o parte, cu modelul probabilistic de testare statistic
a ipotezelor i, pe de alt parte, cu faptul c nimic nu ne mpiedic s pstrm ipoteza
i s ncercm confirmarea ei ntr-un alt studiu.
Problema variabilelor multiple. Dac n exemplele din manualele de statistic
sunt luate n discuie, de regul, situaii simple, cu minimum de variabile posibile, cel
mai adesea, dou. n realitate, cel mai adesea, studiile de psihologie trebuie s fac
fa unei avalane de variabile a cror relaie trebuie testat nu doar una cte una ci
i n interdependena lor. Acest fapt ridic, pe de o parte, probleme de procedur
statistic i, pe de alt parte, probleme de prezentare a rezultatelor. Alegerea
procedurii astfel nct s surprind exact relaiile care intereseaz, cu excluderea
influenelor colaterale, este, din pcate, greu de explicitat la nivelul unui manual
introductiv. n ceea ce privete forma de prezentare, trebuie avut n vedere
necesitatea de a fi, n egal msur, sintetici i explicii. Sintetici, pentru a nu ngreuna
textul cu o abunden excesiv de tabele de date, explicii, pentru c nu pot fi eludate
informaiile eseniale care sunt necesare pentru interpretarea rezultatelor.
Reinere fa de declararea relaiei cauzale. Aprecierea pe baza unui test de
semnificaie statistic a unei relaii de cauzalitate ntre variabile este cel puin
hazardat. Acest lucru poate fi susinut numai dac se respect anumite condiii
experimentale, care s ne asigure c ntre cele dou variabile este o relaie cauzefect.
Tabele i figuri. Tabelele sunt cel mai des utilizate pentru includerea n textul
rapoartelor de cercetare a rezultatelor obinute. Ele prezint avantajul indicrii cu
exactitate a valorilor i susinerii cu precizie a concluziilor. Figurile au ns avantajul
de a prezenta informaia ntr-o form intuitiv i accesibil, atrgnd atenia
cititorului. Nu se poate face o recomandare de preferin pentru una sau alta dintre
cele dou forme. Oricum, este de reinut c figurile ocup mult spaiu tipografic i
sunt mai pretenioase din punctul de vedere al editrii i al tehnoredactrii textelor.
n orice caz, se vor evita figurile prea complexe. Este recomandabil ca fiecare grafic
s prezinte o singur idee, pe care s o susin ct mai simplu i mai explicit.
Discutarea i interpretarea rezultatelor.
Adevrata ncercare ntr-un demers de cercetare nu este, aa cum s-ar putea
crede, prelucrarea efectiv a datelor. Dac sunt corect recoltate i nregistrate,
prelucrarea lor se face destul de uor cu ajutorul programelor computerizate existente
astzi. Interpretarea, ns, este o prob pentru oricine se afl n faza de finalizare a
unei cercetri.
Premisa fundamental a unei interpretri consistente este suportul teoretic,
claritatea i consistena ipotezei sau ipotezelor cercetrii. Este imposibil s tragi
concluzii dac nu eti contient de obiectivele urmrite. Adesea se cade prad iluziei
c, indiferent de ce date dispunem, se poate susine un demers de cercetare doar cu
ajutorul unui program de calcul statistic sofisticat i a unui set de date oarecare. Din
pcate, se ntmpl destul de des ca un student s vin i s spun: am aceste date, ce
teste statistice pot face cu ele?. Obiectivul cercetrii trebuie s fie clar precizat de la
bun nceput n timp ce alegerea procedurii statistice ine de natura scalei de msurare,
caracteristicile variabilelor i ipotezei pe care trebuie s o testm. Dac fiecare dintre
aceste aspecte sunt clare n mintea cercettorului, atunci rspunsul la ntrebarea demai
sus este foarte uor de dat.
Se va urmri, pe de o parte, coerena dintre concluzii i datele pe care se
sprijin, iar pe de alt parte, dintre concluzii i condiiile specifice cercetrii (eantion,
model de investigare). Cu alte cuvinte, fiecare aspect al concluziilor trebuie s aib un
29
eantion
concluzia cercetrii
mic
mare
mic
mare
rezultat important
importana practic posibil dar incert
rezultat neconcludent
ipoteza cercetrii este, probabil, fals
Formularea concluziilor
Studiul trebuie s se ncheie cu concluzii adecvate cu rezultatele obinute,
formulate sintetic i explicit. Nu se vor evita aspectele mai puin reuite ale cercetrii,
eventualele nereuite, chiar. Rostul acestora este acela de a ajuta la evitarea repetarea
unor greeli de ctre cei care vor dori s reia acelai tip de investigaie, mai trziu. Se
pot face chiar recomandri explicite n acest sens. Orict de semnificative ar fi
rezultatele unui anumit studiu, ele nu vor schimba modul de a gndi o anumit
realitate psihologic. Acest efect nu l pot avea dect rezultate obinute de mai multe
studii concordante pe aceeai tem.
Nu se va uita niciodat faptul c semnificaia statistic nu ine loc i de
semnificaie teoretic, cu sensul de consisten a unui anumit model teoretic
explicativ. Procedurile statistice nu sunt altceva dect instrumente de evaluare
probabilist ipotezelor. Profunzimea teoretic a unui studiu nu poate rezulta dect din
calitatea modelului de investigaie (ipoteze, proceduri de evaluare, subtilitatea analizei
rezultatelor, etc.) i nu din datele statistice ca atare.
Statistica trebuie s fie o modalitate de organizare i disciplinare a gndirii tiinifice,
n nici un caz, ns, nu se poate substitui acesteia. Dar nu se poate ajunge la aceast
performan dect dac statistica este neleas att sub aspecte ei tari ct i cu
limitele ei.
n trecut, la nceputurile utilizrii statisticii n psihologie, prezena acesteia
ntr-o lucrare avea un caracter de prestigiu, cu att mai mare cu ct era mai bogat
reprezentat. n prezent, omniprezena calculatoarelor i a programelor specializate au
fcut ca prelucrrile statistice s devin o operaiune relativ facil. Tocmai din acest
motiv, apare riscul abuzului de statistic, a utilizrii necritice i superficiale a acesteia
n elaborarea lucrrilor de cercetare.
n fine, ca o concluzie a celor spuse, se cuvine sa insistm pe respectarea
exigenelor procedurale impuse de metoda statistic. Simpla populare a unei lucrri
cu date statistice, tabele, grafice, sau cu valori ale unor teste de semnificaie, nu
asigur n mod necesar acelui document valoarea tiinific la care aspir. Asigurarea
calitii datelor supuse prelucrrii, respectarea condiiilor de alegere a testelor de
semnificaie, interpretarea lor adecvat i publicarea rezultatelor n formatul adecvat,
sunt condiii indispensabile pentru calitatea tiinific a unui studiu bazat pe metoda
statistic.
32