Sunteți pe pagina 1din 35

Aplicaii computerizate ale datelor

Exemple de studii corelaionale:


Exist vreo legtur ntre scorurile la testele
de inteligen i performana colar?
Exist asociere ntre nlime i greutate?
Exist asociere ntre inteligena prinilor i
inteligena copiilor?
Exist o relaie ntre numrul orelor de studiu
la statistic i punctajul obinut la evaluri?


Corelaia nu implic o cauzalitate

Ce fel de date au fost colectate?
Care sunt condiiile de aplicare?

Date numerice
Variabile msurate pe scale de interval sau de raport
Variabile normal distribuite
Numrul de subieci este mai mare de 30
Absena outlierilor sau a valorilor extreme
Relaia dintre variabile este liniar
Norul de puncte indic homoscedasticitate

Folosim corelaia Spearman, atunci cnd

Cel puin una dintre variabile este msurat
pe scal ordinal
Cel puin una dintre variabile nu este normal
distribuit
Numrul de subieci este mai mic de 30


7) Cum interpretm asocierea dintre dou
variabile?
Coeficient de
corelatie
Indic puterea
asocierii
Indic direcia sau relaia
(pozitiv sau negativ)
r = +.37
Corelaia pozitiv arat relaia de direct proporionalitate
ntre cele dou variabile: cu ct crete x, cu att crete i Y.

Corelaia negativ arat relaia de invers proporionalitate:
cu ct crete X, cu att scade Y.

Coeficient de corelaie Interpretare
0.0-0.1 Foarte mic, negliabil
0.1-0.3 Mic, minor
0.3-0.5 Moderat, mediu
0.5-0.7 Mare, ridicat
0.7-0.9 Foarte mare, foarte ridicat
0.9-1 Aproape perfect
Coeficient de corelaie (r)
Prag de semnificaie (p)
Numr de participani (N)
Norul de puncte ca modalitate a a testa
normalitatea distribuiei
Norul de puncte evideniaz patternul de organizare a
datelor, fiind i o modalitate de a testa normalitatea
distribuiei.
Atunci cnd normalitatea este nclcat, norul de puncte
tinde s fie asimetric la unul dintre capete (Tabachnick, &
Fidell, 2007).
Forma norului de puncte ne ofer detalii i despre
variabilitatea datelor. Cu ct variabilitatea crete, cu att
corelaia scade.
Variabilitatea sczut se obine n cazul datelor omogene,
leptocurtice, asimetrice pozitiv sau negativ.
De asemenea, norul de puncte este o modalitate eficient de
a depista outlierii bivarai sau valorile aberante.

Norul de puncte ca modalitate a a testa
normalitatea distribuiei
Intensitatea asocierii dintre variabile
coeficientul de determinare

r
2
x 100

coeficientul de determinare
- procentul din
dispersia variabilei
depndente explicat
evoluia variabilei
independente (ct
de mare este
influena variabilei
independente
asupra celei
dependente)
Cauzele care pot afecta precizia unui coeficient
de corelaie
Presupunerea c ntre x i y exist coliniaritate, adic faptul
c norului de puncte ce materializeaz corelaia i-ar putea fi
ajustat o linie dreapt numit linia de regresie a lui y n
raport cu x.
Distribuiile atipice care, prezint valori atipice la extremele
seriei de variaie
Erorile de introducere a datelor
Erorile de eantionare: cu ct omogenitatea grupului este
mai mare, cu att corelaia descrete
Erorile de msurtoare sau de tastare

Corelaia i mrimea eantionului
O corelaie slab poate fi semnificativ statistic dac
eantionul este mare cu ct crete numrul de subieci,
crete variabilitatea eantionului scderea coeficientului
de corelaie dar crete semnificaia statistic. Este greit
s afirmm c am obinut o corelaie slab din cauza
numrului mic de subieci!!!
D.p.d.v teoretic i corelaiile slabe pot fi importante
Exemplu: un grup de cercettori a demonstrat c ntre
consumul aspirinei i atacul de cord exist o corelaie de -
.034, ceea ce nseamn c folosirea aspirinei explic doar
1% din variaia apariiei atacului de cord, adic dintr-un
grup de 20.000 persoane care nu consumau aspirin, 72
fceau atac de cord !!!

Corelaia parial
Relaia dintre dou variabile este
afectat de o a treia variabil. Acest
lucru este evident n cazul unor relaii
false sau a unor relaii de moderare.

Relaii false ntre dou variabile
C
X
Y
X
C
Y
Exemplul 1:
Zilele ploioase duc la o dispoziie afectiv negativ.
In realitate, exist ali factori precum presiunea atmosferic, gradul de
luminozitate pot influena dispoziia afectiv, nu ploaia propriu-zis.

Exemplul 2:
Persoanele mai scunde au prul mai lung.
Dac avem n vedere variabila gen care coreleaz att cu lungimea prului ct i
cu nlimea, obinem un alt rezultat. Femeile au pr mai lung i sunt mai
scunde, iar relaia dintre X i Y devine nesemnificativ, dac inem cont de gen.
Relaie ntre X i Y moderat de a treia
variabil
X
C
Y
Exemplul 3:
Relaia dintre timpul stat la soare i nivelul de bronzare.
Dac avem n vedere variabila tip de ten, rezultatele sunt
diferite.
Relaia ntre X i Y mediat de a treia
variabil
X C Y
Exemplul 4:
Relaia dintre motivaia pentru nvare i performanele
colare este mediat de strategiile de nvare.
Motivaia pentru nvare duce la alegerea unor strategii mai
eficiente care, la rndul lor, duc la rezultate colare ridicate.
Pai SPSS pentru calculul corelaiei
pariale
Pai SPSS pentru calculul corelaiei pariale


1. exist o corelaie bivariat (Pearson) puternic semnificativ
statistic ntre reprezentri spaiale i calcul aritmetic.
2. ! QI coreleaz semnificativ cu ambele variabile!
3. In partea a doua a tabelului (Controlling for QI) observm c de
aceast dat corelaia dintre Reprezentarea spaial i calculul
aritmetic devine nesemnificativ legtura dintre cele dou variabile
nu era dect efectul influenei pe care o exercita inteligena asupra
lor.
(Marian Popa, 2009, Statistic psihologic nivel intermediar, note de
curs).
Dac relaia dintre Reprezentarea spaial i Calculul aritmetic ar
fi rmas semnificativ, n condiiile n care influena QI este
eliminat, am fi putut vorbi despre existena uni corelaii pariale.

Regresia liniar
Regresia liniar
frecvent utilizat n cercetarea psihologic
pentru validarea unor modele teoretice
pentru scopuri practice, precum selecia.

Exemplu
Cunoscnd nivelul inteligenei unui elev, putem prezice
performana sa colar.
permite s estimm rezultatele viitoare pe baza unor
indicatori din prezent

Variabila ale crei valori dorim s le prezicem, se
numete criteriu,
Variabila ale crei valori le utilizm pentru a prezice
valorile criteriului, se numete predictor
Regresia liniar
pleac de la premisa unei corelaii puternice ntre predictor
i criteriu
Msura n care norul de puncte descrie o relaie liniar
ntre variabile poate fi ilustrat prin trasarea unei drepte
prin acest nor de puncte care contureaz patternul norului
de puncte i care se numete linie de regresie
Regresia liniar simpl - exist un singur predictor
(variabila independent) i un singur criteriu (variabila
dependent)
Regresia multiliniar sau multipl presupune mai multe
surse de variaie, ecuaia de regresie include mai muli
factori ce intervin cu ponderi diferite n predicia criteriului.

Ecuaia de regresie
Ecuaia de regresie
Linia de regresie
5.5
6
6.5
7
7.5
8
8.5
9
80 85 90 95 100 105 110 115 120
M
e
d
i
e

m
a
t
e
m
a
t
i
c
a

QI
medie
matematica
Linear (medie
matematica)
Regresia liniar multipl
Regresia liniar multipl presupune folosirea
mai multor predictori.

Ecuaia de regresie este urmtoarea:

Y = B
0
+ B
1
X
1
+ B
2
X
2
+ ... + B
n
X
n




Condiii de aplicare pentru regresia liniar
simpl i multipl

1. Variabila dependent (VD) i variabila independent (VI)
s fie variabile cantitative normal distribuite.
2. Relaia dintre VD i VI s fie liniar (scatterplot - matrix).
3. Erorile (reziduurile) s fie normal distribuite (histogram
sau Kolmogorov-Smirnov).
4. Evitarea multicoliniaritii (corelaii mari 0,50 0,60 ntre
oricare dou VI).
5. Evitare cazurilor extreme i a cazurilor influente
(inspectarea tabelului Residuals statitics).
6. Evitarea homoscedasticitii : reziduurile vor avea aceeai
varian pentru fiecare nivel al variabilelor predictor (VI).

Calculul regresiei liniare simple (Pasul 1)
Calculul regresiei liniare simple (Pasul 2)
Primul tabel arat variabilele din modelul de predicie.
Al doilea tabel, Model Summary, ofer coeficientul de corelaie
dintre variabila dependent i variabila independent (R
coeficientul de corelaie multipl, pentru regresia multiliniar),
coeficientul de determinare (R
2
) care arat procentul de variaie al
variabilei criteriu explicat de variabila predictor.
Al treilea tabel, ANOVA, testul F arat n ce msur exist diferene
semnificative statistic ntre estimrile oferite pe baza ecuaiei de
regresie implicate n comparaie cu estimrile bazate pe valoarea
mediei (Sava, 2004). Pentru un model eficient, F este semnificativ
statistic.
Al patrulea tabel, Coefficients, conine coeficienii standardizai i
nestandardizai de regresie i valoarea constantei. Testul t de pe
ultima coloan arat dac fiecare coeficient de regresie este
semnificativ diferit de 0. Pragul de semnificaie mai mic de 0,05
arat c predictorul ales este un predictor semnificativ.

S-ar putea să vă placă și