Exist vreo legtur ntre scorurile la testele de inteligen i performana colar? Exist asociere ntre nlime i greutate? Exist asociere ntre inteligena prinilor i inteligena copiilor? Exist o relaie ntre numrul orelor de studiu la statistic i punctajul obinut la evaluri?
Corelaia nu implic o cauzalitate
Ce fel de date au fost colectate? Care sunt condiiile de aplicare?
Date numerice Variabile msurate pe scale de interval sau de raport Variabile normal distribuite Numrul de subieci este mai mare de 30 Absena outlierilor sau a valorilor extreme Relaia dintre variabile este liniar Norul de puncte indic homoscedasticitate
Folosim corelaia Spearman, atunci cnd
Cel puin una dintre variabile este msurat pe scal ordinal Cel puin una dintre variabile nu este normal distribuit Numrul de subieci este mai mic de 30
7) Cum interpretm asocierea dintre dou variabile? Coeficient de corelatie Indic puterea asocierii Indic direcia sau relaia (pozitiv sau negativ) r = +.37 Corelaia pozitiv arat relaia de direct proporionalitate ntre cele dou variabile: cu ct crete x, cu att crete i Y.
Corelaia negativ arat relaia de invers proporionalitate: cu ct crete X, cu att scade Y.
Coeficient de corelaie Interpretare 0.0-0.1 Foarte mic, negliabil 0.1-0.3 Mic, minor 0.3-0.5 Moderat, mediu 0.5-0.7 Mare, ridicat 0.7-0.9 Foarte mare, foarte ridicat 0.9-1 Aproape perfect Coeficient de corelaie (r) Prag de semnificaie (p) Numr de participani (N) Norul de puncte ca modalitate a a testa normalitatea distribuiei Norul de puncte evideniaz patternul de organizare a datelor, fiind i o modalitate de a testa normalitatea distribuiei. Atunci cnd normalitatea este nclcat, norul de puncte tinde s fie asimetric la unul dintre capete (Tabachnick, & Fidell, 2007). Forma norului de puncte ne ofer detalii i despre variabilitatea datelor. Cu ct variabilitatea crete, cu att corelaia scade. Variabilitatea sczut se obine n cazul datelor omogene, leptocurtice, asimetrice pozitiv sau negativ. De asemenea, norul de puncte este o modalitate eficient de a depista outlierii bivarai sau valorile aberante.
Norul de puncte ca modalitate a a testa normalitatea distribuiei Intensitatea asocierii dintre variabile coeficientul de determinare
r 2 x 100
coeficientul de determinare - procentul din dispersia variabilei depndente explicat evoluia variabilei independente (ct de mare este influena variabilei independente asupra celei dependente) Cauzele care pot afecta precizia unui coeficient de corelaie Presupunerea c ntre x i y exist coliniaritate, adic faptul c norului de puncte ce materializeaz corelaia i-ar putea fi ajustat o linie dreapt numit linia de regresie a lui y n raport cu x. Distribuiile atipice care, prezint valori atipice la extremele seriei de variaie Erorile de introducere a datelor Erorile de eantionare: cu ct omogenitatea grupului este mai mare, cu att corelaia descrete Erorile de msurtoare sau de tastare
Corelaia i mrimea eantionului O corelaie slab poate fi semnificativ statistic dac eantionul este mare cu ct crete numrul de subieci, crete variabilitatea eantionului scderea coeficientului de corelaie dar crete semnificaia statistic. Este greit s afirmm c am obinut o corelaie slab din cauza numrului mic de subieci!!! D.p.d.v teoretic i corelaiile slabe pot fi importante Exemplu: un grup de cercettori a demonstrat c ntre consumul aspirinei i atacul de cord exist o corelaie de - .034, ceea ce nseamn c folosirea aspirinei explic doar 1% din variaia apariiei atacului de cord, adic dintr-un grup de 20.000 persoane care nu consumau aspirin, 72 fceau atac de cord !!!
Corelaia parial Relaia dintre dou variabile este afectat de o a treia variabil. Acest lucru este evident n cazul unor relaii false sau a unor relaii de moderare.
Relaii false ntre dou variabile C X Y X C Y Exemplul 1: Zilele ploioase duc la o dispoziie afectiv negativ. In realitate, exist ali factori precum presiunea atmosferic, gradul de luminozitate pot influena dispoziia afectiv, nu ploaia propriu-zis.
Exemplul 2: Persoanele mai scunde au prul mai lung. Dac avem n vedere variabila gen care coreleaz att cu lungimea prului ct i cu nlimea, obinem un alt rezultat. Femeile au pr mai lung i sunt mai scunde, iar relaia dintre X i Y devine nesemnificativ, dac inem cont de gen. Relaie ntre X i Y moderat de a treia variabil X C Y Exemplul 3: Relaia dintre timpul stat la soare i nivelul de bronzare. Dac avem n vedere variabila tip de ten, rezultatele sunt diferite. Relaia ntre X i Y mediat de a treia variabil X C Y Exemplul 4: Relaia dintre motivaia pentru nvare i performanele colare este mediat de strategiile de nvare. Motivaia pentru nvare duce la alegerea unor strategii mai eficiente care, la rndul lor, duc la rezultate colare ridicate. Pai SPSS pentru calculul corelaiei pariale Pai SPSS pentru calculul corelaiei pariale
1. exist o corelaie bivariat (Pearson) puternic semnificativ statistic ntre reprezentri spaiale i calcul aritmetic. 2. ! QI coreleaz semnificativ cu ambele variabile! 3. In partea a doua a tabelului (Controlling for QI) observm c de aceast dat corelaia dintre Reprezentarea spaial i calculul aritmetic devine nesemnificativ legtura dintre cele dou variabile nu era dect efectul influenei pe care o exercita inteligena asupra lor. (Marian Popa, 2009, Statistic psihologic nivel intermediar, note de curs). Dac relaia dintre Reprezentarea spaial i Calculul aritmetic ar fi rmas semnificativ, n condiiile n care influena QI este eliminat, am fi putut vorbi despre existena uni corelaii pariale.
Regresia liniar Regresia liniar frecvent utilizat n cercetarea psihologic pentru validarea unor modele teoretice pentru scopuri practice, precum selecia.
Exemplu Cunoscnd nivelul inteligenei unui elev, putem prezice performana sa colar. permite s estimm rezultatele viitoare pe baza unor indicatori din prezent
Variabila ale crei valori dorim s le prezicem, se numete criteriu, Variabila ale crei valori le utilizm pentru a prezice valorile criteriului, se numete predictor Regresia liniar pleac de la premisa unei corelaii puternice ntre predictor i criteriu Msura n care norul de puncte descrie o relaie liniar ntre variabile poate fi ilustrat prin trasarea unei drepte prin acest nor de puncte care contureaz patternul norului de puncte i care se numete linie de regresie Regresia liniar simpl - exist un singur predictor (variabila independent) i un singur criteriu (variabila dependent) Regresia multiliniar sau multipl presupune mai multe surse de variaie, ecuaia de regresie include mai muli factori ce intervin cu ponderi diferite n predicia criteriului.
Ecuaia de regresie Ecuaia de regresie Linia de regresie 5.5 6 6.5 7 7.5 8 8.5 9 80 85 90 95 100 105 110 115 120 M e d i e
m a t e m a t i c a
QI medie matematica Linear (medie matematica) Regresia liniar multipl Regresia liniar multipl presupune folosirea mai multor predictori.
Ecuaia de regresie este urmtoarea:
Y = B 0 + B 1 X 1 + B 2 X 2 + ... + B n X n
Condiii de aplicare pentru regresia liniar simpl i multipl
1. Variabila dependent (VD) i variabila independent (VI) s fie variabile cantitative normal distribuite. 2. Relaia dintre VD i VI s fie liniar (scatterplot - matrix). 3. Erorile (reziduurile) s fie normal distribuite (histogram sau Kolmogorov-Smirnov). 4. Evitarea multicoliniaritii (corelaii mari 0,50 0,60 ntre oricare dou VI). 5. Evitare cazurilor extreme i a cazurilor influente (inspectarea tabelului Residuals statitics). 6. Evitarea homoscedasticitii : reziduurile vor avea aceeai varian pentru fiecare nivel al variabilelor predictor (VI).
Calculul regresiei liniare simple (Pasul 1) Calculul regresiei liniare simple (Pasul 2) Primul tabel arat variabilele din modelul de predicie. Al doilea tabel, Model Summary, ofer coeficientul de corelaie dintre variabila dependent i variabila independent (R coeficientul de corelaie multipl, pentru regresia multiliniar), coeficientul de determinare (R 2 ) care arat procentul de variaie al variabilei criteriu explicat de variabila predictor. Al treilea tabel, ANOVA, testul F arat n ce msur exist diferene semnificative statistic ntre estimrile oferite pe baza ecuaiei de regresie implicate n comparaie cu estimrile bazate pe valoarea mediei (Sava, 2004). Pentru un model eficient, F este semnificativ statistic. Al patrulea tabel, Coefficients, conine coeficienii standardizai i nestandardizai de regresie i valoarea constantei. Testul t de pe ultima coloan arat dac fiecare coeficient de regresie este semnificativ diferit de 0. Pragul de semnificaie mai mic de 0,05 arat c predictorul ales este un predictor semnificativ.