Documente Academic
Documente Profesional
Documente Cultură
IPOTEZA DE NUL
▪ În cazul testelor parametrice H0 susține că mediile eșantioanelor sunt egale
▪ În cazul testelor neparametrice H0 susține că distribuțiile eșantioanelor sunt asemănătoare
→ respingerea ipotezei de nul nu mai oferă un rezultat intuitiv, este mai greu de interpretat.
▪ Testele neparametrice mai sunt cunoscute sub denumirea de teste libere de distribuție.
▪ Model <- wilcox.test(VD ~ VI, data = baza de date, paired = FALSE, exact=FALSE,
alternative = „greater/less/two.sided”).
▪ Model este un obiect care va primi rezultatele funcției wilcox.test
▪ VD – va primi denumirea variabilei dependente
▪ VI – va primi rezultatele variabilei independente
▪ paired = FALSE indică faptul că avem eșantioane independente
▪ exact=FALSE se folosește atunci când avem mai puțin de 50 de participanți
▪ alternative – indică tipul ipotezei
▪ Solicită pachetul devtools.
TESTUL WILCOXON
▪ este echivalentul neparametric al testului t pentru eșantioane dependente.
▪ Rezultatul testului Wilcoxon este o valoare T.
▪ Psihologul unei fabrici este interesat să studieze efectul concediului de odihnă asupra
productivității în muncă (α = 0,05, bilateral). Acesta măsoară productivitatea timp de o
săptămână înainte de plecarea în concediu a angajaților și o săptămână după revenirea la
locul de muncă. În tabelul 12.6 sunt sintetizate datele strânse de psiholog.
Valoarea calculatà a testului este valoarea T cea mai micã, în exemplul nostru 6.
• Valoarea criticà tabelar o vom citi în Anexa 8 în functie de volumul esantionului (N= 8) si a
= 0,05 bilateral -› Tcritic este egal cu 4.
• Atunci când valoarea calculatà este mai micã sau egalã cu valoarea criticã, se respinge
ipoteza de nul, iar ipoteza cercetàrii se confirmã.
• Când valoare calculatà este mare decât valoarea criticã, se accept ipoteza de nul, iar
ipoteza cercetarii nu se confirmã.
TESTUL KRUSKAL-WALLIS
▪ Acest test este echivalentul neparametric al testului de analiză de varianță uni-factorială
(ANOVA One-Way).
▪ Presupunem că un psiholog este interesat să studieze dacă exercițiile fizice au un rol
asupra depresiei (α = 0,01). Acesta îi împarte pe cei 15 pacienți cu depresie în trei grupuri:
în unul în care pacienții nu vor face exerciții fizice, în al doilea eșantion participanții care vor
alerga ușor timp de 20 de minute și un grup în care participanții vor alerga ușor timp de 45
de minute.
TESTUL FRIEDMAN
▪ Testul Friedman este utilizat în situația în care dorim să comparăm rezultatele obținute în
cel puțin trei condiții pe același eșantion.
▪ Echivalentul parametric al acestui test este ANOVA pentru măsurători repetate
(ANOVA-MR).
▪ un profesor este interesat să studieze anxietatea studenților înainte de a intra în sesiune.
Acesta selectează un eșantion de 10 studenți cărora le măsoară anxietatea în la începutul
fiecărei sesiuni pe parcursul celor trei ani de studii.
Exemplul 1
Dacă studenții la psihologie de la 3 facultăți diferite au de răspuns la un chestionar privind
utilitatea unor discipline, aceștia vor face o alegere bazată, cel mai frecvent, pe o comparație
orientată tematic. – ANOVA unifactorială, eșantioane independente.
Dacă studenții dintr-o facultate răspund la un chestionar privind utilitatea statisticii,
chestionar aplicat succesiv, atât în anul 1, în anul 3 cât și la finalul unui program de master,
aceștia se vor baza pe o comparație orientată ceva mai pragmatic, ca urmare a unor
chestionări repetate. – ANOVA cu măsurători repetate.
Exemplul 2
Dacă alegem să măsurăm personalitate pentru 3 grupuri distincte (medici, psihologi,
ingineri) atunci putem compara profilul personalității celor 3 profesii. – ANOVA unifactorială,
eșantioane independente.
Dacă alegem să măsurăm personalitatea înainte de intrarea în profesie, în timpul și la
pensionarea unui anumit grup, atunci alegem să măsurăm în mod repetat personalitatea,
dar la momente total diferite. – ANOVA cu măsurători repetate.
AVANTAJE
▪ Neutralizarea variabilității determinate de particularitățile participanților.
▪ Putere mai mare
▪ Necesită mai puțini participanți.
DEZAVANTAJE
▪ Pierderea (mortalitatea) participanților.
▪ Încălcarea condiției de independetă a valorilor – rezultatele dintr-o anumită etapă pot fi
influențate de măsurătorile anterioare (efectul de memorie, obișnuința cu proba, intuirea
obiectivului cercetării etc).
▪ Efectul exercițiului.
▪ Efectul de oboseală.
▪ Efectul de tranziție a tratamentului – stres vs relaxare (stresul indus în prima etapă poate
afecta performanța în condiția de relaxare).
▪ Efectul de ordine – se referă la posibilitatea ca efectul tratamentului să fie influențat de
ordinea în care participanții sunt raportați la condițiile de tratament.
LOGICA ANOVA-MR
▪Ipoteza statistica ramâne aceeasi ca si în cazul ANOVA esantioane independente.
CONDITII
▪ VD – se măsoară pe scală I/R
▪ VI are trei sau mai multe niveluri care descriu momentele sau condițiile măsurării.
▪ VD – are distribuție normală pentru fiecare moment al măsurării
▪ Eșantionare aleatorie – deoarece este greu de efectuat, în cazul ANOVA-MR se utilizează
eșantioane de conveniență.
▪ Să nu existe cazuri extreme
▪ Condiția de sfericitate
CONDIȚIA DE SFERICITATE
▪ R afișează rezultatele testului Mauchly.
▪ daca testul Mauchly este semnificativ statistic (p ≤ 0,05) vom concluziona că există
diferențe semnificative între varianțele diferențelor și condiția de sfericitate nu este
îndeplinită.
▪ Dacă testul Mauchly este nesemnificativ statistic (p > .0.05) diferențele dintre varianțele
diferențelor nu sunt semnificative statistic (sunt aproximativ egale) și este îndeplinită condiția
de sfericitate.
ANOVA MR – R
▪Profesorul de statistică este interesat să studieze efectul pe care îl are complexitatea
materiei predate asupra notelor obținute de studenți la evaluările parțiale.
▪H1: Notele obținute de studenți la cele patru parțiale sunt diferite ca urmare a complexității
informațiilor învățate.
▪Pachetele necesare
a)ez – pentru a aplica funcția
b)ezANOVA psych – pentru statistica descriptivă
Observație!
Cu toate că testul W al lui John William Mauchly este unul dintre cele mai utilizate pentru
evaluarea sfericității, testul nu reușește să detecteze întotdeauna abaterea față de sfericitate
în cazul eșantioanelor mici și o supraestimează în cazul eșantioanelor mari. În consecință
dimensiunea eșantionului influențează interpretarea rezultatelor.
În exemplul prezentat mai sus abaterea de la sfericitate a fost detectată (p < .05).
Curs 3 - ANALIZA DE REGRESIE LINIARĂ
CORELAȚIE ȘI PREDICȚIE
▪ Cea mai populară procedură statistică în științele psiho-sociale
▪ Francis Galton – relația dintre înălțimea medie a părinților și înălțimea copiilor ▪ Analiza de
regresie și coeficientul de corelație
Corelația liniară
Regresia multiplă
Predicția perfectă
▪ r = ±1
▪ Orice valoare a predictorului (X) corespunde unei valori identice a criteriului (Y)
▪ Între X și Y există o relație direct proporțională (corelație perfect pozitivă) sau invers
proporțională (corelație perfect negativă).
Predicția în cazul corelației imperfecte
▪ r ε (-1 → 1)
▪ X = atitudinea față de statistică (predictorul)
▪ Y = performanța la statistică (Semestrul I) (criteriul)
DREAPTA DE REGRESIE
▪ Relația dintre X și Y poate fi reprezentată grafic prin intermediul graficului Scatterplot.
▪ Măsura în care norul de puncte descrie relația dintre predictor și criteriu va fi ilustrată
printr-o dreaptă care trece prin acest nor = dreapta de regresie.
▪ Pentru a trasa dreapta avem nevoie de punctul de origine și panta (înclinarea).
EROAREA DE PREDICȚIE
▪ Prin bifarea unei opțiuni SPSS-ul ne salvează în baza de date valorile prezise ale VD
(performanța la statistică în sem I).
▪ Diferența dintre valorile prezise și valorile reale ale performanței la statistică reprezintă
eroarea de predicție (varianță neexplicată sau diferență reziduală).
CONDIȚII
▪ VD – scală I/R (există și situații în care se măsoară pe scală ordinală)
▪ VD – distribuție normlă
▪ VI – scală I/R sau nominală dihotomică (ex: nu consumă = 0;
consumă = 1).
▪ VI distribuție normală atunci când este măsurată pe scală I/R.
▪ Existența unei relații liniare între VI și VD
▪ Variabilele predictor trebuie să fie ortogonale (să nu coreleze între ele).
▪ Existența unei corelații între predictori se numește multicoliniaritate (pe scurt coliniaritate).
▪ Predictorii sunt ortogonali atunci când prezintă corelații sub .30; Tolerance > .70; VIF <
10).
VOLUMUL EȘANTIONULUI
▪ Marks (1966) – 200 de participanți indiferent de numărul predictorilor
▪ Schmidt (1971) - pentru fiecare variabilă independentă sunt necesari 25 de participanți. ▪
Green (1991) – N = 50 + m*8
THE NULL HYPOTHESIS
▪ Ipoteza de nul susține că panta este egală cu 0. ▪ H0: b = 0
▪ Ipteza cercetării susține că:
a) Există un efect pozitiv – panta este pozitivă (b > 0)
b) Există un efect negativ – panta este negativă (b < 0)
c) Predictorul are un efect asupra criteriului – panta este diferită de
(b ≠ 0).
EXEMPLU
▪ Se cunoaște faptul că abilitățile numerice au un efect asupra anxietății față de statistică.
Dacă avem studenți proveniți de la trei facultăți (Psihologie, Sociologie și Științele Educației)
este recomandat să eliminăm efectul abilităților numerice (VCo) înainte de a testa diferențele
la nivelul anxietății față de statistică în funcție de profilul facultatea în care învață studenții.
ANCOVA
▪ A controla o variabilă = a o menține constantă
▪ Ce diferență ar exista la nivelul anxietății față de statistică în funcție de tipul facultății, dacă
toți participanții ar avea aceleași abilități numerice.
AVANTAJELE ANCOVA
▪ Reducerea erorii determinate de varianța intra-grup – în cazul ANOVA One-Way, varianța
intra-grup este varianța neexplicată a VD de către VI. Dacă o parte din această varianță
neexplicată ar putea fi atribuită unei variabile covariante atunci am putea obține un efect mai
sensibil al VI asupra VD.
▪ Controlul VCo – are loc o corecție a mediilor VD în raport cu valorile VCo.
▪ Volumul eșantionului – controlând VCo, nu trebuie să alegem doar participanți care au
același nivel al variabilei care are o influență asupra VD. În concluzie, asigurăm o putere mai
mare.
NUMĂRUL COVARIANȚELOR
▪ Un model poate include una sau mai multe covariante.
▪ Se vor selecta covariantele care prezintă corelațiile cele mai mari cu VD.
▪ un număr prea mare de covariante determină scăderea puterii testului.
CONDITII
▪ Existența unei relații liniare între VD și VCo – în lipsa unei astfel de relații nu are sens să
excludem efectul unei variabile.
▪ Absența unei relații liniare între covariante – în cazul în care covariantele corelează între
ele, coeficienții de corelație trebuie să fie mai mici decât 0.30.
▪ Covariantele trebuie să fie măsurate fără erori – se recomandă ca instrumentele utilizate
pentru a măsura VCo să aibă un indice de fidelitate > 0.80.
▪ Independența covariantelor în raport cu VI – nu trebuie să existe o corelație între VI și VCo.
De exemplu, dacă studiem diferențele la nivelul conformismului în funcție de vârstă, folosind
anxietatea drept covariantă, se cunoaște faptul că anxietatea este în relație vârsta.
▪ Omogenitarea varianțelor VD în raport cu VI
▪ Omogenitatea pantei de regresie – panta de regresie pentru relația dintre covariante și VD
trebuie să fie echivalentă pentru fiecare grup.
▪ În concluzie, efectul variabilelor covariante asupra VD trebuie să fie echivalent în raport cu
fiecare nivel al VI. Dacă această condiție nu este îndeplinită, ajustarea valorilor VD în funcție
de VCo este imprecisă.
Dacă IV determină 3 grupuri, la nivelul fiecărui grup relația covariantă – variabilă dependentă
este similară în cazul omogenității de regresie.
ANCOVA UNIFACTORIALA
▪ Dorim să studiem variaţia conformismului în funcţie de categoria de vârstă, cu eliminarea
efectului anxietăţii
▪ Similar cazului ANOVA unifactorial ne interesează în ce măsură conformismul variază în
funcţie de categoriile de vârstă?
▪ Singura diferenţă faţă de ANOVA unifactorial este dată de faptul că răspunsul la întrebare
are loc după excluderea influenţei variabilei covariante, în cazul nostru „anxietatea”.
▪ Variaţia conformismului în funcţie de categoria de vârstă, prin ANCOVA presupune
identificarea efectului categoriei de vârstă (IV) asupra conformismului (DV) păstrând constat
nivelul anxietăţii. (cel mai adesea se folosește valoare medie a anxietății)
▪ Acest fapt se traduce prin realizarea ANOVA, însă după excluderea influenţei variabilei
covariante (controlul acesteia), în cazul de față „anxietatea”.
▪Există diferențe semnificative la nivelul comportamentului alimentar nesănătos (ED) în
funcție de orientarea sexuală atunci când ținem sub control depresia?
Curs 5 - DISTRIBUTIA BINOMIALA
DISTRIBUTIA BINOMIALA
▪ BINOM = Expresie algebrică constituită din suma sau diferența a doi termeni.
▪ Distribuția binomială este formată din probabilitățile fenomenelor dihotomice.
▪ Evenimentele dihotomice reprezintă acele fenomene care pot avea două posibilități.
▪ Cum răspundem la următoarele întrebări:
▪ Sunt o persoană analitică sau sintetică?
▪ Prefer fotbalul sau alt sport?
▪ Doresc să urmez un program de Master la FPSE?
▪ Ascult predominant cu urechea stângă sau cu urechea dreaptă?
▪ Vreți să lucrăm cu pauză sau terminăm cursul cu 10 minute mai devreme? ☺
Probabilitatea unui eveniment este egală cu p.
Evenimentul complementar are probabilitatea egală cu q.
p= N/nE
N- reprezintă numărul de observații
nE - reprezintă numărul de rezultate posibile
q=1-p
CONDIȚII
1. Numărul de observații n este fix.
2. Fiecare observație este independentă.
3. Fiecare observație reprezintă una dintre cele două valori de tip dihotomi (succes/eșec)
4. Probabililitatea de succes = p este aceeași pentru fiecare observație
INDICELE DE DIFICULTATE
▪ Indicele de dificultate al itemului reprezintă probabilitatea de răspunde „corect” la item.
▪ Atunci când măsurăm trăsături de personalitate, răspunsurile corecte sunt cele care indică
prezența constructului măsurat.
▪ Atunci când folosim scoare Lickert (de exemplu, de la 1 la 5) răspunsurile corecte sunt 4 și
5.
▪ În cazul în care există itemi formulați în sensul opus constructului, răspunsurile vor fi
inversate înainte de începe analiza de itemi (1 devine 5, 2 devine 4 etc). Această
transformare poate fi făcută în R cu ajutorul funcției recode!!!
INDICELE DE DISCRIMINARE
▪ Indică măsura în care un item diferențiază corect între participanți.
▪ Arată în ce măsură itemul diferențiază între cei care au răspuns corect din grupul superior
comparativ cu cei care au răspuns corect în grupul inferior.
▪ Poate lua valori între -1 și +1.
▪ Ebel și Firisbie (1986) propun următoarea clasificare a itemilor în funcție de indicele de
discriminare:
▪ Mai mare sau egal cu 0,40 – itemul este bun.
▪ Între 0,30 și 0,39 – acceptabil.
▪ Între 0,20 și 0,29 – slab.
▪ Sub 0,20 – foarte slab.