Sunteți pe pagina 1din 18

Curs 1- Testele statistice neparametrice pentru date ordinale

TESTELE NEPARAMETRICE PENTRU DATE ORDINALE


1. Testul Mann-Whitney
2. Testul Wilcoxon
3. Testul Kruskal-Wallis
4. Testul Friedman pentru măsurători repetate
5. Testele de corelație pentru date ordinale (Spearman și Kendall).
CÂND LE UTILIZAM?
▪ VD este măsurată pe scală nominală sau ordinală.
▪ VD este de tip categorial indiferent de scala de măsurare.
▪ Deși VD este măsurată pe scală I/R nu îndeplinește condițiile impuse de testele
parametrice: normalitate, valori extreme.
▪ Volumul eșantionului este mic (N < 30).

IPOTEZA DE NUL
▪ În cazul testelor parametrice H0 susține că mediile eșantioanelor sunt egale
▪ În cazul testelor neparametrice H0 susține că distribuțiile eșantioanelor sunt asemănătoare
→ respingerea ipotezei de nul nu mai oferă un rezultat intuitiv, este mai greu de interpretat.
▪ Testele neparametrice mai sunt cunoscute sub denumirea de teste libere de distribuție.

TRANSFORMAREA VALORILOR ÎN RANGURI


▪ În situația în care VD are valori măsurate pe scală I/R, acestea vor fi transformate în
ranguri
(lb. engleză = rank)
▪ Rangurile sunt atribuite în funcție de poziția respondentului după ordonarea crescătoare
sau
descrescătoare a valorilor.
▪ Putem atribui rangul cel mai mic scorului cel mai mare (primul loc este ocupat de
respondentul cu cea mai bună performanță), dar la fel de bine putem atribui rangul cel mai
mare respondentului cu scorul cel mai mare.
▪ Atunci când avem valori egale rangurile se pot distribui după 3 reguli:
1. Atribuirea rangului mediu – toate valorile identice primesc un rang egal cu media
aritmetică
a rangurilor cuvenite scorurilor identice.
2. Atribuirea rangului cel mai mic sau a celui mai mare – toate valorile identice primesc
rangul cel mai mic (cel ce corespunde primei valori) sau rangul cel mai mare (cel care
corespunde ultimei valori identice).
3. Atribuirea secvențială – presupune ca valorile identice să primească primul rang
disponibil, iar valoarea distinctă ce urmează primește rangul imediat următor.
TESTUL MANN-WHINEY
▪ este utilizat pentru a determina în ce măsură sunt diferite două seturi de date extrase din
eșantioane independente.
▪ este corespondentul neparametric al testului t pentru două eșantioane independente.
▪ un psiholog dorește să studieze în ce măsură muzica clasică are un efect asupra
capacității de memorare. El selectează un eșantion de 27 de studenți cărora le dă spre
memorare o listă de cuvinte. Participanții sunt împărțiți în două grupuri: 15 studenți au
memorat lista ascultând muzică clasică, iar 12 au memorat lista într-un mediu fără fundal
sonor. Există diferențe semnificative între cele două eșantioane?
▪ Valoarea calculată a testului Mann-Whitney este dată de valoarea calculată U cea mai
mică.
▪ Deoarece U1 = U2 este de la sine înțeles că valoarea calculată a testului este 90.
▪ Decizia statistică se ia prin compararea valorii U calculate (90) cu valoarea critică U din
Anexa 6 → Ucritic = 49.

▪ Dacă Ucalculat > Ucritic se acceptă ipoteza de nul.


▪ Dacă Ucalculat ≤ Ucritic se respinge ipoteza de nul.
▪ Ucalculat (90) > Ucritic (49) → acceptăm H0 și respingem H1

▪ Model <- wilcox.test(VD ~ VI, data = baza de date, paired = FALSE, exact=FALSE,
alternative = „greater/less/two.sided”).
▪ Model este un obiect care va primi rezultatele funcției wilcox.test
▪ VD – va primi denumirea variabilei dependente
▪ VI – va primi rezultatele variabilei independente
▪ paired = FALSE indică faptul că avem eșantioane independente
▪ exact=FALSE se folosește atunci când avem mai puțin de 50 de participanți
▪ alternative – indică tipul ipotezei
▪ Solicită pachetul devtools.

TESTUL WILCOXON
▪ este echivalentul neparametric al testului t pentru eșantioane dependente.
▪ Rezultatul testului Wilcoxon este o valoare T.
▪ Psihologul unei fabrici este interesat să studieze efectul concediului de odihnă asupra
productivității în muncă (α = 0,05, bilateral). Acesta măsoară productivitatea timp de o
săptămână înainte de plecarea în concediu a angajaților și o săptămână după revenirea la
locul de muncă. În tabelul 12.6 sunt sintetizate datele strânse de psiholog.

Valoarea calculatà a testului este valoarea T cea mai micã, în exemplul nostru 6.
• Valoarea criticà tabelar o vom citi în Anexa 8 în functie de volumul esantionului (N= 8) si a
= 0,05 bilateral -› Tcritic este egal cu 4.
• Atunci când valoarea calculatà este mai micã sau egalã cu valoarea criticã, se respinge
ipoteza de nul, iar ipoteza cercetàrii se confirmã.
• Când valoare calculatà este mare decât valoarea criticã, se accept ipoteza de nul, iar
ipoteza cercetarii nu se confirmã.

TESTUL KRUSKAL-WALLIS
▪ Acest test este echivalentul neparametric al testului de analiză de varianță uni-factorială
(ANOVA One-Way).
▪ Presupunem că un psiholog este interesat să studieze dacă exercițiile fizice au un rol
asupra depresiei (α = 0,01). Acesta îi împarte pe cei 15 pacienți cu depresie în trei grupuri:
în unul în care pacienții nu vor face exerciții fizice, în al doilea eșantion participanții care vor
alerga ușor timp de 20 de minute și un grup în care participanții vor alerga ușor timp de 45
de minute.

▪ Scorul H poate avea doar valori mai mari sau egale cu 0.


▪ Pentru situațiile în care cel puțin unul din eșantioane are minim 6 participanți, valoarea
critică se citește din tabelul de la Anexa 8 în funcție de numărul de grade de libertate (df =
numărul de grupuri - 1) și pragul α.
▪ Atunci când toate eșantioanele au sub 6 participanți valoarea critică se citește dintr-un
tabel special (Anexa 9) în funcție de volumul fiecărui grup și nivelul pragului α.
▪ Pentru exemplul nostru, valoarea critică este egală cu 8,00.
▪ Atunci când valoarea calculată este mai mică decât valoarea critică acceptăm ipoteza de
nul și respingem ipoteza cercetării.
▪ Atunci când valoarea calculată este mai mare sau egală cu valoarea critică vom respinge
ipoteza de nul și ipoteza cercetării se confirmă.
▪ În exemplul nostru H = 0,875 este mai mic decât Hcritic = 8,00 și vom accepta ipoteza de
nul. În concluzie nivelul depresiei pacienților nu diferă semnificativ în funcție de timpul
petrecut efectuând exerciții fizice.

TESTUL FRIEDMAN
▪ Testul Friedman este utilizat în situația în care dorim să comparăm rezultatele obținute în
cel puțin trei condiții pe același eșantion.
▪ Echivalentul parametric al acestui test este ANOVA pentru măsurători repetate
(ANOVA-MR).
▪ un profesor este interesat să studieze anxietatea studenților înainte de a intra în sesiune.
Acesta selectează un eșantion de 10 studenți cărora le măsoară anxietatea în la începutul
fiecărei sesiuni pe parcursul celor trei ani de studii.

▪ valoarea calculată a testului Friedman este mai mare sau egală cu 0.


▪ Valoarea critică se citește din Anexa 8 în funcție de numărul de grade de libertate (numărul
de măsurători - 1) și pragul α.
▪ Pentru exemplul nostru, valoarea critică este 11.07.
▪ valoarea calculată a testului Friedman este mai mare sau egală cu 0.
▪ Valoarea critică se citește din Anexa 8 în funcție de numărul de grade de libertate (numărul
de măsurători - 1) și pragul α.
▪ Pentru exemplul nostru, valoarea critică este 11.07
▪ Atunci când valoarea calculată este mai mică decât valoarea critică acceptăm ipoteza de
nul și
respingem ipoteza cercetării.
▪ Atunci când valoarea calculată este mai mare sau egală cu valoarea critică vom respinge
ipoteza de nul și ipoteza cercetării se confirmă.
▪ În cazul nostru, valoarea calculată (9,2) este mai mică decât cea critică (11,07) și luăm
decizia de a accepta ipoteza de nul și de a respinge ipoteza cercetării.
Curs 2 - ANOVA pentru măsurători repetate / A NOVA-MR
INTRODUCERE
▪ ANOVA One-Way și ANCOVA au fost utilizate pentru a compara grupuri formate din
participanți diferiți.
▪ Testul t pentru eșantioane dependente compara mediile obținute pe același eșantion în
două condiții diferite (test - retest).
▪ ANOVA-MR se utilizează atunci când comparăm mediile aceluiași eșantion în trei momente
diferite.
▪ Exemple: comparații privind depresia post-natală a mamelor cu 3 copii, comparații privind
performanțele studenților la parțialele de la Statistică (Parțial 1, Parțial 2, Parțial 3 și Parțial
4).
▪ Design longitudinal – oferă posibilitatea de a urmări evoluția comportamentului studiat
pentru o perioadă de timp.

Exemplul 1
Dacă studenții la psihologie de la 3 facultăți diferite au de răspuns la un chestionar privind
utilitatea unor discipline, aceștia vor face o alegere bazată, cel mai frecvent, pe o comparație
orientată tematic. – ANOVA unifactorială, eșantioane independente.
Dacă studenții dintr-o facultate răspund la un chestionar privind utilitatea statisticii,
chestionar aplicat succesiv, atât în anul 1, în anul 3 cât și la finalul unui program de master,
aceștia se vor baza pe o comparație orientată ceva mai pragmatic, ca urmare a unor
chestionări repetate. – ANOVA cu măsurători repetate.

Exemplul 2
Dacă alegem să măsurăm personalitate pentru 3 grupuri distincte (medici, psihologi,
ingineri) atunci putem compara profilul personalității celor 3 profesii. – ANOVA unifactorială,
eșantioane independente.
Dacă alegem să măsurăm personalitatea înainte de intrarea în profesie, în timpul și la
pensionarea unui anumit grup, atunci alegem să măsurăm în mod repetat personalitatea,
dar la momente total diferite. – ANOVA cu măsurători repetate.

▪ Modelul longitudinal oferă răspunsul la mai multe întrebări:


1. Putem evidenția efectul unei variabile independente asupra variabilei dependente, de
exemplu, efectul terapeutic prin mai multe evaluări?
2. Care este evoluția acestor efecte încă o perioadă de timp de la încheierea terapiei?
3. Există riscul, în cazul măsurătorilor repetate, al transportului de efecte de la o
măsurătoare la alta (carry-over effects)? Și în acest caz ce soluții există pentru a obiectiva
mărimea acestora?
4. Care sunt procedurile statistice adecvate pentru astfel de analize?

AVANTAJE
▪ Neutralizarea variabilității determinate de particularitățile participanților.
▪ Putere mai mare
▪ Necesită mai puțini participanți.
DEZAVANTAJE
▪ Pierderea (mortalitatea) participanților.
▪ Încălcarea condiției de independetă a valorilor – rezultatele dintr-o anumită etapă pot fi
influențate de măsurătorile anterioare (efectul de memorie, obișnuința cu proba, intuirea
obiectivului cercetării etc).
▪ Efectul exercițiului.
▪ Efectul de oboseală.
▪ Efectul de tranziție a tratamentului – stres vs relaxare (stresul indus în prima etapă poate
afecta performanța în condiția de relaxare).
▪ Efectul de ordine – se referă la posibilitatea ca efectul tratamentului să fie influențat de
ordinea în care participanții sunt raportați la condițiile de tratament.

LOGICA ANOVA-MR
▪Ipoteza statistica ramâne aceeasi ca si în cazul ANOVA esantioane independente.

CONDITII
▪ VD – se măsoară pe scală I/R
▪ VI are trei sau mai multe niveluri care descriu momentele sau condițiile măsurării.
▪ VD – are distribuție normală pentru fiecare moment al măsurării
▪ Eșantionare aleatorie – deoarece este greu de efectuat, în cazul ANOVA-MR se utilizează
eșantioane de conveniență.
▪ Să nu existe cazuri extreme
▪ Condiția de sfericitate

Ce este condiția de sfericitate?


▪ este asemănătoare cu omogenitatea varianțelor din cazul testului t pentru eșantioane
independente sau ANOVA.
▪ Sfericitatea, care se notează cu ε (epsilon), se referă la:
a) omogenitatea varianței pentru fiecare nivel al măsurării
b) egalitatea varianțelor diferențelor dintre măsurători luate două câte două.
dacă formăm perechi de câte două măsurători și calculăm diferențele dintre scoruri, atunci
este necesar ca aceste diferențe să aibă varianțe aproximativ egale.

CONDIȚIA DE SFERICITATE
▪ R afișează rezultatele testului Mauchly.
▪ daca testul Mauchly este semnificativ statistic (p ≤ 0,05) vom concluziona că există
diferențe semnificative între varianțele diferențelor și condiția de sfericitate nu este
îndeplinită.
▪ Dacă testul Mauchly este nesemnificativ statistic (p > .0.05) diferențele dintre varianțele
diferențelor nu sunt semnificative statistic (sunt aproximativ egale) și este îndeplinită condiția
de sfericitate.

ANOVA MR – R
▪Profesorul de statistică este interesat să studieze efectul pe care îl are complexitatea
materiei predate asupra notelor obținute de studenți la evaluările parțiale.
▪H1: Notele obținute de studenți la cele patru parțiale sunt diferite ca urmare a complexității
informațiilor învățate.
▪Pachetele necesare
a)ez – pentru a aplica funcția
b)ezANOVA psych – pentru statistica descriptivă

Observație!
Cu toate că testul W al lui John William Mauchly este unul dintre cele mai utilizate pentru
evaluarea sfericității, testul nu reușește să detecteze întotdeauna abaterea față de sfericitate
în cazul eșantioanelor mici și o supraestimează în cazul eșantioanelor mari. În consecință
dimensiunea eșantionului influențează interpretarea rezultatelor.
În exemplul prezentat mai sus abaterea de la sfericitate a fost detectată (p < .05).
Curs 3 - ANALIZA DE REGRESIE LINIARĂ
CORELAȚIE ȘI PREDICȚIE
▪ Cea mai populară procedură statistică în științele psiho-sociale
▪ Francis Galton – relația dintre înălțimea medie a părinților și înălțimea copiilor ▪ Analiza de
regresie și coeficientul de corelație

Corelația liniară

Regresie liniară simplă

Regresia multiplă

▪ VI = predictor (lb. engleză explanatory variable, antecedent variable) ▪ VD = criteriu (lb.


engleză consequent variable)
▪ Regresia simplă
- un singur predictor
- are la bază corelația dintre X și Y
▪ Regresia multiplă
- există cel puțin doi predictori
- are la bază corelația multiplă dintre predictori și criteriu

Predicția perfectă
▪ r = ±1
▪ Orice valoare a predictorului (X) corespunde unei valori identice a criteriului (Y)
▪ Între X și Y există o relație direct proporțională (corelație perfect pozitivă) sau invers
proporțională (corelație perfect negativă).
Predicția în cazul corelației imperfecte
▪ r ε (-1 → 1)
▪ X = atitudinea față de statistică (predictorul)
▪ Y = performanța la statistică (Semestrul I) (criteriul)

▪ Pentru exemplul prezentat r = .-578


▪ În contextul regresiei liniare simple, coeficientul de corelație devine coeficient de regresie și
se
notează cu R.
▪ Coeficientul de determinare pentru corelație (r2) devine coeficient de determinare pentru
regresie (R2)
▪ R2 se interpretează la fel ca r2.
▪ Pentru exemplul anterior R2=.3340
▪ Astfel, 33.40% din variabilitatea valorilor performanței la statistică pe primul semestru are
legătură cu variabilitatea valorilor anxietății față de statistică.
▪ zy’ = r * zx
▪ zy’ = valorile prezise ale criteriului în scoruri z
▪ zx = valorile predictorului în scoruri z
▪ Pe măsură ce r tinde spre 0, zy’ va lua valori din ce în ce mai mici (tinzând spre 0).

REGRESIA CĂTRE MEDIE


▪ Sir Francis Galton a introdus termenul de regresie studiind relația dintre înălțimea copiilor și
cea a părinților.
▪ Galton a găsit un r = .67 între înălțimea părinților (X) și cea a copiilor (Y).
▪ Pornind de la acest rezultat se poate prezice înălțimea copilului dacă știm înălțimea medie
a
părinților lui.
▪ Dacă înălțimea medie a părinților unui copil este cu 1.5 abateri standard peste media
populației de părinți, atunci copilul va avea o înălțime egală cu:
zy’ = 0.67 * 1.5 = 1.005
▪ Cu alte cuvinte, copilul va avea o înălțime cu 1.005 abateri standard mai mare decât media
populației de copii.
▪ Galton a denumit această tendință regresia către mediocritate
▪ denumirea consacrată este de regresie către medie.
▪ Datorită relației de tip liniar vorbim despre regresie liniară către medie.

DREAPTA DE REGRESIE
▪ Relația dintre X și Y poate fi reprezentată grafic prin intermediul graficului Scatterplot.
▪ Măsura în care norul de puncte descrie relația dintre predictor și criteriu va fi ilustrată
printr-o dreaptă care trece prin acest nor = dreapta de regresie.
▪ Pentru a trasa dreapta avem nevoie de punctul de origine și panta (înclinarea).

EROAREA DE PREDICȚIE
▪ Prin bifarea unei opțiuni SPSS-ul ne salvează în baza de date valorile prezise ale VD
(performanța la statistică în sem I).
▪ Diferența dintre valorile prezise și valorile reale ale performanței la statistică reprezintă
eroarea de predicție (varianță neexplicată sau diferență reziduală).
CONDIȚII
▪ VD – scală I/R (există și situații în care se măsoară pe scală ordinală)
▪ VD – distribuție normlă
▪ VI – scală I/R sau nominală dihotomică (ex: nu consumă = 0;
consumă = 1).
▪ VI distribuție normală atunci când este măsurată pe scală I/R.
▪ Existența unei relații liniare între VI și VD
▪ Variabilele predictor trebuie să fie ortogonale (să nu coreleze între ele).
▪ Existența unei corelații între predictori se numește multicoliniaritate (pe scurt coliniaritate).
▪ Predictorii sunt ortogonali atunci când prezintă corelații sub .30; Tolerance > .70; VIF <
10).
VOLUMUL EȘANTIONULUI
▪ Marks (1966) – 200 de participanți indiferent de numărul predictorilor
▪ Schmidt (1971) - pentru fiecare variabilă independentă sunt necesari 25 de participanți. ▪
Green (1991) – N = 50 + m*8
THE NULL HYPOTHESIS
▪ Ipoteza de nul susține că panta este egală cu 0. ▪ H0: b = 0
▪ Ipteza cercetării susține că:
a) Există un efect pozitiv – panta este pozitivă (b > 0)
b) Există un efect negativ – panta este negativă (b < 0)
c) Predictorul are un efect asupra criteriului – panta este diferită de
(b ≠ 0).

Curs 4 - ANALIZA DE COVARIANȚĂ (ANCOVA)


CE ESTE ANCOVA?
▪ ANOVA One-Way compară mediile a cel puțin trei eșantioane independente (formate din
participanți diferiți).
▪ ANOVA-One Way nu ține cont de celelalte variabile care ar putea avea un efect asupra VD.
▪ ANCOVA este o extensie a ANOVA One-Way → testează efectele VI după ce este eliminat
efectul unei/mai multor variabile care ar putea avea efect asupra VD.
▪ ANCOVA rafinează rezultatele obținute prin ANOVA One-Way.
▪ Variabilele care au un efect asupra VD se numesc variabile covariante (lb. engleză –
covariate
variables).
▪ Covarianta este o variabilă care are o influență cunoscută asupra VD și nu există motive
care să
justifice utilizarea ei.
▪ Într-un studiu se pot utiliza una sau mai multe variabile covariante.
▪ ANCOVA compară mediile provenite de la cel puțin două eșantioane independente
eliminând efectul variabilelor care pot avea un efect asupra VD.

EXEMPLU
▪ Se cunoaște faptul că abilitățile numerice au un efect asupra anxietății față de statistică.
Dacă avem studenți proveniți de la trei facultăți (Psihologie, Sociologie și Științele Educației)
este recomandat să eliminăm efectul abilităților numerice (VCo) înainte de a testa diferențele
la nivelul anxietății față de statistică în funcție de profilul facultatea în care învață studenții.

ANCOVA
▪ A controla o variabilă = a o menține constantă
▪ Ce diferență ar exista la nivelul anxietății față de statistică în funcție de tipul facultății, dacă
toți participanții ar avea aceleași abilități numerice.

AVANTAJELE ANCOVA
▪ Reducerea erorii determinate de varianța intra-grup – în cazul ANOVA One-Way, varianța
intra-grup este varianța neexplicată a VD de către VI. Dacă o parte din această varianță
neexplicată ar putea fi atribuită unei variabile covariante atunci am putea obține un efect mai
sensibil al VI asupra VD.
▪ Controlul VCo – are loc o corecție a mediilor VD în raport cu valorile VCo.
▪ Volumul eșantionului – controlând VCo, nu trebuie să alegem doar participanți care au
același nivel al variabilei care are o influență asupra VD. În concluzie, asigurăm o putere mai
mare.

NUMĂRUL COVARIANȚELOR
▪ Un model poate include una sau mai multe covariante.
▪ Se vor selecta covariantele care prezintă corelațiile cele mai mari cu VD.
▪ un număr prea mare de covariante determină scăderea puterii testului.

CONDITII
▪ Existența unei relații liniare între VD și VCo – în lipsa unei astfel de relații nu are sens să
excludem efectul unei variabile.
▪ Absența unei relații liniare între covariante – în cazul în care covariantele corelează între
ele, coeficienții de corelație trebuie să fie mai mici decât 0.30.
▪ Covariantele trebuie să fie măsurate fără erori – se recomandă ca instrumentele utilizate
pentru a măsura VCo să aibă un indice de fidelitate > 0.80.
▪ Independența covariantelor în raport cu VI – nu trebuie să existe o corelație între VI și VCo.
De exemplu, dacă studiem diferențele la nivelul conformismului în funcție de vârstă, folosind
anxietatea drept covariantă, se cunoaște faptul că anxietatea este în relație vârsta.
▪ Omogenitarea varianțelor VD în raport cu VI
▪ Omogenitatea pantei de regresie – panta de regresie pentru relația dintre covariante și VD
trebuie să fie echivalentă pentru fiecare grup.
▪ În concluzie, efectul variabilelor covariante asupra VD trebuie să fie echivalent în raport cu
fiecare nivel al VI. Dacă această condiție nu este îndeplinită, ajustarea valorilor VD în funcție
de VCo este imprecisă.

Dacă IV determină 3 grupuri, la nivelul fiecărui grup relația covariantă – variabilă dependentă
este similară în cazul omogenității de regresie.

ANCOVA UNIFACTORIALA
▪ Dorim să studiem variaţia conformismului în funcţie de categoria de vârstă, cu eliminarea
efectului anxietăţii
▪ Similar cazului ANOVA unifactorial ne interesează în ce măsură conformismul variază în
funcţie de categoriile de vârstă?
▪ Singura diferenţă faţă de ANOVA unifactorial este dată de faptul că răspunsul la întrebare
are loc după excluderea influenţei variabilei covariante, în cazul nostru „anxietatea”.
▪ Variaţia conformismului în funcţie de categoria de vârstă, prin ANCOVA presupune
identificarea efectului categoriei de vârstă (IV) asupra conformismului (DV) păstrând constat
nivelul anxietăţii. (cel mai adesea se folosește valoare medie a anxietății)
▪ Acest fapt se traduce prin realizarea ANOVA, însă după excluderea influenţei variabilei
covariante (controlul acesteia), în cazul de față „anxietatea”.
▪Există diferențe semnificative la nivelul comportamentului alimentar nesănătos (ED) în
funcție de orientarea sexuală atunci când ținem sub control depresia?
Curs 5 - DISTRIBUTIA BINOMIALA
DISTRIBUTIA BINOMIALA
▪ BINOM = Expresie algebrică constituită din suma sau diferența a doi termeni.
▪ Distribuția binomială este formată din probabilitățile fenomenelor dihotomice.
▪ Evenimentele dihotomice reprezintă acele fenomene care pot avea două posibilități.
▪ Cum răspundem la următoarele întrebări:
▪ Sunt o persoană analitică sau sintetică?
▪ Prefer fotbalul sau alt sport?
▪ Doresc să urmez un program de Master la FPSE?
▪ Ascult predominant cu urechea stângă sau cu urechea dreaptă?
▪ Vreți să lucrăm cu pauză sau terminăm cursul cu 10 minute mai devreme? ☺
Probabilitatea unui eveniment este egală cu p.
Evenimentul complementar are probabilitatea egală cu q.
p= N/nE
N- reprezintă numărul de observații
nE - reprezintă numărul de rezultate posibile
q=1-p

▪ Evenimente de tip dihotomic cu probabilitate egală de apariție


- Răspunsurile de tip da/nu dintr-un chestionar
- Genul persoanei la naștere: feminin/masculin
- Dominanța emisferică: emisf. stângă/emisf. dreaptă
- Valorile la un test raportate la medie: x < μ / x ≥ μ
- Semnul diferenței dintre valori și medie: < 0 / ≥ 0

▪ Evenimente de tip dihotomic cu probabilitate inegală de apariție:


-Răspunsurile dintr-un test grilă sunt de forma:
a. (varianta1)
b. (varianta2)
c. (varianta3)
d. (varianta4)
▪ răspunsul a = corect
▪ răspunsuri non a = greșite
▪ Semnul diferenței dintre valori și mod în cazul distribuțiilor asimetrice: (-)/(+)

CONDIȚII
1. Numărul de observații n este fix.
2. Fiecare observație este independentă.
3. Fiecare observație reprezintă una dintre cele două valori de tip dihotomi (succes/eșec)
4. Probabililitatea de succes = p este aceeași pentru fiecare observație

TESTUL Z AL PROPORTIILOR PENTRU UN SINGUR EȘANTION


▪Exemplu: Într-un eșantion de deținuți (N=100) numărul celor care citesc în mod sistematic
presa, după OUG-13, este de 35. În populația deținuților din penitenciare proporția celor
care citesc presa era P=0,2 în 2016.
▪ Să se testeze ipoteza unei proporții mai mari a celor care urmăresc presa în penitenciar la
începutul lui 2017, comparativ cu 2016. (α=0,05)

▪H1: în penitenciar se citește mai mult presa în 2017


▪H0: în penitenciar se citește la fel de mult presa ca în anii
precedenți.
▪p= 35/100 → p = 0,35 (eșantion) ▪P= 0,20 (populație)

Curs 6 - ANALIZA DE ITEMI


INTRODUCERE
▪ Analiza de itemi este un capitol de bază în domeniul construcției instrumentelor
psihologice.
▪ Analiza de itmei este o colecție de metode utilizate pentru evaluarea itemilor unui
test/chestionar.
▪ Itemul este formulat sub forma unei afirmații sau a unei întrebări.
▪ Itemii sunt analizați calitativ (conținut și formă) și cantitativ (proprietăți psihometrice)

TEORIA CLASICĂ A TESTULUI (TCT)


X = T +E
▪ X = scorul observat
▪ T = scorul real
▪ E = eroarea de măsurare
▪ TCT – fiecare item reprezintă o estimare echivalentă cu alt item a constructului măsurat.
▪ Scorul obținut reprezintă o estimare a constructului, un scor ridicat fiind asociat cu
manifestarea mai pregnantă a trăsăturii respective.
▪ rezultatul obținut la test reflectă nivelul real al caracteristicii investigate.
▪ Suma erorilor este 0.
▪ Nu există corelație între T și E.
▪ Erorile apărute la testări repetate nu corelează între ele.

TEORIA RĂSPUNSULUI LA ITEM (IRT)


▪ Modelele IRT sunt cunoscute sub denumirea de modele ale trăsăturilor latente.
▪ IRT folosește eșantioane mari și diverse.
▪ Fiecare item reprezintă o estimare diferită a constructului măsurat.
▪ Scorul observat este rezultat obținut ca urmare a ponderilor diferite pe care le are fiecare
item.

METODE DE CONSTRUCȚIE A TESTELOR


Intuitivă – are la bază operaționalizarea constructelor.
▪ Autorul testului decide care sunt itemii ce trebuie să facă parte din test.
Empirică - selecţia itemilor este ghidată doar de relaţia determinată empiric între itemul
testului şi o măsură-criteriu specifică
▪ Asamblarea unui eșantion de itemi din diferite chestionare.

INDICELE DE DIFICULTATE
▪ Indicele de dificultate al itemului reprezintă probabilitatea de răspunde „corect” la item.
▪ Atunci când măsurăm trăsături de personalitate, răspunsurile corecte sunt cele care indică
prezența constructului măsurat.
▪ Atunci când folosim scoare Lickert (de exemplu, de la 1 la 5) răspunsurile corecte sunt 4 și
5.
▪ În cazul în care există itemi formulați în sensul opus constructului, răspunsurile vor fi
inversate înainte de începe analiza de itemi (1 devine 5, 2 devine 4 etc). Această
transformare poate fi făcută în R cu ajutorul funcției recode!!!

▪ Un cercetător construiește un chestionar care măsoară extraversia. Participanții trebuie să


răspundă folosind o scală likert de la 1 (dezacord total) la 5 (acord total)
1. Îmi plac petrecerile mari și zgomotoase.
2. Prefer să stau acasă și să citesc o carte în loc să merg la o petrecere.
3. Obișnuies să deschid conversația atunci când sunt cu un un necunoscut.
4. Prefer să rămân în umbră.
5. Nu mă derajnează să fiu în centrul atenției.
Itemii marcați cu albastru măsoară introversia, motiv pentru care ei trebuie scorați invers →
1 devine 5; 2 devine 4; 4 devine 2; 5 devine 1.

INDICELE DE DISCRIMINARE
▪ Indică măsura în care un item diferențiază corect între participanți.
▪ Arată în ce măsură itemul diferențiază între cei care au răspuns corect din grupul superior
comparativ cu cei care au răspuns corect în grupul inferior.
▪ Poate lua valori între -1 și +1.
▪ Ebel și Firisbie (1986) propun următoarea clasificare a itemilor în funcție de indicele de
discriminare:
▪ Mai mare sau egal cu 0,40 – itemul este bun.
▪ Între 0,30 și 0,39 – acceptabil.
▪ Între 0,20 și 0,29 – slab.
▪ Sub 0,20 – foarte slab.

INDICELE CRONBACH ALPHA


▪ Testează măsura în care itemii măsoară aceeași realitate psihologică.
▪ Este o procedură care testează fidelitatea instrumentelor psihologice.
▪ Poate lua valori cuprinse între 0 și 1.
▪ Poate lua și valori negative atunci când datele sunt viciate.

STRATEGII DE CRESTERE A COEFICIENTULUI CRONBACH ALPHA


▪ Creșterea numărului de itemi – Profeția Spearman Brown susține că indicele de fidelitate
crește odată cu numărul de itemi.
▪ Volum mai mare al eșantionului
▪ Scorarea Likert asigură o consistență internă mai bună decât scorarea dihotomică a
itemilor. ▪ Scorarea Likert în 7 trepte este mai eficientă sub aspectul consistenței interne
comparativ cu
Likert în 5 trepte.
▪ Corelații mai mare de 0.30 între itemi și scală.

S-ar putea să vă placă și