Statistica Sem II PDF

Curs 1- Testele statistice neparametrice pentru date ordinale
TESTELE NEPARAMETRICE PENTRU DATE ORDINALE

1. Testul Mann-Whitney
2. Testul Wilcoxon
3. Testul Kruskal-Wallis
4. Testul Friedman pentru măsurători repetate
5. Testele de corelație pentru date ordinale (Spearman și Kendall).
CÂND LE UTILIZAM?
▪ VD este măsurată pe scală nominală sau ordinală.
▪ VD este de tip categorial indiferent de scala de măsurare.
▪ Deși VD este măsurată pe scală I/R nu îndeplinește condițiile impuse de testele
parametrice: normalitate, valori extreme.
▪ Volumul eșantionului este mic (N < 30).
IPOTEZA DE NUL
▪ În cazul testelor parametrice H0 susține că mediile eșantioanelor sunt egale
▪ În cazul testelor neparametrice H0 susține că distribuțiile eșantioanelor sunt asemănătoare
→ respingerea ipotezei de nul nu mai oferă un rezultat intuitiv, este mai greu de interpretat.
▪ Testele neparametrice mai sunt cunoscute sub denumirea de teste libere de distribuție.
TRANSFORMAREA VALORILOR ÎN RANGURI

▪ În situația în care VD are valori măsurate pe scală I/R, acestea vor fi transformate în
ranguri
(lb. engleză = rank)
▪ Rangurile sunt atribuite în funcție de poziția respondentului după ordonarea crescătoare
sau
descrescătoare a valorilor.
▪ Putem atribui rangul cel mai mic scorului cel mai mare (primul loc este ocupat de
respondentul cu cea mai bună performanță), dar la fel de bine putem atribui rangul cel mai
mare respondentului cu scorul cel mai mare.
▪ Atunci când avem valori egale rangurile se pot distribui după 3 reguli:
1. Atribuirea rangului mediu – toate valorile identice primesc un rang egal cu media
aritmetică
a rangurilor cuvenite scorurilor identice.
2. Atribuirea rangului cel mai mic sau a celui mai mare – toate valorile identice primesc
rangul cel mai mic (cel ce corespunde primei valori) sau rangul cel mai mare (cel care
corespunde ultimei valori identice).
3. Atribuirea secvențială – presupune ca valorile identice să primească primul rang
disponibil, iar valoarea distinctă ce urmează primește rangul imediat următor.
TESTUL MANN-WHINEY
▪ este utilizat pentru a determina în ce măsură sunt diferite două seturi de date extrase din
eșantioane independente.
▪ este corespondentul neparametric al testului t pentru două eșantioane independente.
▪ un psiholog dorește să studieze în ce măsură muzica clasică are un efect asupra
capacității de memorare. El selectează un eșantion de 27 de studenți cărora le dă spre
memorare o listă de cuvinte. Participanții sunt împărțiți în două grupuri: 15 studenți au
memorat lista ascultând muzică clasică, iar 12 au memorat lista într-un mediu fără fundal
sonor. Există diferențe semnificative între cele două eșantioane?
▪ Valoarea calculată a testului Mann-Whitney este dată de valoarea calculată U cea mai
mică.
▪ Deoarece U1 = U2 este de la sine înțeles că valoarea calculată a testului este 90.
▪ Decizia statistică se ia prin compararea valorii U calculate (90) cu valoarea critică U din
Anexa 6 → Ucritic = 49.
▪ Dacă Ucalculat > Ucritic se acceptă ipoteza de nul.

▪ Dacă Ucalculat ≤ Ucritic se respinge ipoteza de nul.
▪ Ucalculat (90) > Ucritic (49) → acceptăm H0 și respingem H1
▪ Model <- wilcox.test(VD ~ VI, data = baza de date, paired = FALSE, exact=FALSE,
alternative = „greater/less/two.sided”).
▪ Model este un obiect care va primi rezultatele funcției wilcox.test
▪ VD – va primi denumirea variabilei dependente
▪ VI – va primi rezultatele variabilei independente
▪ paired = FALSE indică faptul că avem eșantioane independente
▪ exact=FALSE se folosește atunci când avem mai puțin de 50 de participanți
▪ alternative – indică tipul ipotezei
▪ Solicită pachetul devtools.
TESTUL WILCOXON
▪ este echivalentul neparametric al testului t pentru eșantioane dependente.
▪ Rezultatul testului Wilcoxon este o valoare T.
▪ Psihologul unei fabrici este interesat să studieze efectul concediului de odihnă asupra
productivității în muncă (α = 0,05, bilateral). Acesta măsoară productivitatea timp de o
săptămână înainte de plecarea în concediu a angajaților și o săptămână după revenirea la
locul de muncă. În tabelul 12.6 sunt sintetizate datele strânse de psiholog.
Valoarea calculatà a testului este valoarea T cea mai micã, în exemplul nostru 6.
• Valoarea criticà tabelar o vom citi în Anexa 8 în functie de volumul esantionului (N= 8) si a
= 0,05 bilateral -› Tcritic este egal cu 4.
• Atunci când valoarea calculatà este mai micã sau egalã cu valoarea criticã, se respinge
ipoteza de nul, iar ipoteza cercetàrii se confirmã.
• Când valoare calculatà este mare decât valoarea criticã, se accept ipoteza de nul, iar
ipoteza cercetarii nu se confirmã.
TESTUL KRUSKAL-WALLIS
▪ Acest test este echivalentul neparametric al testului de analiză de varianță uni-factorială
(ANOVA One-Way).
▪ Presupunem că un psiholog este interesat să studieze dacă exercițiile fizice au un rol
asupra depresiei (α = 0,01). Acesta îi împarte pe cei 15 pacienți cu depresie în trei grupuri:
în unul în care pacienții nu vor face exerciții fizice, în al doilea eșantion participanții care vor
alerga ușor timp de 20 de minute și un grup în care participanții vor alerga ușor timp de 45
de minute.
▪ Scorul H poate avea doar valori mai mari sau egale cu 0.

▪ Pentru situațiile în care cel puțin unul din eșantioane are minim 6 participanți, valoarea
critică se citește din tabelul de la Anexa 8 în funcție de numărul de grade de libertate (df =
numărul de grupuri - 1) și pragul α.
▪ Atunci când toate eșantioanele au sub 6 participanți valoarea critică se citește dintr-un
tabel special (Anexa 9) în funcție de volumul fiecărui grup și nivelul pragului α.
▪ Pentru exemplul nostru, valoarea critică este egală cu 8,00.
▪ Atunci când valoarea calculată este mai mică decât valoarea critică acceptăm ipoteza de
nul și respingem ipoteza cercetării.
▪ Atunci când valoarea calculată este mai mare sau egală cu valoarea critică vom respinge
ipoteza de nul și ipoteza cercetării se confirmă.
▪ În exemplul nostru H = 0,875 este mai mic decât Hcritic = 8,00 și vom accepta ipoteza de
nul. În concluzie nivelul depresiei pacienților nu diferă semnificativ în funcție de timpul
petrecut efectuând exerciții fizice.
TESTUL FRIEDMAN
▪ Testul Friedman este utilizat în situația în care dorim să comparăm rezultatele obținute în
cel puțin trei condiții pe același eșantion.
▪ Echivalentul parametric al acestui test este ANOVA pentru măsurători repetate
(ANOVA-MR).
▪ un profesor este interesat să studieze anxietatea studenților înainte de a intra în sesiune.
Acesta selectează un eșantion de 10 studenți cărora le măsoară anxietatea în la începutul
fiecărei sesiuni pe parcursul celor trei ani de studii.
▪ valoarea calculată a testului Friedman este mai mare sau egală cu 0.

▪ Valoarea critică se citește din Anexa 8 în funcție de numărul de grade de libertate (numărul
de măsurători - 1) și pragul α.
▪ Pentru exemplul nostru, valoarea critică este 11.07.
▪ valoarea calculată a testului Friedman este mai mare sau egală cu 0.
▪ Valoarea critică se citește din Anexa 8 în funcție de numărul de grade de libertate (numărul
de măsurători - 1) și pragul α.
▪ Pentru exemplul nostru, valoarea critică este 11.07
▪ Atunci când valoarea calculată este mai mică decât valoarea critică acceptăm ipoteza de
nul și
respingem ipoteza cercetării.
▪ Atunci când valoarea calculată este mai mare sau egală cu valoarea critică vom respinge
ipoteza de nul și ipoteza cercetării se confirmă.
▪ În cazul nostru, valoarea calculată (9,2) este mai mică decât cea critică (11,07) și luăm
decizia de a accepta ipoteza de nul și de a respinge ipoteza cercetării.
Curs 2 - ANOVA pentru măsurători repetate / A NOVA-MR
INTRODUCERE
▪ ANOVA One-Way și ANCOVA au fost utilizate pentru a compara grupuri formate din
participanți diferiți.
▪ Testul t pentru eșantioane dependente compara mediile obținute pe același eșantion în
două condiții diferite (test - retest).
▪ ANOVA-MR se utilizează atunci când comparăm mediile aceluiași eșantion în trei momente
diferite.
▪ Exemple: comparații privind depresia post-natală a mamelor cu 3 copii, comparații privind
performanțele studenților la parțialele de la Statistică (Parțial 1, Parțial 2, Parțial 3 și Parțial
4).
▪ Design longitudinal – oferă posibilitatea de a urmări evoluția comportamentului studiat
pentru o perioadă de timp.
Exemplul 1
Dacă studenții la psihologie de la 3 facultăți diferite au de răspuns la un chestionar privind
utilitatea unor discipline, aceștia vor face o alegere bazată, cel mai frecvent, pe o comparație
orientată tematic. – ANOVA unifactorială, eșantioane independente.
Dacă studenții dintr-o facultate răspund la un chestionar privind utilitatea statisticii,
chestionar aplicat succesiv, atât în anul 1, în anul 3 cât și la finalul unui program de master,
aceștia se vor baza pe o comparație orientată ceva mai pragmatic, ca urmare a unor
chestionări repetate. – ANOVA cu măsurători repetate.
Exemplul 2
Dacă alegem să măsurăm personalitate pentru 3 grupuri distincte (medici, psihologi,
ingineri) atunci putem compara profilul personalității celor 3 profesii. – ANOVA unifactorială,
eșantioane independente.
Dacă alegem să măsurăm personalitatea înainte de intrarea în profesie, în timpul și la
pensionarea unui anumit grup, atunci alegem să măsurăm în mod repetat personalitatea,
dar la momente total diferite. – ANOVA cu măsurători repetate.
▪ Modelul longitudinal oferă răspunsul la mai multe întrebări:

1. Putem evidenția efectul unei variabile independente asupra variabilei dependente, de
exemplu, efectul terapeutic prin mai multe evaluări?
2. Care este evoluția acestor efecte încă o perioadă de timp de la încheierea terapiei?
3. Există riscul, în cazul măsurătorilor repetate, al transportului de efecte de la o
măsurătoare la alta (carry-over effects)? Și în acest caz ce soluții există pentru a obiectiva
mărimea acestora?
4. Care sunt procedurile statistice adecvate pentru astfel de analize?
AVANTAJE
▪ Neutralizarea variabilității determinate de particularitățile participanților.
▪ Putere mai mare
▪ Necesită mai puțini participanți.
DEZAVANTAJE
▪ Pierderea (mortalitatea) participanților.
▪ Încălcarea condiției de independetă a valorilor – rezultatele dintr-o anumită etapă pot fi
influențate de măsurătorile anterioare (efectul de memorie, obișnuința cu proba, intuirea
obiectivului cercetării etc).
▪ Efectul exercițiului.
▪ Efectul de oboseală.
▪ Efectul de tranziție a tratamentului – stres vs relaxare (stresul indus în prima etapă poate
afecta performanța în condiția de relaxare).
▪ Efectul de ordine – se referă la posibilitatea ca efectul tratamentului să fie influențat de
ordinea în care participanții sunt raportați la condițiile de tratament.
LOGICA ANOVA-MR
▪Ipoteza statistica ramâne aceeasi ca si în cazul ANOVA esantioane independente.
CONDITII
▪ VD – se măsoară pe scală I/R
▪ VI are trei sau mai multe niveluri care descriu momentele sau condițiile măsurării.
▪ VD – are distribuție normală pentru fiecare moment al măsurării
▪ Eșantionare aleatorie – deoarece este greu de efectuat, în cazul ANOVA-MR se utilizează
eșantioane de conveniență.
▪ Să nu existe cazuri extreme
▪ Condiția de sfericitate
Ce este condiția de sfericitate?

▪ este asemănătoare cu omogenitatea varianțelor din cazul testului t pentru eșantioane
independente sau ANOVA.
▪ Sfericitatea, care se notează cu ε (epsilon), se referă la:
a) omogenitatea varianței pentru fiecare nivel al măsurării
b) egalitatea varianțelor diferențelor dintre măsurători luate două câte două.
dacă formăm perechi de câte două măsurători și calculăm diferențele dintre scoruri, atunci
este necesar ca aceste diferențe să aibă varianțe aproximativ egale.
CONDIȚIA DE SFERICITATE
▪ R afișează rezultatele testului Mauchly.
▪ daca testul Mauchly este semnificativ statistic (p ≤ 0,05) vom concluziona că există
diferențe semnificative între varianțele diferențelor și condiția de sfericitate nu este
îndeplinită.
▪ Dacă testul Mauchly este nesemnificativ statistic (p > .0.05) diferențele dintre varianțele
diferențelor nu sunt semnificative statistic (sunt aproximativ egale) și este îndeplinită condiția
de sfericitate.
ANOVA MR – R
▪Profesorul de statistică este interesat să studieze efectul pe care îl are complexitatea
materiei predate asupra notelor obținute de studenți la evaluările parțiale.
▪H1: Notele obținute de studenți la cele patru parțiale sunt diferite ca urmare a complexității
informațiilor învățate.
▪Pachetele necesare
a)ez – pentru a aplica funcția
b)ezANOVA psych – pentru statistica descriptivă
Observație!
Cu toate că testul W al lui John William Mauchly este unul dintre cele mai utilizate pentru
evaluarea sfericității, testul nu reușește să detecteze întotdeauna abaterea față de sfericitate
în cazul eșantioanelor mici și o supraestimează în cazul eșantioanelor mari. În consecință
dimensiunea eșantionului influențează interpretarea rezultatelor.
În exemplul prezentat mai sus abaterea de la sfericitate a fost detectată (p < .05).
Curs 3 - ANALIZA DE REGRESIE LINIARĂ
CORELAȚIE ȘI PREDICȚIE
▪ Cea mai populară procedură statistică în științele psiho-sociale
▪ Francis Galton – relația dintre înălțimea medie a părinților și înălțimea copiilor ▪ Analiza de
regresie și coeficientul de corelație
Corelația liniară
Regresie liniară simplă
Regresia multiplă
▪ VI = predictor (lb. engleză explanatory variable, antecedent variable) ▪ VD = criteriu (lb.

engleză consequent variable)
▪ Regresia simplă
- un singur predictor
- are la bază corelația dintre X și Y
▪ Regresia multiplă
- există cel puțin doi predictori
- are la bază corelația multiplă dintre predictori și criteriu
Predicția perfectă
▪ r = ±1
▪ Orice valoare a predictorului (X) corespunde unei valori identice a criteriului (Y)
▪ Între X și Y există o relație direct proporțională (corelație perfect pozitivă) sau invers
proporțională (corelație perfect negativă).
Predicția în cazul corelației imperfecte
▪ r ε (-1 → 1)
▪ X = atitudinea față de statistică (predictorul)
▪ Y = performanța la statistică (Semestrul I) (criteriul)
▪ Pentru exemplul prezentat r = .-578

▪ În contextul regresiei liniare simple, coeficientul de corelație devine coeficient de regresie și
se
notează cu R.
▪ Coeficientul de determinare pentru corelație (r2) devine coeficient de determinare pentru
regresie (R2)
▪ R2 se interpretează la fel ca r2.
▪ Pentru exemplul anterior R2=.3340
▪ Astfel, 33.40% din variabilitatea valorilor performanței la statistică pe primul semestru are
legătură cu variabilitatea valorilor anxietății față de statistică.
▪ zy’ = r * zx
▪ zy’ = valorile prezise ale criteriului în scoruri z
▪ zx = valorile predictorului în scoruri z
▪ Pe măsură ce r tinde spre 0, zy’ va lua valori din ce în ce mai mici (tinzând spre 0).
REGRESIA CĂTRE MEDIE

▪ Sir Francis Galton a introdus termenul de regresie studiind relația dintre înălțimea copiilor și
cea a părinților.
▪ Galton a găsit un r = .67 între înălțimea părinților (X) și cea a copiilor (Y).
▪ Pornind de la acest rezultat se poate prezice înălțimea copilului dacă știm înălțimea medie
a
părinților lui.
▪ Dacă înălțimea medie a părinților unui copil este cu 1.5 abateri standard peste media
populației de părinți, atunci copilul va avea o înălțime egală cu:
zy’ = 0.67 * 1.5 = 1.005
▪ Cu alte cuvinte, copilul va avea o înălțime cu 1.005 abateri standard mai mare decât media
populației de copii.
▪ Galton a denumit această tendință regresia către mediocritate
▪ denumirea consacrată este de regresie către medie.
▪ Datorită relației de tip liniar vorbim despre regresie liniară către medie.
DREAPTA DE REGRESIE
▪ Relația dintre X și Y poate fi reprezentată grafic prin intermediul graficului Scatterplot.
▪ Măsura în care norul de puncte descrie relația dintre predictor și criteriu va fi ilustrată
printr-o dreaptă care trece prin acest nor = dreapta de regresie.
▪ Pentru a trasa dreapta avem nevoie de punctul de origine și panta (înclinarea).
EROAREA DE PREDICȚIE
▪ Prin bifarea unei opțiuni SPSS-ul ne salvează în baza de date valorile prezise ale VD
(performanța la statistică în sem I).
▪ Diferența dintre valorile prezise și valorile reale ale performanței la statistică reprezintă
eroarea de predicție (varianță neexplicată sau diferență reziduală).
CONDIȚII
▪ VD – scală I/R (există și situații în care se măsoară pe scală ordinală)
▪ VD – distribuție normlă
▪ VI – scală I/R sau nominală dihotomică (ex: nu consumă = 0;
consumă = 1).
▪ VI distribuție normală atunci când este măsurată pe scală I/R.
▪ Existența unei relații liniare între VI și VD
▪ Variabilele predictor trebuie să fie ortogonale (să nu coreleze între ele).
▪ Existența unei corelații între predictori se numește multicoliniaritate (pe scurt coliniaritate).
▪ Predictorii sunt ortogonali atunci când prezintă corelații sub .30; Tolerance > .70; VIF <
10).
VOLUMUL EȘANTIONULUI
▪ Marks (1966) – 200 de participanți indiferent de numărul predictorilor
▪ Schmidt (1971) - pentru fiecare variabilă independentă sunt necesari 25 de participanți. ▪
Green (1991) – N = 50 + m*8
THE NULL HYPOTHESIS
▪ Ipoteza de nul susține că panta este egală cu 0. ▪ H0: b = 0
▪ Ipteza cercetării susține că:
a) Există un efect pozitiv – panta este pozitivă (b > 0)
b) Există un efect negativ – panta este negativă (b < 0)
c) Predictorul are un efect asupra criteriului – panta este diferită de
(b ≠ 0).
Curs 4 - ANALIZA DE COVARIANȚĂ (ANCOVA)

CE ESTE ANCOVA?
▪ ANOVA One-Way compară mediile a cel puțin trei eșantioane independente (formate din
participanți diferiți).
▪ ANOVA-One Way nu ține cont de celelalte variabile care ar putea avea un efect asupra VD.
▪ ANCOVA este o extensie a ANOVA One-Way → testează efectele VI după ce este eliminat
efectul unei/mai multor variabile care ar putea avea efect asupra VD.
▪ ANCOVA rafinează rezultatele obținute prin ANOVA One-Way.
▪ Variabilele care au un efect asupra VD se numesc variabile covariante (lb. engleză –
covariate
variables).
▪ Covarianta este o variabilă care are o influență cunoscută asupra VD și nu există motive
care să
justifice utilizarea ei.
▪ Într-un studiu se pot utiliza una sau mai multe variabile covariante.
▪ ANCOVA compară mediile provenite de la cel puțin două eșantioane independente
eliminând efectul variabilelor care pot avea un efect asupra VD.
EXEMPLU
▪ Se cunoaște faptul că abilitățile numerice au un efect asupra anxietății față de statistică.
Dacă avem studenți proveniți de la trei facultăți (Psihologie, Sociologie și Științele Educației)
este recomandat să eliminăm efectul abilităților numerice (VCo) înainte de a testa diferențele
la nivelul anxietății față de statistică în funcție de profilul facultatea în care învață studenții.
ANCOVA
▪ A controla o variabilă = a o menține constantă
▪ Ce diferență ar exista la nivelul anxietății față de statistică în funcție de tipul facultății, dacă
toți participanții ar avea aceleași abilități numerice.
AVANTAJELE ANCOVA
▪ Reducerea erorii determinate de varianța intra-grup – în cazul ANOVA One-Way, varianța
intra-grup este varianța neexplicată a VD de către VI. Dacă o parte din această varianță
neexplicată ar putea fi atribuită unei variabile covariante atunci am putea obține un efect mai
sensibil al VI asupra VD.
▪ Controlul VCo – are loc o corecție a mediilor VD în raport cu valorile VCo.
▪ Volumul eșantionului – controlând VCo, nu trebuie să alegem doar participanți care au
același nivel al variabilei care are o influență asupra VD. În concluzie, asigurăm o putere mai
mare.
NUMĂRUL COVARIANȚELOR
▪ Un model poate include una sau mai multe covariante.
▪ Se vor selecta covariantele care prezintă corelațiile cele mai mari cu VD.
▪ un număr prea mare de covariante determină scăderea puterii testului.
CONDITII
▪ Existența unei relații liniare între VD și VCo – în lipsa unei astfel de relații nu are sens să
excludem efectul unei variabile.
▪ Absența unei relații liniare între covariante – în cazul în care covariantele corelează între
ele, coeficienții de corelație trebuie să fie mai mici decât 0.30.
▪ Covariantele trebuie să fie măsurate fără erori – se recomandă ca instrumentele utilizate
pentru a măsura VCo să aibă un indice de fidelitate > 0.80.
▪ Independența covariantelor în raport cu VI – nu trebuie să existe o corelație între VI și VCo.
De exemplu, dacă studiem diferențele la nivelul conformismului în funcție de vârstă, folosind
anxietatea drept covariantă, se cunoaște faptul că anxietatea este în relație vârsta.
▪ Omogenitarea varianțelor VD în raport cu VI
▪ Omogenitatea pantei de regresie – panta de regresie pentru relația dintre covariante și VD
trebuie să fie echivalentă pentru fiecare grup.
▪ În concluzie, efectul variabilelor covariante asupra VD trebuie să fie echivalent în raport cu
fiecare nivel al VI. Dacă această condiție nu este îndeplinită, ajustarea valorilor VD în funcție
de VCo este imprecisă.
Dacă IV determină 3 grupuri, la nivelul fiecărui grup relația covariantă – variabilă dependentă
este similară în cazul omogenității de regresie.
ANCOVA UNIFACTORIALA
▪ Dorim să studiem variaţia conformismului în funcţie de categoria de vârstă, cu eliminarea
efectului anxietăţii
▪ Similar cazului ANOVA unifactorial ne interesează în ce măsură conformismul variază în
funcţie de categoriile de vârstă?
▪ Singura diferenţă faţă de ANOVA unifactorial este dată de faptul că răspunsul la întrebare
are loc după excluderea influenţei variabilei covariante, în cazul nostru „anxietatea”.
▪ Variaţia conformismului în funcţie de categoria de vârstă, prin ANCOVA presupune
identificarea efectului categoriei de vârstă (IV) asupra conformismului (DV) păstrând constat
nivelul anxietăţii. (cel mai adesea se folosește valoare medie a anxietății)
▪ Acest fapt se traduce prin realizarea ANOVA, însă după excluderea influenţei variabilei
covariante (controlul acesteia), în cazul de față „anxietatea”.
▪Există diferențe semnificative la nivelul comportamentului alimentar nesănătos (ED) în
funcție de orientarea sexuală atunci când ținem sub control depresia?
Curs 5 - DISTRIBUTIA BINOMIALA
DISTRIBUTIA BINOMIALA
▪ BINOM = Expresie algebrică constituită din suma sau diferența a doi termeni.
▪ Distribuția binomială este formată din probabilitățile fenomenelor dihotomice.
▪ Evenimentele dihotomice reprezintă acele fenomene care pot avea două posibilități.
▪ Cum răspundem la următoarele întrebări:
▪ Sunt o persoană analitică sau sintetică?
▪ Prefer fotbalul sau alt sport?
▪ Doresc să urmez un program de Master la FPSE?
▪ Ascult predominant cu urechea stângă sau cu urechea dreaptă?
▪ Vreți să lucrăm cu pauză sau terminăm cursul cu 10 minute mai devreme? ☺
Probabilitatea unui eveniment este egală cu p.
Evenimentul complementar are probabilitatea egală cu q.
p= N/nE
N- reprezintă numărul de observații
nE - reprezintă numărul de rezultate posibile
q=1-p
▪ Evenimente de tip dihotomic cu probabilitate egală de apariție

- Răspunsurile de tip da/nu dintr-un chestionar
- Genul persoanei la naștere: feminin/masculin
- Dominanța emisferică: emisf. stângă/emisf. dreaptă
- Valorile la un test raportate la medie: x < μ / x ≥ μ
- Semnul diferenței dintre valori și medie: < 0 / ≥ 0
▪ Evenimente de tip dihotomic cu probabilitate inegală de apariție:

-Răspunsurile dintr-un test grilă sunt de forma:
a. (varianta1)
b. (varianta2)
c. (varianta3)
d. (varianta4)
▪ răspunsul a = corect
▪ răspunsuri non a = greșite
▪ Semnul diferenței dintre valori și mod în cazul distribuțiilor asimetrice: (-)/(+)
CONDIȚII
1. Numărul de observații n este fix.
2. Fiecare observație este independentă.
3. Fiecare observație reprezintă una dintre cele două valori de tip dihotomi (succes/eșec)
4. Probabililitatea de succes = p este aceeași pentru fiecare observație
TESTUL Z AL PROPORTIILOR PENTRU UN SINGUR EȘANTION

▪Exemplu: Într-un eșantion de deținuți (N=100) numărul celor care citesc în mod sistematic
presa, după OUG-13, este de 35. În populația deținuților din penitenciare proporția celor
care citesc presa era P=0,2 în 2016.
▪ Să se testeze ipoteza unei proporții mai mari a celor care urmăresc presa în penitenciar la
începutul lui 2017, comparativ cu 2016. (α=0,05)
▪H1: în penitenciar se citește mai mult presa în 2017

▪H0: în penitenciar se citește la fel de mult presa ca în anii
precedenți.
▪p= 35/100 → p = 0,35 (eșantion) ▪P= 0,20 (populație)
Curs 6 - ANALIZA DE ITEMI

INTRODUCERE
▪ Analiza de itemi este un capitol de bază în domeniul construcției instrumentelor
psihologice.
▪ Analiza de itmei este o colecție de metode utilizate pentru evaluarea itemilor unui
test/chestionar.
▪ Itemul este formulat sub forma unei afirmații sau a unei întrebări.
▪ Itemii sunt analizați calitativ (conținut și formă) și cantitativ (proprietăți psihometrice)
TEORIA CLASICĂ A TESTULUI (TCT)

X = T +E
▪ X = scorul observat
▪ T = scorul real
▪ E = eroarea de măsurare
▪ TCT – fiecare item reprezintă o estimare echivalentă cu alt item a constructului măsurat.
▪ Scorul obținut reprezintă o estimare a constructului, un scor ridicat fiind asociat cu
manifestarea mai pregnantă a trăsăturii respective.
▪ rezultatul obținut la test reflectă nivelul real al caracteristicii investigate.
▪ Suma erorilor este 0.
▪ Nu există corelație între T și E.
▪ Erorile apărute la testări repetate nu corelează între ele.
TEORIA RĂSPUNSULUI LA ITEM (IRT)

▪ Modelele IRT sunt cunoscute sub denumirea de modele ale trăsăturilor latente.
▪ IRT folosește eșantioane mari și diverse.
▪ Fiecare item reprezintă o estimare diferită a constructului măsurat.
▪ Scorul observat este rezultat obținut ca urmare a ponderilor diferite pe care le are fiecare
item.
METODE DE CONSTRUCȚIE A TESTELOR

Intuitivă – are la bază operaționalizarea constructelor.
▪ Autorul testului decide care sunt itemii ce trebuie să facă parte din test.
Empirică - selecţia itemilor este ghidată doar de relaţia determinată empiric între itemul
testului şi o măsură-criteriu specifică
▪ Asamblarea unui eșantion de itemi din diferite chestionare.
INDICELE DE DIFICULTATE
▪ Indicele de dificultate al itemului reprezintă probabilitatea de răspunde „corect” la item.
▪ Atunci când măsurăm trăsături de personalitate, răspunsurile corecte sunt cele care indică
prezența constructului măsurat.
▪ Atunci când folosim scoare Lickert (de exemplu, de la 1 la 5) răspunsurile corecte sunt 4 și
5.
▪ În cazul în care există itemi formulați în sensul opus constructului, răspunsurile vor fi
inversate înainte de începe analiza de itemi (1 devine 5, 2 devine 4 etc). Această
transformare poate fi făcută în R cu ajutorul funcției recode!!!
▪ Un cercetător construiește un chestionar care măsoară extraversia. Participanții trebuie să

răspundă folosind o scală likert de la 1 (dezacord total) la 5 (acord total)
1. Îmi plac petrecerile mari și zgomotoase.
2. Prefer să stau acasă și să citesc o carte în loc să merg la o petrecere.
3. Obișnuies să deschid conversația atunci când sunt cu un un necunoscut.
4. Prefer să rămân în umbră.
5. Nu mă derajnează să fiu în centrul atenției.
Itemii marcați cu albastru măsoară introversia, motiv pentru care ei trebuie scorați invers →
1 devine 5; 2 devine 4; 4 devine 2; 5 devine 1.
INDICELE DE DISCRIMINARE
▪ Indică măsura în care un item diferențiază corect între participanți.
▪ Arată în ce măsură itemul diferențiază între cei care au răspuns corect din grupul superior
comparativ cu cei care au răspuns corect în grupul inferior.
▪ Poate lua valori între -1 și +1.
▪ Ebel și Firisbie (1986) propun următoarea clasificare a itemilor în funcție de indicele de
discriminare:
▪ Mai mare sau egal cu 0,40 – itemul este bun.
▪ Între 0,30 și 0,39 – acceptabil.
▪ Între 0,20 și 0,29 – slab.
▪ Sub 0,20 – foarte slab.
INDICELE CRONBACH ALPHA

▪ Testează măsura în care itemii măsoară aceeași realitate psihologică.
▪ Este o procedură care testează fidelitatea instrumentelor psihologice.
▪ Poate lua valori cuprinse între 0 și 1.
▪ Poate lua și valori negative atunci când datele sunt viciate.
STRATEGII DE CRESTERE A COEFICIENTULUI CRONBACH ALPHA

▪ Creșterea numărului de itemi – Profeția Spearman Brown susține că indicele de fidelitate
crește odată cu numărul de itemi.
▪ Volum mai mare al eșantionului
▪ Scorarea Likert asigură o consistență internă mai bună decât scorarea dihotomică a
itemilor. ▪ Scorarea Likert în 7 trepte este mai eficientă sub aspectul consistenței interne
comparativ cu
Likert în 5 trepte.
▪ Corelații mai mare de 0.30 între itemi și scală.

Statistica Sem II PDF

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Statistica Sem II PDF

Încărcat de

Drepturi de autor:

Formate disponibile

Curs 1- Testele statistice neparametrice pentru date ordinale

TESTELE NEPARAMETRICE PENTRU DATE ORDINALE

TRANSFORMAREA VALORILOR ÎN RANGURI

▪ Dacă Ucalculat > Ucritic se acceptă ipoteza de nul.

▪ Scorul H poate avea doar valori mai mari sau egale cu 0.

▪ valoarea calculată a testului Friedman este mai mare sau egală cu 0.

▪ Modelul longitudinal oferă răspunsul la mai multe întrebări:

Ce este condiția de sfericitate?

Regresie liniară simplă

▪ VI = predictor (lb. engleză explanatory variable, antecedent variable) ▪ VD = criteriu (lb.

▪ Pentru exemplul prezentat r = .-578

REGRESIA CĂTRE MEDIE

Curs 4 - ANALIZA DE COVARIANȚĂ (ANCOVA)

▪ Evenimente de tip dihotomic cu probabilitate egală de apariție

▪ Evenimente de tip dihotomic cu probabilitate inegală de apariție:

TESTUL Z AL PROPORTIILOR PENTRU UN SINGUR EȘANTION

▪H1: în penitenciar se citește mai mult presa în 2017

Curs 6 - ANALIZA DE ITEMI

TEORIA CLASICĂ A TESTULUI (TCT)

TEORIA RĂSPUNSULUI LA ITEM (IRT)

METODE DE CONSTRUCȚIE A TESTELOR

▪ Un cercetător construiește un chestionar care măsoară extraversia. Participanții trebuie să

INDICELE CRONBACH ALPHA

STRATEGII DE CRESTERE A COEFICIENTULUI CRONBACH ALPHA

S-ar putea să vă placă și