Curs 1
De ce studiem statistica?
Psihologia s-a desprins din filozofie, devenind astfel o știință de sine stătătoare, datorită posibilității de a
testa/verifica teoriile emise. Orice practică sau intervenție psihologică validată științific se bazează pe un număr
ridicat de studii ce atestă eficiența și validitatea acesteia.
Noțiuni introductive
Statistica descriptivă – realizarea unei radiografii cât mai exacte a realității (a unui set de date)
Măsurarea conceptelor – 4 scale de măsurare:
Scala nominală – cunoscută sub denumirea de scală calitativă/categorială.
o Cuprinde răspunsuri care nu sunt ierarhizate – ex: apartenența religioasă: ortodox, catolic, etc.
o Dacă variabila conține doar două răspunsuri posibile, indiferent dacă acestea pot fi ierarhizate sau
nu, avem de-a face tot cu o scală nominală – ex: genul: masculin, feminin
Scală ordinală – cunoscută sub numele de scală de ordine/ierarhică
o Permite ordinarea categoriilor în funcție de un criteriu – ex: cât de des citiți? *foarte rar *rar *din
cand in cand *des *foarte des
Scala de intervale – scală numerică, permite determinarea cu precizie a distanțelor dintre valor – ex: un
scor de 15 puncte la o probă de empatie
o În absența unor etaloane clare, nu putem interpreta scorul obținut
Scala de proporții – scală numerică
o Valoarea zero nu este aleasă la întâmplare, avem un punct de reper – ex: viteza de reacție = 180
ms
Atenție! Aproape orice variabilă poate fi măsurată prin mai multe scale de măsurare.
Reprezentările grafice = metode intuitive de a observa distribuția datelor:
- Diagrama circulară – specifică scalelor de tip nominal, fiecare „felie” reprezintă o categorie
- Diagrama cu bare – specifică scalelor de tip ordinal, fiecare bară reprezintă o categorie
- Histograma – specifică scalelor de intervale și de proporții, fiecare bară reprezintă o clasă
- Poligonul frecvențelor – specific scalelor numerice, fiecare punct reprezintă valoarea centrală a unei clase
Curs 2
De ce avem nevoie pentru a descrie un set de date?
De cel putin 2 parametrii:
Tendința centrală a datelor – identificarea unei valori reprezentative pentru setul
respectiv de date
Gradul de împrăștiere al datelor/dispersia – urmărind omogenitatea sau
eterogenitatea unui grup
Indicatorii tendinței centrale:
a. Media
- Reprezintă mijlocul valoric al unei condiții de date
- Este un indicator al tendinței centrale sensibil la valorile extreme ale colecției de date
- Se notează cu m
b. Mediana
- Reprezintă valoarea care se află exact la mijlocul unei colecții de date
- Este un indicator al tendinței centrale rezistent la valorile extreme ale colecției de date
- Se notează cu md
c. Modul
- Reprezintă valoarea cu frecvență maximă din cadrul unei colecții de date
- Este un indicator aproximativ al tendinței centrale
- Se notează cu mo
Cum se calculează cei trei indicatori?
Scală nominală – Modul
Scală ordinală – Mediana
Scala numerică – Media, Mediana, Modul – in funcție de forma distribuției datelor
Forma distribuției datelor
Pentru scalele de intervale și de proporții, reprezentarea grafică cea mai potrivită este histograma. Primele forme
ale distribuției datelor sunt:
- distribuția simetrică (frecvența datelor sunt concentrate în jurul valorii centrale),
- distribuția asimetrică (frecvențele datelor sunt concentrate spre una dintre cele două extremități: distribuție
simetrică pozitivă – frecv sunt concentrate în jurul valorilor scăzute (stânga); distribvuție simetrică
negativă (frecv sunt concentrate în jurul valorilor ridicate (dreapta) );
- distribuția atipică (frecvențele nu sunt concentrate în nici o parte a graficului).
Indicatorii tendinței centrale în funcție de forma distribuției:
o Distribuție simetrică – Media
o Distribuție asimetrică – Mediana
o Distribuție atipică – Modul
Indicatorii dispersiei ne arată gradul de împrăștiere (dispersie) al datelor. Valori mai mari = dispersie mai
ridicată.
Abaterea standard (Standard deviaion – eng.)
Abaterea intercvartilică
Cand se calculează cei doi indicatori:
Scala nominală - ---
Scala ordinală – abaterea intercvartilică
Scala numerala –
Distribuție simetrică – abaterea standard
Distribuție asimetrică – abaterea intercvartilică
Distribuție atipică - ---
Curs 3
Percentilele
Punctul centil (percentil) ne furnizează o minimă informație despre locul în care este situat un participant
în raport cu locul testat. Ex: Percentilul 70 reprezintă un rezultat mai bun decât 70% dintre persoanele testate.
În cazul distribuțiilor asimetrice, se pot stabili anumite categorii calitative ale rezultatelor pe baza
cvartilelor (Q)(puncte de reper)
Corespondența cvartile-percentile:
- Q1 = Pc25
- Q2 = Pc50
- Q3 = Pc75
o Rezultate slabe – valori mai mici de Q1
o Rezultate medii – intre Q1 și Q2
o Rezultate bune – între Q2 și Q3
o Rezultate foarte bune – valori mai mari de Q3
În cazul unei distribuții simetrice, media împarte șirul de date în două păți egale – 50% din rezultate sunt
mai mici decât media, 50% sunt mai mari.
Pe baza mediei (m) și a abaterii standard (α), se stabilesc anumite puncte de reper m +/- α
Pe baza acestor puncte de reper putem să determinăm ce procent de participanți obțin rezultate mai mari
de un anumit scor brut, sau poziția unui participant în raport cu eșantionul studiat.
Standardizarea datelor
În forma lor brută, scorurile nu relevă întreaga lor semnificație. Pentru rezolvarea unor probleme de acest
fel, se recurge la transformarea rezultatelor din cote brute în cote standardizate.
Cotele standard Z
Formula de calcul pentru transformarea oricărei valori în cote standard z este z=(x-m)/α; unde:
- X = scorul pe care dorim să în transformăm
- M = media eșantionului
- α = abaterea standard a eșantionului repsectiv.
În general, cotele standard z au valori cuprinse între -3 și +3. Media datelor transformate în cote standard z va
avea întotdeauna valoarea 0 iar abaterea standard va avea valoarea 1. În cote standard z, valorile negative
reprezintă scoruri mai mici decât media, iar valorile pozitive, scoruri mai mari.
Curs 4
Statistica inferențială =
- Găsirea unor explicaţii pentru fenomenele observate
- Realizarea unor predicţii cu privire la comportamentele viitoare ale unor persoane
- Extinderea unor concluzii de la nivelul eşantionului testat la nivelul populaţiei din care acesta a fost extras
Orice studiu trebuie să pornească de la o întrebare de cercetare
Ipotezele de cercetare
Ipoteza ştiinţifică este o predicţie care are capacitatea de a fi operaţionalizată şi testată pentru a oferi un
răspuns problemei studiate.
Testarea ipotezelor cuprinde trei dimensiuni esenţiale:
- Analiza datelor empirice
- Realizarea unor inferenţe logice pe baza acestora
- Menţinerea unei atitudini sceptice legate de concluziile obţinute
În funcţie de tipul studiului, se deosebesc:
a. Ipoteza corelaţională – vizează identificarea unor legături (asocieri) între variabile
Ex. Există o legătură între conștinciozitate și performanța academică.
b. Ipoteza comparativă – vizează identificarea unor diferenţe între grupuri
Ex. Există diferenţe între bărbaţi şi femei privind nivelul empatiei.
În funcţie de modul de formulare, pot fi:
a. Ipoteza unidirecţională: se precizează direcţia predicţiei
Ex. 1. Există o corelaţe pozitivă între variabilele X şi Y
Ex. 2. Grupul A este mai slab decât grupul B
b. Ipoteza bidirecţională: nu se precizează direcţia predicţiei
Ex. 1. Există o asociere între variabilele X şi Y
Ex. 2. Există diferenţe între grupul A şi grupul B
Pe baza analizei datelor colectate trebuie să decidem dacă ipoteza de cercetare este sau nu susţinută (există sau
nu efect). Decizia de a accepta ipoteza de cercetare se ia pe baza pragului de semnificaţie (p)
Pragul de semnificație (p)
Arată probabilitatea de a obţine din întâmplare efectul observat
Poate lua valori între 0 şi 1
Valoarea pe baza căreia se susține sau nu ipoteza de cercetare este 0,05 (.05)
Dacă p < .05 – rezultat semnificativ statistic (există efect) = ipoteza de cercetare este susținută.
Dacă p > .05 – rezultat nesemnificativ statistic (nu există efect) = ipoteza de cercetare nu este
susținută.
Interpretarea pragului de .05: există o probabilitate de maximum 5% de a obţine din întâmplare efectul
observat
Pragul de semnificaţie este sensibil la volumul eşantionului
o În cazul unui eşantion redus (ex. 15 participanţi) sunt şanse mari ca rezultatul să fie nesemnificativ
statistic, deşi în realitate există un efect
o În cazul unui eşantion foarte mare (ex. 10.000 participanţi) sunt şanse mari de a obţine un rezultat
semnificativ statistic, deşi în realitate nu există efectul testat
Erorile de tip I şi II în testarea ipotezelor
Eroarea de tip I apare atunci când efectul nu există în realitate, dar ipoteza de cercetare este acceptată
(concluzionăm că efectul există).
De ce apare eroarea de tip I?
Număr mult prea mare de participanţi, teste cu proprietăţi psihometrice ridicate, desgin puternic, etc.
Eroarea de tip II apare atunci când efectul există în realitate, dar ipoteza de cercetare este respinsă
(concluzionăm că efectul nu există).
De ce apare eroarea de tip II?
Număr redus de participanţi, teste cu proprietăţi psihometrice scăzute, design slab, etc.
În realitate A fost acceptată (există efect) A fost respinsă (nu există efect)
Există efect (ipoteza de cercetare Decizie Ok Eroare de tip 2
trebuia acceptată)
Nu există efect (ipoteza de Eroare de tip 1 Decizie Ok
cercetare trebuia respinsă)
Pragul de semnificaţie răspunde la întrebarea “Există o diferenţă/asociere semnificativă?” Mărimea
efectului ne arată cât de puternică este această diferenţă sau asociere.
Două categorii de indicatori ai mărimii efectului:
Bazaţi pe diferenţa standardizată dintre medii (comparaţii)
Bazaţi pe procentul de dispersie explicată (corelaţii)
Ce indicatori utilizăm?
- Din prima categorie:
d al lui Cohen
- Din a doua categorie:
coeficientul de determinare r2
Marimea efectului d al lui Cohen Coeficientul de determinare r2
Efect scăzut In jurul a 0.20 In jurul a 0.01
Efect mediu In jurul a 0.50 In jurul a 0.06
Efect puternic In jurul a 0.80 In jurul a 0.14
Puterea statistică reprezintă capacitatea unui studiu de a detecta un efect care există în realitate
Poate lua valori între 0 şi 1
- Valoarea optimă: 0,80 (80% şanse de a detecta un efect)
- Valoare acceptabilă: 0,70 (70% şanse de a detecta un efect)
Cu cât puterea statistică este mai scăzută, cu atât creşte probabilitatea de a comite eroarea de tip II. Cu cât
puterea statistică este mai ridicată (peste .97-.98, tot mai aproape de 1), cu atât creşte probabilitatea de a comite
eroarea de tip I.
Curs 5
Prin analiza corelaţională urmărim în ce măsură schimbările dintr-o variabile sunt însoţite de schimbări
într-o altă variabilă
Coeficientul de corelaţie r este cel mai întâlnit indicator de măsurare a gradului de asociere dintre două
variabile. Poate lua valori cuprinse între -1 şi +1
- Corelaţie pozitivă = un nivel ridicat variabilei X se asociază cu un nivel ridicat al variabilei Y (ambele
cresc)
- Corelaţie negativă = un nivel ridicat variabilei X se asociază cu un nivel scăzut al variabilei Y (una crește,
cealaltă scade).
Cu cât valoarea coeficientului de corelaţie este mai aproape de oricare dintre cei doi poli (-1 sau +1), cu
atât relaţia dintre cele două variabile este mai puternică. Cu cât valoarea coeficientului de corelaţie este mai
aproape de 0, cu atât relaţia dintre cele două variabile este mai slabă
Ex.
r = .70 > r = .42;
r = -.55 > r = -.31
r = .48 < r = -.64
Reprezentarea grafică a asocierii dintre variabile
a. Scatterplot (norul de puncte) – un grafic cu două axe, fiecare dintre axe reprezentând una dintre cele două
variabile. Fiecare punct din grafic reprezintă scorul unui participant la cele două variabile în cauză. Pe
baza norului de puncte se pot identifica:
Forma relaţiei dintre variabile (liniară, non-liniară sau absentă)
Direcţia relaţiei dintre variabile (pozitivă sau negativă)
Intensitatea relaţiei dintre variabile (puternică, medie sau scăzută)
Importanța reprezentării grafice a reprezentării grafice prin norul de puncte:
Există situaţii în care interpretarea coeficientului de corelaţie poate fi făcută greşit în absenţa verificării
norului de puncte
Ex. Situaţii în care coeficientul de corelaţie este foarte apropiat de 0 (semnificând absenţa relaţiei), dar în realitate:
Există două sub-seturi de date distincte (ex. rezultatele bărbaţilor faţă de cele ale femeilor)
Există o relaţie curbilinie echilibrată ce determină schimbarea norului de puncte dinspre pozitiv spre
negativ sau invers
Există o asociere clară între cele două variabile care este însă mascată de unele date extreme care reduc
valoarea coeficientului de corelaţie
Atentie!! Coeficientul de corelaţie arată doar dacă există o asociere între cele două variabile
Curs 6
Corelația parțială (pr) se utilizează pentru a verifica asocierea dintre două variabile, menţinând constant efectul
altei (altor) variabile (covariabilă).
Se compară corelația simplă (r) dintre variabile cu corelația parțială (pr). În funcție de modul în care cele
două diferă – mai multe situații posibile.
a. Situația I = Corelația parțială și corelația simplă sunt aproximativ egale.
Ex. r = .68, pr = .67
Relația dintre X și Y nu este afectată de variabila Z. Sau variabila Z nu explică relația dintre X și Y.
b. Situația a II-a A = Corelația parțială este mai slabă decât corelația simplă, dar rămâne semnificativă.
Ex. r = .68, p = .002; pr = .45, p = .017.
Relația dintre X și Y este afectată de variabila Z.
c. Situația a II-aB = Corelația parțială este mai puternică decât corelația simplă.
Ex. r = .56, pr = .73.
Relația dintre X și Y este afectată de variabila Z.
Variabila Z – efect de mascare a relației dintre X și Y.
d. Situația a III-a = Corelația parțială este mai slabă decât corelația simplă, devenind nesemnificativă.
Ex. r = .54, p = .01; pr = .12, p = .28.
Relația dintre X și Y este una falsă.
Curs 7
Testele t compară diferențele dintre mediile a două grupuri (pentru mai mult de 2 grupuri – alte tehnici)
Ex 1. Există diferențe între profesori și polițiști privind stresul la locul de muncă.
Ex 2. Există diferențe între grupa 1 și grupa 2 privind notele de la Neuro. ☺
a. Testele t pt. eșantioane independente = Verifică diferenţa dintre mediile a două eşantioane independente.
Eşantioane independente – au fost alese la întâmplare, pe baza situaţiei lor naturale (nu există nici o legătură între
ele).
b. Testele t pt. Eșantioane perechi = Verifică diferenţa dintre mediile a două eşantioane perechi.
Eşantioane perechi – sunt în relaţie una cu cealaltă prin intervenţia experimentatorului sau prin corespondenţă
naturală.
- Situația perechilor naturale – Sunt formate după una sau mai multe caracteristici prealabile (care există în
mod natural).
- Situația perechilor artificiale – Sunt puse în corespondenţă prin intervenţia experimentatorului.
c. Situația măsurătorilor repetate = O grupă de participanți testată de două ori (pretest – posttest; în două
momente de timp diferite).
Ex. Un eșantion de elevi cu probleme comportamentale testaţi pre-test şi post-test (înainte şi după un program de
intervenţie), privind nivelul agresivităţii.
Cat de puternice sunt diferențele?
În mod normal – indicatorul d Cohen., care însă nu poate fi calculat direct din SPSS, deci se folosește coeficientul
de determinare r2.
r2 = t2 / t2 + df
Unde t = valoarea testului t iar df = gradele de libertate. Ambele valori sunt oferite in output-ul SPSS.
d. Testele t pt. un singur eșantion = Verifică diferenţa dintre media unui eşantion şi cea a populaţiei din
care a fost extras.
Ex. După aplicarea unui test de cunoștințe generale tuturor elevilor de clasa a XII-a din județul Timiș, se compară
media clasei XII B de la liceul A cu media tuturor claselor testate.
Curs 8
Tehnicile hi pătrat (χ2; eng. chi-square) = Sunt cel mai des utilizate în cazul datelor de tip nominal (în anumite
situaţii – posibil şi ordinal).
Testul hi pătrat al gradului de potrivire – verifică dacă există diferenţe semnificative între frecvențele de răspuns
a categoriilor unei variabile, adica diferențe între frecvențele așteptate (teoretice) și frecvențele observate (reale).
Curs 9
Principalele instrumente de evaluare şi măsurare în Psihologie sunt testele standardizate. Alegerea unui test
depinde de obiectivul urmărit prin testarea respectivă: selecţie de personal, evaluare periodică, cercetare,
screening, etc.
Care sunt cele mai importante caracteristici ale unui test?
- Să măsoare ceea ce spune că măsoară (validitate).
- Să aibă o eroare de măsurare cât mai mică (fidelitate).
a. Validitatea probelor psihologice
La nivel teoretic, putem distinge între validitatea internă şi validitatea externă a unei probe psihologice.
Validitatea internă se referă la gradul în care testul măsoară ceea ce spune că măsoară.
Validitatea externă se referă la gradul în care rezultatele obţinute la acel test pot fi generalizate.
În practică, distingem între trei forme de validitate:
- Validitatea de construct (eng. construct validity)
- Validitatea de conţinut (eng. content validity)
- Validitatea de criteriu (eng. criterion validity)
a. Validitatea de construct
Validitatea de construct se referă la gradul în care un test măsoară ceea ce spune teoria care stă la baza lui că ar
trebui să măsoare. Demonstrarea validităţii de construct presupune (printre altele) verificarea legăturilor dintre
proba respectivă şi alte teste.
Validitatea convergentă se referă la gradul în care un test corelează cu alte probe cu care ar trebui (teoretic) să se
afle în legătură.
Ex. Dacă aplic 2 probe care măsoară Extraversiunea, ar trebui să...?
Ex. Extraversiunea ar trebui să coreleze moderat (pozitiv) cu Căutarea de senzații.
Validitatea divergentă verifică dacă anumite probe care (teoretic) nu au nici o legătură sunt în realitate
independente.
Ex. Nu ar trebui să existe o legătură semnificativă între Extraversiunea și
Percepția distanței.
b. Validitatea de conținut
Validitatea de conţinut se referă la examinarea conţinutului probei pentru a evalua dacă aceasta acoperăeşantionul
de comportamente reprezentative pe care ar trebui să le măsoare.
Ex. Un test de Extraversiune acoperă toți indicatorii discutați în literatura de specialitate?
c. Validitatea de criteriu
Validitatea de criteriu se referă la legăturile dintre proba psihologică şi una (sau mai multe) variabile criteriu
considerate ca fiind reprezentative pentru constructul respectiv.
Validitatea concurentă se referă la gradul în care testul corelează cu alte variabile ce au relevanţă pentru
constructul respectiv, fiind măsurate în acelaşi timp.
Validitatea predictivă se referă la gradul în care rezultatele la test pot prezice alte variabile (cu relevanţă pentru
constructul respectiv) care sunt măsurate la un moment din viitor.
b. Fidelitatea probelor psihologice
Fidelitatea reprezintă gradul în care scorurile unui test sunt consistente sau repetabile, adică gradul în care ele nu
sunt afectate de erorile de măsurare.
Principalele metode de estimare a fidelităţii sunt:
- Test – retest
- Teste (forme) paralele
- Split-half (metoda înjumătăţirii)
- Consistenţa internă
a. Metoda test-retest
Se administrează proba psihologică aceluiaşi eşantion de participanţi în două momente diferite (2-7 săptămâni).
Se calculează coeficientul de corelaţie dintre cele două scoruri obţinute.
Dacă valoarea coeficientului este pozitivă şi puternică atunci proba are un nivel optim de fidelitate.
Metoda este recomandată în cazul probelor care măsoară caracteristici generale durabile (ex. inteligenţă,
personalitate, etc.).
b. Metoda testelor paralele
Se administrează cele două versiuni ale probei unui eşantion de participanţi (proba trebuie sa conțină două versiuni
identice – câte 2 itemi pentru fiecare conținut).
Ex. Conținut: Îmi place să am prieteni.
- Item 1. Petrec cât de mult timp pot împreună cu prietenii.
- Item 2. Am nevoie de un cerc mare de prieteni.
Scorurile celor două versiuni (forme) ar trebui să prezinte o corelaţie pozitivă foarte puternică între ele (preferabil
cât mai apropiată de 1.00), pentru a avea un nivel optim de fidelitate.
Metoda este mai puţin utilizată în practică din cauza faptului că destul de puţine probe psihologice au forme
(versiuni) paralele.
c. Metoda înjumătățirii – split-half
Se administrează proba unui eşantion de participanţi. Răspunsurile la test sunt împărţite în două jumătăţi (ex.
Itemii pari vs. itemii impari). Se calculează coeficientul de corelaţie între cele două jumătăţi.
Dacă valoarea coeficientului este pozitivă şi puternică atunci proba are un nivel optim de fidelitate.
Trebuie avut în vedere faptul că nivelul de fidelitate se poate modifica în funcţie de modul de înjumătăţire a
itemilor.
d. Metoda consistenței interne
Se administrează proba unui eşantion de participanţi. Se calculează unul dintre coeficienţii de consistenţă internă
(cel mai des utilizat este coeficientul α Cronbach) – verifică corelația dintre fiecare item și scorul format din toți
itemii.
Coeficientul α Cronbach poate lua valori între 0 şi 1.
Interpretarea lui α Cronbach se realizează astfel:
- Valori peste .80 – nivel optim de fidelitate
- Valori între .70 şi .80 – nivel acceptabil/satisfăcător de fidelitate
- Valori între .60 şi .70 – nivel “la limită” de fidelitate
- Valori între .50 şi .60 – nivel scăzut de fidelitate
- Valori sub .50 – nivel inacceptabil de fidelitate