Sunteți pe pagina 1din 8

Scala ordinală

Bazele teoretice ale psihodiagnosticului


▪ Scalele ordinale - scale de ordine, scale de rang, scale ierarhice - permit ordonarea observaţiilor,
Măsurarea în psihologie: Măsurare vs evaluare & Scale de măsură indivizilor, situaţiilor de la mic la mare, de la simplu la complex, de la mai puţin la mai mult.
▪ În interiorul unei clase date, indivizii pot fi comparaţi în funcţie de gradul prezenţei unui atribut comun.
Trebuie să fim preocupaţi de ordinea relativă a obiectelor sau indivizilor.
Psihometrie, măsurare, evaluare
S1 < S2 < S3.............Sn (pentru n subiecţi)
Psihometria, ca domeniu al psihologiei, este interesată de studiul diferențelor individuale, măsurarea ▪ Operaţiunea de ordonare presupune o discriminare foarte riguroasă faţă de simpla categorizare,
făcându-se prin urmare cu ajutorul testelor. deoarece pentru fiecare obiect sau individ trebuie să stabilim gradul de prezenţă a unui atribut, ceea ce nu
▪ Măsurarea este o operație care constă în asocierea, după anumite reguli, a unor simboluri (de cele mai înseamnă că scala indică cantitatea absolută a atributelor prezente, nici amploarea diferenţelor sau
multe ori numerice), obiectelor, evenimentelor, sau indivizilor, pentru a evalua gradul în care acestea prezintă raporturile dintre cantităţile atributelor prezente.
anumite atribute ▪ Atributul nu se exprimă în mod necesar în unităţi egale, chiar dacă numerele care le reprezintă sunt la
▪ Evaluarea presupune prezența unor aspecte subiective. Putem defini evaluarea ca fiind o operație care distanţe egale.
constă în a face o judecată de valoare, sau a acorda o valoare unui obiect sau unei persoane, comparând ▪ Simbolurile numerice atribuite obiectelor sau indivizilor, sunt ranguri care indică poziţia relativă a acestora
obiectul, l sau persoana cu un criteriu dat. pe un continuum pentru atributul pe care dorim să-l măsurăm, ca în exemplul de mai jos.

Scale de măsură
▪ Natura scalei de măsurare utilizată determină tipul de interpretare şi cantitatea de informaţii pe care o
putem extrage din rezultatele obţinute cu ajutorul acelei scale.
▪ Primul criteriu de diferenţiere a unui tip de scară, se referă la regulile care determină modul în care
numerele sunt asociate atributelor măsurate.
▪ Datele scalelor ordinale pot fi analizate prin statistici neparametrice.
▪ O scală nu are raţiunea de a exista dacă nu există un izomorfism (corespondenţă) între unele
▪ Se poate recurge la toate operaţiile statistice aplicabile scalelor nominale. În plus, pentru aceste date
proprietăţi ale atributelor măsurate şi unele proprietăţi ale seriei numerice.
putem calcula: mediana (valoarea care împarte distribuția în două părți egale, 50% dintre scoruri sunt mai
▪ Atributele pe care trebuie să le posede o scală de măsurare sunt: magnitudinea sau mărimea, intervale
mici și 50% dintre scoruri sunt mai mari), centile, coeficienţi de corelaţie a rangurilor, chi-pătrat.
egale şi punctul zero.
Scala de intervale egale
Scale de măsură - atribute
▪ Aranjarea ordinală poate da rezultate foarte complete dacă cunoaştem distanţa care separă obiectele sau
▪ Când o scală are magnitudine, atunci un anumit atribut poate fi judecat ca fiind mai mare decât, mai mic
indivizii în funcţie de atributul măsurat.
decât sau egal cu o altă stare a aceluiași atribut.
▪ Scalele cu intervale egale permit măsurarea diferenţelor dintre gradele de prezenţă a atributelor, dar nu
▪ Intervale egale, înseamnă că magnitudinea unui atribut reprezentat de o unitate de măsură pe o scală este
indică amplitudinea absolută a acestor grade, deoarece ele nu admit zero absolut.
egală, indiferent de locul unde este plasată unitatea pe scală.
▪ Din această cauză este imposibil să stabilim proporţii pe baza gradelor de prezenţă a unui atribut exprimat
▪ Punctul zero absolut, este valoarea care indică faptul că atributul care trebuie măsurat nu are nici o
pe o scală de intervale egale.
valoare (mai bine spus are valoarea zero).
▪ Două enunţuri principale pot defini scalele cu intervale egale:
Scala nominală S1 < S2 < S3.............< Sn și S2 - S1 = S3 - S2 = S4 - S3.................Sn - Sn-1
▪ unde S1..........Sn sunt grade relative la care un atribut se prezintă pentru diferiţi subiecţi
▪ Acest tip de scală este cunoscută şi sub denumirea de scală calitativă, scală categorială sau scală de
clasificare.
▪ Forma cea mai simplă de observaţie constă în a stabili dacă două obiecte au doi indivizi sunt calitativ
asemănători sau diferiţi prin răspunsurile lor la o situaţie dată, sau când prezintă una sau mai multe
proprietăţi date.
▪ Vom putea astfel grupa proprietăţile sau indivizii în funcţie de una sau mai multe caracteristici comune.
Este suficient să precizăm criteriile utilizate pentru includerea obiectelor sau indivizilor într-o clasă sau
categorie. ▪ Scalele de intervale oferă, pe lângă posibilitatea operaţiilor statistice specifice scalelor mai puţin complexe,
▪ Operaţiile de clasificare şi enumerare sunt folosite în producerea unei scale nominale. precum: calculul mediei, abaterii standard, coeficientul de corelaţie Pearson, teste de semnificaţie (F;
▪ În cazul în care simbolurile numerice sunt atribuite indivizilor, aceste simboluri nu reprezintă cantităţi de t) şi folosirea unor numeroase tehnici statistice puternice.
atribute şi nu putem vorbi de posibilităţi de utilizare a matematicii sau statisticii, ci doar Scalele de proporții sau de raport
de obţinerea unor informaţii calitative.
▪ Singurele operaţii statistice posibile cu aceste date nominale sunt: ▪ Această scală, care se aplică măsurătorilor fizice este o scală numerică. În măsurarea unui atribut, zero
▪ calculul frecvenţelor (numărul de cazuri din fiecare categorie), absolut indică absenţa atributului la un obiect sau individ.
▪ identificarea modulului (categoria cu cei mai mulţi indivizi), ▪ O scală de proporţii poate fi stabilită pentru un atribut, care la primă vedere, nu prezintă posibilitatea
▪ calcului coeficientului de contingenţă (verificare ipotezei referitoare la distribuţia cazurilor în absenţei totale, când putem respinge existenţa unei relaţii funcţionale între acel atribut şi un alt atribut sau
categorii, evaluarea interdependenţei a două principii de clasare). fenomen care posedă proprietatea de adunare (adică zero absolut).
Metoda testelor în psihologie:Testul psihologic&Conduita ca relație Clasificarea testelor în psihologie

Testul psihologic PARADIGMA TEORETICĂ


DEFINIȚII ▪ reprezentanţii şcolii experimentaliste, care descompun personalitatea în părţi componente, apelează la
▪ Cattell (1890) – probă destinată cunoașterii diferențelor dintre indivizi. teste „sectoriale” folosind analiza factorială şi metode metrice precise
▪ Cronbach - procedeu sistematizat de măsură a comportamentului unor persoane şi de descriere a ▪ psihologii clinicieni, încearcă să cuprindă ansamblul personalităţii cu ajutorul testelor holistice, folosind sau
acestuia cu ajutorul unor scări numerice sau a unui sistem de categorii nu indicatori numerici.
▪ Rey - un mijloc de a diferenția indivizii în funcție de un etalon
ASPECTUL PSIHOLOGIC INVESTIGAT
▪ Anastasi (1976) - măsurarea standardizată şi obiectivă a unei modalități de comportament.
▪ Holban (1978) - instrument al metodei experimentale, organizat sub forma unei probe standardizate din ▪ teste intelectuale, care vizează cunoaşterea proceselor cognitive (percepţie, memorie, capacitate de
punct de vedere al conținutului, al condițiilor de aplicare şi al modalităților de apreciere a rezultatelor, analiză şi sinteză etc.)
instrument ce este folosit în stabilirea unei anumite variabile. ▪ teste de personalitate, care vizează aspectul afectiv-atitudinal.
▪ Cosmovici (1996) - o probă standardizată, vizând determinarea cât mai exactă a gradului de dezvoltare a
MODUL DE PREZENTARE
unei însușiri psihice sau fizice.
▪ teste orale, răspunsul subiectului se dă sub formă verbală,
PROBĂ STANDARDIZATĂ
▪ teste scrise (numite creion - hârtie),
▪ Consemn (explicarea sarcinilor de efectuat)
▪ teste instrumentale, la care se utilizează un suport concret (material sau un aparat),
▪ Corectarea și cotarea răspunsurilor
▪ teste informatizate, aplicate cu ajutorul computerului.
▪ Interpretarea rezultatului
MICRO-SITUAȚIE ANALOGĂ REALITĂȚII MODUL DE APLICARE
▪ Simulare a unor caracteristici bine definite
▪ Individuale
▪ Micro-situație reprodusă trebuie să fie cât mai apropiată de situația reală din care a fost extrasă
▪ Colective
▪ Mucchielli (1969), consideră că un simulator este „un dispozitiv care reproduce, după reguli şi garanţii bine
precizate un ansamblu de condiţii reale ale existenţe” ▪ teste de inteligenţă şi dezvoltare mintală, care măsoară aptitudinea cognitivă generală şi nivelul atins în
dezvoltarea caracteristicilor intelectuale;
Itemul – element al unui test, constituind o situație particulară și jucând rolul unui stimul la care subiectul nu
▪ teste de aptitudini şi capacităţi, care au fost elaborate pentru măsurarea aptitudinilor de grup şi specifice;
poate da decât un răspuns din două sau mai multe răspunsuri teoretice prevăzute de test.
▪ teste de personalitate - măsoară însuşiri de temperament şi caracter, fiind împărţite în două categorii:
▪ Extrage dintr-o situație concretă, reală un eșantion de condiții sau factori, considerați semnificativi pentru ▪ teste obiective de personalitate, care-şi propun obţinerea unor date cuantificabile, cât mai puţin
un anumit tip de comportament, ignorând aspectele neesențiale. influenţate de interpretările subiective şi evitarea tendinţei de faţadă a subiecţilor în momentul elaborării
răspunsului, deoarece aceştia nu conştientizează aspectele personalităţii vizate de test;
Conduita ca relație - R = f(P,S) ▪ tehnici proiective, care valorizează mecanismul de proiecţie în cunoaşterea psihologică a persoanei,
trecând peste vigilenţa conştiinţei în încercarea de a studia inconştientul;
Relații funcționale – utilizate pentru studiul funcțiilor psihice, unde aceeaşi persoană reacţionează diferit la ▪ teste de cunoştinţe sau docimologice, care măsoară nivelul cunoştinţelor acumulate de subiecţi şi
variabile cantitative şi calitative ale situaţiei. servesc ca modalitate de examinare şi notare.
Relaţii structurale - folosite pentru studiul structurii psihice, unde se studiază relaţiile dintre răspunsurile În realitate testul extrage, din variaţiile teoretic infinite ale conduitelor subiectului, un nr limitat de eşantioane
obţinute de subiecţi pornind de la situaţii diferite. de conduită, pe care le măsoară, oferind o imagine lacunară asupra conduitei reale a persoanei testate.
Relaţii diferenţiale - folosite pentru studierea diferenţelor dintre indivizi, unde luăm în consideraţie reacţiile
unor persoane diferite la o singură situaţie standardizată.
Fidelitatea instrumentelor psihologice
Stabilitatea în timp I Consistența internă I Absența relativă a erorilor
▪ Fidelitatea se referă la precizia cu care un test măsoară anumite caracteristici.
1. stabilitatea rezultatelor în timp şi în consecinţă în predictibilitatea lor.
Cât de variabile de fluctuante sunt rezultatele subiectului de la o măsurare la alta?
2. acurateţea, precizia cu care testul măsoară ceea ce şi-a propus să măsoare.
Valorile obţinute la o probă sunt adevăratele valori ale aspectului psihologic măsurat? Diferenţele
interindividuale, constatate în privinţa cotelor obţinute la test, pot fi explicate prin diferenţe reale dintre
subiecţi?
3. absenţa relativă a erorilor de măsurare.
Cât de mare este eroarea de măsurare (totalul erorilor întâmplătoare) a testului?
Relații funcționale Relaţii structurale Relaţii diferenţiale
Stabilitatea în timp a rezultatelor Eroarea standard de măsurare

▪ Inconstanța măsurării
▪ Se observă că testarea repetată a unei persoane cu aceeaşi probă, sau cu probe paralele duce la
obţinerea unor rezultate fluctuante, la o variaţie mai mult sau mai puţin accentuată.
▪ Scorurile obţinute la testele psihologice provin din răspunsurile date de diferiţi subiecţi. Una din carac. ▪ Sx – Abaterea standard a instrumentului
comportam. uman este că se modifică în timp, aspect care ne face să ne preocupe constanţa scorurilor. ▪ rxx′ - coeficientului de fidelitate
▪ Eşantionarea itemilor, ▪ SE este denumită eroarea standard de măsurare sau eroarea probabilă.
▪ Circumstanţele particulare de administrare a testului ▪ SE reprezintă eroarea aleatoare care nu poate fi eliminată din măsurare, dar trebuie luate măsuri pentru a
▪ Caracteristicile subiecţilor o reduce cât mai mult. Vom spune că măsurarea este fidelă sau precisă în măsura în care există cât mai
puţine erori posibile sau valoarea SE este cât mai mică posibil. Teoretic eroarea este nulă.
Fidelitatea. Consistența internă a itemilor
Intervalul scorului adevărat
▪ Teoria preciziei testului (termen generic pentru desemnarea studiului consistenţei interne) este importantă
prin două probleme fundamentale: ▪ X - 1SE ≤ A ≤ X + 1SE pentru o probabilitate de 0,68
▪ Prima constă în gradul de consistenţă a rezultatelor, şi se referă la relaţia între scorurile obţinute în ▪ X - 2SE ≤ A ≤ X + 2SE pentru o probabilitate de 0,95
diferite situaţii de aplicare a testelor; ▪ X - 3SE ≤ A ≤ X + 3SE pentru o probabilitate de 0,99
▪ A doua se referă la cauzele diferenţelor observate între scoruri, deci a cunoaşte factorii care determină
scorurilor inconstante şi importanţa efectului lor.

Teoria clasică a testelor

▪ După teoria clasică a testelor toate scorurile observate (X) sunt compuse din două părţi: un scor adevărat
(A) şi un scor eroare (E). Această relaţie poate fi reprezentată sub forma ecuaţiei:
X=A+E Exerciții.
Scorul adevărat
▪ Coeficientul de fidelitate a unui instrument de inteligență emoțională este rXX’ = 0,60, abaterea standard
▪ Scor obţinut cu un test perfect, deci un test care măsoară fără eroare. De fapt, dacă putem efectua are valoarea SX = 1,5. Pe baza acestor date, stabiliți între ce limite se situează scorul adevărat al unui
măsurări fără eroare, toate scorurile observate pot fi considerate ca adevărate. subiect, la o probabilitate de 95%, care a obținut la acest instrument scorul de 10.
▪ Lord şi Novick (1968) dau o altă definiţie scorului adevărat elaborând postulatele de bază şi relaţiile dintre
scorurilor adevărate şi eroare. Rezolvare:
Scorul adevărat al unui subiect (s) obţinut cu un instrument dat (i) este definit ca valoarea aşteptată a
scorului observat.
▪ Scorul mediu a unui subiect pentru un număr infinit de utilizări a X = 10 (din enunt)
aceluiaşi instrument de măsură. La un nivel de încredere de 95%:
X – 2*Se = 10 – 2*0,94 = 10 - 1,88 = 8,12
Fidelitatea ca raport de varianță X + 2*S2 = 10 + 2*0,94 = 10 + 1,88 = 11,88
Unde: La un nivel de încredere de 95%, scorul adevărat al subiectului se află în intervalul 8,12 – 11,88.

s2A/ s2x este proporţia varianţei observate care provine din varianţa
adevărată
▪ Coeficientul de fidelitate a unui instrument de inteligență emoțională este rXX’ = 0,75, abaterea standard
s2E/ s2x este proporţia varianţei observate care provine din varianţa are valoarea SX = 3,5. Pe baza acestor date, stabiliți între ce limite se situează scorul adevărat al unui
eroare subiect, la o probabilitate de 99%, care a obținut la acest instrument scorul de 23.
Rezolvare:

X = 23 (din enunt)
La un nivel de încredere de 99%:
X – 3*Se = 23 – 3*1,75 = 23 – 5,25 = 17,75
X + 3*Se = 23 + 3*1,75 = 23 + 5,25 = 28,25
La un nivel de încredere de 99%, scorul adevărat al subiectului se află în intervalul 17,75 – 28,25.
Sursele erorilor de măsurare Validitatea instrumentelor psihologie
▪ Erori produse de testul însuși Validitatea de conținut I Validitatea de construct I Validitatea predictivă
▪ eşantionarea itemilor, dacă testul presupune măsurarea unei trăsături foarte precise, ambiguitatea
▪ Validitatea, care este determinată în funcţie de gradul de varianţă adevărată al variabilei măsurate,
enunţurilor, imprecizia instrucţiunilor în legătură cu maniera de răspuns, o limită de timp neadecvată.
poate fi definită ca fiind:
▪ Erori legate de condițiile de aplicare a testului ▪ gradul în care un test măsoară o trăsătură, un construct sau un factor;
▪ procedeele de prezentare a testului. Dacă aceste procedee sunt standard riscurile de eroare sunt ▪ relaţia dintre scorurile obţinute la test şi o măsurare a unui criteriu exterior.
scăzute. Lipsa de experienţă a grupului testat, neobişnuinţa subiecţilor de a răspunde la teste poate fi un ▪ După Legendre (1993), validitatea este "capacitatea unui instrument de a măsura realmente ceea ce şi-a
factor de eroare. Lipsa de concentrare a subiecţilor, erorile de redactare a instrucţiunilor şi deficienţele de propus să măsoare după utilizarea acestuia".
cronometrare, sunt erori care fac parte din această categorie.
Fidelitate și validitate
▪ Erori legate de subiecții care răspund la test
▪ motivaţia, obişnuinţa cu testarea, anxietatea, diferenţele de învăţare şi variabile de natură fiziologică.
S2A = S2p + S2n
▪ S2p = varianţa pertinentă
Fidelitatea – consistența internă ▪ S2n = varianţa non pertinentă dar valabilă

DEFINIȚIE - Fidelitatea unui instrument este corelaţia sau coeficientul de concordanţă între două teste S2X = S2p + S2n + S2E
paralele sau două teste paralele la care eşantionul de itemi a fost extras din aceeaşi populaţie de itemi. ▪ Varianţa totală a unui test - formată din varianţa validă, varianţa non pertinentă dar şi din varianţa eroare.
▪ Indicele obţinut e un coeficient de corelaţie între măsurări care dau acelaşi scor adevărat pt fiecare subiect. ▪ Dacă varianţa eroare scade, deci fidelitatea creşte (S2A / S2X), varianţa validă potenţială creşte, dar
▪ Acest indice arată precizia cu care un item ne permită să măsurăm o caracteristică. De asemenea, această varianţă poate fi pertinentă sau nu pentru o situaţie dată.
coeficientul de corelaţie la pătrat indică proporţia varianţei între două măsurări. ▪ O varianță eroare scăzută nu garantează o validitate mare şi în acelaşi timp o fidelitate mare este o condiţie
Metode de estimare a fidelității necesară dar nu suficientă pentru o validitate mare pentru un test dat într-o situaţie dată.
▪ Fidelitatea = precizia cu care un test măsoară anumite caracteristici.
▪ Metoda testelor paralele ▪ Validitatea vizează calitatea măsurării.
▪ calcularea corelaţiei între două forme ale aceluiaşi test format din itemi diferiţi ▪ Validitatea - proporţia de varianţă adevărată care este pertinentă scopurilor de utilizare a unui test.
▪ Metoda test-retest ▪ Studiul validităţii vizează erorile sistematice, cel al fidelităţii erorile aleatorii.
▪ aplica acelaşi test de două ori aceluiaşi grup de subiecţi la un interval mai mic sau mai mare de timp şi a ▪ Un coeficient de validitate rXY nu poate depăşi valoarea rădăcinii pătrate a coeficientului de fidelitate rXX’,
calcula corelaţia dintre rezultatele obţinute. ceea ce înseamnă că validitatea este tot timpul limitată de fidelitatea unui test.
▪ Metode de analiză a varianței interne
▪ Metoda înjumătățirii
Tipuri de validitate.
▪ Coeficientul Alpha și Kuder-Ricardson Validitatea de conținut
Interpretarea coeficientului de fidelitate ▪ Vizează măsura în care un test este expresia unui eșantion reprezentativ dintr-un ansamblu de itemi sau de
sarcini, considerat ca fiind fundamentat cantitativ și calitativ.
▪ Ca o corelație dintre scorurile obținute și scorurile adevărate ▪ Evaluarea validității de conținut se realizează în funcție de gradul de pertinență al eșantionului de itemi.
▪ raport de varianţă, prin care se poate stabili cât din proporţia de varianţa totală aparţine varianţei ▪ Validitatea logică – recunoaștere testului de către experți pe baza analizei logico-științifice.
adevărate ▪ Validitatea aparentă (de fațadă) – identificarea unei corespondențe logice și evidente între itemi și ceea
▪ Un standard de comparaţie a preciziei unui test cu precizia altor teste de aceeaşi natură ce un test este destinat să măsoare.
▪ Compararea testului nou creat cu un test a cărei fidelitate a fost deja verificată și acceptată
▪ Schimbarea rangului subiecților Validitatea de construct
▪ Pentru ca un test să fie fidel, trebuie ca indivizii să se situeze în aceeași poziție în ierarhie și la cea de-a ▪ Cronbach & Meehl – constructul este „suma atributelor ipotetice ale indivizilor, atribute care noi
doua testare presupunem că sunt reflectate în rezultatele unui test”.
▪ Gradul de eroare între scorurile individuale ▪ Guthke – „constructul este înțeles ca o caracteristică, respectiv complex de caracteristici, acceptat în
▪ Cu cât eroarea de măsurate este mai mare cu atât intervalul în care se plasează scorurile adevărate este primul rând ipotetic, care stă la baza comportamentului exterior observabil, el nefiind însă direct observabil”
mai mare. ▪ Validitatea de construct vizează gradul în care testul măsoară constructul dorit.
▪ Validitate teoretică, validitate conceptuală, validitate ipotetico-deductivă.
Exerciții ▪ Metode intratest
▪ vizează stabilirea validităţii de conţinut în funcţie de definiţiile operaţionale ale constructului şi studii de
▪ Interpretați următorul coeficienți de fidelitate: rxx′= 0,85, rxx′=0,90. omogenitate a testului cu ajutorul indicelui de consistenţă internă, prin determinarea fie a coeficientului alpfa
▪ rxx′ = 0,85 – 85% din varianța observată decurge din varianța scorurilor adevărate și 15% decurge din fie a coeficientului Kuder-Richarson
varianța eroare. ▪ Metode intertest
▪ rxx′ = 0,90 – 90% din varianța observată decurge din varianța scorurilor adevărate și 10% decurge din ▪ studiază corelaţiile dintre mai multe teste pentru a verifica dacă ele măsoară acelaşi construct.
varianța eroare.
Validitatea de construct – metode intertest ❑ Un test are validitate divergentă dacă obținem corelații scăzute între trăsături diferite măsurate
❑Validitatea convergentă permite să se demonstreze că două teste măsoară același construct sau prin aceeași metodă. (coeficienți marcați cu roșu)
constructe apropiate.
❑Validitatea congruentă este verificată printr-o metodă de stabilire a validității unui nou test prin corelarea
scorurilor obținute la testul în cauză cu rezultatele altor teste, a căror validitate a fost stabilită anterior.
❑Validitatea divergentă permite să se demonstreze independența sau noncorelația (lipsa corelației) testului
cu alte teste care măsoară un construct diferit.

Validitatea de construct – multitrăsături-multimetodă


▪ Campbell și Fiske – metoda multitrăsături-multimetodă (multitrait- multimethod matrix)
▪ Se bazează pe principiul în baza căruia un test măsoară un construct folosind o metodă particulară.
▪ Rezultatele obținute pot fi dependente de: constructul măsurat; metoda utilizată; combinația celor două
▪ Prin intermediul acestei metode obținem informații despre: omogenitatea testului; validitatea convergentă;
validitatea divergentă
▪ Să presupunem că prin intermediul a două teste măsurăm gradul de liberalism (A), cultura generală (B) și
alienarea (C) prin trei metode diferite: cu itemi polihotomici (I), cu itemi dihotomici (II), răspunsuri libere (III). III. Validitatea convergentă
▪ Prin metoda multitrăsături-multimetodă se obține următoarea matrice: ❑ corelațiile dintre aceeași trăsătură măsurate prin metode diferite (celulele colorate cu albastru) –
coeficienți monontrăsătură – heterometodă
❑Un test are validitate convergentă dacă obținem corelații ridicate între măsurile aceleași trăsături
prin metode diferite.

Categorii de rezultate
I. Estimarea fidelității
❑Diagonala principală cuprinde estimările fidelității pentru fiecare test și pentru fiecare metodă (același test,
aceeași metodă). Aceste valori trebuie să depășească valoarea 0,70 (vezi celule colorate cu roz). -
coeficienți monotrăsătură – monometodă IV. Măsuri ale varianței care decurge din specificul metodei de măsurare
❑ Corelațiile dintre trăsături diferite măsurate prin aceeași metodă (vezi celulele colorate cu mov) –
coeficienți heterotrăsătură - monometodă
❑Efectul metodei este relevant dacă corelațiile testelor care măsoară trăsături diferite sunt mai ridicate
pentru aceeași metodă decât pentru metode diferite.
❑„Efectul de halo” metodologic se manifestă prin tendința de supraestimare a corelațiilor dintre variabilele
dif. măsurate prin aceleași metode (vezi diferența între celulele colorate cu mov și cele colorate cu verde).

II. Validitatea divergentă


❑ corelațiile dintre trăsături diferite măsurate prin metode diferite (colorate cu galben) – coeficienți
heterotrăsătură - heterometodă
❑ este esențial ca aceste valori să fie mai scăzute față de corelațiile aceleași trăsături măsurate prin metode
diferite (colorate cu albastru).
Validitatea predictivă Validitatea predictivă
▪ Validitatea unui test este judecată în funcţie de corelaţia sa cu criteriul şi de gradul în care scorurile ▪ Criteriul (Y) - scorul care este prezis
criteriu nu reprezintă corect scopul propus (slăbiciunea criteriului). ▪ Predictori (X) - Scorurile la testele pe baza cărora se face predicția
Criteriu și măsura-criteriu ▪ rxy – coeficientul de validitate
▪ Astin (1964) consideră criteriul ca fiind un concept general legat de randament. ▪ Corelația dintre predictor și criteriu
▪ Acest concept trebuie să fie exprimat în termeni operaţionali, conform unei măsuri care apoi permite ▪ Indică procentul din varianța criteriului explicată de varianța predictorilor (prin ridicare la pătrat).
determinarea validității unui test.
Analiza de regresie - Estimarea scorului la criteriu (rezultat viitor), pe baza scorurilor la variabilele predictori
Măsura criteriu se face pe baza ecuației de regresie (ecuație matematică).
▪ Pertinența (validitatea sa) – trebuie să reflecte și să măsoare aspectele fundamentale ale criteriului Presupune:
conceptual. Evaluarea pertinenţei unei măsuri - criteriu se face prin procedee raţionale şi calitative. Nu există ▪ Realizarea unui studiu pe baza căruia se identifică legătura dintre predictor și criteriu (rxy).
un indice cantitativ eficace pentru exprimarea gradului de pertinenţă a unei măsuri - criteriu. ▪ Identificarea mediei și abaterii standard, pentru testul predictor, dar si pentru variabila criteriu, în cadrul unui
▪ Fidelitatea (constanța măsurărilor) – aceasta trebuie să fie constantă în timp indiferent de circumstanţe. grup reprezentativ pentru persoanele în cazul cărora se vor face predicții (estimări ale rezultatelor viitoare).
O măsură - criteriu inconstantă nu poate fi pusă în relaţie cu alta, iar indicele relaţiei cu predictorul nu va ▪ Persoanele pentru care se pot face predicții, pe baza rezultatelor studiului inițial, sunt diferite de cele
semnifica nimic, indiferent de gradul acestuia. incluse în studiu, însă păstrează aceleași caracteristici.
▪ Absența contaminării - Măsurarea criteriului se va efectua în condiţiile în care factorii non pertinenţi nu pot Criteriu și predictori
influenţa scorurile. Contaminarea poate să apară uşor dacă măsura criteriu se prezintă sub forma unor scale În cadrul unei aplicații, avem:
de evaluare care sunt vulnerabile datorită efectului de halo sau a tendinţei de indulgenţă. Instrucţiuni foarte ➢Un singur rezultat anticipat (criteriu - Y)
precise de forma unei descrieri detaliate a caracteristicilor de evaluat permite diminuarea riscului de ➢Una sau mai multe variabile predictori (X)
contaminare. În funcție de numărul de predictori, avem:
1. Regresie simplă (X)
Validitatea predictivă 2. Regresie multiplă (cel puțin doi predictori)
▪ Predicție: capacitatea de anticipare, pe baza rezultatelor la o serie de teste sau pe baza unor caracteristici
individuale (ex. varsta), rezultate viitoare. Ecuația de regresie simplă
▪ Validitatea predictivă: proprietatea unui test de a utiliza rezultatele sale pentru a anticipa rezultate viitoare. ▪ Un singur criteriu (Y) și un singur predictor (X)
În note brute
Coeficientul de validitate ▪ Y = a + b*X
Etape în identificarea coeficientului de validitate predictivă: ▪ Y = scorul la criteriu (care trebuie aflat)
▪ Alegerea unui eșantion de subiecți ▪ X = scorul la testul predictor (cunoscut)
▪ Aplicarea testului predictor acestor subiecți ▪ a = constanta de regresie
▪ Realizarea unor prelucrări specificate dacă este cazul ▪ b = coeficientul de regresie nestandardizat
▪ Colectarea datelor la criteriu ▪ a = rxy ∗ sy/sx (sy – abaterea standard a criteriului; sx – abaterea standard a predictorului)
▪ Calcularea corelației între scorurile obținute la predictor și la criteriu ▪ b = My − b ∗ Mx
Interpretarea coeficientului de validitate predictivă În note standard:
▪ Transformarea coeficientului de validitate în procente de varianţă. Prin ridicarea la pătrat a coeficientului de ▪ Zy = rxy * Zx
validitate obţinem proporţia din varianţă explicată prin acesta. ▪ Zx – valoarea în note z a scorului la predictor
▪ Dacă rXY = 0,60 atunci r2XY = 0,36 sau o proporţie de varianţă egală cu 0,36. Putem spune că 36% din ▪ rxy – coeficientul de corelație între predictor și criteriu
varianţă este împărţită între două variabile, sau că 36% din varianţa criteriului este datorată variaţiei ▪ z = (X − M)/sx
scorurilor testului predictor. Ecuația de regresie multiplă
▪ Observăm că coeficientul de validitate trebuie să fie de circa 0,7071 pentru ca jumătate din varianţa ▪ Un singur criteriu (Y) și mai mulți predictori (X1, X2, X3,..., Xn)
criteriului să fie explicată prin varianţa scorurilor la predictor. În note brute
▪ Y = a + b1*x1 + b2*X2 + b3*X3 + ... + bn*Xn
Exerciții ▪ Y = scorul la criteriu (care trebuie aflat)
▪ X1, X2, ... = scorul la testul predictor (cunoscut)
▪ Un studiu și-a propus să verifice dacă inteligența emoțională prezice performanța academică și s-a obținut ▪ a = constanta de regresie
o corelație între cele două variabile rXY = 0,80. Interpretați acest coeficient. ▪ b = coeficientul de regresie nestandardizat
▪ În cazul ecuației de regresie multiple, valorile pentru a, b și β se dau.
În note standard:
▪ Corelația dintre stabilitatea emoțională și performanța în muncă are valoarea rXY = 0,75. Interpretați acest ▪ Zy = β1*Zx1 + β2*Zx2 + ...+ βn*Zxn
coeficient. ▪ Zx1, Zx2, ... – valoarea în note z a scorului la predictor
▪ β – coeficientul de regresie standardizat
▪ z = (X −M)/sx
Exerciții rezolvări
Cerinţe:
Eroarea standard de estimare 1. Să se stabilească la care dintre probe a obţinut primul subiect cele mai bune rezultate.
Fiecare analiza de regresie implică o marjă de eroare, numită eroare standard de estimare (Sest). ▪ Se calculează nota z a primului subiect la fiecare dintre cele 3 probe
Scor criteriu - Scor real la criteriu folosind formula: z = (X −M)/s, unde X este scorul brut, M este media
❑68%: y ε [y – Sest; y + Sest] acelei probe și s este abaterea standard.
❑95%: y ε [y – 2Sest; y + 2Sest]
❑99%: y ε [y – 3Sest; y + 3Sest] Concluzie: Primul subiect a obținut cele mai bune rezultate la proba
vocabular (z = 3,33)
Standardizarea testelor
Note standard 2 . Să se stabilească la care dintre probe a obţinut al doilea subiect cele mai slabe rezultate
▪ Se calculează nota z a celui de-al subiect la fiecare dintre cele 3
Scorurile Z probe folosind formula: z =(X −M)/s, unde X este scorul brut, M este
▪ Scorurile standard se calculează prin împărţirea deviaţiei fiecărui scor de media acelei probe și s este abaterea standard.
la medie la abaterea standard a scorurilor.
▪ z = (X −M)/sx Concluzie: Cel de-al doilea subiect a obținut cele mai slabe rezultate
▪ X – Scorul obținut la test la proba de abilitate numerică (z= -1,4)
▪ M – media distribuției scorurilor
▪ Sx – abaterea standard a scorurilor
▪ Cel mai mare avantaj al scorurilor Z în comparaţie cu notele brute, este că scorurile Z sunt întotdeauna 3. Ierarhizaţi subiecţii în funcţie de rezultatele obţinute la cele trei teste.
echivalente. Astfel, un scor Z de 2 înseamnă întotdeauna 2 abateri standard de la medie. Ele permit Pentru a ierarhiza subiecții în funcție de
compararea scorurilor obţinute de un individ la teste diferite. performanța globală obținută, vom calcula media
▪ Scorurile Z au o medie de 0, o abatere standard de 1 şi pot lua valori negative şi pozitive. Un scor Z mai aritmetică notelor z calculate la cerința 1 (pentru
mare decât media este un scor pozitiv, iar scorul mai mic decât media este un scor Z negativ. subiectul 1) și la cerința 2 (pentru subiectul 2).
Concluzie: Cel de-al doilea subiect a avut o
Scoruri Z transformate performanță globală mai bună comparativ cu
▪ Zt = a + b ∗ Z primul subiect.
▪ Zt - scorul Z transformat 4. Transformaţi în note stanine, note sten şi în
▪ a – media distribuției transformate note t scorurile obţinute de cei doi subiecţi la testul de Abilitate numerică.
▪ b = abaterea standard a distribuției transformate Pentru a transforma notele z în alte note standardizate (sten, stanine, T) aplicăm formula:
▪ Z – scorul z calculat ztransformat = a + b ∗ zcalc
▪ Specificul distribuției altor scoruri standardizate: Unde: a – media distribuției standard și b - abaterea standard a distribuției standard.
Specificul notelor standardizate:

Exerciții
Unui grup de subiecţi i s-a aplicat 3 teste: Vocabular, Abilitate numerică şi Analogii. Inventarul statistic de
bază obţinut este următorul: Vocabular: media =10, abaterea standard =3 Abilitate numerică: media =17,
abaterea standard =5 Analogii: media=11, abaterea standard = 2
Rezultatele obţinute de doi subiecţi la aceste probe sunt: Vocabular: x1=20, x2=15, Abilitate numerică: x1=7,
x2=10, Analogii: x1=15, x2=18
Cerinţe:
1. Să se stabilească la care dintre probe a obţinut primul subiect cele mai bune rezultate.
2. Să se stabilească la care dintre probe a obţinut al doilea subiect cele mai slabe rezultate
3. Ierarhizaţi subiecţii în funcţie de rezultatele obţinute la cele trei teste.
4. Transformaţi în note stanine, note sten şi în note t scorurile obţinute de cei doi subiecţi la testul de Abilitate
numerică.
Sisteme de etalonare Etaloane în clase normalizate
Etaloane în cuantile I Etaloane în unități de abateri sigma I Etaloane normalizate ▪ Etaloane în clase normalizate nu sunt altceva decât derivații ale etaloanelor în unități sigma și se bazează
pe transformarea notelor z în alte categorii de note. Algoritmul de calcul este oarecum similar celui utilizat în
Etaloane realizarea etaloanelor în unități sigma și se bazează pe fracțiuni de unități z.
▪ Un etalon reprezintă un sistem de norme prin care putem compara rezultatele unui subiect (caz individual) ▪ Pt a stabili care este fracțiunea lui z pt crearea claselor se calculează 2z/(nr clase −1) (nr impar de clase)
cu rezultatele obținute de către un grup reprezentativ de subiecți. ▪ Media notelor z = 0 iar abaterea standard s = z = 1.
▪ Etaloanele se construiesc în funcţie de aspectul distribuţiei datelor eșantionului pe care s-a făcut studiul.
Exercițiu
Etaloane în cuantile Încadrați un subiect (A) într-un etalon în 5 clase normalizate știind că acesta a obținut scorul 30 la un test de
Se construiesc pentru: anxietate și media distribuției este 25 și abaterea standard este 5. încadrați un subiect (B) care a obținut
▪ datele care descriu distribuții care se abat de normalitate, scorul 18.
▪ datele măsurate pe scala ordinală.

Exercițiu

Exercițiu
Construiți un etalon în 7 clase z și încadrați un subiect A care a obținut un scor de 30 și un subiect B care a
obținut un scor de 1, știind că media este 25 și abaterea standard este 5.

Etaloane în unități sigma


▪ Se folosesc atunci când distribuția datelor este una normală.
▪ Se construiesc pe baza mediei și a abaterii standard.

Exercițiu
Analiza unui grup de 150 de persoane care au completat un test de instabilitate emoțională a indicat faptul
că media distribuției este 20 și abaterea standard este 3. Construiți un etalon în unități de abateri standard
cu 5 clase egale. În ce clasă se află un participant care a obținut scorul 22? Încadrați un participant care a
obținut scorul 16.

S-ar putea să vă placă și