Sunteți pe pagina 1din 66

CONF.DR.

AUREL STAN

STATISTIC I

CUPRINS
I. INTRODUCERE

II. STATISTIC DESCRIPTIV

III. GRUPAREA I SISTEMATIZAREA DATELOR

IV. INDICATORII STATISTICI

V. MODELELE TEORETICE DE RAPORTARE

BIBLIOGRAFIE
SCOPUL UNITII DE CURS
Familiarizarea cursanilor cu problemele principale ale statisticii infereniale aplicate n psihologie;
Informarea cursanilor asupra principalelor tipuri de aplicaii ale statisticii infereniale n domeniul
psihologic de cercetare;
Informarea cursanilor asupra specificului variabilelor psihologice supuse procesului de prelucrare
statistic;
Informarea cursanilor asupra limitelor interpretrii statistice n cercetarea psihologic

OBIECTIVE OPERAIONALE
n urma studierii acestei uniti de curs, studenii trebuie s-i formeze urmtoarele deprinderi
intelectuale:
S opereze cu principalele concepte statistice aplicate n domeniul psihologiei;
S precizeze principalele scale de msur utilizate n domeniul cercetrii psihologice i s disting
specificul acestora n cazul unor cercetri concrete;
S precizeze situaiile de aplicare n psihologie a conceptelor statistice referitoare diferenierea i
asocierea seriilor de valori ale unei variabile;
S precizeze specificul principalilor indicatori statistici i s cunoasc etapele calculrii lor.
S precizeze sensul i non-sensul indicatorilor statistici;
S precizeze sensul diferitelor abateri de la distribuia normal;
S poat utiliza corect datele coninute n tabelul anex.

EVALUARE
Se va realiza n cadrul unui examen scris la sfritul semestrului. Pentru examen se vor stabili dou
tipuri de subiecte: un tip referitor la teoria statistic i un tip referitor la aplicarea n practic a
cunotinelor dobndite. n cadrul activitilor tutoriale se vor exersa subiectele cu caracter practic i se
va verifica realizarea exerciiilor de la sfritul capitolelor. Tipurile de subiecte pentru examen vor fi egal
ponderate pentru nota final obinut la examen
STATISTIC I

INTRODUCERE

ntr-o definiie succint, statistica este un ansamblu de metode care au drept obiect colectarea,
organizarea, tratamentul i interpretarea datelor de observaie care se refer la grupuri de persoane
sau de obiecte. Exist discuii, care nu vor fi comentate n manualul nostru, asupra autonomiei statisticii
ca tiin, din cauza faptului c o bun parte din metodele statisticii aparine domeniului matematic, n
consecin se susine c statistica nu ar fi dect matematic aplicat, afirmaie care nu poate fi
contestat. ns, dezvoltarea statisticii a prilejuit dezvoltarea unor modaliti de abordare a studiului
datelor i a unor exigene metodologice de cercetare specifice care-i o confer un statut aparte,
inconfundabil n ansamblul tiinelor moderne.
Disciplina statisticii are o vast arie aplicativ, n domenii dintre cele mai diverse. Este foarte
greu de indicat un domeniu al activitilor teoretice i practice n care s nu-i gseasc utilitatea.
Statistica aplicat n psihologie va expune cteva consideraii teoretice strict necesare, fr s se
preocupe de fundamentarea matematic a procedeelor folosite, chestiune care preocup specialitii n
statistic teoretic, i va insista asupra specificului aplicativ al unor proceduri statistice n cercetarea
psihologic sau n practica profesional ce presupune prelucrarea i interpretarea datelor. Interveniile
statistice din domeniul psihologic se refer mai ales la acele date care provin de la grupuri de
persoane, dar acest aspect nu poate fi generalizat.
Originile preocuprilor statistice pot fi defalcate n funcie de considerarea acestora drept practici
istoricete atestate sau drept contribuii tiinifice sistematizate. n primul caz se poate vorbi de o
existen milenar (5-milenii) a acestora, n al doilea caz de una secular (4 secole anterioare). Nevoia
de a colecta date cantitative asupra populaiei i condiiilor sale materiale de existen se face simit
din momentul n care apar comunitii umane organizate (semnul apariiei acestora este dat naterea
instituiilor de reglare a desfurrii vieii n comunitate, apariia statelor constituind forma evoluat a
unor astfel de instituii). n China, Egipt, Grecia i Roma antic apar recensminte cerute de funcionarii
administrativi, practici continuate n evul mediu (releveurile realizate la ordinele lui Charlemagne,
Domesday Book a lui Wilhelm Cuceritorul, spre 1090) i n nceputurile perioadele moderne ale istoriei,
prin numeroase inventare sau releveuri realizate ca urmare a unor ordonane regale sub impulsul lui
Sully, a lui Colbert i a lui Vauban.
n secolul al XVII-lea se profileaz concepte relative la bazele i la mijloacele studiilor statistice,
deci putem vorbi nceputurile statisticii teoretice. n aceast perioad i contureaz apariia a dou coli
de gndire n acest domeniu. coala german, numit i coala descriptiv, de la care pare c deriv
cuvntul statistic (cuvntul german die Statistik), este fondat de ctre Herman Conring (1606-1681),
profesor la Universitatea din Helmstadt, ale crui contribuii vor fi continuate prin Gottfried Achenwall
(1719-1772). Cea de-a doua coal, denumit aritmetica politic are ca fondatori pe John Graunt

93
AUREL STAN

(1620-1764), Gregory King (1648-1712), Edmond Halley 1656-1742) i pe sir William Petty (1623-
1687), i pune n eviden, dincolo de descriere, anumite permanene statistice, de exemplu raportul
numrului de nateri masculine i acela al celor feminine. Edmond Hailley prezint un tabel de
mortalitate care este baza lucrrilor actuariale contemporane, apoi un reprezentant al colii germane,
Johann Peter Sssmilch (1707-1767), public importante lucrri asupra procentului de masculinitate la
natere i asupra evoluiei acestuia pn la vrsta de 20 de ani.
De o deosebit importan n fundamentarea teoretic a statisticii este apariia, n 1812, a lucrrii
lui Pierre Simon de Laplace (1749-1827), intitulat Teoria analitic a probabilitilor, care pune n
eviden avantajele care pot fi trase din aceast teorie n studiul fenomenelor naturale. n care cauzele
sunt prea complexe pentru a le putea cunoate exhaustiv i a le analiza individual.
Ca expresie a dezvoltrii statisticii, apar o serie de statistici autonome consacrate anumitor
domenii de specialitate precum statistica aplicat n mecanic, agronomie i economie, a cror
dezvoltare nu are rost n lucrarea noastr simplificat. Cele mai multe din aplicaiile statisticii se afl,
fr ndoial, n domeniul economic i administrativ.
Nu ncercm s facem o istorie amnunit a statisticii, lucrare care ar trebui s fie deosebit de
laborioas, ci s punctm momente importante ale evoluiei acesteia, legate de aplicarea acestei
discipline n domeniul tiinelor sociale. nceputul n aceast privin este fcut de savantul belgian
Adolphe Quetelet, care a avut preocupri tiinifice de o larg diversitate n domeniul aplicaiilor
statisticii1.
Adolphe Qutelet (1796-1874) extinde cmpul de aplicare a metodei statistice n domeniile
antropometric, psihologic i social. La iniiativa sa se reunete la Bruxelles, n 1853, primul congres
internaional de statistic, precursor al Institutului internaional de statistic, fondat la Londra n anul
1885, instituie tiinific care a rmas deosebit de prestigioas pn n zilele noastre. Adolphe Qutelet
a introdus noiunea de om mediu, controversat de-a lungul timpului, concept preluat de o serie
statisticieni i sociologi. Ca urmare a lucrrilor tiinifice aparinnd lui Qutelet, acelora ale lui Francis
Galton (1822-1911) i Karl Pearson (1857-1936), se fondeaz biostatistica sau biometria.
n domeniul tiinelor umane, studiile lui Charles Spearman asupra comportamentului indivizilor,
dezvoltate n psihologia aplicat, uman i animal, au condus la metode de analiz factorial, o
prelungire logic a studiului corelaiilor. Francis Galton, Charles Spearman i Karl Pearson pot fi
considerai ntemeietorii prestigioasei coli psihometrice engleze, care a influenat semnificativ modul de
prelucrare a datelor n cercetrile psihologice.

1 Pentru cei care doresc s cunoasc mai amnunit aspecte ale istoriei statisticii romneti i internaionale le recomandm
lucrarea lui Mihai arc Tratat de statistic aplicat, Editura Didactic i Pedagogic R.A., Bucureti, 1998 i pe cea
coordonat de Vladimir Trebici Mic enciclopedie de statistic, Editura tiinific i enciclopedic, Bucureti, 1985.

94
STATISTIC I

Psihologia devine tiin de sine stttoare abia n a doua jumtate a secolului al XIX-lea, odat
cu accentuarea laturii experimentale n cercetare, n ale crei nceputuri au fost marcate acumulri de
date care erau deficitare sub aspectul interpretrii lor. Procedeele statistice utilizate de psiholog vin,
totodat, n ntmpinarea nevoii de diversificare a metodelor de cercetare, fapt ce conduce la
interpretarea mai adecvat a rezultatelor investigaiilor tiinifice.

Printre lucrrile de importan din ultimele decenii, enumerm pe cele ale lui Fisher, dEgon,
Sharpe, Pearson Jerzy Neyman asupra teoriei testelor i acelea referitoare la estimaii, nscute din
cercetrile empirice asupra aplicrii metodei sondajelor . Apariia unor puternice mijloace de calcul a
permis, pe de alt parte, de a pune n aplicare noi metode de statistic descriptiv (care nu recurg la
modele, nici la ipoteze), aplicabile la marile tabele de date multidimensionale. Aflate n germene la
Charles Spearman i E. Pearson, aceste metode se regrupeaz sub numele de analiz a datelor, fiind
dezvoltate prin H. Hotelling n anii 1930 i n Frana prin J.P. Benzecri n anii 1960.
Actualmente, preocuprile de analiz statistic a datelor din domeniul tiinelor sociale, n general
vorbind, sunt deosebit de intense, realizndu-se progrese teoretice i practice. Sub acest ultim aspect
sunt de remarcat apariia unor programe computerizate destinate uurrii muncii de calcul (cel mai
cunoscut i cel mai utilizat fiind SPSS-ul). Folosirea unor astfel de programe presupune, pentru
exploatarea corect a rezultatelor, cunoaterea fundamentelor teoretice ale statisticii.

95
AUREL STAN

I. STATISTIC DESCRIPTIV

O diviziune fundamental o disciplinei statisticii este n statistic descriptiv i statistic


inferenial, diviziune care ine cont de ordinea istoric a apariiei celor dou ramuri. Statistica
descriptiv s-a constituit n secolele XVII-XIX i se ocup cu descrierea fenomenelor statistice
investigate prin culegerea i clasificarea datelor obinute dintr-o cercetare empiric, realizarea de
rezumate i sinteze cu ajutorul unui limbaj numeric. Este un ansamblu de tehnici permind descrierea
grupurilor de date i luarea deciziilor n absena unei informaii complete. Scopul unui astfel de demers
este de a aduce datele ntr-o form clar i utilizabil. Informaiile de baz produse prin statisticile
descriptive sunt media valorile maximale i minimale, diferite msurri ale variaiei i datele cuprinznd
forma sau configuraia distribuiei variabilelor. Msurrile reprezint comportamente, competene,
obinuine, aptitudini, capacitii sau alte tipuri de conduite care caracterizeaz performanele i
definesc variabilele dependente. n statistic sunt utilizate mai multe metode sunt utilizate pentru
(re)prezentarea organizat a datelor: histogramele, curbele, poligoanele de frecven, diagramele
circulare. Examenul vizual al datelor prin intermediul graficelor constituie o manier economic, simpl
i eficace de a observa distribuia eantionului prin raport la distribuia normal. Calculele realizate n
statistica descriptiv duc la constituirea de valori relative, valori medii, dispersii, abateri. Statistica
descriptiv trebuie considerat ca o etap a demersului statistic ce permite o exprimare cantitativ clar
i coerent a mulimilor de date.

I.1.NOIUNI FUNDAMENTALE

nelegerea aseriunilor statistice este posibil din momentul n care ne nsuim o serie de noiuni
fundamentale. ncepem prin a preciza care sunt noiunile fundamentale n statistic i cu eventuale
precizri referitoare la unele sensuri specifice care opereaz n domeniul statisticii n legtur cu aceste
noiuni.
Una din aceste noiuni este cea de variabil. Este o noiune de care nu ne putem dispensa n
explicaia tiinific, totalitatea studiilor experimentale apelnd frecvent la ea pentru a expune raiunea
acestui demers tiinific, modul de derulare i concluziile trase. Este frecvent folosit mpreun cu
noiunile de variaie i variabilitate. n Grand dictionnaire de la psychologie variabila este definit ca o
entitate abstract care servete ca suport pentru o multitudine de valori2. Proprietatea variabilei de a
lua anumite valori se numete variabilitate, iar oscilaiile valorice ale variabilei poart numele de variaie.
Variaiile pot fi previzibile i imprevizibile. Variaiile sunt considerate previzibile n situaia n care orice

2 Grand dictionnaire de la psychologie, Larousse, 1992, p. 816

96
STATISTIC I

valoare succesiv dintr-o serie poate fi determinat cu precizie sau mcar aproximat. Variaiile sunt
imprevizibile cnd valorile succesive ale unei serii nu pot fi prevzute.
Arthur Reber, autorul unui reputat dicionar de psihologie atrage atenia asupra faptului c, dei
variabila este o entitate care sufer schimbri, ea este de fapt o abstracie, o form, o cantitate3. Astfel,
dac realizm cercetri n domeniul senzaiilor auditive i suntem interesai de intensitatea tonului,
variabila operativ este intensitatea; ntr-un studiu n care avem ca variabil dificultatea unui test,
dificultatea este variabila real. Tonul i testele utilizate sunt doar moduri care permit intensitii i
dificultii s se manifeste. Precizri necesare sunt fcute n matematic i logic unde noiunea de
variabil este surprins mai explicit prin tratarea variabilei ca simbol care reprezint clase de lucruri sau
domenii de valori care satisfac anumite condiii i nu orice lucru sau valoare particular. O valoare
particular a variabilei este denumit modalitate sau variant de variaie. A desemna o variabil
nseamn a-i atribui un nume i a-i indica modalitile pe care le poate lua n cadrul unui sistem bine
precizat. O analiz tiinific se poate realiza doar cu condiia ca obiectul pe care ea se exercit s aib
o structur relativ stabil. Dac modalitile variabilei pot fi ierarhizate dup un anumit criteriu, acestea
poart numele de nivele Variabila este opus constantei, care nu are dect o singur valoare, fix i
nesupus oscilaiei. Definiia unei variabile i a modalitilor sale nu este independent de descrierea
dispozitivului experimental n care a intervine. n funcie de ipoteza sa, cercettorul selecioneaz strile
pertinente ale variabilei pe care el o studiaz. O variabil are cel puin dou modaliti.
Exist dou condiii pe care trebuie s le ndeplineasc o variabil:
1. s fie alctuit dintr-un ansamblu de valori exclusive, n consecin fiecare din elementele
unei variabile nu poate lua dect o singur valoare.
2. ansamblul de valori sau de modaliti ale unei variabile trebuie s fie exhaustiv toate
elementele trebuie s poat fi caracterizate de ansamblul de valori.
Exist un sistem de clasificare a variabilelor care funcioneaz prin considerarea unei serii de
criterii. Vom enumera doar denumirile rezultnd din apelarea la cele mai frecvente criterii.
Astfel, dac lum n consideraie gradul de dependen se distinge ntre variabile independente i
variabile dependente. Distincia ntre variabile dependente i independente este cel mai frecvent
folosit. Variabilele independente (notate curent cu VI) sunt variabile manipulate sau fixate de ctre
experimentator. Mai clar, variabila independent este o caracteristic - a subiectului, a ambianei sale
fizice sau sociale, a sarcinii, a stimulului sau stimulilor prezentai - care este manipulat de ctre
cercettor n scopul de a controla sau de a analiza efectul sau efectele sale asupra comportamentului
studiat4. Variabil independent este orice variabil ale crei valori sunt, n principiu, independente de
schimbrile care au loc cu alte variabile. ntr-un experiment, variabila independent poate fi orice
variabil care este manipulat specific, astfel nct s se observe efecte asupra variabilei dependente.
Variabila independent mai este numit i variabil experimental sau controlat. Variabilele
dependente (notate curent cu VD) sunt variabile observate de experimentator i care fac obiectul unei
msurri. Variabila dependent este orice variabil ale crei valori sunt, n principiu, rezultatul

3 Reber, Arthur S., "Dictionary of Psychology", Penguin Books, London, 1985, pag.811
4 J.-P. Rossi & Al., La mthode exprimentale en psychologie, Dunod, Paris, 1997, pag.22

97
AUREL STAN

schimbrilor care au loc ntr-una sau mai multe variabile independente. n matematic, noiunea de
dependen este exprimat printr-o formul de tipul y = f (x) . Prin aceast form de prezentare a
dependenei se exprim faptul c valorile lui y sunt dependente (sau n funcie de) valorile lui x. n
cercetarea psihologic situaia devine: comportamentul subiectului luat n considerare (y) este
dependent de manipularea unui factor (x). n cercetarea psihologic, variabila dependent este, n
general, un rspuns furnizat de ctre subiect sau o caracteristic a acestui rspuns.
O alt accepiune este aceea c variabila dependent este o variabil care este estimat dintr-o
alt variabil ale crei valori sunt date. Efectul variabilelor independente este observat pe variabilele
dependente. Exemplu: dac ne propunem s cercetm efectul diferitelor forme de psihoterapie asupra
sensibilitii, variabila independent este forma de psihoterapie (terapie psihanalitic, terapie
comportamental, terapie experienial, terapie adlerian, terapie sistemic) i variabila dependent
este efectul asupra sensibilitii pe un anumit plan. Relaia dintre variabila numit independent i
variabila numit dependent este una presupus cauzal. Relaia cauzal trebuie s fie demonstrat, nu
doar afirmat. Pentru demonstrare se cer urmate regulile unei metodologii competent elaborate. n caz
contrar, putem fi robii aparenelor constituite n aa-numitele artefacte.
Calitile unei bune variabile dependente sunt pertinena (variabila dependent trebuie s fie un
indicator pertinent al comportamentului) i sensibilitatea (variabila dependent trebuie s exprime
variaii comportamentale foarte fine).

Ce este o variabil intermediar?

O noiune care se ntlnete n lucrrile de psihologie experimental este cea de variabil


intermediar. Introducerea i utilizarea sistematic a acestei noiuni este atribuit lui Edward
Chase. Tolman, cunoscutul psiholog american specializat n nvarea la animal. El nu prsete
total domeniul behaviorismului, dar modific viziunea acestui curent prin folosirea noiunii de
intenionalitate. n concepia sa, comportamentul este un fenomen molar care permite unei fiine de a
atinge un obiect scop prin alegerea unor mijloace. Acest fapt implic o referin necesare la variabile
intermediare de tip motivaional i cognitiv definite obiectiv. Noiunea de variabil intermediar cunoate
o frecvent utilizare n domeniul nvrii, mai ales n studiile cunoscutului teoretician bahaviorist Clark
Leonard Hull.
n anul 1928, E.C. Tolman enumer dou tipuri de variabile intermediare care se intercaleaz
ntre variabilele dependente i cele independente pentru a determina comportamentele. Variabilele
intermediare cuprinse n primul tip, considerate mai elementare, sunt ereditatea vrsta i educaia i
sunt direct legate de variabilele independente. Cele din al doilea tip sunt nevoile, dorinele, atitudinile i
ipotezele, fiind considerate mai complexe, n calitate de combinaii ntre anumite variabile independente
i variabile intermediare elementare. Actualmente, variabilele intermediare din prima categorie sunt
tratate ca variabile independente.
Introducerea acestor variabile i are raiunea n dificultile teoretice ale curentului behaviorist
strict, n care domina schema S-R (stimul-reacie). n aceast schem, ereditatea, vrsta i educaia nu

98
STATISTIC I

descriu nici stimulul, nici rspunsul. A doua categorie de variabile intermediare este constituit din
nevoi, dorine, atitudini, ipoteze care nu pot fi controlate de ctre experimentator.

J.P. Rossi consider c exist o a treia categorie de variabile intermediare care trimite la
mecanismele intermediare5. Astfel, activitatea de organizare care permite de a reine mai bine o list de
cuvinte a fost adesea clasat n rubrica variabilelor intermediare, deoarece activitatea de structurare
este un tratament care se situeaz ntre S i R. Paul Fraisse a insistat n studiile sale asupra faptului c
rspunsul este funcie a interaciunii ntre situaie i personalitatea subiectului.
Jean-Franois Le Ny consider n Grand dictionnaire de la psychologie c noiunea de variabil
intermediar poate fi definit ca o variabil ipotetic presupus a fi funcie a unei variabile de
ambian i ca determinnd direct o variabil de comportament6.
Astfel, noiunea lui C.L. Hull i a teoreticienilor behavioriti, n general, de for a motivaiei
(Drive) era considerat, pe de o parte, ca fiind o funcie direct a duratei de privare (de hran, butur
etc.) i, pe de alt parte, ca determinnd n mod direct vigoarea comportamentului.

Totui, noiunea de variabil intermediar este puin utilizat astzi lucru datorat modului n
care sunt privite aspectele care in de persoan. Aceste aspecte sunt, de fapt, mecanisme interne. De
exemplu, s-a artat c organizarea informaiei permite o mai bun reinere a unei liste de cuvinte.
Activitatea de organizare este o variabil intermediar. Ea presupune o tratare a informaiei i constituie
un intermediar ntre S i R. Din momentul introducerii modelelor de tratare a informaiei, noiunea de
variabil intermediar i-a pierdut raiunea de a exista. Astfel, putem vorbi de variabile independente,
variabile dependente, stri ale subiectului i procese se tratare a informaiei. Acestea din urm sunt mai
mult ipotetice dect intermediare.
Dac lum n consideraie natura i fineea variaiei, atunci vorbim de variabile discrete i
variabile continue. Cele discrete sau discontinue sunt variabilele ale crei valori posibile sunt n numr
limitat i sunt exprimate prin valori izolate, nedifereniate. De obicei, pentru a le exprima se folosesc
numere ntregi. De exemplu, variabila numrul de persoane care locuiesc ntr-un apartament este o
variabil discret. Aceast variabil poate lua valorile 1, 2, 3, 4 .a.m.d., dar nu valoarea 2,5 sau 3,7. O
variabil este continu n cazul cnd are teoretic un numr nelimitat de variante. Ca atare, ntre dou
variante de variaie succesive se poate interpune o a treia. Dac msurarea se realizeaz n centimetri,
ntre valoarea 2 cm i 3 cm se poate interpune valoarea 2,5 cm.

5 idem pag.45
6 Grand dictionnaire de la psychologie, Larousse, 1992, p. 816

99
AUREL STAN

Continuitate versus discontinuitate

Arthur S. Reber precizeaz c ideea de continuitate se refer la absena unor ntreruperi,


pauze sau etape (n cazul existenei unor etape acestea sunt foarte mici i astfel,
nedetectabile)7. Discontinuitatea este opusul continuitii. Autorul englez spune c
discontinuitatea este prezent atunci cnd nu sunt reprezentate toate valorile posibile8. El
explic prezena ghilimelelor prin faptul c situaia este mai delicat n legtur cu reprezentarea
valorilor. Astfel, este posibil ca variaia s se manifeste ca o serie de valori discrete (discontinue) care,
de fapt, prezint o variaie subiacent continu. Reber ia ca exemplu nlimea variaia valorilor luate
de nlime este discontinu fiind msurat n uniti discrete (de obicei cm), dar subiacent, este
prezent o variaie continu ntruct putem avea toate nlimile posibile. Diferena se observ mai bine
atunci cnd opunem variaia aparent discontinu cu una ntr-adevr discontinu cum este numrul de
erori de nvare n cadrul unui experiment. Este adevrat c n msurtorile pe care le efectum,
depindem foarte mult de precizia instrumentului de msur utilizat. Astfel, timpul de reacie este o
variabil continu, dar poate prea discret dac folosim un cronometru clasic care msoar doar
secundele. Instrumentele moderne pot evidenia un numr foarte mare de posibilitii ntre 25 de
secunde i 26 de secunde, dac pot evidenia zecimile, sutimile, miimilor, milionimile de secund.
Dac nu avem instrumente perfecionate de msur, distincia dintre variabilele continue i cele discrete
poate deveni arbitrar. Cele mai multe din variabilele utilizate n psihologie (n special scorurile testelor
i chestionarelor psihologice) sunt discrete.

O distincie frecvent utilizat se face ntre variabilele dihotome sau dihotomice i variabilele
polihotome sau polihotomice. Variabilele dihotomice sunt variabile care au dou 2 modaliti: adevrat -
fals; corect-incorect; da nu, prezen-absen, acord dezacord; masculin-feminin etc., i care
primesc, de obicei , valorile numerice 1 - 0.

Real i artificial n dihotomie

Dany Laveault i Jacques Grgoire9 fac diferena ntre variabile real dihotomice i artificial
dihotomice. O variabil real dihotomic presupune mprirea natural n 2 categorii (de
exemplu, variabila sex are natural dou modaliti: masculin (care se poate nota cu 1) i feminin
(care se poate nota cu 0), iar variabilele artificial dihotomice corespund transformrii
convenionale a valorilor variabilelor polihotomice (continue sau discontinue). De exemplu, n urma
aplicrii unui test subiecii dintr-un grup, acetia pot obine iniial note ntre 1 i 40, dar, ulterior, acetia
pot fi mprii n 2 subgrupe: cei care au scoruri mai mici dect mediana sunt ncadrai n subgrupul A

7 Reber, Arthur S., "Dictionary of Psychology", Penguin Books, London, 1985, pag.811
8 idem
9 Dany Laveault & Jacques Grgoire, Introduction aux theories des testes en sciences humaines, De Boeck Universite,

1997, pp. 234235

100
STATISTIC I

cu rezultate slabe (scoruri uniformizate prin notarea cu 0), iar cei cu scoruri peste median intr n
subgrupul B cu rezultate bune (uniformizate prin notarea cu 1). Aceast mprire poate fi fcut i n
funcie de existena unei valori criteriu, care mparte grupul iniial n reuii (notai cu 1) i nereuii
(notai cu 0). Criteriul de dihotomizare poate avea i un caracter convenional.

O distincie cu care se opereaz frecvent este cea ntre variabile cantitative i variabile
cantitative. n primul caz exprimarea variantelor sau modalitilor variabilelor se face prin intermediul
numerelor (timp, greutate, lungime), n al doilea caz prin intermediul atributelor (apartenen etnic,
religioas, sex). Variabila cantitativ timp de reacie va putea avea ca variante sau modaliti 23; 25; 19;
30 sutimi de secund, pe cnd variabila calitativ apartenen religioas va avea ca modaliti: ortodox,
catolic, protestant, mahomedan, budist etc.

Variabile calitative Variabile cantitative


Sex (masculin, feminin) Performan fizic sau psihic msurat
Culoarea ochilor (albatri, cprui, verzi,etc. (Q.I.= 101,sau Q.I.= 83)
Vrsta ( 17,19 23 etc.)
Tabelul I. Exemplificri pentru variabile calitative i variabile cantitative

O clasificare prezent n studiile experimentale este n funcie de posibilitatea cercettorului de a


manipula apariia modalitilor variabilei pe care el o studiaz. Vorbim n acest caz de variabile
provocate i de variabile invocatei. Modalitile primei variabile ale acestui criteriu de clasificare pot fi
create de ctre experimentator, n sensul c st n puterea acestuia de a le manevra. De exemplu,
variabila intensitate sonor poate avea n cadrul unui experiment trei modaliti sau stri: slab, medie,
puternic. n funcie de interesul tiinific, experimentatorul poate varia cele trei stri, poate s provoace
aceste stri. Dar dac interesul tiinific se manifest n privina coeficientului intelectual, nu mai st n
puterea experimentatorului de a manevra fora intelectual a cuiva. n acest caz, variabila coeficient
intelectual este invocat, cercettorul putnd doar cuta i mobiliza pentru un studiu persoane care au
diferii coeficieni intelectuali (ex. 75, 90, 100,105).
O noiune indispensabil pentru exprimarea statistic este cea de unitate statistic, avnd sensul
de element al unei mulimi statistice. Un termen similari este cel de individ statistic. Unitile statistice
pot fi indivizi umani sau obiecte care sunt purttori ai unei anumite caracteristici ce prezint interes
pentru o anumit cercetare. Mulimea statistic poate fi o populaie statistic, adic totalitatea indivizilor
care satisfac exigenele unei anumite definiii riguros formulate, sau un eantion, un subansamblu de
indivizi ai populaiei care are caracteristica de a fi reprezentativ, adic din analiza acestuia este permis
de a se trage aproximativ aceleai concluzii ca i din analiza ntregii populaii. Eantionul este un
univers redus al populaiei. Raportul dintre populaie i eantion statistic este mai bine exprimat prin
raportul dintre mulime i submulime. Selecionarea indivizilor dintr-o populaie pentru constituirea unui
eantion poate fi aleatorie sau conform unui algoritm de selecie. n procedura aleatorie de selecie,
orice individ trebuie s aib anse egale de a fi ales. ntr-o oper aprut postum, intitulat Ars

101
AUREL STAN

conjectandi, matematicianul elveian Jacques Bernoulli, unul din clasicii teoriei probabilitilor, a artat
c o tragere la sori corect fcut permite de a obine un eantion care s aib caracteristici similare
acelora ale populaiei. Deci, nu orice grup de indivizi formeaz un eantion, ci doar acel grup constituit
prin respectarea unor reguli riguroase. Cnd ntr-un studiu ntlnim termenul de lot sau de grup, trebuie
existe suspiciunea c acesta a fost compus prin apelarea la o procedur de extragere care nu respect
strict metodologia de constituire a eantioanelor. Biais-ul, termen ce s-a impus n ultima perioad n
limbajul tiinific cu semnificaia de eroare sistematic, mrete riscul de a proceda la generalizri
eronate. Populaiile pot fi finite, cnd mrimea sa este riguros delimitat cantitativ, i infinite cnd
mrimea lor nu poate fi determinat cu precizie sau este n continu cretere cu o rat imprevizibil.
Populaia poate fi definit extensiv, atunci cnd elementele sale pot fi listate (de exemplu, lista nominal
a pensionarilor dintr-un cartier din Iai). Definirea intensiv a populaiei presupune indicarea principiului
care st la baza constituirii sale (exemplu, toi elevii liceului Mihai Eminescu din Iai din primul
semestru al anului 2003).

Variabilele nu descriu indivizii statistici n ansamblul lor, ci prin intermediul unor caracteristici. O
caracteristic este o proprietate a unei uniti statistice care prezint interes pentru o anumit cercetare.
Individul statistic este purttor al unei caracteristici. Aceast caracteristic este descriptibil printr-un
ansamblu de reliefri ale caracteristicii. Aceste reliefri sunt variantele de variaie sau modalitile.
Caracteristica pe care noi ne propunem s o descriem statistic poate fi manifest, n cazul n care poate
fi descris sau msurat n mod direct (greutatea corporal, culoarea ochilor, sexul, nivelul veniturilor)
sau latent (voalat), n cazul n care poate fi msurat doar indirect. De exemplu, dac ne propunem
s examinm introversiunea, aceasta nu se poate face n mod direct, ci prin intermediul unei ntregi serii
de semne ale introversiunii detectabile prin ntrebrile unui chestionar sau prin analiz clinic. O
caracteristic este operaional definit atunci cnd se poate decide care sunt reliefrile caracteristicii
respective. Practic, din punct de vedere psihologic, operaionalizarea este traducerea unui concept
teoretic n comportamente observabile. Calitatea tiinific a unor cercetri depinde foarte mult de
calitatea operaionalizrii conceptuale care se realizeaz n cursul realizrii lor.
Este necesar s facem i cteva precizri asupra variabilitii, n scopul de a evidenia aspecte
care sunt frecvent ntlnite n studii tiinifice. Variabilitatea este intraindividual atunci cnd se
raporteaz la diferenele existente ntre momentele sau situaiile diferite n care se afl acelai individ.
De exemplu, atunci cnd se cerceteaz timpul de reacie la aceeai persoan n momente temporale
diferite, se pot obine valori diferite. Diferena dintre cea mai mic i cea mai mare variant de variaie
poart numele de amplitudine de variaie sau de plaj de variaie. Variabilitatea interindividual face
referire la diferenele existente ntre indivizi (desigur, referindu-se la aceeai caracteristic).
Variabilitatea intragrup caracterizeaz oscilaiile valorice n cadrul unui grup bine precizat i
variabilitatea intergrup caracterizeaz aceste oscilaii la nivelul indicatorilor aparinnd la grupuri diferite.
Indicatorii statistici nu sunt doar simple valori ale variabilei, ci valori reprezentative care caracterizeaz
ansamblul valorilor unui grup.

102
STATISTIC I

Variabile i factori.

Termenii tiinifici de variabil i factor sunt des folosii ca sinonimi ceea ce poate crea o
serie de confuzii. n esen, orice factor poate fi o variabil, dar nu orice variabil poate fi un
factor. Nu exist o coresponden perfect ntre variabil i factor. n unele lucrri tiinifice,
termenul factor este folosit abuziv.
n general, prin factor se nelege orice are o influen cauzal, un anumit efect asupra unui
fenomen. n acest sens factorul este considerat o condiie antecedent sau o cauz. Prin extensie,
factorul poate fi considerat o variabil independent. Acest sens e propriu procedurilor statistice bazate
pe analiza de varian. Distincia ntre factori sistematici i aleatori este fundamental. Factorul este
sistematic, n cazul n care alegerea modalitilor poate fi sistematic, i aleatoriu, n cazul n care
modalitile sale sunt stabilite prin tragere la sori. O convenie frecvent respectat este aceea de a
denumi factorul printr-o liter majuscul i o cifr care indic numrul modalitilor. De exemplu, n
cadrul notaiei S3 desemnm prin S factorul studii i prin 3 numrul de modaliti. Desemnarea
nivelelor se face prin utilizarea literelor minuscule: s1= studii superioare, s2=studii medii i s3=studii
generale. Prin convenie factorii aleatorii sunt subliniai. Factorii crora experimentatorul vrea s le
studieze efectele sunt numii principali, iar cei pe care experimentatorul trebuie s-i controleze pentru c
el tie c acetia au un efect asupra fenomenului studiat sunt numii secundari.
Factorul poate fi unul din rezultatele unei analize factoriale, termen care nu reprezint un concept
unitar, ci mai curnd este utilizat ca termen umbrel pentru un numr de proceduri statistico-matematice
care-i propun s localizeze un numr mai mic de dimensiuni clusteri sau factori ntr-un set mai mare
de variabile independente sau itemi. Primul element distinctiv al unei analize factoriale este reducerea
datelor. Analiza factorial este o reacie contra beiei de cuvinte n cercetarea psihologic care tinde s
considere c oamenii i aciunile umane au attea caliti cam cte adjective i atribute exist ntr-o
limb. A exprima mult prin puin, principiul parcimonieii, este esenial n analiza factorial, indiferent de
formele pe care le mbrac aceast analiz. Ca atare, factorul este o variabil subiacent care st la
baza variaiei altor variabile, este o esen ireductibil i irepetabil care servete de suport lumii
fenomenologice cu o mare varietate de manifestri.

103
AUREL STAN

II. GRUPAREA I SISTEMATIZAREA DATELOR

II.1.MSURAREA N PSIHOLOGIE

O prim ntrebare care se pune atunci cnd abordm problema prelucrrii datelor obinute ntr-o
cercetare psihologic este: haina numeric se potrivete la fel de bine exprimrii rezultatelor ca n
domeniul fizicii, chimiei, biologiei, sau are un anumit specific care trebuie lmurit? n esen, trebuie s
stabilim dac faptul psihic este la fel de bine fundamentat cantitativ ca n domeniile amintite. Dezbaterile
pe aceast tem dureaz de secole, opunnd la nceputurile lor concepia lui Immanuel Kant i celei
aparinnd lui Johann Herbart. Prima concepie susine c psihologia nu va ajunge niciodat tiin
experimental, deoarece faptul psihic nu posed dect o singur variabil, timpul. A doua concepie
susine c psihologia va putea deveni experimental i cantitativist, ntruct posed pe lng variabila
timp i variabilele intensitate i calitate. Dezbaterile pe aceast tem nu au ncetat, fiind sintetizate
foarte bine ntr-o lucrare de erudiie a lui Vasile Pavelcu: Ambele atitudini sunt fireti cci, dac am
aplica metrismul matematic la prerile nsei, ivite n rndul oamenilor de tiin, cu privire la psihologia
matematic, am constata abateri statistice naturale, att n sens pozitiv, ct i n cel negativ, fa de
medie. Extremele sunt egal de primejdioase pentru dezvoltarea unei tiine. O ncredere exagerat,
nejustificat suficient ntr-o metod, duce fatal spre dezamgirea i prsirea total a acesteia. Un
scepticism anticipat, i la fel de nejustificat, bareaz drumul ncercrilor i verificrilor, fr de care nu
putem face dovada tiinific10.
Rspunsul la ntrebarea anterioar presupune o scurt incursiune n domeniul teoriei msurrii.

Nevoia de msurare a venit odat cu apariia i dezvoltarea cercetrii experimentale n


psihologie. Pentru a fi considerat tiinific, cercetarea psihologic trebuie s se supun rigorilor
care domina tiinele cu un statut bine precizat, cum sunt fizica, fiziologia i chimia, n care
experimentul era frecvent practicat. Promotorii experimentului psihologic considerau c prin
intermediul acestuia psihologia se deprteaz de viziunea speculativ i adera la exigenele spiritului
pozitiv, atotputernic la sfritul secolului XIX i nceputul secolului XX, perioad n care avntul
cercetrii experimental-psihologice a fost foarte pronunat. Personalitile dominante n aceast
perioad au fost E.H. Weber, G.T. Fechner, W. Wundt, H. Ebbinghaus, H. Helmholtz, S. Hull, J.McK.
Cattell. Domeniul n care aceti savani au lucrat a fost unul relativ ngust, cel al structurilor psihice
elementare (senzaii, percepii). ncercrile de a extinde tehnicile experimental-statistice la fenomene
psihice complexe a dus la apariia unor eecuri i nereuite n cercetare. Perfecionarea tehnicilor de
investigaie s-a fcut paralel cu progresul concepiilor psihologice i a aparatului statistico-matematic.
Necesar cercetrilor complexe n care interrelaionarea era complex. Cercettori precum Ch.

10Vezi Pavelcu, Vasile Problema msurii n psihologie, Extras din Cercetri pedagogice, vol. I, 1943. Tipografia Alexandru A.
Terek, Iai, pag.3.

104
STATISTIC I

Spearman, H.P. Kelley, H. Hotteling, L.L. Thurstone, C. Burt, L. Guttman, S.S. Stevens au perfecionat
i rafinat concepia de cercetare n psihologie i au elaborat tehnici cantitative complexe, aa cum este
analiza factorial. ntr-o lucrare clasic de psihometrie, care se menine n actualitate, Nicolae
Mrgineanu red complexitatea situaiei cercetrii din domeniul psihologic: Una dintre caracteristicile
de baz ale tiinei contimporane, n opoziie cu tiina antebelic i mai ales cu aceea a secolului
trecut, e de a nu te mulumi numai cu studiul relaiilor dintre diferite, ci de ncerca i studiul structurii i
configuraiei acestor relaii. Relaia nu e torul; ea e ntotdeauna o parte i un aspect dintr-un sistem. Ori
acest sistem nu pare a fi indiferent pentru relaie; pentru ca sensul relaiei s fie prins n ntregime,
relaia trebuie raportat i la el. Sistemul pare chiar s aib ultimul cuvnt, proprietile de baz ale
relaiilor nefiind dect funciuni ale sale.11

A msura nseamn a aloca numere lucrurilor i fenomenelor conform unor reguli. Fr o


concepie clar asupra realitii msurabile nu se poate vorbi de precizie i de apreciere cantitativ a
fenomenelor. Pentru depirea unei concepii rigide s-a ajuns la o concepie nou privind puterea
msurrii, elaborndu-se gradiente ale forei de msurare. A luat astfel natere concepia scalelor de
msur. Elaborarea teorie scalelor de msur nu reprezint doar un compromis, o convenien, ci o
adaptare la realitii msurabile specifice i complexe.
Problema scalelor de msur. n sens general, o scal este o procedur sau un plan ce permite
aranjarea obiectelor sau evenimentelor n serii progresive. n sens concret, o scal este un instrument
sau un dispozitiv ce permite ordonarea numeric a obiectelor sau fenomenelor prin determinarea unei
valori proprii. n examinarea psihologic, scala desemneaz un instrument de examinare sau testare
psihologic care posed itemi i sarcini structurai n legtur cu o anumit dimensiune. n acest ultim
sens, avem scala metric a inteligenei Binet-Simon, scala de performan Grace-Arthur. Scala de
dezvoltare A.L. Gessel. Exist scale de atitudini, de preferine, de inteligen.
Valorile pe care le obin variabilele n cursul unor procese de msurare nu au aceeai putere
informaional, adic nu comunic la fel de profund n privina anumitor caracteristici pe care le
studiaz. Neglijarea acestui aspect poate duce la apariia unor confuzii n interpretarea rezultatelor unor
cercetri. Este foarte important de a preciza pe ce scal de msur pot fi apreciate valorile unei
variabile i dac operaiile sau tratamentele statistice sunt pertinente, adic dac sunt adaptate,
ajustate proprietilor specifice ale unei anumite scale.
Practic, scala de msur este un instrument de msur care prezint anumite gradaii dup care
se ghideaz cel care dorete s fac aprecieri n procesul de msurare dintr-un anumit domeniu. n
sens strict scala de msur presupune c modalitile sau valorile sunt cel puin ordonate, deci exclude
observaiile care sunt doar calitativ diferite. n sens larg, scala de msur se raporteaz i la observaii
care pot fi doar calitativ diferite.
Crearea i fundamentarea teoretic a scalelor de msur sunt legate de numele cercettorului
englez S.S. Stevens care, n anul 1946, a stabilit 4 niveluri sau tipuri de scale de msur, inegale n
privina puterii: msuri nominale, ordinale, de interval, i de raport. Ali autori care s-au ocupat de
aceast problem au artat c se pot concepe nenumrate tipuri de scale, dar cea mai mare parte

11 vezi Nicolae Mrgineanu, Elemente de Psihometrie, Ed. Institutului de Psihologie al Universitii din Cluj, 1938

105
AUREL STAN

dintre ele nu au o real semnificaie practic prin diversele grupe de transformri numerice pe care le-ar
presupune12.
Scala nominal (denumiri similare scala categorial sau scala formal) reprezint tipul de scal
care indic cel mai slab grad al msurii. Modalitile scalei nominale sunt definite n aa fel nct fiecare
observaie nu poate fi plasat doar ntr-o singur modalitate. Ea asigur doar simpla difereniere
calitativ a observaiilor fcute de un cercettor. Chiar atunci cnd utilizeaz numere n exprimare
realitii supus msurii, aceast scal nu indic alte proprieti dect acelea de a fi simple etichete
pentru distingerea diferitelor modaliti ale unei variabile. Ea poate asigura identitatea a dou elemente.
La nivelul scalei nominale modalitile X,Y i Z pot fi reprezentate prin 1,2 i 3, sau la fel de bine prin 14,
23, 8. Important este ca aceste simboluri s fie diferite. n acest caz 1 nu este mai mic dect 2 i nici
acesta, la rndul lui, nu este mai mic dect 3. Ele sunt doar simboluri diferite. Observaiile pot fi
exprimate i prin simboluri alfanumerice: a1, a2 i a3 sau chiar prin simboluri pictografice. Astfel de
scale sunt frecvent utilizate n psihologie i, n general, n tiinele sociale, atunci cnd se uzeaz de
clasificri: tipologiile psihologice, nomenclatoarele profesiilor, nosologiile psihiatrice (sisteme de
clasificare a bolilor). De exemplu, variabila categorie socio-profesional poate avea modalitile: elev,
student, funcionar, cadru mediu, cadru superior, patron, manager, omer, pensionar. Prin codificare,
atribuim un simbol distinct fiecrei modaliti a variabilei. Redm ntr-un tabel diferite variante de
codificare: varianta 1-alfabetic, varianta 2-numeric, varianta 3-alfanumeric.
Modalitatea variabilei Varianta 1 Varianta 2 Varianta 3
Elevi A 1 a1
Studeni B 2 a2
Funcionari C 3 a3
Cadre medii D 4 a4
Cadre superioare E 5 a5
Manageri F 6 a6
Patroni G 7 a7
omeri H 8 a8
Pensionari I 9 a9
Tabelul nr.2 Codificri posibile pentru modalitile variabilei categorie socio-profesional n cadrul unei scale
nominale

Recodificarea modalitilor n funcie de variante este corect dac asigur fiecrei modaliti o
notare distinct de a celorlalte, aa cum rezult din tabelul urmtor.
Modalitatea variabilei Varianta 1 Varianta 2 Varianta 3
Elevi C 9 a7
Studeni I 8 a3
Funcionari A 5 a5
Cadre medii D 3 a9
Cadre superioare F 7 a8
Manageri B 1 a2
Patroni E 4 a6
omeri G 6 a4
Pensionari H 2 a1
Tabelul nr. 3 Cuprinde recodificarea corect a modalitilor variabilei Categorie socio-profesional din tabelul 1

12vezi Dick, P., Tournobis, Jocelyne, Flieler, A., Kop, Jeana-Luc, La Psychomtrie, Presses Universitaires de France,
Paris, 1994

106
STATISTIC I

Scala ordinal introduce ordinea ntre elementele unei serii de observaii. Transformrile
efectuate trebuie, de aceast dat, s lase ordinea invariant, neschimbat. ntr-o astfel de situaie
a<b<c i 1<2<3. Ultima serie poate fi nlocuit prin 7;13;19 (care respect ordinea iniial, primul
element mai mic dect al doilea i acesta l, la rndul lui, mai mic dect la treilea, dar nu prin 7;5;15
(care nu o respect). Exemplificrile scalelor nominale n domeniul disciplinelor psiho-sociale sunt, de
asemenea, numeroase (clasele de vrst, nivelurile colare, fazele dezvoltrii intelectuale). Chiar
scorurile brute la probele de aptitudini sau la chestionarele de personalitate, considerate n mod strict,
se ncadreaz n rndul scalelor ordinale. ntr-o astfel de scal putem s spunem c elementul b este
mai mare dect elementul a, dar nu putem s precizm cu ct este mai mare. Cel mai bune exemple
pentru scalele ordinale sunt scalele de atitudini sau scalele de apreciere. Variabila atitudine fa de
fenomenul homosexualitii poate avea urmtoarele modaliti ordonate sau nivele: a) total dezacord; b)
dezacord; c) acord parial; d) acord total. Aceste serie de modaliti este ngheat, n sensul c nu
poate fi schimbat locul ierarhic al unui nivel.
Scala de interval introduc ordinea ntre modalitile unei serii de observaii dar i semnificaia
distanei dintre acestea. Valorile pentru acest tip de scale sunt numerice. Numerele pot fi ntregi
(variabila fiind calificat n acest caz discontinu sau discret) sau s cuprind i valori reale (caz n
care variabila este discontinu, exist posibilitatea interpunerii unei noi valori ntre dou valori
succesive). Exemple de variabile discontinue de interval din domeniul psihologiei: scorurile la itemii
testelor (itemul este o component informaional elementar a unui test sau chestionar); scorurile la
testele sau chestionarele psihologice n ansamblul lor (aptitudini, atitudini). Exemple de variabile
continue de interval din domeniul psihologiei: timpul de reacie verbal, msurarea parametrilor biologici
(n cazul studiilor psihofiziologice). Pentru acest tip de variabil, nu pot exista valori definite n avans. De
aceast dat putem preciza c b este mai mare dect a, dar i cu ct este mai mare. Distana capt
semnificaie. Dac avem 4 elemente (A,B,C,D) egale cu 4,8,12,16 putem preciza c distana dintre
elementele B-C (8-4) este cu 4 mai mic dect distana dintre elementele A-D. Aceste scale au fost
destinate s joace un rol considerabil n psihologie n funcie de dezvoltarea instrumentelor de analiz
care solicit acest nivel de msur.
Scalele de raport. Corespund scalelor pe care Stevens le-a numit scale de interval cu origine
raional. Sunt puin utilizate n cercetarea psihologic. Valorile acestui tip de scal sunt numerice i pot
fi supuse operaiunilor aritmetice. La acest tip de scal se folosete i are sens valoarea nul (0). n
cazul scalelor de interval, valoarea 0 este pur convenional, cum este valoarea 0 a unui termometru. n
cazul scalei de raport, valoarea 0 marcheaz absena unui fenomen, situaie greu de acceptat n
psihologie. Rapoartele nu sunt alterate printr-o transformare de similaritate (adic o transformare liniar
n care b = 0). O reprezentare de acest tip este deci legat de o constant multiplicative.
Menionm scalele nominale i ordinale mai sunt numite i scale calitative, pe cnd scalele de
interval i de raport sunt numite scale cantitative. Scalele, aa cum sunt enumerate anterior, formeaz
un ansamblu ierarhic de la slab la puternic ale crui trepte se disting n privina n privina forei
informaionale. O scal situat pe o treapt superioar are proprietile unei scale inferioar, plus o
serie de proprieti suplimentare. Operaiile i transformrile statistico-matematice care se pot efectua

107
AUREL STAN

n cadrul unei scale sunt condiionate de puterea informaional a scalei respective. Cu ct naintm
spre vrful ierarhiei scalare, cu att numrul de operaii permise este mai mare i transformrile sunt
mai complexe. Pe parcursul lucrrii noastre vom face specificaii necesare n aceast privin, de cte
ori este cazul13.

II.2 CONSIDERAII ASUPRA GRUPRII DATELOR

Operaiile de grupare sunt strict necesare n activitatea de cercetare tiinific efectuat cu


ajutorul unor metode de investigaie specifice psihologiei. Primul lucru asupra cruia ne ndreptm
atenia atunci cnd suntem n faa unor date neordonate rezultate dintr-o cercetare este s ne ntrebm
asupra puterii informaionale a unor astfel de date. Aparin scalei nominale, ordinale, de interval sau de
raport? Fiecare din aceste scale pun probleme specifice de prelucrare, sistematizare i de reprezentare
grafic. n ceea mai mare parte a cazurilor, psihologul se gsete n faa unor valori care sunt de nivelul
scalei de interval, este adevrat, cu respectarea anumitor convenii care confer datelor acest statut. n
funcie de modul de sistematizare a datelor ele ne vorbesc mai mult sau mai puin consistent.
Gruparea. n cazul n care modalitile de care dispunem au valoare scalar nominal sau
ordinal grupare presupune stabilirea frecvenelor specifice fiecrei modaliti. Frecvenele absolute
rezult din nsumarea tipurilor distincte ale modalitilor sau nivelelor. Frecvenele relative traduc
cuantumul procentual al fiecrei frecvene absolut, adic valoarea procentului din total reprezentat de
o anumit modalitate a variabilei. De exemplu, dac ntr-o cercetare ne propunem s grupm variabila
nominal tip de studii superioare, cu modalitile studii umaniste, studii economice, studii tehnice, putem
avea urmtoarea situaie (situaie imaginat):
Nr. crt. Tip de studii Frecvena (f) Frecvena relativ(f%)
1 Studii umaniste 75 56,8%
2 Studii economice 43 32,6%
3 Studii tehnice 14 10,6%
Total N = 132 100%
Tabelul nr.4 Cuprinde modul de nregistrare a frecvenei a modalitilor sau categoriilor unor scale nominale

Frecvena relativ se obine prin nmulirea cu o sut a raportului dintre frecvena relativ i
43
efectivul total. Astfel frecvena relativ 32,5% se obine astfel: 32,5% = * 100 . Frecvenele relative
132
dau o informaie mai precis, mai ales n cazul n care nu se cunoate efectivul total (N =132). Astfel,
frecvena absolut egal cu 43 specific modalitii studii medii nu ne comunic prea mult dac nu tim
cunoatem valoarea 132, pe cnd valoarea 32,6 ne comunic faptul c modalitatea studii medii
cuprinde aproximativ o treime din numrul total al subiecilor.

132pentru informaii suplimentare vezi: Valentin Clocotici, Aurel Stan, Statistic aplicat n psihologie, Editura Polirom, Iai,
2000.

108
STATISTIC I

Pentru variabilele ale cror modaliti se prezint sub form numeric, drumul ordonrii este ceva
mai lung. n acest caz, o mas de cifre neordonat ne transmite foarte puin sens. Exemplificrile pe
care le vom face pe parcursul lucrrii noastre sunt, n cea mai mare parte, specifice cercetrii
psihologice. S presupunem c avem n fa urmtoarele valori rezultate din corectarea unui test
psihologic, mai clar spus avem n fa notele brute obinute de 91 de subieci la testul AD-P (atenie
distributiv Praga), avnd studii medii, vrsta ntre 35-40 ani, provenind din mediul urban:

22 37 56 76 33 48 40 47 58 78
82 50 54 53 47 54 55 62 69 29
43 59 70 55 53 48 36 66 72 53
46 35 43 58 52 50 57 72 29 35
53 43 39 35 48 55 33 38 43 47
43 49 56 38 32 49 55 60 67 56
64 50 26 69 78 55 53 38 47 55
66 73 50 63 62 46 28 64 63 40
42 61 67 63 46 42 68 59 55 57
55

Menionm c ansamblul valorilor unei variabile poart numele de distribuie. Exist distribuii
teoretice, denumire care indic faptul c valorile sunt repartizate conform rigorilor unui anumit model
matematic de distribuie, i distribuii empirice, rezultate din cercetri concrete. n cazul nostru de
exemplificare, vom opera pe o distribuie empiric. n momentul n care ordonm datele cresctor,
ansamblul valorilor ncepe s capete un sens pentru cei care i propunem s le cerceteze. Prezentm,
n continuare, ordonarea acestor date. Putem observa cu uurin care este cea mai mic i care este
cea mai mare valoare a variabile pe care o notm cu X (care reprezint performana unor subieci la
testul AD-P), deci extremele performanelor.

22 26 28 29 29 32 33 33 35 35
35 36 37 38 38 38 39 40 40 42
42 43 43 43 43 46 46 46 47 47
47 47 48 48 48 48 49 49 50 50
50 50 52 53 53 53 53 53 54 54
55 55 55 55 55 55 55 55 56 56
56 57 57 58 58 59 59 60 61 62
62 63 63 63 64 64 66 66 67 67
68 69 69 70 72 72 73 76 78 78
82
Avem n total 91 de rezultate ale subiecilor. n acest caz, valoarea 1 este numit volumul
distribuie. Se noteaz cu N. Dup aceast ultim ordonare putem s efectum o grupare a datelor,
operaiune care se poate avea dou opiuni:
1. Gruparea pe variante de variaie;
2. Gruparea pe intervale de variaie.
Este un tip de ordonare care poate are cea mai larg rspndire, indiferent de domeniu. Unele
domenii i impun o serie de modele proprii de prezentare a datelor, funcie de particularitile tipului de
cercetare (date rezultate n urma unei observaii, date rezultate dintr-un experiment, date rezultate dintr-
o anchet).

109
AUREL STAN

II.2.1. Gruparea pe variante de variaie.

n cazul n care optm pentru primul fel de grupare, stabilim ct de frecvente sunt valorile diferite
pe care le-au obinut subiecii, adoptnd o ordonare ascendent sau descendent a valorilor distincte.
Rezultatele unei variabile care nu au suferit nc tratamente de transformare valoric poart numele de
valori brute sau note brute. Dac aceast operaiune este efectuat empiric, se ordoneaz cresctor
sau descresctor aceste valori, apoi se parcurge ntreaga serie de valori neordonate i se trage cte o
linie ori de cte ori ntlnim o valoare identic. n exemplul nostru ordonarea este ascendent. Pentru o
bun citire a rezultatelor gruprii empirice se realizeaz grupri de cte 5 valori identice, prin a 5-a linie
se bareaz 4 liniue anterioare. Tipul de marcare IIII cuprinde 5 valori identice ale variabilei.
Nota brut Marcare Fr Nota brut Marcare Fr. Nota brut Marcare Fr.
22 I 1 47 IIII 4 63 III 3
26 I 1 48 IIII 4 64 II 2
28 I 1 49 II 2 66 II 2
29 II 2 50 IIII 3 67 II 2
32 I 1 52 I 1 68 I 1
33 II 2 53 IIII 5 69 II 2
35 III 3 54 II 2 70 I 1
36 I 1 55 IIII III 8 72 II 2
37 I 1 56 III 3 73 I 1
38 III 3 57 II 2 76 I 1
39 I 1 58 II 2 78 II 2
40 II 2 59 II 2 82 I 1
42 II 2 60 I 1
43 IIII 4 61 I 1
46 III 3 62 II 2
Tabelul nr.5 Conine ordonarea pe variante de variaie i marcrile corespunztoare ale frecvenei valorilor

Asemenea contorizri ale datelor se realizeaz n momentul n care tindem s realizm o analiz
foarte amnunit, deci cnd ntr-o cercetare opereaz un spirit analitic pronunat. n momentul n care
urmrim observarea tendinei centrale a datelor, atunci efectum o grupare pe intervale de variaie.
Problema care se pune n acest caz este aceea a numrului optim de intervale n care pot fi grupate
datele avute la dispoziie.

II.2.2. Gruparea pe intervale de variaie


Aceasta poate lua forma intervalelor egale sau inegale. n majoritatea cazurilor n cercetrile
psihologice gruparea se face pe intervale egale.
Gruparea pe intervale de variaie presupune urmtoarele etape:
alegerea sau determinarea mrimii intervalului de variaie. Mrimea intervalului de variaie depinde
de amplitudinea i de numrul de grupe sau de clase dorit. Amplitudinea unei distribuii este
distana dintre cea mai mare i cea mai mic valoare. Vom nota cu A amplitudinea distribuiei,
notaie acceptat n mare parte de autorii de specialitate. Formula de calcul este urmtoarea:
A = Xmax-Xmin+1, n care: Xmax reprezint cea mai mare valoare i Xmin cea mai mic valoare. n
cazul nostru concret X max = 82, X min = 22. Procednd la calculare vom avea A = 82 22 + 1 = 61.
Cifra 61 ne spune c ntre cea mai mare i cea mai mic valoare se gsesc teoretic 61 de valori
ale variabilei distincte una de alta. Distribuiile empirice (rezultate n urma unor cercetri concrete)
nu au, de obicei, toate variantele posibile. n exemplu nostru lipsesc valorile variabilei egale cu 23,
24, 27 etc. Practic, avem un numr de 43 variante distincte ale variabilei. Notm cu i mrimea unui

110
STATISTIC I

A
interval, mrime care se calculeaz dup urmtoarea formul: i = , n care A este amplitudinea
k
distribuiei, iar k este numrul de intervale n care dorim s mprim distribuia. De exemplu, dac
dorim s facem o mprire a distribuiei valorilor n 9 intervale vom avea urmtorul rezultat:
61
i= = 6.77. Dac valorile concrete ale variabilei nu conin zecimale vom proceda la ntregirea
9
valorii i, care se face totdeauna prin adugire. Deci, n urma ntregirii, i = 7. Dac ntregirea s-ar
face prin scdere, ar rmne valori n afara intervalelor, valori nealocate unor intervale. Dar, dac
vom considera mrimea unui interval egal cu 7, vom mri artificial mrimea amplitudinii cu 2,
deoarece 9 7 = 63. Pentru a mpri ponderat diferena la cele dou capete ale distribuiei vom
ncepe primul interval de la 21 i ultimul interval va avea valoarea superioar egal cu 83, deci va fi
mai mare cu 1.
Crearea tabelului cu intervale. Intervalele care rezult sunt urmtoarele:
1 2 3 4 5
Nr.crt. Interval Centru interval Marcare Frecvena
1. 21 27 24 II 2
2. 28 34 31 IIII I 6
3. 35 - 41 38 IIII IIII I 11
4 42 - 48 45 IIII IIII IIII II 17
5. 49 - 55 52 IIII IIII IIII IIII II 22
6. 56 - 62 59 IIII IIII III 13
7. 63 - 69 66 IIII IIII II 12
8. 70 - 76 73 IIII 5
9. 77 - 83 79 III 3
Total N = 91
Tabelul 6. Conine gruparea pe variante de variaie i marcarea frecvenelor valorile pentru fiecare interval
Pe lng rubricile cuprinznd numrul curent i mrimea intervalului au fost trecute, pentru o mai
bun nelegere a tabelului, rubrici cuprinznd marcarea variabilelor componente ale unui interval i
frecvena acestora pe un interval. La o prim privire, intervalele creeaz impresia c au valoarea 6, i
nu 7, cum am anunat anterior. Dar aceste intervale includ limita inferioar i limita superioar. Intervalul
2127 conine urmtoarele valori teoretice: 21,22,23,24,25,26,27. Deci, are 7 componente numerice
distincte. n unele cazuri se face precizarea dac limitele intervalelor sunt sau nu incluse n interval sau
se face precizarea care sunt limitele reale ale intervalelor, n cazul existenei unor valori zecimale.
Astfel, intervalul 21 27 poate avea limita inferioar 20,5 i limita superioar 27,5 dac am fi avut
zecimale.. Ca atare, dac am fi ntlnit valorile 20,7 sau 27,3 le-am fi marcat la intervalul anunat
anterior. Centrul intervalului se obine prin mprirea la 2 a adiiei valorii limitei inferioare a intervalului i
a celei superioare. Astfel la intervalul nr.1, centrul intervalului, egal cu 24, s-a obinut n felul urmtor: 24
21 + 27 48
= = . Stabilirea centrului intervalului poate fi util pentru uurarea unor calcule, situaie n
2 2
care centrul intervalului este considerat o valoare reprezentativ a intervalului.
O problem care se pune la gruparea pe intervale de variaie este aceea a numrului optim de
intervale n care se divizeaz distribuia. Exist n aceast privin o serie de formule de calcul i de
tabele fixnd numrul de intervale. n primul rnd amintim formula lui H.D. Sturges; care fixeaz

111
AUREL STAN

X max X min
mrimea intervalului i = 1 + 3 . 22 lg N n care Xmax este cea mai mare valoare a distribuie,

Xmin - cea mai mica valoare i N - numrul total de rspunsuri ale subiecilor. Dup ce am stabilit
mrimea intervalului se poate determina foarte uor numrul de intervale Pentru valori nu prea mari ale
lui N (sub 100) se folosete formula Hahn-Shapiro: k=Int(N/5), n care k exprim numrul de intervale,
INT exprim partea ntreag a expresiei numerice din parantez (ntregire prin scdere, de exemplu,
INT (3,7)=3). Ilie Puiu Vasilescu exemplific, n una din lucrrile sale consacrate statisticii aplicate, o
serie de tabele care indic numrul de intervale n funcie de numrul de subieci14. Redm, n
continuare, unul din aceste tabele, i anume tabelul lui Bendat i Piersol:
N 200 400 600 800 1000 1500 2000
K 16 20 24 27 30 35 39
Tabelul 6. Tabelul Bendat Piersol referitor la numrul optim de intervale n care se pot diviza distribuiile

n acest tabel prin n s-a notat numrul r de rspunsuri ale subiecilor la o anumit solicitare i prin
k numrul de intervale necesare. Astfel, la 200 de subieci sunt necesare 16 intervale, ntre 201 i 400
sunt necesare 20 de intervale, ntre 401 i 600 avem nevoie de 24 de intervale, .a.m.d. n practic
gruprii datelor pe un numr relativ mic de rspunsuri (n jur de 100) se realizeaz 7; 9; 11; 13 intervale.
Numrul de intervale este impar, fapt ce pune mai bine n eviden tendina central.
n urmtoarea etap se realizeaz un tabel cu frecvenele i alte rubrici necesare efecturii
calculelor statistice. Tabele se elaboreaz conform unor reguli. Aceste reguli15 sunt:
1. s faciliteze percepia rapid i exact a informaiilor prezentate;
2. s cuprind numai informaii strict necesare caracterizrii fenomenului studiat;
3. s aib un titlu scurt, clar, care s sintetizeze coninutul informativ al datelor;
4. s fie numerotate pentru a putea fi identificate uor n textul de analiz,
5. s fie nsoite de note explicative care s explice noiunile cu mai multe sensuri;
6. notele explicative trebuie s explice sursa datelor;
7. liniile i coloanele tabelului trebuiesc numerotate pentru a putea fi identificate uor in text;
8. n tabele nu se admit rubrici incomplete.

Exemplificm rubricile cu frecvene pe datele anunate de noi anterior:


Nr.crt. Interval f f% fc fc fc fc%
1 21 27 2 0,02 (2%) 2 0,02 (2%) 91 1,00 (100%)
2 28 34 6 0,07 (7%) 8 0,09 (9%) 89 0,98 (98%)
3 35 41 11 0,12 (12%) 19 0,21 (21%) 83 0,90 ( 90%)
4 42 48 17 0,19 (19%) 36 0,40 (40%) 72 0,78 ( 78%)
5 49 55 22 0,24 (24%) 58 0,64 64%) 55 0,59 ( 59%)
6 56 62 13 0,14 (14%) 71 0,78 (78%) 33 0,36 ( 36%)
7 63 69 12 0,13 (13%) 83 0,91 (91%) 20 0,22 ( 22%)
8 70 76 5 0,05 (5%) 88 0,97 (97%) 8 0,09 ( 9%)
9 77 83 3 0,03 (3%) 91 1,00 (100%) 3 0,03 ( 3%)
Total N=91 1,00 (100%)
Tabelulul nr.7 Cuprinde intervalele de variaie i tipurile de frecvene

14 Vezi Vasilescu, Ilie Puiu, Statistic informatizat pentru tiinele despre om, Editura militar, Bucureti, 1991, pag. 27
15 Vezi Porojan, Dumitru Statistica i teoria sondajului Casa de editur i pres ansa SRL, Bucureti, 1993, pag. 39

112
STATISTIC I

Legend:
f = frecven simpl sau frecven absolut;
f% = frecven simpl relativ;
fc = frecven cumulat ascendent;
fc% = frecven relativ cumulat ascendent;
fc = frecven absolut cumulat descendent;
fc% = frecven relativ cumulat descendent;

Frecvena simpl notat cu f, indic numrul de rezultate ale subiecilor care se gsesc n intervalul
respectiv. De exemplu, n intervalul 3, cu limitele 35 41 (limita inferioar 35, limita superioar 41) se
gsesc 11 rezultate ale subiecilor. Deci, 11 subieci au obinut la proba AD-P rezultate (sau scoruri)
cuprinse ntre 35 i 41. Dac adiionm toate cele 9 frecvene simple va rezulta valoarea 91,
reprezentnd ansamblul rezultatelor subiecilor care au participat la examinare (notat cu N mare. N
reprezint volumul distribuiei). Frecvena simpl relativ, notat cu f%, indic cota parte de subieci
(este exprimat sub form de proporie) din totalul de 91, existent n intervalul respectiv. n dreptul
intervalului 3 (35 41) se vor afla 0,12 din totalul rezultatelor subiecilor, sau, exprimat sub form
procentual, 12% din acest total(valoare trecut n parantez). Frecvena cumulat ascendent indic
numrul rezultatelor subiecilor care se gsesc pn n dreptul intervalului respectiv (inclusiv acest
interval). De exemplu, n dreptul intervalului 3 de la rubrica fc se gsete valoarea 19, semnificnd
faptul c pn n dreptul intervalului 3, inclusiv acesta, se gsesc 19 rezultate ale subiecilor, sau mai
clar, primele 19 rezultate ale subiecilor ordonate cresctor. Valoarea 19 se obine prin adiia primelor 3
frecvene simple (19 = 2+6+11). Valoarea corespunztoare a intervalului 4, din rubrica fc este 36. Ea
se obine din adiia valorilor primelor 4 frecvene simple (36 = 2+6+11+17). Primele valori din rubricile f
i fc coincid (ambele au valoarea 2). Frecvena relativ cumulat ascendent reprezint cota parte din
totalul rezultatelor subiecilor existent pn la un anumit interval. Ea ne informeaz despre proporia
rspunsurilor subiecilor ( n parantez este trecut forma de exprimare procentual) pn la un anumit
interval. De exemplu, n dreptul intervalului 4 la rubrica fc% se gsete valoarea 0,40, care provine din
adiia frecvenelor simple relative de la intervalele 1- 4 (0,02 + 0,07 + 0,12 + 0,19). Aceast valoare ne
spune c pn la intervalul 4, inclusiv acesta, se gsesc 0,40 din totalul rspunsurilor subiecilor, sau,
exprimat sub form procentual, 40% din totalul acestora. Frecvena cumulat descendent exprim
numrul rspunsurilor subiecilor care se gsete dincolo de un anumit interval Astfel, valoarea 72 a
intervalului 4 din rubrica fc exprim faptul c dincolo de intervalul 4 (inclusiv acesta) se gsesc 72 de
rspunsuri ale subiecilor. Valoarea 72 se obine scznd din numrul total al subiecilor (N = 91) adiia
frecvenelor simple a primelor 3 intervale. Astfel 72=91(2+6+11). Dac ar trebui s calculm frecvena
cumulat descendent a intervalului 5 vom scdea din totalul rspunsurilor adiia primele 4 valori, iar
pentru intervalul 6 adiia primelor 5 valori (55 = 91(2+6+11+17) i 33=91(2+6+11+17+22)). Frecvena
relativ cumulat descendent, notat cu fc% exprim o situaie identic, exprimat sub form de
proporie, n parantez sub form procentual).
Tabelul cuprinznd frecvenele unei distribuii pe intervale de variaie are o utilitate deosebit
pentru calculul diferiilor indicatori statistici.

113
AUREL STAN

II.3. REPREZENTRILE GRAFICE ALE REZULTATELOR.

Formele de reprezentare grafic ale distribuiilor valorilor unei variabile (distribuii univariate, n
care exist o singur variabil care ia diferite valori) sunt foarte diversificate, Ele au menirea de a
vizualiza tendinele existente n interiorul unei distribuii. Prin aceast form grafic unele tendine
existente ntr-o distribuie sunt scoase foarte uor n eviden. Noi vom prezenta cele mai frecvent
utilizate forme de exprimare grafic. Folosim pentru exemplificare distribuia de valori prezentat n
tabelul anterior.

II.3.1. Reprezentarea grafic prin coloane


Prezint n cadrul unui sistem de axe rectangulare intervalele de distribuie pe abscis i
frecvena acestora pe ordonat. Intervalele de distribuie sunt prezentate prin marcaje echidistante pe
axa absciselor, din care nal coloane proporionale cu frecvena acestor intervale.

25
22

20
17
Frecventa intervalelor

15 13
12
11
10
6
5
5 3
2

0
"21-27" "28-34" "35-41" "42-48" "49-55" "56-62" "63-69" "70-76" "77-83"

Intervale de variatie

Figura 1. Reprezentarea grafic prin coloane sau prin bare

O form a reprezentrii grafice prin coloane este histograma, n care coloanele sunt lipite unele
de altele.

114
STATISTIC I

25

20
Frecventa intervalelor
15
22
10
17
11 13 12
5
6 5
2 3
0
"21-27" "28-34" "35-41" "42-48" "49-55" "56-62" "63-69" "70-76" "77-83"

Intervale de variatie

Figura 2. Reprezentarea grafic sub forma histogramei

O alt form frecvent utilizat de reprezentare grafic a rezultatelor este poligonul frecvenelor.
Acesta se obine prin unirea printr-un segment de dreapt a mijlocului liniilor superioare care marcheaz
coloanele histogramelor. Se pot obine i prin unirea prin segmente de dreapt a punctelor care ar
reprezenta frecvena fiecrui interval, pornind din centrul acestuia

Figura 3. Reprezentarea grafic prin poligonul frecvenelor.

25
22
20
Frecventa intervalelor

17
15
13
12
11
10

6
5 5
3
2
0
"21-27" "28-34" "35-41 "42-48" "49-55" "56-62" "63-69" 70-76" "77-83"

Intervale de variatie

Dac marcm pe abscis fiecare interval prin liniue echidistante i unim printr-o linie continu
punctele reprezentnd frecvena intervalelor obinem curba distribuiei.

115
AUREL STAN

25

22
20
Frecventa intervaleor

17
15
13
12
11
10

6
5 5
3
2
0
"21-27" "28-34" "35-41 "42-48" "49-55" "56-62" "63-69" 70-76" "77-83"
Intervalele de variatie

Figura 4. Reprezentare grafic sub forma curbei frecvenelor


Reprezentrile grafice ale variabilelor calitative cunosc o serie de particulariti, determinate de
specificul scalei de msurare. Astfel, pentru a nu crea iluzia unei forme de distribuiei (deoarece
modalitile unei variabile nominale i pot schimba locul fr a denatura reprezentarea fenomenului
studiat) se adopt ca forme de reprezentare grafic diagrama n tronsoane i diagrama circular. Pentru
exemplificare, folosim datele tabelului anterior referitor la tipul de studii.

Diagrama prin tronsoane


14

43
c
b
a
75

a-studii umaniste;b-studii economice;c-studii tehnice

studii tehnice
11%
studii
studii umaniste
economice
56%
Diagrama circular 33%

Figura 5. Cuprinde modaliti de reprezentare grafic specifice scalelor nominale(n primul tip de reprezentare
grafic sunt trecute frecvenele absolute, n al doilea tip frecvenele relative).

116
STATISTIC I

II.4. PROTOCOALE DE PREZENTARE A DATELOR.


Noiunea de protocol de prezentare a datelor este foarte frecvent utilizat n domeniul cercetrilor
calitative i cantitative din cadrul disciplinelor socio-umane. Este un tablou al rezultatelor de baz care
nregistreaz rezultatul fiecrui subiect n fiecare din condiiile experimentale.

Pentru a nu folosi termeni tiinifici nc necunoscui studenilor anului I, menionm c


experimentul este o metod de investigaie care presupune varierea elementelor constitutive ale
unei situaii n scopul de a provoca un fenomen i de a msura evoluia sa. Elaborarea unui
experiment este fcut n scopul de a analiza modificrile rspunsului n funcie de
caracteristicile stimulului, ale situaiei, ale sarcinilor sau ale subiecilor. Am amintit anterior c variabilele
independente n cadrul unui experiment poart numele de factori. Anumii autori (H. Rouanet) disting
variabila independent de factor, n sensul c factorul este o anumit operaionalizare a variabilei.
Operaionalizarea conceptual a fost explicat anterior.. Un plan factorial este un plan de cercetare n
care fiecare modalitate a factorului este combinat cu fiecare modalitate a altor factori. Numrul
condiiilor experimentale ntr-un anumit plan factorial este egal cu produsul numrului de modaliti a
fiecrui factor. Dac dorim s studiem particularitile atitudinale n funcie de mediul de provenien i
sex, vom avea un plan experimental 2x2: variabila mediu de provenien (notat cu P2) are modalitile
rural (notat p1) i urban(notat p2) i variabila sex(notat S2) are modalitile masculin(notat s1) i feminin
(notat s2). 4 condiii experimentale ofer surse de date care vor fi supuse analizei: condiia 1(p1s1),
condiia 2(p1s2), condiia 3(p2s1), condiia 4(p2s2).

Protocol de tip Sn protocol de structur subiect-rezultat total. n cadrul acestui tip de protocol,
fiecrui subiect si dintr-un ansamblu format din n subieci i corespunde o valoare a variabilei Xi.16
Exemplu:

Si Xi Si Xi
S1 X1 1 17
S2 X2 2 19
S3 X3 3 27
S4 X4 4 33
- - - -
Sn Xn 87 27
Tabelul 8. Protocol de tip Sn n partea din dreapta se d un exemplu concret

Protocol de structur S <G>. Protocol de structur subiect-grup de apartenen. Astfel de


protocoale se construiesc n cazul n care rezultatele numerice aparin la subieci care fac parte din
grupuri diferite sau care au fost plasai n situaii diferite i constituie grupuri independente de
msurtori. Exemplificm:

16Explicaii suplimentare n lucrarea Valentin Clocotici, Aurel Stan, Statistic aplicat n psihologie, Polirom, Iai, 2000,
pag.94-103

117
AUREL STAN

S G Xi S G Xi
S1 G1 X1 1 Grup 1 12
S2 G1 X2 2 Grup 1 19
S3 G2 X3 3 Grup 2 23
- - - - - -
Si Gi Xi 35 Grup 3 35
- - - - - -
- - - - - -
Sn Gq Xn 143 Grup 7 29
Tabelul 9. Protocol de baz de tipul subiect grup de apartenen

Protocol de tipul S*T protocol de structur subiect-condiii de investigaie. Se realizeaz n


situaia n care subiecii(S) sunt supui la mai multe condiii de solicitare psihic. Vom exemplifica
pentru dou condiii: sunt prezentate rezultatele aceluiai subiect n condiia T1 i condiia T2
T T1 T2 T T1 T2
S S
S1 X11 X12 1 23 29
S2 X21 X22 2 34 31
S3 X31 X32 3 28 39
. . ..
Sg Xp1 Xp2 123 21 26
Tabelul 10. Protocol de baz de tipul subiect condiii de investigaie. n ultimele trei coloane din dreapta se
exemplific cu o examinare concret.

Suportul protocolului este cadrul n care rezultatele individuale nu au fost reportate. Subprotocolul
este o parte a protocolului de baz; rezultatele obinute printr-o parte din subieci i/sau ntr-o parte a
condiiilor experimentale
Mai putem vorbi de protocoale derivate. Acest tip de protocol este obinut dup ce s-a realizat
anumite operaiuni (transformri ale variabilelor dependente, diferite calcule, condensri i rafinri ale
modalitilor) asupra protocolului de baz. De exemplu, calculul mediei rezultatelor obinute de subieci
ntr-o condiie experimental. Calculele pot s rezide n transformarea variabilei dependente (prin
transformare logaritmic, de exemplu), n rezumarea rezultatele prin intermediul diferitelor tipuri de
indicatori (tendin central, dispersie), n nsumarea datele individuale i n calcularea frecvenelor sau
a procentajelor. n general, cercettorul va prezenta datele ntr-un tablou al rezultatelor care constituie
un protocol derivat.

Exemplificare. Protocoale derivate17


Doi cercettori francezi, J.P. Rossi i C. Loridan, au efectuat n anul 1987 un studiu asupra
modelelor fonologice de identificare a stimulilor scrii. n timpul efecturii studiului au calculat durata
pauzelor oculare asupra stimulului: (cuvinte sau ne-cuvinte) care aveau 2-3 silabe sau 4-5 silabe n

17 dup J.P. Rossi & Al., La mthode exprimentale en psychologie, Dunod, Paris, 1997, pag.61

118
STATISTIC I

situaii de detecie a literelor(subiectul trebuie s spun dac o anumit liter era prezent printre
stimuli) i de decizie lexical (subiectul trebuia s spun dac stimulul era un cuvnt).
n urma prelucrrii rezultatelor, autorii au ntocmit urmtorul tabel:
Numr Detecie litere (t1) Decizie lexical (t2)
silabe Cuvinte(m1) Necuvinte(m2) Cuvinte(m1) Necuvinte(m2)
n1 m 457 473 414 497
s 133 126 111 137
n2 m 460 482 468 579
s 126 105 145 176

n acest tabel sunt nregistrate duratele pauzelor oculare. Explicarea acestei cercetri opereaz
cu urmtorii termenii:
factor principal sistematic, notat T2, cu modalitile t1 (detecia literelor) i t2 (decizia lexical).
Prin aceast se permite o prim diviziune n dou coloane a rezultatelor;
tipul de stimul, notat cu M2, cu modalitile m1 (cuvinte) i m2 (necuvinte). Cu M2 se permite
subdivizarea coloanelor t1 i t2 (sarcinile);
numrul de silabe, notat N2, cu modalitile n1 (2 sau 3 silabe) i n2 (4 sau 6 silabe). N2 este
indicat pe linii.
Variabila dependent este durata pauzelor oculare.
n tabel sunt nregistrate mediile interindividuale (m), ca indicator de tendin central, i abaterile
standard (s), ca indicator de mprtiere. Lectura tabelului presupune punerea n coresponden a
liniilor i coloanelor. Valoarea 457 semnific durata medie a pauzelor oculare n sarcina de detecie a
literelor cnd stimulii sunt cuvinte de 2-3 silabe. Valoarea 497 semnific durata medie a pauzelor
oculare cnd stimulii sunt necuvinte de 2-3 silabe. Protocolul prezint un indicator de tendin central
i un indicator de mprtiere care fac bilanul datelor experimentale. Un protocol de baz cuprinde
durata pauzelor oculare obinute de fiecare subiect pentru fiecare din stimulii prezentai, deoarece n
fiecare condiie experimental sunt utilizai mai muli stimuli diferii.

II.5. TRANSFORMAREA VALORILOR BRUTE N CUANTILE


Care este raiunea acestei transformri? n marea majoritate a examinrilor psihologice se cere o
raportare valoric a rezultatelor obinute. Rezultatul brut al unui test sau chestionar psihologic nu ne
poate da dect o indicaie vag n privina aprecierii unui rezultat. Pentru a veni n ntmpinarea
dezideratului de raportare valoric a rezultatelor s-au creat dou sisteme de norme. Unele dintre
acestea sunt cuantilele, iar celelalte sunt variabilele normate care vor fi tratate n seciunea din lucrare
afectat indicatorilor de mprtiere.
Cuantilul este un element al unei serii ordonate de valori ale unei variabile care separa dou
cuantumuri procentuale din volumul total al valorilor variabilei. Practic, este o born numeric
separnd dou cuantumuri procentuale ale ansamblului valorilor Valorile variabilei separate prin
intermediul unui cuantil sunt ordonate cresctor sau descresctor, operaie anterioar stabilirii
cuantilului. Separaia unui ansamblu de valori ale variabilelor n cuantile constituie una din formele de
etalonare a testelor, adic de creare a unor scale de apreciere a valorii performanelor obinute la
diferite sisteme de solicitare psihic. Etaloanele permit de a situa un subiect care a obinut un scor

119
AUREL STAN

determinat ntr-o anumit clas valoric a subiecilor pentru care testul a fost etalonat. Se va vorbi de
intercuantile (de interdecile, de exemplu) pentru a desemna n+1 zone de distribuie delimitate prin
cuantile (prin n desemnnd numrul cuantilelor). Uneori se utilizeaz termenul de interquantil n loc de
quantil. Distincia clar se face prin precizarea faptului c interqantilul este un interval numeric, pe cnd
quantilul este reprezentat de o singur valoarea numeric. Lucrrile se specialitate ale lui Maurice Reuchlin
consacrate statisticii aplicate n psihologie fac clar aceast separaie de sensuri pentru cele dou noiuni18.
Cuantilele i intercuantilele numerotate cu 1 corespund, n general n Frana, celor mai bune rezultate, iar
n SUA rezultatelor celor mai slabe. Este o chestiune de convenie a notrii. Dac ntr-o distribuie se vor
reprezenta intercuantilele prin clase determinnd intervale pe axa absciselor, se va asigura la aceast distribuie
grafic o form rectangular, efectivele teoretice ale tuturor interquantilelor fiind egale prin definiie.
La nceputul procedurii de cuantilaj (form particular a etalonajului) se alege o metric, adic un numr de
niveluri pe care scala permite de a le discrimina. Dac o scal cuprinde n niveluri i dac efectivul total al unui
N
eantion este N, efectivul fiecrui nivel va fi teoretic . Scala n cuantile va corespunde, deci, unui model
n
rectangular. Cele mai utilizate tipuri n cuantile sunt prezentate n tabelul care urmeaz:

Nr.crt.. Nr interquantile Nr quantile Denumire tehnic Tabelul nr. 11 Conine


1 3 2 Trecil denumirile formelor de
2 4 3 Quartil etalonare prin intermediul
3 5 4 Quintil cuantilelor, gradiente de la 3
4 6 5 Sextil la 10
5 7 6 Septil
6 8 7 Octiil Pentru a construi un
7 9 8 Nonil decilaj (sistem de
8 10 9 Decil clasificare cuprinznd 9
9 100 99 Centil.
cuantile i 10 intercuan-
tile) se procedeaz n aa fel nct clasele scalei rezultate s conin fiecare un acelai numr de
scoruri din eantionul de referin. Este vorba de o convenie care va face distribuia rectangular (n
care fiecare diviziune are un numr egal de subieci). Dac scala este constituit din 10 clase egale n
efectiv, acest efectiv va trebui s aib 10% din numrul total al subiecilor. Limitele valorice ale
interquantilului I vor conine primele 10 % din notele brute, celor mai slabe din distribuie, ale
interquantilului II conin 10% din rezultatele care urmeaz, i aa mai departe, pn la interquantilul X.
Quantilul I va separa primii 10% din subieci de urmtorii 90%, quantilul II primii 20% din subieci de
urmtorii 80 %, i aa mai departe, pn la quantilul IX care va separa primii 90% de urmtorii 10% .
Oferim un exemplu imaginat: un psiholog examineaz un numr de 360 de subieci cu un anumit
test n vederea etalonrii acestuia. Procedura de etalonare se pune n practic n faza construirii unor
instrumente de investigaie psihologic sau n cazul reevalurii acestora. Notele testului variaz, in
exemplu nostru, ntre 0 i 35. Exemplu dat este unul imaginat i nu va conine primele 5 valori
(1,2,3,4,5) i ultimele 3 (33,34 i 35). De obicei, n examinare se obin foarte rar scorurile cele mai mici
i scorurile cele mai mari ale testului sau chestionarului. Dac datele ar fi fost reale, ar fi trebuit s se
fac o serie de precizri cu privire la constituirea eantionului de etalonaj, adic la proveniena
subiecilor examinai, la vrst, nivel de studii, sex etc. De asemenea, ar fi trebuit s se fac precizri cu

18 Vezi Maurice Reuchlin, Prcis de statistique, PUF, Paris, 1976, pag. 67-78

120
STATISTIC I

privire la tehnicile folosite pentru selectarea subiecilor n eantion. naintea operaiunii de etalonare,
datele se organizeaz cresctor n variante de variaie.
Tabelul ntocmit n vederea stabilirii scalei de etaloane n 10 interquantile (sau n 10 clase) va
arta n felul urmtor.
X n nc nct Interdecil Decil Numerotare % interdecil Separaie decil
6 3 3
7 7 10
8 4 14
9 6 20
10 8 28
11 11 39 36 0 11 11 I 10,88% 10,88%/89,12%
12 14 53
13 17 70 72 12 13 13 II 8,61% 19,49%/80,51%
14 16 86
15 19 105 108 14 15 15 III 9,72% 29,21%/70,79%
16 24 129
17 22 151 144 16 17 17 IV 12,77% 41,98%/58,02%
18 26 177 180 18 18 V 7,22% 49,20%/50,80%
19 21 198
20 24 222 216 19 20 20 VI 12,50% 61,70%/38,30%
21 18 240
22 19 259 252 21 22 22 VII 10,27% 71,97%/28,03%
23 17 276
24 14 290 288 23 24 24 VIII 8,61% 79,58%/20,42%
25 16 306
26 14 320 324 25 26 26 IX 8,33% 87,91%/12,09%
27 11 331 331
28 9 340 340
29 7 347 347
30 6 353 353
31 5 358 358
32 2 360 360 27-32 X 12,09%
Tabel nr. 12. Coloanele tabelului conin etape ale procedurii de etalonare prin metoda quantilelor a rezultatelor
obinute la un test psihologic de subieci unui eantion

Notaiile folosite n tabel :


X: nota brut
n: frecvena absolut a unei variante de variaie
nc:frecvena cumulat absolut
nct: frecvena cumulat absolut necesar teoretic pentru calcularea interquantilelor i quantilelor.

Jocul frecvenelor cumulate absolute face s nu putem tia distribuia exact acolo unde trebuie.
n acest caz ne limitm n calcul la cele mai apropiate valori de cele teoretice. Astfel, la primul decil ar fi
trebuit s ne oprim la valoarea 36. Valoarea 39 folosit de noi ca valoare delimitativ pentru primul decil
este cea mai apropiat valoare de 36. Procednd n acest fel am realizat un compromis metodologic.
n cazul cnd dorim s stabilim o scal n centile sau percentile, avem la ndemn o procedur
puin diferit. Pentru a pune n aplicare aceast procedur trebuie s avem distribuii ale cror
amplitudini sunt de ordinul sutelor. Raiunea construirii scalelor care fac apel la centile este de a asigura

121
AUREL STAN

o discriminare foarte fin a subiecilor, dar n cazul n care amplitudinea distribuiei este sub 100
asigurm o fals finee a diferenierii. Redm, n continuare, un tabel ale crui coloane indic paii de
urmat n procedura de calcul:
Lum exemplu a 127 de subieci care au fost examinai cu un anumit test (exemplul este fictiv).
Nr.crt. X f f% C fc% Percentila
1. 11 2 1,57 2 1,57 0,79
2. 12 5 3,94 7 5,51 3,54
3. 13 7 5,51 14 11,02 8,27
4. 14 11 8,68 25 19,69 15,36
5. 15 19 14,96 44 34,65 27,17
6. 16 26 20,47 70 55,12 44,89
7. 17 18 14,17 88 69,29 62,21
8. 18 15 11,81 103 81,10 74,50
9. 19 11 8,66 114 89,76 85,43
10. 20 7 5,51 121 95,28 92,52
11. 21 4 3,15 125 98,43 96,85
12. 22 2 1,57 127 100,00 99,22
Tabel nr. 13. Coloanele tabelului indic etapele necesare calculrii valorilor percentile
Avem n fa un exemplu simplu, deoarece n practic este foarte puin probabil s se gseasc
un test la care s se poat obine doar 12 valori distincte.
Procedura exemplificat de noi este folosit de autori reputai n domeniul psihometric ca David
Magnusson19, J.J. Bernier i B. Pietrulewicz20. Prin aceast procedur se ncearc a se ameliora
impreciziile metodei prezentate la calculul decilelor.
Coloana notat cu X conine diferitele variante ale variabilei obinute n urma unei examinri cu
un anumit test. A doua coloan, notat cu f , conine frecvenele diferitelor valori ale variabilei. n total au
fost cuprini n analiz 127 de rezultate ale subiecilor. Cu f% a fost notat frecvena simpl relativ,
care se obine prin nmulirea cu 100 a rezultatului mpririi fiecrei frecvene simpl la 127 (numrul
total de subieci examinai). Cu fc a fost notat frecvena absolut cumulat ascendent, iar cu fc%
frecvena relativ cumulat ascendent. Valorile din aceast coloan se obin prin nmulirea cu 100 a
rezultatului mpririi fiecrei valori din coloana fc la 127. Ultima coloan conine transformarea n valori
percentile a valorilor iniiale ale testului. Cum se obin aceste valori? Valoarea 13, de exemplu, este
considerat mijlocul unui interval de clas care se ntinde de la 12,5 pn la 13,5. Ca atare, valoarea
percentil este constituit din frecvena cumulat relativ anterioar valorii 13 i din adugarea din
frecvena relativ din dreptul valorii 13.
5,51
8,27 = 5,51 +
2
8,68
15,36 = 11,02 +
2
Ce ne spune o valoare percentil? Ea ne spune, de exemplu, c sub valoarea 16 se gsesc
aproximativ 45% din totalul subiecilor, iar peste aceast valoare se gsesc aproximativ 55 % din totalul
subiecilor.

19 vezi David Magnusson, Testtheorie, Verlag Fraanz Deutlicke Wien, 1973, pag 252
20 vezi J.J. Bernier, B. Pietrulewicz, La psychometrie, Gaetan Morin Editeur, Montreal, Casablanca, 1997, pag. 371-372

122
STATISTIC I

n cazul ordonrii valorilor variabilei pe intervale de variaie procedura este puin diferit. Folosim
exemplul de la nceputul seciunii referitoare la gruparea datelor. Rubricile tabelului sunt cunoscute din
comentariile noastre anterioare. n cazul n care dorim s construim o scal n quartile (trei quartile
mpart distribuia n 4 clase) vom stabili n primul rnd quota, adic un cuantum procentual de subieci
separat de valorile quartilelor. Deci, quartilele se refer la valorile distribuiei, iar quota la un cuantum
procentual al efectivului total. Quota pentru primul quartil va fi de 25% din efectivul total (22,75 n
valoare absolut), quota pentru cel de-al doilea quartil va fi de 50% (45,5 n valoare absolut) i quota
pentru cel de-al treilea quartil va fi de 75% (68,25 n valoare absolut).
Nr.crt Interval f Fc fc%
1 21 27 2 2 0,02 (2%)
2 28 34 6 8 0,09 (9%)
3 35 41 11 19 0,21 (21%)
4 42 48 17 36 0,40 (40%)
5 49 55 22 58 0,64 64%)
6 56 62 13 71 0,78 (78%)
7 63 69 12 83 0,91 (91%)
8 70 76 5 88 0,97 (97%)
9 77 83 3 91 1,00 (100%)
Total N=91
Tabelul 14. Coloanele tabelului conin etape de calcul pentru obinerea quantilelor i interquantilelor n condiiile
gruprii de variante de variaie

Valoarea primei quote va cuprinde 25% din rezultatele subiecilor examinai.. Dac privim la
rubrica fc% a tabelului observm c primii 25% din subieci sunt delimitai de intervalul numrul 4 care
cuprinde pn la el 40% din subieci (inclusiv intervalul 4). Intervalul anterior nu putea s fac o astfel
de separaie, deoarece pn la el se gsesc doar 21% din rezultatele subiecilor (19 rezultate n valoare
absolut). Formula de calcul pe care o aplicm pentru calculul quantilelor pentru date organizate pe
variante de variaie este urmtoarea.
i*d
Q = X sup + ;
f
n care:
Q = denumire generic pentru quantil;
Xsup= valoarea superioar a intervalului anterior celui n care se afl quota;
i = mrimea intervalului de variaie;
d = diferena dintre valoarea absolut a quotei i frecvena cumulat absolut anterioar
intervalului n care se afl quota;
f = frecvena simpl absolut a intervalului n care se afl quota
Pentru cazul nostru particular de calcul a quartilelor, form particular a quantilelor, vom nota
quartilul 1 cu Q1, quartilul 2 cu Q2, quartilul 3 cu Q3. Pentru Q1 am amintit c valoarea procentual a
quotei este de 25%, iar valoarea absolut este de 22,75 (25% din 91; 910,25=22,75). Valoarea
absolut a quotei primului quartil se afl n intervalul 4.
Xsup sau valoarea superioar a intervalului anterior celui n care se afl quota este egal cu 41.
Intervalul anterior este intervalul 3 (35-41). Valoarea superioar sau limita superioar a acestuia este 41.
Mrimea unui interval (i) este egal cu 7.

123
AUREL STAN

Diferena dintre valoarea absolut a quotei (22,75) i frecvena absolut cumulat ascendent a
intervalului anterior celui n care se afl quota (19) este egal cu 3,75 (deci, d=22,7519=3,75).
Frecvena intervalului n care se afl quota este egal cu 17. Intervalul 4 are frecvena egal cu
17.
Avem la dispoziie toate datele necesare calculrii primului quartil.
7 * 3,75 26,25
Q1 = 41+ = 41+ = 41 + 1,54 = 42,54
17 17
n continuare, trecem la calcularea celui de-al doilea quartil. Al doilea quartil separ primele 50%
din rezultatele subiecilor de urmtoarele 50%. De aceast dat quota va fi egal cu 50% din efectivul
91
total, deci, va avea valoarea 45,5 ( = 45,5 ). De aceast dat quota se va situa n intervalul 6, adic
2
intervalul 49 55. Limita superioar a intervalului anterior celui n care se afl quota (Xsup) va fi egal cu
48, diferena ntre quot i frecvena cumulat ascendent anterioar va fi egal cu 9,5 (d = 45,5 36 =
9,5) i frecvena pe intervalul n care se afl quota va fi egal cu 22. Din efectuarea calculelor rezult:
7 * 9,5 66,5
Q2 = 48+ = 48 + = 48 + 3,02 = 51,02
22 22
Pentru calcularea celui de-al treilea quartil, care separ primele 75% dintre rezultatele subiecilor
de ultimele 25% din acestea, quota va fi egal cu 75%, adic are valoarea 68,25. Aceast valoarea se
va gsi n rubrica fc n dreptul intervalului 6 (56 62). Valoarea superioar a intervalului anterior celui
n care se afl quota va fi egal cu 55 (Xsup.). Diferena dintre quot i frecvena cumulat ascendent a
intervalului anterior celui n care se afl quota este egal cu 10,25 (d = 68,25 58,00). Frecvena
intervalului n care se afl quota specific quartilului 3 este egal cu 13. Dup ce am aflat respectivele
valori, putem trece la calcularea quartilului 3.
7 * 10,25 71,75
Q3 = 55 + = 55 + = 55 + 5,51 = 60,51
13 13
Deoarece valorile quartilelor prezint zecimale (ele rezult din interpolare) putem s procedm la
ntregire. Prezentm situaia rezultat n tabelul urmtor.
Nr.crt. Notare Valoare ntregire Notare interquartile Limite
quartille
1 Q1 42,54 43 I 43
2 Q2 51.02 51 II 44 51
3 Q3 60,51 61 III 52 61
4 IV 62
Tabelul 15. Conine exemplificri pentru valorile i notrile quartilelor

Procedura este identic pentru celelalte variante ale cuantilelor. Datele pentru efectuarea
calculelor variaz n funcie de mrimea valorilor variabilei i de dimensiunea quotei. Se observ foarte
uor c interquartilele nu sunt egale n privina dimensiunii intervalelor, ci n privina numrului de
rezultate coninute. De exemplu: pn la valoarea 43 se gsesc primele 25% dintre rezultate, ntre
valorile 44 i 51 ale variabilei se gsesc urmtoarele 25% dintre rezultate, .a.m.d.

124
STATISTIC I

EXERCIIU

Urmtoarele rezultate aparin unor subieci care au efectuat un test psihologic.


111,116,118,56,58,90,75,65,76,55,47,69,83,100,87,70,,81,73,69,94,85,76,79,81,85,61,58,73,
97,101,89,98,66,85,93,67,84,75,57,80,78,94,107,69,75,97,83,89,72,84,103,107,80,73,79,85,
110,59,63,85,78,63,101,97,93,83,87,69,101,93,83,77,98,64,68,78,96,103,98,81,75,85,89,93,
98,58,109,113,58,69,75,87,89,93,87,85,88,89,73,90,78,108,59,70,82,75,72,80

Pentru gruparea i sistematizarea rezultatelor efectuai urmtoarele sarcini de prelucrare statistic:


stabilii amplitudinea distribuiei;
realizai o grupare pe variante de variaie;
realizai o grupare pe intervale de variaie n 7 i 9 clase;
realizai histograma distribuiei grupate pe intervale de variaie;
calculai valorile quartilelor i decilelor, a interquartilelor i a interdecilelor.

125
AUREL STAN

III. INDICATORII STATISTICI

n activitatea de cercetare a unei serii de date avem nevoie de expresii numerice precise care s
descrie condensat caracteristicile acesteia. Aceste mrimi poart numele de indicatori statistici..
Indicatorul statistic este o mrime cu ajutorul creia se caracterizeaz un fenomen sub raportul
structurii, interdependenelor, i modificrilor n timp i spaiu. Expresia numeric este legat de
calitatea fenomenului studiat i, n consecin, indicatorul statistic este expresia numeric a unei
categorii riguros definite. Din punct de vedere numeric indicatorul statistic poate fi o mrime absolut
(volum, efectiv, total) sau o mrime derivata (medie, indice, coeficient). Indicatorul statistic este
rezultatul unei observri i prelucrri statistice.
n activitatea de prelucrare a datelor din domeniul psihopedagogic, i nu numai din acesta, se fac
raportri la 4 feluri de indicatori:
1. indicatori de nivel sau de tendin central (medie, median, modul);
2. indicatori de mprtiere (amplitudine, abatere quartil, abatere medie, varian, abatere standard);
3. indicatori de asimetrie
4. indicatori de exces sau de boltire
Media exprim nivelul atins de o variabila numeric atunci cnd aceast variabil este uniform
repartizat pe unitile care compun o populaie determinat. Cuvntul medie, fr nici o alt
specificaie, se folosete n accepia de medie aritmetic, medie fundamentat n teorie i comod de
utilizat n practic. Alte medii uzuale sunt: media armonic, media geometrica i media ptratic. Notaia
uzual pentru media aritmetic este X , dar se pot ntlni i alte notaii.
n sens general, media trebuie s satisfac anumite condiii. Acestea sunt:
Medie trebuie s fie definit n mod precis. Aceast cerin nu poate fi lsat doar pe seama simplei
aprecieri subiective a celui care efectueaz aciunea de observare;
medie trebuie sa fie expresia tuturor observaiilor fcute. n caz contrar, ea nu poate fi n mod real o
valoare tipic a ntregii repartiii;
Este de dorit ca media s posede proprieti simple i evidente, fcnd posibil nelegerea sensului
su general. O medie nu trebuie s aib un caracter matematic prea abstract;
Este de dorit ca o medie s poat fi calculat cu uurin i rapiditate. Dintre dou medii cu
proprieti asemntoare va fi preferata aceea care se poate calcula mai uor. ns, nu trebuie s
acordm o prea mare atenie uurinei n calcul n detrimentul altor exigene;
Este de dorit ca media sa fie afectat ct mai puin de fluctuaiile de selecie. n eantioanele
extrase (eantionul are sensul de subansamblu al unei populaii) din aceeai populaie mediile vor fi
rareori identice, iar o form anumit de medie poate conduce la diferene mai mari dect alta. Dintre
doua forme de medii va fi mai bun aceea care prezint mai mult stabilitate.
Medie trebuie s poat fi rapid studiat cu ajutorul calculului algebric.

126
STATISTIC I

n marea majoritate a cazurilor de cercetrile psihopedagogice referinele se fac la media


aritmetic., motiv pentru care nu prezentm celelalte feluri de medii: media geometric, media ptratic,
media armonic (avem, desigur, n vedere i caracterul simplificat al acestui curs).
Referindu-ne n mod special la media aritmetic, adic media obinut ca raport ntre suma
valorilor observate ale unei variabile i numrul lor, menionm care sunt proprietile acesteia:
Dac lum n consideraie diferenele dintre fiecare observaie n parte i media aritmetic,
observm c suma algebric a acestor diferene va fi egal cu 0;
Suma ptratelor abaterilor respective este un minim pentru ansamblu de valori. Suma ptratelor
abaterilor de la fiecare valoare individual a variabilei i media aritmetic este mai mic dect suma
abaterilor ridicate la ptrat n jurul oricrei alte valori n afar de media aritmetic;

Nr.crt. X x=X-X x2 X-15 (X-15)2 X-19 (X-19)2


1 11 -6 36 -4 16 -8 64
2 15 -2 4 0 0 -4 16
3 15 -2 4 0 0 -4 16
4 19 2 4 4 16 0 0
5 22 5 25 7 49 3 9
6 21 4 16 6 36 2 4
7 17 0 0 2 4 -2 4
8 12 -5 25 -3 9 -7 49
9 17 0 0 2 4 -2 4
10 19 2 4 4 16 0 0
11 18 1 1 3 9 1 1
Total 187 0 119 21 159 -7 159
Tabelul 16. Cuprinde compararea sumei deviaiei valorilor de la medie n comparaie cu suma deviaiilor de la alte
valori

Volumul sau efectivul acestei distribuii este 11. Media o aflm prin divizarea sumei tuturor
valorilor individuale (187) la 11, rezultatul fiind 17. Prin x se noteaz deviaiile fiecrei valori de la medie,
motiv pentru care valoarea obinut se numete valoare de deviaie.
n tabel se observa clar c suma ptratelor diferenei de la alt valoare dect media aritmetic
este o valoare mai mare dect suma ptratelor abaterilor de la media aritmetic.
Astfel, din consultarea tabelului rezult:
x < (X 15) ; x < (X 15) : x < (X 19)
2 2 2 2

Folosirea mediei n prelucrarea statistic a datelor din domeniul psihopedagogiei este frecvent
n trei tipuri de situaii, din care unele pot fi rezolvate prin folosirea medianei i a modulului:
Situaia n care se pune problema de a aprecia o observaie ntr-o distribuie. Exemplu: O not
poate fi apreciat ca superioar sau inferioar mediei. n general, se precizeaz aceast
constatare.
Situaia n care se compar un grup de observaii cu un altul. Exemplu: ntr-un proces de nvare
care comport o serie de ncercri succesive pot s fie lsate intervale de timp (nvare distribuit)
sau nu (nvare masat). Se constat, n general c rezultatul unui grup de subieci n nvarea
distribuit este superior rezultatului n nvarea masat. Dac cineva consider c aceast

127
AUREL STAN

diferen este prea mare pentru a putea s se explice doar prin variaii fortuite, aceasta va conduce
la o explicaie psihologic;
Situaia n care seriile de date provin de la o surs de variaie sistematic sau de la mai multe. Se
poate calcula valoarea medie asociat la fiecare din strile acestei surse Aceast medie permite de
a descompune variaiile observate n mai multe abateri (care se numesc "efecte") i de a analiza
astfel importana relativ a diferitelor surse sistematice sau fortuite. Posibilitatea unei astfel de
analize este esenial pentru explicarea fenomenelor observate.

III.1. CALCULUL MEDIEI ARITMETICE

Avem trei situaii diferite n procedura de calcul a mediei aritmetice::


1. situaia n care variabilele sunt negrupate;
2. situaia n care variabilele sunt grupate pe variante de variaie;
3. situaia n care variabilele sunt grupate pe intervale de variaie.
n cazul n care variabilele sunt negrupate se adiioneaz toate valorile variabilei i rezultatul final
se mparte la efectivul total al observaiilor. S presupunem c n urma efecturii unui experiment
privind timpul de reacie intraindividual am obinut urmtoarele rezultate: ale variabilei (notat de noi cu
X) timp de reacie intraindividual: 21, 24, 28, 31, 17, 20, 22, 16, 18, 27, 22, 19, 26, 29, 30. n total
avem 15 observaii succesive efectuate pe aceeai persoan. n acest caz media se calculeaz prin

urmtoarea formul: X =
X n care X este notarea mediei aritmetice, X este suma valorilor
N
individuale ale variabilei X i N exprim numrul total de observaii sau efectivul distribuiei. n cazul

nostru concret: X =
X =
350
= 23,3 . Litera greceasc are sensul de sum. Formula pentru date
N 15
negrupate se practic n situaia n care avem puine date la dispoziie. n cazul n care numrul valorilor
unei variabile devine mare, este necesar operaiunea de grupare a datelor. S presupunem c pentru
aceeai situaie experimental am cules date de ordinul sutelor i am procedat la o grupare a lor
conform tabelului nr. 17.

n acest caz, formula pentru calculul mediei este urmtoarea X =


fX
n care X este variabila
N
ordonat pe variante de variaie, f frecvena variantelor de variaie i N este volumul observaiilor sau
efectivul total al acestora. N = fX = 302 Litera greceasc (sigma) are sensul sum de. Pentru
7023
exemplul nostru concret obinem: 23,25 = .
302
n cazul n care avem la dispoziie un numr mare de date i de variante de variaie (i seriile de
valori au o amplitudine de variaie mare) folosim gruparea datelor prin intermediul intervalelor de variaie
i o formul specific pentru medie.

128
STATISTIC I

Nr.crt. X F fX Tabelul 17. Cuprinde exemplificare pentru


1 16 5 90 modul de calcul al mediei aritmetice n cazul gruprii
2 17 11 187 datelor pe variante de variaie
3 18 17 306
4 19 24 456 EXEMPLU: S presupunea c n urma
5 20 30 600 efecturii unui examen psihologic n care am
6 21 35 735 folosit i o prob de atenie (foarte rar un
7 22 38 836 examen psihologic se reduce la o singura
8 23 32 736
prob, de cele mai multe ori se folosete n
9 24 28 672
10 25 20 500 cursul unui astfel de examen un ansamblu de
11 26 18 668 procedee de investigaie) rezultatele au fost
12 27 16 432 grupate, aa cum se prezint n tabelul care
13 28 13 364 urmeaz. Precizm c n acest tabel am trecut
14 29 9 261 date care sunt necesare pentru aplicarea a
15 30 6 180
dou formule diferite de calcul. n una din
N = 302 fX = 7023 formule folosim frecvenele nmulite cu centrul
intervalului notelor brute, iar n alta folosim variabila codificat u, variabil a crei intervenie este
justificat de comoditatea n operaiile de calcul.
Nr.crt Intervalul Xi f fXI u Fu
1 27 - 31 29 7 203 -3 -21
2 32 - 36 34 13 442 -2 -26
3 37 - 41 39 20 780 -1 -20
4 42 - 46 44 27 1188 0 0
5 47 - 51 49 25 1225 1 25
6 52 - 57 54 17 918 2 34
7 56 - 62 59 9 531 3 27
f = N = 118 fXi = 5287 fu = 19
Tabelul 18. Cuprinde exemplificare pentru modul de calcul al mediei aritmetice n cazul gruprii datelor pe
intervale de variaie

n cazul folosirii primei variante de calcul anunate a mediei aritmetice aplicm urmtoarea

formul: X =
fX i
. n cazul de fa f reprezint frecvena pe interval, Xi desemneaz centrul
N
intervalului (i variaz de la 1 la 7, numrul total al intervalelor) i N numrul total al rezultatelor
subiecilor (N=118). Prin aplicarea formulei rezult:
5287
X = = 44,8 , n care 5287 reprezint suma produselor dintre centrele intervalelor i frecvenelor
118
acestora, iar 118 numrul total al rezultatelor subiecilor sau efectivul total. Atragem atenia asupra
faptului c o asemenea formul aproximeaz valoarea mediei aritmetice. Aceast aproximare poate fi
acceptat n cazul n care variabilele sunt repartizate armonios pe lungimea intervalului. Dac n
intervalul 1 (27 31) vom avea valorile 27, 28, 29,29,29, 30, 31 atunci centrul intervalului este
reprezentativ pentru acesta, dar dac vom avea n acest interval 7 valori de 27 sau 7 valori de 31
centrul intervalului de variaie nu mai ndeplinete aceast condiie. Ca atare, acest mod de calcul nu se
recomand n situaia n care distribuiile valorilor prezint asimetrii puternice.

129
AUREL STAN

Realizarea rubricii variabilei codificate u, utilizat n cel de-al doilea procedeu de calcul pentru
variabile ordonate pe intervale de variaie, presupune fixarea n dreptul unui interval a valorii 0 a
variabilei codificate. Aceast fixare este arbitrar, ns, de regul, se realizeaz n dreptul intervalului
modal, adic n dreptul acelui interval care are frecvena cea mai mare. n cazul exemplificat de noi
acest interval poart numrul curent 4 (42 46) Valoarea central a acestui interval va fi o valoare de
referin i o vom nota cu A. n cazul nostru A = 44. Valorile coloanei u se stabilesc prin mprirea
diferenei dintre valoarea variabil Xi i constanta A la mrimea intervalului (i). Urmnd procedura de
39 44 34 44 29 44
calcul vom obine: -1= , -2 = , -3 = .a.m.d. Pentru valorile mai mici ale
5 5 5
variabilei XI dect constanta A se obin valori negative ale variabilei codificate u, i pentru valori mai
mari ale variabilei Xi dect constanta A se obin valori pozitive ale variabilei codificate u. n cazul folosirii
n calcul al variabilei codificate u, formula de calcul va fi urmtoarea:
i * fu
X = A+ ,
N
n care A este o constant egal cu mrimea centrului intervalului pentru care variabila u = 0, i este
mrimea unui interval, fu este produsul din frecvena intervalului i variabila codificat u, f este frecvena
simpl unui interval i u variabila codificat.
5 * 19
Prin aplicarea formulei obinem X = 44 + = 44,8. Facem nc o dat precizarea c aceste
118
proceduri de calcul fac posibil apariia unei anumite erori, eroare datorat faptului c se lucreaz cu
mrimi de reprezentare. Astfel, centrul intervalului este considerat reprezentativ pentru ntregul interval,
situaie care antreneaz erori mari n cazul n care distribuia valorilor are asimetrii accentuate, de
stnga sau de dreapta. n acest caz se impune o operaiune de micorare a mrimii intervalului pn la
limite care asigura o marja de eroare acceptabil. Cea mai corect modalitate de calcul a mediei este
cea rezultat din adiia variabilelor brute si divizarea sumei acestor variabile brute la numrul de
observaii. Prezena unor instalaii de calcul electronic, chiar mai puin performante, fac din calculul
mediilor, si nu numai a lor, o operaiune banal, executat ntr-un timp extrem de scurt.
Problema calcului mediilor se pune i in cazul analizei de itemi. Itemul este o component
informaional elementar a unui test sau chestionar psihologic, care se prezint dihotomic din punct de
vedere cantitativ n cea mai mare parte din cazuri. Analiza de itemi este o operaiune strict necesar n
cazul n care dorim s ne asigurm de faptul c testul ndeplinete o serie de exigene funcionale. S
lum dou exemple (fictive) de modaliti de prezentare a itemilor unor probe psihologice.

Itemii testului A Itemii testului B


Nr.crt. Nr.crt.
1 2 3 4 1 2 3 4
1 0 1 0 0 1 2 5 4 4
2 1 1 1 0 2 3 1 4 2
3 1 1 0 1 3 1 1 2 1
4 0 0 1 1 4 1 3 2 4
5 1 0 0 0 5 2 5 4 1
6 1 0 0 0 6 3 2 4 4
7 0 1 0 1 7 1 3 1 2
8 1 0 1 1 8 2 2 3 3

130
STATISTIC I

9 1 1 0 0 9 3 4 5 4
10 1 0 1 1 10 3 2 4 4
11 0 1 0 0 11 2 1 4 3
fi 7 6 4 5 fI 23 29 37 36
pi 0,63 0,54 0,36 0,45 pi 0,41 0,52 0,67 0,65
qi 0,37 0,46 0,64 0,55 qi 0,59 0,48 0,33 0,33
Tabelul 19. Cuprinde exemplificare pentru modul de calcul al mediei itemilor

n cazul primului exemplu (testul A) avem situaia de examen a 11 subieci la un test cu 4 itemi
(exemplul este teoretic, deoarece un test trebuie sa aib cel puin 20 itemi pentru a putea fi numit test).
Acest mod de organizare a rezultatelor obinute de un grup de subieci la un test psihologic (subieci-
itemi) se numete matricea lui Stern, de la numele psihologului german W. Stern. La fiecare item din
cadrul testului A se pot obine valorile 1 (caz n care exprim soluia corect la o situaie problematic
sau rspuns la un chestionar de personalitate care pune n eviden trstura psihic ce trebuie
diagnosticat) sau 0 (caz n care exprim soluia incorect sau rspuns care nu pune n eviden
trstura psihic cercetat). La testul B rspunsurile la itemi au o distribuie cantitativ polichotomic,
notele variind ntre 1 i 5 (situaie ntlnit mai ales la chestionarele de atitudini)
n cazul testului A, notaia fi indic punctajul total obinut de toi subiecii la itemul 1 notaia pi
proporia de rspunsuri corecte i totodat media rspunsurilor corecte la itemi (i-ul variaz ntre 1 i 4,
deci, vom avea f1,f2,f3,f4, respectiv p1,p2,p3,p4,). n acest notaia pi exprim indicele de dificultate i,
f
totodat, media rezultatelor ansamblului subiecilor la itemi. Deci pi= i (n care notaia N exprim
N
numrul total al subiecilor). n cazul testului B pi exprim indicele de dificultate a itemului, dar nu i
media rezultatelor ansamblului subiecilor la itemi. La testul B, valoarea pi se obine prin mprirea
valorii totale a punctajului obinut la un anumit item de ctre cei 11 subieci la valoarea maximal pe
fi
care ar fi putut-o obine cei 11 subiecii la un anumit item. n acest caz, pi = . n cazul dat de noi
f i max
ca exemplu, la testul B, valoarea fI max = 55, obinut prin nmulirea valorii 5 (valoare maxim pe care
ar fi putut s o obin un subiect pentru un rspuns) cu 11 (numrul total al subiecilor). De exemplu, la
23
testul B, p1= = 0,40 . Pentru media itemilor din testul B se va folosi alt notaie, conform unei uzane
55
de notare.

III.2. CALCULUL MEDIANEI

Mediana, numit i valoare mijlocie, este o valoare caracteristic real (concret) a unei
distribuii, sau rezultnd n urma unei operaii de interpolare, care mparte valorile ordonate cresctor
sau descresctor n dou pri egale, n aa fel nct numrul valorilor mai mari s fie egal cu numrul
valorilor mai mici dect mediana. Mediana poate fi stabilit intr-o serie de date ordonate cresctor sau
descresctor. n cadrul unui ir impar de valori, mediana este valoarea unei variante concrete a
distribuiei, i anume valoarea cu rangul n+1/2. Pentru median folosim notaia Me.

131
AUREL STAN

EXEMPLU:
n distribuia 1,2,3,5,7,9,10,12,13,14,18 avem un total de 11 valori ale variabilei X.. Dac valorile
ar fi fost trecute n ordinea 7,1,13,18,2,10,5,3,9,12,14 ar fi trebuit s le ordonm cresctor. Deci, prima
operaiune necesar pentru calculul medianei este ordonarea valorilor. Mediana va avea valoarea cu
N +1 11 + 1
rangul . n exemplul nostru, mediana va avea rangul = 6 , deci a 6-a valoare din irul
2 2
ordonat cresctor, valoare egal cu 9. n stnga valorii 9 se gsesc 5 valori mai mici (1,2,3,5,7) i n
dreapta 5 valori mai mari (10,12,13,14,18).
n cazul n care seria are un numr par valori, medianei se obine prin interpolare, situndu-se
N N +2
ntre valoarea cu rangul i valoarea cu rangul . Exemplu: n distribuia
2 2
8
17,18,22,24,28,30.35.37 (N=8) valoarea medianei se va situa ntre valorile rangurilor 4 i 5
2
8 + 2
2 . n cazuri de acest gen valoarea medianei va fi media aritmetic a valorilor variabilei care au
24 + 28
rangurile 4 i 5, deci, Me = = 26 .
2
n cazul unei distribuii de frecvene pe variante de variaie mediana poate avea o semnificaie
mai puin clar, situaie cauzat de modul de determinare.

Nr.crt. X F fc fc% Tabelul 20. Cuprinde modul de organizare a


1 5 10 10 0,07 (7%) datelor pentru determinarea medianei
2 6 15 25 0,17 (17%)
3 7 20 45 0,30 (30%) n tabelul alturat am realizat ordonarea
4 8 30 75 0,51 (51%) pe variante de variaie a unei variabile care
5 9 20 95 0,64 (64%) cuprinde 148 de rezultate la o anumit prob
6 10 15 110 0,74 (83%) psihologic. Tabelul cuprinde rubricile:
7 11 13 123 0,83 (83%)
variantele variabilei (X), frecvenele variantelor
8 12 11 134 0,91 (91%)
9 13 9 143 0,97 (97%) de variaie (f), frecvenele cumulate ascendent
10 14 5 148 1,00 (100%) (fc) i frecvenele relative cumulate ascendent
N=148 (fc%). Valoarea medianei trebuie s separe
primii 50% din subieci de urmtorii 50%. Valoarea mediana este considerata cea corespunztoare
procentului frecvenei relative cumulate ascendent mai apropiat de valoarea 50%, de n cazul nostru
valoarea 8 (n dreptul frecvenei cumulate ascendent egal cu 75. Observm pe rubrica frecvenei
relative cumulate ascendent c aceast valoare se afl la varianta de variaie cu numrul curent 4.
Valoarea 8 este considerat mediana acestei distribuii, dar aceast stabilire se face prin acceptarea
unui compromis, deoarece avem 30 de valori 8 ale variabilei X. Practic, avem 35 de valori mai mici
dect 8 (10+15+20) i 73 de valori mai mari (20+15+13+11+9+5). Compromisul const n faptul de a
accepta i valoarea 8 n calcularea primelor 50% din valori i urmtoarelor 50% din acestea. n sens
strict o astfel de determinare poate s nu corespunda definiiei medianei dup care numrul valorile mai
mici si mai mari dect ea s fie egale ntre ele.

132
STATISTIC I

III.3. DETERMINAREA MODULULUI

Modulul este valoarea variabilei cu frecvena cea mai mare n cadrul unei distribuii. Vom nota
acest indicator statistic prin Mo. S lum, de exemplu, urmtoarea distribuie de valori: 11,17,13,12
17,9,8,17,14,19,20,17,15,16,14,18. Dup ce ordonm aceast distribuie
(8,9,11,12,13,14,14,15,16,17,17,17,17,18,19,20) observm c valoarea 17 este cea mai frecvent n
cadrul acestei distribuii, ea repetndu-se de 4 ori. n acest caz, valoarea variabilei egal cu 17 va
constitui valoarea mod a distribuiei sau modul acesteia. Exist cazuri cnd ntr-o distribuie, dou sau
mai multe valori au frecvena cea mai mare. Distribuiile vor numite, n aceast situaie, multimodale
(bimodale, cnd dou valori au frecvenele cele mai mari, trimodale cnd trei valori au frecvenele cele
mai mari, .a.m.d.). De exemplu, distribuia format din valorile ordonate 4,5,6,7,7,7,8,9,9,9,10,11 este
bimodal, deoarece avem dou valori ale variabilei cu frecvene maxime, valorile 7 i 9.
Multimodalitatea indic, de obicei, o eterogenitate valoric a subiecilor supui unui examen, dar, mai
pot exista i alte explicaii.

III.4. INDICATORI DE MSUR A MPRATIERII

Indicatorii de msur a mprtierii frecvent utilizai n analiza statistic a datelor din domeniu
psihopedagogic (i nu numai din acest domeniu) sunt:
amplitudinea;
variana;
abaterea standard;
abaterea medie;
abaterea quartila sau amplitudinea semiinterquartil.
Indicatorii de msur a mprtierii trebuie s satisfac condiii similare cu cele enunate pentru
indicatorii de msur a localizrii sau indicatorii de nivel:
s se bazeze pe toate observaiile;
s fie uor de calculat;
s fie afectate ct mai puin posibil de fluctuaiile de selecie i adecvate unui studiu algebric.
Cea mai simpl msur a mprtierii este amplitudinea, care se obine prin efectuarea diferenei
dintre cea mai mare i cea mai mic valoare observat la care se adaug valoarea 1. Obiecii cu privire
la folosirea amplitudinii exist n situaii n care viteza de calcul i simplitatea n interpretare nu sunt
cerine importante. Amplitudinea este afectat de fluctuaiile de selecie mari de la eantion la eantion.
Notm amplitudinea cu A. S lum exemplul timpului de rezolvare a unei sarcini: 55,5 6, 65, 54, 66, 58,
62, 61, 12, 56, 68, 67, 59, 57, 60, 145 (exprimat n zecimi de secund). n acest caz, avem doua valori
extreme, foarte puternic distanate de restul valorilor, i anume valorile 12 si 145, care aparin, probabil,
n primul caz unui supradotat, iar n al doilea unui hipofren (denumire folosit pentru a desemna o
persoan cu randament intelectual de limit). Dac valorile de acest gen sunt intr-un numr foarte mic,
se pot elimina practic din operaiunile de grupare. Dac la datele amintite am efectua calculul
amplitudinii, vom gsi o valoare de cteva ori mai mare dect n cazul n care le eliminm din calculele
noastre. n primul caz, amplitudinea se calculeaz n modul urmtor: Xmax Xmin +1=145 12 + 1= 134.

133
AUREL STAN

n cazul eliminrii valorilor puternic distanate, avem: A = Xmax Xmin + 1 = 68 54 + 1 = 15. Ultima
determinare a amplitudinii este evident mai realist, deoarece este amplitudinea care caracterizeaz
majoritatea datelor. Amplitudinea nu ine cont de forma repartiiei, deoarece ntre limitele de variaie se
poate obine aceeai valoare pentru amplitudinea unei curbe de frecvente simetrice sau unei curbe de
frecvene n form de J, I sau U.
Abaterea medie este media aritmetic a abaterilor valorilor individuale ale variabilei X fa de
media aritmetic a valorilor distribuiei luate n valoarea absolut. Vom nota acest indicator de
mprtiere cu AM. Pentru distribuii negrupate vom utiliza urmtoarea formul pentru calculul abaterii

medii: AM. =
XX , n care cu X se noteaz variabila, cu X media distribuiei i cu N numrul
N
total al valorilor variabilei. Dac vom nota cu x diferena X - X , vom avea urmtoarea formul pentru

calculul abaterii medii pentru date negrupate: AM =


x . Variabila x se numete variabil de
N
deviaie. n cazul n care avem variabilele grupate pe variante de variaie, vom utiliza urmtoarele

formule: AM =
f X X sau AM =
f x
, n care cu f se noteaz frecvena variantei de variaie
N N
Prezentm, n continuare, tabelele care se ntocmesc pentru evidenierea etapelor calculrii abaterii
medii pentru variabile negrupate (i neordonate) i pentru variabile grupate de variante de variaie.
Exemplele cuprind valori diferite:
Variabile negrupate ( i neordonate) Variabile grupate pe variante de variaie
Nr.crt. X x (X- X ) x Nr.crt. X f FX x fx fx
1 12 -4 4 1 14 3 42 -8 - 24 24
2 13 -3 3 2 16 6 96 -6 - 36 36
3 19 3 3 3 19 9 171 -3 - 27 27
4 20 4 4 4 21 13 273 -1 - 13 13
5 14 -2 2 5 23 17 391 1 17 17
6 16 0 0 6 24 12 288 2 24 24
7 15 -1 1 7 25 9 225 3 27 27
8 17 1 1 8 26 5 130 4 20 20
9 18 2 2 9 28 2 56 6 12 12
144 0 20 76 1672 0 200
Tabelul 21. Cuprinde etapele decalcul pentru determinarea abaterii medii

n tabelul din stnga s-au fcut urmtoarele notaii n coloane:

X valorile variabilei;
x valorile variabilei de deviaie;
x - valorile variabilei de deviaie n valoarea absolut.
Valoarea medie pentru valorile tabelului cu variabile negrupate se obine prin aplicarea formulei

anunate anterior: X =
X = 144 = 16 . Rubrica x se obine scznd din valoarea mediei distribuiei
N 9

134
STATISTIC I

valoarea variabilei. Astfel, prima valoarea din rubrica x, egal cu 4, se obine efectund scderea
12-16, a doua valoarea, egal cu 3, se obine efectund scderea 13 - 16, .a.m.d. Se observ uor
faptul c suma abaterilor variabilelor de la medie este egal cu 0. Abaterea medie se poate calcula
doar prin adiia valorilor absolute care sunt trecute n rubrica notat cu x . Suma valorilor absolute a
deviaiilor de la medie este egal cu 20. Dup ce aflm aceast valoare putem trece la aplicarea

formulei pentru calculul abaterii medii. AM=


x =
20
= 2,22 .
N 9
n tabelul din dreapta s-au fcut urmtoarele notaii n coloane:
X - valorile variantelor de variaie;
f - Frecvenele variantelor de variaie;
fX - valorile produsului dintre variantele de variaie i frecvenele acestora;
x - valoarea variabilei de deviaie;
fx - valorile produsului dintre variabila de deviaie i frecvena variantelor de variaie;
f x - valorile produsului dintre variabila de deviaie n valoare absolut i frecvenele variantelor
de variaie.
n acest tabel f = N = 76 , deci avem n total 76 de valori ale variabilei X (care sunt grupate n
9 variante de variaie). Pentru a trece la calculul abaterii medii trebuie s calculm, n primul rnd,
media aritmetic.

X=
(fX ) = 1672 = 22 . n tabelul din dreapta suma de la rubrica fx este egal cu 0 i nu
N 76
cea de la rubrica x, din cauza existenei frecvenelor pentru variantele de variaie. Pentru calculul
abaterii medii folosim suma de la rubrica f x care este egal.cu 200. Dup calcularea acestor valori

putem trece la calculul abaterii medii. AM =


(f x ) = 200 = 2,63
N 76

Variana i abaterea standard se gsesc ntr-o strns legtura una cu alta. Valoarea abaterii
standard se obine prin extragerea rdcinii ptrate din valoarea varianei. Aceti doi indicatori de
mprtiere sunt foarte frecvent utilizai n demersurile analizei statistice n toate domeniile de activitate.
Variana sau dispersia este un indicator sintetic care prezint o importan accentuat, deoarece cu
ajutorul ei se studiaz influena factorilor care acioneaz n cadrul mulimilor de date. Variana se
calculeaz ca medie aritmetic a ptratelor abaterilor valorilor individuale ale unei variabile de la media
lor aritmetic. Reamintim faptul c suma acestor abateri este egal cu 0, motiv pentru care fiecare
valoare individual a abaterii se ridic la ptrat naintea operaiei de adiie.
Vom nota variana unei distribuii prin s2 i abaterea standard prin s. Formula pentru calcularea

varianei sau dispersiei pentru valori negrupate ale unei variabile este: s2 =
x 2

. Corespunztor
N
explicaiilor anterioare, formula abaterii standard pentru acelai fel de valori ale variabilei este

135
AUREL STAN

urmtoarea: s =
x .
2

N
Ridicarea la ptrat nu trebuie considerat un procedeu artificial, deoarece simpla suma a
abaterilor de la medie ar da in mod automat zero. Ridicarea la ptrat este cel mai simplu procedeu
pentru a asigura datelor acelai semn. Ca i alte calcule ale indicatorilor statistici avem cazul datelor
negrupate i cazul datelor grupate
Rubricile necesare calculului le prezentm n tabelul care urmeaz:

Nr. crt. X x x2 Tabelul 22. Cuprinde etape de clacul pentru determinarea


1 11 -6 36 varianei i abaterii standard (date negrupate)
2 14 -3 9
3 16 -1 1 n primul rnd se calculeaz media cu formula
4
5
18
20
1
3
1
9 specific datelor negrupate: X =
X = 170 = 10,00 .
N 10
6 22 5 25
7 17 0 0 Dup ce am calculat valoarea mediei trecem la
8 18 1 1 completarea rubricii x, care se obine din efectuarea
9 15 -2 4 diferenei dintre fiecare valoare individual a variabilei X i
10 19 2 4
valoarea mediei aritmetice ( X = 10,00 ). Apoi trecem la
170 0 90
realizarea rubricii x2 prin ridicarea la ptrat a fiecrei valori
din rubrica x.. Dup ce am nsumat valorile din rubrica x2 (x2 = 90), putem trece la calcularea varianei

i a abaterii standard. s 2
=
x =
2
90
= 9,00 i s =
x2
=
90
= 9 = 3.
N 10 N 10
n cazul n care avem date grupate pe variante de variaie, se ntocmete tabelul (date fictive):
Date grupate pe variante de variaie
Nr.crt X f fX x x2 fx2
1 17 2 34 - 5,23 27,35 57,71
2 19 5 95 - 3,23 10,43 52,16
3 20 9 180 - 2,23 4,97 44,76
4 21 13 273 - 1,23 1,51 19,67
5 22 18 396 - 0,23 0,05 0,95
6 23 12 276 0,77 0,59 7,11
7 24 10 240 1,77 3,13 31,33 Tabelul 23. Cuprinde etape de clacul
8 26 6 156 3,77 14,21 85,28 pentru determinarea varianei i
9 28 3 84 5,77 33,29 99,88 abaterii standard (date grupate pe
78 1734 395,85 variante de variaie)

Explicaia rubricilor a fost dat la tabelele constituite anterior. Avem un total de 78 de valori.

Aplicm formula pentru calcularea mediei: X =


(fX ) = 1734 = 22,23
Rubrica x se constituie prin
N N
scderea valorii 22,23 din valorile variantelor de variaie. Din aplicarea formulei pentru calcularea

varianei rezult: s2 =
(fx ) = 395,85 = 5,075. Abaterea standard se obine prin extragerea rdcinii
2

N 78
ptrate din valoarea varianei.

136
STATISTIC I

s= s 2 = 5,075 = 2,25
Pentru calcularea varianei i abaterii standard n condiiile existenei unei distribuii de valori pe
intervale de variaie avem la dispoziie formule care utilizeaz variabila codificat u. Utilizarea unor
astfel de variabile asigur n calcul valori numerice relativ mici. Formula pentru calcularea varianei este:
(fu 2 ) (fu ) 2
s2 = i2*
. Pentru calcularea abaterii standard putem n aplicare urmtoarea
N N

(fu ) (fu )
2 2
formul: s = i*

. Se observ clar c valoarea abaterii standard care se va
N N

obine este rdcin ptrat din valoarea varianei.
Oferim pentru exemplificare urmtoarea grupare pe intervale de variaie:

Valori grupate pe intervale de variaie


Nr.crt Interval (i = 5) f u fu u2 Fu2
1 19 23 9 - 3 - 27 9 81
2 24 28 13 - 2 - 26 4 52
3 29 33 19 - 1 - 19 1 19
4 34 38 24 0 0 0 0
5 39 43 20 1 20 1 20
6 44 48 14 2 28 4 56
7 49 - 53 10 3 30 9 90
109 6 318
Tabelul 24. Cuprinde etape de clacul pentru determinarea varianei i abaterii standard (date grupate pe intervale
de variaie)

Am explicat anterior modul cum se stabilesc valorile variabilei u. n acest exemplu am fixat
arbitrar valoarea u = 0 n dreptul intervalului modal, adic intervalul care are cea mai mare frecven
(intervalul 34 38, care are frecvena 24). Prin i am nota mrimea intervalului (i = 5)
Aplicnd formula varianei vom obine:
318 6 2
s2 = 25 = 25[2,91 0,003] = 72,5. Abaterea standard o obinem prin extragerea
108 108
rdcinii ptrate din aceast valoare. s = 72,5 = 8,51 ( prin aproximare 8,5).
Menionm o proprietate matematic important a abaterii standard care are aplicaii frecvente n
domeniul nostru de interes. Amplitudinea unei curbe normale Gauss-Laplace poate fi aproximat
satisfctor de urmtoarea formul: A = 6 s. n sectorul distribuiei cuprins ntre valoarea mediei i o
mrime a abaterii standard se gsesc aproximativ 68% din valorile unei distribuii. ntre valoarea mediei
i dou mrimi ale abaterii standard se afl aproximativ 95% din valorile unei distribuii normale
Gauss-Laplace, iar ntre valoarea mediei aritmetice i trei mrimi ale mrimi ale abaterii standard se
gsesc 99,958% din valorile distribuiei.
S lum exemplul unei distribuii de 118 de rezultate, avnd media aritmetic egal cu 64 i
abaterea standard egal cu 8. ntre valoarea 56 (64 8) i valoarea 72, (64 + 8) se vor gsi aproximativ

137
AUREL STAN

68% dintre valorile distribuiei. ntre valoarea 48 (64 (28)) i valoarea 78 (64 + (28)) se vor gsi
aproximativ 95% dintre valori. ntre valoarea 40 (64 (38)) i valoarea 88 (64 + (38)) se vor gsi
aproximativ 99,958% dintre valorile distribuiei, deci marea majoritate a acestor valori.
Aceast proprietate a abaterii standard ntr-o distribuie teoretic Gauss-Laplace are aplicaii n
construirea etaloanelor testelor. Rezultatul cantitativ global obinut de un subiect la un anumit test
psihologic poart denumirea de scor. Scorul este o nsumare rezultatelor obinute la componentele
elementare ale testului, componente care poart denumirea de itemi. Cunoaterea scorului unui anumit
subiect la un anumit test nu ne poate oferi aprecierea valoric a subiectului, deoarece aceasta se face
prin raportare la valorile obinute la respectivul test de un grup, numit i grup de referin (care trebuie
s ndeplineasc o serie de exigene privind omogenitatea). Aceast situaie de incertitudine valoric a
scorului n privina unui subiect se datoreaz i amplitudinii foarte diferite a distribuiilor valorilor oferite
de teste. Astfel, la testul Bourdon-Amfimov (destinat diagnosticrii ateniei concentrate) se pot obine
scoruri ntre 1 i 776. La testul M.P. Raven (folosit n diagnosticul inteligenei) se pot obine scoruri ntre
1 i 60 i la testul AD-P (atenie distributiv Praga) se pot obine scoruri ntre 1 i 100. n acest caz, nu
putem compara randamentul exprimat prin scorul 245, obinut de un subiect la testul Bourdon-Amfimov,
cu randamentul exprimat prin scorul 172, obinut de acelai subiect la testul Kraepelin, sau cu
randamentul exprimat prin scorul 33, obinut la testul M.P Raven. Chiar dac testele amintite ar avea
aceeai amplitudine a scorurilor, randamentele obinute de un grup de subieci la respectivele teste ar
putea fi foarte diferite. Iat de ce, scorurile testelor (pentru a putea fi pune n eviden valoarea unui
randament individual) trebuiesc raportate la scale valorice cu acelai numr de trepte, care sunt
stabilite dup ce testul a fost efectuat de un grup de referin (difereniat n funcie de scor, vrst,
mediu de provenien, nivel de studii etc.). Aceste scale standardizate se construiesc respectnd o
serie de exigene i viziuni teoretice. Numrul treptelor scalelor pe care dorim s facem aprecierea
rezultatelor subiecilor se stabilete n funcie de oportunitile situaiei de evaluare n care ne aflm.
Vom efectua o gradare pe curb a unei scale cu 7 trepte (A, B, C, D, E, F, G), deci un numr
impar de trepte. Utilizm exemplul dat anterior (distribuie de 118 scoruri, avnd media egal cu 64 i
abaterea standard egal cu 8). n primul rnd, trebuie stabilit baza de gradare, notat de noi cu BG.
A
Formula bazei de gradare este: BG = , n care A este amplitudinea distribuiei i k numrul de clase
k
n care dorim s facem gradarea pe curb. Amplitudinea distribuiei poate fi foarte bine aproximat
ntr-o distribuie teoretic Gauss-Laplace prin nmulirea abaterii standard cu 6, aa cum am explicat
anterior. Deci, A=68 = 48. Dup ce am aflat valoarea amplitudinii putem trece la calcularea bazei de
48
gradare BG = = 6,86. n cazul unui numr impar de clase, vom mpri baza de gradare la 2
7
BG
( = 3,43 ). Pentru delimitarea limitei inferioare a clasei centrale, clasa D, vom scdea din valoare
2
mediei jumtate din baza de gradare i pentru delimitarea limitei superioare a acesteia vom aduna la
valoarea mediei jumtate din valoarea bazei de gradare. Limita inferioar a clasei centrale va fi 61,57
(64 3,43 = 60,57) i limita superioar 67,43 (64 + 3,43). Delimitarea claselor inferioare i superioare
ale clasei D se va face prin scderi succesive, respectiv adunri succesive, la limitele clasei centrale a
ntregii valori a bazei de gradare. Astfel pentru delimitarea limitei inferioare a clasei C vom scdea:
60,57 6,86 = 53,71. Pentru stabilirea limitei inferioare a clasei B vom scdea, din nou, 6,86 din

138
STATISTIC I

valoarea rezultat anterior (54,71 6,86 = 46,85). Orice valoarea mai mic de 46,85 va face parte din
clasa A. Pentru calcularea limitelor claselor din dreapta clasei centale D procedm prin adunarea
succesiv a bazei de gradare. Astfel, pentru delimitarea limitei superioare a clasei E vom aduna la limita
superioar a clasei D valoarea ntreag a bazei de gradare (67,43+6,86=74,29). Pentru calcularea
limitei superioare a clasei F vom aduga la valoarea rezultat din ultima adunare valoarea ntreag a
unei baze de gradare (74,29 + 6,86 = 81,15). Orice valoare mai mare dect 81,15 va face parte din
clasa G. Redm ntr-un tabel clasele rezultatele:

Nr.crt. Clasa Limite clasei ntregire


1 A 46,84 47
2 B 46,85 53,70 49 54
3 C 53,71 60,56 56 61
4 D 60,57 67,43 63 67
5 E 67,44 74,29 68 74
6 F 74,30 81,15 75 - 81
7 G 81,16 82
Tabelul 25. Cuprinde determinarea claselor standard prin procedeul gradrii pe curb

Facem precizarea c, n cazul n care valorile rezultatelor nu se prezint cu zecimale, putem


proceda la ntregirea limitelor claselor. Astfel, valoarea 47,84 din clasa A va deveni 48, Pentru a nu crea
confuzii n privina apartenenei unui rezultat la o anumit clas, limita inferioar a clasei urmtoare va fi
mrit cu o unitate i vom ntregi limita superioar a clasei urmtoare. Dac valoarea aflat dup virgul
depete 0,5 ntregirea se va face prin adugire, iar dac aceast valoarea este mai mic de 0,5,
ntregirea se va face prin scdere. Astfel 54,70 va deveni 55 iar 64,43 va deveni 64.
Micile deplasri ale limitelor claselor n urma operaiei de ntregire nu afecteaz semnificativ
valoarea acestora.
n cazul n care numrul de clase n care dorim s facem gradarea pe curb este par (6,8,10), se
procedeaz direct la adiia,respectiv scderea, bazei de gradare din medie, fr a o mai mpri pe
aceasta n dou (n cazul unui numr par de clase nu mai avem o clas central)
Prin intermediul abaterii standard i a mediei putem efectua i conversiuni ale valorii distribuiilor,
obinndu-se aa-numitele variabile normate. Cele mai cunoscute dintre aceste variabile sunt variabilele
XX
z. Formula pentru transformarea scorurilor brute n variabile normate z este urmtoarea: z = ,
s
n care X este variabila original, X este media aritmetic a distribuiei originale i s abaterea standard.
Dac transformm toate variabilele originale ale unei distribuii n variabile normate z obinem o nou
distribuie, care are media 0 i abaterea standard 1. Noile variabile vor avea majoritatea valorilor ntre
3 i 3, indiferent care vor fi valorile variabilelor originale. Forma unei distribuii nu se schimb prin
aceast transformare. Ce ne spune, de fapt, o anumit valoare z? Ea ne d informaii asupra distanei,
exprimat n abateri standard, dintre o valoare a distribuiei i medie. O valoare z = -1,22 ne informeaz
asupra faptului c respectiva valoare se gsete plasat n stnga mediei (unde se gsesc plasate
valorile mai mici dect media), i anume la o deprtare de -1,22 abateri standard de medie. O valoare z
= 2,34 ne indic faptul c respectiva valoare se gsete la dreapta medie (acolo unde se gsesc
valorile mai mari dect media) la deprtare de 2,34 abateri standard. Valoarea z ne permite s facem
aprecieri poziiei relative a unui rspuns n ansamblul rspunsurilor. Aceste fapt este posibil datorit

139
AUREL STAN

proprietilor matematice ale distribuiei Gauss-Laplace, denumit i distribuia normal. ntr-o astfel de
distribuie teoretic (construit prin intermediul unei funcii matematice) valorile mediei, medianei i
modulului se confund. La acest gen de distribuie exist a perfect simetrie a valorilor n jurul mediei.
Tabele matematice special realizate pentru acest scop ne indica ce cuantum procentual din efectivul
total se afl ntre medie i a anumit valoare a distribuie. Prin deducie se poate stabili acest cuantum
ntre dou valori oarecare ale distribuiei. Pentru a putea efectua o astfel de determinare trebuie s
consultm tabelul de valori cuprins n anexele lucrrii, intitulat Tabelul legii normale reduse.
n prima coloan (z) a tabelului sunt trecute valori progresive z cu rata de 0,1 (0,0; 0,1; 0,2; 0,3
.a.m.d. ). Ele formeaz capete de linii Aceste valori merg pn la z = 4,00. Am precizat anterior c
valorile z pot oscila pn la 3. Acest lucru este valabil n marea majoritate a cazurilor. ntr-un foarte mic
numr de cazuri (100% - 99,958%) variabilele normate z pot primi valori mai mare dect 3. n prima linie
(z) sunt trecute valori z progresive cu rata de 0,01 (0,00; 0,01;. 0,02; 0,03 .a.m.d.). Aceste valori
formeaz capete de coloane. Aceste fraciuni de valori z merg pn la 0,09. Din intersecia irurilor de
valori care porneasc din capetele de linii i a celor care pornesc din capetele de coloan putem indica
proporiile rezultate (sau procente, dac nmulim cu 100 proporia) care se gsesc n afara unui interval
valoric format din variabile z. Dac cunoatem proporia de rezultate din efectivul total care se afl n
afara unui interval valoric z, putem foarte simplu s aflm ct se afl n interiorul acestui interval. S
lum exemplul unei valori z = 1,42. Pentru a afla informaia dorit vom citi din tabel proporia aflat la
intersecia liniei 1,4 i coloanei 0,02 (1,4 + 0,02 = 1,42).

z 0,00 0.01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0
0,1
0,02
.. .
1,4 0,15561
Tabelul 26. Cuprinde exemplificare pentru modul de lucru cu tabela legii normale reduse

La aceast intersecie vom afla proporia 0,15561, aproximativ 0,16. Ce semnific aceast
proporie? Ea semnific faptul c n afara intervalului exprimat n valori z) - 1,42 i 1,42 se gsete
aproximativ 0,16 din efectivul total al distribuiei sau 16% din efectivul acestei distribuii. n interiorul
intervalului se va afla 0,84 din efectivul acestei distribuii (1,00 0,84) sau, exprimat procentual, 84 %
din acest efectiv. Proporia aflat n afara intervalului amintit (0,16) se afl plasat la cele dou capete
opuse ale distribuiei. Jumtate din aceast proporie (0,08) se afla n stnga variabilei z = -1,42 (valori
mai mici dect aceasta) i cealalt jumtate (0,08) se va afla la dreapta valorii variabilei z = 1,42 (valori
mai mari dect aceasta. Dac transformm scorul brut al unui subiect n variabile z i obinem valoarea
-1,42 aceasta semnific faptul c subiectul respectiv a obinut un rezultat mai bun dect 0,08, sau,
exprimat procentual, 8% din totalul rezultatelor subiecilor i mai slab dect 0,92 sau, exprimat
procentual, 92% din totalul subiecilor (100%-0,08). Dac dup transformarea scorurilor brute un subiect
obine o valoarea z = 1,42, aceasta semnific faptul c 0,92 sau, exprimat procentual, 92% din totalul
rezultatelor sunt mai slabe dect rezultatul obinut respectivul subiect. Doar 0,08 (sau 8%) din totalul
rezultatelor vor fi mai bune dect rezultatul obinut de respectivul subiect.
O aplicaie frecvent a tabelului legii normale reduse este calcularea cotei procentuale de subieci
existeni n claselor determinate prin gradarea pe curb. Lum exemplul dat anterior, n care distribuia

140
STATISTIC I

rezultatelor a 118 subieci avea o medie de 64 i o abatere standard de 8. Pentru aceasta transformm
limitele superioare a claselor stabilite n variabile z. Pentru aceasta lum n consideraie primele 3 limite
superioare ale claselor stabilite i ntocmim urmtorul tabel:

Nr.crt. Variabile originale Variabile z Proporie tabelar njumtire


1 46,84 - 2,145 0,0323 0,016 ( sau 1,6%)
2 53,70 - 1,287 0,1970 0,0985 (9,85%)
3 60,56 - 0,375 0,667 0,333 (33,3%)
Tabela 27. Cuprinde exemplificare pentru determinarea proporiilor suprafeei curbei normale Gauss prin
intermediul valorilor z

Deci, clasa A va avea conine 0,016 rezultate ale subiecilor sau 1,6% dintre acestea. Deoarece
modul de construire a claselor se bazeaz pe simetria acestora, clasa G care este simetric clasei A va
conine , de asemenea, 1,6% dintre rezultatele subiecilor. Deosebirea const n aceea c 1,6% din
rezultatele coninute de clasa A sunt cele mai slabe, pe cnd 1,6% din rezultatele coninute de clasa G
sunt cele mai bune. Pentru a afla proporia de subieci existeni n clasa B vom scdea din proporia
0,0985 proporia 0.016 i se va obine rezultatul 0,0825. Scderea este justificat de faptul c 0,0985
conine proporia rezultatelor claselor A i B. Clasa simetric clasei B este clasa F, care va conine, de
asemenea, 0,0825 din ansamblul rezultatelor subiecilor sau, exprimat sub form procentual, 8,25%
din efectivul total al rezultatelor. Pentru a afla proporia clasei C se va scdea din 0,333 proporia
0,0985 (coninut de clasele A i B la un loc).Va rezulta proporia 0,234 sau, exprimat sub form
procentual 23,4% din total. Clasa simetric clasei C este clasa E, care va avea aceeai proporie de
rezultate. Procentul clasei centrale D se va afla scznd din valoarea 1,00 sumele proporiilor celorlalte
clase. Vom avea:
1,00-(20,016)-(20,0825)-(20,234)=1,00-0,665=0,335.
n exprimare procentual clasa central D va conine 33,5 % din totalul rezultatelor.

n tabelul care urmeaz transformm proporiile i procentele n valori absolute:

Nr.crt Clasa Limite clasei ntregire % din total Valori absolute ntregire
1 A 46,84 47 1,6,5% 0,016*118 = 1,88 2
2 B 46,85 53,70 48 54 8,25,0% 0,0825*118 = 9,73 10
3 C 53,71 60,56 55 - 61 23,4% 0,234*118 = 27,61 28
4 D 61,57 67,43 62 - 67 33,5% 0,335*118 = 39,53 40
5 E 67,44 74,29 68 - 74 23,4% 0,234*118 = 27,61 28
6 F 74,30 81,15 75 - 81 8,25,0% 0,0825*118 = 9,73 10
7 G 81,16 82 2,5% 0,016*118 = 1,88 2
TOTAL 100% 120
Tabelul 28. Cuprinde exemplificare pentru determinarea proporiile claselor normalizate

Operaiunea de ntregire este necesar, deoarece nu are sens s se spun c ntr-o clas se afl
rezultatele a 1,88 de subieci. n urma analizei acestui tabel se poate spune c 2 dintre subieci au
obinut rezultate care-i situeaz n clasa A (cele mai bune rezultate), 10 subiecii au obinut rezultate
care-i situeaz n clasa B, a doua clas valoric, .a.m.d. Jocul ntregirilor face ca suma total s fie
puin mai mare (120, n loc de 118). Observm c aceste clase construite pe baza mediei i a abaterii

141
AUREL STAN

standard sunt egale ca valoare (jocul aproximrilor face s existe mici diferene), dar nu i n privina
numrului de rezultate ale subiecilor coninute n ele. Acest gen de mprire n clase este realist,
deoarece rezultate de excepie i rezultate foarte slabe obin un numr foarte mic de subieci.
Variabilele normate z sunt foarte utile n indicarea poziiei relative a rezultatului unui subiect n
ansamblul rezultatelor ansamblului subiecilor
n cadrul variabilelor z sunt foarte evidente, trei deficiene: valoarea foarte mic a amplitudinii (de
la 3 la 3), obinerea de valori negative i exprimarea sub form zecimal, fr posibilitatea ntregirii
(deoarece, n unele cazuri, s-ar deforma semnificativ valoarea unui rezultate. Pentru a se remedia
aceste deficiene s-au creat alte tipuri de variabile normate, care se obin tot printr-o transformare liniar
pornind de la medie i abatere standard. Teoretic se pot calcula o infinitate de tipuri de variabile
normate bazate pe transformri liniare, dar, n practic se utilizeaz un numr restrns, dintre care
amintim variabilele T, create de McCall, i variabile Hull, create de un cercettor american cu acelai
nume. Formula pentru transformarea variabilelor originale a unor distribuii n variabile normate T este

urmtoarea: T = 50 +
10
s
[ ]
X X . Dac transformm toate valorile originale ale unei distribuii dup

formula amintit anterior obinem o nou distribuie care va avea valoare mediei aritmetice egal cu 50
X X
i valoarea abaterii standard egal cu 10. Dac avem n vedere faptul c z= , formula se poate
s
scrie i n modul urmtor: T= 50 + 10 z. Noile valori obinute dup transformare vor oscila aproximativ
ntre 18 i 82. Pentru a avea la dispoziie variabile normate care s oscileaz ntre 1 i 100 (cu
aproximaie), foarte comode de utilizat n practic, s-au creat variabilele Hull, avnd urmtoarea formul

de constituire: H = 50 +
14
s
[ ]
X X . Formul alternativ de constituire este: H = 50 + 14z. Dac

transformm toate valorile originale ale unei variabile dup formula lui H vom obine o nou distribuie
cu media 50 i abaterea standard egal cu 14.
Atenionm asupra faptului c variabilele normate i pierd valoarea practic de utilizare dac
distribuia empiric (distribuie ale crei valori sunt obinute dintr-o cercetare concret) se deosebete
semnificativ de o distribuie normal Gauss-Laplace. Distribuiile empirice i cele teoretice sunt diferite
n marea majoritate a cazurilor. Este important de a ti dac aceast diferen este semnificativ sau
nu. Pentru a stabili aceast difereniere exist anumite proceduri statistice.
Exemplu de transformare n variabile normate z, T i H. S presupunem c avem o distribuie
empiric cu media egal cu 73 i abaterea standard de egal cu 15. Ne propunem s transformm
valorile variabilei X egale cu 37, 63, 78, 85, 92 , conform formulelor stabilite pentru variabile normate z,
T i H. n mod uzual, n domeniul aplicrii testelor psihologice pentru denumirea unei operaiuni de
acest gen se folosete expresia transformare a scorurilor brute n note z, T i H. Nu procedm la
ntregirea notelor z, deoarece deformarea rezultatului ar fi semnificativ atunci cnd este vorba de o
cifr mic. La notele T i H deformarea rezultatelor prin ntregire este nesemnificativ. Formulele de
transformare sunt cele pe care le-am expus anterior. Faptul transformrii presupune c anterior ne-am
asigurat de existena condiiilor care o permite. n cazul existenei unor asimetrii puternice, operaiunea
de transformare nu ne este de folos practic.

142
STATISTIC I

Nr.crt. Variabila original X Note z Note T ntregire Note H ntregire


1 37 - 2,40 26 26 16,40 16
2 63 - 0,67 43,33 43 40,67 41
3 78 0,33 53,33 53 54,67 55
4 85 0,80 58 58 61,20 61
5 92 1,27 62,67 63 67.33 67
Tabelul 29. Cuprinde exemplificare pentru transformarea valorilor brute n note standard

III.5. STABILIREA ABATERII QUARTILE


Abaterea quartill, notat cu Q, este un indicator de apreciere a mprtierii, care se calculeaz
prin mprirea la 2 a diferenei dintre valoarea quartilului 3 (Q3) i cea a quartilului 1 (Q1). Intervalul
( X 1Q ) cuprinde 50% din rezultatele unei distribuii. Amplitudinea unei distribuii are aproximativ 7,5
abateri quartile. Relaia se verific mai ales n situaia n care distribuia empiric se conformeaz
exigenelor teoretice unei distribuii normale Gauss-Laplace. Se poate efectua o gradare pe curb prin
folosirea medianei i abaterii quartile, aa cum s-a fcut cu media i abaterea standard. Oferim un
exemplu concret pentru calcularea abaterii quartile. S presupunem c media unei distribuii este egal
74, quartilul 3 (Q3) este egal cu 85 i quartilul 1 (Q1) este egal cu 62. Numrul de rezultate ale
subiecilor este egal cu 186 (N = 186) Modul de stabilire a acestor forme particulare a quantilelor l-am
tratat anterior. Dup aflarea celor dou valori, putem trece la calculul abaterii quartile.
Q 3 Q1 85 62
Q= = = 11,5 . ntre valorile 62,5 (74 11,5) i 85,5 ( 74 + 11,5) se gsesc aproximativ
2 2
50% dintre rezultate (93 de rezultate).

III.6. STABILIREA INDICATORILOR DE ASIMETRIE


Indicatorii de nivel i de mprtiere au un mare rol n descrierea unora din caracteristicile unei
distribuii, dar sunt insuficieni pentru formarea unei imagini complete asupra tendinelor care exist n
aceasta. Distribuiile pot s aib medii i variane egale, dar s nu fie la fel de simetrice. Stabilirea
indicatorilor de asimetrie prezint importan n aprecierea existenei unor influene n irul de date
(datorate compoziiei eantionului sau erorilor de construcie a unui test psihologic, de exemplu)
Apreciere asimetriei unei distribuii se poate face n cel mai simplu mod prin compararea valorilor mediei
i medianei. Cnd media este inferioar medianei avem o asimetrie negativ. Dac mediana este
inferioar mediei avem o asimetrie pozitiv a distribuiei de valori. Asimetria negativ presupune
ngrmdirea de valori n dreapta mediei, adic existena mai multor valori superioare mediei dect
cele inferioare acesteia. Cnd valorile mai mici dect media sunt n numr superior celor mai mari dect
aceasta suntem n situaia unei asimetrii pozitive.
Distribuia rezultatelor la un test prezentnd o puternic asimetrie de dreapt indic deosebita
calitate intelectual a celor ce efectueaz testul (daca acest test este de inteligen) sau a modului de
construcie a probei psihologice (cu prea multe situaii problematice uoare). n cazul n care avem drept
scop s selectm o categorie de personal puternic performanta, se urmrete deliberat asigurarea
asimetriei de stnga n timpul construciei probei. Amintim c astfel de procedee de construcia sunt de
excepie. n majoritatea cazurilor, constatarea unei asimetrii semnificative a rezultatelor constituie un
semnal pentru remedierea construciei probelor.
Procedeul simplei comparaii a mediei i medianei are o valoare aproximativ. Egalitatea

143
AUREL STAN

medianei mediei nu ne asigur n privina simetriei unei distribuii. n cazul n care dorim sa fim mai
precii trebuie sa calculam o serie de indicatori. Unul dintre acetia se bazeaz pe diferena dintre

medie i median. l vom nota cu S. Formula este urmtoarea: S =


(
3 X Md )
n care cu X am notat
s

media, cu Md mediana i cu S indicatorul de asimetrie. n alt caz vom folosi formula: S =


x 3

, n care
Ns 3
S este indicatorul de asimetrie (Skwenes), x este variabila de deviaie (X- X ), N este efectivul total i s
abaterea standard a distribuiei. n cazul variabilelor grupate se folosete la numrtor fx 3
. Vom
folosi tabelul cu date grupate pe variante de variaie creat pentru exemplificarea etapelor de calcul n
vederea determinrii mediei aritmetice.
Date grupate pe variante de variaie
Nr.crt X f fX x x2 fx2 x3 fx3
1 17 2 34 - 5,23 27,35 54,71 - 143,06 - 286,11
2 19 5 95 - 3,23 10,43 52,16 - 33,70 - 168,49
3 20 9 180 - 2,23 4,97 44,76 - 11,09 - 99,81
4 21 13 273 - 1,23 1,51 19,67 - 1,86 - 24,19
5 22 18 396 - 0,23 0,05 0,95 0,01 0,22
6 23 12 276 0,77 0,59 7,11 0,46 5,48
7 24 10 240 1,77 3,13 31,33 5,55 55,45
8 26 6 156 3,77 14,21 85,28 53,58 321,50
9 28 3 84 5,77 33,29 99,88 192.10 576,30
78 1734 395,85 380,35
Tabelul 30. Cuprinde exemplificare pentru etapele de calcul necesare stabilirii indicatorului de asimetrie
Pentru a avea la dispoziie toate datele aplicrii formulei coeficientului de asimetrie S va trebui s
calculm abaterea standard a distribuiei. Aplicm formula pentru calcularea abaterii standard pentru
variabile grupate pe variante de variaie:

s=
(fx ) =
2
380,35
= 4,87 = 2,2 . Aplicm, n continuare formula pentru calculul coeficientului
N 78

de asimetrie: S =
(fx ) = 3
380,35
= 0,45.
3
Ns 78 * 10,64
Cnd valoarea coeficientului este 0, atunci distribuia este perfect simetric. Valoarea negativ
indic o asimetrie negativ, valoarea pozitiv o asimetrie pozitiv. Valoarea obinut la distribuia
exemplificat indic o asimetrie pozitiv.

III.7. INDICATORI DE BOLTIRE SAU INDICATORI DE EXCES

Pentru a caracteriza n ntregime o distribuie de valori trebuie s adugm la indicatorii de nivel,


mprtiere i asimetrie indicatorii de exces sau de kurtosis. Kurtoza este gradul de aplatizare a unei
distribuii. Se disting n aceasta privin 3 tipuri de distribuii: distribuiile leptokurtice (ascuite), n care
se gsete un mare numr de valori cuprins la centrul distribuiei, distribuiile platicurtice care sunt
evazate i se caracterizeaz printr-o mare ntindere a scorurilor i distribuiile mezocurtice, reprezentate
printr-o distribuie apropiat celei normale. Exista o formul adecvat de calcul a excesului pentru

144
STATISTIC I

(C 75 C 25) )
scalele ordinale K= . Prin K am notat coeficientul de exces, prin C75 centilul 75, prin C25
C 90 C10
centilul 25, prin C90 centilul 90 i prin C10 centilul 10. Conform acestei formule, o distribuie poate fi
considerat mezokurtic atunci cnd valoarea lui K se situeaz n jurul valorii 0,2632. Distribuia va fi
considerata drept leptokurtic atunci cnd K este mai mic dect 0,2632 i drept platicurtic cnd K este
mai mare dect 0,2632. Coeficientul de exces pentru distribuii care satisfac exigenele scalelor de

interval se noteaz, de asemenea, cu K. Formula de calcul este urmtoarea: K =


x 4

. n aceast
N * s4
formul K este coeficientul de exces a unei distribuii, x4 este puterea a patra a variabilei de deviaie
(X- X ), s4 este puterea a patra a abaterii standard a distribuiei. n cazul variabilelor grupate pe variante
de variaie la numrtor apare (f*x4). Pentru exemplificare am adaptat tabelul prezentat anterior.
Abaterea standard are aceeai valoare (s = 2,2; s4 = 23,42).
Date grupate pe variante de variaie
Nr.crt X f fX x x4 f*x4
1 17 2 34 - 5,23 748,18 1496,36
2 19 5 95 - 3,23 108,85 544,23
3 20 9 180 - 2,23 24,73 222,57
4 21 13 273 - 1,23 2,29 29,76
5 22 18 396 - 0,23 0,00 0,05
6 23 12 276 0,77 0,35 4.22
7 24 10 240 1,77 9,82 98,15
8 26 6 156 3,77 202.01 1212,04
9 28 3 84 5,77 1108,42 3325,25
78 1734 6932,62
Tabelul 31. Cuprinde exemplificare pentru etapele de calcul necesare stabilirii indicatorului de exces

n continuare, aplicm formula pentru calculul coeficientului de exces:

K=
(fx ) =
4
6932,32
=
6932,62
= 3,79
4
N*s 78 * 23,42 1826,26
Dup ultima formul folosit o distribuie este considerat mezokurtic cnd K = 3. n cazul n
care K>3 distribuia este leptokurtic, iar n cazul n care K<3 ea este platikurtic. Rezultatul obinut de
noi indic o distribuie leptokurtic.

EXERCIII

1. Se dau urmtoarele valori negrupate ale unei variabile:


15,31, 21,17, 19, 22, 27, 23, 26, 30, 20, 25,28, 27, 18, 17.
S se determine cele 4 tipuri de indicatori statistici amintii n curs.

145
AUREL STAN

2.Se dau urmtoarele valori ale unei variabile, organizate pe variante de variaie:
Nr. crt. Valorile variabilei (X) Frecvena (f)
1 21 4
2 22 5
3 23 7
4 24 11
5 25 13
6 26 20
7 27 25
8 28 30
9 29 22
10 30 19
11 31 17
12 32 13
13 33 5
14 34 3
S se determine tipurile de indicatori amintii n curs.

146
STATISTIC I

IV. MODELELE TEORETICE DE RAPORTARE

Am insistat anterior asupra faptului c o mulime de cifre rezultat din colectarea notelor brute
ale unui mare numr de persoane care au efectuat un test psihologic nu ne ofer nici o informaie
relevant dac nu realizm o serie de operaii preliminare. Ordonarea i sistematizarea acestor date
ncep s confere sens acestei mulimi de date. Realizarea histogramei, a poligonului frecvenelor, a
curbei frecventelor sau a altor forme de reprezentare spaial a distribuiilor empirice ofer imaginea
tendinei generale care exist n cadrul mulimii de date. Interpretarea unor reprezentri grafice a
distribuiilor empirice este posibil doar prin raportare la nite modele, care au o fundamentare
matematic riguroas. Cele mai frecvente raportri ale distribuiilor i reprezentrilor lor grafice se fac la
modelul distribuiei i curbei normale a lui Gauss-Laplace. Modelul amintit nu este nici mai bun, nici mai
ru dect alte modele de distribuii (modelul Poisson, modelul binomial, modelul uniform discret,
modelul Snedecor-Fisher, modelul hipergeometric)21, ci cel mai frecvent utilizat i mai adaptat datelor
oferite de cercetrile psihopedagogice.
Raportarea la distribuia normal este una din cele mai frecvente proceduri n analiza datelor
rezultate din cercetrile cantitative ale domeniului psihologic. n unele cazuri, aceast modalitate de
raportare devine un gest reflex, automatic, lipsit de discernmnt din partea cercettorului puin abilitat
n privina exploatrii metodelor cantitative. Asemnarea unei distribuii empirice cu o distribuie normal
pare s indice c cercetarea merge pe drumul cel bun, c o anumit caracteristic psihic se manifest
armonios pe ansamblul unui grup.
Este binecunoscut faptul c orice msurare capt sens prin raportarea la un model teoretic.
Curba normal Gauss-Laplace este unul din modelele cu care se opereaz n cercetarea cantitativ,
dar nu singurul. Exist alte modele frecvent utilizate, dar nu la fel de populare. De unde vine
popularitatea curbei n clopot? Aceast distribuia pare multor cercettori natural i fireasc,
manifestndu-se parc n firea lucrurilor, i probabil cred, c dac nu ar fi inventat-o celebrul
matematician german, ar fi fcut-o ei cu siguran. Acumularea de fapte de via nregistrate n
registrele oficiale ale statelor din Occident cu sistem administrativ evoluat din secolul XVII i XVII parc
anuna curba lui Gauss. Astfel, n secolul XVIII s-a remarcat o mare stabilitate a recensmntului
efectuat asupra marilor colectiviti (naterile, cstoriile, decesele). Acest fapt era interpretat ca o
manifestare a providenei, a unei ordini divine, impunnd o aezare cantitativ armonioas pentru
societate n ansamblul su, dincolo de indivizii volatili i imprevizibili.
n 1832, matematicianul german Carl-Friedrich Gauss (1777-1855), profesor la Universitatea din
Gttingen, supra-numit prinul matematicienilor stabilete o curb de erori, care va purta ulterior
numele su, oferind o reprezentare n clopot a erorilor de observaie pentru msurtori mai ales
astronomice. Curba normal a repartiiei, numit i curba normal Gauss-Laplace este simetric, are

21 O descriere a acestor modelele gsii n lucrarea lui Ilie Puiu Vasilescu, Statistic informatizat pentru tiinele despre om,
Editura militar, Bucureti, 1991, pag. 53-96, de asemenea n lucrarea Statistica aplicat n psihologie de Valentin Clocotici
i Aurel Stan, lucrare n curs de apariie la Editura Polirom.

147
AUREL STAN

vrf unic, cu ordonat maxim centrat pe medie i divizeaz repartiia valorilor n dou pri egale
(media, mediana i modul coincid). Cu ct abaterea standard este mai slab cu att curba se strnge
mai mult, se apropie asimptotic de axa x. Exist o relaie fix ntre abaterea standard a unui eantion i
procentajul poriunilor de suprafa situate sub curb ntre dou limite
Statisticianul, matematicianul i astronomul belgian Lambert Adolphe Jacques Quetelet (1796-
1874), autor al lucrrii Sur lhomme et le dveloppment de ses facults ou essai de physique sociale,
1835, a pus n eviden faptul c distribuiile obinute pe caracteristici foarte variate au aceeai alur
(ceea ce se va numi mai trziu curba n clopot) i propune o interpretare. El demonstreaz matematic
c aceast form rezult din compunerea unui mare numr de erori mici i independente unele de
altele. Abaterile, prin raportare la tendina central (valoare care corespunde vrfului curbei) vor fi nite
imperfeciuni n realizarea efectiv a unui obiect perfect. Noiunea pus n circulaie de Quetelet este
aceea de om mediu. La baza filosofrilor savantului belgian se afla considerentul c media descrie un
subiect ideal, descrcat de erorile cu care natura l-a creat. Apreciaz c media este mai adevrat
dect o valoare msurat. Omul mediu este proslvit ca expresie a adevrului. Cu toat strduina lui
Quetelet de a impune omul mediu, aceast noiune a fost o prezen foarte controversat n cmpul
preocuprilor tiinifice socio-umane.
Distribuie normal se contureaz atunci cnd o caracteristic (de exemplu, n cazul nostru,
inteligena) se nate din aciunea conjugat a mai multor surse de variaie care, firesc, o influeneaz.
Avantajele acestui tip de distribuie rezid n posibilitatea unui mai bun tratament statistic a seriilor de
rezultate repartizate ntr-un mod normal (n uniti de abateri standard).
Comentnd ntr-o lucrare presupoziiile curbei lui Gauss. Jean Jacques Bonniol i Michel Vial se
exprim poetic vorbind despre armul discret al simetriei22. Modelul gaussian a fost adoptat cu
uurin din cauza faptului c el prezint toate aparenele de eviden: simetria armonioas, calcule
simple, coeren cu (sau legitimare a) ideile existente asupra distribuiei aptitudinilor, coeren, cu
imperativele seleciei sociale i a alegerii celor mai buni, cu obinuinele mentale i socio-culturale.
Distribuia normal se verific experimental asupra variabilelor aleatoare i pare s dea seama de un fel
de lege a naturii.
Forma ca atare a curbei Gauss Laplace are o mare putere de sugestie pentru cei nclinai spre
filosofare a faptelor, obiectelor, evenimentelor lumeti. Tot ce fiineaz n aceast lume are un nceput,
o evoluie, un vrf de glorie sau de vitalitate, dup care urmeaz cderea, declinul i aneantizarea.
Fiinele de orice gen, creaiile umane, alctuirile sociale, imperiile i mririle lumeti sunt tiranizate n
existena lor de legea lui Gauss-Laplace.
Dar, distribuia normal nu este divin i universal, cum a crezut la nceput Einstein. Exist
distribuii n U, n J, n I, asimetrice de dreapta, asimetrice de stnga i altele. n scopul de a conserva
avantajele distribuiei normale se modific valorile aceste distribuii prin transformarea mai ales n valori
z sau T, adic se pun n funciune procedeele de normalizare. Generalizarea acestui model probabilist
ajunge la legea normal redus, la care se rezum cteva caracteristici. ntr-o distribuie normal
media, mediana i modul coincid, sigma sau abaterea standard delimiteaz zonele n care procentajele
sunt cunoscute i stabile.
Exemplificm noiunea de model de distribuie i deviaiile de la un model prin raportare la

22Jean Jacques Bonniol, Michel Vial, Les modles de lvaluation. Textes fondateurs avec commentaires, De Boeck &
Larcier s.a.1997, Paris, Bruxelles, pag.71

148
STATISTIC I

modelul binomial, model foarte apropiat modelului normal de distribuie. Frecvenele variantelor sau
intervalelor de distribuie sunt proporionale cu valorile urmtoarelor serii:

2 intervale: 1 1
3 intervale: 1 2 1
4 intervale: 1 3 3 1
5 intervale: 1 4 6 4 1
6 intervale: 1 5 10 10 5 1
7 intervale: 1 6 15 20 15 6 1
8 intervale: 1 7 21 35 35 21 7 1
9 intervale: 1 8 28 56 70 56 28 1

Cum citim aceste serii de valori care formeaz aa-numitul Triunghi al lui Pascal? Facem
referire la algoritmul de repartiie pentru 4 intervale. irul 1 3 3 1 semnific faptul c n modelul
binomial pentru 4 intervale, al doilea interval va avea un efectiv de trei ori mai mare dect primul, al
treilea interval va avea un efectiv de trei ori mai mare dect primul i al patrulea interval va avea un
efectiv egal cu primul. Deci, un prim efectiv de baz se multiplic conform unui algoritm.
Dac vom avea 2940 de valori ale unei distribuii empirice i dorim s le distribuim dup modelul
binomial n 9 clase pentru a putea determina ulterior ct de mult se distaneaz de acest model teoretic
o anumit distribuie empiric, procedm n felul urmtor: 1) se adiioneaz toate cifrele din dreptul
specificaiei 9 (1+8+28+56+70+56+28+8+1=326) ; 2) mprim efectivul total al distribuiei la 326
(2940:326 = 9,01, aproximativ 9); 3) valoarea rezultat o nmulim cu fiecare cifr a irului de date din
dreptul specificaiei 9 intervale.

Specificaie 9 1 8 28 56 70 56 28 8 1
Nr. interval 1 2 3 4 5 6 7 8 9
Efectiv rezultat 9 72 252 504 630 504 252 72 9

Exprimat grafic sub form de histogram, situaia rezultat se prezint astfel:

700
600
500
400
300 630
540 540
200
100 252 252
72 72
0 9 9
1 2 3 4 5 6 7 8 9

Figura 6. Organizarea cantitativ a modelului binomial n 9 clase pentru 2940 de rezultate (exprimat printr-o
histogram)

149
AUREL STAN

Exprimat sub form de curb, vom avea urmtoarea reprezentare grafic

700
630
600
540 540
500
400
300
252 252
200
100
72 72
0 9 9
1 2 3 4 5 6 7 8 9

Figura 7. Organizarea cantitativ a modelului binomial n 9 clase pentru 2940 de rezultate (exprimat printr-o
curb a frecvenelor)

Distribuia empiric (aa cum rezult dintr-o cercetare concret) deviaz foarte frecvent de la o
distribuie teoretic. n exprimare statistic se folosete sintagma pentru aceast deviaie de distan
fa de modelul teoretic. n cercetarea practic nu are importan dac o distribuie empiric se
distaneaz de una teoretic, ci dac aceast deviaie este semnificativ sau nu. Dac distana dintre
cele dou distribuii este una semnificativ, putem spune c ieim din model, situaie care modific o
serie de proceduri de raportare. Astfel, pentru valorile unei distribuii empirice nu mai au sens
exprimrile prin intermediul valorilor normalizate. Exemplificm, prin intermediul unei reprezentri
grafice realizate prin programul SPSS-10, distana ntre o distribuia teoretic i una empiric.
14

12

10

2 Std. Dev = 6,95


Mean = 24,4
0 N = 63,00
12,5 15,0 17,5 20,0 22,5 25,0 27,5 30,0 32,5 35,0 37,5

Figura 8. Exemplificare distanrii dintre o distribuie empiric (histogram pentru 63 de rezultate) i o distribuie
teoretic (curba lui Gauss)

150
STATISTIC I

Se cunosc mai multe forme de deviere sau distanare de la un model teoretic gaussian.
Exemplificrile sunt fcute din domeniul psihologic
1. Curba cu asimetrie de dreapta sau asimetrie negativ semnific faptul ca o proba psihologic
este prea uoara pentru subiecii la care a fost aplicata sau ca grupul de subieci este selecionat din
superdotai. n aceast form de asimetrie se pot detecta cu uurin subiecii foarte slabi, situai n
stnga distribuiei. I se spune pozitiv, deoarece diferena dintre valoarea mediei i valoarea medianei
d o valoare negativ

120
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10

Figura 9. Curba cu asimetrie de dreapta sau asimetrie negativ

2. Curba cu asimetrie de stnga sau asimetrie pozitiv .Semnific faptul c rezultatele unei probe
sunt foarte grele, sau faptul subiecii sunt selecionai dintre cei foarte slab dotai aptitudinal. I se spune
pozitiv deoarece diferena dintre valoarea mediei i valoarea medianei d o valoare pozitiv. Cu o
astfel de reprezentare grafic ies foarte bine n eviden subiecii buni i foarte buni.

120
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10

Figura 10. Curb cu asimetrie de stnga sau asimetrie pozitiv


3. Curba platikurtic semnific ridicarea exagerata a coeficientului de variaie. Amplitudinea
distribuiei sau plaja de variaie este foarte extins. Nu se poate observa nici o tendin de reliefare n
distribuia datelor

151
AUREL STAN

150

100

50

0
1 2 3 4 5 6 7 8 9 10 11

Figura 11. Curb aplatizat sau platikurtic


4. Curba mezokurtica este apropiat ca form curbei normale Gauss-Laplace. Semnific un
echilibru in privina repartiiei rezultatului subiecilor.

60
50
40
30
20
10
0
1 2 3 4 5 6 7 8 9

Figura 12. Curba mezokurtic

5. Curba leptokurtica semnific faptul c majoritatea datelor sunt masate n puine intervale n jurul
mediei i ngustimea coeficientului de variaie

250
200
150
100
50
0
-50 1 2 3 4 5 6 7 8 9

Figura 13. Curba leptokurtic

6. Curba bimodal (cu dublu modul) semnific faptul existenei n grupul de subieci examinai a
doua subgrupuri eterogene cu dotri aptitudinale diferite. Menionm, totodat, c acest fel de curb
rezulta i in cazul adoptrii unei tehnici de construcie a testului psihologic care-si propune s dea
rezultate sub forma dihotomic (apt-inapt, admis-respins);

152
STATISTIC I

30
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 10 11 12

Figura 14. Curba bimodal

7. Curma multimodal semnifica existena n grupul examinat a mai multor subgrupe eterogene
valoric.

40
30
20
10
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Figura 15. Curba multimodal

8. Curba n U semnific plasarea majoritii rezultatelor la extremitile plajei de variaie. n mediile


de populaie puternic divizate pe criterii etnice, rasiale sau religioase se obin astfel de rezultate n
cazuri n care se efectueaz chestionare de opinii n privina calitilor unei anumite grupri cu
eantioane compuse din numere egale de opozani;

200
150
100
50
0
1 2 3 4 5 6 7 8 9

Curba 16. Curba n U

9. Curba n I se ntlnete n cazul n care majoritatea covritoare a subiecilor se situeaz la


limita inferioar a plajei de variaie. Se ntlnesc astfel de situaii cnd transpunem grafic situaia erorilor
la proba tblielor de corectura Bourdon-Amfimov;

153
AUREL STAN

200
150
100
50
0
1 2 3 4 5 6 7 8 9 10 11

Figura 17. Curba n I

10. Curba n j. Situaia se ntlnete cnd transpunem grafic valoarea indicilor de calitate la probele
creion hrtie de atenie concentrata.

250

200

150

100

50

0
1 2 3 4 5 6 7 8 9 10 11

Figura 18. Curba n J


n interpretarea unor astfel de forme de distribuie care deviaz de la o distribuie teoretic
Gauss-Laplace este necesar o anumit elasticitate n interpretare, deoarece anumite condiii
particulare de desfurare a unui examen sau experiment favorizeaz apariia unui anumit tip de
distanare. Explicaiile pe care le-am dat noi constituie doar una din interpretri. De exemplu, la apariia
unei distribuii asimetrice pozitive se poate ntmpla ca subiecii s nu fi neles explicaiile de realizare a
unei anumite sarcini.

154
STATISTIC I

BIBLIOGRAFIE

Andrei, T., Stancu, S., Statistic - Teorie i aplicaii, Editura All, Bucureti, 1995
Dickes, P., Tournois, J., Flieler, A., Kop, J.L., La psychometrie, Presses Universitaire de Frances,
Paris, 1993
Gueguen, N., Manuel de statistique pour psychologues, Dunod, Paris, 1997
Horst, P., Messung und Vorhersage, Verlag Juliusz Beltz, Weinheim, Berlin, Basel, 1971
Lienert, G.A., Testaufbau und Testanalyse,Verlag Juliusz Beltz,Weinheim/ Berlin, 1967
Milton-Smith, G., Ghid simplificat de statistic pentru psihologie i pedagogie, Editura didactic i
pedagogic, Bucureti, 1971
Nowak, A., Metode cantitative n psihologie i sociologie,Oscar Print, Bucureti, 1998
Porojan, D., Statistica i teoria sondajului, Casa de editur ansa SRL, Bucureti, 1993
Radu, I., Miclea, M., Moldovan, O., Neme, S., Szamoskozy, S., Metodologia psihologic i analiza
datelor, Editura Sincron, Cluj, 1993
Reuchlin, M., Les Methodes quantitatives en psychologie, Presses Universitaires de France, Paris,
1962
Reuchlin, M., Precis de statistique, Presses Universitaires de France, Paris, 1975
Rotariu,T., Metode statistice aplicate n tiinele sociale, Polirom, Iai, 1999
Trebici, V. (coord), Mic enciclopedie de statistic, Editura tiinific i enciclopedic, Bucureti,
1985
arc, M., Tratat de statistic aplicat, Editura didactic i pedagogic, R.A. Bucureti, 1998
Vasilescu, I.P., Statistic informatizat pentru tiine despre om, Editura Militar, Bucureti, 1991

155
AUREL STAN

Anexa 1. Tabela legii normale reduse (probabiliti bilaterale)

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 1,00000 0,99202 0,98404 0,97607 0,96809 0,96012 0,95216 0,94419 0,93624 0,92829
0,1 0,92034 0,91241 0,90448 0,89657 0,88866 0,88076 0,87288 0,86501 0,85715 0,84931
0,2 0,84148 0,83367 0,82587 0,81809 0,81033 0,80259 0,79486 0,78716 0,77948 0,71182
0,3 0,76418 0,75656 0,74897 0,74140 0,73386 0,72634 0,71885 0,71138 0,70395 0,69654
0,4 0,68916 0,68181 0,67449 0,66720 0,65994 0,65271 0,64552 0,63836 0,63123 0,62413
0,5 0,61708 0,61005 0,60306 0,59611 0,59920 0,58232 0,57548 0,56868 0,59191 0,55519
0,6 0,54851 0,54186 0,53526 0,52869 0,52217 0,51569 0,50925 0,50286 0,49650 0,49019
0,7 0,48393 0,7770 0,47152 0,46539 0,45930 0,45325 0,44725 0,44130 0,43539 0,42953
0,8 0,42371 0,4]794 0,41222 0,40654 0,40091 0,39532 0,38979 0,38430 0,37886 0,37347
0,9 0,36812 0,36282 0,35757 0,35237 0,34722 0,34211 0,33706 0,33205 0,32709 0,32217
1,0 0,31731 0,31250 0,30773 0,30301 0,29834 0,29372 0,29914 0,28462 0.28014 0,27571
1,1 0,27133 0,26700 0,26271 0,25848 0,25429 0,25014 0,24605 0,24200 0,23800 0,23405
1,2 0,23014 0,22628 0,22247 0,21870 0,21498 0,21130 0,20767 0,20408 0,20055 0,19705
1,3 0,19360 0,19020 0,18684 0,18352 0,18025 0,17702 0,17383 0,17069 0,16759 0,16453
1,4 0,16151 0,15854 0,15561 0,15272 0,14987 0,14706 0,14429 0,14156 0,13887 0,13662
1,5 0,13361 0,13104 0,12851 0,12602 0,12356 0,12114 0,18876 0,11642 0,11411 0,11183
1,6 0,10960 0,10740 0,10523 0,10310 0,10101 0,09894 0,09691 0,09492 0,09296 0,09103
1,7 0,08913 0,08727 0,08543 0,0363 0,08186 0,08012 0,07841 0,07673 0,07508 0,07345
1,8 0,07186 0,07030 0,06876 0,06725 0,06577 0,06431 0,06289 0,06148 0,06011 0,05876
1,9 0,05743 0,05613 0,05486 0,05361 0,05238 0,05118 0,05000 0,04884 0,04770 0,4659
2,0 0,00450 0,04443 0,04338 0,04236 0,04135 0,4036 0,03940 0,03845 0,03753 0,03662
2,1 0,03573 0,03486 0,03401 0,03317 0,03235 0,03156 0,03077 0,03001 0,02926 0,02852
2,2 0,02781 0,02711 0,2034 0,02575 0,02509 0,02445 0,02382 0,02321 0,02261 0,02202
2,3 0,02145 0,02089 0,02034 0,01981 0,01928 0,01877 0,01827 0,01779 0,01731 0,01685
2,4 0,01640 0,01595 0,01552 0,01510 0,01469 0,01429 0,01389 0,01351 0,01314 0,01277
2,5 0,01242 0,01207 0,01174 0,01141 0,01109 0,01077 0,01047 0,01017 0,00988 0,00960
2,6 0,00932 0,00905 0,00879 0,00854 0,00829 0,00805 0,00781 0,00759 0,00736 0,00716
2,7 0,00693 0,00673 0,00653 0,00653 0,00614 0,00596 0,00578 0,00561 0,00544 0,00527
2,8 0,00511 0,00495 0,00480 0,00465 0,00451 0,00437 0,00424 0,00410 0,00398 0,00385
2,9 0,00373 0,00361 0,00350 0,00339 0,00328 0,0318 0,00308 0,00298 0,00288 0,00279
3,0 0,00270 0,00261 0,00253 0,00245 0,00237 0,00269 0,0221 0,00214 0,00207 0,00200
3,1 0,00194 0,00187 0,00181 0,00175 0.00169 0,00163 0,00158 0,00152 0,00147 0,00142
3,2 0,00137 0,00133 0,00128 0,00124 0,00120 0,00115 0,00111 0,00108 0,00108 0,00100
3,3 0,00097 0,00093 0,00090 0,00087 0,00084 0,00081 0,00078 0,00075 0,00072 0,00070
3,4 0,00067 0,00065 0,00063 0,00060 0,00058 0,00056 0,00054 0,00052 0,00050 0,00048
3,5 0,00047 0,00045 0,00043 0,00042 0,00040 0,00039 0,00037 0,00036 0,00034 0,00033
3,6 0,00032 0,00031 0,00029 0,00028 0,00027 0,00026 0,00025 0,00024 0,00023 0,00022
3,7 0,00022 0,00021 0,00020 0,00019 0,00018 0,00018 0,00017 0,00016 0,00016 0,00015
3,8 0,00014 0,00014 0,00013 0,00013 0,00012 0,00012 0,00011 0,00011 0,00010 0,00010
3,9 0,00010 0,00009 0,00009 0,00008 0,00008 0,00008 0,0007 0,00007 0,00007 0.00007
4,0 0,0006 0,0006 0,0006 0,00006 0,00005 0,00005 0,00005 0,00005 0,00005 0,00004

156

S-ar putea să vă placă și