Documente Academic
Documente Profesional
Documente Cultură
AUREL STAN
STATISTIC I
CUPRINS
I. INTRODUCERE
BIBLIOGRAFIE
SCOPUL UNITII DE CURS
Familiarizarea cursanilor cu problemele principale ale statisticii infereniale aplicate n psihologie;
Informarea cursanilor asupra principalelor tipuri de aplicaii ale statisticii infereniale n domeniul
psihologic de cercetare;
Informarea cursanilor asupra specificului variabilelor psihologice supuse procesului de prelucrare
statistic;
Informarea cursanilor asupra limitelor interpretrii statistice n cercetarea psihologic
OBIECTIVE OPERAIONALE
n urma studierii acestei uniti de curs, studenii trebuie s-i formeze urmtoarele deprinderi
intelectuale:
S opereze cu principalele concepte statistice aplicate n domeniul psihologiei;
S precizeze principalele scale de msur utilizate n domeniul cercetrii psihologice i s disting
specificul acestora n cazul unor cercetri concrete;
S precizeze situaiile de aplicare n psihologie a conceptelor statistice referitoare diferenierea i
asocierea seriilor de valori ale unei variabile;
S precizeze specificul principalilor indicatori statistici i s cunoasc etapele calculrii lor.
S precizeze sensul i non-sensul indicatorilor statistici;
S precizeze sensul diferitelor abateri de la distribuia normal;
S poat utiliza corect datele coninute n tabelul anex.
EVALUARE
Se va realiza n cadrul unui examen scris la sfritul semestrului. Pentru examen se vor stabili dou
tipuri de subiecte: un tip referitor la teoria statistic i un tip referitor la aplicarea n practic a
cunotinelor dobndite. n cadrul activitilor tutoriale se vor exersa subiectele cu caracter practic i se
va verifica realizarea exerciiilor de la sfritul capitolelor. Tipurile de subiecte pentru examen vor fi egal
ponderate pentru nota final obinut la examen
STATISTIC I
INTRODUCERE
ntr-o definiie succint, statistica este un ansamblu de metode care au drept obiect colectarea,
organizarea, tratamentul i interpretarea datelor de observaie care se refer la grupuri de persoane
sau de obiecte. Exist discuii, care nu vor fi comentate n manualul nostru, asupra autonomiei statisticii
ca tiin, din cauza faptului c o bun parte din metodele statisticii aparine domeniului matematic, n
consecin se susine c statistica nu ar fi dect matematic aplicat, afirmaie care nu poate fi
contestat. ns, dezvoltarea statisticii a prilejuit dezvoltarea unor modaliti de abordare a studiului
datelor i a unor exigene metodologice de cercetare specifice care-i o confer un statut aparte,
inconfundabil n ansamblul tiinelor moderne.
Disciplina statisticii are o vast arie aplicativ, n domenii dintre cele mai diverse. Este foarte
greu de indicat un domeniu al activitilor teoretice i practice n care s nu-i gseasc utilitatea.
Statistica aplicat n psihologie va expune cteva consideraii teoretice strict necesare, fr s se
preocupe de fundamentarea matematic a procedeelor folosite, chestiune care preocup specialitii n
statistic teoretic, i va insista asupra specificului aplicativ al unor proceduri statistice n cercetarea
psihologic sau n practica profesional ce presupune prelucrarea i interpretarea datelor. Interveniile
statistice din domeniul psihologic se refer mai ales la acele date care provin de la grupuri de
persoane, dar acest aspect nu poate fi generalizat.
Originile preocuprilor statistice pot fi defalcate n funcie de considerarea acestora drept practici
istoricete atestate sau drept contribuii tiinifice sistematizate. n primul caz se poate vorbi de o
existen milenar (5-milenii) a acestora, n al doilea caz de una secular (4 secole anterioare). Nevoia
de a colecta date cantitative asupra populaiei i condiiilor sale materiale de existen se face simit
din momentul n care apar comunitii umane organizate (semnul apariiei acestora este dat naterea
instituiilor de reglare a desfurrii vieii n comunitate, apariia statelor constituind forma evoluat a
unor astfel de instituii). n China, Egipt, Grecia i Roma antic apar recensminte cerute de funcionarii
administrativi, practici continuate n evul mediu (releveurile realizate la ordinele lui Charlemagne,
Domesday Book a lui Wilhelm Cuceritorul, spre 1090) i n nceputurile perioadele moderne ale istoriei,
prin numeroase inventare sau releveuri realizate ca urmare a unor ordonane regale sub impulsul lui
Sully, a lui Colbert i a lui Vauban.
n secolul al XVII-lea se profileaz concepte relative la bazele i la mijloacele studiilor statistice,
deci putem vorbi nceputurile statisticii teoretice. n aceast perioad i contureaz apariia a dou coli
de gndire n acest domeniu. coala german, numit i coala descriptiv, de la care pare c deriv
cuvntul statistic (cuvntul german die Statistik), este fondat de ctre Herman Conring (1606-1681),
profesor la Universitatea din Helmstadt, ale crui contribuii vor fi continuate prin Gottfried Achenwall
(1719-1772). Cea de-a doua coal, denumit aritmetica politic are ca fondatori pe John Graunt
93
AUREL STAN
(1620-1764), Gregory King (1648-1712), Edmond Halley 1656-1742) i pe sir William Petty (1623-
1687), i pune n eviden, dincolo de descriere, anumite permanene statistice, de exemplu raportul
numrului de nateri masculine i acela al celor feminine. Edmond Hailley prezint un tabel de
mortalitate care este baza lucrrilor actuariale contemporane, apoi un reprezentant al colii germane,
Johann Peter Sssmilch (1707-1767), public importante lucrri asupra procentului de masculinitate la
natere i asupra evoluiei acestuia pn la vrsta de 20 de ani.
De o deosebit importan n fundamentarea teoretic a statisticii este apariia, n 1812, a lucrrii
lui Pierre Simon de Laplace (1749-1827), intitulat Teoria analitic a probabilitilor, care pune n
eviden avantajele care pot fi trase din aceast teorie n studiul fenomenelor naturale. n care cauzele
sunt prea complexe pentru a le putea cunoate exhaustiv i a le analiza individual.
Ca expresie a dezvoltrii statisticii, apar o serie de statistici autonome consacrate anumitor
domenii de specialitate precum statistica aplicat n mecanic, agronomie i economie, a cror
dezvoltare nu are rost n lucrarea noastr simplificat. Cele mai multe din aplicaiile statisticii se afl,
fr ndoial, n domeniul economic i administrativ.
Nu ncercm s facem o istorie amnunit a statisticii, lucrare care ar trebui s fie deosebit de
laborioas, ci s punctm momente importante ale evoluiei acesteia, legate de aplicarea acestei
discipline n domeniul tiinelor sociale. nceputul n aceast privin este fcut de savantul belgian
Adolphe Quetelet, care a avut preocupri tiinifice de o larg diversitate n domeniul aplicaiilor
statisticii1.
Adolphe Qutelet (1796-1874) extinde cmpul de aplicare a metodei statistice n domeniile
antropometric, psihologic i social. La iniiativa sa se reunete la Bruxelles, n 1853, primul congres
internaional de statistic, precursor al Institutului internaional de statistic, fondat la Londra n anul
1885, instituie tiinific care a rmas deosebit de prestigioas pn n zilele noastre. Adolphe Qutelet
a introdus noiunea de om mediu, controversat de-a lungul timpului, concept preluat de o serie
statisticieni i sociologi. Ca urmare a lucrrilor tiinifice aparinnd lui Qutelet, acelora ale lui Francis
Galton (1822-1911) i Karl Pearson (1857-1936), se fondeaz biostatistica sau biometria.
n domeniul tiinelor umane, studiile lui Charles Spearman asupra comportamentului indivizilor,
dezvoltate n psihologia aplicat, uman i animal, au condus la metode de analiz factorial, o
prelungire logic a studiului corelaiilor. Francis Galton, Charles Spearman i Karl Pearson pot fi
considerai ntemeietorii prestigioasei coli psihometrice engleze, care a influenat semnificativ modul de
prelucrare a datelor n cercetrile psihologice.
1 Pentru cei care doresc s cunoasc mai amnunit aspecte ale istoriei statisticii romneti i internaionale le recomandm
lucrarea lui Mihai arc Tratat de statistic aplicat, Editura Didactic i Pedagogic R.A., Bucureti, 1998 i pe cea
coordonat de Vladimir Trebici Mic enciclopedie de statistic, Editura tiinific i enciclopedic, Bucureti, 1985.
94
STATISTIC I
Psihologia devine tiin de sine stttoare abia n a doua jumtate a secolului al XIX-lea, odat
cu accentuarea laturii experimentale n cercetare, n ale crei nceputuri au fost marcate acumulri de
date care erau deficitare sub aspectul interpretrii lor. Procedeele statistice utilizate de psiholog vin,
totodat, n ntmpinarea nevoii de diversificare a metodelor de cercetare, fapt ce conduce la
interpretarea mai adecvat a rezultatelor investigaiilor tiinifice.
Printre lucrrile de importan din ultimele decenii, enumerm pe cele ale lui Fisher, dEgon,
Sharpe, Pearson Jerzy Neyman asupra teoriei testelor i acelea referitoare la estimaii, nscute din
cercetrile empirice asupra aplicrii metodei sondajelor . Apariia unor puternice mijloace de calcul a
permis, pe de alt parte, de a pune n aplicare noi metode de statistic descriptiv (care nu recurg la
modele, nici la ipoteze), aplicabile la marile tabele de date multidimensionale. Aflate n germene la
Charles Spearman i E. Pearson, aceste metode se regrupeaz sub numele de analiz a datelor, fiind
dezvoltate prin H. Hotelling n anii 1930 i n Frana prin J.P. Benzecri n anii 1960.
Actualmente, preocuprile de analiz statistic a datelor din domeniul tiinelor sociale, n general
vorbind, sunt deosebit de intense, realizndu-se progrese teoretice i practice. Sub acest ultim aspect
sunt de remarcat apariia unor programe computerizate destinate uurrii muncii de calcul (cel mai
cunoscut i cel mai utilizat fiind SPSS-ul). Folosirea unor astfel de programe presupune, pentru
exploatarea corect a rezultatelor, cunoaterea fundamentelor teoretice ale statisticii.
95
AUREL STAN
I. STATISTIC DESCRIPTIV
I.1.NOIUNI FUNDAMENTALE
nelegerea aseriunilor statistice este posibil din momentul n care ne nsuim o serie de noiuni
fundamentale. ncepem prin a preciza care sunt noiunile fundamentale n statistic i cu eventuale
precizri referitoare la unele sensuri specifice care opereaz n domeniul statisticii n legtur cu aceste
noiuni.
Una din aceste noiuni este cea de variabil. Este o noiune de care nu ne putem dispensa n
explicaia tiinific, totalitatea studiilor experimentale apelnd frecvent la ea pentru a expune raiunea
acestui demers tiinific, modul de derulare i concluziile trase. Este frecvent folosit mpreun cu
noiunile de variaie i variabilitate. n Grand dictionnaire de la psychologie variabila este definit ca o
entitate abstract care servete ca suport pentru o multitudine de valori2. Proprietatea variabilei de a
lua anumite valori se numete variabilitate, iar oscilaiile valorice ale variabilei poart numele de variaie.
Variaiile pot fi previzibile i imprevizibile. Variaiile sunt considerate previzibile n situaia n care orice
96
STATISTIC I
valoare succesiv dintr-o serie poate fi determinat cu precizie sau mcar aproximat. Variaiile sunt
imprevizibile cnd valorile succesive ale unei serii nu pot fi prevzute.
Arthur Reber, autorul unui reputat dicionar de psihologie atrage atenia asupra faptului c, dei
variabila este o entitate care sufer schimbri, ea este de fapt o abstracie, o form, o cantitate3. Astfel,
dac realizm cercetri n domeniul senzaiilor auditive i suntem interesai de intensitatea tonului,
variabila operativ este intensitatea; ntr-un studiu n care avem ca variabil dificultatea unui test,
dificultatea este variabila real. Tonul i testele utilizate sunt doar moduri care permit intensitii i
dificultii s se manifeste. Precizri necesare sunt fcute n matematic i logic unde noiunea de
variabil este surprins mai explicit prin tratarea variabilei ca simbol care reprezint clase de lucruri sau
domenii de valori care satisfac anumite condiii i nu orice lucru sau valoare particular. O valoare
particular a variabilei este denumit modalitate sau variant de variaie. A desemna o variabil
nseamn a-i atribui un nume i a-i indica modalitile pe care le poate lua n cadrul unui sistem bine
precizat. O analiz tiinific se poate realiza doar cu condiia ca obiectul pe care ea se exercit s aib
o structur relativ stabil. Dac modalitile variabilei pot fi ierarhizate dup un anumit criteriu, acestea
poart numele de nivele Variabila este opus constantei, care nu are dect o singur valoare, fix i
nesupus oscilaiei. Definiia unei variabile i a modalitilor sale nu este independent de descrierea
dispozitivului experimental n care a intervine. n funcie de ipoteza sa, cercettorul selecioneaz strile
pertinente ale variabilei pe care el o studiaz. O variabil are cel puin dou modaliti.
Exist dou condiii pe care trebuie s le ndeplineasc o variabil:
1. s fie alctuit dintr-un ansamblu de valori exclusive, n consecin fiecare din elementele
unei variabile nu poate lua dect o singur valoare.
2. ansamblul de valori sau de modaliti ale unei variabile trebuie s fie exhaustiv toate
elementele trebuie s poat fi caracterizate de ansamblul de valori.
Exist un sistem de clasificare a variabilelor care funcioneaz prin considerarea unei serii de
criterii. Vom enumera doar denumirile rezultnd din apelarea la cele mai frecvente criterii.
Astfel, dac lum n consideraie gradul de dependen se distinge ntre variabile independente i
variabile dependente. Distincia ntre variabile dependente i independente este cel mai frecvent
folosit. Variabilele independente (notate curent cu VI) sunt variabile manipulate sau fixate de ctre
experimentator. Mai clar, variabila independent este o caracteristic - a subiectului, a ambianei sale
fizice sau sociale, a sarcinii, a stimulului sau stimulilor prezentai - care este manipulat de ctre
cercettor n scopul de a controla sau de a analiza efectul sau efectele sale asupra comportamentului
studiat4. Variabil independent este orice variabil ale crei valori sunt, n principiu, independente de
schimbrile care au loc cu alte variabile. ntr-un experiment, variabila independent poate fi orice
variabil care este manipulat specific, astfel nct s se observe efecte asupra variabilei dependente.
Variabila independent mai este numit i variabil experimental sau controlat. Variabilele
dependente (notate curent cu VD) sunt variabile observate de experimentator i care fac obiectul unei
msurri. Variabila dependent este orice variabil ale crei valori sunt, n principiu, rezultatul
3 Reber, Arthur S., "Dictionary of Psychology", Penguin Books, London, 1985, pag.811
4 J.-P. Rossi & Al., La mthode exprimentale en psychologie, Dunod, Paris, 1997, pag.22
97
AUREL STAN
schimbrilor care au loc ntr-una sau mai multe variabile independente. n matematic, noiunea de
dependen este exprimat printr-o formul de tipul y = f (x) . Prin aceast form de prezentare a
dependenei se exprim faptul c valorile lui y sunt dependente (sau n funcie de) valorile lui x. n
cercetarea psihologic situaia devine: comportamentul subiectului luat n considerare (y) este
dependent de manipularea unui factor (x). n cercetarea psihologic, variabila dependent este, n
general, un rspuns furnizat de ctre subiect sau o caracteristic a acestui rspuns.
O alt accepiune este aceea c variabila dependent este o variabil care este estimat dintr-o
alt variabil ale crei valori sunt date. Efectul variabilelor independente este observat pe variabilele
dependente. Exemplu: dac ne propunem s cercetm efectul diferitelor forme de psihoterapie asupra
sensibilitii, variabila independent este forma de psihoterapie (terapie psihanalitic, terapie
comportamental, terapie experienial, terapie adlerian, terapie sistemic) i variabila dependent
este efectul asupra sensibilitii pe un anumit plan. Relaia dintre variabila numit independent i
variabila numit dependent este una presupus cauzal. Relaia cauzal trebuie s fie demonstrat, nu
doar afirmat. Pentru demonstrare se cer urmate regulile unei metodologii competent elaborate. n caz
contrar, putem fi robii aparenelor constituite n aa-numitele artefacte.
Calitile unei bune variabile dependente sunt pertinena (variabila dependent trebuie s fie un
indicator pertinent al comportamentului) i sensibilitatea (variabila dependent trebuie s exprime
variaii comportamentale foarte fine).
98
STATISTIC I
descriu nici stimulul, nici rspunsul. A doua categorie de variabile intermediare este constituit din
nevoi, dorine, atitudini, ipoteze care nu pot fi controlate de ctre experimentator.
J.P. Rossi consider c exist o a treia categorie de variabile intermediare care trimite la
mecanismele intermediare5. Astfel, activitatea de organizare care permite de a reine mai bine o list de
cuvinte a fost adesea clasat n rubrica variabilelor intermediare, deoarece activitatea de structurare
este un tratament care se situeaz ntre S i R. Paul Fraisse a insistat n studiile sale asupra faptului c
rspunsul este funcie a interaciunii ntre situaie i personalitatea subiectului.
Jean-Franois Le Ny consider n Grand dictionnaire de la psychologie c noiunea de variabil
intermediar poate fi definit ca o variabil ipotetic presupus a fi funcie a unei variabile de
ambian i ca determinnd direct o variabil de comportament6.
Astfel, noiunea lui C.L. Hull i a teoreticienilor behavioriti, n general, de for a motivaiei
(Drive) era considerat, pe de o parte, ca fiind o funcie direct a duratei de privare (de hran, butur
etc.) i, pe de alt parte, ca determinnd n mod direct vigoarea comportamentului.
Totui, noiunea de variabil intermediar este puin utilizat astzi lucru datorat modului n
care sunt privite aspectele care in de persoan. Aceste aspecte sunt, de fapt, mecanisme interne. De
exemplu, s-a artat c organizarea informaiei permite o mai bun reinere a unei liste de cuvinte.
Activitatea de organizare este o variabil intermediar. Ea presupune o tratare a informaiei i constituie
un intermediar ntre S i R. Din momentul introducerii modelelor de tratare a informaiei, noiunea de
variabil intermediar i-a pierdut raiunea de a exista. Astfel, putem vorbi de variabile independente,
variabile dependente, stri ale subiectului i procese se tratare a informaiei. Acestea din urm sunt mai
mult ipotetice dect intermediare.
Dac lum n consideraie natura i fineea variaiei, atunci vorbim de variabile discrete i
variabile continue. Cele discrete sau discontinue sunt variabilele ale crei valori posibile sunt n numr
limitat i sunt exprimate prin valori izolate, nedifereniate. De obicei, pentru a le exprima se folosesc
numere ntregi. De exemplu, variabila numrul de persoane care locuiesc ntr-un apartament este o
variabil discret. Aceast variabil poate lua valorile 1, 2, 3, 4 .a.m.d., dar nu valoarea 2,5 sau 3,7. O
variabil este continu n cazul cnd are teoretic un numr nelimitat de variante. Ca atare, ntre dou
variante de variaie succesive se poate interpune o a treia. Dac msurarea se realizeaz n centimetri,
ntre valoarea 2 cm i 3 cm se poate interpune valoarea 2,5 cm.
5 idem pag.45
6 Grand dictionnaire de la psychologie, Larousse, 1992, p. 816
99
AUREL STAN
O distincie frecvent utilizat se face ntre variabilele dihotome sau dihotomice i variabilele
polihotome sau polihotomice. Variabilele dihotomice sunt variabile care au dou 2 modaliti: adevrat -
fals; corect-incorect; da nu, prezen-absen, acord dezacord; masculin-feminin etc., i care
primesc, de obicei , valorile numerice 1 - 0.
Dany Laveault i Jacques Grgoire9 fac diferena ntre variabile real dihotomice i artificial
dihotomice. O variabil real dihotomic presupune mprirea natural n 2 categorii (de
exemplu, variabila sex are natural dou modaliti: masculin (care se poate nota cu 1) i feminin
(care se poate nota cu 0), iar variabilele artificial dihotomice corespund transformrii
convenionale a valorilor variabilelor polihotomice (continue sau discontinue). De exemplu, n urma
aplicrii unui test subiecii dintr-un grup, acetia pot obine iniial note ntre 1 i 40, dar, ulterior, acetia
pot fi mprii n 2 subgrupe: cei care au scoruri mai mici dect mediana sunt ncadrai n subgrupul A
7 Reber, Arthur S., "Dictionary of Psychology", Penguin Books, London, 1985, pag.811
8 idem
9 Dany Laveault & Jacques Grgoire, Introduction aux theories des testes en sciences humaines, De Boeck Universite,
100
STATISTIC I
cu rezultate slabe (scoruri uniformizate prin notarea cu 0), iar cei cu scoruri peste median intr n
subgrupul B cu rezultate bune (uniformizate prin notarea cu 1). Aceast mprire poate fi fcut i n
funcie de existena unei valori criteriu, care mparte grupul iniial n reuii (notai cu 1) i nereuii
(notai cu 0). Criteriul de dihotomizare poate avea i un caracter convenional.
O distincie cu care se opereaz frecvent este cea ntre variabile cantitative i variabile
cantitative. n primul caz exprimarea variantelor sau modalitilor variabilelor se face prin intermediul
numerelor (timp, greutate, lungime), n al doilea caz prin intermediul atributelor (apartenen etnic,
religioas, sex). Variabila cantitativ timp de reacie va putea avea ca variante sau modaliti 23; 25; 19;
30 sutimi de secund, pe cnd variabila calitativ apartenen religioas va avea ca modaliti: ortodox,
catolic, protestant, mahomedan, budist etc.
101
AUREL STAN
conjectandi, matematicianul elveian Jacques Bernoulli, unul din clasicii teoriei probabilitilor, a artat
c o tragere la sori corect fcut permite de a obine un eantion care s aib caracteristici similare
acelora ale populaiei. Deci, nu orice grup de indivizi formeaz un eantion, ci doar acel grup constituit
prin respectarea unor reguli riguroase. Cnd ntr-un studiu ntlnim termenul de lot sau de grup, trebuie
existe suspiciunea c acesta a fost compus prin apelarea la o procedur de extragere care nu respect
strict metodologia de constituire a eantioanelor. Biais-ul, termen ce s-a impus n ultima perioad n
limbajul tiinific cu semnificaia de eroare sistematic, mrete riscul de a proceda la generalizri
eronate. Populaiile pot fi finite, cnd mrimea sa este riguros delimitat cantitativ, i infinite cnd
mrimea lor nu poate fi determinat cu precizie sau este n continu cretere cu o rat imprevizibil.
Populaia poate fi definit extensiv, atunci cnd elementele sale pot fi listate (de exemplu, lista nominal
a pensionarilor dintr-un cartier din Iai). Definirea intensiv a populaiei presupune indicarea principiului
care st la baza constituirii sale (exemplu, toi elevii liceului Mihai Eminescu din Iai din primul
semestru al anului 2003).
Variabilele nu descriu indivizii statistici n ansamblul lor, ci prin intermediul unor caracteristici. O
caracteristic este o proprietate a unei uniti statistice care prezint interes pentru o anumit cercetare.
Individul statistic este purttor al unei caracteristici. Aceast caracteristic este descriptibil printr-un
ansamblu de reliefri ale caracteristicii. Aceste reliefri sunt variantele de variaie sau modalitile.
Caracteristica pe care noi ne propunem s o descriem statistic poate fi manifest, n cazul n care poate
fi descris sau msurat n mod direct (greutatea corporal, culoarea ochilor, sexul, nivelul veniturilor)
sau latent (voalat), n cazul n care poate fi msurat doar indirect. De exemplu, dac ne propunem
s examinm introversiunea, aceasta nu se poate face n mod direct, ci prin intermediul unei ntregi serii
de semne ale introversiunii detectabile prin ntrebrile unui chestionar sau prin analiz clinic. O
caracteristic este operaional definit atunci cnd se poate decide care sunt reliefrile caracteristicii
respective. Practic, din punct de vedere psihologic, operaionalizarea este traducerea unui concept
teoretic n comportamente observabile. Calitatea tiinific a unor cercetri depinde foarte mult de
calitatea operaionalizrii conceptuale care se realizeaz n cursul realizrii lor.
Este necesar s facem i cteva precizri asupra variabilitii, n scopul de a evidenia aspecte
care sunt frecvent ntlnite n studii tiinifice. Variabilitatea este intraindividual atunci cnd se
raporteaz la diferenele existente ntre momentele sau situaiile diferite n care se afl acelai individ.
De exemplu, atunci cnd se cerceteaz timpul de reacie la aceeai persoan n momente temporale
diferite, se pot obine valori diferite. Diferena dintre cea mai mic i cea mai mare variant de variaie
poart numele de amplitudine de variaie sau de plaj de variaie. Variabilitatea interindividual face
referire la diferenele existente ntre indivizi (desigur, referindu-se la aceeai caracteristic).
Variabilitatea intragrup caracterizeaz oscilaiile valorice n cadrul unui grup bine precizat i
variabilitatea intergrup caracterizeaz aceste oscilaii la nivelul indicatorilor aparinnd la grupuri diferite.
Indicatorii statistici nu sunt doar simple valori ale variabilei, ci valori reprezentative care caracterizeaz
ansamblul valorilor unui grup.
102
STATISTIC I
Variabile i factori.
Termenii tiinifici de variabil i factor sunt des folosii ca sinonimi ceea ce poate crea o
serie de confuzii. n esen, orice factor poate fi o variabil, dar nu orice variabil poate fi un
factor. Nu exist o coresponden perfect ntre variabil i factor. n unele lucrri tiinifice,
termenul factor este folosit abuziv.
n general, prin factor se nelege orice are o influen cauzal, un anumit efect asupra unui
fenomen. n acest sens factorul este considerat o condiie antecedent sau o cauz. Prin extensie,
factorul poate fi considerat o variabil independent. Acest sens e propriu procedurilor statistice bazate
pe analiza de varian. Distincia ntre factori sistematici i aleatori este fundamental. Factorul este
sistematic, n cazul n care alegerea modalitilor poate fi sistematic, i aleatoriu, n cazul n care
modalitile sale sunt stabilite prin tragere la sori. O convenie frecvent respectat este aceea de a
denumi factorul printr-o liter majuscul i o cifr care indic numrul modalitilor. De exemplu, n
cadrul notaiei S3 desemnm prin S factorul studii i prin 3 numrul de modaliti. Desemnarea
nivelelor se face prin utilizarea literelor minuscule: s1= studii superioare, s2=studii medii i s3=studii
generale. Prin convenie factorii aleatorii sunt subliniai. Factorii crora experimentatorul vrea s le
studieze efectele sunt numii principali, iar cei pe care experimentatorul trebuie s-i controleze pentru c
el tie c acetia au un efect asupra fenomenului studiat sunt numii secundari.
Factorul poate fi unul din rezultatele unei analize factoriale, termen care nu reprezint un concept
unitar, ci mai curnd este utilizat ca termen umbrel pentru un numr de proceduri statistico-matematice
care-i propun s localizeze un numr mai mic de dimensiuni clusteri sau factori ntr-un set mai mare
de variabile independente sau itemi. Primul element distinctiv al unei analize factoriale este reducerea
datelor. Analiza factorial este o reacie contra beiei de cuvinte n cercetarea psihologic care tinde s
considere c oamenii i aciunile umane au attea caliti cam cte adjective i atribute exist ntr-o
limb. A exprima mult prin puin, principiul parcimonieii, este esenial n analiza factorial, indiferent de
formele pe care le mbrac aceast analiz. Ca atare, factorul este o variabil subiacent care st la
baza variaiei altor variabile, este o esen ireductibil i irepetabil care servete de suport lumii
fenomenologice cu o mare varietate de manifestri.
103
AUREL STAN
II.1.MSURAREA N PSIHOLOGIE
O prim ntrebare care se pune atunci cnd abordm problema prelucrrii datelor obinute ntr-o
cercetare psihologic este: haina numeric se potrivete la fel de bine exprimrii rezultatelor ca n
domeniul fizicii, chimiei, biologiei, sau are un anumit specific care trebuie lmurit? n esen, trebuie s
stabilim dac faptul psihic este la fel de bine fundamentat cantitativ ca n domeniile amintite. Dezbaterile
pe aceast tem dureaz de secole, opunnd la nceputurile lor concepia lui Immanuel Kant i celei
aparinnd lui Johann Herbart. Prima concepie susine c psihologia nu va ajunge niciodat tiin
experimental, deoarece faptul psihic nu posed dect o singur variabil, timpul. A doua concepie
susine c psihologia va putea deveni experimental i cantitativist, ntruct posed pe lng variabila
timp i variabilele intensitate i calitate. Dezbaterile pe aceast tem nu au ncetat, fiind sintetizate
foarte bine ntr-o lucrare de erudiie a lui Vasile Pavelcu: Ambele atitudini sunt fireti cci, dac am
aplica metrismul matematic la prerile nsei, ivite n rndul oamenilor de tiin, cu privire la psihologia
matematic, am constata abateri statistice naturale, att n sens pozitiv, ct i n cel negativ, fa de
medie. Extremele sunt egal de primejdioase pentru dezvoltarea unei tiine. O ncredere exagerat,
nejustificat suficient ntr-o metod, duce fatal spre dezamgirea i prsirea total a acesteia. Un
scepticism anticipat, i la fel de nejustificat, bareaz drumul ncercrilor i verificrilor, fr de care nu
putem face dovada tiinific10.
Rspunsul la ntrebarea anterioar presupune o scurt incursiune n domeniul teoriei msurrii.
10Vezi Pavelcu, Vasile Problema msurii n psihologie, Extras din Cercetri pedagogice, vol. I, 1943. Tipografia Alexandru A.
Terek, Iai, pag.3.
104
STATISTIC I
Spearman, H.P. Kelley, H. Hotteling, L.L. Thurstone, C. Burt, L. Guttman, S.S. Stevens au perfecionat
i rafinat concepia de cercetare n psihologie i au elaborat tehnici cantitative complexe, aa cum este
analiza factorial. ntr-o lucrare clasic de psihometrie, care se menine n actualitate, Nicolae
Mrgineanu red complexitatea situaiei cercetrii din domeniul psihologic: Una dintre caracteristicile
de baz ale tiinei contimporane, n opoziie cu tiina antebelic i mai ales cu aceea a secolului
trecut, e de a nu te mulumi numai cu studiul relaiilor dintre diferite, ci de ncerca i studiul structurii i
configuraiei acestor relaii. Relaia nu e torul; ea e ntotdeauna o parte i un aspect dintr-un sistem. Ori
acest sistem nu pare a fi indiferent pentru relaie; pentru ca sensul relaiei s fie prins n ntregime,
relaia trebuie raportat i la el. Sistemul pare chiar s aib ultimul cuvnt, proprietile de baz ale
relaiilor nefiind dect funciuni ale sale.11
11 vezi Nicolae Mrgineanu, Elemente de Psihometrie, Ed. Institutului de Psihologie al Universitii din Cluj, 1938
105
AUREL STAN
dintre ele nu au o real semnificaie practic prin diversele grupe de transformri numerice pe care le-ar
presupune12.
Scala nominal (denumiri similare scala categorial sau scala formal) reprezint tipul de scal
care indic cel mai slab grad al msurii. Modalitile scalei nominale sunt definite n aa fel nct fiecare
observaie nu poate fi plasat doar ntr-o singur modalitate. Ea asigur doar simpla difereniere
calitativ a observaiilor fcute de un cercettor. Chiar atunci cnd utilizeaz numere n exprimare
realitii supus msurii, aceast scal nu indic alte proprieti dect acelea de a fi simple etichete
pentru distingerea diferitelor modaliti ale unei variabile. Ea poate asigura identitatea a dou elemente.
La nivelul scalei nominale modalitile X,Y i Z pot fi reprezentate prin 1,2 i 3, sau la fel de bine prin 14,
23, 8. Important este ca aceste simboluri s fie diferite. n acest caz 1 nu este mai mic dect 2 i nici
acesta, la rndul lui, nu este mai mic dect 3. Ele sunt doar simboluri diferite. Observaiile pot fi
exprimate i prin simboluri alfanumerice: a1, a2 i a3 sau chiar prin simboluri pictografice. Astfel de
scale sunt frecvent utilizate n psihologie i, n general, n tiinele sociale, atunci cnd se uzeaz de
clasificri: tipologiile psihologice, nomenclatoarele profesiilor, nosologiile psihiatrice (sisteme de
clasificare a bolilor). De exemplu, variabila categorie socio-profesional poate avea modalitile: elev,
student, funcionar, cadru mediu, cadru superior, patron, manager, omer, pensionar. Prin codificare,
atribuim un simbol distinct fiecrei modaliti a variabilei. Redm ntr-un tabel diferite variante de
codificare: varianta 1-alfabetic, varianta 2-numeric, varianta 3-alfanumeric.
Modalitatea variabilei Varianta 1 Varianta 2 Varianta 3
Elevi A 1 a1
Studeni B 2 a2
Funcionari C 3 a3
Cadre medii D 4 a4
Cadre superioare E 5 a5
Manageri F 6 a6
Patroni G 7 a7
omeri H 8 a8
Pensionari I 9 a9
Tabelul nr.2 Codificri posibile pentru modalitile variabilei categorie socio-profesional n cadrul unei scale
nominale
Recodificarea modalitilor n funcie de variante este corect dac asigur fiecrei modaliti o
notare distinct de a celorlalte, aa cum rezult din tabelul urmtor.
Modalitatea variabilei Varianta 1 Varianta 2 Varianta 3
Elevi C 9 a7
Studeni I 8 a3
Funcionari A 5 a5
Cadre medii D 3 a9
Cadre superioare F 7 a8
Manageri B 1 a2
Patroni E 4 a6
omeri G 6 a4
Pensionari H 2 a1
Tabelul nr. 3 Cuprinde recodificarea corect a modalitilor variabilei Categorie socio-profesional din tabelul 1
12vezi Dick, P., Tournobis, Jocelyne, Flieler, A., Kop, Jeana-Luc, La Psychomtrie, Presses Universitaires de France,
Paris, 1994
106
STATISTIC I
Scala ordinal introduce ordinea ntre elementele unei serii de observaii. Transformrile
efectuate trebuie, de aceast dat, s lase ordinea invariant, neschimbat. ntr-o astfel de situaie
a<b<c i 1<2<3. Ultima serie poate fi nlocuit prin 7;13;19 (care respect ordinea iniial, primul
element mai mic dect al doilea i acesta l, la rndul lui, mai mic dect la treilea, dar nu prin 7;5;15
(care nu o respect). Exemplificrile scalelor nominale n domeniul disciplinelor psiho-sociale sunt, de
asemenea, numeroase (clasele de vrst, nivelurile colare, fazele dezvoltrii intelectuale). Chiar
scorurile brute la probele de aptitudini sau la chestionarele de personalitate, considerate n mod strict,
se ncadreaz n rndul scalelor ordinale. ntr-o astfel de scal putem s spunem c elementul b este
mai mare dect elementul a, dar nu putem s precizm cu ct este mai mare. Cel mai bune exemple
pentru scalele ordinale sunt scalele de atitudini sau scalele de apreciere. Variabila atitudine fa de
fenomenul homosexualitii poate avea urmtoarele modaliti ordonate sau nivele: a) total dezacord; b)
dezacord; c) acord parial; d) acord total. Aceste serie de modaliti este ngheat, n sensul c nu
poate fi schimbat locul ierarhic al unui nivel.
Scala de interval introduc ordinea ntre modalitile unei serii de observaii dar i semnificaia
distanei dintre acestea. Valorile pentru acest tip de scale sunt numerice. Numerele pot fi ntregi
(variabila fiind calificat n acest caz discontinu sau discret) sau s cuprind i valori reale (caz n
care variabila este discontinu, exist posibilitatea interpunerii unei noi valori ntre dou valori
succesive). Exemple de variabile discontinue de interval din domeniul psihologiei: scorurile la itemii
testelor (itemul este o component informaional elementar a unui test sau chestionar); scorurile la
testele sau chestionarele psihologice n ansamblul lor (aptitudini, atitudini). Exemple de variabile
continue de interval din domeniul psihologiei: timpul de reacie verbal, msurarea parametrilor biologici
(n cazul studiilor psihofiziologice). Pentru acest tip de variabil, nu pot exista valori definite n avans. De
aceast dat putem preciza c b este mai mare dect a, dar i cu ct este mai mare. Distana capt
semnificaie. Dac avem 4 elemente (A,B,C,D) egale cu 4,8,12,16 putem preciza c distana dintre
elementele B-C (8-4) este cu 4 mai mic dect distana dintre elementele A-D. Aceste scale au fost
destinate s joace un rol considerabil n psihologie n funcie de dezvoltarea instrumentelor de analiz
care solicit acest nivel de msur.
Scalele de raport. Corespund scalelor pe care Stevens le-a numit scale de interval cu origine
raional. Sunt puin utilizate n cercetarea psihologic. Valorile acestui tip de scal sunt numerice i pot
fi supuse operaiunilor aritmetice. La acest tip de scal se folosete i are sens valoarea nul (0). n
cazul scalelor de interval, valoarea 0 este pur convenional, cum este valoarea 0 a unui termometru. n
cazul scalei de raport, valoarea 0 marcheaz absena unui fenomen, situaie greu de acceptat n
psihologie. Rapoartele nu sunt alterate printr-o transformare de similaritate (adic o transformare liniar
n care b = 0). O reprezentare de acest tip este deci legat de o constant multiplicative.
Menionm scalele nominale i ordinale mai sunt numite i scale calitative, pe cnd scalele de
interval i de raport sunt numite scale cantitative. Scalele, aa cum sunt enumerate anterior, formeaz
un ansamblu ierarhic de la slab la puternic ale crui trepte se disting n privina n privina forei
informaionale. O scal situat pe o treapt superioar are proprietile unei scale inferioar, plus o
serie de proprieti suplimentare. Operaiile i transformrile statistico-matematice care se pot efectua
107
AUREL STAN
n cadrul unei scale sunt condiionate de puterea informaional a scalei respective. Cu ct naintm
spre vrful ierarhiei scalare, cu att numrul de operaii permise este mai mare i transformrile sunt
mai complexe. Pe parcursul lucrrii noastre vom face specificaii necesare n aceast privin, de cte
ori este cazul13.
Frecvena relativ se obine prin nmulirea cu o sut a raportului dintre frecvena relativ i
43
efectivul total. Astfel frecvena relativ 32,5% se obine astfel: 32,5% = * 100 . Frecvenele relative
132
dau o informaie mai precis, mai ales n cazul n care nu se cunoate efectivul total (N =132). Astfel,
frecvena absolut egal cu 43 specific modalitii studii medii nu ne comunic prea mult dac nu tim
cunoatem valoarea 132, pe cnd valoarea 32,6 ne comunic faptul c modalitatea studii medii
cuprinde aproximativ o treime din numrul total al subiecilor.
132pentru informaii suplimentare vezi: Valentin Clocotici, Aurel Stan, Statistic aplicat n psihologie, Editura Polirom, Iai,
2000.
108
STATISTIC I
Pentru variabilele ale cror modaliti se prezint sub form numeric, drumul ordonrii este ceva
mai lung. n acest caz, o mas de cifre neordonat ne transmite foarte puin sens. Exemplificrile pe
care le vom face pe parcursul lucrrii noastre sunt, n cea mai mare parte, specifice cercetrii
psihologice. S presupunem c avem n fa urmtoarele valori rezultate din corectarea unui test
psihologic, mai clar spus avem n fa notele brute obinute de 91 de subieci la testul AD-P (atenie
distributiv Praga), avnd studii medii, vrsta ntre 35-40 ani, provenind din mediul urban:
22 37 56 76 33 48 40 47 58 78
82 50 54 53 47 54 55 62 69 29
43 59 70 55 53 48 36 66 72 53
46 35 43 58 52 50 57 72 29 35
53 43 39 35 48 55 33 38 43 47
43 49 56 38 32 49 55 60 67 56
64 50 26 69 78 55 53 38 47 55
66 73 50 63 62 46 28 64 63 40
42 61 67 63 46 42 68 59 55 57
55
Menionm c ansamblul valorilor unei variabile poart numele de distribuie. Exist distribuii
teoretice, denumire care indic faptul c valorile sunt repartizate conform rigorilor unui anumit model
matematic de distribuie, i distribuii empirice, rezultate din cercetri concrete. n cazul nostru de
exemplificare, vom opera pe o distribuie empiric. n momentul n care ordonm datele cresctor,
ansamblul valorilor ncepe s capete un sens pentru cei care i propunem s le cerceteze. Prezentm,
n continuare, ordonarea acestor date. Putem observa cu uurin care este cea mai mic i care este
cea mai mare valoare a variabile pe care o notm cu X (care reprezint performana unor subieci la
testul AD-P), deci extremele performanelor.
22 26 28 29 29 32 33 33 35 35
35 36 37 38 38 38 39 40 40 42
42 43 43 43 43 46 46 46 47 47
47 47 48 48 48 48 49 49 50 50
50 50 52 53 53 53 53 53 54 54
55 55 55 55 55 55 55 55 56 56
56 57 57 58 58 59 59 60 61 62
62 63 63 63 64 64 66 66 67 67
68 69 69 70 72 72 73 76 78 78
82
Avem n total 91 de rezultate ale subiecilor. n acest caz, valoarea 1 este numit volumul
distribuie. Se noteaz cu N. Dup aceast ultim ordonare putem s efectum o grupare a datelor,
operaiune care se poate avea dou opiuni:
1. Gruparea pe variante de variaie;
2. Gruparea pe intervale de variaie.
Este un tip de ordonare care poate are cea mai larg rspndire, indiferent de domeniu. Unele
domenii i impun o serie de modele proprii de prezentare a datelor, funcie de particularitile tipului de
cercetare (date rezultate n urma unei observaii, date rezultate dintr-un experiment, date rezultate dintr-
o anchet).
109
AUREL STAN
n cazul n care optm pentru primul fel de grupare, stabilim ct de frecvente sunt valorile diferite
pe care le-au obinut subiecii, adoptnd o ordonare ascendent sau descendent a valorilor distincte.
Rezultatele unei variabile care nu au suferit nc tratamente de transformare valoric poart numele de
valori brute sau note brute. Dac aceast operaiune este efectuat empiric, se ordoneaz cresctor
sau descresctor aceste valori, apoi se parcurge ntreaga serie de valori neordonate i se trage cte o
linie ori de cte ori ntlnim o valoare identic. n exemplul nostru ordonarea este ascendent. Pentru o
bun citire a rezultatelor gruprii empirice se realizeaz grupri de cte 5 valori identice, prin a 5-a linie
se bareaz 4 liniue anterioare. Tipul de marcare IIII cuprinde 5 valori identice ale variabilei.
Nota brut Marcare Fr Nota brut Marcare Fr. Nota brut Marcare Fr.
22 I 1 47 IIII 4 63 III 3
26 I 1 48 IIII 4 64 II 2
28 I 1 49 II 2 66 II 2
29 II 2 50 IIII 3 67 II 2
32 I 1 52 I 1 68 I 1
33 II 2 53 IIII 5 69 II 2
35 III 3 54 II 2 70 I 1
36 I 1 55 IIII III 8 72 II 2
37 I 1 56 III 3 73 I 1
38 III 3 57 II 2 76 I 1
39 I 1 58 II 2 78 II 2
40 II 2 59 II 2 82 I 1
42 II 2 60 I 1
43 IIII 4 61 I 1
46 III 3 62 II 2
Tabelul nr.5 Conine ordonarea pe variante de variaie i marcrile corespunztoare ale frecvenei valorilor
Asemenea contorizri ale datelor se realizeaz n momentul n care tindem s realizm o analiz
foarte amnunit, deci cnd ntr-o cercetare opereaz un spirit analitic pronunat. n momentul n care
urmrim observarea tendinei centrale a datelor, atunci efectum o grupare pe intervale de variaie.
Problema care se pune n acest caz este aceea a numrului optim de intervale n care pot fi grupate
datele avute la dispoziie.
110
STATISTIC I
A
interval, mrime care se calculeaz dup urmtoarea formul: i = , n care A este amplitudinea
k
distribuiei, iar k este numrul de intervale n care dorim s mprim distribuia. De exemplu, dac
dorim s facem o mprire a distribuiei valorilor n 9 intervale vom avea urmtorul rezultat:
61
i= = 6.77. Dac valorile concrete ale variabilei nu conin zecimale vom proceda la ntregirea
9
valorii i, care se face totdeauna prin adugire. Deci, n urma ntregirii, i = 7. Dac ntregirea s-ar
face prin scdere, ar rmne valori n afara intervalelor, valori nealocate unor intervale. Dar, dac
vom considera mrimea unui interval egal cu 7, vom mri artificial mrimea amplitudinii cu 2,
deoarece 9 7 = 63. Pentru a mpri ponderat diferena la cele dou capete ale distribuiei vom
ncepe primul interval de la 21 i ultimul interval va avea valoarea superioar egal cu 83, deci va fi
mai mare cu 1.
Crearea tabelului cu intervale. Intervalele care rezult sunt urmtoarele:
1 2 3 4 5
Nr.crt. Interval Centru interval Marcare Frecvena
1. 21 27 24 II 2
2. 28 34 31 IIII I 6
3. 35 - 41 38 IIII IIII I 11
4 42 - 48 45 IIII IIII IIII II 17
5. 49 - 55 52 IIII IIII IIII IIII II 22
6. 56 - 62 59 IIII IIII III 13
7. 63 - 69 66 IIII IIII II 12
8. 70 - 76 73 IIII 5
9. 77 - 83 79 III 3
Total N = 91
Tabelul 6. Conine gruparea pe variante de variaie i marcarea frecvenelor valorile pentru fiecare interval
Pe lng rubricile cuprinznd numrul curent i mrimea intervalului au fost trecute, pentru o mai
bun nelegere a tabelului, rubrici cuprinznd marcarea variabilelor componente ale unui interval i
frecvena acestora pe un interval. La o prim privire, intervalele creeaz impresia c au valoarea 6, i
nu 7, cum am anunat anterior. Dar aceste intervale includ limita inferioar i limita superioar. Intervalul
2127 conine urmtoarele valori teoretice: 21,22,23,24,25,26,27. Deci, are 7 componente numerice
distincte. n unele cazuri se face precizarea dac limitele intervalelor sunt sau nu incluse n interval sau
se face precizarea care sunt limitele reale ale intervalelor, n cazul existenei unor valori zecimale.
Astfel, intervalul 21 27 poate avea limita inferioar 20,5 i limita superioar 27,5 dac am fi avut
zecimale.. Ca atare, dac am fi ntlnit valorile 20,7 sau 27,3 le-am fi marcat la intervalul anunat
anterior. Centrul intervalului se obine prin mprirea la 2 a adiiei valorii limitei inferioare a intervalului i
a celei superioare. Astfel la intervalul nr.1, centrul intervalului, egal cu 24, s-a obinut n felul urmtor: 24
21 + 27 48
= = . Stabilirea centrului intervalului poate fi util pentru uurarea unor calcule, situaie n
2 2
care centrul intervalului este considerat o valoare reprezentativ a intervalului.
O problem care se pune la gruparea pe intervale de variaie este aceea a numrului optim de
intervale n care se divizeaz distribuia. Exist n aceast privin o serie de formule de calcul i de
tabele fixnd numrul de intervale. n primul rnd amintim formula lui H.D. Sturges; care fixeaz
111
AUREL STAN
X max X min
mrimea intervalului i = 1 + 3 . 22 lg N n care Xmax este cea mai mare valoare a distribuie,
Xmin - cea mai mica valoare i N - numrul total de rspunsuri ale subiecilor. Dup ce am stabilit
mrimea intervalului se poate determina foarte uor numrul de intervale Pentru valori nu prea mari ale
lui N (sub 100) se folosete formula Hahn-Shapiro: k=Int(N/5), n care k exprim numrul de intervale,
INT exprim partea ntreag a expresiei numerice din parantez (ntregire prin scdere, de exemplu,
INT (3,7)=3). Ilie Puiu Vasilescu exemplific, n una din lucrrile sale consacrate statisticii aplicate, o
serie de tabele care indic numrul de intervale n funcie de numrul de subieci14. Redm, n
continuare, unul din aceste tabele, i anume tabelul lui Bendat i Piersol:
N 200 400 600 800 1000 1500 2000
K 16 20 24 27 30 35 39
Tabelul 6. Tabelul Bendat Piersol referitor la numrul optim de intervale n care se pot diviza distribuiile
n acest tabel prin n s-a notat numrul r de rspunsuri ale subiecilor la o anumit solicitare i prin
k numrul de intervale necesare. Astfel, la 200 de subieci sunt necesare 16 intervale, ntre 201 i 400
sunt necesare 20 de intervale, ntre 401 i 600 avem nevoie de 24 de intervale, .a.m.d. n practic
gruprii datelor pe un numr relativ mic de rspunsuri (n jur de 100) se realizeaz 7; 9; 11; 13 intervale.
Numrul de intervale este impar, fapt ce pune mai bine n eviden tendina central.
n urmtoarea etap se realizeaz un tabel cu frecvenele i alte rubrici necesare efecturii
calculelor statistice. Tabele se elaboreaz conform unor reguli. Aceste reguli15 sunt:
1. s faciliteze percepia rapid i exact a informaiilor prezentate;
2. s cuprind numai informaii strict necesare caracterizrii fenomenului studiat;
3. s aib un titlu scurt, clar, care s sintetizeze coninutul informativ al datelor;
4. s fie numerotate pentru a putea fi identificate uor n textul de analiz,
5. s fie nsoite de note explicative care s explice noiunile cu mai multe sensuri;
6. notele explicative trebuie s explice sursa datelor;
7. liniile i coloanele tabelului trebuiesc numerotate pentru a putea fi identificate uor in text;
8. n tabele nu se admit rubrici incomplete.
14 Vezi Vasilescu, Ilie Puiu, Statistic informatizat pentru tiinele despre om, Editura militar, Bucureti, 1991, pag. 27
15 Vezi Porojan, Dumitru Statistica i teoria sondajului Casa de editur i pres ansa SRL, Bucureti, 1993, pag. 39
112
STATISTIC I
Legend:
f = frecven simpl sau frecven absolut;
f% = frecven simpl relativ;
fc = frecven cumulat ascendent;
fc% = frecven relativ cumulat ascendent;
fc = frecven absolut cumulat descendent;
fc% = frecven relativ cumulat descendent;
Frecvena simpl notat cu f, indic numrul de rezultate ale subiecilor care se gsesc n intervalul
respectiv. De exemplu, n intervalul 3, cu limitele 35 41 (limita inferioar 35, limita superioar 41) se
gsesc 11 rezultate ale subiecilor. Deci, 11 subieci au obinut la proba AD-P rezultate (sau scoruri)
cuprinse ntre 35 i 41. Dac adiionm toate cele 9 frecvene simple va rezulta valoarea 91,
reprezentnd ansamblul rezultatelor subiecilor care au participat la examinare (notat cu N mare. N
reprezint volumul distribuiei). Frecvena simpl relativ, notat cu f%, indic cota parte de subieci
(este exprimat sub form de proporie) din totalul de 91, existent n intervalul respectiv. n dreptul
intervalului 3 (35 41) se vor afla 0,12 din totalul rezultatelor subiecilor, sau, exprimat sub form
procentual, 12% din acest total(valoare trecut n parantez). Frecvena cumulat ascendent indic
numrul rezultatelor subiecilor care se gsesc pn n dreptul intervalului respectiv (inclusiv acest
interval). De exemplu, n dreptul intervalului 3 de la rubrica fc se gsete valoarea 19, semnificnd
faptul c pn n dreptul intervalului 3, inclusiv acesta, se gsesc 19 rezultate ale subiecilor, sau mai
clar, primele 19 rezultate ale subiecilor ordonate cresctor. Valoarea 19 se obine prin adiia primelor 3
frecvene simple (19 = 2+6+11). Valoarea corespunztoare a intervalului 4, din rubrica fc este 36. Ea
se obine din adiia valorilor primelor 4 frecvene simple (36 = 2+6+11+17). Primele valori din rubricile f
i fc coincid (ambele au valoarea 2). Frecvena relativ cumulat ascendent reprezint cota parte din
totalul rezultatelor subiecilor existent pn la un anumit interval. Ea ne informeaz despre proporia
rspunsurilor subiecilor ( n parantez este trecut forma de exprimare procentual) pn la un anumit
interval. De exemplu, n dreptul intervalului 4 la rubrica fc% se gsete valoarea 0,40, care provine din
adiia frecvenelor simple relative de la intervalele 1- 4 (0,02 + 0,07 + 0,12 + 0,19). Aceast valoare ne
spune c pn la intervalul 4, inclusiv acesta, se gsesc 0,40 din totalul rspunsurilor subiecilor, sau,
exprimat sub form procentual, 40% din totalul acestora. Frecvena cumulat descendent exprim
numrul rspunsurilor subiecilor care se gsete dincolo de un anumit interval Astfel, valoarea 72 a
intervalului 4 din rubrica fc exprim faptul c dincolo de intervalul 4 (inclusiv acesta) se gsesc 72 de
rspunsuri ale subiecilor. Valoarea 72 se obine scznd din numrul total al subiecilor (N = 91) adiia
frecvenelor simple a primelor 3 intervale. Astfel 72=91(2+6+11). Dac ar trebui s calculm frecvena
cumulat descendent a intervalului 5 vom scdea din totalul rspunsurilor adiia primele 4 valori, iar
pentru intervalul 6 adiia primelor 5 valori (55 = 91(2+6+11+17) i 33=91(2+6+11+17+22)). Frecvena
relativ cumulat descendent, notat cu fc% exprim o situaie identic, exprimat sub form de
proporie, n parantez sub form procentual).
Tabelul cuprinznd frecvenele unei distribuii pe intervale de variaie are o utilitate deosebit
pentru calculul diferiilor indicatori statistici.
113
AUREL STAN
Formele de reprezentare grafic ale distribuiilor valorilor unei variabile (distribuii univariate, n
care exist o singur variabil care ia diferite valori) sunt foarte diversificate, Ele au menirea de a
vizualiza tendinele existente n interiorul unei distribuii. Prin aceast form grafic unele tendine
existente ntr-o distribuie sunt scoase foarte uor n eviden. Noi vom prezenta cele mai frecvent
utilizate forme de exprimare grafic. Folosim pentru exemplificare distribuia de valori prezentat n
tabelul anterior.
25
22
20
17
Frecventa intervalelor
15 13
12
11
10
6
5
5 3
2
0
"21-27" "28-34" "35-41" "42-48" "49-55" "56-62" "63-69" "70-76" "77-83"
Intervale de variatie
O form a reprezentrii grafice prin coloane este histograma, n care coloanele sunt lipite unele
de altele.
114
STATISTIC I
25
20
Frecventa intervalelor
15
22
10
17
11 13 12
5
6 5
2 3
0
"21-27" "28-34" "35-41" "42-48" "49-55" "56-62" "63-69" "70-76" "77-83"
Intervale de variatie
O alt form frecvent utilizat de reprezentare grafic a rezultatelor este poligonul frecvenelor.
Acesta se obine prin unirea printr-un segment de dreapt a mijlocului liniilor superioare care marcheaz
coloanele histogramelor. Se pot obine i prin unirea prin segmente de dreapt a punctelor care ar
reprezenta frecvena fiecrui interval, pornind din centrul acestuia
25
22
20
Frecventa intervalelor
17
15
13
12
11
10
6
5 5
3
2
0
"21-27" "28-34" "35-41 "42-48" "49-55" "56-62" "63-69" 70-76" "77-83"
Intervale de variatie
Dac marcm pe abscis fiecare interval prin liniue echidistante i unim printr-o linie continu
punctele reprezentnd frecvena intervalelor obinem curba distribuiei.
115
AUREL STAN
25
22
20
Frecventa intervaleor
17
15
13
12
11
10
6
5 5
3
2
0
"21-27" "28-34" "35-41 "42-48" "49-55" "56-62" "63-69" 70-76" "77-83"
Intervalele de variatie
43
c
b
a
75
studii tehnice
11%
studii
studii umaniste
economice
56%
Diagrama circular 33%
Figura 5. Cuprinde modaliti de reprezentare grafic specifice scalelor nominale(n primul tip de reprezentare
grafic sunt trecute frecvenele absolute, n al doilea tip frecvenele relative).
116
STATISTIC I
Protocol de tip Sn protocol de structur subiect-rezultat total. n cadrul acestui tip de protocol,
fiecrui subiect si dintr-un ansamblu format din n subieci i corespunde o valoare a variabilei Xi.16
Exemplu:
Si Xi Si Xi
S1 X1 1 17
S2 X2 2 19
S3 X3 3 27
S4 X4 4 33
- - - -
Sn Xn 87 27
Tabelul 8. Protocol de tip Sn n partea din dreapta se d un exemplu concret
16Explicaii suplimentare n lucrarea Valentin Clocotici, Aurel Stan, Statistic aplicat n psihologie, Polirom, Iai, 2000,
pag.94-103
117
AUREL STAN
S G Xi S G Xi
S1 G1 X1 1 Grup 1 12
S2 G1 X2 2 Grup 1 19
S3 G2 X3 3 Grup 2 23
- - - - - -
Si Gi Xi 35 Grup 3 35
- - - - - -
- - - - - -
Sn Gq Xn 143 Grup 7 29
Tabelul 9. Protocol de baz de tipul subiect grup de apartenen
Suportul protocolului este cadrul n care rezultatele individuale nu au fost reportate. Subprotocolul
este o parte a protocolului de baz; rezultatele obinute printr-o parte din subieci i/sau ntr-o parte a
condiiilor experimentale
Mai putem vorbi de protocoale derivate. Acest tip de protocol este obinut dup ce s-a realizat
anumite operaiuni (transformri ale variabilelor dependente, diferite calcule, condensri i rafinri ale
modalitilor) asupra protocolului de baz. De exemplu, calculul mediei rezultatelor obinute de subieci
ntr-o condiie experimental. Calculele pot s rezide n transformarea variabilei dependente (prin
transformare logaritmic, de exemplu), n rezumarea rezultatele prin intermediul diferitelor tipuri de
indicatori (tendin central, dispersie), n nsumarea datele individuale i n calcularea frecvenelor sau
a procentajelor. n general, cercettorul va prezenta datele ntr-un tablou al rezultatelor care constituie
un protocol derivat.
17 dup J.P. Rossi & Al., La mthode exprimentale en psychologie, Dunod, Paris, 1997, pag.61
118
STATISTIC I
situaii de detecie a literelor(subiectul trebuie s spun dac o anumit liter era prezent printre
stimuli) i de decizie lexical (subiectul trebuia s spun dac stimulul era un cuvnt).
n urma prelucrrii rezultatelor, autorii au ntocmit urmtorul tabel:
Numr Detecie litere (t1) Decizie lexical (t2)
silabe Cuvinte(m1) Necuvinte(m2) Cuvinte(m1) Necuvinte(m2)
n1 m 457 473 414 497
s 133 126 111 137
n2 m 460 482 468 579
s 126 105 145 176
n acest tabel sunt nregistrate duratele pauzelor oculare. Explicarea acestei cercetri opereaz
cu urmtorii termenii:
factor principal sistematic, notat T2, cu modalitile t1 (detecia literelor) i t2 (decizia lexical).
Prin aceast se permite o prim diviziune n dou coloane a rezultatelor;
tipul de stimul, notat cu M2, cu modalitile m1 (cuvinte) i m2 (necuvinte). Cu M2 se permite
subdivizarea coloanelor t1 i t2 (sarcinile);
numrul de silabe, notat N2, cu modalitile n1 (2 sau 3 silabe) i n2 (4 sau 6 silabe). N2 este
indicat pe linii.
Variabila dependent este durata pauzelor oculare.
n tabel sunt nregistrate mediile interindividuale (m), ca indicator de tendin central, i abaterile
standard (s), ca indicator de mprtiere. Lectura tabelului presupune punerea n coresponden a
liniilor i coloanelor. Valoarea 457 semnific durata medie a pauzelor oculare n sarcina de detecie a
literelor cnd stimulii sunt cuvinte de 2-3 silabe. Valoarea 497 semnific durata medie a pauzelor
oculare cnd stimulii sunt necuvinte de 2-3 silabe. Protocolul prezint un indicator de tendin central
i un indicator de mprtiere care fac bilanul datelor experimentale. Un protocol de baz cuprinde
durata pauzelor oculare obinute de fiecare subiect pentru fiecare din stimulii prezentai, deoarece n
fiecare condiie experimental sunt utilizai mai muli stimuli diferii.
119
AUREL STAN
determinat ntr-o anumit clas valoric a subiecilor pentru care testul a fost etalonat. Se va vorbi de
intercuantile (de interdecile, de exemplu) pentru a desemna n+1 zone de distribuie delimitate prin
cuantile (prin n desemnnd numrul cuantilelor). Uneori se utilizeaz termenul de interquantil n loc de
quantil. Distincia clar se face prin precizarea faptului c interqantilul este un interval numeric, pe cnd
quantilul este reprezentat de o singur valoarea numeric. Lucrrile se specialitate ale lui Maurice Reuchlin
consacrate statisticii aplicate n psihologie fac clar aceast separaie de sensuri pentru cele dou noiuni18.
Cuantilele i intercuantilele numerotate cu 1 corespund, n general n Frana, celor mai bune rezultate, iar
n SUA rezultatelor celor mai slabe. Este o chestiune de convenie a notrii. Dac ntr-o distribuie se vor
reprezenta intercuantilele prin clase determinnd intervale pe axa absciselor, se va asigura la aceast distribuie
grafic o form rectangular, efectivele teoretice ale tuturor interquantilelor fiind egale prin definiie.
La nceputul procedurii de cuantilaj (form particular a etalonajului) se alege o metric, adic un numr de
niveluri pe care scala permite de a le discrimina. Dac o scal cuprinde n niveluri i dac efectivul total al unui
N
eantion este N, efectivul fiecrui nivel va fi teoretic . Scala n cuantile va corespunde, deci, unui model
n
rectangular. Cele mai utilizate tipuri n cuantile sunt prezentate n tabelul care urmeaz:
18 Vezi Maurice Reuchlin, Prcis de statistique, PUF, Paris, 1976, pag. 67-78
120
STATISTIC I
privire la tehnicile folosite pentru selectarea subiecilor n eantion. naintea operaiunii de etalonare,
datele se organizeaz cresctor n variante de variaie.
Tabelul ntocmit n vederea stabilirii scalei de etaloane n 10 interquantile (sau n 10 clase) va
arta n felul urmtor.
X n nc nct Interdecil Decil Numerotare % interdecil Separaie decil
6 3 3
7 7 10
8 4 14
9 6 20
10 8 28
11 11 39 36 0 11 11 I 10,88% 10,88%/89,12%
12 14 53
13 17 70 72 12 13 13 II 8,61% 19,49%/80,51%
14 16 86
15 19 105 108 14 15 15 III 9,72% 29,21%/70,79%
16 24 129
17 22 151 144 16 17 17 IV 12,77% 41,98%/58,02%
18 26 177 180 18 18 V 7,22% 49,20%/50,80%
19 21 198
20 24 222 216 19 20 20 VI 12,50% 61,70%/38,30%
21 18 240
22 19 259 252 21 22 22 VII 10,27% 71,97%/28,03%
23 17 276
24 14 290 288 23 24 24 VIII 8,61% 79,58%/20,42%
25 16 306
26 14 320 324 25 26 26 IX 8,33% 87,91%/12,09%
27 11 331 331
28 9 340 340
29 7 347 347
30 6 353 353
31 5 358 358
32 2 360 360 27-32 X 12,09%
Tabel nr. 12. Coloanele tabelului conin etape ale procedurii de etalonare prin metoda quantilelor a rezultatelor
obinute la un test psihologic de subieci unui eantion
Jocul frecvenelor cumulate absolute face s nu putem tia distribuia exact acolo unde trebuie.
n acest caz ne limitm n calcul la cele mai apropiate valori de cele teoretice. Astfel, la primul decil ar fi
trebuit s ne oprim la valoarea 36. Valoarea 39 folosit de noi ca valoare delimitativ pentru primul decil
este cea mai apropiat valoare de 36. Procednd n acest fel am realizat un compromis metodologic.
n cazul cnd dorim s stabilim o scal n centile sau percentile, avem la ndemn o procedur
puin diferit. Pentru a pune n aplicare aceast procedur trebuie s avem distribuii ale cror
amplitudini sunt de ordinul sutelor. Raiunea construirii scalelor care fac apel la centile este de a asigura
121
AUREL STAN
o discriminare foarte fin a subiecilor, dar n cazul n care amplitudinea distribuiei este sub 100
asigurm o fals finee a diferenierii. Redm, n continuare, un tabel ale crui coloane indic paii de
urmat n procedura de calcul:
Lum exemplu a 127 de subieci care au fost examinai cu un anumit test (exemplul este fictiv).
Nr.crt. X f f% C fc% Percentila
1. 11 2 1,57 2 1,57 0,79
2. 12 5 3,94 7 5,51 3,54
3. 13 7 5,51 14 11,02 8,27
4. 14 11 8,68 25 19,69 15,36
5. 15 19 14,96 44 34,65 27,17
6. 16 26 20,47 70 55,12 44,89
7. 17 18 14,17 88 69,29 62,21
8. 18 15 11,81 103 81,10 74,50
9. 19 11 8,66 114 89,76 85,43
10. 20 7 5,51 121 95,28 92,52
11. 21 4 3,15 125 98,43 96,85
12. 22 2 1,57 127 100,00 99,22
Tabel nr. 13. Coloanele tabelului indic etapele necesare calculrii valorilor percentile
Avem n fa un exemplu simplu, deoarece n practic este foarte puin probabil s se gseasc
un test la care s se poat obine doar 12 valori distincte.
Procedura exemplificat de noi este folosit de autori reputai n domeniul psihometric ca David
Magnusson19, J.J. Bernier i B. Pietrulewicz20. Prin aceast procedur se ncearc a se ameliora
impreciziile metodei prezentate la calculul decilelor.
Coloana notat cu X conine diferitele variante ale variabilei obinute n urma unei examinri cu
un anumit test. A doua coloan, notat cu f , conine frecvenele diferitelor valori ale variabilei. n total au
fost cuprini n analiz 127 de rezultate ale subiecilor. Cu f% a fost notat frecvena simpl relativ,
care se obine prin nmulirea cu 100 a rezultatului mpririi fiecrei frecvene simpl la 127 (numrul
total de subieci examinai). Cu fc a fost notat frecvena absolut cumulat ascendent, iar cu fc%
frecvena relativ cumulat ascendent. Valorile din aceast coloan se obin prin nmulirea cu 100 a
rezultatului mpririi fiecrei valori din coloana fc la 127. Ultima coloan conine transformarea n valori
percentile a valorilor iniiale ale testului. Cum se obin aceste valori? Valoarea 13, de exemplu, este
considerat mijlocul unui interval de clas care se ntinde de la 12,5 pn la 13,5. Ca atare, valoarea
percentil este constituit din frecvena cumulat relativ anterioar valorii 13 i din adugarea din
frecvena relativ din dreptul valorii 13.
5,51
8,27 = 5,51 +
2
8,68
15,36 = 11,02 +
2
Ce ne spune o valoare percentil? Ea ne spune, de exemplu, c sub valoarea 16 se gsesc
aproximativ 45% din totalul subiecilor, iar peste aceast valoare se gsesc aproximativ 55 % din totalul
subiecilor.
19 vezi David Magnusson, Testtheorie, Verlag Fraanz Deutlicke Wien, 1973, pag 252
20 vezi J.J. Bernier, B. Pietrulewicz, La psychometrie, Gaetan Morin Editeur, Montreal, Casablanca, 1997, pag. 371-372
122
STATISTIC I
n cazul ordonrii valorilor variabilei pe intervale de variaie procedura este puin diferit. Folosim
exemplul de la nceputul seciunii referitoare la gruparea datelor. Rubricile tabelului sunt cunoscute din
comentariile noastre anterioare. n cazul n care dorim s construim o scal n quartile (trei quartile
mpart distribuia n 4 clase) vom stabili n primul rnd quota, adic un cuantum procentual de subieci
separat de valorile quartilelor. Deci, quartilele se refer la valorile distribuiei, iar quota la un cuantum
procentual al efectivului total. Quota pentru primul quartil va fi de 25% din efectivul total (22,75 n
valoare absolut), quota pentru cel de-al doilea quartil va fi de 50% (45,5 n valoare absolut) i quota
pentru cel de-al treilea quartil va fi de 75% (68,25 n valoare absolut).
Nr.crt Interval f Fc fc%
1 21 27 2 2 0,02 (2%)
2 28 34 6 8 0,09 (9%)
3 35 41 11 19 0,21 (21%)
4 42 48 17 36 0,40 (40%)
5 49 55 22 58 0,64 64%)
6 56 62 13 71 0,78 (78%)
7 63 69 12 83 0,91 (91%)
8 70 76 5 88 0,97 (97%)
9 77 83 3 91 1,00 (100%)
Total N=91
Tabelul 14. Coloanele tabelului conin etape de calcul pentru obinerea quantilelor i interquantilelor n condiiile
gruprii de variante de variaie
Valoarea primei quote va cuprinde 25% din rezultatele subiecilor examinai.. Dac privim la
rubrica fc% a tabelului observm c primii 25% din subieci sunt delimitai de intervalul numrul 4 care
cuprinde pn la el 40% din subieci (inclusiv intervalul 4). Intervalul anterior nu putea s fac o astfel
de separaie, deoarece pn la el se gsesc doar 21% din rezultatele subiecilor (19 rezultate n valoare
absolut). Formula de calcul pe care o aplicm pentru calculul quantilelor pentru date organizate pe
variante de variaie este urmtoarea.
i*d
Q = X sup + ;
f
n care:
Q = denumire generic pentru quantil;
Xsup= valoarea superioar a intervalului anterior celui n care se afl quota;
i = mrimea intervalului de variaie;
d = diferena dintre valoarea absolut a quotei i frecvena cumulat absolut anterioar
intervalului n care se afl quota;
f = frecvena simpl absolut a intervalului n care se afl quota
Pentru cazul nostru particular de calcul a quartilelor, form particular a quantilelor, vom nota
quartilul 1 cu Q1, quartilul 2 cu Q2, quartilul 3 cu Q3. Pentru Q1 am amintit c valoarea procentual a
quotei este de 25%, iar valoarea absolut este de 22,75 (25% din 91; 910,25=22,75). Valoarea
absolut a quotei primului quartil se afl n intervalul 4.
Xsup sau valoarea superioar a intervalului anterior celui n care se afl quota este egal cu 41.
Intervalul anterior este intervalul 3 (35-41). Valoarea superioar sau limita superioar a acestuia este 41.
Mrimea unui interval (i) este egal cu 7.
123
AUREL STAN
Diferena dintre valoarea absolut a quotei (22,75) i frecvena absolut cumulat ascendent a
intervalului anterior celui n care se afl quota (19) este egal cu 3,75 (deci, d=22,7519=3,75).
Frecvena intervalului n care se afl quota este egal cu 17. Intervalul 4 are frecvena egal cu
17.
Avem la dispoziie toate datele necesare calculrii primului quartil.
7 * 3,75 26,25
Q1 = 41+ = 41+ = 41 + 1,54 = 42,54
17 17
n continuare, trecem la calcularea celui de-al doilea quartil. Al doilea quartil separ primele 50%
din rezultatele subiecilor de urmtoarele 50%. De aceast dat quota va fi egal cu 50% din efectivul
91
total, deci, va avea valoarea 45,5 ( = 45,5 ). De aceast dat quota se va situa n intervalul 6, adic
2
intervalul 49 55. Limita superioar a intervalului anterior celui n care se afl quota (Xsup) va fi egal cu
48, diferena ntre quot i frecvena cumulat ascendent anterioar va fi egal cu 9,5 (d = 45,5 36 =
9,5) i frecvena pe intervalul n care se afl quota va fi egal cu 22. Din efectuarea calculelor rezult:
7 * 9,5 66,5
Q2 = 48+ = 48 + = 48 + 3,02 = 51,02
22 22
Pentru calcularea celui de-al treilea quartil, care separ primele 75% dintre rezultatele subiecilor
de ultimele 25% din acestea, quota va fi egal cu 75%, adic are valoarea 68,25. Aceast valoarea se
va gsi n rubrica fc n dreptul intervalului 6 (56 62). Valoarea superioar a intervalului anterior celui
n care se afl quota va fi egal cu 55 (Xsup.). Diferena dintre quot i frecvena cumulat ascendent a
intervalului anterior celui n care se afl quota este egal cu 10,25 (d = 68,25 58,00). Frecvena
intervalului n care se afl quota specific quartilului 3 este egal cu 13. Dup ce am aflat respectivele
valori, putem trece la calcularea quartilului 3.
7 * 10,25 71,75
Q3 = 55 + = 55 + = 55 + 5,51 = 60,51
13 13
Deoarece valorile quartilelor prezint zecimale (ele rezult din interpolare) putem s procedm la
ntregire. Prezentm situaia rezultat n tabelul urmtor.
Nr.crt. Notare Valoare ntregire Notare interquartile Limite
quartille
1 Q1 42,54 43 I 43
2 Q2 51.02 51 II 44 51
3 Q3 60,51 61 III 52 61
4 IV 62
Tabelul 15. Conine exemplificri pentru valorile i notrile quartilelor
Procedura este identic pentru celelalte variante ale cuantilelor. Datele pentru efectuarea
calculelor variaz n funcie de mrimea valorilor variabilei i de dimensiunea quotei. Se observ foarte
uor c interquartilele nu sunt egale n privina dimensiunii intervalelor, ci n privina numrului de
rezultate coninute. De exemplu: pn la valoarea 43 se gsesc primele 25% dintre rezultate, ntre
valorile 44 i 51 ale variabilei se gsesc urmtoarele 25% dintre rezultate, .a.m.d.
124
STATISTIC I
EXERCIIU
125
AUREL STAN
n activitatea de cercetare a unei serii de date avem nevoie de expresii numerice precise care s
descrie condensat caracteristicile acesteia. Aceste mrimi poart numele de indicatori statistici..
Indicatorul statistic este o mrime cu ajutorul creia se caracterizeaz un fenomen sub raportul
structurii, interdependenelor, i modificrilor n timp i spaiu. Expresia numeric este legat de
calitatea fenomenului studiat i, n consecin, indicatorul statistic este expresia numeric a unei
categorii riguros definite. Din punct de vedere numeric indicatorul statistic poate fi o mrime absolut
(volum, efectiv, total) sau o mrime derivata (medie, indice, coeficient). Indicatorul statistic este
rezultatul unei observri i prelucrri statistice.
n activitatea de prelucrare a datelor din domeniul psihopedagogic, i nu numai din acesta, se fac
raportri la 4 feluri de indicatori:
1. indicatori de nivel sau de tendin central (medie, median, modul);
2. indicatori de mprtiere (amplitudine, abatere quartil, abatere medie, varian, abatere standard);
3. indicatori de asimetrie
4. indicatori de exces sau de boltire
Media exprim nivelul atins de o variabila numeric atunci cnd aceast variabil este uniform
repartizat pe unitile care compun o populaie determinat. Cuvntul medie, fr nici o alt
specificaie, se folosete n accepia de medie aritmetic, medie fundamentat n teorie i comod de
utilizat n practic. Alte medii uzuale sunt: media armonic, media geometrica i media ptratic. Notaia
uzual pentru media aritmetic este X , dar se pot ntlni i alte notaii.
n sens general, media trebuie s satisfac anumite condiii. Acestea sunt:
Medie trebuie s fie definit n mod precis. Aceast cerin nu poate fi lsat doar pe seama simplei
aprecieri subiective a celui care efectueaz aciunea de observare;
medie trebuie sa fie expresia tuturor observaiilor fcute. n caz contrar, ea nu poate fi n mod real o
valoare tipic a ntregii repartiii;
Este de dorit ca media s posede proprieti simple i evidente, fcnd posibil nelegerea sensului
su general. O medie nu trebuie s aib un caracter matematic prea abstract;
Este de dorit ca o medie s poat fi calculat cu uurin i rapiditate. Dintre dou medii cu
proprieti asemntoare va fi preferata aceea care se poate calcula mai uor. ns, nu trebuie s
acordm o prea mare atenie uurinei n calcul n detrimentul altor exigene;
Este de dorit ca media sa fie afectat ct mai puin de fluctuaiile de selecie. n eantioanele
extrase (eantionul are sensul de subansamblu al unei populaii) din aceeai populaie mediile vor fi
rareori identice, iar o form anumit de medie poate conduce la diferene mai mari dect alta. Dintre
doua forme de medii va fi mai bun aceea care prezint mai mult stabilitate.
Medie trebuie s poat fi rapid studiat cu ajutorul calculului algebric.
126
STATISTIC I
Volumul sau efectivul acestei distribuii este 11. Media o aflm prin divizarea sumei tuturor
valorilor individuale (187) la 11, rezultatul fiind 17. Prin x se noteaz deviaiile fiecrei valori de la medie,
motiv pentru care valoarea obinut se numete valoare de deviaie.
n tabel se observa clar c suma ptratelor diferenei de la alt valoare dect media aritmetic
este o valoare mai mare dect suma ptratelor abaterilor de la media aritmetic.
Astfel, din consultarea tabelului rezult:
x < (X 15) ; x < (X 15) : x < (X 19)
2 2 2 2
Folosirea mediei n prelucrarea statistic a datelor din domeniul psihopedagogiei este frecvent
n trei tipuri de situaii, din care unele pot fi rezolvate prin folosirea medianei i a modulului:
Situaia n care se pune problema de a aprecia o observaie ntr-o distribuie. Exemplu: O not
poate fi apreciat ca superioar sau inferioar mediei. n general, se precizeaz aceast
constatare.
Situaia n care se compar un grup de observaii cu un altul. Exemplu: ntr-un proces de nvare
care comport o serie de ncercri succesive pot s fie lsate intervale de timp (nvare distribuit)
sau nu (nvare masat). Se constat, n general c rezultatul unui grup de subieci n nvarea
distribuit este superior rezultatului n nvarea masat. Dac cineva consider c aceast
127
AUREL STAN
diferen este prea mare pentru a putea s se explice doar prin variaii fortuite, aceasta va conduce
la o explicaie psihologic;
Situaia n care seriile de date provin de la o surs de variaie sistematic sau de la mai multe. Se
poate calcula valoarea medie asociat la fiecare din strile acestei surse Aceast medie permite de
a descompune variaiile observate n mai multe abateri (care se numesc "efecte") i de a analiza
astfel importana relativ a diferitelor surse sistematice sau fortuite. Posibilitatea unei astfel de
analize este esenial pentru explicarea fenomenelor observate.
urmtoarea formul: X =
X n care X este notarea mediei aritmetice, X este suma valorilor
N
individuale ale variabilei X i N exprim numrul total de observaii sau efectivul distribuiei. n cazul
nostru concret: X =
X =
350
= 23,3 . Litera greceasc are sensul de sum. Formula pentru date
N 15
negrupate se practic n situaia n care avem puine date la dispoziie. n cazul n care numrul valorilor
unei variabile devine mare, este necesar operaiunea de grupare a datelor. S presupunem c pentru
aceeai situaie experimental am cules date de ordinul sutelor i am procedat la o grupare a lor
conform tabelului nr. 17.
128
STATISTIC I
n cazul folosirii primei variante de calcul anunate a mediei aritmetice aplicm urmtoarea
formul: X =
fX i
. n cazul de fa f reprezint frecvena pe interval, Xi desemneaz centrul
N
intervalului (i variaz de la 1 la 7, numrul total al intervalelor) i N numrul total al rezultatelor
subiecilor (N=118). Prin aplicarea formulei rezult:
5287
X = = 44,8 , n care 5287 reprezint suma produselor dintre centrele intervalelor i frecvenelor
118
acestora, iar 118 numrul total al rezultatelor subiecilor sau efectivul total. Atragem atenia asupra
faptului c o asemenea formul aproximeaz valoarea mediei aritmetice. Aceast aproximare poate fi
acceptat n cazul n care variabilele sunt repartizate armonios pe lungimea intervalului. Dac n
intervalul 1 (27 31) vom avea valorile 27, 28, 29,29,29, 30, 31 atunci centrul intervalului este
reprezentativ pentru acesta, dar dac vom avea n acest interval 7 valori de 27 sau 7 valori de 31
centrul intervalului de variaie nu mai ndeplinete aceast condiie. Ca atare, acest mod de calcul nu se
recomand n situaia n care distribuiile valorilor prezint asimetrii puternice.
129
AUREL STAN
Realizarea rubricii variabilei codificate u, utilizat n cel de-al doilea procedeu de calcul pentru
variabile ordonate pe intervale de variaie, presupune fixarea n dreptul unui interval a valorii 0 a
variabilei codificate. Aceast fixare este arbitrar, ns, de regul, se realizeaz n dreptul intervalului
modal, adic n dreptul acelui interval care are frecvena cea mai mare. n cazul exemplificat de noi
acest interval poart numrul curent 4 (42 46) Valoarea central a acestui interval va fi o valoare de
referin i o vom nota cu A. n cazul nostru A = 44. Valorile coloanei u se stabilesc prin mprirea
diferenei dintre valoarea variabil Xi i constanta A la mrimea intervalului (i). Urmnd procedura de
39 44 34 44 29 44
calcul vom obine: -1= , -2 = , -3 = .a.m.d. Pentru valorile mai mici ale
5 5 5
variabilei XI dect constanta A se obin valori negative ale variabilei codificate u, i pentru valori mai
mari ale variabilei Xi dect constanta A se obin valori pozitive ale variabilei codificate u. n cazul folosirii
n calcul al variabilei codificate u, formula de calcul va fi urmtoarea:
i * fu
X = A+ ,
N
n care A este o constant egal cu mrimea centrului intervalului pentru care variabila u = 0, i este
mrimea unui interval, fu este produsul din frecvena intervalului i variabila codificat u, f este frecvena
simpl unui interval i u variabila codificat.
5 * 19
Prin aplicarea formulei obinem X = 44 + = 44,8. Facem nc o dat precizarea c aceste
118
proceduri de calcul fac posibil apariia unei anumite erori, eroare datorat faptului c se lucreaz cu
mrimi de reprezentare. Astfel, centrul intervalului este considerat reprezentativ pentru ntregul interval,
situaie care antreneaz erori mari n cazul n care distribuia valorilor are asimetrii accentuate, de
stnga sau de dreapta. n acest caz se impune o operaiune de micorare a mrimii intervalului pn la
limite care asigura o marja de eroare acceptabil. Cea mai corect modalitate de calcul a mediei este
cea rezultat din adiia variabilelor brute si divizarea sumei acestor variabile brute la numrul de
observaii. Prezena unor instalaii de calcul electronic, chiar mai puin performante, fac din calculul
mediilor, si nu numai a lor, o operaiune banal, executat ntr-un timp extrem de scurt.
Problema calcului mediilor se pune i in cazul analizei de itemi. Itemul este o component
informaional elementar a unui test sau chestionar psihologic, care se prezint dihotomic din punct de
vedere cantitativ n cea mai mare parte din cazuri. Analiza de itemi este o operaiune strict necesar n
cazul n care dorim s ne asigurm de faptul c testul ndeplinete o serie de exigene funcionale. S
lum dou exemple (fictive) de modaliti de prezentare a itemilor unor probe psihologice.
130
STATISTIC I
9 1 1 0 0 9 3 4 5 4
10 1 0 1 1 10 3 2 4 4
11 0 1 0 0 11 2 1 4 3
fi 7 6 4 5 fI 23 29 37 36
pi 0,63 0,54 0,36 0,45 pi 0,41 0,52 0,67 0,65
qi 0,37 0,46 0,64 0,55 qi 0,59 0,48 0,33 0,33
Tabelul 19. Cuprinde exemplificare pentru modul de calcul al mediei itemilor
n cazul primului exemplu (testul A) avem situaia de examen a 11 subieci la un test cu 4 itemi
(exemplul este teoretic, deoarece un test trebuie sa aib cel puin 20 itemi pentru a putea fi numit test).
Acest mod de organizare a rezultatelor obinute de un grup de subieci la un test psihologic (subieci-
itemi) se numete matricea lui Stern, de la numele psihologului german W. Stern. La fiecare item din
cadrul testului A se pot obine valorile 1 (caz n care exprim soluia corect la o situaie problematic
sau rspuns la un chestionar de personalitate care pune n eviden trstura psihic ce trebuie
diagnosticat) sau 0 (caz n care exprim soluia incorect sau rspuns care nu pune n eviden
trstura psihic cercetat). La testul B rspunsurile la itemi au o distribuie cantitativ polichotomic,
notele variind ntre 1 i 5 (situaie ntlnit mai ales la chestionarele de atitudini)
n cazul testului A, notaia fi indic punctajul total obinut de toi subiecii la itemul 1 notaia pi
proporia de rspunsuri corecte i totodat media rspunsurilor corecte la itemi (i-ul variaz ntre 1 i 4,
deci, vom avea f1,f2,f3,f4, respectiv p1,p2,p3,p4,). n acest notaia pi exprim indicele de dificultate i,
f
totodat, media rezultatelor ansamblului subiecilor la itemi. Deci pi= i (n care notaia N exprim
N
numrul total al subiecilor). n cazul testului B pi exprim indicele de dificultate a itemului, dar nu i
media rezultatelor ansamblului subiecilor la itemi. La testul B, valoarea pi se obine prin mprirea
valorii totale a punctajului obinut la un anumit item de ctre cei 11 subieci la valoarea maximal pe
fi
care ar fi putut-o obine cei 11 subiecii la un anumit item. n acest caz, pi = . n cazul dat de noi
f i max
ca exemplu, la testul B, valoarea fI max = 55, obinut prin nmulirea valorii 5 (valoare maxim pe care
ar fi putut s o obin un subiect pentru un rspuns) cu 11 (numrul total al subiecilor). De exemplu, la
23
testul B, p1= = 0,40 . Pentru media itemilor din testul B se va folosi alt notaie, conform unei uzane
55
de notare.
Mediana, numit i valoare mijlocie, este o valoare caracteristic real (concret) a unei
distribuii, sau rezultnd n urma unei operaii de interpolare, care mparte valorile ordonate cresctor
sau descresctor n dou pri egale, n aa fel nct numrul valorilor mai mari s fie egal cu numrul
valorilor mai mici dect mediana. Mediana poate fi stabilit intr-o serie de date ordonate cresctor sau
descresctor. n cadrul unui ir impar de valori, mediana este valoarea unei variante concrete a
distribuiei, i anume valoarea cu rangul n+1/2. Pentru median folosim notaia Me.
131
AUREL STAN
EXEMPLU:
n distribuia 1,2,3,5,7,9,10,12,13,14,18 avem un total de 11 valori ale variabilei X.. Dac valorile
ar fi fost trecute n ordinea 7,1,13,18,2,10,5,3,9,12,14 ar fi trebuit s le ordonm cresctor. Deci, prima
operaiune necesar pentru calculul medianei este ordonarea valorilor. Mediana va avea valoarea cu
N +1 11 + 1
rangul . n exemplul nostru, mediana va avea rangul = 6 , deci a 6-a valoare din irul
2 2
ordonat cresctor, valoare egal cu 9. n stnga valorii 9 se gsesc 5 valori mai mici (1,2,3,5,7) i n
dreapta 5 valori mai mari (10,12,13,14,18).
n cazul n care seria are un numr par valori, medianei se obine prin interpolare, situndu-se
N N +2
ntre valoarea cu rangul i valoarea cu rangul . Exemplu: n distribuia
2 2
8
17,18,22,24,28,30.35.37 (N=8) valoarea medianei se va situa ntre valorile rangurilor 4 i 5
2
8 + 2
2 . n cazuri de acest gen valoarea medianei va fi media aritmetic a valorilor variabilei care au
24 + 28
rangurile 4 i 5, deci, Me = = 26 .
2
n cazul unei distribuii de frecvene pe variante de variaie mediana poate avea o semnificaie
mai puin clar, situaie cauzat de modul de determinare.
132
STATISTIC I
Modulul este valoarea variabilei cu frecvena cea mai mare n cadrul unei distribuii. Vom nota
acest indicator statistic prin Mo. S lum, de exemplu, urmtoarea distribuie de valori: 11,17,13,12
17,9,8,17,14,19,20,17,15,16,14,18. Dup ce ordonm aceast distribuie
(8,9,11,12,13,14,14,15,16,17,17,17,17,18,19,20) observm c valoarea 17 este cea mai frecvent n
cadrul acestei distribuii, ea repetndu-se de 4 ori. n acest caz, valoarea variabilei egal cu 17 va
constitui valoarea mod a distribuiei sau modul acesteia. Exist cazuri cnd ntr-o distribuie, dou sau
mai multe valori au frecvena cea mai mare. Distribuiile vor numite, n aceast situaie, multimodale
(bimodale, cnd dou valori au frecvenele cele mai mari, trimodale cnd trei valori au frecvenele cele
mai mari, .a.m.d.). De exemplu, distribuia format din valorile ordonate 4,5,6,7,7,7,8,9,9,9,10,11 este
bimodal, deoarece avem dou valori ale variabilei cu frecvene maxime, valorile 7 i 9.
Multimodalitatea indic, de obicei, o eterogenitate valoric a subiecilor supui unui examen, dar, mai
pot exista i alte explicaii.
Indicatorii de msur a mprtierii frecvent utilizai n analiza statistic a datelor din domeniu
psihopedagogic (i nu numai din acest domeniu) sunt:
amplitudinea;
variana;
abaterea standard;
abaterea medie;
abaterea quartila sau amplitudinea semiinterquartil.
Indicatorii de msur a mprtierii trebuie s satisfac condiii similare cu cele enunate pentru
indicatorii de msur a localizrii sau indicatorii de nivel:
s se bazeze pe toate observaiile;
s fie uor de calculat;
s fie afectate ct mai puin posibil de fluctuaiile de selecie i adecvate unui studiu algebric.
Cea mai simpl msur a mprtierii este amplitudinea, care se obine prin efectuarea diferenei
dintre cea mai mare i cea mai mic valoare observat la care se adaug valoarea 1. Obiecii cu privire
la folosirea amplitudinii exist n situaii n care viteza de calcul i simplitatea n interpretare nu sunt
cerine importante. Amplitudinea este afectat de fluctuaiile de selecie mari de la eantion la eantion.
Notm amplitudinea cu A. S lum exemplul timpului de rezolvare a unei sarcini: 55,5 6, 65, 54, 66, 58,
62, 61, 12, 56, 68, 67, 59, 57, 60, 145 (exprimat n zecimi de secund). n acest caz, avem doua valori
extreme, foarte puternic distanate de restul valorilor, i anume valorile 12 si 145, care aparin, probabil,
n primul caz unui supradotat, iar n al doilea unui hipofren (denumire folosit pentru a desemna o
persoan cu randament intelectual de limit). Dac valorile de acest gen sunt intr-un numr foarte mic,
se pot elimina practic din operaiunile de grupare. Dac la datele amintite am efectua calculul
amplitudinii, vom gsi o valoare de cteva ori mai mare dect n cazul n care le eliminm din calculele
noastre. n primul caz, amplitudinea se calculeaz n modul urmtor: Xmax Xmin +1=145 12 + 1= 134.
133
AUREL STAN
n cazul eliminrii valorilor puternic distanate, avem: A = Xmax Xmin + 1 = 68 54 + 1 = 15. Ultima
determinare a amplitudinii este evident mai realist, deoarece este amplitudinea care caracterizeaz
majoritatea datelor. Amplitudinea nu ine cont de forma repartiiei, deoarece ntre limitele de variaie se
poate obine aceeai valoare pentru amplitudinea unei curbe de frecvente simetrice sau unei curbe de
frecvene n form de J, I sau U.
Abaterea medie este media aritmetic a abaterilor valorilor individuale ale variabilei X fa de
media aritmetic a valorilor distribuiei luate n valoarea absolut. Vom nota acest indicator de
mprtiere cu AM. Pentru distribuii negrupate vom utiliza urmtoarea formul pentru calculul abaterii
medii: AM. =
XX , n care cu X se noteaz variabila, cu X media distribuiei i cu N numrul
N
total al valorilor variabilei. Dac vom nota cu x diferena X - X , vom avea urmtoarea formul pentru
formule: AM =
f X X sau AM =
f x
, n care cu f se noteaz frecvena variantei de variaie
N N
Prezentm, n continuare, tabelele care se ntocmesc pentru evidenierea etapelor calculrii abaterii
medii pentru variabile negrupate (i neordonate) i pentru variabile grupate de variante de variaie.
Exemplele cuprind valori diferite:
Variabile negrupate ( i neordonate) Variabile grupate pe variante de variaie
Nr.crt. X x (X- X ) x Nr.crt. X f FX x fx fx
1 12 -4 4 1 14 3 42 -8 - 24 24
2 13 -3 3 2 16 6 96 -6 - 36 36
3 19 3 3 3 19 9 171 -3 - 27 27
4 20 4 4 4 21 13 273 -1 - 13 13
5 14 -2 2 5 23 17 391 1 17 17
6 16 0 0 6 24 12 288 2 24 24
7 15 -1 1 7 25 9 225 3 27 27
8 17 1 1 8 26 5 130 4 20 20
9 18 2 2 9 28 2 56 6 12 12
144 0 20 76 1672 0 200
Tabelul 21. Cuprinde etapele decalcul pentru determinarea abaterii medii
X valorile variabilei;
x valorile variabilei de deviaie;
x - valorile variabilei de deviaie n valoarea absolut.
Valoarea medie pentru valorile tabelului cu variabile negrupate se obine prin aplicarea formulei
anunate anterior: X =
X = 144 = 16 . Rubrica x se obine scznd din valoarea mediei distribuiei
N 9
134
STATISTIC I
valoarea variabilei. Astfel, prima valoarea din rubrica x, egal cu 4, se obine efectund scderea
12-16, a doua valoarea, egal cu 3, se obine efectund scderea 13 - 16, .a.m.d. Se observ uor
faptul c suma abaterilor variabilelor de la medie este egal cu 0. Abaterea medie se poate calcula
doar prin adiia valorilor absolute care sunt trecute n rubrica notat cu x . Suma valorilor absolute a
deviaiilor de la medie este egal cu 20. Dup ce aflm aceast valoare putem trece la aplicarea
X=
(fX ) = 1672 = 22 . n tabelul din dreapta suma de la rubrica fx este egal cu 0 i nu
N 76
cea de la rubrica x, din cauza existenei frecvenelor pentru variantele de variaie. Pentru calculul
abaterii medii folosim suma de la rubrica f x care este egal.cu 200. Dup calcularea acestor valori
Variana i abaterea standard se gsesc ntr-o strns legtura una cu alta. Valoarea abaterii
standard se obine prin extragerea rdcinii ptrate din valoarea varianei. Aceti doi indicatori de
mprtiere sunt foarte frecvent utilizai n demersurile analizei statistice n toate domeniile de activitate.
Variana sau dispersia este un indicator sintetic care prezint o importan accentuat, deoarece cu
ajutorul ei se studiaz influena factorilor care acioneaz n cadrul mulimilor de date. Variana se
calculeaz ca medie aritmetic a ptratelor abaterilor valorilor individuale ale unei variabile de la media
lor aritmetic. Reamintim faptul c suma acestor abateri este egal cu 0, motiv pentru care fiecare
valoare individual a abaterii se ridic la ptrat naintea operaiei de adiie.
Vom nota variana unei distribuii prin s2 i abaterea standard prin s. Formula pentru calcularea
varianei sau dispersiei pentru valori negrupate ale unei variabile este: s2 =
x 2
. Corespunztor
N
explicaiilor anterioare, formula abaterii standard pentru acelai fel de valori ale variabilei este
135
AUREL STAN
urmtoarea: s =
x .
2
N
Ridicarea la ptrat nu trebuie considerat un procedeu artificial, deoarece simpla suma a
abaterilor de la medie ar da in mod automat zero. Ridicarea la ptrat este cel mai simplu procedeu
pentru a asigura datelor acelai semn. Ca i alte calcule ale indicatorilor statistici avem cazul datelor
negrupate i cazul datelor grupate
Rubricile necesare calculului le prezentm n tabelul care urmeaz:
i a abaterii standard. s 2
=
x =
2
90
= 9,00 i s =
x2
=
90
= 9 = 3.
N 10 N 10
n cazul n care avem date grupate pe variante de variaie, se ntocmete tabelul (date fictive):
Date grupate pe variante de variaie
Nr.crt X f fX x x2 fx2
1 17 2 34 - 5,23 27,35 57,71
2 19 5 95 - 3,23 10,43 52,16
3 20 9 180 - 2,23 4,97 44,76
4 21 13 273 - 1,23 1,51 19,67
5 22 18 396 - 0,23 0,05 0,95
6 23 12 276 0,77 0,59 7,11
7 24 10 240 1,77 3,13 31,33 Tabelul 23. Cuprinde etape de clacul
8 26 6 156 3,77 14,21 85,28 pentru determinarea varianei i
9 28 3 84 5,77 33,29 99,88 abaterii standard (date grupate pe
78 1734 395,85 variante de variaie)
Explicaia rubricilor a fost dat la tabelele constituite anterior. Avem un total de 78 de valori.
varianei rezult: s2 =
(fx ) = 395,85 = 5,075. Abaterea standard se obine prin extragerea rdcinii
2
N 78
ptrate din valoarea varianei.
136
STATISTIC I
s= s 2 = 5,075 = 2,25
Pentru calcularea varianei i abaterii standard n condiiile existenei unei distribuii de valori pe
intervale de variaie avem la dispoziie formule care utilizeaz variabila codificat u. Utilizarea unor
astfel de variabile asigur n calcul valori numerice relativ mici. Formula pentru calcularea varianei este:
(fu 2 ) (fu ) 2
s2 = i2*
. Pentru calcularea abaterii standard putem n aplicare urmtoarea
N N
(fu ) (fu )
2 2
formul: s = i*
. Se observ clar c valoarea abaterii standard care se va
N N
obine este rdcin ptrat din valoarea varianei.
Oferim pentru exemplificare urmtoarea grupare pe intervale de variaie:
Am explicat anterior modul cum se stabilesc valorile variabilei u. n acest exemplu am fixat
arbitrar valoarea u = 0 n dreptul intervalului modal, adic intervalul care are cea mai mare frecven
(intervalul 34 38, care are frecvena 24). Prin i am nota mrimea intervalului (i = 5)
Aplicnd formula varianei vom obine:
318 6 2
s2 = 25 = 25[2,91 0,003] = 72,5. Abaterea standard o obinem prin extragerea
108 108
rdcinii ptrate din aceast valoare. s = 72,5 = 8,51 ( prin aproximare 8,5).
Menionm o proprietate matematic important a abaterii standard care are aplicaii frecvente n
domeniul nostru de interes. Amplitudinea unei curbe normale Gauss-Laplace poate fi aproximat
satisfctor de urmtoarea formul: A = 6 s. n sectorul distribuiei cuprins ntre valoarea mediei i o
mrime a abaterii standard se gsesc aproximativ 68% din valorile unei distribuii. ntre valoarea mediei
i dou mrimi ale abaterii standard se afl aproximativ 95% din valorile unei distribuii normale
Gauss-Laplace, iar ntre valoarea mediei aritmetice i trei mrimi ale mrimi ale abaterii standard se
gsesc 99,958% din valorile distribuiei.
S lum exemplul unei distribuii de 118 de rezultate, avnd media aritmetic egal cu 64 i
abaterea standard egal cu 8. ntre valoarea 56 (64 8) i valoarea 72, (64 + 8) se vor gsi aproximativ
137
AUREL STAN
68% dintre valorile distribuiei. ntre valoarea 48 (64 (28)) i valoarea 78 (64 + (28)) se vor gsi
aproximativ 95% dintre valori. ntre valoarea 40 (64 (38)) i valoarea 88 (64 + (38)) se vor gsi
aproximativ 99,958% dintre valorile distribuiei, deci marea majoritate a acestor valori.
Aceast proprietate a abaterii standard ntr-o distribuie teoretic Gauss-Laplace are aplicaii n
construirea etaloanelor testelor. Rezultatul cantitativ global obinut de un subiect la un anumit test
psihologic poart denumirea de scor. Scorul este o nsumare rezultatelor obinute la componentele
elementare ale testului, componente care poart denumirea de itemi. Cunoaterea scorului unui anumit
subiect la un anumit test nu ne poate oferi aprecierea valoric a subiectului, deoarece aceasta se face
prin raportare la valorile obinute la respectivul test de un grup, numit i grup de referin (care trebuie
s ndeplineasc o serie de exigene privind omogenitatea). Aceast situaie de incertitudine valoric a
scorului n privina unui subiect se datoreaz i amplitudinii foarte diferite a distribuiilor valorilor oferite
de teste. Astfel, la testul Bourdon-Amfimov (destinat diagnosticrii ateniei concentrate) se pot obine
scoruri ntre 1 i 776. La testul M.P. Raven (folosit n diagnosticul inteligenei) se pot obine scoruri ntre
1 i 60 i la testul AD-P (atenie distributiv Praga) se pot obine scoruri ntre 1 i 100. n acest caz, nu
putem compara randamentul exprimat prin scorul 245, obinut de un subiect la testul Bourdon-Amfimov,
cu randamentul exprimat prin scorul 172, obinut de acelai subiect la testul Kraepelin, sau cu
randamentul exprimat prin scorul 33, obinut la testul M.P Raven. Chiar dac testele amintite ar avea
aceeai amplitudine a scorurilor, randamentele obinute de un grup de subieci la respectivele teste ar
putea fi foarte diferite. Iat de ce, scorurile testelor (pentru a putea fi pune n eviden valoarea unui
randament individual) trebuiesc raportate la scale valorice cu acelai numr de trepte, care sunt
stabilite dup ce testul a fost efectuat de un grup de referin (difereniat n funcie de scor, vrst,
mediu de provenien, nivel de studii etc.). Aceste scale standardizate se construiesc respectnd o
serie de exigene i viziuni teoretice. Numrul treptelor scalelor pe care dorim s facem aprecierea
rezultatelor subiecilor se stabilete n funcie de oportunitile situaiei de evaluare n care ne aflm.
Vom efectua o gradare pe curb a unei scale cu 7 trepte (A, B, C, D, E, F, G), deci un numr
impar de trepte. Utilizm exemplul dat anterior (distribuie de 118 scoruri, avnd media egal cu 64 i
abaterea standard egal cu 8). n primul rnd, trebuie stabilit baza de gradare, notat de noi cu BG.
A
Formula bazei de gradare este: BG = , n care A este amplitudinea distribuiei i k numrul de clase
k
n care dorim s facem gradarea pe curb. Amplitudinea distribuiei poate fi foarte bine aproximat
ntr-o distribuie teoretic Gauss-Laplace prin nmulirea abaterii standard cu 6, aa cum am explicat
anterior. Deci, A=68 = 48. Dup ce am aflat valoarea amplitudinii putem trece la calcularea bazei de
48
gradare BG = = 6,86. n cazul unui numr impar de clase, vom mpri baza de gradare la 2
7
BG
( = 3,43 ). Pentru delimitarea limitei inferioare a clasei centrale, clasa D, vom scdea din valoare
2
mediei jumtate din baza de gradare i pentru delimitarea limitei superioare a acesteia vom aduna la
valoarea mediei jumtate din valoarea bazei de gradare. Limita inferioar a clasei centrale va fi 61,57
(64 3,43 = 60,57) i limita superioar 67,43 (64 + 3,43). Delimitarea claselor inferioare i superioare
ale clasei D se va face prin scderi succesive, respectiv adunri succesive, la limitele clasei centrale a
ntregii valori a bazei de gradare. Astfel pentru delimitarea limitei inferioare a clasei C vom scdea:
60,57 6,86 = 53,71. Pentru stabilirea limitei inferioare a clasei B vom scdea, din nou, 6,86 din
138
STATISTIC I
valoarea rezultat anterior (54,71 6,86 = 46,85). Orice valoarea mai mic de 46,85 va face parte din
clasa A. Pentru calcularea limitelor claselor din dreapta clasei centale D procedm prin adunarea
succesiv a bazei de gradare. Astfel, pentru delimitarea limitei superioare a clasei E vom aduna la limita
superioar a clasei D valoarea ntreag a bazei de gradare (67,43+6,86=74,29). Pentru calcularea
limitei superioare a clasei F vom aduga la valoarea rezultat din ultima adunare valoarea ntreag a
unei baze de gradare (74,29 + 6,86 = 81,15). Orice valoare mai mare dect 81,15 va face parte din
clasa G. Redm ntr-un tabel clasele rezultatele:
139
AUREL STAN
proprietilor matematice ale distribuiei Gauss-Laplace, denumit i distribuia normal. ntr-o astfel de
distribuie teoretic (construit prin intermediul unei funcii matematice) valorile mediei, medianei i
modulului se confund. La acest gen de distribuie exist a perfect simetrie a valorilor n jurul mediei.
Tabele matematice special realizate pentru acest scop ne indica ce cuantum procentual din efectivul
total se afl ntre medie i a anumit valoare a distribuie. Prin deducie se poate stabili acest cuantum
ntre dou valori oarecare ale distribuiei. Pentru a putea efectua o astfel de determinare trebuie s
consultm tabelul de valori cuprins n anexele lucrrii, intitulat Tabelul legii normale reduse.
n prima coloan (z) a tabelului sunt trecute valori progresive z cu rata de 0,1 (0,0; 0,1; 0,2; 0,3
.a.m.d. ). Ele formeaz capete de linii Aceste valori merg pn la z = 4,00. Am precizat anterior c
valorile z pot oscila pn la 3. Acest lucru este valabil n marea majoritate a cazurilor. ntr-un foarte mic
numr de cazuri (100% - 99,958%) variabilele normate z pot primi valori mai mare dect 3. n prima linie
(z) sunt trecute valori z progresive cu rata de 0,01 (0,00; 0,01;. 0,02; 0,03 .a.m.d.). Aceste valori
formeaz capete de coloane. Aceste fraciuni de valori z merg pn la 0,09. Din intersecia irurilor de
valori care porneasc din capetele de linii i a celor care pornesc din capetele de coloan putem indica
proporiile rezultate (sau procente, dac nmulim cu 100 proporia) care se gsesc n afara unui interval
valoric format din variabile z. Dac cunoatem proporia de rezultate din efectivul total care se afl n
afara unui interval valoric z, putem foarte simplu s aflm ct se afl n interiorul acestui interval. S
lum exemplul unei valori z = 1,42. Pentru a afla informaia dorit vom citi din tabel proporia aflat la
intersecia liniei 1,4 i coloanei 0,02 (1,4 + 0,02 = 1,42).
z 0,00 0.01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0
0,1
0,02
.. .
1,4 0,15561
Tabelul 26. Cuprinde exemplificare pentru modul de lucru cu tabela legii normale reduse
La aceast intersecie vom afla proporia 0,15561, aproximativ 0,16. Ce semnific aceast
proporie? Ea semnific faptul c n afara intervalului exprimat n valori z) - 1,42 i 1,42 se gsete
aproximativ 0,16 din efectivul total al distribuiei sau 16% din efectivul acestei distribuii. n interiorul
intervalului se va afla 0,84 din efectivul acestei distribuii (1,00 0,84) sau, exprimat procentual, 84 %
din acest efectiv. Proporia aflat n afara intervalului amintit (0,16) se afl plasat la cele dou capete
opuse ale distribuiei. Jumtate din aceast proporie (0,08) se afla n stnga variabilei z = -1,42 (valori
mai mici dect aceasta) i cealalt jumtate (0,08) se va afla la dreapta valorii variabilei z = 1,42 (valori
mai mari dect aceasta. Dac transformm scorul brut al unui subiect n variabile z i obinem valoarea
-1,42 aceasta semnific faptul c subiectul respectiv a obinut un rezultat mai bun dect 0,08, sau,
exprimat procentual, 8% din totalul rezultatelor subiecilor i mai slab dect 0,92 sau, exprimat
procentual, 92% din totalul subiecilor (100%-0,08). Dac dup transformarea scorurilor brute un subiect
obine o valoarea z = 1,42, aceasta semnific faptul c 0,92 sau, exprimat procentual, 92% din totalul
rezultatelor sunt mai slabe dect rezultatul obinut respectivul subiect. Doar 0,08 (sau 8%) din totalul
rezultatelor vor fi mai bune dect rezultatul obinut de respectivul subiect.
O aplicaie frecvent a tabelului legii normale reduse este calcularea cotei procentuale de subieci
existeni n claselor determinate prin gradarea pe curb. Lum exemplul dat anterior, n care distribuia
140
STATISTIC I
rezultatelor a 118 subieci avea o medie de 64 i o abatere standard de 8. Pentru aceasta transformm
limitele superioare a claselor stabilite n variabile z. Pentru aceasta lum n consideraie primele 3 limite
superioare ale claselor stabilite i ntocmim urmtorul tabel:
Deci, clasa A va avea conine 0,016 rezultate ale subiecilor sau 1,6% dintre acestea. Deoarece
modul de construire a claselor se bazeaz pe simetria acestora, clasa G care este simetric clasei A va
conine , de asemenea, 1,6% dintre rezultatele subiecilor. Deosebirea const n aceea c 1,6% din
rezultatele coninute de clasa A sunt cele mai slabe, pe cnd 1,6% din rezultatele coninute de clasa G
sunt cele mai bune. Pentru a afla proporia de subieci existeni n clasa B vom scdea din proporia
0,0985 proporia 0.016 i se va obine rezultatul 0,0825. Scderea este justificat de faptul c 0,0985
conine proporia rezultatelor claselor A i B. Clasa simetric clasei B este clasa F, care va conine, de
asemenea, 0,0825 din ansamblul rezultatelor subiecilor sau, exprimat sub form procentual, 8,25%
din efectivul total al rezultatelor. Pentru a afla proporia clasei C se va scdea din 0,333 proporia
0,0985 (coninut de clasele A i B la un loc).Va rezulta proporia 0,234 sau, exprimat sub form
procentual 23,4% din total. Clasa simetric clasei C este clasa E, care va avea aceeai proporie de
rezultate. Procentul clasei centrale D se va afla scznd din valoarea 1,00 sumele proporiilor celorlalte
clase. Vom avea:
1,00-(20,016)-(20,0825)-(20,234)=1,00-0,665=0,335.
n exprimare procentual clasa central D va conine 33,5 % din totalul rezultatelor.
Nr.crt Clasa Limite clasei ntregire % din total Valori absolute ntregire
1 A 46,84 47 1,6,5% 0,016*118 = 1,88 2
2 B 46,85 53,70 48 54 8,25,0% 0,0825*118 = 9,73 10
3 C 53,71 60,56 55 - 61 23,4% 0,234*118 = 27,61 28
4 D 61,57 67,43 62 - 67 33,5% 0,335*118 = 39,53 40
5 E 67,44 74,29 68 - 74 23,4% 0,234*118 = 27,61 28
6 F 74,30 81,15 75 - 81 8,25,0% 0,0825*118 = 9,73 10
7 G 81,16 82 2,5% 0,016*118 = 1,88 2
TOTAL 100% 120
Tabelul 28. Cuprinde exemplificare pentru determinarea proporiile claselor normalizate
Operaiunea de ntregire este necesar, deoarece nu are sens s se spun c ntr-o clas se afl
rezultatele a 1,88 de subieci. n urma analizei acestui tabel se poate spune c 2 dintre subieci au
obinut rezultate care-i situeaz n clasa A (cele mai bune rezultate), 10 subiecii au obinut rezultate
care-i situeaz n clasa B, a doua clas valoric, .a.m.d. Jocul ntregirilor face ca suma total s fie
puin mai mare (120, n loc de 118). Observm c aceste clase construite pe baza mediei i a abaterii
141
AUREL STAN
standard sunt egale ca valoare (jocul aproximrilor face s existe mici diferene), dar nu i n privina
numrului de rezultate ale subiecilor coninute n ele. Acest gen de mprire n clase este realist,
deoarece rezultate de excepie i rezultate foarte slabe obin un numr foarte mic de subieci.
Variabilele normate z sunt foarte utile n indicarea poziiei relative a rezultatului unui subiect n
ansamblul rezultatelor ansamblului subiecilor
n cadrul variabilelor z sunt foarte evidente, trei deficiene: valoarea foarte mic a amplitudinii (de
la 3 la 3), obinerea de valori negative i exprimarea sub form zecimal, fr posibilitatea ntregirii
(deoarece, n unele cazuri, s-ar deforma semnificativ valoarea unui rezultate. Pentru a se remedia
aceste deficiene s-au creat alte tipuri de variabile normate, care se obin tot printr-o transformare liniar
pornind de la medie i abatere standard. Teoretic se pot calcula o infinitate de tipuri de variabile
normate bazate pe transformri liniare, dar, n practic se utilizeaz un numr restrns, dintre care
amintim variabilele T, create de McCall, i variabile Hull, create de un cercettor american cu acelai
nume. Formula pentru transformarea variabilelor originale a unor distribuii n variabile normate T este
urmtoarea: T = 50 +
10
s
[ ]
X X . Dac transformm toate valorile originale ale unei distribuii dup
formula amintit anterior obinem o nou distribuie care va avea valoare mediei aritmetice egal cu 50
X X
i valoarea abaterii standard egal cu 10. Dac avem n vedere faptul c z= , formula se poate
s
scrie i n modul urmtor: T= 50 + 10 z. Noile valori obinute dup transformare vor oscila aproximativ
ntre 18 i 82. Pentru a avea la dispoziie variabile normate care s oscileaz ntre 1 i 100 (cu
aproximaie), foarte comode de utilizat n practic, s-au creat variabilele Hull, avnd urmtoarea formul
de constituire: H = 50 +
14
s
[ ]
X X . Formul alternativ de constituire este: H = 50 + 14z. Dac
transformm toate valorile originale ale unei variabile dup formula lui H vom obine o nou distribuie
cu media 50 i abaterea standard egal cu 14.
Atenionm asupra faptului c variabilele normate i pierd valoarea practic de utilizare dac
distribuia empiric (distribuie ale crei valori sunt obinute dintr-o cercetare concret) se deosebete
semnificativ de o distribuie normal Gauss-Laplace. Distribuiile empirice i cele teoretice sunt diferite
n marea majoritate a cazurilor. Este important de a ti dac aceast diferen este semnificativ sau
nu. Pentru a stabili aceast difereniere exist anumite proceduri statistice.
Exemplu de transformare n variabile normate z, T i H. S presupunem c avem o distribuie
empiric cu media egal cu 73 i abaterea standard de egal cu 15. Ne propunem s transformm
valorile variabilei X egale cu 37, 63, 78, 85, 92 , conform formulelor stabilite pentru variabile normate z,
T i H. n mod uzual, n domeniul aplicrii testelor psihologice pentru denumirea unei operaiuni de
acest gen se folosete expresia transformare a scorurilor brute n note z, T i H. Nu procedm la
ntregirea notelor z, deoarece deformarea rezultatului ar fi semnificativ atunci cnd este vorba de o
cifr mic. La notele T i H deformarea rezultatelor prin ntregire este nesemnificativ. Formulele de
transformare sunt cele pe care le-am expus anterior. Faptul transformrii presupune c anterior ne-am
asigurat de existena condiiilor care o permite. n cazul existenei unor asimetrii puternice, operaiunea
de transformare nu ne este de folos practic.
142
STATISTIC I
143
AUREL STAN
medianei mediei nu ne asigur n privina simetriei unei distribuii. n cazul n care dorim sa fim mai
precii trebuie sa calculam o serie de indicatori. Unul dintre acetia se bazeaz pe diferena dintre
, n care
Ns 3
S este indicatorul de asimetrie (Skwenes), x este variabila de deviaie (X- X ), N este efectivul total i s
abaterea standard a distribuiei. n cazul variabilelor grupate se folosete la numrtor fx 3
. Vom
folosi tabelul cu date grupate pe variante de variaie creat pentru exemplificarea etapelor de calcul n
vederea determinrii mediei aritmetice.
Date grupate pe variante de variaie
Nr.crt X f fX x x2 fx2 x3 fx3
1 17 2 34 - 5,23 27,35 54,71 - 143,06 - 286,11
2 19 5 95 - 3,23 10,43 52,16 - 33,70 - 168,49
3 20 9 180 - 2,23 4,97 44,76 - 11,09 - 99,81
4 21 13 273 - 1,23 1,51 19,67 - 1,86 - 24,19
5 22 18 396 - 0,23 0,05 0,95 0,01 0,22
6 23 12 276 0,77 0,59 7,11 0,46 5,48
7 24 10 240 1,77 3,13 31,33 5,55 55,45
8 26 6 156 3,77 14,21 85,28 53,58 321,50
9 28 3 84 5,77 33,29 99,88 192.10 576,30
78 1734 395,85 380,35
Tabelul 30. Cuprinde exemplificare pentru etapele de calcul necesare stabilirii indicatorului de asimetrie
Pentru a avea la dispoziie toate datele aplicrii formulei coeficientului de asimetrie S va trebui s
calculm abaterea standard a distribuiei. Aplicm formula pentru calcularea abaterii standard pentru
variabile grupate pe variante de variaie:
s=
(fx ) =
2
380,35
= 4,87 = 2,2 . Aplicm, n continuare formula pentru calculul coeficientului
N 78
de asimetrie: S =
(fx ) = 3
380,35
= 0,45.
3
Ns 78 * 10,64
Cnd valoarea coeficientului este 0, atunci distribuia este perfect simetric. Valoarea negativ
indic o asimetrie negativ, valoarea pozitiv o asimetrie pozitiv. Valoarea obinut la distribuia
exemplificat indic o asimetrie pozitiv.
144
STATISTIC I
(C 75 C 25) )
scalele ordinale K= . Prin K am notat coeficientul de exces, prin C75 centilul 75, prin C25
C 90 C10
centilul 25, prin C90 centilul 90 i prin C10 centilul 10. Conform acestei formule, o distribuie poate fi
considerat mezokurtic atunci cnd valoarea lui K se situeaz n jurul valorii 0,2632. Distribuia va fi
considerata drept leptokurtic atunci cnd K este mai mic dect 0,2632 i drept platicurtic cnd K este
mai mare dect 0,2632. Coeficientul de exces pentru distribuii care satisfac exigenele scalelor de
. n aceast
N * s4
formul K este coeficientul de exces a unei distribuii, x4 este puterea a patra a variabilei de deviaie
(X- X ), s4 este puterea a patra a abaterii standard a distribuiei. n cazul variabilelor grupate pe variante
de variaie la numrtor apare (f*x4). Pentru exemplificare am adaptat tabelul prezentat anterior.
Abaterea standard are aceeai valoare (s = 2,2; s4 = 23,42).
Date grupate pe variante de variaie
Nr.crt X f fX x x4 f*x4
1 17 2 34 - 5,23 748,18 1496,36
2 19 5 95 - 3,23 108,85 544,23
3 20 9 180 - 2,23 24,73 222,57
4 21 13 273 - 1,23 2,29 29,76
5 22 18 396 - 0,23 0,00 0,05
6 23 12 276 0,77 0,35 4.22
7 24 10 240 1,77 9,82 98,15
8 26 6 156 3,77 202.01 1212,04
9 28 3 84 5,77 1108,42 3325,25
78 1734 6932,62
Tabelul 31. Cuprinde exemplificare pentru etapele de calcul necesare stabilirii indicatorului de exces
K=
(fx ) =
4
6932,32
=
6932,62
= 3,79
4
N*s 78 * 23,42 1826,26
Dup ultima formul folosit o distribuie este considerat mezokurtic cnd K = 3. n cazul n
care K>3 distribuia este leptokurtic, iar n cazul n care K<3 ea este platikurtic. Rezultatul obinut de
noi indic o distribuie leptokurtic.
EXERCIII
145
AUREL STAN
2.Se dau urmtoarele valori ale unei variabile, organizate pe variante de variaie:
Nr. crt. Valorile variabilei (X) Frecvena (f)
1 21 4
2 22 5
3 23 7
4 24 11
5 25 13
6 26 20
7 27 25
8 28 30
9 29 22
10 30 19
11 31 17
12 32 13
13 33 5
14 34 3
S se determine tipurile de indicatori amintii n curs.
146
STATISTIC I
Am insistat anterior asupra faptului c o mulime de cifre rezultat din colectarea notelor brute
ale unui mare numr de persoane care au efectuat un test psihologic nu ne ofer nici o informaie
relevant dac nu realizm o serie de operaii preliminare. Ordonarea i sistematizarea acestor date
ncep s confere sens acestei mulimi de date. Realizarea histogramei, a poligonului frecvenelor, a
curbei frecventelor sau a altor forme de reprezentare spaial a distribuiilor empirice ofer imaginea
tendinei generale care exist n cadrul mulimii de date. Interpretarea unor reprezentri grafice a
distribuiilor empirice este posibil doar prin raportare la nite modele, care au o fundamentare
matematic riguroas. Cele mai frecvente raportri ale distribuiilor i reprezentrilor lor grafice se fac la
modelul distribuiei i curbei normale a lui Gauss-Laplace. Modelul amintit nu este nici mai bun, nici mai
ru dect alte modele de distribuii (modelul Poisson, modelul binomial, modelul uniform discret,
modelul Snedecor-Fisher, modelul hipergeometric)21, ci cel mai frecvent utilizat i mai adaptat datelor
oferite de cercetrile psihopedagogice.
Raportarea la distribuia normal este una din cele mai frecvente proceduri n analiza datelor
rezultate din cercetrile cantitative ale domeniului psihologic. n unele cazuri, aceast modalitate de
raportare devine un gest reflex, automatic, lipsit de discernmnt din partea cercettorului puin abilitat
n privina exploatrii metodelor cantitative. Asemnarea unei distribuii empirice cu o distribuie normal
pare s indice c cercetarea merge pe drumul cel bun, c o anumit caracteristic psihic se manifest
armonios pe ansamblul unui grup.
Este binecunoscut faptul c orice msurare capt sens prin raportarea la un model teoretic.
Curba normal Gauss-Laplace este unul din modelele cu care se opereaz n cercetarea cantitativ,
dar nu singurul. Exist alte modele frecvent utilizate, dar nu la fel de populare. De unde vine
popularitatea curbei n clopot? Aceast distribuia pare multor cercettori natural i fireasc,
manifestndu-se parc n firea lucrurilor, i probabil cred, c dac nu ar fi inventat-o celebrul
matematician german, ar fi fcut-o ei cu siguran. Acumularea de fapte de via nregistrate n
registrele oficiale ale statelor din Occident cu sistem administrativ evoluat din secolul XVII i XVII parc
anuna curba lui Gauss. Astfel, n secolul XVIII s-a remarcat o mare stabilitate a recensmntului
efectuat asupra marilor colectiviti (naterile, cstoriile, decesele). Acest fapt era interpretat ca o
manifestare a providenei, a unei ordini divine, impunnd o aezare cantitativ armonioas pentru
societate n ansamblul su, dincolo de indivizii volatili i imprevizibili.
n 1832, matematicianul german Carl-Friedrich Gauss (1777-1855), profesor la Universitatea din
Gttingen, supra-numit prinul matematicienilor stabilete o curb de erori, care va purta ulterior
numele su, oferind o reprezentare n clopot a erorilor de observaie pentru msurtori mai ales
astronomice. Curba normal a repartiiei, numit i curba normal Gauss-Laplace este simetric, are
21 O descriere a acestor modelele gsii n lucrarea lui Ilie Puiu Vasilescu, Statistic informatizat pentru tiinele despre om,
Editura militar, Bucureti, 1991, pag. 53-96, de asemenea n lucrarea Statistica aplicat n psihologie de Valentin Clocotici
i Aurel Stan, lucrare n curs de apariie la Editura Polirom.
147
AUREL STAN
vrf unic, cu ordonat maxim centrat pe medie i divizeaz repartiia valorilor n dou pri egale
(media, mediana i modul coincid). Cu ct abaterea standard este mai slab cu att curba se strnge
mai mult, se apropie asimptotic de axa x. Exist o relaie fix ntre abaterea standard a unui eantion i
procentajul poriunilor de suprafa situate sub curb ntre dou limite
Statisticianul, matematicianul i astronomul belgian Lambert Adolphe Jacques Quetelet (1796-
1874), autor al lucrrii Sur lhomme et le dveloppment de ses facults ou essai de physique sociale,
1835, a pus n eviden faptul c distribuiile obinute pe caracteristici foarte variate au aceeai alur
(ceea ce se va numi mai trziu curba n clopot) i propune o interpretare. El demonstreaz matematic
c aceast form rezult din compunerea unui mare numr de erori mici i independente unele de
altele. Abaterile, prin raportare la tendina central (valoare care corespunde vrfului curbei) vor fi nite
imperfeciuni n realizarea efectiv a unui obiect perfect. Noiunea pus n circulaie de Quetelet este
aceea de om mediu. La baza filosofrilor savantului belgian se afla considerentul c media descrie un
subiect ideal, descrcat de erorile cu care natura l-a creat. Apreciaz c media este mai adevrat
dect o valoare msurat. Omul mediu este proslvit ca expresie a adevrului. Cu toat strduina lui
Quetelet de a impune omul mediu, aceast noiune a fost o prezen foarte controversat n cmpul
preocuprilor tiinifice socio-umane.
Distribuie normal se contureaz atunci cnd o caracteristic (de exemplu, n cazul nostru,
inteligena) se nate din aciunea conjugat a mai multor surse de variaie care, firesc, o influeneaz.
Avantajele acestui tip de distribuie rezid n posibilitatea unui mai bun tratament statistic a seriilor de
rezultate repartizate ntr-un mod normal (n uniti de abateri standard).
Comentnd ntr-o lucrare presupoziiile curbei lui Gauss. Jean Jacques Bonniol i Michel Vial se
exprim poetic vorbind despre armul discret al simetriei22. Modelul gaussian a fost adoptat cu
uurin din cauza faptului c el prezint toate aparenele de eviden: simetria armonioas, calcule
simple, coeren cu (sau legitimare a) ideile existente asupra distribuiei aptitudinilor, coeren, cu
imperativele seleciei sociale i a alegerii celor mai buni, cu obinuinele mentale i socio-culturale.
Distribuia normal se verific experimental asupra variabilelor aleatoare i pare s dea seama de un fel
de lege a naturii.
Forma ca atare a curbei Gauss Laplace are o mare putere de sugestie pentru cei nclinai spre
filosofare a faptelor, obiectelor, evenimentelor lumeti. Tot ce fiineaz n aceast lume are un nceput,
o evoluie, un vrf de glorie sau de vitalitate, dup care urmeaz cderea, declinul i aneantizarea.
Fiinele de orice gen, creaiile umane, alctuirile sociale, imperiile i mririle lumeti sunt tiranizate n
existena lor de legea lui Gauss-Laplace.
Dar, distribuia normal nu este divin i universal, cum a crezut la nceput Einstein. Exist
distribuii n U, n J, n I, asimetrice de dreapta, asimetrice de stnga i altele. n scopul de a conserva
avantajele distribuiei normale se modific valorile aceste distribuii prin transformarea mai ales n valori
z sau T, adic se pun n funciune procedeele de normalizare. Generalizarea acestui model probabilist
ajunge la legea normal redus, la care se rezum cteva caracteristici. ntr-o distribuie normal
media, mediana i modul coincid, sigma sau abaterea standard delimiteaz zonele n care procentajele
sunt cunoscute i stabile.
Exemplificm noiunea de model de distribuie i deviaiile de la un model prin raportare la
22Jean Jacques Bonniol, Michel Vial, Les modles de lvaluation. Textes fondateurs avec commentaires, De Boeck &
Larcier s.a.1997, Paris, Bruxelles, pag.71
148
STATISTIC I
modelul binomial, model foarte apropiat modelului normal de distribuie. Frecvenele variantelor sau
intervalelor de distribuie sunt proporionale cu valorile urmtoarelor serii:
2 intervale: 1 1
3 intervale: 1 2 1
4 intervale: 1 3 3 1
5 intervale: 1 4 6 4 1
6 intervale: 1 5 10 10 5 1
7 intervale: 1 6 15 20 15 6 1
8 intervale: 1 7 21 35 35 21 7 1
9 intervale: 1 8 28 56 70 56 28 1
Cum citim aceste serii de valori care formeaz aa-numitul Triunghi al lui Pascal? Facem
referire la algoritmul de repartiie pentru 4 intervale. irul 1 3 3 1 semnific faptul c n modelul
binomial pentru 4 intervale, al doilea interval va avea un efectiv de trei ori mai mare dect primul, al
treilea interval va avea un efectiv de trei ori mai mare dect primul i al patrulea interval va avea un
efectiv egal cu primul. Deci, un prim efectiv de baz se multiplic conform unui algoritm.
Dac vom avea 2940 de valori ale unei distribuii empirice i dorim s le distribuim dup modelul
binomial n 9 clase pentru a putea determina ulterior ct de mult se distaneaz de acest model teoretic
o anumit distribuie empiric, procedm n felul urmtor: 1) se adiioneaz toate cifrele din dreptul
specificaiei 9 (1+8+28+56+70+56+28+8+1=326) ; 2) mprim efectivul total al distribuiei la 326
(2940:326 = 9,01, aproximativ 9); 3) valoarea rezultat o nmulim cu fiecare cifr a irului de date din
dreptul specificaiei 9 intervale.
Specificaie 9 1 8 28 56 70 56 28 8 1
Nr. interval 1 2 3 4 5 6 7 8 9
Efectiv rezultat 9 72 252 504 630 504 252 72 9
700
600
500
400
300 630
540 540
200
100 252 252
72 72
0 9 9
1 2 3 4 5 6 7 8 9
Figura 6. Organizarea cantitativ a modelului binomial n 9 clase pentru 2940 de rezultate (exprimat printr-o
histogram)
149
AUREL STAN
700
630
600
540 540
500
400
300
252 252
200
100
72 72
0 9 9
1 2 3 4 5 6 7 8 9
Figura 7. Organizarea cantitativ a modelului binomial n 9 clase pentru 2940 de rezultate (exprimat printr-o
curb a frecvenelor)
Distribuia empiric (aa cum rezult dintr-o cercetare concret) deviaz foarte frecvent de la o
distribuie teoretic. n exprimare statistic se folosete sintagma pentru aceast deviaie de distan
fa de modelul teoretic. n cercetarea practic nu are importan dac o distribuie empiric se
distaneaz de una teoretic, ci dac aceast deviaie este semnificativ sau nu. Dac distana dintre
cele dou distribuii este una semnificativ, putem spune c ieim din model, situaie care modific o
serie de proceduri de raportare. Astfel, pentru valorile unei distribuii empirice nu mai au sens
exprimrile prin intermediul valorilor normalizate. Exemplificm, prin intermediul unei reprezentri
grafice realizate prin programul SPSS-10, distana ntre o distribuia teoretic i una empiric.
14
12
10
Figura 8. Exemplificare distanrii dintre o distribuie empiric (histogram pentru 63 de rezultate) i o distribuie
teoretic (curba lui Gauss)
150
STATISTIC I
Se cunosc mai multe forme de deviere sau distanare de la un model teoretic gaussian.
Exemplificrile sunt fcute din domeniul psihologic
1. Curba cu asimetrie de dreapta sau asimetrie negativ semnific faptul ca o proba psihologic
este prea uoara pentru subiecii la care a fost aplicata sau ca grupul de subieci este selecionat din
superdotai. n aceast form de asimetrie se pot detecta cu uurin subiecii foarte slabi, situai n
stnga distribuiei. I se spune pozitiv, deoarece diferena dintre valoarea mediei i valoarea medianei
d o valoare negativ
120
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10
2. Curba cu asimetrie de stnga sau asimetrie pozitiv .Semnific faptul c rezultatele unei probe
sunt foarte grele, sau faptul subiecii sunt selecionai dintre cei foarte slab dotai aptitudinal. I se spune
pozitiv deoarece diferena dintre valoarea mediei i valoarea medianei d o valoare pozitiv. Cu o
astfel de reprezentare grafic ies foarte bine n eviden subiecii buni i foarte buni.
120
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10
151
AUREL STAN
150
100
50
0
1 2 3 4 5 6 7 8 9 10 11
60
50
40
30
20
10
0
1 2 3 4 5 6 7 8 9
5. Curba leptokurtica semnific faptul c majoritatea datelor sunt masate n puine intervale n jurul
mediei i ngustimea coeficientului de variaie
250
200
150
100
50
0
-50 1 2 3 4 5 6 7 8 9
6. Curba bimodal (cu dublu modul) semnific faptul existenei n grupul de subieci examinai a
doua subgrupuri eterogene cu dotri aptitudinale diferite. Menionm, totodat, c acest fel de curb
rezulta i in cazul adoptrii unei tehnici de construcie a testului psihologic care-si propune s dea
rezultate sub forma dihotomic (apt-inapt, admis-respins);
152
STATISTIC I
30
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 10 11 12
7. Curma multimodal semnifica existena n grupul examinat a mai multor subgrupe eterogene
valoric.
40
30
20
10
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
200
150
100
50
0
1 2 3 4 5 6 7 8 9
153
AUREL STAN
200
150
100
50
0
1 2 3 4 5 6 7 8 9 10 11
10. Curba n j. Situaia se ntlnete cnd transpunem grafic valoarea indicilor de calitate la probele
creion hrtie de atenie concentrata.
250
200
150
100
50
0
1 2 3 4 5 6 7 8 9 10 11
154
STATISTIC I
BIBLIOGRAFIE
Andrei, T., Stancu, S., Statistic - Teorie i aplicaii, Editura All, Bucureti, 1995
Dickes, P., Tournois, J., Flieler, A., Kop, J.L., La psychometrie, Presses Universitaire de Frances,
Paris, 1993
Gueguen, N., Manuel de statistique pour psychologues, Dunod, Paris, 1997
Horst, P., Messung und Vorhersage, Verlag Juliusz Beltz, Weinheim, Berlin, Basel, 1971
Lienert, G.A., Testaufbau und Testanalyse,Verlag Juliusz Beltz,Weinheim/ Berlin, 1967
Milton-Smith, G., Ghid simplificat de statistic pentru psihologie i pedagogie, Editura didactic i
pedagogic, Bucureti, 1971
Nowak, A., Metode cantitative n psihologie i sociologie,Oscar Print, Bucureti, 1998
Porojan, D., Statistica i teoria sondajului, Casa de editur ansa SRL, Bucureti, 1993
Radu, I., Miclea, M., Moldovan, O., Neme, S., Szamoskozy, S., Metodologia psihologic i analiza
datelor, Editura Sincron, Cluj, 1993
Reuchlin, M., Les Methodes quantitatives en psychologie, Presses Universitaires de France, Paris,
1962
Reuchlin, M., Precis de statistique, Presses Universitaires de France, Paris, 1975
Rotariu,T., Metode statistice aplicate n tiinele sociale, Polirom, Iai, 1999
Trebici, V. (coord), Mic enciclopedie de statistic, Editura tiinific i enciclopedic, Bucureti,
1985
arc, M., Tratat de statistic aplicat, Editura didactic i pedagogic, R.A. Bucureti, 1998
Vasilescu, I.P., Statistic informatizat pentru tiine despre om, Editura Militar, Bucureti, 1991
155
AUREL STAN
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 1,00000 0,99202 0,98404 0,97607 0,96809 0,96012 0,95216 0,94419 0,93624 0,92829
0,1 0,92034 0,91241 0,90448 0,89657 0,88866 0,88076 0,87288 0,86501 0,85715 0,84931
0,2 0,84148 0,83367 0,82587 0,81809 0,81033 0,80259 0,79486 0,78716 0,77948 0,71182
0,3 0,76418 0,75656 0,74897 0,74140 0,73386 0,72634 0,71885 0,71138 0,70395 0,69654
0,4 0,68916 0,68181 0,67449 0,66720 0,65994 0,65271 0,64552 0,63836 0,63123 0,62413
0,5 0,61708 0,61005 0,60306 0,59611 0,59920 0,58232 0,57548 0,56868 0,59191 0,55519
0,6 0,54851 0,54186 0,53526 0,52869 0,52217 0,51569 0,50925 0,50286 0,49650 0,49019
0,7 0,48393 0,7770 0,47152 0,46539 0,45930 0,45325 0,44725 0,44130 0,43539 0,42953
0,8 0,42371 0,4]794 0,41222 0,40654 0,40091 0,39532 0,38979 0,38430 0,37886 0,37347
0,9 0,36812 0,36282 0,35757 0,35237 0,34722 0,34211 0,33706 0,33205 0,32709 0,32217
1,0 0,31731 0,31250 0,30773 0,30301 0,29834 0,29372 0,29914 0,28462 0.28014 0,27571
1,1 0,27133 0,26700 0,26271 0,25848 0,25429 0,25014 0,24605 0,24200 0,23800 0,23405
1,2 0,23014 0,22628 0,22247 0,21870 0,21498 0,21130 0,20767 0,20408 0,20055 0,19705
1,3 0,19360 0,19020 0,18684 0,18352 0,18025 0,17702 0,17383 0,17069 0,16759 0,16453
1,4 0,16151 0,15854 0,15561 0,15272 0,14987 0,14706 0,14429 0,14156 0,13887 0,13662
1,5 0,13361 0,13104 0,12851 0,12602 0,12356 0,12114 0,18876 0,11642 0,11411 0,11183
1,6 0,10960 0,10740 0,10523 0,10310 0,10101 0,09894 0,09691 0,09492 0,09296 0,09103
1,7 0,08913 0,08727 0,08543 0,0363 0,08186 0,08012 0,07841 0,07673 0,07508 0,07345
1,8 0,07186 0,07030 0,06876 0,06725 0,06577 0,06431 0,06289 0,06148 0,06011 0,05876
1,9 0,05743 0,05613 0,05486 0,05361 0,05238 0,05118 0,05000 0,04884 0,04770 0,4659
2,0 0,00450 0,04443 0,04338 0,04236 0,04135 0,4036 0,03940 0,03845 0,03753 0,03662
2,1 0,03573 0,03486 0,03401 0,03317 0,03235 0,03156 0,03077 0,03001 0,02926 0,02852
2,2 0,02781 0,02711 0,2034 0,02575 0,02509 0,02445 0,02382 0,02321 0,02261 0,02202
2,3 0,02145 0,02089 0,02034 0,01981 0,01928 0,01877 0,01827 0,01779 0,01731 0,01685
2,4 0,01640 0,01595 0,01552 0,01510 0,01469 0,01429 0,01389 0,01351 0,01314 0,01277
2,5 0,01242 0,01207 0,01174 0,01141 0,01109 0,01077 0,01047 0,01017 0,00988 0,00960
2,6 0,00932 0,00905 0,00879 0,00854 0,00829 0,00805 0,00781 0,00759 0,00736 0,00716
2,7 0,00693 0,00673 0,00653 0,00653 0,00614 0,00596 0,00578 0,00561 0,00544 0,00527
2,8 0,00511 0,00495 0,00480 0,00465 0,00451 0,00437 0,00424 0,00410 0,00398 0,00385
2,9 0,00373 0,00361 0,00350 0,00339 0,00328 0,0318 0,00308 0,00298 0,00288 0,00279
3,0 0,00270 0,00261 0,00253 0,00245 0,00237 0,00269 0,0221 0,00214 0,00207 0,00200
3,1 0,00194 0,00187 0,00181 0,00175 0.00169 0,00163 0,00158 0,00152 0,00147 0,00142
3,2 0,00137 0,00133 0,00128 0,00124 0,00120 0,00115 0,00111 0,00108 0,00108 0,00100
3,3 0,00097 0,00093 0,00090 0,00087 0,00084 0,00081 0,00078 0,00075 0,00072 0,00070
3,4 0,00067 0,00065 0,00063 0,00060 0,00058 0,00056 0,00054 0,00052 0,00050 0,00048
3,5 0,00047 0,00045 0,00043 0,00042 0,00040 0,00039 0,00037 0,00036 0,00034 0,00033
3,6 0,00032 0,00031 0,00029 0,00028 0,00027 0,00026 0,00025 0,00024 0,00023 0,00022
3,7 0,00022 0,00021 0,00020 0,00019 0,00018 0,00018 0,00017 0,00016 0,00016 0,00015
3,8 0,00014 0,00014 0,00013 0,00013 0,00012 0,00012 0,00011 0,00011 0,00010 0,00010
3,9 0,00010 0,00009 0,00009 0,00008 0,00008 0,00008 0,0007 0,00007 0,00007 0.00007
4,0 0,0006 0,0006 0,0006 0,00006 0,00005 0,00005 0,00005 0,00005 0,00005 0,00004
156