Sunteți pe pagina 1din 112

AUREL STAN

UNITATEA DE ÎNVĂȚARE 1.
SCURTĂ ISTORIE A STATISTICII, ÎN GENERAL, ŞI A STATISTICII APLICATE ÎN
PSIHOLOGIE, ÎN SPECIAL. UTILITATEA CUNOȘTINȚELOR STATISTICE PENTRU
CERCETAREA PSIHOLOGICĂ – NOȚIUNI FUNDAMENTALE ALE STATISTICII:
VARIABILA, VARIAȚIE, DISTRIBUȚIE, POPULAȚIE, EȘANTION, INDIVID

CE ESTE STATISTICA? DEFINIŢIE

Într-o definiţie succintă, statistica este un ansamblu de metode care au drept obiect colectarea,
organizarea, tratamentul şi interpretarea datelor de observaţie care se referă la persoane, obiecte,
grupuri de persoane sau de obiecte. Este cea mai comună definiţie pe care o luăm ca reper al acestui
manual, însă precizăm că există sute de definiţii ale statisticii. Cunoscutul statistician american Walter
Francis Willcox (1861-1964) aprecia în 1935 că la acea dată existau între 100 şi 120 de definiţii diferite,
iar celebrul reprezentant britanic al acestei discipline Maurice George Kendall (1907-1983) spunea:
«Printre temele în legătură cu care statisticienii nu sunt de acord se găseşte definiţia ştiinţei lor». Din
definiţia noastră de largă accepţiune se poate trage concluzia că statistica este o disciplină legată de
domeniul matematicilor, fiind cel mai apropiată de teoria probabilităţilor.
Diferitele aspecte ale statisticii sunt regrupate în mai multe domenii sau concepte, cum sunt
statistica descriptivă, statistica inferenţială, statistica matematică, analiza datelor.
În anul 1982 statisticianul Pierre Dagnelie delimitează trei mari tendinţe în statistică:
 Statistică «administrativă» sau guvernamentală - realizată în cadrul institutelor naţionale sau locale
de statistică pentru a prelucra mari mulţimi de date necesare instituţiilor moderne de conducere
socială
 Statistica matematică - asigură fundamentarea operaţiunilor procedurilor statistice
 Statistica aplicată sau de teren - făcută cu scopul prelucrări rezultate din cercetările empirice.
Statistica se aplică astăzi aproape în toate domeniile activităţii umane, între care enumerăm pe cele
economice, sociale, politice, biologice, demografice. Este foarte greu de indicat un domeniu al
activităţilor teoretice şi practice în care să nu-şi găsească utilitatea.
Precizările pe care le facem la începutul acestui curs sunt strict necesare deoarece statistica este
un domeniu vast de studiu şi de aplicaţii. Din punct de vedere ştiinţific poate fi privită ca o ştiinţă, ca o
metodă şi ca o tehnică. Este o noţiune pătrunsă în comunicarea publică. Când noţiunea apare scrisă cu
majuscule „Statistica”, această denumire are menirea de a diferenţia această disciplină în câmpul
ştiinţelor, pe când „o statistică” (cu minuscule) desemnează frecvent raportarea unui fapt de sinteză
cantitativă statistic. Începem seria precizărilor şi delimitărilor cu lămuriri în legătură cu istoria şi
vechimea acestei discipline.
Dacă privim statistica drept o sumă de proceduri empirice de culegere şi categorisire a datelor
culese din practica administrativă a diferitelor formaţiuni statale, putem considera că această disciplină
are o vechime milenară. Astfel, se cunosc recensăminte în China cu 23 de secole înaintea erei noastre
şi în Egipt cu 18 secole înaintea erei noastre. În Europa, asociaţiile de negustori au colectat date social-
economice utile înaintea ca acestea să fie realizate de către funcţionarii de stat (fapte notabile fiind
releveurile realizate la ordinele lui Carol cel Mare, Domesday Book a lui Wilhelm Cuceritorul, spre 1090)
şi, la începuturile perioadele moderne ale istoriei, prin numeroase inventare sau releveuri realizate ca
urmare a unor ordonanţe regale sub impulsul lui Sully, a lui Colbert şi a lui Vauban.

128
STATISTICĂ

SCURTĂ ISTORIE A STATISTICII, ÎN GENERAL ŞI A STATISTICII APLICATE ÎN PSIHOLOGIE, ÎN SPECIAL

Referindu-ne la statistica în calitate de corp sistematizat de cunoştinţe, menţionăm că în secolul


al XVII-lea se profilează concepte relative la bazele şi la mijloacele studiilor statistice, deci putem vorbi
începuturile statisticii teoretice. În această perioadă îşi conturează apariţia două şcoli de gândire în
acest domeniu. Şcoala germană, numită şi şcoala descriptivă, de la care pare că derivă cuvântul
statistică (cuvântul german die Statistik), este fondată de către Herman Conring (1606-1681), profesor
la Universitatea din Helmstadt, ale cărui contribuţii vor fi continuate prin Gottfried Achenwall (1719-
1772). Cea de-a doua şcoală, denumită aritmetica politică are ca fondatori pe John Graunt (1620-1764),
Gregory King (1648-1712), Edmond Halley 1656-1742) şi pe sir William Petty (1623-1687), şi pune în
evidenţă, dincolo de descriere, anumite permanenţe statistice, de exemplu raportul numărului de naşteri
masculine şi acela al celor feminine. Edmond Hailley prezintă un tabel de mortalitate care este baza
lucrărilor actuariale contemporane, apoi un reprezentant al şcolii germane, Johann Peter Süssmilch
(1707-1767), publică importante lucrări asupra procentului de masculinitate la naştere şi asupra
evoluţiei acestuia până la vârsta de 20 de ani.
De o deosebită importanţă în fundamentarea teoretică a statisticii este apariţia, în 1812, a lucrării
lui Pierre Simon de Laplace (1749-1827), intitulată “Teoria analitică a probabilităţilor”, care pune în
evidenţă avantajele care pot fi trase din această teorie în studiul fenomenelor naturale, în care cauzele
sunt prea complexe pentru a le putea cunoaşte exhaustiv şi a le analiza individual.
Ca expresie a dezvoltării statisticii, apar o serie de statistici autonome consacrate anumitor
domenii de specialitate precum statistica aplicată în mecanică, agronomie şi economie, a căror
dezvoltare nu are rost în lucrarea noastră simplificată. Cele mai multe din aplicaţiile statisticii se află,
fără îndoială, în domeniul economic şi administrativ.
Nu încercăm să facem o istorie amănunţită a statisticii, lucrare care ar trebui să fie deosebit de
laborioasă, ci să punctăm momente importante ale evoluţiei acesteia, legate de aplicarea acestei
discipline în domeniul ştiinţelor sociale. Începutul în această privinţă este făcut de savantul belgian
Adolphe Quetelet, care a avut preocupări ştiinţifice de o largă diversitate în domeniul aplicaţiilor
statisticii1.
Adolphe Quételet (1796-1874) extinde câmpul de aplicare a metodei statistice în domeniile
antropometric, psihologic şi social. La iniţiativa sa se reuneşte la Bruxelles, în 1853, primul congres
internaţional de statistică, precursor al Institutului internaţional de statistică, fondat la Londra în anul
1885, instituţie ştiinţifică care a rămas deosebit de prestigioasă până în zilele noastre. Adolphe Quételet
a introdus noţiunea de om mediu, controversată de-a lungul timpului, concept preluat de o serie
statisticieni şi sociologi. Ca urmare a lucrărilor ştiinţifice aparţinând lui Quételet, acelora ale lui Francis
Galton (1822-1911) şi Karl Pearson (1857-1936), se fondează biostatistica sau biometria.
În domeniul ştiinţelor umane, studiile lui Charles Spearman (1863-1945) asupra
comportamentului indivizilor, dezvoltate în psihologia aplicată, umană şi animală, au condus la metode
de analiză factorială, o prelungire logică a studiului corelaţiilor. Francis Galton, Charles Spearman, Karl
Pearson şi Cyril Burt pot fi consideraţi întemeietorii prestigioasei şcoli psihometrice engleze, care a
influenţat semnificativ modul de prelucrare a datelor în cercetările psihologice.
Psihologia devine ştiinţă de sine stătătoare abia în a doua jumătate a secolului al XIX-lea, odată
cu accentuarea laturii experimentale în cercetare, în ale cărei începuturi au fost marcate acumulări de
date care erau deficitare sub aspectul interpretării lor. Procedeele statistice utilizate de psiholog vin,
totodată, în întâmpinarea nevoii de diversificare a metodelor de cercetare, fapt ce conduce la
interpretarea mai adecvată a rezultatelor investigaţiilor ştiinţifice. Cartea lui Edward Lee Torndike (1874-
1949) Introduction to the Theory of Mental and Social Measurements marchează începutul perioadei de
cuantificare a cercetărilor psihologice.
                                                            
1 Pentru cei care doresc să cunoască mai amănunţit aspecte ale istoriei statisticii româneşti şi internaţionale le recomandăm
lucrarea lui Mihai Ţarcă “Tratat de statistică aplicată”, Editura Didactică şi Pedagogică R.A., Bucureşti, 1998 şi pe cea
coordonată de Vladimir Trebici “Mică enciclopedie de statistică”, Editura Ştiinţifică şi enciclopedică, Bucureşti, 1985.

129
AUREL STAN
T

Prrintre contribbuţiile de immportanţă dinn perioada modernă,


m ennumerăm pee cele ale luui Ronald
Aylmer Fisher (18990-1972), d’E Egon Sharpe Pearson (1895-1980)) şi Jerzy N Neyman (1894-1981)
asupra teoriei planuurilor experiimentale şi acelea refeeritoare la estimaţii,
e năsscute din ceercetările
empiricee asupra apllicării metodeei sondajelorr . Apariţia unor puternicce mijloace dde calcul a peermis, pe
de altă parte,
p de a pune
p în apliccare noi metode de stattistică descriiptivă (care nu recurg laa modele,
nici la ippoteze), apliccabile la marrile tabele dee date multiddimensionalee. Aflate în germene la Spearman
S
şi E. Pearson, aceste metode se s regrupeazză sub numeele de analizză a datelor,, fiind dezvooltate prin
Harold Hotelling
H (18995-1973) în anii
a 1930 şi în î Franţa prin Jean Paul Benzécri (n.1932) în aniii 1960.
Actualmeente, preocuupările de annaliză statisttică a dateloor din domeeniul ştiinţeloor sociale, înn general
vorbind, sunt deosebbit de intensee, realizânduu-se progresee teoretice şi practice. Sub acest ultim aspect
sunt de remarcat appariţia unor programe coomputerizatee destinate uşurării u munccii de calcul (cel mai
cunoscut şi cel mai utilizat fiind SPSS-ul).. Folosirea unor astfel de programe presupunee, pentru
exploataarea corectă a rezultatelorr, cunoaştereea fundamentelor teoreticce ale statisticcii
Exxistă discuţii, care nu vor fi comentatee în manualull nostru, asuppra autonomiei statisticii ca
c ştiinţă,
din cauzza faptului căă o bună partte din metodeele statisticii aparţine dom meniului mattematic, în coonsecinţă
se susţinne că statistiica nu ar fi decât
d matemmatică aplicattă, afirmaţie care nu poaate fi contestaată. Însă,
dezvoltarea statisticii a prilejuit dezvoltarea
d unor modalittăţi de aborddare a studiuului datelor şi
ş a unor
exigenţee metodologiice de cerceetare speciffice care-i o conferă unn statut apaarte, inconfundabil în
ansamblul ştiinţelor moderne.
m
În acest manual de Statiistică aplicattă în psiholoogie va expuune câteva consideraţii teoretice
strict neccesare, fără să existe prreocuparea pentru
p fundaamentarea matematică
m a procedeelorr folosite,
chestiunne care preocupă speciaaliştii în statisstică teoreticcă, insistându-se asupraa specificului aplicativ
al unor proceduri statistice
s în cercetarea psihologică sau în pracctica profesiională ce prresupune
prelucrarea şi interpretarea dateelor. Intervennţiile statisticce din domenniul psihologgic se referă mai ales
la acele date care prrovin de la grrupuri de perrsoane, dar acesta aspectt nu poate fi generalizat.

IMPORTANT T
Uttilitatea statissticii aplicatee în psihologgie. Cercetarea psihologgică modernăă a acumulaat teorii şi
proceduri metodologgice care fac apel la cunooştinţe de staatistică, utilittatea acestorra din urmă devenind
indispennsabilă. Practica profesioonală actualăă presupune acumulări dee date fără pprecedent caare se cer
prelucrate şi exprimate sintetic într-un î mod adecvat. Leectura articolelor din revvistele de sppecialitate
psihologgică presupuun frecvent comunicări
c a datelor sub
ale s formă nuumerică. Chhiar şi procedurile de
analiză calitativă faac apel la modurim de exprimare a rezultatelor sub formă cantitative. Deci, în
comuniccarea ştiinţificcă şi practic aplicativă diintre specialişti apar marri dificultăţi înn cazul necuunoaşterii
noţiuniloor de statistică aplicată în psihologie. Programeele informatiizate de preelucrare a daatelor de
cercetare nu pot fi puse
p în apliccare fără o cunoaştere
c adecvată
a a acestora.
a Daacă nu avem m însuşite
sensurilee noţiunilor şi
ş proceduriloor statistică, putem efecttua, chiar cu ajutorul calcculatorului, o serie de
prelucrări care nu auu sens şi peertinenţă. În rândul mateeriilor de studdiu de la faccultăţile de psihologie
p
din întreaga lume, obiectul statissticii (care arre o serie dee denumiri alternative, dee exemplu metode
m de
prelucrare a datelorr) figurează în marea majoritatem a cazurilor, în rândul dissciplinelor obligatorii.
Lucrărilee de licenţă, de disertaţiee sau de dooctorat conţinn frecvent ceercetări emppirice care faac apel la
tehnici ded prelucrarre cantitativvă a informaaţiilor. Conccluzia: nu see poarte păătrunde în ambianţa a
modernăă a psihologiei fără să avvem cunoştinnţe de statistică aplicată în î psihologiee.

Peentru însuşireea adecvată a teoriei şi noţiunilor sttatistice estee nevoie să precizăm căă în cazul
aplicaţiei în domeniuul psihologieei operează următoarele diviziuni funndamentale ale acestei discipline
(fără a epuiza criteriille de diviziunne).
 Urmâând ordinea isstorică de appariţia şi tipurrile de operaţţii efectuate, statistică se împarte în:

130
STATISTICĂ

o Sttatistica desscriptivă se ocupă cu deescrierea fennomenelor sttatistice rezuultate din culeegerea şi


claasificarea daatelor obţinuute dintr-o ceercetare empirică, realizzarea de rezzumate şi siinteze cu
ajutorul unui limmbaj numericc. Este un annsamblu de tehnici t permiţând descrierea grupuriloor de date
şi luarea decizziilor în abseenţa unei infoormaţii compplete. Scopul unui astfel de demers este e de a
adduce datele într-o formă clară şi utilizabilă.
u Innformaţiile de
d bază prooduse prin statisticile
s
deescriptive sunt media, vaalorile maxim male şi minimale, diferitee măsurări aale variaţiei şi datele
cuuprinzând foorma sau configuraţia
c distribuţiei variabilelor.
v Calculele reealizate în statistica
deescriptivă duuc la constituuirea de valori medii, diispersii, abatteri. Statisticca descriptivă trebuie
coonsiderată caa o etapă a demersului statistic ce permite o exprimaree cantitativăă clară şi
cooerentă a muulţimilor de daate.
o Sttatistica infeerenţială (denumiri simiilare statisticca analitică sau s statisticaa inductivă) cuprinde
metode de appreciere critică a valabilităţii indicattorilor empirrici. Spre deeosebire de statistica
deescriptivă, acceastă compponentă reallizează inferrenţe. Prin inferenţă se înţelege „opperaţia la
nivvelul intelecctului prin caare se trece de la un ennunţ la altul,, acceptareaa adevărului ultimului
ennunţ bazânddu-se pe leegătura logică menţinută cu enunnţurile anterrioare, acceptate ca
addevărate”. Dacă am avea a la disppoziţie toţi indivizii
i stattisticii aparţinând unei populaţii,
indicatorii rezultaţi prin prelucrarea
p s
statistică sunnt numiţi paarametri, mărimi fixe, nesupuse n
osscilaţiei valoorice. Cea mai mare parte a cercetărilor sttatistice se realizează însă pe
eşşantioane, ale căror indiicatori sunt estimaţii
e ai parametrilorr populaţiei, care apreciază cu o
annumită cotă de d eroare
 În funncţie de număărul variabileelor care intrăă în aprecieree statistică, această
a discipplină se dividde în:
o Sttatistică uniivariată - esste cea mai simplă form mă de analizăă statistică ccantitativă Analiza se
reealizează pe descrierea unei u singure variabile înn termeni de unitate de aanaliză apliccabilă. De
exxemplu, variabila scor brut b al testuului poate fi subiect de analiză, stabilindu-se principalii
inddicatori ai ansamblului de d date de la mai mulţi subiecţi. Esste folosită mai ales în statistica
deescriptivă.
o Sttatistică mu ultivariată see ocupă cu analiza simuultană a valorilor provennind de la mai m multe
vaariabile valoriilor Este folossită prioritar în
î statistică inferenţială.

REZUMA AT
 Discciplina statistiicii se ocupăă cu acumulaarea de date, cu tratamentul , interpretarea şi preezentarea
acesstora în aşa încât
î acesteaa să devină comprehensib
c bile
 Funddamentarea matematică a statisticii începe din secolele s XVII–XVIII, cânnd iau naşterre şcoala
germmană sau şcooala descriptivă şi şcoala engleză sauu aritmetica politică. p
 Statiistica are applicaţii în maajoritatea cercetărilor dinn diverse doomenii şi în practica aplicativă a
acesstora. În psihologie, statisstica se aplicăă la sfârşitul secolului XIX X şi începutul secolului XX
X
 Divizziuni fundam mentale ale statisticii suunt: a) statiistică descriptivă şi staatistică infereenţială şi
b) sttatistică univaariată şi statistică multivariată.
 Cunooştinţele de statistică
s sunnt utile atât înn cercetare câât şi în psihoologia aplicatăă.

ÎNTREBĂ ĂRI
Care estte diferenţa înntre statisticaa descriptivă şi statistica inferenţială?
i
În ce conndiţii statistica are o vechime milenarăă şi în ce conndiţii o vechim me seculară??

131
AUREL STAN
T

Referinţţe bibliograffice
obligatorrii
o Clocotici,
C V., Stan, A. (20000) Statisticaa aplicată în psihologie, Editura
E Poliroom, Iaşi, 20000
o Popa, M. (20008) Statistică pentru psihhologie, Edituura Polirom, Iaşi.
suplimenntare
o Sava,
S F. (20004) Analiza datelor
d în cerrcetarea psihhologică, Clujj-Napoca, Edditura ASCR.
o Stan.
S Aurel((2017) Trataat de metoddologie a cercetării
c în psihologie, Editura Unniversităţii

“Alexandru Iooan Cuza” diin Iaşi

NOŢIUNI
O FUNDA
AMENTALE

Înţţelegerea asserţiunilor staatistice este posibilă


p din momentul
m în care
c ne însuşim o serie de d noţiuni
fundameentale. Începpem prin a preciza p care sunt noţiunile fundamenntale în statistică şi cu eventuale
e
precizări referitoare la unele senssuri specificee care opereaază în domenniul statisticii în legătură cu c aceste
noţiuni.
Unna din aceste noţiuni estte cea de variabilă.va Estee o noţiune ded care nu nne putem disspensa în
explicaţiaa ştiinţifică, totalitatea
t stuudiilor experimentale apeelând frecvennt la ea penttru a expunee raţiunea
acestui demers
d ştiinnţific, modul de derulare şi concluziiile trase. Esste frecvent folosită împreună cu
noţiunile de variaţie şi variabilitatte. În Grand dictionnaire de la psychhologie variabbila este defiinită ca o
„entitate abstractă caare serveşte ca suport peentru o multiitudine de vaalori”2. Propriietatea variabilei de a
lua anum mite valori se numeşte variabilitate, iarr oscilaţiile vaalorice ale vaariabilei poarrtă numele dee variaţie.
Variaţiilee pot fi previzzibile şi impreevizibile. Varriaţiile sunt considerate
c p
previzibile în situaţia în care
c orice
valoare succesivă diintr-o serie poate p fi determinată cu precizie
p sau măcar aproxximată. Variaaţiile sunt
imprevizzibile când vaalorile successive ale unei serii nu pot fif prevăzute.
Esste necesar să facem şi câteva precizări asupra variabilităţii, în scopul dee a evidenţiaa aspecte
care sunnt frecvent întâlnite în studii ştiinţiifice. Variabilitatea este intraindividuuală atunci când se
raportează la diferennţele existentte între mom mentele sau situaţiile
s diferrite în care sse află acelaşşi individ.
De exem mplu, atunci când se cerccetează timppul de reacţiee la aceeaşi persoană înn momente temporale
diferite, se
s pot obţinee valori diferiite. Diferenţaa dintre cea mai m mică şi cea c mai marre variantă de variaţie
poartă numele
n de am mplitudine ded variaţie saau de plajă de d variaţie. Variabilitatea
V a interindividuuală face
referire la diferenţeele existente între inddivizi (desiguur, referinduu-se la aceeeaşi caraccteristică).
Variabilittatea intragrrup caracterizează osccilaţiile valorrice în cadrul unui grup bine prrecizat şi
variabilitaatea intergruup caracterizeează aceste oscilaţii la nivvelul indicatoorilor aparţinâând la grupurri diferite.
Arrthur Reber, autorul unui reputat dicţiionar de psihhologie atragge atenţia assupra faptului că, deşi
variabila este o entitaate care sufeeră schimbări, ea este dee fapt o abstraacţie, o formă, o cantitatee3. Astfel,
dacă reaalizăm cerceetări în domeeniul senzaţţiilor auditive şi suntem interesaţi dee intensitateaa tonului,
variabila operativă este e intensitaatea; într-un studiu în care
c avem ca c variabilă dificultatea unui
u test,
dificultateea este variiabila reală. Tonul şi tesstele utilizatee sunt doar moduri caree permit inteensităţii şi
dificultăţiii să se mannifeste. Precizări necesare sunt făcuute în matem matică şi logică unde noţţiunea de
variabilă este surprinnsă mai expliccit prin tratarrea variabilei ca simbol caare reprezinttă clase de luucruri sau
domenii de valori caare satisfac anumite conndiţii şi nu orice lucru saau valoare pparticulară. O valoare
particulaară a variabiilei este dennumită modaalitate sau variantă v de variaţie. A desemna o variabilă
înseamnnă a-i atribui un nume şi a-i indica modalităţile pee care le poaate lua în caadrul unui sisstem bine
                                                            
2 Grand diictionnaire de laa psychologie, Larousse,
L 19922, p. 816
3 Reber, Arthur
A S., "Dictioonary of Psychoology", Penguinn Books, London, 1985, pag.8111

132
STATISTICĂ

precizat. O analiză şttiinţifică se poate realiza doar cu conddiţia ca obiecctul pe care eea se exercittă să aibă
o structuură relativ staabilă. Dacă modalităţile
m v
variabilei pot fi ierarhizatee după un annumit criteriu, acestea
poartă numele de niivele Variabilla este opussă constanteii, care nu arre decât o singură valoarre, fixă şi
nesupussă oscilaţiei. Definiţia uneei variabile şi a modalităţţilor sale nu este independentă de descrierea
dispozitivvului experimmental în caare ea intervvine. În funcţţie de ipotezza sa, cerceetătorul seleccţionează
stările peertinente ale variabilei pe care el o stuudiază. O varriabilă are ceel puţin două modalităţi.

IMPORTANT T
Există doouă condiţii pe
p care trebuuie să le îndeeplinească o variabilă:
v
1. să fiee alcătuită dintr-un
d ansaamblu de vaalori exclusivve, în conseccinţă fiecare din elemenntele unei
variabile nu poate luaa decât o singură valoaree.
2. ansam mblul de valoori sau de modalităţi
m ale unei variabile trebuie săă fie exhausttiv – toate elementele
trebuie să
s poată fi caaracterizate de
d ansamblull de valori

CLASIFICARE
L SU
UMARĂ VARIA
ABILELOR

Exxistă un sisteem de clasifficare a variaabilelor care funcţioneazză prin considerarea uneei serii de
criterii. Vom
V enumeraa doar denum mirile rezultânnd din apelarrea la cele maim frecvente criterii.
Asstfel, dacă luuăm în conssideraţie critteriul graduluui de depenndenţă se diistinge între variabile
independdente şi variaabile dependdente. Distinccţia între variaabile dependdente şi indeppendente estte cel mai
frecvent folosită în teerminologia cercetării
c din psihologie. Variabilele
V inndependentee (notate cureent cu VI)
sunt variabile manipulate sau fixxate de cătree experimenttator. Mai claar, „variabila independentă este o
caracteriistică - a subbiectului, a ambianţei
a saale fizice sau sociale, a sarcinii,
s a stimulului sau stimulilor
prezentaaţi - care este manipulatăă de către ceercetător în scopul s de a controla sauu de a analizza efectul
sau efecctele sale assupra compoortamentului studiat”4. Vaariabilă indeppendentă esste orice varriabilă ale
cărei vaalori sunt, înn principiu, independente
i e de schimbările care au loc cu aalte variabilee. Într-un
experimeent, variabilaa independenntă poate fi orice
o variabilăă care este manipulată
m sppecific, astfel încât să
se observe efecte asupra variabbilei dependeente. Variabiila independeentă mai este numită şi variabilă
experimeentală sau coontrolată. Vaariabilele deppendente (nottate curent cu c VD) sunt vvariabile obseervate de
experimeentator şi caare fac obiecctul unei măssurări. Variabbila dependeentă este orice variabilă ale cărei
valori sunt, în prinncipiu, rezultatul schimbbărilor care au loc înttr-una sau mai multe variabile
independdente. În matematică,
m n
noţiunea de „dependenţţă” este expprimată printtr-o formulă de tipul
y  f (xx ) . Prin aceeastă formă de prezentare a dependdenţei se expprimă faptul că valorile lui l y sunt
dependeente (sau în funcţie
f de) valorile
v lui x. În cercetarea psihologicăă situaţia devvine: comportamentul
subiectului luat în considerare
c (y) este deependent de manipulareea unui factoor (x). În ceercetarea
psihologică, variabilaa dependenntă este, în general, unn răspuns furnizat f de către subiecct sau o
caracteriistică a acesttui răspuns.
O altă accepţiuune este aceeea că variabbila dependeentă este o variabilă
v caree este estimaată dintr-o
altă variaabilă ale cărrei valori sunnt date. Efecctul variabilellor independdente este obbservat pe variabilele
v
dependeente. Exemplu: dacă ne propunem
p săă cercetăm efectul
e diferiteelor forme dee psihoterapie asupra
sensibilittăţii, variabila independdentă este forma de psihoterapiee (terapie ppsihanalitică, terapie
comportaamentală, teerapie experiienţială, teraapie adleriană, terapie siistemică) şi variabila dependentă
este efeectul asupra sensibilităţii pe un anum mit plan. Reelaţia dintre variabila num mită indepenndentă şi
variabila numită depeendentă estee una presuppus cauzală. Relaţia cauzzală trebuie ssă fie demonsstrată, nu
doar afirrmată. Pentruu demonstrarre se cer urm mate regulile unei metodoologii compeetent elaboratte. În caz

                                                            
4 J.-P. Rosssi & Al., La mééthode expérimentale en psychhologie, Dunod, Paris, 1997, pag.22
p

133
AUREL STAN
T

contrar, putem fi victimele aparennţelor constituuite în aşa-nuumitele artefa


facte.

IMPORTANT T
Calităţilee unei bune variabile dependente sunts pertinennţa (variabilaa dependenntă trebuie să
s fie un
indicatorr pertinent al
a comportam mentului) şi sensibilitateea (variabila dependentăă trebuie să exprime
variaţii coomportamenntale foarte finne).

CE ESTE O VARIABILĂ INTERM


MEDIARĂ?

O noţiune carre se întâlneeşte în lucrăările de psihhologie expeerimentală eeste cea de variabilă


intermeddiară. Introduucerea şi utillizarea sistem matică a aceestei noţiuni este atribuittă lui Edwardd Chase.
Tolman (1886-1959), cunoscutul psiholog am merican speccializat în învvăţarea la animal. El nu părăseşte
p
total doomeniul behaaviorismului, dar modiffică viziuneaa acestui curent prin folosirea nooţiunii de
intenţionnalitate. În cooncepţia sa, comportameentul este unn fenomen molar m care peermite unei fiinţe de a
atinge un obiect scoop prin alegerea unor mijjloace. Acestt fapt implicăă o referinţă necesare la variabile
intermeddiare de tip motivaţional
m ş cognitiv deffinite obiectivv. Noţiunea de
şi d variabilă inntermediară cunoaşte
o frecvenntă utilizare în î domeniul învăţării, maai ales în studiile cunoscuutului teoreticcian behavioorist Clark
Leonard Hull (1884-11952)
În anul 1928, E.C. Tolmann enumeră două d tipuri de
d variabile intermediare care se inteercalează
între varriabilele dependente şi cele c indepenndente pentrru a determina comporttamentele. Variabilele
V
intermeddiare cuprinse în primul tip, t considerrate mai elem mentare, sunnt ereditatea vârsta şi edducaţia şi
sunt direect legate de variabilele inndependentee. Cele din al doilea tip suunt nevoile, ddorinţele, atittudinile şi
ipotezelee, fiind considderate mai complexe, în calitate de coombinaţii întrre anumite variabile independente
şi variabbile intermeddiare elemenntare. Actualmente, variaabilele interm mediare din prima categorie sunt
tratate caa variabile independente..
Inttroducerea acestor
a variaabile îşi are raţiunea în dificultăţile
d teeoretice ale curentului beehaviorist
strict, în care dominaa schema S-R R (stimul-reaacţie). În aceaastă schemăă, ereditatea, vârsta şi educaţia nu
descriu nici stimulul, nici răspunnsul. A douaa categorie de d variabile intermediaree este consttituită din
nevoi, doorinţe, atitudini, ipoteze caare nu pot fi controlate dee către experrimentator.
J.PP. Rossi coonsideră că există o a treia categoorie de variaabile intermeediare care trimite la
mecanismele intermeediare5. Astfeel, activitateaa de organizaare care perm mite de a reţine mai bine o listă de
cuvinte a fost adeseea clasată înn rubrica variabilelor intermediare, deeoarece activvitatea de sttructurare
este un tratament
t care se situeazză între S şi R. Paul Fraissse a insistatt în studiile sale asupra faaptului că
răspunsuul este funcţie a interacţiuunii între situaaţie şi personnalitatea subbiectului.
Jeean-François Le Ny conssideră în Graand dictionnaire de la psyychologie că noţiunea dee variabilă
intermeddiară poate fi definită ca c o variabilă ipotetică presupusă a fi funcţie a unei varriabile de
ambianţăă şi ca determ minând direcct o variabilă de comportaament6.
Asstfel, noţiuneea lui C.L. Hull
H şi a teooreticienilor behaviorişti,
b în general, de forţă a motivaţiei
m
(Drive) era
e consideraată, pe de o parte, ca fiinnd o funcţie directă
d a duraatei de privare (de hranăă, băutură
etc.) şi, pe
p de altă paarte, ca determinând în mod direct vigooarea compoortamentului..

Tootuşi, noţiuneea de variabbilă intermeddiară este puuţin utilizată astăzi – lucrru datorat modului
m în
care sunnt privite aspectele care ţin
ţ de persoaană. Aceste aspecte suntt, de fapt, mecanisme intterne. De
exemplu, s-a arătat că organizaarea informaţiei permite o mai bună reţinere a uunei liste dee cuvinte.

                                                            
5 idem pagg.45
6 Grand diictionnaire de laa psychologie, Larousse,
L 19922, p. 816

134
STATISTICĂ

Activitatea de organizare este o variabilă intermediară. Ea presupune o tratare a informaţiei şi constituie


un intermediar între S şi R. Din momentul introducerii modelelor de tratare a informaţiei, noţiunea de
variabilă intermediară şi-a pierdut din raţiunea de a exista. Astfel, putem vorbi de variabile
independente, variabile dependente, stări ale subiectului şi procese se tratare a informaţiei. Acestea din
urmă sunt mai mult ipotetice decât intermediare.
Dacă luăm în consideraţie natura şi fineţea variaţiei, atunci vorbim de variabile discrete şi
variabile continue. Cele discrete sau discontinue sunt variabilele ale cărei valori posibile sunt în număr
limitat şi sunt exprimate prin valori izolate, nediferenţiate. De obicei, pentru a le exprima se folosesc
numere întregi. De exemplu, variabila numărul de persoane care locuiesc într-un apartament este o
variabilă discretă. Această variabilă poate lua valorile 1, 2, 3, 4 ş.a.m.d., dar nu valoarea 2,5 sau 3,7.
Deci între două valori succesive ale variabilei discrete nu se poate introduce o a treia. O variabilă este
continuă în cazul când are teoretic un număr nelimitat de variante. Ca atare, între două variante de
variaţie succesive se poate interpune o a treia. Dacă măsurarea se realizează în centimetri, între
valoarea 2 cm şi 3 cm se poate interpune valoarea 2,5 cm.
1. O distincţie frecvent utilizată se face între variabilele dihotome sau dihotomice şi variabilele
polihotome sau polihotomice. Variabilele dihotomice sunt variabile care au două 2 modalităţi:
adevărat - fals; corect-incorect; da – nu, prezenţă-absenţă, acord – dezacord; masculin-feminin etc.,
şi care primesc, de obicei, valorile numerice 1-0.
2. O distincţie cu care se operează frecvent este cea între variabile cantitative şi variabile cantitative.
În primul caz exprimarea variantelor sau modalităţilor variabilelor se face prin intermediul numerelor
(timp, greutate, lungime), în al doilea caz prin intermediul atributelor (apartenenţă etnică, religioasă,
sex). Variabila cantitativă timp de reacţie va putea avea ca variante sau modalităţi 23; 25; 19; 30
sutimi de secundă, pe când variabila calitativă apartenenţă religioasă va avea ca modalităţi:
ortodox, catolic, protestant, mahomedan, budist etc.
Variabile calitative Variabile cantitative
 Sex (masculin, feminin)  Performanţă fizică sau psihică măsurată
 Culoarea ochilor (albaştri, căprui, verzi,etc.) (Q.I.= 101,sau Q.I.= 83)
 Credinţă religioasă (ortodox, catolic,  Vârsta (17,19, 23 etc.)
musulman)  Numărul de erori comise într-o sarcină
(0,1,2,3,4 etc.)
Tabel exemplificativ pentru variabile calitative şi variabile cantitative

3. O clasificare prezentă în studiile experimentale este în funcţie de posibilitatea cercetătorului de a


manipula apariţia modalităţilor variabilei pe care el o studiază. Vorbim în acest caz de variabile
provocate şi de variabile invocatei. Modalităţile primei variabile ale acestui criteriu de clasificare pot
fi create de către experimentator, în sensul că stă în puterea acestuia de a le manevra. De
exemplu, variabila intensitate sonoră poate avea în cadrul unui experiment trei modalităţi sau stări:
slabă, medie, puternică. În funcţie de interesul ştiinţific, experimentatorul poate varia cele trei stări,
poate să provoace aceste stări. Dar dacă interesul ştiinţific se manifestă în privinţa coeficientului
intelectual, nu mai stă în puterea experimentatorului de a manevra forţa intelectuală a cuiva. În
acest caz, variabila coeficient intelectual este invocată, cercetătorul putând doar căuta şi mobiliza
pentru un studiu persoane care au diferiţi coeficienţi intelectuali (ex. 75, 90, 100,105).

O noţiune indispensabilă pentru exprimarea statistică este cea de unitate statistică, având sensul
de element al unei mulţimi statistice. Un termen similari este cel de individ statistic. Unităţile statistice
pot fi indivizi umani sau obiecte care sunt purtători ai unei anumite caracteristici ce prezintă interes
pentru o anumită cercetare. Mulţimea statistică poate fi o populaţie statistică, adică totalitatea indivizilor
care satisfac exigenţele unei anumite definiţii riguros formulate, sau un eşantion, un subansamblu de
indivizi ai populaţiei care are caracteristica de a fi reprezentativ, adică din analiza acestuia este permis
de a se trage aproximativ aceleaşi concluzii ca şi din analiza întregii populaţii. Eşantionul este un

135
AUREL STAN
T

univers redus
r al poppulaţiei. Rapoortul dintre populaţie
p şi eşantion
e statistic este m
mai bine exprrimat prin
raportul dintre mulţimme şi submulţime. Selecţionarea indivvizilor dintr-o populaţie peentru constituuirea unui
eşantion poate fi aleeatorie sau conformă
c unuui algoritm de
d selecţie. Înn procedura aleatorie dee selecţie,
orice inddivid trebuie să aibă şannse egale dee a fi ales. Volumul
V unui eşantion saau unei popuulaţii este
numărul de indivizi caare le compuun.

IMPORTANT T
Duupă un prim criteriu, eşanntioanele de divid în mari şi mici. Eşantioanele maari au convennţional un
volum dee peste 30 de d indivizi şi cele mici unnul de 30 şi mai puţin. Convenţia
C dee departajaree nu este
totdeaunna respectatăă, aşa încât într-un numărr mic de cazuuri, graniţa de departajaree oscilează între î 30 şi
50, autorii de studii având
a grijă de
d a o precizza. În funcţie de conţinutuul componenţei lor apare al doilea
criteriu de
d clasificarre, ca ataree eşantioaneele se mai divid în deppendente şi independennte. Cele
dependeente sunt compuse din aceiaşi a indivizi(luaţi în coonsideraţie înainte
î şi duupă introduceerea unui
tratamennt experimenntal) iar cele independente din indivizzi diferiţi. Ceea mai bună exemplificare pentru
eşantioaanele indepeendente suntt eşantioaneele de bărbaaţi şi eşantiooanele de feemei. Din inntersecţia
modalităăţilor celor doouă criterii de clasificare, rezultă
r următtoarea clasifiicare a eşanttioanelor:
 Eşanntioane mic independentee
 Eşanntioane mici dependente
 Eşanntioane mari independentte
 Eşanntioane mari dependente

Înttr-o operă apărută


a posstum, intitulaată „Ars connjectandi”, matematician
m nul elveţian Jacques
Bernoulli (1655-17055), unul din clasicii
c teorieii probabilităţiilor, a arătat că o trageree la sorţi coreect făcută
permite ded a obţine un u eşantion care
c să aibă caracteristici similare aceelora ale poppulaţiei. Deci, nu orice
grup de indivizi formeează un eşanntion, ci doarr acel grup constituit prin respectareaa unor reguli riguroase
de prelevvare a indivizzilor în interioorul acestuiaa. Când într-uun studiu întââlnim termennul de lot sauu de grup,
trebuie să
s existe susspiciunea că acesta a fosst compus prrin apelarea la o proceduură de extraggere care
nu respeectă strict meetodologia de d constituiree a eşantioannelor. Biais-uul, termen cee s-a impus în ultima
perioadăă în limbajul ştiinţific cu semnificaţiaa de eroare sistematică, măreşte risscul de a prroceda la
generalizzări eronate. Populaţiile potp fi finite, în
î situaţia în care când mărimea
m lor eeste riguros delimitată
d
cantitativv, şi infinite când
c mărimeea lor nu poaate fi determinată cu preccizie sau estee în continuăă creştere
cu o ratăă imprevizibilă. Populaţia poate fi definită extensivv, atunci cândd elementelee sale pot fi listate (de
exemplu, lista nominală a penssionarilor dintr-un cartieer din Iaşi). Definirea inntensivă a populaţiei p
presupunne indicareaa principiului care stă la baza constituirii sale (eexemplu, toţii elevii liceullui „Mihai
Eminesccu” din Iaşi din primul sem mestru al anuului 2003).

VARIABILE
A ŞI FA
ACTORI

Teermenii ştiinţţifici de variaabilă şi factoor sunt frecveent folosiţi ca sinonimi cceea ce poatte crea o
serie de confuzii. În esenţă,
e oricee factor poatee fi o variabillă, dar nu oriice variabilă poate fi un factor.
f Nu
există o corespondennţă perfectă între variabilă şi factor. În Î unele lucrrări ştiinţifice, termenul faactor este
folosit abbuziv.
În general, prin factor se înţelege oricce are o inffluenţă cauzaală, un anum mit efect asuupra unui
fenomenn. În acest senss factorul este considderat o conddiţie antecedeentă sau o ccauză. Prin extensie,
factorul poate
p fi conssiderat o variabilă independentă. Acesst sens e proopriu proceduurilor statisticce bazate
pe analizza de variannţă. Distincţiaa între factori sistematici şi aleatori este fundam mentală. Facttorul este
sistemattic, în cazul în care aleggerea modalităţilor poatee fi sistematiică, şi aleatooriu, în cazuul în care

136
STATISTICĂ

modalităăţile sale sunnt stabilite prrin tragere laa sorţi. O coonvenţie freccvent respecttată este aceeea de a
denumi factorul printtr-o literă maajusculă şi o cifră care indică număărul modalităăţilor. De exeemplu, în
cadrul notaţiei
n S3 desemnăm prin S factoruul „studii” şi prin 3 num mărul de moodalităţi. Dessemnarea
nivelelorr se face prinn utilizarea literelor
l minuuscule: s1= studii
s superioare, s2=stuudii medii şi s3=studii
generalee. Prin conveenţie factorii aleatorii suunt subliniaţi.. Factorii cărora experim mentatorul vrrea să le
studieze efectele sunnt numiţi princcipali, iar cei pe care expperimentatoruul trebuie să-i controleze pentru că
el ştie căă aceştia au unu efect asuppra fenomenului studiat sunts numiţi seecundari.
men care nu rreprezintă unn concept
Faactorul poatee fi unul din reezultatele unnei analize factoriale, term
unitar, ci mai curând este utilizat ca c termen um mbrelă pentru un număr de d proceduri statistico-maatematice
care-şi propun
p să loccalizeze un număr mai mic de dimensiuni clusteri sau s factori înntr-un set mai mare de
variabile independennte sau item mi. Primul eleement distincctiv al unei analize factooriale este reeducerea
datelor. Analiza
A factoorială este o reacţie contrra beţiei de cuvinte
c în cerrcetarea psihhologică caree tinde să
considerre că oamennii şi acţiunilee umane au atâtea calităăţi cam câte adjective şi atribute există într-o
limbă. A exprima muult prin puţin, principiul paarcimonieii, estee esenţial în analiza faactorială, indiiferent de
formele pe care le îm mbracă aceaastă analiză. Ca atare, faactorul este o variabilă ssubiacentă caare stă la
baza variaţiei altor variabile,
v esste o esenţăă ireductibilă şi irepetabilă care servveşte de support lumii
fenomennologice cu o mare varietaate de manifeestări.

REZUM MAT
 Existăă în statisticcă o serie de noţiuni fundamentalle, care stau la baza îînţelegerii teeoriilor şi
proceedurilor utilizzate. Acesteaa sunt variabbilă, constanntă, paramettru, estimaţiee, populaţie, eşantion
individ
 Definirea variabileelor fundameentale este fooarte importantă.
 Ele mai
m importantte distincţii înntre variabile sunt între vaariabile indeppendente şi ddependente, continue
şi discontinue, cantitative şi caalitative
 Distinncţie importantă este şi acceea între vaariabile şi factori.

ÎNTREBĂ ĂRI
 Care este diferenţţa dintre populaţie şi eşanntion
 Care sunt cele maai frecvente criterii
c de classificare a varriabilelor în statistică
s
 Cum se clasifică variabilele
v
 Care este diferenţţa dintre o vaariabilă şi un factori

Referinţe biibliografice
obligatorrii
 Clocotici,
C V., Stan, A., 2000, Statisticăă aplicata în psihologie, Editura
E Poliroom, Iaşi
 Milton-Smith
M , G., 1971, Ghid simplifiicat de statisstică pentru psihologie şşi pedagogie””, Editura
d
didactică şi pedagogică,
p B
Bucureşti
suplimenntare
 Popa,
P M., 20008, „Statisticcă pentru psihhologie. Teorrie şi aplicaţii SPSS”, Editura Polirom, Iaşi
 Nowak,
N A., 1998, “Metode cantitative în psihologiee şi sociologie”, Oscar Priint, Bucureşti

137
STATISTICĂ

UNITATEA DE ÎNVĂȚARE 2.
SPECIFICUL MĂSURĂRII ÎN PSIHOLOGIE. SCALE DE MĂSURARE. OPERAȚII
PERMISE ȘI NEPERMISE ÎN CADRUL SCALELOR DE MĂSURARE. SENS ȘI
NONSENS ÎN MĂSURARE. ORGANIZAREA DATELOR. PROTOCOALE DE
PREZENTARE A DATELOR. CUANTILELE ȘI INTERCUANTILELE. ETALONAREA
DATELOR REZULTATE DINTR-O CERCETARE. UTILITATEA NOTELOR STANDARD
ÎN PSIHOLOGIE REPREZENTAREA GRAFICĂ A DATELOR REZULTATE DIN
CERCETARE

MĂSURAREA ÎN PSIHOLOGIE

O primă întrebare care se pune atunci când abordăm problema prelucrării datelor obţinute într-o
cercetare psihologică este: haina numerică se potriveşte la fel de bine exprimării rezultatelor ca în
domeniul fizicii, chimiei, biologiei, sau are un anumit specific care trebuie lămurit? În esenţă, trebuie să
stabilim dacă faptul psihic este la fel de bine fundamentat cantitativ ca în domeniile amintite. Dezbaterile
pe această temă durează de secole, opunând la începuturile lor concepţia lui Immanuel Kant (1724-
1804) şi celei aparţinând lui Johann Herbart (1776-1841). Prima concepţie susţine că psihologia nu va
ajunge niciodată ştiinţă experimentală, deoarece faptul psihic nu posedă decât o singură variabilă,
timpul. A doua concepţie susţine că psihologia va putea deveni experimentală şi cantitativistă, întrucât
posedă pe lângă variabila timp şi variabilele intensitate şi calitate. Dezbaterile pe această temă nu au
încetat, fiind sintetizate foarte bine într-o lucrare de erudiţie a lui Vasile Pavelcu: „Ambele atitudini sunt
fireşti căci, dacă am aplica metrismul matematic la părerile înseşi, ivite în rândul oamenilor de ştiinţă, cu
privire la psihologia matematică, am constata abateri statistice naturale, atât în sens pozitiv, cât şi în cel
negativ, faţă de medie. Extremele sunt egal de primejdioase pentru dezvoltarea unei ştiinţe. O încredere
exagerată, nejustificată suficient într-o metodă, duce fatal spre dezamăgirea şi părăsirea totală a
acesteia. Un scepticism anticipat, şi la fel de nejustificat, barează drumul încercărilor şi verificărilor, fără
de care nu putem face dovada ştiinţifică”7.
Răspunsul la întrebarea anterioară presupune o scurtă incursiune în domeniul teoriei măsurării.

Nevoia de măsurare a venit odată cu apariţia şi dezvoltarea cercetării experimentale în psihologie.


Pentru a fi considerată ştiinţifică, cercetarea psihologică trebuie să se supună rigorilor care domina
ştiinţele cu un statut bine precizat, cum sunt fizica, fiziologia şi chimia, în care experimentul era frecvent
practicat. Promotorii experimentului psihologic considerau că prin intermediul acestuia psihologia se
depărtează de viziunea speculativă şi adera la exigenţele spiritului pozitiv, atotputernic la sfârşitul secolului
XIX şi începutul secolului XX, perioadă în care avântul cercetării experimental-psihologice a fost foarte
pronunţat. Personalităţile dominante în această perioadă au fost E.H. Weber, G.T. Fechner, W. Wundt,
H. Ebbinghaus, H. Helmholtz, S. Hull, J.McK. Cattell. Domeniul în care aceşti savanţi au lucrat a fost unul
relativ îngust, cel al structurilor psihice elementare (senzaţii, percepţii). Încercările de a extinde tehnicile
experimental-statistice la fenomene psihice complexe a dus la apariţia unor eşecuri şi nereuşite în
cercetare. Perfecţionarea tehnicilor de investigaţie s-a făcut paralel cu progresul concepţiilor psihologice şi
a aparatului statistico-matematic necesar cercetărilor complexe în care interrelaţionarea era complexă.
Cercetători precum Ch. Spearman, H.P. Kelley, H. Hotteling, L.L. Thurstone, C. Burt, L. Guttman,
S.S. Stevens au perfecţionat şi rafinat concepţia de cercetare în psihologie şi au elaborat tehnici
cantitative complexe, aşa cum este analiza factorială. Într-o lucrare clasică de psihometrie, care se
menţine în actualitate, Nicolae Mărgineanu redă complexitatea situaţiei cercetării din domeniul psihologic:
                                                            
7Vezi Pavelcu, Vasile Problema măsurii în psihologie, Extras din Cercetări pedagogice, vol. I, 1943. Tipografia Alexandru A.
Terek, Iaşi, pag.3.

139
AUREL STAN

„Una dintre caracteristicile de bază ale ştiinţei contimporane, în opoziţie cu ştiinţa antebelică şi mai ales cu
aceea a secolului trecut, e de a nu te mulţumi numai cu studiul relaţiilor dintre diferite, ci de încerca şi
studiul structurii şi configuraţiei acestor relaţii. Relaţia nu e totul; ea e întotdeauna o parte şi un aspect
dintr-un sistem. Ori acest sistem nu pare a fi indiferent pentru relaţie; pentru ca sensul relaţiei să fie prins
în întregime, relaţia trebuie raportată şi la el. Sistemul pare chiar să aibă ultimul cuvânt, proprietăţile de
bază ale relaţiilor nefiind decât funcţiuni ale sale”.8

A măsura înseamnă a aloca numere lucrurilor şi fenomenelor conform unor reguli. Fără o
concepţie clară asupra realităţii măsurabile nu se poate vorbi de precizie şi de apreciere cantitativă a
fenomenelor. Pentru depăşirea unei concepţii rigide s-a ajuns la o concepţie nouă privind puterea
măsurării, elaborându-se gradiente ale forţei de măsurare. A luat astfel naştere concepţia scalelor de
măsură. Elaborarea teorie scalelor de măsură nu reprezintă doar un compromis, o convenienţă, ci o
adaptare la realităţii măsurabile specifice şi complexe.

Scale de măsurare. În sens general, o scală este un dispozitiv care este înzestrat cu gradaţii
pentru a stabili dimensiunile obiectelor şi fenomenelor, şi uneori , o procedură sau un plan ce permite
aranjarea obiectelor sau evenimentelor în serii progresive. Vorbim de scală de măsurare în situaţia în
care instrument sau un dispozitiv ce permite ordonarea numerică a obiectelor sau fenomenelor prin
determinarea unei valori proprii. În examinarea psihologică, scala desemnează un instrument de
examinare sau testare psihologică care posedă itemi şi sarcini structuraţi în legătură cu o anumită
dimensiune. În acest ultim sens, avem scala metrică a inteligenţei Binet-Simon, scala de performanţă
Grace-Arthur. Scala de dezvoltare Arthur L. Gessel. Există scale de atitudini, de preferinţe, de
inteligenţă.
Valorile pe care le obţin variabilele în cursul unor procese de măsurare nu au aceeaşi putere
informaţională, adică nu comunică la fel de profund în privinţa anumitor caracteristici pe care le
studiază. Neglijarea acestui aspect poate duce la apariţia unor confuzii în interpretarea rezultatelor unor
cercetări. Este foarte important de a preciza pe ce scală de măsură pot fi apreciate valorile unei
variabile şi dacă operaţiile sau tratamentele statistice sunt pertinente, adică dacă sunt adaptate,
ajustate proprietăţilor specifice ale unei anumite scale.
În sens strict scala de măsură presupune că modalităţile sau valorile sunt cel puţin ordonate, deci
exclude observaţiile care sunt doar calitativ diferite. În sens larg, scala de măsură se raportează şi la
observaţii care pot fi doar calitativ diferite.
Crearea şi fundamentarea teoretică a scalelor de măsură sunt legate de numele cercetătorului
american Stanley Smith Stevens (1906-1973) care, în anul 1946, a stabilit 4 niveluri sau tipuri de scale
de măsură, inegale în privinţa puterii: măsuri nominale, ordinale, de interval, şi de raport. Alţi autori care
s-au ocupat de această problemă au arătat că se pot concepe nenumărate tipuri de scale, dar cea mai
mare parte dintre ele nu au o reală semnificaţie practică prin diversele grupe de transformări numerice
pe care le-ar presupune9.
Scala nominală (denumiri similare scala categorială sau scala formală) reprezintă tipul de scală
care indică cel mai slab grad al măsurii. Modalităţile scalei nominale sunt definite în aşa fel încât fiecare
observaţie nu poate fi plasată doar într-o singură modalitate. Ea asigură doar simpla diferenţiere
calitativă a observaţiilor făcute de un cercetător. Chiar atunci când utilizează numere în exprimare
realităţii supus măsurii, această scală nu indică alte proprietăţi decât acelea de a fi simple etichete
pentru distingerea diferitelor modalităţi ale unei variabile. Ea poate asigura identitatea a două elemente.
La nivelul scalei nominale modalităţile X,Y şi Z pot fi reprezentate prin 1, 2 şi 3, sau la fel de bine prin
14, 23, 8. Important este ca aceste simboluri să fie diferite. În acest caz 1 nu este mai mic decât 2 şi nici
                                                            
8vezi Nicolae Mărgineanu, Elemente de Psihometrie, Ed. Institutului de Psihologie al Universităţii din Cluj, 1938
9vezi Dick, P., Tournobis, Jocelyne, Flieler, A., Kop, Jeana-Luc, “La Psychométrie”, Presses Universitaires de France, Paris,
1994

140
STATISTICĂ

acesta, la rândul lui, nu este mai mic decât 3. Ele sunt doar simboluri diferite. Observaţiile pot fi
exprimate şi prin simboluri alfanumerice: a1, a2 şi a3 sau chiar prin simboluri pictografice. Astfel de
scale sunt frecvent utilizate în psihologie şi, în general, în ştiinţele sociale, atunci când se uzează de
clasificări: tipologiile psihologice, nomenclatoarele profesiilor, nosologiile psihiatrice (sisteme de
clasificare a bolilor). De exemplu, variabila categorie socio-profesională poate avea modalităţile: elev,
student, funcţionar, cadru mediu, cadru superior, patron, manager, şomer, pensionar. Prin codificare,
atribuim un simbol distinct fiecărei modalităţi a variabilei. Redăm într-un tabel diferite variante de
codificare: varianta 1-alfabetică, varianta 2-numerică, varianta 3-alfanumerică.
Modalitatea variabilei Varianta 1 Varianta 2 Varianta 3
Elevi A 1 a1
Studenţi B 2 a2
Funcţionari C 3 a3
Cadre medii D 4 a4
Cadre superioare E 5 a5
Manageri F 6 a6
Patroni G 7 a7
Şomeri H 8 a8
Pensionari I 9 a9
Tabel exemplificativ pentru Codificările posibile pentru modalităţile variabilei categorie socio-
profesională în cadrul unei scale nominale

Recodificarea modalităţilor în funcţie de variante este corectă dacă asigură fiecărei modalităţi o
notare distinctă de a celorlalte, aşa cum rezultă din tabelul următor.

Modalitatea variabilei Varianta 1 Varianta 2 Varianta 3


Elevi C 9 a7
Studenţi I 8 a3
Funcţionari A 5 a5
Cadre medii D 3 a9
Cadre superioare F 7 a8
Manageri B 1 a2
Patroni E 4 a6
Şomeri G 6 a4
Pensionari H 2 a1
Tabelul exemplificativ ce cuprinde recodificarea corectă a modalităţilor variabilei Categorie socio-
profesională din tabelul anterior

La nivelul scalelor nominale nu are sens noţiunea de formă a distribuţiei, deoarece poziţia
modalităţilor sau categoriilor nu este fixă. Să presupunem că am efectuat un studiu asupra tipurilor
temperamentale şi am obţine următoarele rezultate:
Cod Denumire Frecvenţă
A flegmatic 23
B sanguinic 45
C coleric 39
D melancolic 21

Dacă vom realiza cea mai comună reprezentare grafică, prin intermediul unei histograme, ar
rezulta următorul grafic:

141
AUREL STAN
T

50 45
39
40

30 23 21
20

10

0
fleggmatic sanguinic coleric m
melancolic

Din acest grrafic se creeaază iluzia că avem reprezzentată o situuaţia care în prima parte creşte şi,
ulterrior scade în intensitate. Dacă schim mbăm poziţia modalităţilor, lucru caree este permiss, rezultă
urmăătoarea situaaţie:
Cood Denumire Frecvenţăă
B sanguinic 45
C Coleric 39
A flegmatic 23
D Melancolic 21
La acest mod de preezentare, vaa rezulta următorul graffic care nu mai respecctă forma
anteerioară:
45
45
4 3
39
4
40
3
35
3
30
23
2
25 21
2
20
1
15
1
10
5
0
B‐Sanguinic C‐Co
oleric A‐fflegmatic D
D‐melancolic

Obbservăm o altă formă de d repartiţiee care nu este greşită în comparaţţie cu primaa. Pentru
frecvenţeele categoriilor sau modalităţilor scaalei nominalee sunt indicaate forme de reprezentarre grafică
adecvatee, care nu innduc iluzia foormei distribbuţiei. Acesteea sunt diagrama prin troonsoane şi cercul
c de
structurăă sau „diagrama-plăcintă”
Foolosind datele din ultimuul tabel de exemplificaree, prezentăm m aceste forme de reprrezentare
grafică:
1400
1200 21
1
1000 23
3 meelancolic 21 Sanguinic
80
0 45
fleegmatic Coleric
60
0 39
9 23
Co
oleric Flegmatic
40
0
Sanguinic Melancolic
20
0 45
5 39

Diaggrama prin troonsoane „Diagrama-pl


„ lăcintă”

142
STATISTICĂ

OPERAŢII PERMISE ASUPRA MODALITĂŢILOR SCALEI NOMINALE

Asupra modalităţilor scalei nominale pot fi efectuate două tipuri de operaţii: gruparea şi rafinarea.
Prin grupare, din două sau mai multe categorii se obţine o singură categorie, distinct etichetată. Prin
repetarea operaţiei de grupare, din m categorii se obţin n categorii, în care m>n.
Prin rafinare, dintr-o categorie se obţin două sau mai multe categorii, distinct etichetate. Prin
repetarea operaţiei de grupare din m categorii se obţin n categorii, în care m<n.
Oferim un exemplu din domeniul nomenclatoarelor profesionale, instrumente care sunt frecvent
folosite în domeniul resurselor umane.

Exemplu
Profesia Codificare Fr. Grupare Codificare Fr.
Ing. mecanic a1 10 Profesii
Ing. electronist a2 14 industriale A 43
Sudor a3 19 GRUPARE
Ing. agronom b1 6
Agricultor b2 7
Muncitor agricol b3 3 Profesii
agricole B 16
Profesor c1 17 Profesii
Învăţător c2 13 umaniste C 42
Educator c3 12

RAFINARE

Scala ordinală introduce ordinea între elementele unei serii de observaţii. Transformările de
codificare efectuate trebuie, de această dată, să lase ordinea invariantă, neschimbată. Într-o astfel de
situaţie a<b<c şi 1<2<3. Ultima serie poate fi înlocuită prin 7;13;19 (care respectă ordinea iniţială, primul
element mai mic decât al doilea şi acesta l, la rândul lui, mai mic decât la treilea, dar nu prin 7;5;15
(care nu o respectă). Exemplificările scalelor nominale în domeniul disciplinelor psiho-sociale sunt, de
asemenea, numeroase (clasele de vârstă, nivelurile şcolare, fazele dezvoltării intelectuale). Chiar
scorurile brute la probele de aptitudini sau la chestionarele de personalitate, considerate în mod strict,
se încadrează în rândul scalelor ordinale. Într-o astfel de scală putem să spunem că elementul b este
mai mare decât elementul a, dar nu putem să precizăm cu cât este mai mare. Cel mai bune exemple
pentru scalele ordinale sunt scalele de atitudini sau scalele de apreciere. Variabila atitudine faţă de
fenomenul homosexualităţii poate avea următoarele modalităţi ordonate sau nivele: a) total dezacord; b)
dezacord; c) acord parţial; d) acord total. Aceste serie de modalităţi este ”îngheţată”, în sensul că nu
poate fi schimbat locul ierarhic al unui nivel. Noţiunea de formă a distribuţiei capătă sens în cazul
datelor având valoare scalară ordinală
Scala de interval introduce ordinea între modalităţile unei serii de observaţii dar şi semnificaţia
distanţei dintre acestea. Valorile pentru acest tip de scale sunt numerice. Numerele pot fi întregi
(variabila fiind calificată în acest caz discontinuă sau discretă) sau să cuprindă şi valori reale (caz în
care variabila este discontinuă, există posibilitatea interpunerii unei noi valori între două valori
succesive). Exemple de variabile discontinue de interval din domeniul psihologiei: scorurile la itemii
testelor (itemul este o componentă informaţională elementară a unui test sau chestionar); scorurile la
testele sau chestionarele psihologice în ansamblul lor (aptitudini, atitudini). Exemple de variabile
continue de interval din domeniul psihologiei: timpul de reacţie verbală, măsurarea parametrilor biologici
(în cazul studiilor psihofiziologice). Pentru acest tip de variabilă, nu pot exista valori definite în avans. De
această dată putem preciza că b este mai mare decât a, dar şi cu cât este mai mare. Distanţa capătă
semnificaţie. Dacă avem 4 elemente (A,B,C,D) egale cu 4,8,12,16 putem preciza că distanţa dintre
elementele B-C (8-4) este cu 4 mai mică decât distanţa dintre elementele A-D. Însă nu putem spune, în
cadrul acestei scale, că valoarea 4 este de două ori mai mică decât valoarea 8. Aceste scale au fost

143
AUREL STAN
T

destinatee să joace un rol consideerabil în psihhologie în funncţie de dezvvoltarea instrrumentelor de analiză


care solicită acest nivvel de măsurră.
Sccalea de rap port corespuunde scalelor pe care Sttevens le-a numit n scale dde interval cu
c origine
raţionalăă. Sunt puţin utilizate în ceercetarea psihologică. Vaalorile acestuui tip de scalăă sunt numerrice şi pot
fi supusee operaţiuniloor aritmeticee. La acest tip de scală ses foloseşte şi are sens valoarea nuulă (0). În
cazul scaalelor de inteerval, valoareea 0 este purr convenţionaală, cum estee valoarea 0 a unui termoometru. În
cazul sccalei de rapoort, valoareaa 0 marcheaază absenţa unui fenom men, situaţie greu de accceptat în
psihologie. Rapoartele nu sunt alterate printr--o transformaare de similaritate (adică o transformaare liniară
în care b = 0). O reprrezentare de acest tip estte deci legatăă de o constaantă multipliccativă.
Menţionăm sccalele nominaale şi ordinale mai sunt numite şi sccale calitativee, pe când scalele de
interval şi
ş de raport sunt
s numite scale cantitaative. Scalelee, aşa cum sunt enumeraate anterior, formează f
un ansaamblu ierarhiic de la slabb la puternicc ale cărui trepte se disting în privvinţa în privinţa forţei
informaţiionale. O sccală situată pe p o treaptă superioară are proprietăăţile unei sccale inferioarră, plus o
serie de proprietăţi suuplimentare.

Bibliografiee
Referinţee principale
 Clocotici,
C V., Stan, A., 20000, Statisticăă aplicata în psihologie, Editura
E Poliroom, Iaşi
 Opariuc-Dan
O n, C., Statistiică aplicată în
î ştiinţele soocio-umane, Asociaţia dee Ştiinţe Coggnitive din
România, Cluj
Referinţee suplimentare
 Popa,
P M., „Staatistică pentrru psihologie. Teorie şi applicaţii SPSS”, Editura Poolirom, Iaşi, 2008
 Nowak,
N A., “M
Metode cantitative în psihhologie şi socciologie”, Osccar Print, Buccureşti, 19988

Opperaţiile de grupare sunnt strict necesare în activitatea de cercetare şttiinţifică efecctuată cu


ajutorul unor metodee de investiggaţie specifice psihologiei. Primul luucru asupra căruia ne înndreptăm
atenţia atunci
a când suntem
s în faţaa unor date neordonate
n rezultate
r dinttr-o cercetaree este să ne întrebăm
asupra puterii
p informaţionale a unnor astfel de date. Aparţin scalei nom minale, ordinaale, de interval sau de
raport? Fiecare
F din aceste
a scale pun problem me specifice de
d prelucraree, sistematizaare şi de reprrezentare
grafică. În
Î ceea mai mare
m parte a cazurilor, pssihologul se găseşte în faaţa unor valoori care sunt de d nivelul
scalei dee interval, este adevărat, cu respectarrea anumitorr convenţii caare conferă ddatelor acest statut. În
funcţie de modul de sistematizare
s e a datelor ele ne “vorbessc” mai mult sau
s mai puţinn consistent.
Grruparea. În cazul în caare modalităţţile de care dispunem au a valoare sscalară nomiinală sau
ordinală grupare preesupune stabbilirea frecveenţelor specifice fiecărei modalităţi. Frecvenţele absolute
rezultă din
d însumareea tipurilor distincte alee modalităţiloor sau nivellelor. Frecveenţele relativve traduc
cuantummul procentuaal al fiecărei frecvenţe abbsolută, adicăă valoarea procentului din total reprezzentat de
o anumittă modalitatee a variabilei. De exemplu, dacă într-o cercetare ne n propunem m să grupăm variabila
nominalăă tip de studiii superioare, cu modalităţile studii um
maniste, studiiii economice,, studii tehnicce, putem
avea urmmătoarea situuaţie (situaţiee imaginată):

Nr. crt. Tip de studdii Freccvenţa (f) Frecvenţţa relativă(f%%)


1 Studdii umaniste 75
7 56,88%
2 Studdii economicee 43
4 32,66%
3 Studdii tehnice 14 10,66%
Total N = 132 100% %
Tabel cuuprinzând moodul de înregistrare a freccvenţei a moddalităţilor sauu categoriilorr unor scale nominale
n

144
STATISTICĂ

Frecvenţa relativă se obţine prin înmulţirea cu o sută a raportului dintre frecvenţa relativă şi
43
efectivul total. Frecvenţa relativă 32,5% se obţine astfel: 32,5% = * 100 . Frecvenţele relative dau o
132
informaţie mai precisă, mai ales în cazul în care nu se cunoaşte efectivul total (N =132). Astfel,
frecvenţa absolută egală cu 43 specifică modalităţii studii medii nu ne comunică prea mult dacă nu
cunoaştem valoarea volumului distribuţiei care este egală cu 132, pe când valoarea 32,6% ne comunică
faptul că modalitatea studii medii cuprinde aproximativ o treime din numărul total al subiecţilor.
Pentru variabilele ale căror modalităţi se prezintă sub formă numerică, drumul ordonării este ceva
mai lung. În acest caz, o masă de cifre neordonată ne transmite foarte puţin sens. Exemplificările pe
care le vom face pe parcursul lucrării noastre sunt, în cea mai mare parte, specifice cercetării
psihologice. Să presupunem că avem în faţă următoarele valori rezultate din corectarea unui test
psihologic, mai clar spus avem în faţă notele brute obţinute de 91 de subiecţi la testul AD-P (atenţie
distributivă Praga), având studii medii, vârsta între 35-40 ani, provenind din mediul urban:

22 37 56 76 33 48 40 47 58 78
82 50 54 53 47 54 55 62 69 29
43 59 70 55 53 48 36 66 72 53
46 35 43 58 52 50 57 72 29 35
53 43 39 35 48 55 33 38 43 47
43 49 56 38 32 49 55 60 67 56
64 50 26 69 78 55 53 38 47 55
66 73 50 63 62 46 28 64 63 40
42 61 67 63 46 42 68 59 55 57
55

Menţionăm că ansamblul valorilor unei variabile poartă numele de distribuţie. Există distribuţii
teoretice, denumire care indică faptul că valorile sunt repartizate conform rigorilor unui anumit model
matematic, şi distribuţii empirice, rezultate din cercetări concrete. În cazul nostru de exemplificare, vom
opera pe o distribuie empirică. În momentul în care ordonăm datele crescător, ansamblul valorilor
începe să capete un sens pentru cei care îşi propunem să le cerceteze. Prezentăm, în continuare,
ordonarea acestor date. Putem observa cu uşurinţă care este cea mai mică şi care este cea mai mare
valoare a variabile pe care o notăm cu X (care reprezintă performanţa unor subiecţi la testul AD-P), deci
extremele performanţelor.

22 26 28 29 29 32 33 33 35 35
35 36 37 38 38 38 39 40 40 42
42 43 43 43 43 46 46 46 47 47
47 47 48 48 48 48 49 49 50 50
50 50 52 53 53 53 53 53 54 54
55 55 55 55 55 55 55 55 56 56
56 57 57 58 58 59 59 60 61 62
62 63 63 63 64 64 66 66 67 67
68 69 69 70 72 72 73 76 78 78
82
Avem în total 91 de rezultate ale subiecţilor. În acest caz, valoarea 91 este numită volumul
distribuţie. Se notează cu N. După această ultimă ordonare putem să efectuăm o grupare a datelor,
operaţiune care se poate avea două opţiuni:
1. Gruparea pe variante de variaţie;
2. Gruparea pe intervale de variaţie.

145
AUREL STAN

Este un tip de ordonare care poate are cea mai largă răspândire, indiferent de domeniu. Unele
domenii îşi impun o serie de modele proprii de prezentare a datelor, funcţie de particularităţile tipului de
cercetare (date rezultate în urma unei observaţii, date rezultate dintr-un experiment, date rezultate dintr-
o anchetă).

GRUPAREA PE VARIANTE DE VARIAŢIE

În cazul în care optăm pentru primul fel de grupare, stabilim cât de frecvente sunt valorile diferite
pe care le-au obţinut subiecţii, adoptând o ordonare ascendentă sau descendentă a valorilor distincte.
Rezultatele unei variabile care nu au suferit încă tratamente de transformare valorică poartă numele de
valori brute sau note brute. Dacă această operaţiune este efectuată empiric, se ordonează crescător
sau descrescător aceste valori, apoi se parcurge întreaga serie de valori neordonate şi se trage câte o
linie ori de câte ori întâlnim o valoare identică. În exemplul nostru ordonarea este ascendentă. Pentru o
bună citire a rezultatelor grupării empirice se realizează grupări de câte 5 valori identice, prin a 5-a linie
se barează 4 liniuţe anterioare. Tipul de marcare IIII cuprinde 5 valori identice ale variabilei.

Nota brută Marcare Fr Nota brută Marcare Fr. Nota brută Marcare Fr.
22 I 1 47 IIII 4 63 III 3
26 I 1 48 IIII 4 64 II 2
28 I 1 49 II 2 66 II 2
29 II 2 50 IIII 3 67 II 2
32 I 1 52 I 1 68 I 1
33 II 2 53 IIII 5 69 II 2
35 III 3 54 II 2 70 I 1
36 I 1 55 IIII III 8 72 II 2
37 I 1 56 III 3 73 I 1
38 III 3 57 II 2 76 I 1
39 I 1 58 II 2 78 II 2
40 II 2 59 II 2 82 I 1
42 II 2 60 I 1
43 IIII 4 61 I 1
46 III 3 62 II 2
Tabel conţinând ordonarea pe variante de variaţie şi marcările corespunzătoare ale frecvenţei valorilor

Asemenea grupări ale datelor se realizează în momentul în care tindem să realizăm o analiză
foarte amănunţită, deci când într-o cercetare operează un spirit analitic pronunţat. În momentul în care
urmărim observarea tendinţei centrale a datelor, atunci efectuăm o grupare pe intervale de variaţie.
Problema care se pune în acest caz este aceea a numărului optim de intervale în care pot fi grupate
datele avute la dispoziţie.

GRUPAREA PE INTERVALE DE VARIAŢIE

Aceasta poate lua forma intervalelor egale sau inegale. În majoritatea cazurilor în cercetările
psihologice gruparea se face pe intervale egale.
Gruparea pe intervale de variaţie presupune următoarele etape:
 alegerea sau determinarea mărimii intervalului de variaţie. Mărimea intervalului de variaţie depinde
de amplitudinea şi de numărul de grupe sau de clase dorit. Amplitudinea unei distribuţii este
distanţa dintre cea mai mare şi cea mai mică valoare. Vom nota cu A amplitudinea distribuţiei,
notaţie acceptată în mare parte de autorii de specialitate. Formula de calcul este următoarea:

146
STATISTICĂ

A = Xmax-Xmin+1, în care: Xmax reprezintă cea mai mare valoare şi Xmin cea mai mică valoare. În
cazul nostru concret X max = 82, X min = 22. Procedând la calculare vom avea A = 82 – 22 + 1 = 61.
Cifra 61 ne spune că între cea mai mare şi cea mai mică valoare se găsesc teoretic 61 de valori
ale variabilei distincte una de alta. Distribuţiile empirice (rezultate în urma unor cercetări concrete)
nu au, de obicei, toate variantele posibile. În exemplu nostru lipsesc valorile variabilei egale cu 23,
24, 27 etc. Practic, avem un număr de 43 variante distincte ale variabilei. Notăm cu i mărimea unui
A
interval, mărime care se calculează după următoarea formulă: i = , în care A este amplitudinea
k
distribuţiei, iar k este numărul de intervale în care dorim să împărţim distribuţia. De exemplu, dacă
61
dorim să facem o împărţire a distribuţiei valorilor în 9 intervale vom avea următorul rezultat: i =
9
= 6.77. Dacă valorile concrete ale variabilei nu conţin zecimale vom proceda la întregirea valorii i,
care se face totdeauna prin adăugire. Deci, în urma întregirii, i = 7. Dacă întregirea s-ar face prin
scădere, ar rămâne valori în afara intervalelor, valori nealocate unor intervale. Dar, dacă vom
considera mărimea unui interval egală cu 7, vom mări artificial mărimea amplitudinii cu 2, deoarece
9 × 7 = 63. Pentru a împărţi ponderat diferenţa la cele două capete ale distribuţiei vom începe
primul interval de la 21 şi ultimul interval va avea valoarea superioară egală cu 83, deci va fi mai
mare cu 1.
 crearea tabelului cu intervale. Intervalele care rezultă sunt următoarele:
1 2 3 4 5
Nr.crt. Interval Centru interval Marcare Frecvenţa
1. 21 – 27 24 II 2
2. 28 – 34 31 IIII I 6
3. 35 - 41 38 IIII IIII I 11
4 42 - 48 45 IIII IIII IIII II 17
5. 49 - 55 52 IIII IIII IIII IIII II 22
6. 56 - 62 59 IIII IIII III 13
7. 63 - 69 66 IIII IIII II 12
8. 70 - 76 73 IIII 5
9. 77 - 83 79 III 3
Tabel conţinând gruparea pe variante de variaţie şi marcarea frecvenţelor valorile pentru fiecare interval

Pe lângă rubricile cuprinzând numărul curent şi mărimea intervalului au fost trecute, pentru o mai
bună înţelegere a tabelului, rubrici cuprinzând marcarea variabilelor componente ale unui interval şi
frecvenţa acestora pe un interval. La o primă privire, intervalele creează impresia că au valoarea 6, şi
nu 7, cum am anunţat anterior. Dar aceste intervale includ limita inferioară şi limita superioară. Intervalul
21–27 conţine următoarele valori teoretice: 21,22,23,24,25,26,27. Deci, are 7 componente numerice
distincte. În unele cazuri se face precizarea dacă limitele intervalelor sunt sau nu incluse în interval sau
se face precizarea care sunt limitele reale ale intervalelor, în cazul existenţei unor valori zecimale.
Astfel, intervalul 21–27 poate avea limita inferioară 20,5 şi limita superioară 27,5 dacă am fi avut
zecimale. Ca atare, dacă am fi întâlnit valorile 20,7 sau 27,3 le-am fi marcat la intervalul anunţat
anterior. Centrul intervalului se obţine prin împărţirea la 2 a adiţiei valorii limitei inferioare a intervalului şi
a celei superioare. Astfel la intervalul nr.1, centrul intervalului, egal cu 24, s-a obţinut în felul următor:
24 . Stabilirea centrului intervalului poate fi utilă pentru uşurarea unor calcule, situaţie în
care centrul intervalului este considerat o valoare reprezentativă a intervalului.
O problemă care se pune la gruparea pe intervale de variaţie este aceea a numărului optim de
intervale în care se divizează distribuţia. Există în această privinţă o serie de formule de calcul şi de
tabele fixând numărul de intervale. În primul rând amintim formula lui H.D. Sturges care fixează

147
AUREL STAN

mărimea intervalului .
în care xmax este cea mai mare valoare a distribuţie, xmin - cea mai
mica valoare şi N - numărul total de răspunsuri ale subiecţilor. După ce am stabilit mărimea intervalului
se poate determina foarte uşor numărul de intervale Pentru valori nu prea mari ale lui N (sub 100) se
foloseşte formula Hahn-Shapiro: k=Int(N/5), în care k exprimă numărul de intervale, INT exprimă partea
întreagă a expresiei numerice din paranteză (întregire prin scădere, de exemplu, INT (3,7)=3). Ilie Puiu
Vasilescu exemplifică, în una din lucrările sale consacrate statisticii aplicate, o serie de tabele care
indică numărul de intervale în funcţie de numărul de subiecţi10. Redăm, în continuare, unul din aceste
tabele, şi anume tabelul lui Bendat şi Piersol:
N 200 400 600 800 1000 1500 2000
K 16 20 24 27 30 35 39
Tabelul Bendat – Piersol referitor la numărul optim de intervale în care se pot diviza distribuţiile

În acest tabel prin N s-a notat numărul r de răspunsuri ale subiecţilor la o anumită solicitare şi prin
k numărul de intervale necesare. Astfel, la 200 de subiecţi sunt necesare 16 intervale, între 201 şi 400
sunt necesare 20 de intervale, între 401 şi 600 avem nevoie de 24 de intervale, ş.a.m.d. În practică
grupării datelor pe un număr relativ mic de răspunsuri (în jur de 100) se realizează 7; 9; 11; 13 intervale.
Numărul de intervale este impar, fapt ce pune mai bine în evidenţă tendinţa centrală.
 În următoarea etapă se realizează un tabel cu frecvenţele şi alte rubrici necesare efectuării
calculelor statistice. Tabele se elaborează conform unor reguli. Aceste reguli11 sunt:
1. să faciliteze percepţia rapidă şi exactă a informaţiilor prezentate;
2. să cuprindă numai informaţii strict necesare caracterizării fenomenului studiat;
3. să aibă un titlu scurt, clar, care să sintetizeze conţinutul informativ al datelor;
4. să fie numerotate pentru a putea fi identificate uşor în textul de analiză,
5. să fie însoţite de note explicative care să explice noţiunile cu mai multe sensuri;
6. notele explicative trebuie să explice sursa datelor;
7. liniile şi coloanele tabelului trebuiesc numerotate pentru a putea fi identificate uşor in text;
8. în tabele nu se admit rubrici incomplete.
Exemplificăm rubricile cu frecvenţe pe datele anunţate de noi anterior:
Nr.crt. Interval f f% fc↓ fc↓ fc↑ fc↑%
1 21 – 27 2 0,02 (2%) 2 0,02 (2%) 91 1,00 (100%)
2 28 – 34 6 0,07 (7%) 8 0,09 (9%) 89 0,98 (98%)
3 35 – 41 11 0,12 (12%) 19 0,21 (21%) 83 0,90 ( 90%)
4 42 – 48 17 0,19 (19%) 36 0,40 (40%) 72 0,78 ( 78%)
5 49 – 55 22 0,24 (24%) 58 0,64 64%) 55 0,59 ( 59%)
6 56 – 62 13 0,14 (14%) 71 0,78 (78%) 33 0,36 ( 36%)
7 63 – 69 12 0,13 (13%) 83 0,91 (91%) 20 0,22 ( 22%)
8 70 – 76 5 0,05 (5%) 88 0,97 (97%) 8 0,09 ( 9%)
9 77 – 83 3 0,03 (3%) 91 1,00 (100%) 3 0,03 ( 3%)
Total N=91 1,00 (100%)
Tabel exemplificativ pentru intervalele de variaţie şi tipurile de frecvenţe
Legendă:
 f = frecvenţă simplă sau frecvenţă absolută;
 f% = frecvenţă simplă relativă;
 fc↓ = frecvenţă cumulată ascendent;
 fc↓% = frecvenţă relativă cumulată ascendent;
 fc↑ = frecvenţă absolută cumulată descendent;
 fc↑% = frecvenţă relativă cumulată descendent;
                                                            
10 Vezi Vasilescu, Ilie Puiu, Statistică informatizată pentru ştiinţele despre om, Editura militară, Bucureşti, 1991, pag. 27
11 Vezi Porojan, Dumitru „Statistica şi teoria sondajului” Casa de editură şi presă “Şansa” SRL, Bucureşti, 1993, pag. 39

148
STATISTICĂ

Frecvenţa simplă, notată cu f, indică numărul de rezultate ale subiecţilor care se găsesc în
intervalul respectiv. De exemplu, în intervalul 3, cu limitele 35-41 (limita inferioară 35, limita superioară
41) se găsesc 11 rezultate ale subiecţilor. Deci, 11 subiecţi au obţinut la proba AD-P rezultate (sau
scoruri) cuprinse între 35 şi 41. Dacă adiţionăm toate cele 9 frecvenţe simple va rezulta valoarea 91,
reprezentând ansamblul rezultatelor subiecţilor care au participat la examinare (notat cu N mare. N
reprezintă volumul distribuţiei).
Frecvenţa simplă relativă, notată cu f%, indică cota parte de subiecţi (este exprimată sub formă
de proporţie) din totalul de 91, existentă în intervalul respectiv. În dreptul intervalului 3 (35-41) se vor
afla 0,12 din totalul rezultatelor subiecţilor, sau, exprimat sub formă procentuală, 12% din acest
total(valoare trecută în paranteză).
Frecvenţa cumulată ascendent indică numărul rezultatelor subiecţilor care se găsesc până în
dreptul intervalului respectiv (inclusiv acest interval). De exemplu, în dreptul intervalului 3 de la rubrica
fc↓ se găseşte valoarea 19, semnificând faptul că până în dreptul intervalului 3, inclusiv acesta, se
găsesc 19 rezultate ale subiecţilor, sau mai clar, primele 19 rezultate ale subiecţilor ordonate crescător.
Valoarea 19 se obţine prin adiţia primelor 3 frecvenţe simple (19 = 2+6+11). Valoarea corespunzătoare
a intervalului 4, din rubrica fc↓ este 36. Ea se obţine din adiţia valorilor primelor 4 frecvenţe simple (36 =
2+6+11+17). Primele valori din rubricile f şi fc↓ coincid (ambele au valoarea 2).
Frecvenţa relativă cumulată ascendent reprezintă cota parte din totalul rezultatelor subiecţilor
existentă până la un anumit interval. Ea ne informează despre proporţia răspunsurilor subiecţilor ( în
paranteză este trecută forma de exprimare procentuală) până la un anumit interval. De exemplu, în
dreptul intervalului 4 la rubrica fc↓% se găseşte valoarea 0,40, care provine din adiţia frecvenţelor
simple relative de la intervalele 1- 4 (0,02 + 0,07 + 0,12 + 0,19). Această valoare ne spune că până la
intervalul 4, inclusiv acesta, se găsesc 0,40 din totalul răspunsurilor subiecţilor, sau, exprimat sub formă
procentuală, 40% din totalul acestora.
Frecvenţa cumulată descendent exprimă numărul răspunsurilor subiecţilor care se găseşte
dincolo de un anumit interval. Astfel, valoarea 72 a intervalului 4 din rubrica fc↑ exprimă faptul că
dincolo de intervalul 4 (inclusiv acesta) se găsesc 72 de răspunsuri ale subiecţilor. Valoarea 72 se
obţine scăzând din numărul total al subiecţilor (N = 91) adiţia frecvenţelor simple a primelor 3 intervale.
Astfel 72=91–(2+6+11). Dacă ar trebui să calculăm frecvenţa cumulată descendent a intervalului 5 vom
scădea din totalul răspunsurilor adiţia primele 4 valori, iar pentru intervalul 6 adiţia primelor 5 valori (55
= 91–(2+6+11+17) şi 33=91–(2+6+11+17+22)).
Frecvenţa relativă cumulată descendent, notată cu fc↑% exprimă o situaţie identică, exprimată
sub formă de proporţie, în paranteză sub formă procentuală).
Tabelul cuprinzând frecvenţele unei distribuţii pe intervale de variaţie are o utilitate deosebită
pentru calculul diferiţilor indicatori statistici.

TRANSFORMAREA VALORILOR BRUTE ÎN VALORI STANDARDIZATE

Care este raţiunea acestei transformări? În marea majoritate a examinărilor psihologice se cere o
raportare valorică a rezultatelor obţinute. Scorul brut al unui test sau chestionar psihologic nu ne poate
da decât o indicaţie vagă în privinţa aprecierii valorice a unui subiect. Pentru a veni în întâmpinarea
dezideratului de raportare valorică a rezultatelor s-au creat două sisteme de norme. Unele dintre
acestea sunt cuantilele, iar celelalte sunt variabilele normate care vor fi tratate în secţiunea din lucrare
afectată indicatorilor de împrăştiere.

149
AUREL STAN
T

IMPORTANT T
Cuuantilul este un element al unei seriii ordonate de d valori ale unei variabile care separa două
cuantum muri procentuuale din volumul total al a valorilor variabilei. Practic,
P este o “bornă” numerică
separândd două cuaantumuri proocentuale alee ansamblullui valorilor Valorile varriabilei sepaarate prin
intermeddiul unui cuuantil sunt ordonate
o creescător sauu descrescăttor, operaţiee anterioarăă stabilirii
cuantilului. Separaţiaa unui ansam mblu de valori ale variabilelor în cuanntile constituiie una din foormele de
etalonaree a testelor, adică de creare
c a unoor scale de apreciere
a a valorii perfoormanţelor obbţinute la
diferite sisteme
s de solicitare
s psihhică. Etaloannele permit ded a situa unu subiect caare a obţinutt un scor
determinnat într-o anuumită clasă valorică
v a suubiecţilor penntru care testtul a fost etaalonat. Se vaa vorbi de
intercuanntile (de inteerdecile, de exemplu) peentru a deseemna n+1 zone z de distrribuţie delimitate prin
cuantile (prin n desemnând număărul cuantilellor). Uneori se s utilizează termenul dee interquantil în loc de
quantil. Distincţia
D clară se face prrin precizareaa faptului că interqantilul este un interrval numeric, pe când
quantilul este reprezzentat de o singură valooarea numerrică. Lucrările se speciaalitate ale lui Maurice
Reuchlinn consacrate statisticii applicate în psihhologie fac clară
c aceastăă separaţie dde sensuri peentru cele
două noţţiuni .
12

Cuuantilele şi intercuantilelee numerotate cu 1 coreespund, în geeneral în Fraanţa, celor mai m bune


rezultatee, iar în SUAA rezultatelor celor mai sllabe. Este o chestiune de convenţie a notării. Daacă într-o
p clase deeterminând inntervale pe aaxa absciselor, se va
distribuţie se vor repprezenta inteercuantilele prin
asigura la această distribuţie graffică o formă rectangulară
r , efectivele teeoretice ale ttuturor interqquantilelor
fiind egaale prin definiţie.
Laa începutul procedurii
p de cuantilare (fformă particuulară a etalonnării) se alegge o metrică, adică un
număr de d niveluri pee care scala permite de a le discrimina. Dacă o scală cuprinnde n nivelurri şi dacă
N
efectivul total al unuui eşantion este
e N, efecttivul fiecărui nivel va fi teoretic . Scala în cuuantile va
n
corespunnde, deci, unnui model recctangular. Ceele mai utilizaate tipuri în cuantile
c suntt prezentate în tabelul
care urm
 
mează:
Nr.crt. Nr interquanntile Nr quaantile Dennumire tehniccă Tabel conţinând denumirile forrmelor de
1 3 2 Trecilă etalonare prin inttermediul cuuantilelor,
2 4 3 Quartilă gradieente de la 3 laa 10
3 5 4 Quintilă
4 6 5 Sextilă Pentru a construi unn decilaj
5 7 6 Septilî (sistemm de clasifficare cuprinzând 9
6 8 7 Octiilă cuantile şi 10 intercuantile) se
7 9 8 Nonilă proceddează în aşşa fel încât clasele
8 10 9 Decilă scalei rezultate săă conţină fieecare un
9 100 9
99 Centilă acelaşşi număr de scoruri din eşantionul
e
de refeerinţă. Este vorba de o convenţie
c
care va face distribuuţia rectanguulară (în caree fiecare divviziune are un u număr egal de subieccţi). Dacă
scala estte constituităă din 10 clasee egale în effectiv, acest efectiv
e va treebui să aibă 110% din num mărul total
al subieccţilor. Limitelle valorice ale interdeciluului I vor connţine primelee 10% din nootele brute, celor c mai
slabe dinn distribuţie, ale interdeccilului II conţiin 10% din rezultatele
r caare urmeazăă, şi aşa mai departe,
până deccilul interdeccilul X. Deciluul I va separaa primii 10% din subiecţi de următorii 90%, deciluul II primii
20% din subiecţi de următorii
u 80%
%, şi aşa mai departe, pâână la interdeecilul IX care va separa primii 90%
de următtorii 10%.

                                                            
12 Vezi Maaurice Reuchlin, Précis de stattistique, PUF, Paris,
P 1976, pagg. 67-78

150
STATISTICĂ

Oferim un exemplu imaginat: un psiholog examinează un număr de 360 de subiecţi cu un anumit


test în vederea etalonării acestuia. Procedura de etalonare se pune în practică în faza construirii unor
instrumente de investigaţie psihologică sau în cazul reevaluării acestora. Notele testului variază, in
exemplu nostru, între 0 şi 35. Exemplu dat este unul imaginat şi nu va conţine primele 5 valori
(1,2,3,4,5) şi ultimele 3 (33,34 şi 35). De obicei, în examinare se obţin foarte rar scorurile cele mai mici
şi scorurile cele mai mari ale testului sau chestionarului. Dacă datele ar fi fost reale, ar fi trebuit să se
facă o serie de precizări cu privire la constituirea eşantionului de etalonare, adică la provenienţa
subiecţilor examinaţi, la vârstă, nivel de studii, sex etc. De asemenea, ar fi trebuit să se facă precizări cu
privire la tehnicile folosite pentru selectarea subiecţilor în eşantion. Reamintim, că înaintea operaţiunii
de etalonare, datele se organizează crescător în variante de variaţie.
Tabelul întocmit în vederea stabilirii scalei de etaloane în 10 interquantile (sau în 10 clase) va
arăta în felul următor:

X n nc nct Interdecil Decil Numerotare % interdecil Separaţie decil


6 3 3
7 7 10
8 4 14
9 6 20
10 8 28
11 11 39 36 0 – 11 11 I 10,83% 10,83%/89,17%
12 14 53
13 17 70 72 12 – 13 13 II 8,61% 19,49%/80,51%
14 16 86
15 19 105 108 14 – 15 15 III 9,72% 29,21%/70,79%
16 24 129
17 22 151 144 16 – 17 17 IV 12,77% 41,98%/58,02%
18 26 177 180 18 18 V 7,22% 49,20%/50,80%
19 21 198
20 24 222 216 19 – 20 20 VI 12,50% 61,70%/38,30%
21 18 240
22 19 259 252 21 – 22 22 VII 10,27% 71,97%/28,03%
23 17 276
24 14 290 288 23 – 24 24 VIII 8,61% 79,58%/20,42%
25 16 306
26 14 320 324 25 – 26 26 IX 8,33% 87,91%/12,09%
27 11 331 331
28 9 340 340
29 7 347 347
30 6 353 353
31 5 358 358
32 2 360 360 27-32 X 12,09%
Coloanele tabelului conţin etape ale procedurii de etalonare prin metoda quantilelor (9 decile şi 10
interdecile) a rezultatelor obţinute la un test psihologic de subiecţi unui eşantion
Notaţiile folosite în tabel:
X: nota brută
n: frecvenţa absolută a unei variante de variaţie
nc:frecvenţa cumulată absolută
nct: frecvenţa cumulată absolută necesară teoretic pentru calcularea interquantilelor şi quantilelor.
Jocul frecvenţelor cumulate absolute face să nu putem “tăia” distribuţia exact acolo unde trebuie.
În acest caz ne limităm în calcul la cele mai apropiate valori de cele teoretice. Astfel, la primul decil ar fi

151
AUREL STAN

trebuit să ne oprim la valoarea 36. Valoarea 39 folosită de noi ca valoare delimitativă pentru primul decil
este cea mai apropiată valoare de 36. Procedând în acest fel am realizat un compromis metodologic.
În cazul când dorim să stabilim o scală în centile sau percentile, avem la îndemână o procedură puţin
diferită. Pentru a pune în aplicare această procedură trebuie să avem distribuţii ale căror amplitudini sunt de
ordinul sutelor. Raţiunea construirii scalelor care fac apel la centile este de a asigura o discriminare foarte
fină a subiecţilor, dar în cazul în care amplitudinea distribuţiei este sub 100 asigurăm o falsă fineţe a
diferenţierii. Redăm, în continuare, un tabel ale cărui coloane indică paşii de urmat în procedura de calcul:
Luăm exemplu a 127 de subiecţi care au fost examinaţi cu un anumit test (exemplul este fictiv).
Nr.crt. X F f% C fc% Percentila
1. 11 2 1,57 2 1,57 0,79
2. 12 5 3,94 7 5,51 3,54
3. 13 7 5,51 14 11,02 8,27
4. 14 11 8,68 25 19,69 15,36
5. 15 19 14,96 44 34,65 27,17
6. 16 26 20,47 70 55,12 44,89
7. 17 18 14,17 88 69,29 62,21
8. 18 15 11,81 103 81,10 74,50
9. 19 11 8,66 114 89,76 85,43
10. 20 7 5,51 121 95,28 92,52
11. 21 4 3,15 125 98,43 96,85
12. 22 2 1,57 127 100,00 99,22
În tabelul anterior, coloanele tabelului indică etapele necesare calculării valorilor percentile
Avem în faţă un exemplu simplu, deoarece în practică este foarte puţin probabil să se găsească
un test la care să se poată obţine doar 12 valori distincte.
Procedura exemplificată de noi este folosită de autori reputaţi în domeniul psihometric ca David
Magnusson13, J.J. Bernier şi B. Pietrulewicz14. Prin această procedură se încearcă a se ameliora
impreciziile metodei prezentate la calculul decilelor.
Coloana notată cu X conţine diferitele variante ale variabilei obţinute în urma unei examinări cu
un anumit test. A doua coloană, notată cu f, conţine frecvenţele diferitelor valori ale variabilei. În total au
fost cuprinşi în analiză 127 de rezultate ale subiecţilor. Cu f% a fost notată frecvenţa simplă relativă,
care se obţine prin înmulţirea cu 100 a rezultatului împărţirii fiecărei frecvenţe simplă la 127 (numărul
total de subiecţi examinaţi). Cu fc a fost notată frecvenţa absolută cumulată ascendent, iar cu fc%
frecvenţa relativă cumulată ascendent. Valorile din această coloană se obţin prin înmulţirea cu 100 a
rezultatului împărţirii fiecărei valori din coloana fc la 127. Ultima coloană conţine transformarea în valori
percentile a valorilor iniţiale ale testului. Cum se obţin aceste valori? Valoarea 13, de exemplu, este
considerată mijlocul unui interval de clasă care se întinde de la 12,5 până la 13,5. Ca atare, valoarea
percentilă este constituită din frecvenţa cumulată relativă anterioară valorii 13 şi din adăugarea ½ din
frecvenţa relativă din dreptul valorii 13.
5,51
8,27 = 5,51 +
2
8,68
15,36 = 11,02 +
2
Ce ne spune o valoare percentilă? Ea ne spune, de exemplu, că sub valoarea 16 se găsesc
aproximativ 45% din totalul subiecţilor, iar peste această valoare se găsesc aproximativ 55% din totalul
subiecţilor.

                                                            
13 vezi David Magnusson, Testtheorie, Verlag Fraanz Deutlicke Wien, 1973, pag 252
14 vezi J.J. Bernier, B. Pietrulewicz, La psychometrie, Gaetan Morin Editeur, Montreal, Casablanca, 1997, pag. 371-372

152
STATISTICĂ

În cazul ordonării valorilor variabilei pe intervale de variaţie procedura este puţin diferită. Folosim
exemplul de la începutul secţiunii referitoare la gruparea datelor. Rubricile tabelului sunt cunoscute din
comentariile noastre anterioare. În cazul în care dorim să construim o scală în quartile (trei quartile
împart distribuţia în 4 clase) vom stabili în primul rând quota, adică un cuantum procentual de subiecţi
separat de valorile quartilelor. Deci, quartilele se referă la valorile distribuţiei, iar quota la un cuantum
procentual al efectivului total. Quota pentru primul quartil va fi de 25% din efectivul total (22,75 în
valoare absolută), quota pentru cel de-al doilea quartil va fi de 50% (45,5 în valoare absolută) şi quota
pentru cel de-al treilea quartil va fi de 75% (68,25 în valoare absolută).
Nr.crt Interval f Fc↓ fc↓%
1 21 – 27 2 2 0,02 (2%)
2 28 – 34 6 8 0,09 (9%)
3 35 – 41 11 19 0,21 (21%)
4 42 – 48 17 36 0,40 (40%)
5 49 – 55 22 58 0,64 64%)
6 56 – 62 13 71 0,78 (78%)
7 63 – 69 12 83 0,91 (91%)
8 70 – 76 5 88 0,97 (97%)
9 77 – 83 3 91 1,00 (100%)
Coloanele tabelului conţin etape de calcul pentru obţinerea quantilelor şi interquantilelor în condiţiile
grupării de variante de variaţie

Valoarea primei quote va cuprinde 25% din rezultatele subiecţilor examinaţi. Dacă privim la
rubrica fc↓% a tabelului observăm că primii 25% din subiecţi sunt delimitaţi de intervalul numărul 4 care
cuprinde până la el 40% din subiecţi (inclusiv intervalul 4). Intervalul anterior nu putea să facă o astfel
de separaţie, deoarece până la el se găsesc doar 21% din rezultatele subiecţilor (19 rezultate în valoare
absolută). Formula de calcul pe care o aplicăm pentru calculul quantilelor pentru date organizate pe
variante de variaţie este următoarea:
;
în care:
 Q = denumire generică pentru quantil;
 Xsup= valoarea superioară a intervalului anterior celui în care se află quota;
 i = mărimea intervalului de variaţie;
 d = diferenţa dintre valoarea absolută a quotei şi frecvenţa cumulată absolută anterioară
intervalului în care se află quota;
 f = frecvenţa simplă absolută a intervalului în care se află quota

Pentru cazul nostru particular de calcul a quartilelor, formă particulară a quantilelor, vom nota
quartilul 1 cu Q1, quartilul 2 cu Q2, quartilul 3 cu Q3. Pentru Q1 am amintit că valoarea procentuală a
quotei este de 25%, iar valoarea absolută este de 22,75 (25% din 91; 91×0,25=22,75). Valoarea
absolută a quotei primului quartil se află în intervalul 4.
Xsup sau valoarea superioară a intervalului anterior celui în care se află quota este egală cu 41.
Intervalul anterior este intervalul 3 (35-41). Valoarea superioară sau limita superioară a acestuia este 41.
Mărimea unui interval (i) este egală cu 7.
Diferenţa dintre valoarea absolută a quotei (22,75) şi frecvenţa absolută cumulată ascendent a
intervalului anterior celui în care se află quota (19) este egală cu 3,75 (deci, d=22,75–19=3,75).
Frecvenţa intervalului în care se află quota este egală cu 17. Intervalul 4 are frecvenţa egală cu
17.

153
AUREL STAN
T

Avvem la dispoziţie toate daatele necesarre calculării primului


p quarrtil.
7 * 3,75 26,25
Q1 = 41++ = 41+
4  41  1,54  442,54
17 17
În continuare, trecem la caalcularea celuui de-al doileea quartil. Al doilea quartiil separă prim mele 50%
din rezulltatele subieccţilor de următoarele 50% %. De această dată quotta va fi egalăă cu 50% dinn efectivul
91
total, decci, va avea valoarea
v 45,55 (  45,5 ). De aceasttă dată quotaa se va situaa în intervalul 6, adică
2
intervalul 49 –55. Lim mita superioaară a intervalului anterior celui în care se află quotta (Xsup) va fi egală cu
48, difereenţa între quuotă şi frecveenţa cumulatăă ascendent anterioară va v fi egală cuu 9,5 (d = 455,5 – 36 =
9,5) şi freecvenţa pe inntervalul în care
c se află quota
q va fi egală cu 22. Diin efectuareaa calculelor reezultă:
7 * 9,5 66,5
Q2 = 48++  488   488  3,02  511,02
22 22
Peentru calcularea celui de--al treilea quaartil, care seppară primele 75% dintre rrezultatele subiecţilor
s
de ultimeele 25% din acestea, quoota va fi egală cu 75%, adică a are valooarea 68,25.. Această valoarea se
va găsi înî rubrica fc↑↑ în dreptul intervalului 6 (56 –62). Valoarea supeerioară a inteervalului anteerior celui
în care se
s află quota va fi egală cu c 55 (Xsup.). Diferenţa dintre quotă şii frecvenţa cuumulată asceendent a
intervalului anterior celui
c în caree se află quoota este egaală cu 10,255 (d = 68,255 – 58,00). Frecvenţa
F
intervalului în care see află quota specifică quartilului 3 este egală cu 13. După ce am aflat resspectivele
valori, puutem trece laa calcularea quartilului
q 3.
7 * 10,25 71,775
Q3 = 55 +  55   55  5,51  60,51
13 133
Deeoarece valoorile quartileloor prezintă zeecimale (ele rezultă din innterpolare) pputem să procedăm la
întregire. Prezentăm situaţia rezuultată în tabellul următor.
Nr.crtt. Notare quartille Valoare Întregiree Notare interquartile Limite
1 Q
Q1 42,54 43 I → 434
2 Q
Q2 51.02 51 III 44 – 51
3 Q
Q3 60,51 61 I
III 52 – 61
4 I
IV 62 →
Tabel cuuprinzând exeemplificări peentru valorile şi notările quuartilelor

Prrocedura este identică pentru celelalte variantte ale cuanttilelor. Datelle pentru effectuarea
calculeloor variază în funcţie de mărimea
m valorrilor variabileei şi de dimennsiunea quottei. Se obserrvă foarte
uşor că interquartileele nu sunt egale
e în privvinţa dimenssiunii intervaalelor, ci în pprivinţa numărului de
rezultatee conţinute. De
D exemplu: până la vaaloarea 43 se s găsesc prrimele 25% dintre rezultate, între
valorile 44
4 şi 51 ale variabilei
v se găsesc
g următoarele 25% dintre rezultaate, ş.a.m.d.

Repere biblliografice
Referinţee principale
 Colocotici,
C V Stan, A., 2000,
V., 2 Statisticca aplicată înn psihologie, Editura Polirrom, Iaşi
 Radu, I., Miclea, M., Mooldovan, O., Nemeş,S., Szamoskozyy, S., ”Metoddologia psihoologică şi
a
analiza datellor”, Editura Sincron, Cluuj, 1993.
 Nowak, A., “Metode canttitative în psihologie şi soociologie”, Osscar Print, Buucureşti, 1998
Referinţee suplimentare
 Reuchlin, M., “Precis de statistique”, Presses Universitaires de France, Paaris, 1975
 Rateau, P., “Metodele
“ şi statisticile exxperimentale în ştiinţele umane”,
u Edituura Polirom, Iaşi 2004

154
STATISTICĂ

REPREZENTARE
E EA GRAFICĂ A DATELOR REZ ZULTATE DIN CERCETARE
C
Reprezeentările grafi fice ale rezulltatelor
 Formele de reprezentaree grafică ale distribuţiilor valorilor v unei variabile (distribuţii univvariate, în
c există o singură variabilă care iaa diferite valoori) sunt foartte diversificaate. Ele au meenirea de
care
a vizualiza tendinţele existente în interiorul uneei distribuţii. Prin aceastăă formă graffică unele
t
tendinţe exisstente într-o distribuţie suunt scoase fooarte uşor înn evidenţă. N Noi vom prezenta cele
mai frecventt utilizate forrme de exprimare graficăă. Folosim pentru p exempplificare distrribuţia de
v
valori prezenntată în tabelul anterior.
Reprezeentarea graffică prin colloane
 Prezintă în cadrul unui sistem de axe a rectanguulare intervaalele de disttribuţie pe abscisă şi
f
frecvenţa accestora pe ordonată. Intervalele de d distribuţiee sunt prezzentate prin marcaje
e
echidistante pe axa abssciselor, din care înalţă coloane prroporţionale cu frecvenţaa acestor
intervale. În cazul distribuuţiilor care see referă la seerii de valori temporale, aastfel de reprrezentare
poartă numeele de historioogramă, referindu-se la evoluţia în tim mp a unui fenoomen.
Exemplu u: Să presuppunem, prin intermediul unor u valori im maginare că ne propunem m să exprimăăm grafic
evoluţia delicvenţei juvenile,
j de--a lungul annului 2012, la nivel naţioonal. Datele pe care le avem la
dispoziţiee sunt următoarele:
Nr. Luna Nr.cazzuri Preecizări:
1 Ianuariee 844  Este o serrie cronologică cu mom mente egal distanţate
d
2 Februarrie 988 întree ele. Pentrru reprezentaarea grafică a acesteia se poate
3 Martie 1223 formma historiogrramei, formattă din coloanne cu baza constantă
c
4 Aprilie 788 şi înnălţime variabilă.
5 Mai 888  Pe axa abscciselor se rezzervă un num măr de diviziuni egale
6 Iunie 733 unittăţilor de timpp consideratee; pe axa orddonatelor se stabilesc
7 Iulie 1002 unittăţile de reprrezentare în funcţie de scala folosită pentru
8 August 966 axaa absciselor şi ş de amplituudinea de vaariaţie a caraacteristicii
9 Septembrie 566 care e urmează a fi reprezentate. Armoniaa graficului see asigură
10 Octombbrie 877 în funcţie de amplitudineaa distribuţieii şi de unitatea de
11 Noiembrie 1003 reprezentare pee axa absciseelor.
12 Decembbrie 112
Exem
mplu: - Număărul de coloaane: 12
- Amplitudinea: 1233 - 56+1 = 688;
- Număărul de intervvale: 11
- Distanţa între inteervale: 0,5 cm
m.
Reprezentarea grafică
g sub foormă de histooriograma va arăta în moddul următor:
150 123
98 102 96 103112
100 84 78 88 73
87
56
50

0
ian mar mai
m iul s
sept noiem
O altă formă a reprezentăării grafice prin
p coloane este histograama, în caree coloanele sunt
s lipite
unele dee altele.
S presupuneem că în urrmătorul tabeel avem treccute rezultattele unui lot de subiecţi la testul

Atenţie distributivă Praga,
P prezentate sub forrma intervaleelor de variaţie
   

155
AUREL STAN
T

Nr. Interval Frecvenţa


1 2 - 17 7
2 18-30 14
3 31 -39 18
4 4 - 47
40 25
5 4
48-58 19
6 59 -72 11
7 73- 90 5
H
Histograma see va prezentaa sub felul urrmător:
 Rep
prezentarea grafică sub b forma histo ogramei
25
"2 ‐ 17"
20
"18 ‐ 30""

15 "31 ‐ 39""

"40 ‐ 47""
10
"48 ‐ 58""
5
"59 ‐ 72""
0 "73 ‐ 90""
Rezultate

O altă formă frecvent utilizată de reprrezentare graafică a rezulttatelor este ppoligonul freccvenţelor.
Se pot obţine şi prinn unirea prin segmente dee dreaptă a punctelor
p carre ar reprezeenta frecvenţţa fiecărui
interval, pornind din centrul acesstuia. Rezultaatul unui alt test este exprrimat prin poligonul frecveenţelor.

 Rep prezentarea grafică prin n poligonul frecvenţelor


f r.
Dacă punctele din plaan sunt unitee prin intermeediul unei linii continue obbţinem curba distribuţiei.
25
22
20
Frecventa intervalelor

17
15
13 12
10 1
11

5 6 5
2 3
0
8‐34" "35‐41 "42‐48" "49‐5
"21‐27" "28 55" "56‐62" "63‐69" 70‐76
6" "77‐83"
Intervale d
de variatie

25
22
2
20
Frecventa intervaleor

17
15
13 12
10 11

5 6 5
2 3
0
"21--27" "28-34" "35-41 "42-48" "49-55"" "56-62" "63
3-69" 70-76"" "77-83"
Inttervalele de variatie

156
STATISTICĂ

 Reprezentare grafică sub forma curbei frecvenţelor


Reprezentările grafice ale variabilelor calitative cunosc o serie de particularităţi, determinate de
specificul scalei de măsurare. Astfel, pentru a nu crea iluzia unei forme de distribuţiei (deoarece
modalităţile unei variabile nominale îşi pot schimba locul fără a denatura reprezentarea fenomenului
studiat) se adoptă ca forme de reprezentare grafică diagrama în tronsoane şi diagrama circulară. Pentru
exemplificare, folosim datele tabelului anterior referitor la tipul de studii.

14

43
c

Diagrama prin tronsoane 75


a

a-studii umaniste;b-studii economice;c-studii tehnice

studii tehnice
11%
Diagrama circulară
studii
economice studii umaniste
32% 57%

Grafice privind structura populaţiei. Foarte frecvent, în cercetare avem de exprimat structura
populaţiei sau a eşantionului pe care am realizat un studiu. Avem la dispoziţie următorul exemplu
imaginat referitor la populaţia judeţului Iaşi în două momente temporale diferite:
Tabel cuprinzând structura populaţiei în funcţie de criteriul “Urban – Rural”
Data Total Urbană Rurală
1 ianuarie 1950 517 202 181 210 335 992
I ianuarie 2006 875 417 494 215 380 702
Valori procentuale
1 ianuarie 1950 100% 35% 65%
1 ianuarie 2006 100% 57% 43%
O primă formă de reprezentare este cercul de structură. Se rezervă un cuantum procentual din
suprafaţa cercurilor corespunzător procentului populaţie în cele două momente diferite:
REPREZENTARE PRIN CERCUL DE STRUCTURĂ A DATELOR DIN TABELUL ANTERIOR

57% 43%
35% 65%

1 ianuarie 1950 Legendă: Rural Urban 1 ianuarie 2006

157
AUREL STAN

Pătratul de structură se
REPREZENTAREA GRAFICĂ A DATELOR DIN TABELUL ANTERIOR PRIN FORMA
PĂTRATULUI DE STRUCTURĂ
constituie prin construirea în
interiorul unui pătrat mai mare a
100 de pătrate mai mici care se
35% 57% colorează sau se haşurează diferit
în funcţie de valorile din tabel.
Astfel, în pătratele de mai jos zona
rurală este reprezentată prin 65,
respectiv 43 de pătrate mai mici, iar
65 % cea urbană de 35, respectiv 57
43% pătrate mai mici alăturate unele de
altele.
O reprezentare similară prin
1 ianuarie 1950  1 ianuarie 2006   
intermediul figurilor geometrice se
Legendă:              Rural Urban realizează prin intermediul
dreptunghiului de structură. Din
suprafaţa dreptunghiului se rezervă
un cuantum procentual
corespunzător datelor existente în
tabelul anterior.

Reprezentarea grafică a datelor din tabelul anterior prin


intermediul dreptunghiului de structură

35% 57%

65%

43%

1 ianuarie 1950 Legendă: Rural Urban

REZUMAT
 În mod frecvent în cercetarea ştiinţifică se apelează la exprimarea grafică a datelor
 Este de dorit ca datele reprezentate grafic să fie însoţite de un tabel, care să prezinte şi sursa
datelor
 Formele de reprezentare grafică trebuie să fie adecvate situaţiei de cercetare
 Cele mai frecvente forme de reprezentare grafică în statistica univariată din domeniul psihologic sunt
histograma, poligonul frecvenţelor şi curba frecvenţelor

158
STATISTICĂ

UNITAT
TEA DE ÎN NVĂȚARE 3.3
INDICA
ATORUL ST TATISTIC. PREZENT TAREA SISSTEMULUII DE INDIC
CATORI
STATIS
STICII. IND
DICATORII STATISTIC CI DE NIVE A, MEDIANA, VALOA
EL (MEDIA AREA
MOD) INDICATOR RII STATIS
STICI DE ÎM
MPRĂȘTIE ERE

În activitatea de
d cercetare a unei serii de d date avem m nevoie de expresii num merice precisee care să
descrie condensat
c caaracteristicilee acesteia. Acceste mărimi poartă numeele de indicaatori statistici..

IMPORTANT T
Indicatorul statistic este o mărime cu ajutorul
a căreia se caracteerizează un ffenomen subb raportul
structurii, interdepenndenţelor, şi modificăriloor în timp şi spaţiu. Exxpresia numeerică este leegată de
calitatea fenomenuluui studiat şi, în conseciinţă, indicatoorul statistic este expresia numerică a unei
categorii riguros definite. Din punnct de vederre numeric inndicatorul staatistic poate fi o mărime absolută
(volum, efectiv, totaal) sau o mărime
m derivaata (medie, indice, coeeficient). Indiicatorul statiistic este
rezultatuul unei observvări şi prelucrări statisticee.

În activitatea de
d prelucraree a datelor dinn domeniul psihopedagog
p gic, şi nu nummai din acesta, se fac
raportări la 4 feluri dee indicatori:
1. indicaatori de nivel sau de tendinţă centrală (medie, meddiană, modull);
2. indicaatori de împrăăştiere (amplitudine, abattere quartilă, abatere meddie, varianţă,, abatere standard);
3. indicaatori de asimetrie
4. indicaatori de excees sau de bolttire

Indicatorii dee nivel: med dia. Media exprimă


e nivellul atins de o variabila nnumerică atuunci când
această variabilă estte uniform reepartizată pee unităţile care compun o populaţie ddeterminată. Cuvântul
medie, făără nici o altăă specificaţiee, se foloseştte în accepţiaa de medie aritmetică,
a m
medie fundammentată în
teorie şi comod de utilizat
u în praactică. Alte medii
m uzualee sunt: mediaa armonică, media geom metrica şi
media păătratică. Notaaţia uzuală pentru media aritmetică esste X , dar see pot întâlni şşi alte notaţii.
În sens generral, media trrebuie să saatisfacă anum mite condiţii. În concepţiia marilor statisticieni
englezi George
G Udnyy Yule (1871--1951) şi Maaurice George Kendall (19907-1983) accestea sunt:
 mediee trebuie să fie definită înn mod precis. Această ceerinţă nu poate fi lăsată doar pe seam ma simplei
apreccieri subiectivve a celui carre efectueazăă acţiunea de d observare;
 mediee trebuie sa fie expresia tuturor observaţiilor făcutte. În caz contrar, ea nu poate fi în mod m real o
valoaare tipică a înntregii repartiţţii;
 este de d dorit ca media
m să possede proprietăţi simple şi evidente, făccând posibilăă înţelegereaa sensului
său general.
g O meedie nu trebuuie să aibă un caracter matematic preea abstract;
 este de dorit ca o medie săă poată fi calculată c cu uşurinţă şi rapiditate. D Dintre două medii cu
proprrietăţi asemăănătoare va fif preferata aceeaa care se
s poate calccula mai uşoor. Însă, nu trrebuie să
acorddăm o prea mare
m atenţie uşurinţei
u în calcul
c în detrimentul altor exigenţe;
 este de d dorit ca media
m sa fie afectată
a m puţin de fluctuaţiile dee selecţie. În eşantioanele extrase
cât mai
(eşanntionul are seensul de subbansamblu all unei populaaţii) din aceeaşi populaţiee mediile vorr fi rareori
identiice, iar o formmă anumită de medie pooate conducee la diferenţee mai mari deecât alta. Dinntre doua
formee de medii vaa fi mai bună aceea care prezintă mai multă stabilitate.
 mediee trebuie să poată fi rapidd studiată cu ajutorul calcculului algebric.
În marea majjoritate a caazurilor de cercetările
c psihopedagog
p gice referinţele se fac la media
aritmeticcă, motiv penntru care nu prezentăm
p ceelelalte feluri de medii: media
m geomettrică, media pătratică,
media arrmonică (aveem, desigur, în î vedere şi caracterul
c sim
mplificat al accestui curs).

159
AUREL STAN
T

Reeferindu-ne în î mod speccial la media aritmetică(notată cu X ), adică meddia obţinută ca raport


între summa valorilor observate ale a unei varriabile şi num mărul lor, menţionăm
m caare sunt prooprietăţile
acesteia:
· Dacăă luăm în consideraţie
c diferenţele dintre fiecaare observaţie în parte şi media aritmetică,
a
obseervăm că sum ma algebrică a acestor differenţe va fi egală cu 0;
· Sum ma pătratelor abaterilor reespective esste un minim m pentru ansaamblu de vaalori. Suma pătratelor
p
abatterilor de la fiiecare valoarre individualăă a variabilei şi media arittmetică este mai mică deecât suma
abatterilor ridicatee la pătrat în jurul oricăreii alte valori înn afară de meedia aritmeticcă;

Nr.crt. X x=X- X x2 X-15 (X-155)2 X-199 (X-19)2


1 111 -6 36 -4 166 -8 64
2 155 -2 4 0 0 -4 16
3 155 -2 4 0 0 -4 16
4 199 2 4 4 166 0 0
5 222 5 25 7 499 3 9
6 211 4 16 6 366 2 4
7 177 0 0 2 4 -2 4
8 122 -5 25 -33 9 -7 49
9 177 0 0 2 4 -2 4
10 199 2 4 4 166 0 0
11 188 1 1 3 9 1 1
Tottal 187 0 1199 21 1559 -7 159
Tabelul cuprinzând
c c
compararea s
sumei deviaţţiei valorilor de
d la medie în comparaţţie cu suma deviaţiilor
d
de la altee valori(media este egală cu 17)

Voolumul sau efectivul aceestei distribuuţii este 11. Media o afflăm prin divvizarea sumeei tuturor
valorilor individuale (187) la 11, reezultatul fiindd 17. Prin x se notează deeviaţiile fiecăărei valori de la medie,
motiv peentru care valloarea obţinuută se numeşşte valoare de deviaţie.
În tabel se observa clar căă suma pătraatelor diferennţei de la alttă valoare deecât media aritmetică
a
este o vaaloare mai mare
m decât suuma pătrateloor abaterilor de d la media aritmetică.
a
Asstfel, din conssultarea tabeelului rezultă::
 x <  X  15 ;  x 2 <  X  15 :  x 2 <  X  19
2 2

IMPORTANT T
Foolosirea meddiei în prelucrarea statistică a datelor din domeniuul psihopedaagogiei este frecventă
în trei tippuri de situaţii, din care unnele pot fi rezzolvate prin folosirea
f meddianei şi a moodulului:
 Situaaţia în care se pune prooblema de a aprecia o observaţie o înntr-o distribuţie. Exempluu: O notă
poatte fi apreciaată ca supeerioară sau inferioară mediei. m În general,
g se precizează această
consstatare.
 Situaaţia în care se s compară un grup de observaţii
o cu un altul. Exxemplu: Într-uun proces dee învăţare
caree comportă o serie de încercări successive pot să fiie lăsate inteervale de timpp (învăţare distribuită)
d
sau nu (învăţaree masată). See constată, în î general căă rezultatul unui
u grup dee subiecţi în învăţarea
î
distrribuită este superior rezzultatului în învăţarea masată. m Daccă cineva coonsideră că această
diferrenţă este preea mare penntru a putea să s se explicee doar prin vaariaţii fortuitee, aceasta va conduce
la o explicaţie pssihologică;
 Situaaţia în care seriile
s de datte provin de la o sursă dee variaţie sisstematică sauu de la mai multe.
m Se
poatte calcula valloarea mediee asociată la fiecare din stăriles acesteei surse Aceaastă medie peermite de

160
STATISTICĂ

a descompune variaţiile observate în mai multe abateri (care se numesc "efecte") şi de a analiza
astfel importanţa relativă a diferitelor surse sistematice sau fortuite. Posibilitatea unei astfel de
analize este esenţială pentru explicarea fenomenelor observate.

CALCULUL MEDIEI ARITMETICE

Avem trei situaţii diferite în procedura de calcul a mediei aritmetice:


1. situaţia în care variabilele sunt negrupate;
2. situaţia în care variabilele sunt grupate pe variante de variaţie;
3. situaţia în care variabilele sunt grupate pe intervale de variaţie.
În cazul în care variabilele sunt negrupate se adiţionează toate valorile variabilei şi rezultatul final
se împarte la efectivul total al observaţiilor. Să presupunem că în urma efectuării unui experiment
privind timpul de reacţie intra-individual am obţinut următoarele rezultate: ale variabilei (notată de noi cu
X) “timp de reacţie intraindividual”: 21, 24, 28, 31, 17, 20, 22, 16, 18, 27, 22, 19, 26, 29, 30. În total
avem 15 observaţii succesive efectuate pe aceeaşi persoană. În acest caz media se calculează prin

următoarea formulă: în care X este notarea mediei aritmetice, ∑ este suma valorilor
individuale ale variabilei X şi N exprimă numărul total de observaţii sau efectivul distribuţiei. În cazul

nostru concret: 23,3. Litera grecească Σ are sensul de sumă. Formula pentru date
negrupate se practică în situaţia în care avem puţine date la dispoziţie. În cazul în care numărul valorilor
unei variabile devine mare, este necesară operaţiunea de grupare a datelor. Să presupunem că pentru
aceeaşi situaţie experimentală am cules date de Nr.crt. X F fX
ordinul sutelor şi am procedat la o grupare a lor 1 16 5 90
conform tabelului. 2 17 11 187
În acest caz, formula pentru calculul 3 18 17 306

mediei este următoarea în care X este 4 19 24 456
variabila ordonată pe variante de variaţie, f 5 20 30 600
frecvenţa variantelor de variaţie şi N este 6 21 35 735
volumul observaţiilor sau efectivul total al 7 22 38 836
acestora. N =  fX  302 Litera grecească Σ 8 23 32 736
(sigma) are sensul “sumă de”. Pentru exemplul 9 24 28 672
nostru concret obţinem: 23,25 . 10 25 20 500
11 26 18 668
În cazul în care avem la dispoziţie un
12 27 16 432
număr mare de date şi de variante de variaţie
13 28 13 364
(şi seriile de valori au o amplitudine de variaţie
mare) folosim gruparea datelor prin intermediul 14 29 9 261
intervalelor de variaţie şi o formulă specifică 15 30 6 180
pentru medie. N = 302  fX  7023
Tabel exemplificativ pentru modul de calcul al mediei
aritmetice în cazul grupării datelor pe variante de variaţie

EXEMPLU
Să presupunea că în urma efectuării unui examen psihologic în care am folosit şi o probă de
atenţie (foarte rar un examen psihologic se reduce la o singura probă, de cele mai multe ori se foloseşte
în cursul unui astfel de examen un ansamblu de procedee de investigaţie) rezultatele au fost grupate,
aşa cum se prezintă în tabelul care urmează. Precizăm că în acest tabel am trecut date care sunt
necesare pentru aplicarea a două formule diferite de calcul. În una din formule folosim frecvenţele

161
AUREL STAN
T

înmulţitee cu centrul intervalului notelor


n brute,, iar în alta folosim
f variabila codificattă u, variabilă a cărei
intervenţţie este justificată de com
moditatea în operaţiile
o de calcul.
c

Nr.crt Inntervalul Xi f fXI u Fu


1 2 - 31
27 29 7 203 -3 -21
2 3 - 36
32 34 13 442 -2 -26
3 3 - 41
37 39 20 780 -1 -20
4 4 - 46
42 44 27 1188 0 0
5 4 - 51
47 49 25 1225 1 25
6 5 - 57
52 54 17 918 2 34
7 5 - 62
56 59 9 531 3 27
Σf = N = 118 ΣfXi = 52887 Σfu = 19
Tabelul exemplificati
e iv pentru modul de calcul al mediei aritmetice
a în cazul grupărrii datelor pe intervale
de variaţţie

În cazul folossirii primei variante de calcul


c anunţaate a medieei aritmetice aplicăm urm mătoarea

formulă: X =
 fXX i . În cazul de faţă f reprezintă frrecvenţa pe interval, Xi desemneazză centrul
N
intervalului (i variazăă de la 1 laa 7, număruul total al inntervalelor) şi
ş N număruul total al reezultatelor
5287
subiecţiloor (N=118). Prin aplicareea formulei rezultă:
r X =  44,8 , în care 55287 reprezinntă suma
118
produsellor dintre ceentrele intervvalelor şi freecvenţelor accestora, iar 118 număruul total al reezultatelor
subiecţiloor sau efectivvul total.

IMPORTANT T
Atragem atenţia asuupra faptuluii că o asem menea formuulă aproximeează valoareea mediei aritmetice.
a
Această aproximaree poate fi accceptată în cazul în caare variabilele sunt repaartizate armonios pe
lungimeaa intervalului. Dacă în inteervalul 1 (27––31) vom avea valorile 277,28,29,29,29,30,31 atunnci centrul
intervalului este reprrezentativ pentru acesta, dar dacă voom avea în acest a intervall 7 valori de 27 sau 7
valori dee 31 centrul inntervalului dee variaţie nu mai îndeplineşte aceastăă condiţie. Caa atare, acesst mod de
calcul nuu se recomanndă în situaţiaa în care disttribuţiile valorilor prezintă asimetrii putternice.

Reealizarea rubbricii variabileei codificate u, utilizată în


î cel de-al doilea proceedeu de calccul pentru
variabile ordonate pe p intervale de variaţie, presupune fixarea în dreptul unui interval a vaalorii 0 a
variabilei codificate. Această fixaare este arbittrară, însă, de d regulă, see realizează în dreptul inntervalului
modal, adică
a în drepptul acelui innterval care are
a frecvenţaa cea mai mare. m În cazuul exemplificat de noi
acest intterval poartăă numărul curent 4 (42–446) Valoarea centrală a acestui a intervval va fi o vaaloare de
referinţă şi o vom noota cu A. În cazul nostruu A = 44. Vaalorile coloanei u se stabilesc prin îm mpărţirea
diferenţeei dintre valoarea variabillă Xi şi consstanta A la mărimea
m intervalului (i). U
Urmând proccedura de
39  44 34  44 2  44
29
calcul voom obţine: -1=- , -2 = , -3 = ş.a.mm.d. Pentru valorile mai mici ale
5 5 5
variabilei XI decât constanta
c A se
s obţin valoori negative alea variabileii codificate uu, şi pentru valori
v mai
mari ale variabilei Xi decât
d constaanta A se obţţin valori pozzitive ale variaabilei codificaate u. În cazul folosirii
în calcul al variabilei codificate u, formula de calcul
c va fi urrmătoarea:
i *  fu
X = A ,
N

162
STATISTICĂ

în care A este o connstantă egalăă cu mărimeea centrului intervalului


i p
pentru care vvariabila u = 0, i este
mărimeaa unui intervaal, fu este proodusul din freecvenţa intervvalului şi variabila codificaată u, f este frecvenţa
simplă unui interval şi
ş u variabila codificată.
5 * 19
Prrin aplicarea formulei obţiinem X = 444  = 44,8.
118

IMPORTANT T
Faacem încă o dată precizarea că aceste procedurri de calcul fac f posibilă apariţia uneii anumite
erori, erooare datoratăă faptului că se lucrează cu mărimi dee reprezentaare. Astfel, ceentrul intervaalului este
considerrat reprezenttativ pentru întregul
î interrval, situaţie care antrennează erori m mari în cazuul în care
distribuţia valorilor are
a asimetrii accentuate,, de stânga sau de dreapta. În aceest caz se impune o
operaţiunne de micşorrare a mărim mii intervaluluii până la limite care asiguura o marja dde eroare accceptabilă.
Cea mai corectă moddalitate de caalcul a medieei este cea reezultată din adiţia
a variabilelor brute si divizarea
sumei accestor variabbile brute la numărul
n de observaţii. Preezenţa unor instalaţii
i de ccalcul electroonic, chiar
mai puţinn performantte, fac din calculul mediiloor, si nu numai a lor, o opperaţiune bannală, executaată într-un
timp extrrem de scurt..

Prroblema calccului mediiloor se pune şiş in cazul analizei


a de itemi.
i Itemul este o com mponentă
informaţiională elemeentară a unui test sau cheestionar psihoologic, care se
s prezintă ddihotomic din punct de
vedere cantitativ
c în cea
c mai maree parte din caazuri. Analizaa de itemi esste o operaţiuune strict necesară în
cazul în care dorim săs ne asigurrăm de faptul că testul îndeplineşte o serie de exiigenţe funcţioonale. Să
luăm douuă exemple (fictive)
( de modalităţi
m de prezentare
p a itemilor unorr probe psihoologice.

Itemiii testului A Itemii testului B


Nr.crt.. Nr.crt.
N
1 2 3 4 1 2 3 4
1 0 1 0 0 1 2 5 4 4
2 1 1 1 0 2 3 1 4 2
3 1 1 0 1 3 1 1 2 1
4 0 0 1 1 4 1 3 2 4
5 1 0 0 0 5 2 5 4 1
6 1 0 0 0 6 3 2 4 4
7 0 1 0 1 7 1 3 1 2
8 1 0 1 1 8 2 2 3 3
9 1 1 0 0 9 3 4 5 4
10 1 0 1 1 10 3 2 4 4
11 0 1 0 0 11 2 1 4 3
fi 7 6 4 5 fI 233 29 37 36
pi 0,63 0,54 0,,36 0,45 pi 0,441 0,52 0,67 0,65
qi 0,37 0,46 0,,64 0,55 qi 0,559 0,48 0,33 0,33
Tabel exxemplificativ pentru moduul de calcul al
a mediei item
milor

În cazul primuului exemplu (testul A) avvem situaţia de examen a 11 subiecţţi la un test cu c 4 itemi
(exempluul este teorettic, deoarecee un test trebbuie sa aibă cel
c puţin 20 itemi pentru a putea fi nuumit test).
Acest mod de organizare a rezultatelor obţinnute de un grup de subieecţi la un tesst psihologic (subiecţi-
itemi) see numeşte matricea
m lui Stern,
S de la numele psihologului geerman Wilhellm Louis Steern(1871-
1938). Laa fiecare item
m din cadrul testului
t A se pot obţine vaalorile 1 (cazz în care exprrimă soluţia corectă
c la
o situaţiee problematică sau răspuuns la un chhestionar de personalitatee care pune în evidenţă trăsătura

163
AUREL STAN

psihică ce trebuie diagnosticată) sau 0 (caz în care exprimă soluţia incorectă sau răspuns care nu pune
în evidenţă trăsătura psihică cercetată). La testul B răspunsurile la itemi au o distribuţie cantitativă
polihotomică, notele variind între 1 şi 5 (situaţie întâlnită mai ales la chestionarele de atitudini)
În cazul testului A, notaţia fi indică punctajul total obţinut de toţi subiecţii la itemul 1 notaţia pi
proporţia de răspunsuri corecte şi totodată media răspunsurilor corecte la itemi (i-ul variază între 1 şi 4,
deci, vom avea f1,f2,f3,f4, respectiv p1,p2,p3,p4,). În acest notaţia pi exprimă indicele de dificultate şi,
f
totodată, media rezultatelor ansamblului subiecţilor la itemi. Deci pi= i (în care notaţia N exprimă
N
numărul total al subiecţilor). În cazul testului B pi exprimă indicele de dificultate a itemului, dar nu şi
media rezultatelor ansamblului subiecţilor la itemi. La testul B, valoarea pi se obţine prin împărţirea
valorii totale a punctajului obţinut la un anumit item de către cei 11 subiecţi la valoarea maximală pe
fi
care ar fi putut-o obţine cei 11 subiecţii la un anumit item. În acest caz, pi = . În cazul dat de noi
f i max
ca exemplu, la testul B, valoarea fI max = 55, obţinută prin înmulţirea valorii 5 (valoare maximă pe care
ar fi putut să o obţină un subiect pentru un răspuns) cu 11 (numărul total al subiecţilor). De exemplu, la
23
testul B, p1=  0,40 . Pentru media itemilor din testul B se va folosi altă notaţie, conform unei uzanţe
55
de notare.

STABILIREA MEDIANEI

Mediana, numită şi valoare mijlocie, este o valoare caracteristică reală (concretă) a unei
distribuţii, sau rezultând în urma unei operaţii de interpolare, care împarte valorile ordonate crescător
sau descrescător în două părţi egale, în aşa fel încât numărul valorilor mai mari să fie egal cu numărul
valorilor mai mici decât mediana. Mediana poate fi stabilită intr-o serie de date ordonate crescător sau
descrescător. În cadrul unui şir impar de valori, mediana este valoarea unei variante concrete a
distribuţiei, şi anume valoarea cu rangul n+1/2. Pentru mediană folosim notaţia Me.

EXEMPLU
În distribuţia 1,2,3,5,7,9,10,12,13,14,18 avem un total de 11 valori ale variabilei X.. Dacă valorile
ar fi fost trecute în ordinea 7,1,13,18,2,10,5,3,9,12,14 ar fi trebuit să le ordonăm crescător. Deci, prima
operaţiune necesară pentru calculul medianei este ordonarea valorilor. Mediana va avea valoarea cu
N 1 11  1
rangul . În exemplul nostru, mediana va avea rangul  6 , deci a 6-a valoare din şirul
2 2
ordonat crescător, valoare egală cu 9. În stânga valorii 9 se găsesc 5 valori mai mici (1,2,3,5,7) şi în
dreapta 5 valori mai mari (10,12,13,14,18).
În cazul în care seria are un număr par valori, medianei se obţine prin interpolare, situându-se
N N 2
între valoarea cu rangul şi valoarea cu rangul . Exemplu: în distribuţia
2 2
8
17,18,22,24,28,30.35.37 (N=8) valoarea medianei se va situa între valorile rangurilor 4   şi 5
2
8  2
 2  . În cazuri de acest gen valoarea medianei va fi media aritmetică a valorilor variabilei care au
24  28
rangurile 4 şi 5, deci, Me =  26 .
2

164
STATISTICĂ

În cazul unei distribuţii de frecvenţe pe variante de variaţie meediana poatee avea o sem
mnificaţie
mai puţinn clară, situaţie cauzată de
d modul de determinare.
d .

Nr.crt. X F fc↑↑ fc↑% Tabel exxemplificativ pentru modul


m de
1 5 10 10 0,07 (77%) orrganizare a datelor ppentru deteerminarea
2 6 15 25 0,17 (17%) medianei
3 7 2
20 45 0,30 (330%)
4 8 3
30 75 0,51 (551%) În tabelul alăturat aam realizat ordonarea
o
5 9 2
20 95 0,64 (664%) pee variante ded variaţie a unei variabile care
6 10 15 110 0,74 (883%) cuuprinde 148 de rezultatee la o anumită probă
7 11 13 123 0,83 (883%) pssihologică. Tabelul cuprinde rubricile:
8 12 11 1344 0,91 (991%) vaariantele variiabilei (X), frrecvenţele vaariantelor
9 13 9 143 0,97 (997%) dee variaţie (f),, frecvenţele cumulate ascendent
a
10 14 5 148 1,00 (100%) (fcc↓) şi frecvennţele relativee cumulate ascendent
a
(fcc↓%). Valoarea medianeei trebuie săă separe
N==148
prrimii 50% din d subiecţi de următoorii 50%.
Valoareaa mediana este e consideerata cea coorespunzătoaare procentuului frecvenţeei relative cumulate
ascendeent mai aproopiată de vaaloarea 50%, de în caazul nostru valoarea v 8 ((în dreptul frecvenţei
f
cumulatee ascendentt egală cu 75. 7 Observăm m pe rubrica frecvenţei relative cum mulate ascendent că
această valoare se află la variaanta de variaţie cu num mărul curent 4. Valoareaa 8 este considerată
medianaa acestei disstribuţii, dar această
a stabbilire se facee prin accepptarea unui ccompromis, deoarece
avem 300 de valori 8 ale variabileei X. Practic, avem 35 dee valori mai mici decât 8 (10+15+20)) şi 73 de
valori mai mari (20++15+13+11+9+5). Comppromisul constă în faptul de a acceepta şi valoaarea 8 în
calculareea primelor 50% din vaalori şi urm mătoarelor 500% din acesstea. În senns strict o astfel de
determinnare poate săă nu corespuunda definiţieei medianei după care num mărul valorilee mai mici şi mai mari
decât eaa să fie egalee între ele.

DETERMINAREAA VALORII MODD

Vaaloarea modd sau modul este valoarrea variabileei cu frecvennţa cea mai mare în caadrul unei
distribuţii. Vom nota acest indicaator statistic prin Mo. Să luăm, de exxemplu, următoarea distrribuţie de
valori: 111,17,13,12,177,9,8,17,14,119,20,17,15,116,14,18. Duupă ce ordonnăm această distribuţie (88,9,11,12,
13,14,144,15,16,17,177,17,17,18,199,20) observvăm că valooarea 17 esste cea mai frecventă în î cadrul
acestei distribuţii,
d eaa repetându-sse de 4 ori. În acest cazz, valoarea variabilei
v egaală cu 17 vaa constitui
valoareaa mod a distribuţiei sau modul
m acesteia. Există cazzuri când întrr-o distribuţiee, două sau mai
m multe
valori auu frecvenţa cea
c mai maree. Distribuţiile vor numitee, în aceastăă situaţie, multimodale (bbimodale,
când douuă valori au frecvenţele cele mai maari, trimodale când trei vaalori au frecvvenţele cele mai mari,
ş.a.m.d.)). De exemplu, distribuţiaa formată dinn valorile ordoonate 4,5,6,77,7,7,8,9,9,9,,10,11 este bimodală,
b
deoarecee avem douăă valori ale variabilei
v cu frecvenţe maaxime, valoriile 7 şi 9. Muultimodalitateea indică,
de obiceei, o eterogennitate valoricăă a subiecţiloor supuşi unuui examen, daar, mai pot exxista şi alte explicaţii.
e

ÎNTREBĂ ĂRI
 Care este deosebbirea între meedie şi mediaană?
 Care este deosebbirea între meediană şi valooare mod?
 Ce esste un item?

165
AUREL STAN
T

Repere bibliograficee
principale
 Clocotici,
C V., Stan, A., 20000, Statisticaa aplicată în psihologie, Editura
E Poliroom, Iaşi
 Milton-Smith, G., “Ghid simplificat de statistică pentru pssihologie şi pedagogie”, Editura
d
didactică şi pedagogică,
p Bucureşti, 19971
 Nowak, A., “Metode canttitative în psihologie şi soociologie”, Osscar Print, Buucureşti, 1998
 Vasilescu,
V I.P. “Statisticăă informatizaată pentru ştiinţele despree om”, Editura Militară, Bucureşti,
B
1991.
suplimenntare
 Reuchlin, M., “Precis de statistique”,
s P
Presses Univversitaires dee France, Paris, 1975
 Rateau, P., “Metodele
“ şi statisticile exxperimentale în ştiinţele umane”,
u Edituura Polirom, Iaşi 2004

Indicatorii de măsură a îmmprăştierii freecvent utilizaaţi în analizaa statistică a datelor din domeniu
psihopeddagogic (şi nu numai din acest domenniu) sunt:
 amplitudineaa;
 varianţa;
 abaterea staandard;
 abaterea meedie;
 abaterea quuartila sau ammplitudinea semiinterquarrtilă.

IMPORTANT T
Indicatorrii de măsurră a împrăşştierii trebuiee să satisfaccă condiţii similare
s cu ccele enunţatte pentru
indicatorrii de măsurăă a localizării sau indicatorii de nivel:
 să see bazeze pe toate
t observaaţiile;
 să fiee uşor de calcculat;
 să fiee afectate câtt mai puţin poosibil de flucttuaţiile de selecţie şi adeccvate unui studiu algebricc.

Ceea mai simpllă măsură a împrăştierii estee amplituddinea, care se obţine prinn efectuarea diferenţei
dintre ceea mai mare şi cea mai mică
m valoare observată la care se adaaugă valoareaa 1. Obiecţii cu privire
la folosirrea amplitudinii există în situaţii în care
c viteza de calcul şi simplitatea
s înn interpretaree nu sunt
cerinţe immportante. Amplitudinea
A este afectatăă de fluctuaţiiile de selecţie mari de laa eşantion la eşantion.
Notăm amplitudinea
a cu A. Să luăm exemplul timpului de rezolvare
r a unei
u sarcini: 555, 56, 65, 544, 66, 58,
62, 61,12,56,68,67,559,57,60,1455 (exprimat în î zecimi dee secundă). În acest caaz, avem dooua valori
extreme,, foarte puterrnic distanţatte de restul valorilor,
v şi annume valorilee 12 si 145, ccare aparţin, probabil,
în primuul caz unui supradotat,
s iaar în al doileea unui hipoofren (denum mire folosită pentru a deesemna o
persoanăă cu randam ment intelectual de limită).. Dacă valorile de acest gen g sunt intr--un număr fooarte mic,
se pot elimina pracctic din opeeraţiunile de grupare. Dacă D la dateele amintite am efectuaa calculul
amplitudinii, vom găssi o valoare de d câteva ori mai mare decât d în cazuul în care le eeliminăm din calculele
noastre. În primul cazz, amplitudinnea se calculează în modul următor: Xmax – Xmin +1=145 – 12 + 1= 134.
În cazul eliminării vaalorilor puternnic distanţatee, avem: A = Xmax – Xmin + 1 = 68 ––54 + 1 = 15. Ultima
determinnare a amplittudinii este evident
e mai realistă, deooarece este amplitudineaa care caraccterizează
majoritattea datelor. Amplitudinea
A a nu ţine contt de forma reepartiţiei, deooarece între limitele de variaţie
v se
poate obbţine aceeaşi valoare penntru amplituddinea unei cuurbe de frecvvente simetrice sau unei curbe de
frecvenţee în formă dee J, I sau U.

166
STATISTICĂ

Abaterea medie este media aritmetică a abaterilor valorilor individuale ale variabilei X faţă de
media aritmetică a valorilor distribuţiei luate în valoarea absolută. Vom nota acest indicator de
împrăştiere cu AM. Pentru distribuţii negrupate vom utiliza următoarea formulă pentru calculul abaterii

medii: AM. =
 X  X , în care cu X se notează variabila, cu X media distribuţiei şi cu N numărul
N
total al valorilor variabilei. Dacă vom nota cu x diferenţa X - X , vom avea următoarea formulă pentru

calculul abaterii medii pentru date negrupate: AM =


 x . Variabila x se numeşte variabilă de
N
deviaţie. În cazul în care avem variabilele grupate pe variante de variaţie, vom utiliza următoarele

formule: AM =
 f X  X sau AM =  f x , în care cu f se notează frecvenţa variantei de variaţie
N N
Prezentăm, în continuare, tabelele care se întocmesc pentru evidenţierea etapelor calculării abaterii
medii pentru variabile negrupate (şi neordonate) şi pentru variabile grupate de variante de variaţie.
Exemplele cuprind valori diferite:
Variabile negrupate ( şi neordonate) Variabile grupate pe variante de variaţie
Nr.crt. X x (X- X ) x Nr.crt. X f FX x fx fx
1 12 -4 4 1 14 3 42 -8 - 24 24
2 13 -3 3 2 16 6 96 -6 - 36 36
3 19 3 3 3 19 9 171 -3 - 27 27
4 20 4 4 4 21 13 273 -1 - 13 13
5 14 -2 2 5 23 17 391 1 17 17
6 16 0 0 6 24 12 288 2 24 24
7 15 -1 1 7 25 9 225 3 27 27
8 17 1 1 8 26 5 130 4 20 20
9 18 2 2 9 28 2 56 6 12 12
 144 0 20 76 1672 0 200
Tabelul cuprinzând etapele de calcul pentru determinarea abaterii medii

În tabelul din stânga s-au făcut următoarele notaţii în coloane:


 X – valorile variabilei;
 x – valorile variabilei de deviaţie;
 x - valorile variabilei de deviaţie în valoarea absolută.
Valoarea medie pentru valorile tabelului cu variabile negrupate se obţine prin aplicarea formulei

anunţate anterior: X 
 X  144  16 . Rubrica x se obţine scăzând din valoarea mediei distribuţiei
N 9
valoarea variabilei. Astfel, prima valoarea din rubrica x, egală cu – 4, se obţine efectuând scăderea
12-16, a doua valoarea, egală cu –3, se obţine efectuând scăderea 13 - 16, ş.a.m.d. Se observă uşor
faptul că suma abaterilor variabilelor de la medie este egală cu 0. Abaterea medie se poate calcula
doar prin adiţia valorilor absolute care sunt trecute în rubrica notată cu x . Suma valorilor absolute a
deviaţiilor de la medie este egală cu 20. După ce aflăm această valoare putem trece la aplicarea

formulei pentru calculul abaterii medii. AM=


 x  20  2,22 .
N 9
În tabelul din dreapta s-au făcut următoarele notaţii în coloane:
 X - valorile variantelor de variaţie;
 f - Frecvenţele variantelor de variaţie;

167
AUREL STAN
T

 fX - valorile proddusului dintree variantele de


d variaţie şi frecvenţele acestora;
 x - valoarea vaariabilei de deviaţie;
 fx - valorile produsului dintre variabila de deviaţie şi frrecvenţa variantelor de vaariaţie;
 f x - valorile proddusului dintree variabila dee deviaţie în valoare abssolută şi frecvvenţele variaantelor de
variaaţie.
În acest tabel  f  N  76
7 , deci avem în total 766 de valori alee variabilei X (care sunt grupate
g în
9 variante de variaţiie). Pentru a trece la caalculul abaterii medii trebbuie să calcuulăm, în prim
mul rând,
media arritmetică.

X
 fX   1672  22 . În tabelul din
d dreapta suma
s de la rubrica
r Σfx eeste egală cu
c 0 şi nu
N 76
cea de la rubrica Σxx, din cauzaa existenţei frecvenţelor
f pentru variaantele de varriaţie. Pentruu calculul
abaterii medii
m m suma de laa rubrica f x care este egală
folosim e cu 2000. După calccularea acesstor valori

putem treece la calculul abaterii medii. AM =


 f x   2000  2,63
N 766
Vaarianţa şi abbaterea standdard se găseesc într-o strânsă legătuura una cu aalta. Valoareaa abaterii
standardd se obţine prin extrageerea rădăciniii pătrate dinn valoarea varianţei.v Acceşti doi indicatori de
împrăştieere sunt foarrte frecvent utilizaţi
u în demmersurile anaalizei statisticce în toate doomeniile de activitate.
a
Varianţa sau disperssia este un indicator
i sinttetic care prrezintă o impportanţă acceentuată, deooarece cu
ajutorul ei se studiaază influenţa factorilor caare acţioneaază în cadrul mulţimilor de date. Vaarianţa se
calculeazză ca medie aritmetică a pătratelor abaterilor
a valoorilor individuuale ale unei variabile de la media
lor aritm
metică. Ream mintim faptul că suma accestor abaterri este egalăă cu 0, motivv pentru carre fiecare
valoare individuală a abaterii se ridică la pătraat înaintea opperaţiei de addiţie.
Voom nota varianţa unei disstribuţii prin s2 şi abatereea standard prin s. Form mula pentru calcularea
c

varianţei sau disperssiei pentru valori


v negruppate ale uneei variabile este:e s2 =
 x . Coresspunzător
2

N
explicaţiiilor anterioaare, formula abaterii staandard penttru acelaşi fel f de valorri ale variabbilei este

următoarea: s =
 x2
.
N

IMPORTANT T
Riidicarea la pătrat
p nu trebuie considderată un procedeu
p arttificial, deoarece simpla suma a
abateriloor de la meddie ar da în mod automaat zero. Ridiccarea la pătrrat este cel mai simplu procedeu
pentru a asigura dattelor acelaşi semn. Ca şi alte calculee ale indicatoorilor statisticci avem cazuul datelor
negrupatte şi cazul daatelor grupatee.

Ruubricile neceesare calculullui le prezenttăm în tabeluul care urmeaază:


Nr. crt. X x x2
1 11 -6 36
2 14 -3 9
3 16 -1 1
4 18 1 1
5 20 3 9
6 22 5 25

168
STATISTICĂ

7 17 0 0
8 18 1 1 Tabel cuprinzând etapele de clacul pentru
9 15 -2 4 determinarea varianţei şi abaterii standard (date negrupate)
10 19 2 4
În primul rând se calculează media cu formula
 170 0 90
specifică datelor negrupate: X 
 X  170  10,00 .
N 10
După ce am calculat valoarea mediei trecem la completarea rubricii x, care se obţine din
efectuarea diferenţei dintre fiecare valoare individuală a variabilei X şi valoarea mediei aritmetice (
X  10,00 ). Apoi trecem la realizarea rubricii x2 prin ridicarea la pătrat a fiecărei valori din rubrica x.
După ce am însumat valorile din rubrica x2 (Σx2 = 90), putem trece la calcularea varianţei şi a abaterii

standard s 2  x 2 90
  9,00 şi s   x2

90
 9  3.
N 10 N 10
În cazul în care avem date grupate pe variante de variaţie, se întocmeşte tabelul (date fictive):
Date grupate pe variante de variaţie
Nr.crt X f fX x x2 fx2
1 17 2 34 - 5,23 27,35 57,71
2 19 5 95 - 3,23 10,43 52,16
3 20 9 180 - 2,23 4,97 44,76
4 21 13 273 - 1,23 1,51 19,67
5 22 18 396 - 0,23 0,05 0,95
6 23 12 276 0,77 0,59 7,11
7 24 10 240 1,77 3,13 31,33
8 26 6 156 3,77 14,21 85,28 Tabel cuprinzând etapele de clacul
9 28 3 84 5,77 33,29 99,88 pentru determinarea varianţei şi
abaterii standard (date grupate pe
Σ 78 1734 395,85
variante de variaţie)

Explicaţia rubricilor a fost dată la tabelele constituite anterior. Avem un total de 78 de valori.

Aplicăm formula pentru calcularea mediei: X 


 fX   1734  22,23 Rubrica x se constituie prin
N N
scăderea valorii 22,23 din valorile variantelor de variaţie. Din aplicarea formulei pentru calcularea

varianţei rezultă: s =
2   fx 2

395,85
 5,075. Abaterea standard se obţine prin extragerea rădăcinii
N 78
pătrate din valoarea varianţei.
s = s 2  5,075  2,25
Pentru calcularea varianţei şi abaterii standard în condiţiile existenţei unei distribuţii de valori pe
intervale de variaţie avem la dispoziţie formule care utilizează variabila codificată u. Utilizarea unor
astfel de variabile asigură în calcul valori numerice relativ mici. Formula pentru calcularea varianţei este:
 fu 2   fu   2 
s2 = i2* 
      . Pentru calcularea abaterii standard putem în aplicare următoarea
 N  N  
   

formulă: s = i*

   
fu 2   fu   
  
2 

. Se observă clar că valoarea abaterii standard care se va


 N  N  
   
obţine este rădăcină pătrată din valoarea varianţei.

169
AUREL STAN
T

Offerim pentru exemplificare următoareaa grupare pee intervale dee variaţie:

Valori grupate pe intervale


i de variaţie
v
Nrr.crt Intervval (i = 5) F u fu u2 Fu2
1 199 – 23 9 - 3 - 27 9 81
2 244 – 28 13 - 2 - 26 4 52
3 299 – 33 19 - 1 - 19 1 19
4 344 – 38 24 0 0 0 0
5 399 – 43 20 1 20 1 20
6 444 – 48 14 2 28 4 56
7 499 - 53 10 3 30 9 90
Σ 109 6 318
Tabel cuuprinzând etaapele de claccul pentru deeterminarea varianţei şi abaterii
a standdard (date grrupate pe
intervalee de variaţie)

Amm explicat anterior


a modul cum se stabilesc
s valorile variabillei u. În aceest exemplu am fixat
arbitrar valoarea
v u = 0 în dreptuul intervalului modal, adiccă intervalul care are ceaa mai mare frecvenţă
(intervaluul 34 –38, caare are frecveenţa 24). Prinn i am notat mărimea
m intervalului (i = 55).
Applicând formuula varianţei vom obţine:
 318  6  2 
s = 255 
2     252,91  0,003  72,5. Abaaterea standdard o obţinnem prin exxtragerea
 108  1008  
rădăcinii pătrate din această
a valoare. s = 722,5 = 8,51 ( prin
p aproximaare 8,5).

STABILIREA
T ABA
ATERII QUART
TILE

Abbaterea quarrtillă, notată cu


c Q, este un u indicator de
d apreciere a împrăştierrii, care se caalculează
prin împărţirea la 2 a diferenţei dintre
d valoareea quartilului 3 (Q3) şi ceea a quartilului 1 (Q1). Inntervalul (
X  1Q ) cuprinde 50% din rezultatele unei distribuţii.
d Am
mplitudinea unei
u distribuţţii are aproximativ 7,5
abateri quartile.
q Relaaţia se verifiică mai aless în situaţia în care distribuţia empirică se confformează
exigenţeelor teoretice unei distribuuţii normale Gauss-Lapla
G ce. Se poatee efectua o ggradare pe curbă
c prin
folosireaa medianei şi ş abaterii quuartile, aşa cumc s-a făcuut cu media şi abaterea standard. Oferim
O un
exemplu concret penntru calculareea abaterii quuartile. Să prresupunem că c media uneei distribuţii este egală
74, quarrtilul 3 (Q3) este egal cu c 85 şi quaartilul 1 (Q1) este egal cu 62. Num mărul de rezuultate ale
subiecţiloor este egal cu 186 (N = 186) Modull de stabilire a acestor foorme particulare a quantilelor l-am
tratat antterior. După aflarea celorr două valori, putem trecee la calculul abaterii
a quartile.
Q 3  Q1 85  62 6
Q=   11,5 . Înttre valorile 62,5 (74 – 11,5) şi 85,5 ( 74 + 11,5) sse găsesc approximativ
2 2
50% dinttre rezultate (93 de rezulttate).

Repere bibliograficee
principaale
 Milton-Smith, G., “Ghid simplificat de statistică pentru pssihologie şi pedagogie”, Editura
d
didactică şi pedagogică,
p Bucureşti, 19971
 Rotariu,Traiaan (coord.), “Metode
“ stattistice aplicate în ştiinţele sociale”, Pollirom, Iaşi, 19999.

170
STATISTICĂ

 Vasilescu, I.P., “Statistică informatizată pentru ştiinţele despre om”, Editura Militară, Bucureşti,
1991.
 Andrei,T., Stancu, S., “Statistica Teorie şi aplicaţii”, Editura All, Bucureşti, 1995
suplimentare
 Reuchlin, M., “Precis de statistique”, Presses Universitaires de France, Paris, 1975
 Rateau, P., “Metodele şi statisticile experimentale în ştiinţele umane”, Editura Polirom, Iaşi 2004

171
AUREL STAN
T

UNITAT
TEA DE ÎN
NVĂȚARE 4.
4
GRADAAREA PE E CURBĂĂ. SISTEM
ME DE NOTE
N STTANDARD NORMAL LIZATE.
DETER
RMINAREA A SUPRAFE
EȚELOR UNOR
U POR
RȚIUNI DIN
N DISTRIBU
UȚIA NORM
MALĂ

IMPORTANT T
Menţionăăm o proprieetate matem matică imporrtantă a abaaterii standarrd care are aplicaţii freccvente în
domeniuul nostru de interes. Am mplitudinea unei
u curbe normale
n Gauss-Laplace poate fi approximată
satisfăcăător de următoarea formuulă: A = 6 s. În sectorul distribuţiei
d cuuprins între vvaloarea meddiei şi ± o
mărime a abaterii staandard se găăsesc aproxim mativ 68% din valorile unei distribuţii. Între valoareea mediei
şi ± douuă mărimi alle abaterii standard se aflăa aproxim mativ 95% din valorile unnei distribuţii normale
Gauss-LLaplace, iar înntre valoareaa mediei aritm
metice şi ± trei
t mărimi ale mărimi alee abaterii staandard se
găsesc 99,958%
9 din valorile distribuţiei.

Săă luăm exem mplul unei disstribuţii normaale cu N=1188 de rezultatte, având m media aritmettică egală
cu 64 şi abaterea staandard egalăă cu 8. Între valoarea 566 (64 – 8) şi valoarea 72, (64 + 8) see vor găsi
aproximaativ 68% dinttre valorile distribuţiei. Înttre valoarea 48 (64 – (2××8)) şi valoarrea 78 (64 + (2×8)) se
vor găsii aproximativv 95% dintre valori. Între valoarea
v 40 (64
( – (3×8)) şi valoarea 888 (64 + (3×88)) se vor
găsi aprooximativ 99,9958% dintre valorile
v distribuţiei, deci marea
m majorittate a acestoor valori.

IMPORTANT T
Această proprietate a abaterii standard înntr-o distribuţie teoreticăă Gauss-Lapplace are applicaţii în
construirrea etaloaneelor testelor. Rezultatul cantitativ
c gloobal obţinut de un subieect la un annumit test
psihologic poartă deenumirea de scor. Scoruul este o înssumare rezultatelor obţinnute la compponentele
elementaare ale testului, componeente care poaartă denumirea de itemi. Cunoaştereaa scorului unui anumit
subiect la un anumit test nu ne poate
p oferi apprecierea vallorică a subieectului, deoaarece aceastaa se face
prin rapoortare la valoorile obţinute la respectivvul test de unn grup, numitt şi grup de rreferinţă (carre trebuie
să îndepplinească o serie
s de exigeenţe privind omogenitateea). Această situaţie de inncertitudine valorică
v a
scorului în privinţa unnui subiect ses datorează şi amplitudinii foarte difeerite a distribbuţiilor valorillor oferite
de teste

Asstfel, la testul Bourdon-A Amfimov (deestinat diagnnosticării ateenţiei concenntrate) se pot obţine
scoruri înntre 1 şi 776. La testul M.P. Raven (foolosit în diagnosticul intelligenţei) se ppot obţine scooruri între
1 şi 60 şi
ş la testul AD D-P (atenţie distributivă
d P
Praga) se pott obţine scoruri între 1 şi 100. În acesst caz, nu
putem coompara randdamentul expprimat prin sccorul 245, obţinut de un subiect la testtul Bourdon-A Amfimov,
cu randaamentul expprimat prin scorul s 172, obţinut de acelaşi subbiect la testuul Kraepelin, sau cu
randameentul exprimaat prin scorul 33, obţinut la testul M.P P. Raven. Chhiar dacă tesstele amintitee ar avea
aceeaşi amplitudine a scorurilor, randamenteele obţinute de d un grup ded subiecţi laa respectivelee teste ar
putea fi foarte diferitee. Iată de cee, scorurile teestelor (penttru a putea fif pune în evvidenţă valoaarea unui
randameent individual) trebuiesc raaportate la sccale valoricee cu acelaşi număr
n de treppte, care sunnt stabilite
după ce testul a fostt efectuat dee un grup dee referinţă (diferenţiat în funcţie de sccor, vârstă, mediu m de
provenieenţă, nivel dee studii etc.). Aceste sccale standarddizate se coonstruiesc reespectând o serie de
exigenţee şi viziuni teeoretice. Num mărul trepteloor scalelor pee care dorimm să facem aaprecierea reezultatelor
subiecţiloor se stabileşşte în funcţie de oportunittăţile situaţiei de evaluaree în care ne aaflăm.

172
STATISTICĂ

Vom efectua o gradare pe curbă a unei scale cu 7 trepte (A, B, C, D, E, F, G), deci un număr
impar de trepte. Utilizăm exemplul dat anterior (distribuţie de 118 scoruri, având media egală cu 64 şi
abaterea standard egală cu 8). În primul rând, trebuie stabilită baza de gradare, notată de noi cu BG.
A
Formula bazei de gradare este: BG = , în care A este amplitudinea distribuţiei şi k numărul de clase
k
în care dorim să facem gradarea pe curbă. Amplitudinea distribuţiei poate fi foarte bine aproximată
într-o distribuţie teoretică Gauss-Laplace prin înmulţirea abaterii standard cu 6, aşa cum am explicat
anterior. Deci, A=6×8 = 48. După ce am aflat valoarea amplitudinii putem trece la calcularea bazei de
48
gradare BG=  6,86. În cazul unui număr impar de clase, vom împărţi baza de gradare la
7
BG
2(  3,43 ). Pentru delimitarea limitei inferioare a clasei centrale, clasa D, vom scădea din valoare
2
mediei jumătate din baza de gradare şi pentru delimitarea limitei superioare a acesteia vom aduna la
valoarea mediei jumătate din valoarea bazei de gradare. Limita inferioară a clasei centrale va fi 61,57
(64 – 3,43 = 60,57) şi limita superioară 67,43 (64 + 3,43). Delimitarea claselor inferioare şi superioare
ale clasei D se va face prin scăderi succesive, respectiv adunări succesive, la limitele clasei centrale a
întregii valori a bazei de gradare. Astfel pentru delimitarea limitei inferioare a clasei C vom scădea:
60,57 – 6,86 = 53,71. Pentru stabilirea limitei inferioare a clasei B vom scădea, din nou, 6,86 din
valoarea rezultată anterior (54,71 – 6,86 = 46,85). Orice valoarea mai mică de 46,85 va face parte din
clasa A. Pentru calcularea limitelor claselor din dreapta clasei centale D procedăm prin adunarea
succesivă a bazei de gradare. Astfel, pentru delimitarea limitei superioare a clasei E vom aduna la limita
superioară a clasei D valoarea întreagă a bazei de gradare (67,43+6,86=74,29). Pentru calcularea
limitei superioare a clasei F vom adăuga la valoarea rezultată din ultima adunare valoarea întreagă a
unei baze de gradare (74,29 + 6,86 = 81,15). Orice valoare mai mare decât 81,15 va face parte din
clasa G. Redăm într-un tabel clasele rezultatele:

Nr.crt. Clasa Limite clasei Întregire


1 A → 46,84 → 47
2 B 46,85 – 53,70 49 – 54
3 C 53,71 – 60,56 56 – 61
4 D 60,57 – 67,43 63 – 67
5 E 67,44 – 74,29 68 – 74
6 F 74,30 – 81,15 75 - 81
7 G 81,16 → 82 →
Tabel cuprinzând determinarea claselor standard prin procedeul gradării pe curbă

Facem precizarea că, în cazul în care valorile rezultatelor nu se prezintă cu zecimale, putem
proceda la întregirea limitelor claselor. Astfel, valoarea 47,84 din clasa A va deveni 48, Pentru a nu crea
confuzii în privinţa apartenenţei unui rezultat la o anumită clasă, limita inferioară a clasei următoare va fi
mărită cu o unitate şi vom întregi limita superioară a clasei următoare. Dacă valoarea aflată după virgulă
depăşeşte 0,5 întregirea se va face prin adăugire, iar dacă această valoarea este mai mică de 0,5,
întregirea se va face prin scădere. Astfel 54,70 va deveni 55 iar 64,43 va deveni 64.
Micile deplasări ale limitelor claselor în urma operaţiei de întregire nu afectează semnificativ
valoarea acestora.
În cazul în care numărul de clase în care dorim să facem gradarea pe curbă este par (6,8,10), se
procedează direct la adiţia,respectiv scăderea, bazei de gradare din medie, fără a o mai împărţi pe
aceasta în două (în cazul unui număr par de clase nu mai avem o clasă centrală)
Prin intermediul abaterii standard şi a mediei putem efectua şi conversiuni ale valorii distribuţiilor,
obţinându-se aşa-numitele variabile normate. Cele mai cunoscute dintre aceste variabile sunt variabilele

173
AUREL STAN

XX
z. Formula pentru transformarea scorurilor brute în variabile normate z este următoarea: z  ,
s
în care X este variabila originală, X este media aritmetică a distribuţiei originale şi s abaterea standard.
Dacă transformăm toate variabilele originale ale unei distribuţii în variabile normate z obţinem o nouă
distribuţie, care are media 0 şi abaterea standard 1. Noile variabile vor avea majoritatea valorilor între –
3 şi 3, indiferent care vor fi valorile variabilelor originale. Forma unei distribuţii nu se schimbă prin
această transformare. Ce ne spune, de fapt, o anumită valoare z? Ea ne dă informaţii asupra distanţei,
exprimată în abateri standard, dintre o valoare a distribuţiei şi medie. O valoare z = -1,22 ne informează
asupra faptului că respectiva valoare se găseşte plasată în stânga mediei (unde se găsesc plasate
valorile mai mici decât media), şi anume la o depărtare de -1,22 abateri standard de medie. O valoare
z=2,34 ne indică faptul că respectiva valoare se găseşte la dreapta medie (acolo unde se găsesc
valorile mai mari decât media) la depărtare de 2,34 abateri standard. Valoarea z ne permite să facem
aprecieri poziţiei relative a unui răspuns în ansamblul răspunsurilor. Aceste fapt este posibil datorită
proprietăţilor matematice ale distribuţiei Gauss-Laplace, denumită şi distribuţia normală. Într-o astfel de
distribuţie teoretică (construită prin intermediul unei funcţii matematice) valorile mediei, medianei şi
modulului se confundă. La acest gen de distribuţie există a perfectă simetrie a valorilor în jurul mediei.
Tabele matematice special realizate pentru acest scop ne indica ce cuantum procentual din efectivul
total se află între medie şi a anumită valoare a distribuţie. Prin deducţie se poate stabili acest cuantum
între două valori oarecare ale distribuţiei. Pentru a putea efectua o astfel de determinare trebuie să
consultăm tabelul de valori cuprins în anexele lucrării, intitulat Tabelul legii normale reduse.

X  3s   X  2s   X  1s   X  X  1s   X  2s   X  3s  

Imagine de exemplificare asupra gradării pe curbă

În prima coloană (z) a tabelului sunt trecute valori progresive z cu rata de 0,1 (0,0; 0,1; 0,2; 0,3
ş.a.m.d. ). Ele formează capete de linii Aceste valori merg până la z = 4,00. Am precizat anterior că
valorile z pot oscila până la 3. Acest lucru este valabil în marea majoritate a cazurilor. Într-un foarte mic
număr de cazuri (100% - 99,958%) variabilele normate z pot primi valori mai mare decât 3. În prima linie
(z) sunt trecute valori z progresive cu rata de 0,01 (0,00; 0,01;. 0,02; 0,03 ş.a.m.d.). Aceste valori
formează capete de coloane. Aceste fracţiuni de valori z merg până la 0,09. Din intersecţia şirurilor de
valori care pornească din capetele de linii şi a celor care pornesc din capetele de coloană putem indica

174
STATISTICĂ

proporţiile rezultate (sau procente, dacă înmulţim cu 100 proporţia) care se găsesc în afara unui interval
valoric format din variabile z. Dacă cunoaştem proporţia de rezultate din efectivul total care se află în
afara unui interval valoric z, putem foarte simplu să aflăm cât se află în interiorul acestui interval. Să
luăm exemplul unei valori z = 1,42. Pentru a afla informaţia dorită vom citi din tabel proporţia aflată la
intersecţia liniei 1,4 şi coloanei 0,02 (1,4 + 0,02 = 1,42).

Z 0,00 0.01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0
0,1
0,02
…….. ….
1,4 0,15561
Tabel cuprinzând exemplificare pentru modul de lucru cu tabela legii normale reduse

La această intersecţie vom afla proporţia 0,15561, aproximativ 0,16. Ce semnifică această
proporţie? Ea semnifică faptul că în afara intervalului exprimat în valori z) - 1,42 şi 1,42 se găseşte
aproximativ 0,16 din efectivul total al distribuţiei sau 16% din efectivul acestei distribuţii. În interiorul
intervalului se va afla 0,84 din efectivul acestei distribuţii (1,00 – 0,84) sau, exprimat procentual, 84 %
din acest efectiv. Proporţia aflată în afara intervalului amintit (0,16) se află plasată la cele două capete
opuse ale distribuţiei. Jumătate din această proporţie (0,08) se afla în stânga variabilei z = -1,42 (valori
mai mici decât aceasta) şi cealaltă jumătate (0,08) se va afla la dreapta valorii variabilei z = 1,42 (valori
mai mari decât aceasta. Dacă transformăm scorul brut al unui subiect în variabile z şi obţinem valoarea
-1,42 aceasta semnifică faptul că subiectul respectiv a obţinut un rezultat mai bun decât 0,08, sau,
exprimat procentual, 8% din totalul rezultatelor subiecţilor şi mai slab decât 0,92 sau, exprimat
procentual, 92% din totalul subiecţilor (100%-0,08). Dacă după transformarea scorurilor brute un subiect
obţine o valoarea z = 1,42, aceasta semnifică faptul că 0,92 sau, exprimat procentual, 92% din totalul
rezultatelor sunt mai slabe decât rezultatul obţinut respectivul subiect. Doar 0,08 (sau 8%) din totalul
rezultatelor vor fi mai bune decât rezultatul obţinut de respectivul subiect.
O aplicaţie frecventă a tabelului legii normale reduse este calcularea cotei procentuale de subiecţi
existenţi în claselor determinate prin gradarea pe curbă. Luăm exemplul dat anterior, în care distribuţia
rezultatelor a 118 subiecţi avea o medie de 64 şi o abatere standard de 8. Pentru aceasta transformăm
limitele superioare a claselor stabilite în variabile z. Pentru aceasta luăm în consideraţie primele 3 limite
superioare ale claselor stabilite şi întocmim următorul tabel:

Nr.crt. Variabile originale Variabile z Proporţie tabelară Înjumătăţire


1 46,84 - 2,145 0,0323 0,016 ( sau 1,6%)
2 53,70 - 1,287 0,1970 0,0985 (9,85%)
3 60,56 - 0,375 0,667 0,333 (33,3%)
Tabel cuprinzând exemplificarea pentru determinarea proporţiilor suprafeţei curbei normale Gauss prin
intermediul valorilor z

Deci, clasa A va avea conţine 0,016 rezultate ale subiecţilor sau 1,6% dintre acestea. Deoarece
modul de construire a claselor se bazează pe simetria acestora, clasa G care este simetrică clasei A va
conţine, de asemenea, 1,6% dintre rezultatele subiecţilor. Deosebirea constă în aceea că 1,6% din
rezultatele conţinute de clasa A sunt cele mai slabe, pe când 1,6% din rezultatele conţinute de clasa G
sunt cele mai bune. Pentru a afla proporţia de subiecţi existenţi în clasa B vom scădea din proporţia
0,0985 proporţia 0.016 şi se va obţine rezultatul 0,0825. Scăderea este justificată de faptul că 0,0985
conţine proporţia rezultatelor claselor A şi B. Clasa simetrică clasei B este clasa F, care va conţine, de
asemenea, 0,0825 din ansamblul rezultatelor subiecţilor sau, exprimat sub formă procentuală, 8,25%
din efectivul total al rezultatelor. Pentru a afla proporţia clasei C se va scădea din 0,333 proporţia

175
AUREL STAN

0,0985 (conţinută de clasele A şi B la un loc). Va rezulta proporţia 0,234 sau, exprimat sub formă
procentuală 23,4% din total. Clasa simetrică clasei C este clasa E, care va avea aceeaşi proporţie de
rezultate. Procentul clasei centrale D se va afla scăzând din valoarea 1,00 sumele proporţiilor celorlalte
clase. Vom avea: 1,00-(2×0,016)-(2×0,0825)-(2×0,234)=1,00-0,665=0,335.
În exprimare procentuală clasa centrală D va conţine 33,5 % din totalul rezultatelor.

În tabelul care urmează transformăm proporţiile şi procentele în valori absolute:


Nr.crt Clasa Limite clasei Întregire % din total Valori absolute Întregire
1 A → 46,84 → 47 1,6,5% 0,016*118 = 1,88 2
2 B 46,85 – 53,70 48 – 54 8,25,0% 0,0825*118 = 9,73 10
3 C 53,71 – 60,56 55 - 61 23,4% 0,234*118 = 27,61 28
4 D 61,57 – 67,43 62 - 67 33,5% 0,335*118 = 39,53 40
5 E 67,44 – 74,29 68 - 74 23,4% 0,234*118 = 27,61 28
6 F 74,30 – 81,15 75 - 81 8,25,0% 0,0825*118 = 9,73 10
7 G 81,16→ 82 → 2,5% 0,016*118 = 1,88 2
TOTAL 100% 120
Tabel cuprinzând exemplificare pentru determinarea proporţiile claselor normalizate

Operaţiunea de întregire este necesară, deoarece nu are sens să se spună că într-o clasă se află
rezultatele a 1,88 de subiecţi. În urma analizei acestui tabel se poate spune că 2 dintre subiecţi au
obţinut rezultate care-i situează în clasa A (cele mai bune rezultate), 10 subiecţii au obţinut rezultate
care-i situează în clasa B, a doua clasă valorică, ş.a.m.d. Jocul întregirilor face ca suma totală să fie
puţin mai mare (120, în loc de 118). Observăm că aceste clase construite pe baza mediei şi a abaterii
standard sunt egale ca valoare (jocul aproximărilor face să existe mici diferenţe), dar nu şi în privinţa
numărului de rezultate ale subiecţilor conţinute în ele. Acest gen de împărţire în clase este realist,
deoarece rezultate de excepţie şi rezultate foarte slabe obţin un număr foarte mic de subiecţi.
Variabilele normate z sunt foarte utile în indicarea poziţiei relative a rezultatului unui subiect în
ansamblul rezultatelor ansamblului subiecţilor.
În cadrul variabilelor z sunt foarte evidente, trei deficienţe: valoarea foarte mică a amplitudinii (de
la –3 la 3), obţinerea de valori negative şi exprimarea sub formă zecimală, fără posibilitatea întregirii
(deoarece, în unele cazuri, s-ar deforma semnificativ valoarea unui rezultate. Pentru a se remedia
aceste deficienţe s-au creat alte tipuri de variabile normate, care se obţin tot printr-o transformare liniară
pornind de la medie şi abatere standard. Teoretic se pot calcula o infinitate de tipuri de variabile
normate bazate pe transformări liniare, dar, în practică se utilizează un număr restrâns, dintre care
amintim variabilele T, create de McCall, şi variabile Hull, create de un cercetător american cu acelaşi
nume. Formula pentru transformarea variabilelor originale a unor distribuţii în variabile normate T este
următoarea: T = 50 
10
s
 
X  X . Ideea variabilelor T a fost lansată de către McCall în anii ’20, dar s-a
impus 20 de ani mai târziu. Numele de T este dat de autor în cinstea a doi mari psihometricieni: Lewis
Terman şi Edward L.Thorndike. Dacă transformăm toate valorile originale ale unei distribuţii după
formula amintită anterior obţinem o nouă distribuţie care va avea valoare mediei aritmetice egală cu 50
XX
şi valoarea abaterii standard egală cu 10. Dacă avem în vedere faptul că z= , formula se poate
s
scrie şi în modul următor: T= 50 + 10 z. Noile valori obţinute după transformare vor oscila aproximativ
între 18 şi 82. Pentru a avea la dispoziţie variabile normate care să oscilează între 1 şi 100 (cu
aproximaţie), foarte comode de utilizat în practică, s-au creat variabilele Hull, având următoarea formulă
de constituire: H = 50 +
14
s
 
X  X . Formulă alternativă de constituire este: H = 50 + 14z. Dacă

176
STATISTICĂ

transformăm toate valorile originale ale unei variabile după formula lui H vom obţine o nouă distribuţie
cu media 50 şi abaterea standard egală cu 14.
Atenţionăm asupra faptului că variabilele normate îşi pierd valoarea practică de utilizare dacă
distribuţia empirică (distribuţie ale cărei valori sunt obţinute dintr-o cercetare concretă) se deosebeşte
semnificativ de o distribuţie normală Gauss-Laplace. Distribuţiile empirice şi cele teoretice sunt diferite
în marea majoritate a cazurilor. Este important de a şti dacă această diferenţă este semnificativă sau
nu. Pentru a stabili această diferenţiere există anumite proceduri statistice.
Exemplu de transformare în variabile normate z, T şi H. Să presupunem că avem o distribuţie
empirică cu media egală cu 73 şi abaterea standard de egală cu 15. Ne propunem să transformăm
valorile variabilei X egale cu 37, 63, 78, 85, 92 , conform formulelor stabilite pentru variabile normate z,
T şi H. În mod uzual, în domeniul aplicării testelor psihologice pentru denumirea unei operaţiuni de
acest gen se foloseşte expresia “transformare a scorurilor brute în note z, T şi H”. Nu procedăm la
întregirea notelor z, deoarece deformarea rezultatului ar fi semnificativă atunci când este vorba de o
cifră mică. La notele T şi H deformarea rezultatelor prin întregire este nesemnificativă. Formulele de
transformare sunt cele pe care le-am expus anterior. Faptul transformării presupune că anterior ne-am
asigurat de existenţa condiţiilor care o permite. În cazul existenţei unor asimetrii puternice, operaţiunea
de transformare nu ne este de folos practic.

Nr.crt. Variabila originală X Note z Note T Întregire Note H Întregire


1 37 - 2,40 26 26 16,40 16
2 63 - 0,67 43,33 43 40,67 41
3 78 0,33 53,33 53 54,67 55
4 85 0,80 58 58 61,20 61
5 92 1,27 62,67 63 67.33 67
Tabel cuprinzând exemplificarea pentru transformarea valorilor brute în note standard

177
AUREL STAN

UNITATEA DE ÎNVĂȚARE 5.
INDICATORI DE ASIMETRIE ȘI EXCES – MODELE DE REPARTIȚIE TEORETICE

Indicatorii de nivel şi de împrăştiere au un mare rol în descrierea unora din caracteristicile unei
distribuţii, dar sunt insuficienţi pentru formarea unei imagini complete asupra tendinţelor care există în
aceasta. Distribuţiile pot să aibă medii şi varianţe egale, dar să nu fie la fel de simetrice. Stabilirea
indicatorilor de asimetrie prezintă importanţă în aprecierea existenţei unor influenţe în şirul de date
(datorate compoziţiei eşantionului sau erorilor de construcţie a unui test psihologic, de exemplu).
Apreciere asimetriei unei distribuţii se poate face în cel mai simplu mod prin compararea valorilor mediei
şi medianei. Când media este inferioară medianei avem o asimetrie negativă. Dacă mediana este
inferioară mediei avem o asimetrie pozitivă a distribuţiei de valori. Asimetria negativă presupune
“îngrămădirea” de valori în dreapta mediei, adică existenţa mai multor valori superioare mediei decât
cele inferioare acesteia. Când valorile mai mici decât media sunt în număr superior celor mai mari decât
aceasta suntem în situaţia unei asimetrii pozitive.

 A s i m etr ia n eg a ti v ă
V a lo a r e a m o d Imagine cuprinzând
M e dia na
poziţia mediei, medianei şi
a valorii mod în distribuţiile
cu asimetrie negativă
M e di e

D i fe r e n ţa d in tre m e d i e ş i m e d i a n ă e s te n e g a ti vă

Imagine cuprinzând
 A s im e tria poz itiv ă poziţia mediei, medianei şi
Valo are m od a valorii mod în distribuţiile
cu asimetrie pozitivă
M ediană
M ed ia

D iferenţa între medi e ş i m ediană este po zitivă

Distribuţia rezultatelor la un test prezentând o puternică asimetrie de dreaptă indică deosebita


calitate intelectuală a celor ce efectuează testul (daca acest test este de inteligenţă) sau a modului de
construcţie a probei psihologice (cu prea multe situaţii problematice uşoare). În cazul în care avem drept
scop să selectăm o categorie de personal puternic performanta, se urmăreşte deliberat asigurarea

178
STATISTICĂ

asimetriei de stânga în timpul construcţiei probei. Amintim că astfel de procedee de construcţia sunt de
excepţie. În majoritatea cazurilor, constatarea unei asimetrii semnificative a rezultatelor constituie un
semnal pentru remedierea construcţiei probelor.
Procedeul simplei comparaţii a mediei şi medianei are o valoare aproximativă. Egalitatea
medianei mediei nu ne asigură în privinţa simetriei unei distribuţii. În cazul în care dorim sa fim mai
precişi trebuie sa calculam o serie de indicatori. Unul dintre aceştia se bazează pe diferenţa dintre
medie şi mediană. Îl vom nota cu S. Formula este următoarea: S =

3 X  Md 
în care cu X am notat
s

media, cu Md mediana şi cu S indicatorul de asimetrie. În alt caz vom folosi formula: S =


 x3
, în care
Ns 3
S este indicatorul de asimetrie (Skwenes), x este variabila de deviaţie (X- X ), N este efectivul total şi s
abaterea standard a distribuţiei. În cazul variabilelor grupate se foloseşte la numărător  fx 3 . Vom
folosi tabelul cu date grupate pe variante de variaţie creat pentru exemplificarea etapelor de calcul în
vederea determinării mediei aritmetice.

Date grupate pe variante de variaţie


Nr.crt X F fX x x2 fx2 x3 fx3
1 17 2 34 - 5,23 27,35 54,71 - 143,06 - 286,11
2 19 5 95 - 3,23 10,43 52,16 - 33,70 - 168,49
3 20 9 180 - 2,23 4,97 44,76 - 11,09 - 99,81
4 21 13 273 - 1,23 1,51 19,67 - 1,86 - 24,19
5 22 18 396 - 0,23 0,05 0,95 0,01 0,22
6 23 12 276 0,77 0,59 7,11 0,46 5,48
7 24 10 240 1,77 3,13 31,33 5,55 55,45
8 26 6 156 3,77 14,21 85,28 53,58 321,50
9 28 3 84 5,77 33,29 99,88 192.10 576,30
Σ 78 1734 395,85 380,35
Tabel cuprinzând exemplificare pentru etapele de calcul necesare stabilirii indicatorului de asimetrie

Pentru a avea la dispoziţie toate datele aplicării formulei coeficientului de asimetrie S va trebui să
calculăm abaterea standard a distribuţiei. Aplicăm formula pentru calcularea abaterii standard pentru

variabile grupate pe variante de variaţie: s=


 fx  
2
380,35
 4,87  2,2 . Aplicăm, în
N 78

continuare formula pentru calculul coeficientului de asimetrie: S=


 fx 3

 380,35
 0,45.
3
Ns 78 * 10,64
Când valoarea coeficientului este 0, atunci distribuţia este perfect simetrică. Valoarea negativă
indică o asimetrie negativă, valoarea pozitivă o asimetrie pozitivă. Valoarea obţinută la distribuţia
exemplificată indică o asimetrie pozitivă.

INDICATORI DE BOLTIRE SAU INDICATORI DE EXCES

Pentru a caracteriza în întregime o distribuţie de valori trebuie să adăugăm la indicatorii de nivel,


împrăştiere şi asimetrie indicatorii de exces sau de kurtosis. Kurtoza este gradul de aplatizare a unei
distribuţii. Se disting în aceasta privinţă 3 tipuri de distribuţii: distribuţiile leptokurtice (ascuţite), în care
se găseşte un mare număr de valori cuprins la centrul distribuţiei, distribuţiile platicurtice care sunt
evazate şi se caracterizează printr-o mare întindere a scorurilor şi distribuţiile mezocurtice, reprezentate

179
AUREL STAN

printr-o distribuţie apropiată celei normale. Exista o formulă adecvată de calcul a excesului pentru
(C 75  C 25) )
scalele ordinale K= . Prin K am notat coeficientul de exces, prin C75 centilul 75, prin C25
C 90  C10
centilul 25, prin C90 centilul 90 şi prin C10 centilul 10. Conform acestei formule, o distribuţie poate fi
considerată mezokurtică atunci când valoarea lui K se situează în jurul valorii 0,2632. Distribuţia va fi
considerata drept leptokurtică atunci când K este mai mic decât 0,2632 şi drept platicurtică când K este
mai mare decât 0,2632. Coeficientul de exces pentru distribuţii care satisfac exigenţele scalelor de

interval se notează, de asemenea, cu K. Formula de calcul este următoarea: K =


 x4
. În această
N * s4
formulă K este coeficientul de exces a unei distribuţii, x4 este puterea a patra a variabilei de deviaţie
(X- X ), s4 este puterea a patra a abaterii standard a distribuţiei. În cazul variabilelor grupate pe variante
de variaţie la numărător apare Σ(f*x4). Pentru exemplificare am adaptat tabelul prezentat anterior.
Abaterea standard are aceeaşi valoare (s = 2,2; s4 = 23,42).

Date grupate pe variante de variaţie


Nr.crt X f fX x x4 f*x4
1 17 2 34 - 5,23 748,18 1496,36
2 19 5 95 - 3,23 108,85 544,23
3 20 9 180 - 2,23 24,73 222,57
4 21 13 273 - 1,23 2,29 29,76
5 22 18 396 - 0,23 0,00 0,05
6 23 12 276 0,77 0,35 4.22
7 24 10 240 1,77 9,82 98,15
8 26 6 156 3,77 202.01 1212,04
9 28 3 84 5,77 1108,42 3325,25
Σ 78 1734 6932,62
Tabel cuprinzând exemplificare pentru etapele de calcul necesare stabilirii indicatorului de exces

În continuare, aplicăm formula pentru calculul coeficientului de exces:

K
 
fx 4

6932,32 6932,62
  3,79
4
N*s 78 * 23,42 1826,26
După ultima formulă folosită o distribuţie este considerată mezokurtică când K = 3. În cazul în
care K>3 distribuţia este leptokurtică, iar în cazul în care K<3 ea este platikurtică. Rezultatul obţinut de
noi indică o distribuţie leptokurtică.

 Exemplificare exces
Distrib uţia leptocu rtică
Exemplificare pentru curba
normală, curba platicurtică şi
curba leptocurtică
Distrib uţia platicurtică
Distribuţia no rmală

180
STATISTICĂ

Repere bibliograficee
principale
 Colocotici,
C V Stan, A., 2000,
V., 2 ”Statistitica aplicata în
î psihologi”, Editura Polirrom, Iași
 Rotariu ,Traian (coord.), “Metode statistice aplicate în ştiinţelee sociale”, Poolirom, Iaşi, 1999.
 Vasilescu,
V I.P., “Statisticăă informatizaată pentru ştiinţele despree om”, Editura Militară, Bucureşti,
B
1991.
 Andrei,T.,
A Stancu, S., “S Statistica Teoorie şi aplicaţţii”, Editura All,
A Bucureşti, 1995
suplimenntare
 Reuchlin, M., “Precis de statistique”, Presses Universitaires de France, Paaris, 1975
 Rateau, P., “Metodele
“ şi statisticile exxperimentale în ştiinţele umane”,
u Edituura Polirom, Iaşi 2004

MODELE DE REPPARTIȚIE TEORRETICE

Amm insistat annterior asupraa faptului că o mulţime de cifre rezuultată din collectarea noteelor brute
ale unui mare număăr de persoaane care au efectuat un test psiholoogic nu ne ooferă nici o informaţie
relevantăă dacă nu reealizăm o seerie de operaaţii preliminaare. Ordonareea şi sistematizarea aceestor date
încep săă confere seens acestei mulţimi
m de date. Realizarea histogramei, a poligoonului frecveenţelor, a
curbei frrecventelor sau
s a altor foorme de repprezentare sppaţială a disttribuţiilor empirice oferă imaginea
tendinţei generale care există înn cadrul mulţimii de datte. Interpretaarea unor rreprezentări grafice a
distribuţiilor empiricee este posibbilă doar prrin raportare la nişte modele, m care au o fundaamentare
matemattică riguroasăă. Cele mai frecvente
f rapportări ale disstribuţiilor şi reprezentărilo
r or lor graficee se fac la
modelul distribuţiei şii curbei normmale a lui Gauss-Laplace.. Modelul am mintit nu este nici mai bunn, nici mai
rău decâât alte modele de distrribuţii (modeelul Poisson, modelul binomial, moddelul uniform m discret,
modelul Snedecor-Fisher, modelul hipergeom metric)15, ci cel
c mai frecvvent utilizat şşi mai adaptaat datelor
oferite dee cercetările psihopedagoogice.
Raaportarea la distribuţia normală
n estee una din ceele mai frecvvente proceduri în analizza datelor
rezultatee din cercetăările cantitativve ale domeeniului psihologic. În uneele cazuri, această modaalitate de
raportaree devine un gest
g reflex, automatic,
a lippsit de discerrnământ din partea cerceetătorului puţţin abilitat
în privinţţa exploatării metodelor cantitative.
c Assemănarea uneiu distribuţiii empirice cuu o distribuţiee normală
pare să indice că cerrcetarea merrge pe drumuul cel bun, căă o anumită caracteristică
c ă psihică se manifestă
m
armonioss pe ansambblul unui grupp.
Esste binecunooscut faptul că c orice măssurare capăttă sens prin raportarea la un modell teoretic.
Curba normală Gausss-Laplace este e unul dinn modelele cu c care se opperează în ccercetarea caantitativă,
dar nu singurul. Exxistă alte moodele frecveent utilizate, dar nu la fel de popuulare. De unde vine
popularittatea „curbei în clopot”?? Această distribuţia pare multor ceercetători „naaturală” şi „firească”,
manifesttându-se parcă în firea lucrurilor, şi ş probabil cred,
c că daccă nu ar fi „inventat-o” celebrul
matemattician germaan, ar fi făcut-o ei cu siguranţă.
s Acumularea de d fapte de viaţă înregistrate în
registrelee oficiale ale statelor din Occident cu sistem administrativ evooluat din secoolul XVII şi XVII X parcă
„anunţa” curba lui Gauss.
G Astfell, în secolul XVIII s-a reemarcat o mare m stabilitatte a recensăământului
efectuat asupra marrilor colectiviităţi (naşterile, căsătoriilee, decesele). Acest faptt era interpreetat ca o
manifesttare a providdenţei, a unnei ordini divvine, impunâând o aşezare cantitativăă armonioassă pentru
societatee în ansamblul său, dincoolo de indiviziii volatili şi im
mprevizibili.
În 1832, matem maticianul geerman Carl-F Friedrich Gauuss (1777-18855), profesoor la Universitatea din
Göttingeen, supra-num mit „prinţul matematicien
m nilor” stabileşşte o „curbăă de erori”, ccare va purtta ulterior
                                                            
15O descrriere a acestor modelele găsiţţi în lucrarea lui Ilie Puiu Vasileescu, Statistică informatizată ppentru ştiinţele despre
d om,
Editura militară, Iași, 2000, Editura Polirrom.

181
AUREL STAN

numele său, oferind o reprezentare în clopot a erorilor de observaţie pentru măsurători mai ales
astronomice. Curba normală a repartiţiei, numită şi curba normală Gauss-Laplace este simetrică, are
vârf unic, cu ordonată maximă centrată pe medie şi divizează repartiţia valorilor în două părţi egale
(media, mediana şi modul coincid). Cu cât abaterea standard este mai slabă cu atât curba se strânge
mai mult, se apropie asimptotic de axa x. Există o relaţie fixă între abaterea standard a unui eşantion şi
procentajul porţiunilor de suprafaţă situate sub curbă între două limite
Statisticianul, matematicianul şi astronomul belgian Lambert Adolphe Jacques Quetelet (1796-
1874), autor al lucrării Sur l’homme et le développment de ses facultés ou essai de physique sociale,
1835, a pus în evidenţă faptul că distribuţiile obţinute pe caracteristici foarte variate au aceeaşi alură
(ceea ce se va numi mai târziu „curba în clopot”) şi propune o interpretare. El demonstrează matematic
că această formă rezultă din compunerea unui mare număr de erori mici şi independente unele de
altele. Abaterile, prin raportare la tendinţa centrală (valoare care corespunde vârfului curbei) vor fi nişte
imperfecţiuni în realizarea efectivă a unui obiect „perfect”. Noţiunea pusă în circulaţie de Quetelet este
aceea de om mediu. La baza filosofărilor savantului belgian se afla considerentul că media descrie un
subiect ideal, descărcat de erorile cu care natura l-a creat. Apreciază că media este mai adevărată
decât o valoare măsurată. Omul mediu este proslăvit ca expresie a adevărului. Cu toată străduinţa lui
Quetelet de a impune „omul mediu”, această noţiune a fost o prezenţă foarte controversată în câmpul
preocupărilor ştiinţifice socio-umane.
Distribuţie normală se conturează atunci când o caracteristică (de exemplu, în cazul nostru,
inteligenţa) se naşte din acţiunea conjugată a mai multor surse de variaţie care, firesc, o influenţează.
Avantajele acestui tip de distribuţie rezidă în posibilitatea unui mai bun tratament statistic a seriilor de
rezultate repartizate într-un mod normal (în unităţi de abateri standard).
Comentând într-o lucrare presupoziţiile curbei lui Gauss. Jean Jacques Bonniol şi Michel Vial se
exprimă poetic vorbind despre „şarmul discret al simetriei”16. Modelul gaussian a fost adoptat cu
uşurinţă din cauza faptului că el prezintă toate aparenţele de evidenţă: simetria armonioasă, calcule
simple, coerenţă cu (sau legitimare a) ideile existente asupra distribuţiei aptitudinilor, coerenţă, cu
imperativele selecţiei sociale şi a alegerii „celor mai buni”, cu obişnuinţele mentale şi socio-culturale.
Distribuţia normală se verifică experimental asupra variabilelor aleatoare şi pare să dea seama de un fel
de „lege a naturii”.
Forma ca atare a curbei Gauss Laplace are o mare putere de sugestie pentru cei înclinaţi spre
filosofare a faptelor, obiectelor, evenimentelor lumeşti. Tot ce fiinţează în această lume are un început,
o evoluţie, un vârf de glorie sau de vitalitate, după care urmează căderea, declinul şi aneantizarea.
Fiinţele de orice gen, creaţiile umane, alcătuirile sociale, imperiile şi măririle lumeşti sunt „tiranizate” în
existenţa lor de legea lui Gauss-Laplace.
Dar, distribuţia normală nu este „divină şi universală”, cum a crezut la început Einstein. Există
distribuţii în U, în J, în I, asimetrice de dreapta, asimetrice de stânga şi altele. În scopul de a conserva
avantajele distribuţiei normale se modifică valorile aceste distribuţii prin transformarea mai ales în valori
z sau T, adică se pun în funcţiune procedeele de normalizare. Generalizarea acestui model probabilist
ajunge la legea normală redusă, la care se rezumă câteva caracteristici. Într-o distribuţie normală
media, mediana şi modul coincid, sigma sau abaterea standard delimitează zonele în care procentajele
sunt cunoscute şi stabile.
Exemplificăm noţiunea de model de distribuţie şi deviaţiile de la un model prin raportare la
modelul binomial, model foarte apropiat modelului normal de distribuţie. Frecvenţele variantelor sau
intervalelor de distribuţie sunt proporţionale cu valorile următoarelor serii:

                                                            
16Jean Jacques Bonniol, Michel Vial, Les modèles de l’évaluation. Textes fondateurs avec commentaires, De Boeck &
Larcier s.a.1997, Paris, Bruxelles, pag.71

182
STATISTICĂ

2 intervale: 1 1
3 intervale: 1 2 1
4 intervale: 1 3 3 1
5 intervale: 1 4 6 4 1
6 intervale: 1 5 10 10 5 1
7 intervale: 1 6 15 20 15 6 1
8 intervale: 1 7 21 35 35 21 7 1
9 intervale: 1 8 28 56 70 56 28 1

Cum citim aceste serii de valori care formează aşa-numitul «Triunghi al lui Pascal»? Facem
referire la algoritmul de repartiţie pentru 4 intervale. Şirul «1 3 3 1» semnifică faptul că în modelul
binomial pentru 4 intervale, al doilea interval va avea un efectiv de trei ori mai mare decât primul, al
treilea interval va avea un efectiv de trei ori mai mare decât primul şi al patrulea interval va avea un
efectiv egal cu primul. Deci, un prim efectiv de bază se multiplică conform unui algoritm.
Dacă vom avea 2940 de valori ale unei distribuţii empirice şi dorim să le distribuim după modelul
binomial în 9 clase pentru a putea determina ulterior cât de mult se distanţează de acest model teoretic
o anumită distribuţie empirică, procedăm în felul următor: 1) se adiţionează toate cifrele din dreptul
specificaţiei 9 (1+8+28+56+70+56+28+8+1=326) ; 2) împărţim efectivul total al distribuţiei la 326
(2940:326 = 9,01, aproximativ 9); 3) valoarea rezultată o înmulţim cu fiecare cifră a şirului de date din
dreptul specificaţiei „9 intervale”.

Specificaţie „9” 1 8 28 56 70 56 28 8 1
Nr. interval 1 2 3 4 5 6 7 8 9
Efectiv rezultat 9 72 252 504 630 504 252 72 9

Exprimată grafic sub formă de histogramă, situaţia rezultată se prezintă astfel:

700
600
500
400
300 630
540 540
200
100 252 252
72 72
0 9 9
1 2 3 4 5 6 7 8 9

Grafic privind organizarea cantitativă a modelului binomial în 9 clase pentru 2940 de rezultate
(exprimată printr-o histogramă)

Exprimată sub formă de curbă, vom avea următoarea reprezentare grafică

183
AUREL STAN

700
630
600
540 540
500

400

300
252 252
200

100
72 72
0 9 9
1 2 3 4 5 6 7 8 9

Grafic referitor la organizarea cantitativă a modelului binomial în 9 clase pentru 2940 de rezultate
(exprimată printr-o curbă a frecvenţelor)

Distribuţia empirică (aşa cum rezultă dintr-o cercetare concretă) deviază foarte frecvent de la o
distribuţie teoretică. În exprimare statistică se foloseşte sintagma pentru această deviaţie de distanţă
faţă de modelul teoretic. În cercetarea practică nu are importanţă dacă o distribuţie empirică se
distanţează de una teoretică, ci dacă această deviaţie este semnificativă sau nu. Dacă distanţa dintre
cele două distribuţii este una semnificativă, putem spune că ieşim din model, situaţie care modifică o
serie de proceduri de raportare. Astfel, pentru valorile unei distribuţii empirice nu mai au sens
exprimările prin intermediul valorilor normalizate. Exemplificăm, prin intermediul unei reprezentări
grafice realizate prin programul SPSS-10, distanţa între o distribuţia teoretică şi una empirică.
14

12

10

2 Std. Dev = 6,95


Mean = 24,4
0 N = 63,00
12,5 15,0 17,5 20,0 22,5 25,0 27,5 30,0 32,5 35,0 37,5

Grafic de exemplificare pentru distanţarea dintre o distribuţie empirică (histogramă pentru 63 de


rezultate) şi o distribuţie teoretică (curba lui Gauss)

Se cunosc mai multe forme de deviere sau distanţare de la un model teoretic gaussian.
Exemplificările sunt făcute din domeniul psihologic.

184
STATISTICĂ

1. Curba cu asimetrie de stânga sau asimetrie negativă semnifică faptul ca o proba psihologică este
prea uşoara pentru subiecţii la care a fost aplicata sau ca grupul de subiecţi este selecţionat din
superdotaţi. În această formă de asimetrie se pot detecta cu uşurinţă subiecţii foarte slabi, situaţi în
stânga distribuţiei. I se spune negativă, deoarece diferenţa dintre valoarea mediei şi valoarea
medianei dă o valoare negativă
120
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10

Grafic de exemplificare Curba cu asimetrie de stânga sau asimetrie negativă

2. Curba cu asimetrie de dreapta sau asimetrie pozitivă .Semnifică faptul că rezultatele unei probe sunt
foarte grele, sau faptul subiecţii sunt selecţionaţi dintre cei foarte slab dotaţi aptitudinal. I se spune
pozitivă deoarece diferenţa dintre valoarea mediei şi valoarea medianei dă o valoare pozitivă. Cu o
astfel de reprezentare grafică ies foarte bine în evidenţă subiecţii buni şi foarte buni.
120
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10

Grafic de exemplificare pentru curba cu asimetrie de dreapta sau asimetrie pozitivă

3. Curba platikurtică semnifică ridicarea exagerata a coeficientului de variaţie. Amplitudinea distribuţiei


sau plaja de variaţie este foarte extinsă. Nu se poate observa nici o tendinţă de reliefare în distribuţia
datelor
140
120
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10 11

Grafic de exemplificare pentru curbă aplatizată sau platikurtică

4. Curba mezokurtica este apropiată ca formă curbei normale Gauss-Laplace. Semnifică un echilibru in
privinţa repartiţiei rezultatului subiecţilor.

185
AUREL STAN

60
50
40
30
20
10
0
1 2 3 4 5 6 7 8 9

Grafic de exemplificare pentru curba mezokurtică

5. Curba leptokurtica semnifică faptul că majoritatea datelor sunt masate în puţine intervale în jurul
mediei şi îngustimea coeficientului de variaţie

250
200
150
100
50
0
-50 1 2 3 4 5 6 7 8 9

Grafic de exemplificare pentru curba leptokurtică

6. Curba bimodală (cu dublu modul) semnifică faptul existenţei în grupul de subiecţi examinaţi a doua
subgrupuri eterogene cu dotări aptitudinale diferite. Menţionăm, totodată, că acest fel de curbă
rezulta şi in cazul adoptării unei tehnici de construcţie a testului psihologic care-si propune să dea
rezultate sub forma dihotomică (apt-inapt, admis-respins);
30
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 10 11 12

Grafic ilustrativ pentru curba bimodală

7. Curma multimodală semnifica existenţa în grupul examinat a mai multor subgrupe eterogene valoric.

186
STATISTICĂ

40
30
20

10

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Grafic exemplificativ pentru curba multimodală

8. Curba în U semnifică plasarea majorităţii rezultatelor la extremităţile plajei de variaţie. În mediile de


populaţie puternic divizate pe criterii etnice, rasiale sau religioase se obţin astfel de rezultate în
cazuri în care se efectuează chestionare de opinii în privinţa calităţilor unei anumite grupări cu
eşantioane compuse din numere egale de opozanţi;
200
150
100

50
0
1 2 3 4 5 6 7 8 9

Grafic exemplificativ pentru curba în U

9. Curba în I se întâlneşte în cazul în care majoritatea covârşitoare a subiecţilor se situează la limita


inferioară a plajei de variaţie. Se întâlnesc astfel de situaţii când transpunem grafic situaţia erorilor la
proba tăbliţelor de corectura Bourdon-Amfimov;
200

150
100
50
0
1 2 3 4 5 6 7 8 9 10 11

Grafic exemplificativ pentru curba în I

10. Curba în J. Situaţia se întâlneşte când transpunem grafic valoarea indicilor de calitate la probele
creion hârtie de atenţie concentrata.

187
AUREL STAN
T

250

200

150

100

50

0
1 2 3 4 5 6 7 8 9 10 11

Grafic exxemplificativ pentru curbaa în J

În interpretareea unor astfeel de forme de distribuţţie care devviază de la o distribuţie teoretică


Gauss-LLaplace estee necesară o anumită elasticitate în interpretare, deoareece anumitee condiţii
particulaare de desfăăşurare a unnui examen sau experim ment favorizeează apariţiaa unui anum mit tip de
distanţarre. Explicaţiile pe care le--am dat noi constituie
c doar una din innterpretări. De exemplu, la apariţia
unei disttribuţii asimettrice pozitive se poate înttâmpla ca subiecţii să nu fi înţeles expplicaţiile de reealizare a
unei anuumite sarcini.

Repere bibliograficee
principale
 Colocotici,
C V Stan, A., 2000,
V., 2 ”Statistitica aplicata în
î psihologi”, Editura Polirrom, Iași
 Vasilescu,
V I.P., “Statisticăă informatizaată pentru ştiinţele despree om”, Editura Militară, Bucureşti,
B
1991.
 Andrei,T.,
A Stancu, S., “S Statistica Teoorie şi aplicaţţii”, Editura All,
A Bucureşti, 1995
suplimenntare
 Reuchlin, M., “Precis de statistique”,
s P
Presses Univversitaires dee France, Paris, 1975
 Rateau, P., “Metodele
“ şi statisticile exxperimentale în ştiinţele umane”,
u Edituura Polirom, Iaşi 2004

188
STATISTICĂ

UNITATEA DE ÎNVĂȚARE 6.
SPECIFICUL STATISTICII INFERENȚIALE. CLARIFICĂRI NOȚIONALE: EȘANTION,
POPULAȚIE DEMOGRAFICĂ, POPULAȚIE STATISTICĂ, LOT, GRUP,
REPREZENTATIVITATE. EXTRAGEREA SAU PRELEVAREA EȘANTIOANELOR

POPULAŢIE ŞI EŞANTION

Noţiunile de populaţie şi eşantion sunt foarte frecvent utilizate în statistica inferenţială, din acest
motiv se cer clar precizate.
În statistic inferenţială, termenul de populaţie are un sens aparte faţă de cel curent, sens dat de
specificul acestei discipline care operează cu mulţimi de date aparţinând unor domenii foarte diferite.
În general vorbind, o populaţie este constituită dintr-un un ansamblu de indivizi care au în comun una
sau mai multe caracteristici care servesc de a le regrupa. Vorbim de populaţii umane sau demografice,
de populaţii statistice, de populaţii biologice. În statistică descriptivă, aşa cum am precizat în manualul
anterior, o populaţie este un ansamblu de indivizi sau unităţi statistice asupra căruia se realizează un
studiu şi care au unul sau mai multe caracteristici comune.
Ca atare, în statistică, populaţia nu înseamnă totalitatea locuitorilor globului pământesc sau a
unei părţi din acesta. Într-o formă foarte succintă definim populaţia ca un ansamblu de entităţi care
satisfac exigenţele unei definiţi date. Definirea prealabilă a entităţilor, înaintea includerii lor în populaţie,
trebuie să fie foarte riguroasă, pentru a nu da naştere la confuzii. În loc de entităţi se preferă în unele
definiţii ale populaţiei termenii de indiviz sau de unităţi, cu precizarea că nu este vorba de indivizi umani,
ci de elemente ale diferitelor mulţimi de natură foarte diferită. Făcând aceste precizări, putem da câteva
exemple de ansambluri sau grupuri care pot constitui populaţii:
 grupuri de persoane;
 grupuri profesionale;
 grupuri etnice;
 grupuri religioase;
 grupuri de instituţii;
 grupuri de animale;
 grupuri de obiecte.
 grupuri de itemi;
Există o mare diversitate a modalităţilor în care putem să ilustrăm noţiunea de populaţie.
Domeniile care satisfac definiţia individului de bază sau a unităţii din cadrul populaţiei formează un mare
evantai, pornind de la cele mai banale până la cele mai bizare. Astfel, exemplificând din domeniul
indivizilor umani, în această noţiune statistică pot fi cuprinse:
 toate persoanele de naţionalitate română;
 toate persoanele care sunt angajate într-o firmă;
 toate persoanele care se ocupă cu ocrotirea minorilor din Europa;
 toate persoanele care folosesc un anumit tip de şampon;
 toate persoanele dintr-un anumit judeţ care posedă un câine de rasă;
 toţi inginerii care sunt conducători de firme.
Practic, nu există limite ale exemplificării noţiunii de populaţie statistice. Din punct de vedere al
ştiinţei numită statistică, calităţile pe care trebuie să le posede o anumită populaţie trebuiesc bine
stăpânite şi, în majoritatea cazurilor, clar cuantificate. Mărimea unei populaţii poate varia de la un individ
sau o unitate până la numere de dimensiuni extrem de mari. În unele cazuri, când numărul unităţilor
este foarte mare şi se găseşte într-o continuă creştere cu o rată imprevizibilă, se vorbeşte de populaţii
infinite. Acelaşi individ sau aceeaşi unitate poate să se regăsească în mai multe populaţii, în cazul în
care satisface şi criteriile altor sisteme de clasificare. Astfel, o persoană poate face parte din populaţia

189
AUREL STAN
T

profesorilor de bioloogie din Mooldova, din populaţia


p creedincioşilor ortodocşi din aceeaşi zonă,
z din
populaţiaa posesorilorr de computeere şi din cea a actorilor amatori,
a de exemplu.
e
Î cazul în care se calculează un indicator nuumeric din date
În d proveninnd de la toţţi indivizii
populaţieei, mărimea rezultată
r se cheamă
c paraametru şi aree o valoare fixă, nesupusă oscilaţiei. Este
E doar
unul din sensurile nooţiunii de paarametru. Dacă avem posibilitatea săă măsurăm îîn întregime înălţimea
populaţieei copiilor dee 12 ani, de sex
s masculinn din Românnia putem sppune cu exactitate cât esste media
acesteia. Dar, anterioor trebuie să precizăm claar când conssiderăm că unn copil are 122 ani, deoareece foarte
rar putem m face măsuurători exactt în ziua în carec acesta împlineşte 12 ani. De acceea, precizăm că în
această categorie poot fi cuprinşi copii
c care la data măsurăătorii aveau între 11 ani şşi 180 de zilee şi 12 ani
şi 180 de d zile. Preccauţiile metoodologice sunnt foarte impportante daccă dorim să evităm apariţia unor
neclarităăţi.
Maniera în care se proceedează pentruu constituireaa unui eşantion depinde dde :
 existtenţa unor innformaţii asuppra incidenţeei caracteristicilor definite prealabil (De exemplu, bărbaţii
b şi
femeeile au aceleaşi atitudinni faţă de muncă?
m Există o evoluţie a acestorr atitudini cuu vârsta?
Modalitatea în caare exerciţiilee şcolare de învăţare a leecturii diferă ded la ţară la ţară?)
 existtenţa informaaţii asupra populaţiei, adiică dacă aceeasta are preccizaţi indicatoorii statistici??
Este importaant, în primul caz, ca grupele comparrate să fie ecchivalente, cuu excepţia vaariabilelor
definite (variabilele
( a
anchetei). În al
a doilea cazz este imperaativ ca grupele reţinute săă fie constituite în aşa
fel încâtt ele să fie asemănătoaare populaţieei de care ne n interesăm m (denumită şi populaţie părinte),
deoarecee constatărilee făcute pe datele
d obţinuute în eşantioon urmează a fi generalizzate prin infeerenţă, la
nivelul înntregii populaaţii. Se impunne ca un astffel de eşantioon să fie reprrezentativ.

IMPORTANT T
Se impun câteva rem marci în privinnţa reprezenttativităţii:
 nu se poate vorbbi de reprezentativitate în mod absolutt. Astfel, un eşantion
e poaate fi mai mult sau mai
puţinn reprezentattiv, nu reprezzentativ sau nereprezenta
n ativ
 În apprecierea repprezentativităăţii ne bazăm m pe două critterii de aprecciere: preciziaa şi siguranţaa. Regula
este: cu cât dorim să fim mai m precişi, cu atât sunteem mai puţinn siguri. Exisstă convenţii statistice
privind un comprromis între ceele două criteerii
 Reprezentativitattea unui eşaantion nu depinde doar de d numărul indivizilor exxtraşi sau prelevaţi în
eşanntion, cât de respectarea regulilor ce guvernează
g această
a extraagere
 Nu există
e un raport direct prooporţional înttre creşterea mărimii eşanntionului şi ccreşterea câşştigului de
repreezentativitatee. Există o limita dincolo de caare nu se mai înregisstrează un plus de
repreezentativitatee

Dacă eşantioonul nu este asemănătorr populaţiei de d care se interesează unn studiu, se spune că
eşantionul este deforrmat sau conntorsionat. Tootdeauna există diferenţee între populaaţie şi eşantiooane, dar
acestea pot fi minim malizate prinn tehnici speecifice de prrelucrare staatistică. Tehnnicile de eşaantionare
vizează obţinerea unor u eşantioaane pe cât posibil de reprezentativve. În cele mai multe cazuri în
cercetăriile ştiinţifice din
d domeniul psihopedaggogic nu se operează
o cu un eşantion, ci cu mai muulte.
Eşantioanelee de numescc independennte în cazul în î care indivvizii care le ccompun nu sunt fizic
aceiaşi în fiecare din ele. Ilustrareea cea mai clară
c a unor astfel de eşaantioane sunt cele diferennţiate prin
sex (eşaantioane de bărbaţi,
b eşanntioane de femei). Eşantiooanele indeppendente se folosesc în cercetare,
c
în situaţţia în care cercetătorul vrea să evite e ca efecctele adiţionnale ale maanipulării moodalităţilor
variabilelor să se producă, cândd exista o coompletă incompatibilitate în succesiunea de mannipulare a
acestor modalităţi
m şi atunci când se doreşte a se evita efeectele oboseelii, scăderii m motivaţiei şi a atenţiei
din parteea indivizilor care le compun (în cazuul în care există o mare solicitare
s în ccadrul unor cercetări).
c

190
STATISTICĂ

Seriile de date se consideră că aparţin unor eşantioane independente şi când membrii aceluiaşi grup
de indivizi sunt supuşi la o solicitare în condiţii diferite.
Eşantioanele perechi sau dependente sunt formate din aceeaşi indivizi sau din grupe diferite
de indivizi, care au fost anterior egalizate în privinţa anumitor caracteristici (vârstă, sex, nivel de
şcolarizare, arie geografică de provenienţă etc.) şi pregătite cu grijă pentru competiţie. Aceste tipuri de
eşantioane au utilizări multiple în psihologie şi pedagogie, ale căror cazuri se pot grupa în trei categorii:
 Cercetări în care există necesitatea de a controla cât mai riguros un factor de variaţie. În cazul
cercetărilor longitudinale acelaşi eşantion este folosit mai mulţi ani, sau chiar mai multe decenii În
cercetările de psihosomatică cercetătorii utilizează acelaşi eşantion de persoane la un interval de
20 sau 30 de ani, după ce anterior au constatat prezenţa unor factori de ordin psihologic care
predispun la apariţia unei bolii cardiace sau de altă natură;
 Cercetări şi studii în care diferitele etape de măsură sunt legate între ele, în cazul în care un
cercetător îşi propune să aprecieze efectele cumulative ale manipulării variabilelor Exemple de
studii de acest gen sunt cele efectuate în privinţa efectului învăţării asupra memoriei;
 Cercetări în care se doreşte a se controla influenţa factorilor comuni eşantioanelor. În acest tip de
cercetări în care caracteristicile nu se raportează asupra trăsăturilor identice proprii indivizilor, ci
asupra caracteristicilor comune ale eşantioanelor.

Dacă în psihologie ar exista posibilitatea studierii populaţiilor întregi, statistica descriptivă ar fi


suficientă pentru a rezuma rezultatele observaţiilor. Însă, cel mai adesea, se lucrează cu eşantioane de
subiecţi (fapt ce duce la crearea distribuţiilor observate) provenind dintr-o populaţie, sau din mai multe
populaţii diferite.

EXEMPLU: Într-un studiu asupra caracteristicilor memoriei copiilor se vor putea face investigaţii
în mai multe clase primare pentru a observa cum se efectuează memorarea, care este geneza şi
evoluţia acesteia. Se va studia, în acest caz, un eşantion din populaţia elevilor din România, având
vârsta stabilită de cercetătorii care efectuează studiul. Dacă acelaşi studiu se va efectua asupra elevilor
de aceiaşi vârstă din şcolile din Egipt şi din Brazilia vor exista eşantioane provenind din trei populaţii
diferite.
Întrebarea care se pune este următoarea: dacă în mod global (nu neapărat pentru toţi indivizii,
ci doar pentru majoritatea dintre ei) se observă diferenţe de memorare între două eşantioane de elevi,
este posibil ca aceste diferenţe să existe şi la nivelul populaţiilor luate în întregime? Răspunsul la
această întrebare este foarte important, deoarece dacă se pot confirma diferenţele, se poate trage
concluzia existenţei diferenţelor între populaţii. Dacă nu se poate realiza acest lucru, nu se pot trage nici
concluzii asupra diferenţelor între populaţii (în ciuda diferenţelor obţinute la eşantioane) şi se poate
trage concluzia că geneza memoriei şi a diferitelor sale forme este universală, că ea urmează aceleaşi
faze şi etape la toţi copiii, indiferent din care zonă a planetei provin. În alte conjuncturi şi în alte situaţii,
miza nu poate fi la fel de importantă. Există în acest caz obligaţia de a arăta că ceea ce s-a obţinut
sau observat nu este pur fortuit şi ocazional, propriu doar eşantionului studiat, ci că avem de-a face cu
lucruri semnificative, suficient de generale, valabile pentru populaţie, adică dincolo de nivelul
eşantionului. Faptul observat are un caracter “sistematic”, aplicabil nu la toţi indivizii, nici la toate
eşantioanele de indivizi, ci la cea mai mare parte dintre acestea.
Demersul care constă în a generaliza pentru un ansamblu mai vast (populaţia), ceea ce se
observă pe un ansamblu mult mai restrâns (eşantion) este cel mai uzual în psihologie, pentru că
frecvent nu se cunosc statisticile descriind populaţia în întregime.
Mai rar, când se cunoaşte populaţia, problema este de şti dacă un eşantion observat este
conform, tipic acestei populaţii (compatibilă cu ea) sau dacă este atipic şi, probabil, rezultat din altă
populaţie. Avem un astfel de caz când se testează un model (elaborat de un cercetător) prezicând
răspunsurile aşteptate din partea subiecţilor. Este vorba de a şti dacă răspunsurile efective obţinute cu
un eşantion de subiecţi (plasaţi în condiţii definite prin model) sunt conforme predicţiilor acestuia.

191
AUREL STAN
T

Î cele douăă cazuri penttru a se pronunţa asuprra populaţiei (prin inferennţă, plecând de la un
În
eşantion), cercetătorul poate fi coondus la a uttiliza un intermediar: statistica inferenţţială. Este neecesar să
fie preciizate natura, statutul şi rolul acestei statistici ca şi distribbuţiile pe caare ea le reeprezintă.
Chestiunnile inferenţiaale, de generralizare sau de d compatibillitate, cuprindd statisticile ddescriptive: frecvenţe,
f
medii, chhiar dispersii (varianţe), precum
p şi differenţe de medii, de dispersii, de freccvenţe. Se voor trata în
cadrul statisticii
s inferrenţiale frecvvenţele şi mediile, precumm şi diferenţelle lor.

Repere bibliograficee
principale
 Anddrei,T., Stanccu, S., Statisttică - Teorie şi
ş aplicaţii, Editura All, Buucureşti, 19955
 Cloccotici, V., Staan, A., Statistică aplicată în psihologiee, Editura Polirom, Iaşi, 20000
suplimenntare
 Jem
mna, Dănuţ Vasile,
V Conceeptul de reprezentativitatte în cercetaarea statisticăă pe bază de sondaj,
Anaalele ştiinţificce ale Univerrsităţii „Alexaandru Ioan Cuza”
C din Iaşşi, Tomul L/LLI, Ştiinţe ecconomice,
20004-2005
 Porrojan, D., Staatistica şi teorria sondajului, Casa de edditură „Şansaa” SRL, Bucuureşti, 1993

O
Operaţia de construcţie a eşantioaneelor se numeeşte sondaj sau s eşantionaare. Se mai utilizează
termenii eşantionaj şi sondaj. De la începput trebuie conştientizat
c tă importanţaa căutării innformaţiei
"adevăraate", juste, adică
a a aceleei informaţii pe care am m avea-o dacă s-ar cercceta toţi indivizii care
compun populaţia. Ca atare, eşantioanelee trebuie săă fie cât mai m reprezenntative. Metoodele de
eşantionare se dividd, în mare, în eşantionnări aleatoriii şi eşantionări empiricce. Dintre tippurile de
eşantionări aleatorii cunoscute
c ennumerăm urm mătoarele:
 Eşanntionarea proobabilistică sau s eşantionaarea la întâm mplare. Acesst tip de eşantionare facce apel la
mecanismele dee extragere aleatorie (prrin tragere la sorţi) de indivizi caree compun eşşantionul.
Eşanntionarea “laa întâmplare”” constă în a preleva uniităţile la întâmplare dintrr-o anumită populaţie. p
Aceaasta presupuune că cerceetătorul dispuune de date referitoare la ansamblul populaţiei, adică de
bazăă de sondaj. În cazul cunoaşterii bazeei de sondaj se procedează prin trageere la sorţi a unităţilor.
În prrincipiu, trageerea la sorţi constituie ceea mai bună metodă de eşantionare,
e ddeoarece corespunde
modelelor statisttice folosite pentru analiză. Apoi se extrage, respectândr sspecificul aleeatoriu a
acesstui tip de eşşantionare, un u număr deeterminat de numere cupprinse între 1 şi n (notare pentru
volumul eşantionnului). Unităţţile coresponndente selecţţionate consttituie eşantioonul. Totuşi, acest tip
de eşantionare
e nu este cel mai adaptaat în acele studiis în caree unităţile dde eşantionare, astfel
seleccţionate, nu sunt disponibbil, mai ales când este voorba de persooane (este m mai uşor de a constitui
un eşantion
e de persoane
p penntru a le măssura greutateea, decât de a face un eşşantion statistic pentru
a măăsura atitudinnile). Din motive de fezabbilitate sau dee cost tragerrea la sorţi pooate fi preceddată de o
presstructurare em mpirică (deci nealeatorie)) a populaţieei, operaţie leegată de cunnoaşterea preealabilă a
acessteia. Tragerrea la sorţi elementară
e c
constă în a numerota
n toţţi indivizii caare compun populaţia
părinnte studiată, apoi de a extrage
e la înntâmplare o cantitate
c deffinită din aceeste numere, această
cantitate fiind effectiv eşantioonul. Se selectează indivizii corespunzând num merelor trasee la sorţi,
confform principiuului tragerii la loto. Este modul de eşantionaj cel mai probabbilist, dar carre are un
inconvenient maajor care connstă în faptul că este foaarte costisitorr în timp şi bbani. A invenntaria toţi
indivvizii populaţieei este o opeeraţiune deossebit de dificilă, urmată dee o alta la feel de dificilă, aceea de
a găăsi pe toţi indivizii traşi la sorţi. Acest tip
t de eşantioon se poate totuşi
t utiliza îîn studiile dee teren, în
studiile efectuatee pe copii unei u creşe, înn studiul efeectuat într-o întreprinderee sau, în geeneral, în
studiile efectuatee pe mici coleectivităţi.

192
STATISTICĂ

 Eşanntion prin traagere la sorţii secvenţialăă sau eşantioon cu mai muulte trepte. E Este o tragerre la sorţi
caree se efectueaază pe criteriii succesive. ÎnÎ primul rânnd se defineşşte o populaţiie pe un criteeriu dat şi
se extrage un priim eşantion urmând
u acesst criteriu. Appoi se defineşşte un al doileea criteriu în interiorul
acesstui eşantion şi se proceddează la o nouă n tragere la sorţi penttru elementeele iniţial seleecţionate.
Exem mplu de traagerea la soorţi secvenţială: în cazzul efectuăriii unui studiu asupra stress-ului s
profeesional în rândul infirmierelor din mediul spitaliceesc public, înn primul mom ment se seleccţionează
un eşantion
e de spitale,
s apoi, în al doilea moment, see extrage un eşantion dee infirmiere din fiecare
spitaal selecţionatt.
 Eşanntionaje prin grappes. Un U grappes este e un ansaamblu de unnităţi având o legătură “nnaturală”.
Exem mplu: elevii unei
u clase, clasele aceluiaaşi aşezământ şcolar, muuncitorii unui atelier, atelieerele unei
aceleeaşi uzine, articolele
a unuui jurnal, jurnnalele unui aceluiaşi
a grupp de presă. Unităţile com mponente
ale unui
u grappess se aseamănă mai mult între ele deccât cu alte unnităţi. Baza dde sondaj nu mai este
atunci ansambluul unităţilor susceptibile
s d a fi chesttionate, ci grrappes-urile. În anchetele asupra
de
şcoliii a devenit o procedură clasică
c faptull de a proceeda mai întâi la tragerea la sorţi prin hazard a
şcoliilor, apoi a claselor, apoi a elevilor înn interiorul nivvelelor şcolare. Este vorbba, în acest caz, de o
trageere la sorţi prin
p grappess de trei graade, pentru că c sunt utilizzate trei unittăţi de sondaaj legate.
Avanntajul acestui procedeu reezidă în faptuul că cineva nu are nevoie de a dispune de baza de d sondaj
relattivă la populaţia părinte şi în faptul că se limitează dispersia unităţiloor de contacctat. Este
neceesar, e totuşii, ca grappess-urile să fie de mărime suficientă
s î număr sufficient pentru ca să se
şi în
aplicce legea num merelor mari.

IMPORTANT T
Leegea numerrelor mari a fost formulată matemaaticianul şi fizicianul elveeţian Jacob Bernoulli
(1654-17705), aceastaa constituind bazele teoriiei probabilităăţii. Legea nuumerelor mari este o teooremă din
teoria probabilităţilor care descriee rezultatele unui experim
ment repetat ded mai multee ori. Conform
m acestei
legi, rezultatul mediuu obținut se apropie tot mai mult dee valoarea așteptată,
a cuu cât experim
mentul se
repetă de mai multe ori. Aceasta se explică prin p faptul căă abaterile întâmplătoare într-un sens sau altul
se comppensează recciproc.

 Eşanntionarea strratificată. În acest caz se divizeazză populaţia în subpopuulaţii numitee straturi,


dispunând fiecarre de caractteristici distinncte. Se exttrage un eşaantion din innteriorul fiecăărui strat.
Ansaamblul acestor eşantioane, care poot fi de mărime diferită, constituie eeşantionul de studiu.
Aceaastă metodă are ca prioriitate definireaa, în prealabbil, a subpopuulaţiilor sau sstraturilor. Aleegerea la
hazaard a unităţilor se face apoi în interiorul fiecăruui strat (definnit prin încruucişarea varriabilelor).
Aceaastă metodă este privileggiată când se realizează asupra bazei de caracteeristici specifice luate
dreppt criteriu de stratificare. Criteriile
C de stratificare
s a unităţilor suunt funcţie a specificului studiului.
Exemmplu: într-o anchetă
a asuupra comporttamentelor de cumpăraree a bunurilorr de consum zilnic se
stabilesc drept criterii:
c niveluul de venituri al menajuului, sexul, mărimea
m locaalităţii. Într-oo anchetă
asuppra opiniei eleevilor acesteea pot fi considerate nivelul şcolar şi reeuşita şcolarăă.

METODE DE EŞAANTIONARE EM
MPIRICE SAU METODE NEAL
LEATORII

Aceste metoode de eşantionare se baazează pe coonstruirea unnui eşantion aale cărui caracteristici
A
sunt celee mai apropiate de caraacteristicile esenţiale
e ale populaţiei, pornind
p de laa informaţiilee care se
posedă despre
d o poppulaţie.
 Eşanntionarea priin quote. Estte cel mai faamiliar tip dee eşantionaree şi constă îîn alegerea indivizilor
caree compun eşaantionul în aşşa fel încât caracteristicil
c e esenţiale ale
a populaţiei să se regăssească în

193
AUREL STAN

aceleaşi proporţii, sau după un anumit procent (quota), în eşantion. Prin acest tip de eşantionare se
construieşte un “model redus al populaţiei”. Mărimea diferitelor subgrupe constitutive ale
eşantionului este proporţională subgrupelor echivalente din populaţia părinte. Pentru acest tip de
eşantionare se mai utilizează denumirea “eşantionare proporţională”. Dacă în populaţia părinte
există 48% bărbaţi şi 52% femei, într-o anchetă purtată pe 1000 de persoane se vor chestiona 480
de bărbaţi şi 520 de femei. Pentru a realiza acest fel de eşantionare se stabilesc în prealabil cote
care se comunică persoanelor însărcinate cu înregistrarea informaţiilor. Indivizii sunt, în general,
mai greu de găsit dacă ei aparţin la o categorie cu frecvenţă redusă în populaţia părinte. După
stabilirea quotelor se examinează sau chestionează indivizii la concurenţa proporţiilor, ţinând
seama de criteriile fixate. Cele mai importante criterii pentru adulţi sunt: a) vârsta, b) sexul,
c) profesia, d) nivelul de venituri, e) zona locuită. La copii se consideră vârsta şi echivalentul său
(clasa şcolară), tipul de şcoală frecventat, profesiunea tatălui etc. Se pot colecţiona date până se
completează procentul grilei. În cazul sondajele de opinie, în care metoda de eşantionare prin quote
este foarte utilizată, variabilele cel mai frecvent utilizate sunt sexul, vârsta, mărimea comunităţii
locuite, localizarea geografică, profesiunea şefului de menaj, profesiunea persoanei chestionate ca
şi nivelul de studii. Fiabilitatea eşantionului este funcţie de justeţea descrierii populaţiei şi de
pertinenţa variabilelor alese pentru a determina quotele în legătură cu finalitatea studiului. În
domeniile de studiu noi şi în timpul bulversărilor sociale sau politice este adesea dificil de a
determina a priori variabilele pertinente.

EXEMPLU: să presupunem ca trebuie să construim un eşantion prin quote având volumul de 1200
de persoane şi trebuie să ţinem seama în colectarea datelor de variabilele sex, vârstă, nivel de
studii şi specificul localităţii de provenienţă. Sexul îl vom nota cu S, cu variantele S1 (masculin) şi S2
(feminin). Vârsta o vom nota cu V, având varianteleV1 (până la 25 ani), V2 (26-40 ani), V3 (41 ani de
ani şi peste). Nivelul de studii îl vom nota cu G, cu variantele G1 (studii generale), G2 (studii medii)
şi G3 (studii superioare). Specificul localităţii de provenienţă îl vom nota cu P, având variantele P1
(urban) şi P2 ( rural).
În continuare vom prezenta 2 tabele cu câte 36 de căsuţe fiecare (2·3·3·2=36). În tabelul din
stânga fiecare căsuţă va prezenta procentul din populaţia naţională (valorile sunt fictive)
corespunzător unei anumite combinaţii a variantelor sau modalităţii variabilelor amintite. În căsuţele
celui de-al doilea tabel vor fi trecute cifre reprezentând numărul proporţional de indivizi ai
eşantionului.

Situaţia existentă în populaţie Situaţia în eşantion


(exprimată procentual) (exprimată în valori absolute)
P1 P2 P1 P2
G1 G2 G3 G1 G2 G3 G1 G2 G3 G1 G2 G3
V1 3,4 2,8 1,7 2,8 2,0 1,9 V1 41 31 20 34 24 23
S1 V2 3,2 3,4 1,8 1,7 1,8 1,5 S1 V2 38 41 22 20 22 18
V3 4,8 1,9 2,7 3,8 4,2 1,9 V3 58 23 32 46 50 23
V1 2,6 2,5 2,3 3,7 2,8 2,7 V1 31 30 28 44 34 32
S2 V2 3,5 3,0 3,1 4,1 3,0 1,9 S2 V2 42 36 37 49 36 22
V3 4,3 3,1 1,4 4,0 3,4 1,5 V3 52 37 17 48 41 18

Cum se obţin valorile numerice pentru eşantion? În tabelul din dreapta, cuprinzând valorile
numerice ale eşantionului corespunzătoare procentelor existente în populaţie, celula S1V1P1G1
(conţinând numărul persoanelor din eşantion care sunt de sex masculin, au vârsta până la 25 de
ani, provin din mediul urban şi au studii generale) conţine cifra 41. Celula corespunzătoare din
tabelul cuprinzând situaţia procentuală din populaţie conţine valoarea 3,4 (exprimare procentuală).

194
STATISTICĂ

Valoarea 41 s-a obţinut prin înmulţirea valorii volumului eşantionului (1200) cu 0,034 (proporţia
corespunzătoare din populaţie obţinută prin transformarea valorii procentuale). Deci
1200×0,034=40,8, aproximativ 41 (menţionăm că toate valorile au fost întregite, deformarea
produsă fiind considerată neesenţială). 41 de subiecţi reprezintă 3,4% din volumul eşantionului. Se
procedează similar pentru toate celulele tabelului. Procentele cu care noi am exemplificat sunt
fictive, dar cele reale pot fi uşor de găsit în anuarele statistice.
 Eşantionare prin unităţi tip. Acest fel de eşantionare se obţine prin divizarea populaţiei părinte în
categorii cu ajutorul variabilelor care sunt considerate esenţiale pentru o anumită cercetare.
Obiectivul este de a construi un eşantion ale cărui caracteristici fac din el un eşantion susceptibil de
a furniza informaţii pertinente. Exemplul cel mai potrivit ar fi acela al unor eşantioane cuprinzând
infractorii tineri, indicat atunci când un cercetător îşi propune să studieze delicvenţa juvenilă.
Realizarea unor astfel de studii presupun depăşirea unor dificultăţi de natură organizatorică şi
metodologică.

ANCHETELE DIACRONICE

În unele situaţii de cercetare (în care există interes ştiinţific pentru un proces evolutiv) este
necesar de a se examina sau chestiona la date succesive acelaşi eşantion de subiecţi. În acest caz se
constituie ceea ce se numeşte un panel. Această metodă a fost descrisă de sociologul american Paul
Felix Lazarsfeld în anul 1938. Ea este utilizată, mai ales, pentru studiul evoluţiei comportamentelor
electorale. Institutele de sondaje au create paneluri permanente pe subpopulaţii specifice: medici,
avocaţi, auditori de radio şi televiziune, grupări religioase şi politice etc. Panelurile sunt utilizate şi în
situaţii în care un cercetător este interesat de a controla experienţa sau competenţa persoanelor.
Această tehnică prezintă interes în reperarea indivizilor care îşi schimbă opiniile şi atitudinile şi
a celor care nu şi le schimbă, având drept finalitate aprecierea nivelului acestei stabilităţi sau evoluţii.
Ea prezintă unele inconveniente, deoarece persoanele care acceptă de a face parte dintr-un panel au
caracteristici particulare (disponibilitate, sociabilitate) şi este dificil de a discerne în privinţa variabilelor
care influenţează, conduitele, opiniile sau atitudinile. Atitudinile se pot schimba prin faptul de a fi
membru al unui panel (de exemplu tendinţa de a produce răspunsuri conformiste, de a rămâne coerent
în timp). De asemenea, există un risc de obsolescenţă a panelului (caracteristica unui produs de a fi
depăşit, de a pierde o parte din valoarea sa), datorat evoluţiei persoanelor (îmbătrânire, schimbarea
profesiei, oprirea colaborării, schimbarea locuinţei).

MĂRIMEA EŞANTIONULUI

Determinarea mărimii eşantionului ce urmează a fi constituit este o problemă foarte importantă.


Numărul persoanelor examinate sau chestionate trebuie să satisfacă: exigenţa de a fi destul de precis
în estimarea populaţiei părinte şi pe aceea de a fi apt de a da informaţii fiabile, ţinând cont de
caracteristicile care interesează. De exemplu, în cazul sondajului de opinii asupra intenţiilor de vot între
două alegeri este important ca persoanele să fie chestionate într-un interval temporal foarte scurt,
deoarece se cunoaşte faptul că preferinţele electorale sunt foarte fluctuante şi că anticiparea rezultatului
votului constituie interesul major al operaţiei. Numărul de persoane chestionate trebuie să fie optim
limitat, din cauza costurilor sondajului şi a numărului de anchetatori specializaţi la care este posibil de a
face apel într-un timp scurt. Pe de altă parte volumul eşantioanelor trebuie să fie suficient de mare,
deoarece estimarea trebuie să fie suficient de precisă, cu atât mai mult cu cât candidaţii sunt numeroşi.

195
AUREL STAN

DEFORMĂRILE SISTEMATICE ALE REZULTATELOR

În cazul în care unităţile de eşantionare sunt fiinţe umane există în mod necesar surse de
deformare sistematic a rezultatelor care intervin în apreciere. Un termen din ce în ce mai utilizat în
literatura de specialitate străină pentru denumirea acestor deformări ce au un caracter sistematic este
cel de biais. În fond, nimeni nu este obligat să furnizeze informaţii. Deformările informaţiilor oferite de
eşantionare există indiferent de metodele folosite. Direcţiile din care poate veni deformare sunt:
 în cazul unei eşantionări probabiliste, o parte din indivizii care fac parte din eşantionul prevăzut nu
răspund la chestionar;
 în cazul unei eşantionări prin quote putem să avem o suprareprezentare a anumitor categorii de
persoane (este mai posibil de a întâlni mai multe femei decât bărbaţi, rurali trăind în oraş decât
rurali izolaţi.
 chestionarea persoanelor prin telefon (acelea care nu au telefon nu sunt întrebate) sau în locuri
frecventate în mod obişnuit de o anumită categorie de persoane.
Controlul acestor deformări, sau, mai bine spus, limitarea lor, se realizează prin impunerea de
reguli privind chestionarea: a nu chestiona amici şi cunoştinţe, a varia locurile şi orele de chestionare, a
nu chestiona mai multe persoane care aparţin la aceluiaşi grup (membrii aceleaşi familii) dacă aceasta
nu este prevăzut în mod expres. Institutele de sondaje exercită un control permanent asupra celor ce se
ocupă cu chestionare persoanelor, deoarece cunosc faptul că nivelul calităţii unei anchete depinde de
respectarea regulilor de eşantionare, reguli care au fost concepute în funcţie de finalitatea studiului. În
ciuda acestor controale, ţinând cont de diversitatea surselor de deformare, se estimează că metoda
quotelor dă, în general, rezultate mai puţin satisfăcătoare decât alte metode. Atunci când este posibil de
aprecia importanţa deformărilor se procedează la aplicarea unor procedee de corecţie a datelor
obţinute. Această corecţie nu este posibilă decât dacă există o bună cunoaştere a populaţiei cuprinse în
studiu şi a modelelor adecvate care permit redresarea lor.
Operaţia de redresare a eşantioanelor presupune o serie de riscuri. În sondaje se introduc
adesea întrebări care vizează sinceritatea răspunsurilor. De exemplu, când se întreabă despre intenţia
de vot, se întreabă şi de votul precedent. Dacă există nepotriviri mari se operează o redresare şi o
ponderare.
Precizare. Noţiunea de biais (în limba franceză), bias (în limba engleză) apare frecvent în
articolele ştiinţifice de cercetare în domeniul psihologiei şi nu numai. Cea mai adecvată traducere pentru
aceşti termeni este de eroare sistematică sau distorsiune. Pentru a da un exemplu în privinţa distorsiunii
rezultatelor, amintim faptul că în operaţiunea de eşantionare sau sondaj operăm cu trei feluri de
distribuţii: distribuţia populaţiei, distribuţia eşantionului şi distribuţia de sondaj:

TIPURI DE DISTRIBUŢII ÎN STATISTICA INFERENŢIALĂ

Distribuţia populaţiei

Distribuţia Distribuţia de
eşantioanelor sondaj

Să presupunem că avem la dispoziţie valorile de examinare la un test psihologic la o populaţie


formată din cinci indivizi. Aceste valori sunt:

196
STATISTICĂ

Distribuția populației

17

18 Media populaţiei = 19,00

19
N = v olumul populaţiei = 5

20

21

Volumul populaţiei N=5 şi media populaţiei este egală cu 19. Să presupunem că am scris pe
bileţele fiecare din valorile la examinare şi că le-am introdus într-o urnă, de unde ne-am propus să
extragem 110 eşantioane de câte 3 indivizi. Rezultă 10 distribuţii de eşantioane:

DISTRIBUŢIILE EŞANTIOANELOR
VOLUMUL FIECĂRUI EŞANTION = 3
Nr. eşantion Valori ale variabilei X Medie Inexactitate

1 17 18 19 18,00 - 1,00

2 17 18 20 18,33 - 0,67

3 17 18 21 18,67 - 0,33

4 17 19 20 18,67 -0,33

5 17 19 21 19,00 0,00

6 17 20 21 19,33 0.33

7 18 19 20 19,00 0,00

8 18 19 21 19,33 0,33

9 18 20 21 19,67 0,67

10 19 20 21 20,00 1,00

Am înregistrat mediile eşantioanelor şi diferenţa dintre media populaţiei (egală cu 19) şi media
eşantionului, numită exactitate, nu eroare, deoarece este firesc faptul ca media populaţiei şi mediile
eşantioanelor să nu fie identice. Dacă adiţionăm inexactităţile obţinem valoarea 0 (valorile negative sunt
anulate de cele pozitive).
Distribuţia de sondaj este distribuţia mediilor eşantioanelor, deci distribuţia unor indicatori ai
eşantioanelor.

197
AUREL STAN

Distribuţia de sondaj
Medie
18,00
18,33
18,67
18,67
19,00 Eşantionare nedistorsionată : media
19,33 populaţiei = valoarea scontată a mediei =
19,00 19,00
19,33
19,67
20,00
19,00
Valoare scontată a mediei

Observăm cu uşurinţă faptul că media distribuţiei populaţiei şi media distribuţiei de sondaj sunt
identice. Această extragere este nedistorsionată.
Însă, dacă sustragem din urnă o valoare, rezultă următoarele eşantioane:

EŞANTIONARE DISTORSIONATĂ
(LIPSA VALORII 21)

Nr.eşantion Valori ale variabilei X Media

1 17 18 19 18,00

2 17 18 20 18,33

3 17 19 20 18,67

4 18 19 20 19,00

Valoare scontată a mediei 18,50

Observăm de această dată că valorile mediei populaţiei şi a distribuţiei de sondaj nu mai sunt
identice. Diferenţa din valoarea 19 (media populaţiei) şi valoarea 18,5 (media distribuţiei de sondaj) este
de 0,5, care se numeşte distorsiune.

198
STATISTICĂ

Repere bibliograficee
orii
obligato
▪ Cloccotici, V., Stan, A., Statistiică aplicată în
î psihologie,, Editura Poliirom, Iaşi, 20000
▪ Gueguen, N., Maanuel de stattistique pour psychologue
p es, Dunod, Paaris, 1997
suplimeentare
▪ Rotaariu,T., Metodde statistice aplicate
a în şttiinţele socialle, Polirom, Iaaşi, 1999

199
AUREL STAN
T

UNITAT
TEA DE ÎN
NVĂȚARE 7.7
PROBAABILITATE
E ȘI DISTR
RIBUȚIA PR
ROBABILIT
TĂȚILOR. INTERVALLELE DE
FLUCT
TUAŢIE A MEDIILOR
M PROVENIND DINTR
R-UN EŞAN
NTION

CONSIDERAŢII
O P
PRELIMINARE

Accest domeniuu aparţine sttatisticii inferrenţiale, adică acelui dom meniu care sse foloseşte de d datele
oferite dee statistica descriptivă
d în scopul de a face prognooze. A înţelegge statistica inferenţială înseamnă
î
a înţelegge metodelee de a evaluua probabilitaatea teoreticcă de apariţţie a unor feenomene cu caracter
aleator. Inferenţa staatistică este fondată pe evaluarea unei u probabiilităţi teoreticce de apariţiie a unui
fenomenn observat, probabilitate în î funcţie de a cărei valoaare statisticiaanul stabileştte decizia pe care o ia
într-o annumită probleemă. În funddamentarea deciziilor opperează în multe m situaţii teoria probaabilităţilor,
domeniuu ştiinţific cerccetat în princcipal de mateematicieni speecializaţi carre-i asigură o abstractizarre de înalt
nivel.

IMPORTANT T
Teoriia probabilittăţii - Este o teorie mattematică a fenomenelor
f aleatorii, addică a fenommenelor a
căror apariţie este suub semnul haazardului. Oppus noţiunii de fenomen aleatoriu,
a de hazard, este noţiunea
de fenom men determinnat, care estee un fenomenn a cărui apaariţie se poatte prevedea pprin cunoaşteerea unor
legături cauzale.
c Se introduc fărăă a fi definite concepte fuundamentale şi se enunţăă, fără a le demonstra
axiomelee teoriei, caree descriu prooprietăţile conceptelor funndamentale. Teoria se coonstruieşte cu ajutorul
concepteelor fundameentale şi a axxiomelor. Reezultatele obţinute prin raaţionamente logice sunt denumite
teoremelle teoriei.
Alegeerea concepttelor fundam mentale şi a axiomelor este motivatăă de necesitaatea construcţiei unui
model, adică
a a unei descrieri
d ideaalizate a unorr fenomene observabile.
o
Din acest unghhi de vedere, concepttele fundam mentale coreespund noţiunilor experimentale
proprietăăţilor acestoraa.
Pentrru ca o teoriee să aibă creedibilitate estte necesar caa teoremele sale demonsstrate în caddrul teoriei
să poatăă fi confruntatte cu faptele observate, cuc realitatea empirică.
e
Verifiicare teoremelor sau proopoziţiilor în realitatea
r em
mpirică consttituie o bază de acceptarre a altor
propoziţiii (care urmeaază o cale dee verificare).
Experienţa confruuntării lumii empirice
e cu modelele
m a dus
d la constaatarea existeenţei unor asppecte ale
realului necuprinse
n î model, sittuate în afaraa modelului, şi existenţaa unor părţi îîn interiorul modelului
în m
care nu au corespoondent în luumea care se modeleaază. Teoria probabilităţii cuprinde noţiuni n ca
evenimeent, mulţime de bază, teoria mulţimillor şi operaţiii inspirate din d teoria muulţimilor, probbabilitate,
spaţiu ded probabilitaate, evenimeente echiproobabile, funccţie de repaartiţie, densittate de probbabilitate,
repartiţii teoretice. Studierea
S unuui fenomen aleatoriu
a îşi propune, în primul rândd, să stabileaască lista
rezultateelor posibile.

Pentru dimeensiunea pe care şi-o prropune cursuul nostru, meenţionăm că apropierea de acest
domeniuu al teoriei proobabilităţilor este una em
mpirică, adicăă bazată pe exemple
e conccrete ce au o anumită
valoare ilustrativă.
Evaluarea prrobabilităţii se
s bazează pep principiul urnei. Cele maim clare ilusstrări ale proobabilităţii
rezultatee din tragereea la sorţi suunt aruncarea unei moneede în sus şi ş extragereaa succesivă a 10 bile
dintr-o urnă care connţine 50 de bile albe şi 500 de bile negre. Dacă aruuncăm o monneda în sus în î serii de
câte 10 aruncări şi realizăm serrii de ordinuul miilor, probbabilitatea de a rezulta anumite prooporţii ale
capului sau pajurei se distribuiee conform exigenţelor
e unei
u distribuţţii normale G
Gauss, care poate fi

200
STATISTICĂ

transpusă grafic în aşa-numita curbă normală Gauss. Numărul de posibilităţi este foarte mare, în situaţia
în care se fac lansări în serie mare. Dacă s-ar face doar 2 lansări ale unei monede, am avea 4
posibilităţi teoretice diferite de succesiune a capului sau a pajurei:

Cap Cap
Cap Pajură
Pajură Cap
Pajură Pajură

La un număr de două posibilităţi la fiecare aruncare a unei monede (în serii de câte 10 aruncări)
avem 210 posibilităţi concrete de apariţie. Exemplu: pentru proporţia de ori 9 cap şi 1 pajura avem printre
variante:

Nr.crt. 1 2 3
4 5 6 7 8 9 10
1 C C C
C C C C C C C
2 C C C
C C C C C C P
3 C C C
C C C C C P C
4 C C C
C C C C P C C
… … … … … … … … … … …
… P P P P P P P P P P

În care cu C se notează apariţia capului şi cu P apariţia pajurei.


Numărul diferitelor proporţii de apariţie poate fi estimat cu ajutorul formulei:
NT !
NPI 
NI !*NT  NI !
în care: NPI - numărul de proporţii identice;
NT - numărul de trageri;
NI - numărul de evenimente identice
NPI
PAP 
NC
în care: PAP - probabilitatea de apariţie a unei proporţii
NPI - numărul de proporţii identice;
NC - numărul de combinaţi.
Cu ajutorul unor astfel de formule se pot obţine toate probabilităţile de apariţie a proporţiilor posibile,
oricare ar fi numărul de lansări succesive care s-ar practica. Probabilitatea de a obţine 2 pajuri
succesive în cursul a 10 lansări succesive (din 1024 de serii de lansări) este:
10! 10 x9 x8 x7 x6 x5 x 4 x3 x 2 x1
NPI (2)    45
2! x(10  2)! (2 x1)! x(8 x7 x6 x5 x 4 x3 x 2 x1)
45
PAP   0,0439
1024 , deci aproximativ 4,4%.

Se poate astfel obţine probabilitatea pentru fiecare din proporţii.

   

201
AUREL STAN

Nr.crt. Evenimentul căutat Numărul de apariţii Probabilitatea


1 0 1 0,10%
2 1 10 0,98%
3 2 45 4,59%
4 3 120 11,72%
5 4 210 20,51%
6 5 252 24,61%
7 6 210 20,51%
8 7 120 11,72%
9 8 45 4,59%
10 9 10 0,90%
11 10 1 0,10%
Total 1024 100,00%
Cu un astfel de tabel se poate imediat evalua probabilitatea de apariţie a unei trageri conţinând o
proporţie dată.
Observăm că probabilităţile extreme (de 10 ori pajura şi de 10 ori capul) se întâlnesc foarte rar, şi
o repartiţie egală (de 5 ori pajura şi de 5 ori capul) are o mare frecvenţă. Dacă efectuăm o histogramă a
frecvenţelor absolute de apariţie a diferitelor proporţii vizualizăm că anumite proporţii sunt mult mai
frecvente decât altele. Pentru ca aceste frecvenţe de apariţie să poată lua forma curbei normale Gauss
trebuie să avem un mare număr de aruncări. Deci, cu cât numărul de aruncări este mai mare cu atât
putem să prognozăm mai bine numărul de apariţii a unei frecvenţe.

300 252
250 210 210
200
150 120 120
100
45 45
50 0 10 10 0
0
1 2 3 4 5 6 7 8 9 10 11

Cazul când într-o urnă se află 100 de bile dintre care 30 albe şi 70 negre. Formula este
următoarea:
NT !
PAP  xP!NE xP 2 NT  NE
NE! x( NT  NE )!
în care - PAP- probabilitatea de apariţie a unei proporţii:
NT- numărul de trageri;
NE - numărul de evenimente identice,
P1 - probabilitatea primului element;
P2 - probabilitatea celui de-al doilea element17.

                                                            
17Formulele au fost preluate din lucrarea lui Nicolas Gueguen «Manuel de statistique pour psychologues», Dunod, Paris,
1997, pag.72-73

202
STATISTICĂ

Ştiind că P1 poate caracteriza proporţia bilelor albe şi P2 proporţia bilelor negre şi că NT


caracterizează mărimea eşantionului se poate calcula probabilitatea exactă de a obţine nu importă ce
proporţie de bile albe şi bile negre într-un eşantion de mărime definită.

EXEMPLU
Care este probabilitatea de a obţine 3 bile albe provenind din 8 trageri?
P1=0,3 P2 = 0,7 (exprimate în scala de la 0 la 1). Se remarcă că 1- P1 = P2. NT=8. NE=3.
Probabilitatea este următoarea:
8!
x0,33 x0,7 83  0,2541
3! x(8  3)!
Probabilitatea este de 0,2541 adică 25,41% şanse de a găsi 3 bile albe în eşantionul nostru.
Probabilitatea de a găsi 7 bile albe va fi de:
8!
x 0,37 x 0,7 8 7  0,001225
7! x (8  7)
deci, există 0,12% şanse de a obţine un eşantion conţinând 7 bile albe.
Principiul urnei funcţionează asupra măsurătorilor de intervale continue şi discontinue.
Oferim în continuare un exemplu de conformitate la distribuţia normală Gauss-Laplace a
rezultatelor extragerii de eşantioane dintr-o populaţie. Este un exemplu simplu, bazat pe o populaţie
restrânsă18.
La o populaţie definită de 8 subiecţi se efectuează o sarcină de învăţare a unei listei de 20 de
cuvinte concrete. Se obţin următoarele scoruri:

Subiect 1 2 3 4 5 6 7 8
Scorul de învăţare 6 8 7 10 9 11 12 5

Se poate considera că cei 8 subiecţi aparţin populaţiei părinte. Să presupunem că noi vom extrage
la întâmplare din această populaţie câte 2 subiecţi din această populaţie şi efectuăm media scorurilor
lor. Mediile pe care le obţin trebuie obligatoriu să corespundă la una dintre mediile conţinute în tabloul
următor. În total au putut fi constituite un număr de 28 de eşantioane.

5 6 7 8 9 10 11 12
5
6 5,5
7 6,0 6,5
8 6,5 7,0 7,5
9 7,0 7,5 8,0 8,5
10 7,5 8,0 8,5 9,0 9,5
11 8,0 8,5 9,0 9,5 10,0 10.5

12 8,5 9,0 9,5 10,0 10,5 11,0 11,5

Se prezintă tabelul cu efectivele fiecărei medii distinctive obţinute:

Valoare 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 10,0 10,5 11,0 11,5
Efectiv 1 1 2 2 3 3 4 3 3 2 2 1 1

                                                            
18 vezi Nicolas Gueguen, op.cit., pag. 74

203
AUREL STAN

Vom transpune grafic această distribuţie, prin intermediul unei histograme.

5
4
4
3 3 3 3
3
2 2 2 2
2
1 1 1 1
1
0
1 2 3 4 5 6 7 8 9 10 11 12 13
Aspectul distribuţiei este foarte apropiat de cel teoretic elaborat de Gauss-Laplace. Distribuţia
apare perfect simetrică. Se poate verifica această simetrie calculând media, mediana şi modulul acestei
distribuţii a mediilor. Pentru toţi aceşti indicatori de tendinţă centrală se va obţine valoarea 8,5.
Distribuţia normală se caracterizează printr-o medie corespunzând punctului cel mai înalt al curbei şi
printr-o varianţă caracterizând modul general în care se dispersează valorile distribuţiei în jurul acestei
medii. Din raţiuni practice valoarea acestor parametri a fost fixată odată pentru totdeauna prin legea
normată centrată redusă. Am descris-o anterior, în capitolul destinat indicatorilor statistici, odată cu
tratarea valorilor normate z. Este o variantă practică a distribuţiei normale Gauss-Laplace. Media
distribuţiei centrate reduse este egală cu 0 şi abaterea standard este egală cu 1. Această curbă este
normată prin valoarea celor doi parametri. Curba care caracterizează această lege este continuă.
Cunoscând proprietăţile distribuţiei acestei curbe putem afla probabilitatea teoretică de apariţie a unui
eveniment, adică a uneia din variantele posibile a unei distribuţii. Mai bine spus, într-o distribuţie
centrată redusă putem să apreciem sau să estimăm probabilitatea de apariţie a intervalului mergând de
la media distribuţiei până la valoarea corespunzând fenomenului studiat.

PRINCIPIUL ABATERII CENTRATE REDUSE


X X
Formula abaterii centrate reduse este următoarea z  , în care X este variabila brută a
s
distribuţiei, X media distribuţiei eşantionului şi s abaterea standard a distribuţiei eşantionului. Această
transformare nu poate să se realizeze decât dacă distribuţia studiată prezintă o formă normală. Este
necesar să facem o distincţie în privinţa notării indicatorilor populaţiei şi ai eşantioanelor. Pentru a nota
media unei populaţii vom utiliza litera grecească μ. Pentru notarea abaterii standard a unei populaţii
vom utiliza litera grecească σ. Pentru a nota volumul unei populaţii vom folosi litera n. Notarea mediei
eşantionului se va face prin X . Prin s vom nota abaterea standard a unui eşantion şi prin N volumul
eşantionului. Aceste convenţii de notare sunt respectate parţial, motiv pentru care trebuie să fim atenţi,
atunci când analizăm o lucrare ştiinţifică de statistică, la convenţiile cu care se operează. Studiul
principiilor de extragere a eşantioanelor în interiorul unei urne indică că mediile acestora şi proporţiile
acestora tind să prezinte caracteristicile populaţiei din care au fost extrase. Se poate prevedea media şi
proporţiile pe care le va avea un eşantion oarecare, dacă acesta este extras dintr-o populaţie ai cărei
parametri sunt cunoscuţi şi invers (μ,  şi n).

204
STATISTICĂ

IMPORTANT T
Obiectivul coonstă în a prrevedea valoorile anumitorr parametri pornind
O p de laa indicatorii iddentificaţi
într-un eşantion,
e şi innvers, a prevvedea valorile unor indicaatori ai unui eşantion porrnind de la parametrii
p
unei poppulaţii. Specifficăm că noţiunea de paraametru o foloosim numai pentru
p populaaţie. Se va trrece de la
funcţia de
d descriere la funcţia dee inferenţă. Regula
R care prezidează
p u
utilizarea tabeelelor centratte reduse
(prezentâând o formă normală) treebuie să fie sccrupulos resppectată.

Tabelele disttribuţiei respeective se găssesc în anexxele cursului nostru. În staatistica infereenţială un


T
concept important este pragul de d încredere. Intervalele de fluctuaţiee ale mediiloor şi proporţţiilor sunt
noţiuni esenţiale
e alee rezumateloor distribuţiiloor de măsurră. Aceste inntervale sunt construite pentru a
apropia cuc cea mai marem certitudine posibilă media m sau prroporţia pe care
c o ia un eeşantion extraas dintr-o
populaţiee pentru caree este cunosccută media, abaterea
a standard şi voluumul.
A controla gradul
g de ceertitudine adooptat comportă un anum mit risc de erroare de a nu n vedea
media saau proporţia de d eşantion în î intervalul astfel
a calculaat. Pragul de încredere esste riscul de eroare
e de
a nu luaa în calcul aceste
a două evenimentee posibile. Astfel, există în cazul aruuncării în suus a unei
monede 99,8% din 100 de a avvea un eşanttion conţinânnd între 1 şi 9 pajurii. Inntervalul 1-9 se poate
reduce dar
d pragul dee încredere see reduce. Astfel:
 înntre 2 şi 8 see găsesc 98,225% din cazuuri;
 înntre 3 şi 7 see găsesc 89,007% din cazuuri.
A
Aceste proccentaje de interval se stabilesc
s prin adiţionareea procentajeelor fiecărei variante
expuse anterior
a în taabel. Astfel pentru
p a rezzulta 97,74% cazuri adunnăm procentajele de la variantelev
2,3,4,5,66,7,8, (4,59% % +11,72% + 20,51% + 24,61% + 20,51% 2 + 11,72% + 4,599%). Pentru a rezulta
89,07% cazuri adunăăm procentajele de la varriantele 3,4,5,6,7, (11,72% % + 20,51% + 24,61% + 20,51% 2 +
11,72%).
A stabili praggul de încreddere înseam mnă a ne punne următoareea întrebare:: “Care va fi valoarea
mediei populaţiei
p din care a fost extras
e un eşaantionul, în aşa
a fel încât intervalul
i pe care îl calcuulez să nu
ia în connsideraţie proobabilitatea extremă?”.
e P
Probabilităţile
e extreme sunt uşor locallizabile şi sunt situate
în supraffaţa care răm mâne din supprafaţa curbeei dincolo de a anumită valoarev a abaaterii de la medie.
m Ne
servim ded valoarea z ca de un cooeficient de control
c a ampplitudinii interrvalului căutaat. Această valoare va
fixa riscuul de a găsi media
m sau prroporţia eşantionului dincoolo de limita acestor abatteri. Cu cât valoarea z
este maai mare, cu atât a riscul de a găsi o valoare exteerioară aprecciabilă va fi mai slab. Pragul P de
încrederee este adaptarea celui mai bun compromis posibil.
S vedem ce
Să c număr dee valori ale unei u distribuţii centrate reduse
r poatee rămâne diincolo de
valoareaa z egală cu 0,74.
0 Căutămm în tabelul anexă valoareea z indicată::

Z 0,00 0,01 0,002 0,03 0,04 0,05 0,006 0,07 0,08 0,09
0,0
0,1
0,2
0.3
0,4
0,5
0,6
0,7 0,4593

După cum inndică tabeluul 45,93% din


D d numărul valorilor vaariabilei (am făcut transsformarea
procentuuală prin înm
mulţire cu 1000) se găsescc în afara inteervalului –0,77z şi +0,7z, sau mai binee spus în

205
AUREL STAN

intervalul X ±0,7z. Jumătate din valorile cuprinse în acest procent (45,93) valori aparţinând unei
distribuţii care se conformează exigenţelor distribuţiei centrate reduse (adică 22,965%), sunt mai mici
decât –0,7z şi jumătate mai mari decât +0,7z.

VALOAREA PRAGULUI DE ÎNCREDERE

Noţiunea cea mai dependentă de responsabilitatea celui care efectuează măsurători este nivelul
de încredere pe care un cercetător doreşte să-l acorde estimării fluctuaţiei eşantionării. Marea
majoritate a autorilor de specialitate par a fi de acord să plaseze nivelul de încredere acceptabil la 95%.
Aceasta înseamnă că valoarea pe care o ia un indicator al eşantionului are 95 şanse din 100 de a
aparţine la intervalul calculat (el nu are 5% şanse să aparţină acestui interval). 95% este un prag minim
care are şanse să crească la 99% sau chiar 99,99%. Când dorim, cu orice preţ, să ne păzim de o
eroare, există riscul de a cădea în alta. Dacă pragul trebuie să fie mai ridicat, aceasta depinde de o
solidă reflexie teoretică pe conjunctura unei inferenţe statistice. Pentru efectuarea calculelor va trebui să
aducem în atenţie o nouă noţiune, şi anume noţiunea de eroare standard a mediei. În vederea stabilirii
intervalului de fluctuaţie a unei medii a populaţiei sau a eşantionului. Trebuie să adăugăm la mediile
respective o marjă de eroare (ME). Marja de eroare este compusă dintr-o variabilă (z pentru un anumit
prag de încredere) şi o constantă (eroarea standard). Când estimăm intervalul de fluctuaţie a mediei

unui eşantion de va folosi abaterea standard a populaţie în determinarea erorii standard ( ) şi când
N
estimăm intervalul de fluctuaţie a mediei unei populaţii se va folosi abaterea standard a eşantionului în
s
determinarea erorii standard ( ).
N
s
Astfel IFP = X ± ME sau IFP = X  z *
N
în care: X = media eşantionului
ME = marja de eroare
z = variabila normată cu acelaşi nume
N = volumul eşantionului
IFP = intervalul de fluctuaţie a mediei populaţiei.
Pentru calculul intervalului de fluctuaţie a mediei unui eşantion în condiţiile în care cunoaştem
media şi abaterea standard a populaţie, avem la dispoziţie următoarea formulă:

IFE = μ ± ME sau IFE =  z * ;
N
în care:
- σ = abaterea standard a populaţiei;
- N = efectivul eşantionului;
- μ = populaţiei;
- N = volumul eşantionului;
- z = variabila normată cu acelaşi nume;
- ME = marja de eroare.

Intervalul de fluctuaţie a mediei la diverse praguri de încredere


Exista o simetrie a valorii marjelor de fluctuaţie - limita superioară şi limita inferioară.

EXEMPLU: Populaţie compusă din 12 indivizi cărora li s-a aplicat proba de dexteritate manuală O'Connor
(exemplu fictiv, în practica profesională foarte rar se poate întâlni o populaţie de 12 indivizi).

206
STATISTICĂ

Subiect 1 2 3 4 5 6 7 8 9 10 11 12
Valoare 16 6 9 12 7 13 8 10 17 15 14 11

Vom calcula media şi abaterea standard a acestei distribuţii a valorilor populaţiei:


Aplicăm formula pentru calcularea mediei
Nr.crt. X x x2
 
1 16 4.50 20,25 X 138
aritmetice:  11,5 . Simbolul
2 6 - 5,50 30,25 n 12
3 9 - 2,50 6,25 utilizat pentru desemnarea mediei este adaptat
4 12 0,50 0,25 pentru populaţie. În continuare, aplicăm formula
5 7 - 4,50 20,25 pentru calcularea abaterii standard. În primul rând
6 13 1,50 2,25 vom calcula varianţa, după formula pentru date
7 8 - 3,50 12,25 negrupate, apoi abaterea standard:

2   
2
8 10 - 1,50 2,25 x 143
 11,91 . Pentru calcularea
9 17 5,50 30,25 n 12
10 15 3,50 12,25 abaterii standard extragem rădăcină pătrată din
11 14 2,50 6,25 varianţă:   11,91  3,45 .
12 11 - 0,50 0,25
Să presupunem că prelevăm la întâmplare
Σ 138 143
un eşantion din doi subiecţi în această populaţie şi să
încercăm de a prezice cu un prag de încredere de 95% (deci un risc de eroare de 5%) intervalul de
fluctuaţie a mediei acestui eşantion. Tabelul legii normale centrate reduse ne furnizează pentru un risc
de 5% o valoare z egală cu 1,96. Pentru a afla această valoare z = 1,96 căutăm în celulele tabelului
legii normale reduse valoarea 0,05. Valoarea z corespunzătoare va fi 1,96.

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0
0,1
…….……….…….…………………………….. ……..……..……….
1,90 0,0500

Deci, dincolo de intervalul valoric – 1,96z + 1,96z nu mai rămâne decât 5% din suprafaţa curbei.
Deci, intervalul de fluctuaţie a mediei unui eşantion extras la întâmplare din populaţie se poate afla
3,4
aplicând formula: IFE  11,5  1,96 x  11,5  4.10 . Deci, cu un risc de eroare de 5% putem să
2
estimăm că media eşantionului poate oscila între 7.40 (11,5 - 4,10) şi 15.60 (11,5 + 4,10) Dacă privim
tabloul datelor culese prin examinare observăm că marea majoritate a mediilor eşantioanelor se
încadrează între aceste limite fixate de medie şi abaterile erorii standard (pentru a verifica acest lucru
putem să facem media a câte două valori din populaţie pe care s-a exemplificat).

CONTROLUL PARAMETRILOR DE FLUCTUAŢIE

Marja de fluctuaţie depinde de 3 parametri care nu exercită acelaşi grad de influenţă asupra
amplitudinii intervalului.
 Pragul de încredere. Creşterea amplitudinii intervalului de încredere are efect direct asupra
concluziilor care se pot trage. Se poate ajunge la două concluzii diferite (opuse în aparenţă) după
nivelul de încredere ales. Este foarte important de a determina bine nivelul de încredere care se acordă
estimaţiilor noastre, dacă nu dorim să ajungem la concluzii eronate.

207
AUREL STAN
T

 Varianţa estee dificil controlabilă peentru că ea reezultă din măsurătorile eefectuate în populaţie.
p
Precizia este cu atât mai importantă (intervaluul va fi mai înngust în jurull mediei) cu ccât dispersiaa va fi mai
mică, daar nu se poatte întâlni situuaţia în care varianţa să nun acţionezee asupra valoorii. Micşorarrea valorii
varianţei într-o populaţie nu este posibilă deccât dacă se identifică în populaţie
p indivizii care prroduc cea
mai marre dispersie (şi de connstatat dacă ei nu sunt bolnavi în momentul eefectuării unnei probe
psihologice, dacă au înţeles ceeaa ce li se cerre, dacă au mai m făcut ceeea ce li se ceere pe când alţiia nu au
făcut). Pe scurt, trebbuie să se verifice echivalenţa factoriloor de variaţiee pentru fiecaare subiect.
 Mărimea eşantionului.
e A priori, nimmic nu ne împiedică să folosim atââţia indivizi câţi c dorim
pentru ceercetare. În schimb,
s se pune
p şi probleema costului general caree corespundee măririi num mărului de
indivizi. Mărirea
M eşanntionului nu este
e proporţioonală valorii sale, ci rădăcinii pătrate a acestei vallori. Dacă
dorim o precizie de zece
z ori mai mare este nevoie
n de suute de ori maai mulţi indivizi. Câştigul obţinut
o în
termeni de precizie nu este liniaar. Populaţiaa părinte de mare dimennsiune (de ordinul milioaanelor) se
poate examina
e sau chestiona în proporţie de d 50%, 20% %, 10%, 5% sau 1%. Esste foarte prrobabil ca
energia mobilizată săă nu fie propporţională câştigului realizzat. Institutele de sondaje recomandăă cel mai
bun com mpromis întree gradul de precizie şi costul
c financiiar al sondajjului. Dacă aavem stabilite valorile

celorlaltee variabile ale
a marjei de fluctuaţie (MF = z* ) putem să stabilim
m mărimea efectivului
e
N
eşantionului pentru un
u prag de încrederea datt).
 EXEM MPLU Din ap plicarea unuii test de inteeligenţă la o populaţie reezultă o meddie egală cu 240 şi o
abattere standardd egală cu 22, în condiţiile în caree distribuţia este normală. Se doreşşte să se
deteermine, la un risc de 2%, care va fi nuumărul de subiecţi necesaari ai unui eşşantion testatt pentru a
obţinne o marja ded fluctuaţie de 5,70. Deeci, MF = 5,770. Pentru un prag de înncredere de 98% sau
penttru un risc dee eroare de 2% valoarea lui z este egaală cu 2,32.
2 5,70 22
22 22 222 484 484
7  2,32 *
5,70 ;  ;2,478  ;2,478 
2
;6,1441  ;?   78
7 ,81
? 2,32 ? ? ? ? 6,141
Puteem trage concluzia că unn eşantion care are 79 de indivizi corespunde riscuului ales.

Deeterminareaa altor param metri de flucctuaţie. Este inutil de a accţiona asupraa mărimii cellorlalţi doi
parametri de fluctuaţţie. Cineva nun poate schimba rezonaabil valoarea dispersiei obbservate în populaţie.
p
Aceasta înseamnă să s reluăm măăsurătorile asupra
a populaţiei. A lua un
u nivel de rrisc inferior lui 5% se
dovedeşşte se dovedeeşte a fi o prrocedură inadecvată, deooarece existăă riscul de a elimina inutil anumite
eşantioaane care pot fif conservatee.

Repere bibliograficee
obligatorrii
▪ Cloccotici, V., Stan, A., Statistiică aplicată în
î psihologie,, Editura Poliirom, Iaşi, 20000
▪ Gueguen, N., Maanuel de stattistique pour psychologue
p es, Dunod, Paaris, 1997
suplimenntare
▪ Rotaariu,T., Metodde statistice aplicate
a în şttiinţele socialle, Polirom, Iaaşi, 1999

INTERVALELE DE FLUCTUAŢŢIE A MEDIILORR PROVENIND DINTR-UN EŞ


ŞANTION

Pâână acum s-au s estimatt intervalele de fluctuaţţie a mediilor eşantioanelor plecânnd de la


caracteriisticile cunosscute ale poopulaţiei. În cazul
c fluctuaţiei mediei eşantionului
e aveam cunooştinţă de
media şi varianţa poopulaţiei părrinte. În pracctica cercetăărilor psihopeedagogice see întâlnesc foarte
f rar
astfel dee cazuri. În majoritatea
m c
cazurilor nu cunoaştem parametrii
p caaracterizând populaţia păărinte din

208
STATISTICĂ

care s-a extras eşantionul studiatt. Mai frecvent se întâlneeşte situaţia în


î care se disspune de un eşantion
despre care
c există aprecierea căă este cel maai reprezentativ posibil dinn populaţie (deoarece s-aau utilizat
toate miijloacele penntru ca el săă fie aşa), şi ş nu se disspune de paarametrii poppulaţiei perm miţând un
asemeneea control. Prezintă
P interees, de asemeenea, de a şti
ş în ce măsuură aceste m medii pot să reprezinte
r
populaţiaa sau populaaţiile părinte din
d care au ieeşit (a se veddea modelizaarea principiuului urnei.) Dee această
dată obiectivul este de a găsi ceeac ce conţţine urna pornind de la informaţiile cconţinute în eşantion.
Această extrapolare nu se poate face decât luuând informaaţii de la eşanntionul studiaat.

INFERENŢA ASUUPRA MEDIILORR POPULAŢIEI

Cuurba valoriloor mediilor eşantioanelo


e r extrase diintr-o populaaţie este unna normală, când se
extrage un număr suficient
s de indivizi dintr--o populaţie în care distribuţia este normală (doar când
mărimeaa eşantionuluui este suficcient de importantă). Înn caz contraar curba dee repartiţie a datelor
eşantionului tinde sa ia o alură coomplet diferităă.

IMPORTANT T
Distribuţiile t ale lui Student
În cazul în care eşanntionul este de d mică mărime, deci cânnd efectivul său s este puţin important, curba de
distribuţie nu mai urm mează legea centrată reddusă, ci o legge a lui Studdent. Mărimeaa de demarccaţie între
eşantioaanele mici şi eşantioanele mari estee fixată de mulţi m autori la cifra 30. Când mărim mea este
superioaară cifrei 30 forma
f legii luui Student tinnde a se connfunda cu leggea normala de distribuţie Gauss-
Laplace. Legea lui Sttudent ca şi legea
l centrattă redusă permite de a deetermina proobabilitatea de apariţie
a abaterrilor teoreticee de la mediee. Aceste abbateri sunt desemnate prrin litera t (cca z în legeaa normală
centrată redusă). Ca şi distribuţiaa normală, distribuţia
d lui t este simetrrică. Ea se ccaracterizeazză printr-o
medie eggală cu 0, daar abaterea sa standard depinde
d de unn număr de grade
g de libeertate (notate în anexa
referitoare la legea t a lui Stuudent prin f). f Numărul gradelor dee libertate ddepinde de mărimea
eşantionului. Influenţţa pe care o exercită mărrimea eşantioonului este proporţională cu rădăcina pătrată a
valorii saale. Se ajunnge la un mooment în caare mărimea are puţină influenţă asupra variaţieei mărimii
studiat. A avea 10 indivizi
i mai mult
m sau maai puţin nu schimbăs aprooape cu nim mic estimaţia când se
lucreazăă cu mari eşaantioane cuprrinzând mai multe m sute dee indivizi. Nu acelaşi lucruu se întâmplăă când se
lucreazăă cu eşantioaane de mică mărime. Câând mărimeaa eşantionuluui va fi inferiooară sau egaală cu 30
vorbim ded mici eşanttioane şi infeerenţele pe care noi le prooducem se vor v fonda pe legea t a lui Student.
Când măărimea eşanttionului va fi superioară laa 30 vorbim de mari eşanntioane şi infferenţele se fondează
pe legeaa normala centrată redusăă. Dacă utilizzăm tabele ale a lui t pentru eşantioanee a căror mărime este
superioaară lui 30, aceeasta nu connstituie o eroaare. La acest nivel valoarrea lui t este apropiată dee aceea a
lui z încâât acest fapt nu afecteazăă decât zecim malele erorii standard
s a fluuctuaţiei.

EXEMPLU
X FICTIVV. Capacitateea de memoorare de scurrt termen. See prezintă uunui număr de d 326 de
elevi de liceu o lista cu 20 cuvintte pe display-ul unui monnitor (un cuvvânt la fiecaree 2 secunde). Ulterior
se verificcă numărul de
d cuvinte pee care subieccţii le pot reprroduce. Media numărului de cuvinte reamintite
r
este de 8,40,
8 în timp ce abatereaa standard esste egală cu 2.58. Obiecttivul cercetărrii este de a estima
e cu
un risc de
d eroare dee 5% (sau cuu un prag de încredere de 95%) meddia populaţiei din care sunt extraşi
elevii caare compun eşantionul. Este vorba de un eşaantion mare, deoarece efectivul eşaantionului
depăşeşşte cifra 30.
s
În cazul acestaa IFP = X  z *
N

209
AUREL STAN

Deosebirea între formulele utilizate până acum constă în faptul că abaterea standard a populaţiei
a devenit abaterea standard a eşantionului. Valoarea tabelară a lui z = 0,05 va fi 1,96. Pentru aplicaţie:
2,58 2,58
IFP = 8,40  1,96 *  8,40  1,96 *  8,40  0,27
326 18,05
Limita inferioară a intervalului de fluctuaţie a mediei populaţiei va fi 8,13 (8,40-0,27), iar limita
superioară 8,67 (8,40 + 0,27). Cu riscul de eroare de 5% se estimează ca media populaţiei părinte va fi
cuprinsă în intervalul marcat de valorile 8,13 şi 8,67.

Intervalul de fluctuaţie pentru eşantioane mici. Menţionăm că pentru calcularea intervalului de


fluctuaţie a mediei populaţiei pornind de la valorile cunoscute ale indicatorilor eşantionului nu există
diferenţă în privinţa formulei. Este important ca datele să prezinte o curba de formă normală.
EXEMPLU. Eşantion de 17 copii care prezintă tulburări de comportament între 6 si 8 ani19. Se
relevă cu ajutorul unei grile, comportamentele agresive provocate de copiii prezentând tulburări de
comportament în diferite perioade ale jocului colectiv cu copii care nu prezintă astfel de tulburări. Din
cele 60 de comportamente caracteristice ale agresivităţii în timpul jocului s-a obţinut o medie de 28,53 şi
o abatere standard de 8.10. Obiectivul cercetării este de a realiza un studiu comparativ cu o cercetare
identică în care toţi copiii manifestă respectivele tulburări de comportament. Se doreşte a se determina
intervalul de fluctuaţie a medie la un risc de 1%. În acest caz numărul de grade de libertate va fi de
17-1=16. Se găseşte valoarea 2.92. În condiţiile legii centrate reduse s-ar fi găsit valoarea de 2,58.
Prezentăm schematic modul de detectare a valorii t din tabela legii lui t a lui Student, pentru un risc de
eroare de 1%.

p Valori ale pragului de risc p


0,20 0,10 0,05 0,02 0,01 0,001 0,0001 0,00001
f
1
2

16 2,92
s
Formula este următoarea: IFP = X  t * . Din punerea în aplicare a formulei rezultă:
N
8,10 8,10
IFP = 28,53  2,92 *  28,53  2,92 *  28,53  2,92 *1,96  28,53  5,74
17 4,12
La un risc de 1% sau la un prag de încredere de 99% media populaţiei se va situa între 22.79
(28,53-5,74) şi 34,27(28,53 + 5,74).

Populaţii finite. În cazul în care se poate evalua cu o precizie corectă mărimea populaţiei în
interiorul căreia se prelevează un eşantion, se convine, în fapt, să se considere finită această populaţie.
EXEMPLU: numărul de locuitori ai unei ţări. În acest caz se cunoaşte aproximativ numărul de indivizi care
au calitatea cerută pentru a aparţine populaţiei definite. Gradul de precizie va fi funcţie de importanţa
generală a populaţiei. Astfel, a omite câteva zeci de mii de muncitori din nu este prea grav dacă
populaţia respectivă numără 50 de milioane într-o ţară. Situaţia se modifică dacă studiul se efectuează
asupra cercetătorilor ştiinţifici dintr-o ţară.
Populaţii infinită. Populaţia infinită este o populaţie la care nu se poate determina numărul sau
populaţia al cărei număr creşte fără încetare. Astfel, pentru utilitatea cercetătorilor psihologi nu se ştie
numărul persoanelor care suferă de o anumită fobie, a persoanelor care iubesc animalele de casă. În
unele cazuri, lucrurile au o evoluţie foarte rapidă înainte ca cineva să poată determina mărimea
                                                            
19 Exemplu preluat din Nicolas Gueguen, op.cit.

210
STATISTICĂ

populaţieei. Astfel, în informatică populaţia aşa-zisă a "innterneţilor" variază


v foartee rapid. În acest
a caz
putem săă cunoaştem m indivizi din această
a popuulaţie, dar nuumărul lor exaact nu-l putem m afla.

ÎNTREBĂ ĂRI
 Cândd se impunem m să consulttăm tabelele distribuţiei t
 Caree este diferennţa între inexxactitate şi disstorsiune

Repere bibliograficee
principale
▪ Cloccotici, V., Stan, A., Statistiică aplicată în
î psihologie,, Editura Poliirom, Iaşi, 20000
▪ Gueguen, N., Maanuel de stattistique pour psychologue
p es, Dunod, Paaris, 1997
suplimenntare
▪ Rotaariu,T., Metodde statistice aplicate
a în şttiinţele socialle, Polirom, Iaaşi, 1999

211
AUREL STAN
T

UNITAT
TEA DE ÎN
NVĂȚARE 8.
8
A TESTELOR STATISTICE. ST
TEORIA TABILIREA
A SEMNIFIC
CAȚIEI DIFFERENŢEI
DINTRE
E MEDII

CONSIDERAŢIII PRELIMINARE

Î statistică testul este o procedură de calcul peentru verificaarea unor ipooteze emise anterior.
În
Deci, tesstul statistic este
e util, mai ales, în condiţiile în caree dorim să affirmăm sau ssă infirmăm o ipoteză.
Pentru a afirma sau infirma validditatea ipotezzelor în statistică se disppune de un număr maree de teste
statisticee. Astfel, exisstă, teste caare compară mediile întree ele, teste carec comparră proporţiile între ele
care com mpară variannţele, teste caare studiază legăturile înntre variabile.. Cea mai cuurentă clasificcare este
între testte statistice de
d diferenţierre (teste caree compară mediile
m între ele,
e teste carre compară proporţiile
p
între ele) şi teste staatistice de associere (caree studiază legăturile întree variabile). ÎÎnainte de puunerea în
aplicare a unui test statistic trebbuiesc formullate două ipooteze, în genneral opuse, care vor fi alternativ
testate pentru
p a ajutaa cercetătorul sau practiciianul în ceeaa ce el îşi proopune să reallizeze.
Ipoteza de nulitate Aceeastă ipotezăă statistică mai m este dennumită ipoteeza de nul şi este, în
general, notată cu H0. Ipoteza de d nul presuupune că difeerenţele constatate întree doi indicatoori supuşi
analizei sunt
s nesemnnificative, legate de factorri aleatori rezzultând din vaariaţia eşantioonajului şi nuu din unul
sau mai mulţi factori sistematici, explicând ceeea ce un ceercetător a observat.
o A foormula ipotezza de nul
înseamnnă a afirma ca nu există nimic n diferit, că toate măssurile sunt eggale, că meddii diferite sunnt de fapt
identice, că proporţii neechivaleente sunt ideentice în semnificaţie. Înnseamnă a spune că diferenţele
observatte depind de hazard şi nuu de un alt facctor.
Ipoteza alternativă. Estee ipoteza pee care o form mulează cerceetătorul caree a prelevat unul sau
mai mullte eşantioanne dintr-o populaţie, care a manipuulat sau stuudiat mai muulte variabilee şi care
gândeştee că ceea cee el a observvat nu este legat de flucttuaţii fireşti de d eşantionaare, ci de unuul sau de
mai mulţţi factori deteerminanţi. Acceastă ipotezză, notată în general cu H1, arată că hazardul nu poate să
explice rezultatul
r caree s-a obţinut.
După ce o anumită
a ipoteeză a fost foormulată, poaate fi practiccat testul carre va putea susţine o
astfel dee ipoteză mai mult decât alta.a Ipoteza nulă este ceea care este totdeauna
t testată. În urm ma acestui
demers sunts posibile două alternaative:
 ipoteeza nulă este conservatăă şi, în acesst caz, nu see poate adoppta punctul dde vedere al ipotezei
alterrnative;
 ipoteeza nulă estee respinsă şi, în acest cazz, se poate reeţine ipoteza alternativă.
Î realizarea testelor stattistice se pot întâlni două tipuri de erori: erori de tipp I şi erori dee speţa II.
În
În tabeluul care urmeaază prezentăm schematicc condiţiile dee apariţie a acestor erori.

Decizia
D Ho adevărat
a Ho fals
H0 acceptat Deciizie corectă Eroare de tip II
H respins
Ho Eroaare de tip I Decizie corectă

IMPORTANT T
Există risscuri atât prinn acceptareaa H0, cât şi prrin respingereea H0. Probaabilitatea de a respinge ippoteza de
nul, în tim
mp ce aceassta este adevvărată se num meşte, eroarre de prima speţă
s sau ero
roare de tip I.. Această
eroare ses numeşte pragul
p de înccredere sau de semnificaaţie a unui teest. Valoareaa sa fixează riscul pe
care cineeva şi-l ia unn cercetător spunând
s că ceea
c ce se observa
o estee legat de un factor sistem
matic mai
curând decât
d de flucttuaţiile normaale ale eşanttionării. Acest tip de risc se
s fixează la 5% sau 1% (se poate
reduce dacă
d condiţii imperioase justifică acest lucru. Probaabilitatea de a accepta ippoteza nulă, în î timp ce

212
STATISTICĂ

aceasta este falsă este numită eroare de a doua speţă sau eroare de tip II. Este riscul pe care cineva îl
ia de a spune că ceea ce s-a observat este legat de fluctuaţii normale ale eşantionării, pe când în
realitate aceste observaţii sunt explicate printr-un alt factor sau prin alţi factori. În mod paradoxal, erorile
de tip I si tip II sunt strâns legate. Diminuând eroarea de tip 1 creşte, în acelaşi timp, eroarea de tip II, şi
mărind eroarea de tip 1 se diminuează eroarea de tip II. Deoarece este dificil; de a fixa un compromis
între cele 2 riscuri de eroare, pragul fixat pentru fiecare din aceste riscuri va fi în funcţie de miza
inferenţelor, voinţa sau lipsa voinţei de a detecta factorul activând variaţia (factorul sistematic)
eşantionului pe care cineva îl utilizează, de caracterului novator sau lipsit de această caracteristică al
rezultatelor. Se va putea reduce riscul de a doua speţă fără a modifica riscul primei speţe, optimizând
metoda de eşantionare, prelevând indivizi suplimentari, utilizând anumite tipuri de teste sau optând
pentru un test unilateral mai curând decât bilateral. Testul unilateral poate obţine doar rezultate pozitive,
pe când cel bilateral poate obţine rezultate pozitive şi negative.

TESTE STATISTICE PARAMETRICE ŞI NEPARAMETRICE

Folosirea unui anumit test depinde de tipul de scală de măsură utilizată pentru a culege
informaţia statistică. Uneori se poate folosi un test independent de scală pentru că distribuţia nu oferă
caracteristici de formă şi de dispersie necesare pentru folosirea acestui test.
Se pot distinge două familii de teste statistice:
 teste parametrice, în care concluziile se sprijină pe legea probabilităţii care certifică că distribuţia
sau distribuţiile observate respectă anumite caracteristici;
 teste nonparametrice care nu necesită respectarea acestor caracteristici.
Testele parametrice prezintă următoarele exigenţe:
▪ datele distribuţiei trebuie să se repartizeze în maniera "normală", adică, în alţi termeni, curba trebuie
să aibă o formă apropiată aceleia a legii normale;
▪ datele de care se dispune să provin din scala de măsură de interval (cel puţin);
▪ varianţele acestora trebuie să fie omogene, adică nu trebuie să existe dezechilibre importante ale
dispersiilor, în cazul în care se cere compararea mediilor a două eşantioane.
Aceste trei condiţii trebuie să fie verificate înaintea oricărei folosiri a unui test parametric. Dacă
condiţiile sunt îndeplinite cercetătorul sau practicianul are la dispoziţie un evantai de teste puternic,
pentru că ele permit de a diminua riscul de a doua speţă. Dacă una din condiţii nu este îndeplinită (şi a
fortiori toate trei) se riscă de a respinge pe nedrept ipoteza de nulitate, adică de a observa diferenţe şi
relaţii acolo unde ele nu există.
Testele nonparametrice pot să se elibereze de această condiţie de normalitate sau de
echivalenţă a dispersiilor. Ele sunt independente de un anumit tip de distribuţie sau, cum se mai spune,
au o distribuţie liberă. Un alt mare avantaj al acestor teste este acela ca ele nu cer să se dispună de
eşantioane de mare dimensiune. În schimb, prezintă inconvenientul de a fi mai puţin puternice ca
testele parametrice, adică informaţia pe care o oferă este mai puţin consistentă. Consecinţa acestei
slăbiciuni poate să conducă la creşterea riscului de a doua speţă, la concluzia că nu există nimic
diferenţiat, pe când în realitate există unele diferenţe.

COMPARAŢIA MEDIILOR

Principalele teste statistice. Realizarea tipurilor de teste pentru compararea mediilor pleacă de
la premisa că eşantioanele care se obţin dintr-o populaţie se situează mult mai frecvent în intervalul de
fluctuaţie al populaţiei studiate. Acest principiu poate fi înţeles la diferenţa dintre două medii provenind
din eşantioane diferite. Se consideră că fluctuaţiile de eşantionare pot să conducă la diferenţe, dar că
frecvenţele acestor diferenţe se repartizează de manieră neomogenă. Astfel probabilitatea de a obţine o

213
AUREL STAN

diferenţă nulă (mediile să fie identice) este cazul cel mai frecvent, în timp ce probabilitatea de a obţine o
diferenţă nenulă este teoretic mai puţin frecvent, cu atât mai mult cu cât amplitudinea acestor diferenţe
este mai mare.

EXEMPLU: Se aplică unei populaţii de 8 subiecţi o probă de dexteritate manuală la care scorul maxim
este 18. Scorurile obţinute sunt următoarele:

Subiect 1 2 3 4 5 6 7 8 9
Scor 9 11 14 10 12 13 8 16 15

Se prelevează la întâmplare doi subiecţi (S1 şi S2) în această populaţie şi se face diferenţa
scorurilor lor (S1 – S2). Aceasta trebuie să corespundă uneia din diferenţele din cele două tabele.

Subiectul 2 Subiectul 1
8910111213141516 8 9 10111213141516
8 8
9 1 9 -1
1021 10.2 -1
11321 11-3-2-1
Subiectul 1

Subiectul 2

12432 1 12.4 -3-2 -1


13543 2 1 13-5-4-3 -2 -1
14654 3 2 1 14-6-5-4 -3 -2 -1
15765 4 3 2 1 15-7-6-5 -4 -3 -2 -1
16876 5 4 3 2 1 16-8-7-6 -5 -4 -3 -2 -1

Prezentăm, în continuare, un tabel cu efectivele diferenţelor posibile în valoare absolută.


Observăm că cea mai mică diferenţă este egală cu 1 (în valoare absolută) şi cea mai mare diferenţă
este egală cu 8.

Amplitudine diferenţei 1 2 3 4 5 6 7 8 Total


Frecvenţe absolute(efective) 16 14 12 10 8 6 4 2 72
Frecvenţe relative ( în %) 22 19 17 14 11 8 6 3 100

Cu cât amplitudinea diferenţelor este mai importantă cu atât probabilitatea unui subiect de a fi
obţinut o astfel de diferenţă este mai slabă. Se pune următoarea întrebare la testul de comparare a
mediilor: «Care este probabilitatea pe care o vom avea de a obţine o astfel de diferenţă prin hazardul
eşantionării?». Testele de comparare a mediilor vor să răspundă cu precizie la această întrebare,
evaluând probabilitatea de a obţine în manieră aleatorie toate diferenţele observate. Dacă aceasta
probabilitate este superioară unui prag, fixat prin convenţie la 5%, atunci se estimează ca diferenţele
sunt imputabile hazardului eşantionajului. Se va conserva atunci ipoteza nulă. Dacă această
probabilitate va fi egală sau inferioară acestui prag, atunci se va respinge ipoteza de nul şi se va
propune ipoteza alternativă. Atunci se va concluziona că diferenţa este statistic semnificativă şi că
diferenţa este imputabilă efectului variabilei sau variabilelor pe care cineva a putut să le manipuleze.
Există totdeauna, în schimb, un risc ca diferenţele să fie imputabile hazardului eşantionării.
Un test de comparaţie a mediilor nu trebuie să se efectueze decât plecând de la distribuţii de date
provenind din scale de măsură de interval şi de raport. Testele de comparare a mediilor sunt teste
parametrice şi, deci, la efectuarea lor, cercetătorul trebuie să verifice conformitatea caracteristicilor
distribuţiei cu aşteptările statisticianului. Distribuţiile studiate trebuie să fie normale şi variantele lor
trebuie să fie echivalente. Dacă lucrurile stau aşa, atunci se dispune de instrumente statistice care devin

214
STATISTICĂ

"parteneri" foarte fiabili în procesele de decizie care se pun în operă. În majoritatea cazurilor, aceasta se
verifică grafic, comparând valorile parametrilor.

COMPARAREA UNEI MEDII LA O NORMĂ

Norma poate să îmbrace diverse accepţiuni, funcţie de fenomenul studiat sau de câmpul de
studiu, chiar de disciplina ştiinţifică. Statisticienii impun aici o valoare, care reprezintă o valoare
aşteptată a mediei, având foarte puţină importanţă dacă este o valoare întreagă sau fracţionară, dacă
este pozitivă sau negativă. Este imperativ ca valoarea să se exprime sub formă numerică. Psihologul
trebuie să se acomodeze la această constrângere, exprimând fenomenul psihologic sub forma unei
valori numerice. Media nu poate să rămână la starea de definiţie conceptuală.
În psihologie, norma poate să fie un efect aşteptat (memorizarea medie a 7 elemente de
informaţie) sau cunoaşterea prealabilă a unui fenomen psihologic pentru care se dispune de o normă
provenind de la o populaţie (media QI-ul, media naţională a rezultatelor unui test şcolar). Ea poate, de
asemenea, să se caracterizeze printr-o valoare aşteptată de către un cercetător sau un practician, care
estimează că o poată justifica teoretic. De asemenea, norma poate să fie o valoare nulă într-o sarcină
oarecare de polarizare. În toate cazurile, exploatarea sa va fi aceeaşi. Testul statistic va avea drept
obiectiv de a verifica dacă diferenţa dintre media unui eşantion (media observată) şi valoarea numerică
acordată normei poate fi atribuită la un factor aleator (factor legat de o eroare de eşantionare) sau de un
factor sistematic (variabila independentă, manipulată sau determinată). Ipoteza unui factor sistematic
(numita H1 ) este adoptată după ce s-a respins ipoteza unui factor aleator (numit H0).

Metoda de calcul. Obiectivul testului este de a răspunde la întrebarea următoare: Care este
probabilitatea ca diferenţa observată între media unui eşantion şi media normei să poată fi atribuită
fluctuaţiilor normale de eşantionare? Există mai multe metode de a răspunde, dar a fost aleasă aceea
care permite de a evalua cu exactitate probabilitatea de a obţine prin hazard de eşantionaj o astfel de
diferenţă. Formula pentru diferenţă dintre o medie de eşantion şi o normă este asemănătoare cu
formulele găsite anterior.
X   (norma )
z
s ( )
N
în care: z = variabila normată redusă
X = media eşantionului
μ = media populaţiei
s = abaterea standard a eşantionului
N = efectivul eşantionului
σ = abaterea standard a populaţiei.
În paranteză au fost trecute simboluri alternative.
Formula este un raport între diferenţa a două medii cu eroarea standard asociată acestei
diferenţe. Norma este numită în acest caz media populaţiei, pentru că funcţia principală a testului este
de a spune dacă se poate considera sau nu eşantionul ca fiind prelevat din populaţia părinte din care
este extrasă. Fluctuaţia eşantionării face posibilă apariţia unei infinităţi de medii de eşantion. Rămâne
de ştiut care poate fi probabilitatea de a obţine în această populaţie, un eşantion de aceeaşi medie ca
aceea care s-a observat practic. Examinând formula se poate observa că indicele obţinut nu este nimic
altceva decât o abatere pe care cineva o va putea situa în spaţiu unei legi de distribuţie, aşa cum s-a
făcut cu valoarea unui subiect. S-a substituit, deci, valorii unui subiect valoarea unei diferenţe. O astfel
de evaluare presupune luarea în considerare simultană a mai multor elemente:

215
AUREL STAN
T

 ammplitudinea abaterii
a între medii: cu cât amplitudineea se măreştte, cu atât m mai puţin are ea şanse
dee a se întâlni prin hazarduul eşantionăriii;
 vaarianţa asociaată acestei abateri: cu câât aceasta este mai slabă cu atât abatterea redusă este mai
maare. Formulaa ia în calcul două cazuri: primul esste acela în care varianţţa populaţiei (varianţa
associată normeei) este cunooscută, în acest caz se iaa în calcul vaarianţa populaaţiei. Al doileea caz, în
geeneral mai frrecvent, estee acela în carec varianţaa populaţiei este necunooscută şi, înn această
sittuaţie, aceastta este estimmată prin variaanţa eşantionnului (estimaaţie fără contoorsionări);
 măărimea eşantionului: cu cât c mai multt diferenţele se observă la marile eşaantioane, cu atât mai
muult factorii suusceptibili dee a exprima diferenţa
d pot să se exprim me. Influenţaa mărimii eşaantionului
esste proporţionnală rădăcinnii sale pătraate. Abatereaa dintre douuă medii estte deci pondderată de
vaaloarea numittorului care, odată mai mult,
m depindee de două vaariabile: dispeersia (sau vaarianţa) şi
măărimea eşanntionului. Cu cât variabilitatea este mai redusăă cu atât maai mult indiccele final
(abbaterea reduusă) are şanse de a fi marem şi deci ipoteza de nulitate
n are m
mai multe şaanse de fi
resspinsă.
Î cazul în caare varianţa populaţiei esste cunoscutăă formula sufferă o uşoarăă modificare, sugerată
În
de noi înn formula prrecedentă. Prin varianţa populaţiei see înţelege vaarianţa asociiată mediei populaţiei
p
c corespunde normei).. Abaterea reedusă se obţine făcând raaportul următtor:
(aceea care
X 
z

N
S
Semnificaţia simbolurilorr utilizate înn formulă esste cunoscuttă. Cazurile în care cercetătorul
posedă o informaţie asupra variaanţei populaţţiei (populaţie din care eşantionul
e coomparat a fosst extras)
sunt puţţin frecvente în cercetarrea psihopeddagogică. În majoritatea situaţiilor de cercetare, varianţa
populaţieei nu este cuunoscută cu certitudine, şi se considderă ca ataree. Este cazuul în care cercetătorul
dispune de măsuri anterioare
a făcute cu un eşantion
e de foarte mare mărime, exxtras cu cel mai
m mare
respect faţa
f de regulile eşantionăării. Este, de asemenea,
a cazul
c în care măsura a fost repetată înn multiple
circumsttanţe (cu muultiple eşantiioane), situaaţie în care ea oferă unn indice de vvariabilitate particular
constantt. Varianţa caa valoare a normei poate fi determinatta fără ca să existe, în mood necesar, o măsură
prealabilă a acesteeia. Ea poatte să se juustifice printtr-un model teoretic, inndependent de toate
măsurătoorile efectuatte.

APLICAŢIE.
A
NUMĂRUL MAAGIC. Cercetăările destinatte evaluării memoriei
m de scurt termenn arată că apptitudinea
de memorizare imeddiată pentru diferite
d inform
maţii este dee 7 ± 2. În scopul
s de a vverifica dacăă această
limită o posedă şi liceenii, doi cercetători
c au prezentat o serie de 18 cuvinte ccomune la 193 1 elevi.
Cuvintelee apar pe dissplay-ul, un cuvânt
c la douuă secunde.
Imediat dupăă proiecţia lisstei, subiecţii trebuie să-şi aminteascăă, cât mai reppede posibil, cuvintele
prezentaate pe displaay. Media am mintirii liceenilor este de 7,13. Cerceetătorii se înttrebă dacă, adoptând
riscul dee 5%, scorul mediu al rezzultatului asuupra liceeniloor este diferiit de acela înn general obbservat în
lucrările anterioare. În acest caz valoarea
v 7 este consideraată o normă,, iar 2 abaterrea standard.. Formula
de calcul este următooarea:
7,133  7,00 0,13 0,133
z    0,909
2 2 0,1443
193 13,89
z teoreticc, dat de leggea normală centrată reddusă, este dee 1.96 la risccul de 5% (fixxarea acesteei valori a
fost făcuută anterior). Valoarea z calculată
c de noi este multt inferioară valorii
v tabelarre. La riscul de
d 5% nu
se aducce proba uneei diferenţe între î cele doouă probe comparate.
c Ipoteza de nnulitate trebuuie să fie

216
STATISTICĂ

conservată. Eşantionul liceenilor poate fi considerat ca aparţinând populaţiei din care a fost extras.
Diferenţa de reamintire de 0.13 poate fi atribuită fluctuaţiilor normale de eşantionare. Se poate, deci,
considera că această diferenţă nu are nimic excepţional.

CAZUL ÎN CARE VARIANŢA POPULAŢIEI ESTE NECUNOSCUTĂ

În cercetarea psihopedagogică este rară situaţia în care se dispune de elemente de informaţie


cantitativă precisă asupra populaţiei, plecând de la care este extras eşantionul studiat. În situaţia în care
varianţa populaţiei nu este cunoscută se ia în consideraţie varianţa eşantionului pentru estimarea erorii
standard. Va fi o estimaţie fără deformare. Indiferent dacă este vorba de mici sau mari eşantioane,
formula de comparaţie a unei medii la o normă este totdeauna aceeaşi.
X   (norma )
t sau z = .
s
N
Alegerea acestora depinde esenţial de mărimea eşantionului. Dacă mărimea eşantionului este
inferioară sau egală cu 30 indicele, ales este t-ul a lui Student. Tabela consultată va fi tabela t a lui
Student. Dacă această mărime este superioară lui 30, atunci indicele ales va fi z. Tabele de referinţă va
fi, deci, legea normală centrată redusă.

COMPARAREA A DOUĂ MEDII OBSERVATE

Situaţia în care se dispune de o normă numerică sau de o medie a populaţiei nu este cea mai
frecventă în psihologie şi în alte disciplinele ştiinţifice şi experimentale. În majoritatea cazurilor se
compară între ele distribuţii ale datelor provenind din două eşantioane. Faptul că nu se dispune de
norme sau de medii ale populaţiei (în psihologie şi alte discipline) este legat de două particularităţi:
 amplitudinea rezultatelor din domeniul psihologiei;
 specificitatea metodologică a studiului acestor rezultate.
Când se concepe un plan de studiu original, cu instrumente de măsură şi ipoteze originale,
cercetătorul nu este în măsură de a avea la dispoziţia sa o medie a populaţiei sau chiar o anumită idee
a valorii pe care aceasta trebuie să o ia. Originalitatea unui câmp de cercetare, originalitatea unei
variabile independente manipulate sau originalitatea unei ipoteze teoretice propuse provin în majoritatea
timpului din faptul că nimic nu a fost studiat, făcut sau propus anterior. Un cercetător nu-şi pierde timpul
reluând cercetări la care concluziile se cunosc foarte bine. În situaţia în care nici o informaţie nu este
disponibilă cercetătorul se vede obligat de a recurge la compararea a două eşantioane. Chiar situaţiile
experimentale cele mai simple, care compară un grup de control cu un grup supus la aceleaşi condiţii
experimentale ca şi grupul de control, dar afectat printr-o variabilă suplimentară, trebuie adesea să facă
apel la două grupe de subiecţi, apoi de a le compara pentru a "aprecia" efectul variabilei suplimentare.
Obiectivul principal este de preciza dacă două eşantioane observate pot fi considerate ca fiind extrase
din aceeaşi populaţie. Testele de comparare a două medii ne dau probabilitatea de a obţine a astfel de
abatere între medii, prelevând din aceeaşi populaţie două eşantioane de subiecţi. Dacă această
probabilitate este rară, în general inferioară lui 5% , se consideră că eşantioanele nu provin din aceeaşi
populaţie.

COMPARAREA A DOUĂ MEDII PROVENIND DIN EŞANTIOANE INDEPENDENTE

Eşantioanele independente sunt eşantioanele în care indivizii care le compun (indivizi luaţi în
sens larg pentru că poate să fie vorba de persoane, de grupuri, instituţii) sunt totdeauna diferiţi sau în

217
AUREL STAN

care alegerea unui individ într-un eşantion nu influenţează alegerea altui individ în alt eşantion. Deci,
indivizi care nu pot fi afectaţi decât în unul sau altul din eşantioanele comparate.
Cazul în care varianţa populaţiei este cunoscută. Situaţie puţin frecventă în psihologie, întâlnită,
totuşi în cazul replicării experienţelor sau în cazul în care se dispune de informaţii numerice provenind
din precedentele studii. De asemenea, se poate estima că varianţa fiecăruia din eşantioane trebuie să
aibă o asemenea valoare (provenind din studii anterioare). De asemenea, se poate estima că varianţa
este constantă (aceeaşi pentru cele două eşantioane). Desigur, se presupune că aceasta se justifică
teoretic şi doar responsabilitatea aceluia care face această estimaţie poate fi angajată. Formula este
următoarea:
X1  X 2
z
 21  2 2

N1 N2
Există puţine diferenţe în comparaţie cu metoda de determinare a abaterii reduse folosite
anterior.
Cazul în care varianţa populaţiei este necunoscută. În cazul în care varianţa populaţiei nu
este cunoscută sau, cel puţin, una din ele nu este cunoscută, se ia în consideraţie varianţa
eşantioanelor pentru estimarea erorii standard. În acest caz trebuie să se ţină seama de mărimea
eşantionului. Metoda de determinare a abaterii reduse variază după mărimea fiecărui eşantion şi tabela
de probabilităţi care se aplică pentru a aprecia probabilitatea abaterii.

Cazul eşantioanelor mari

Precizare. Testul statistic t este o abreviere de la “test statistic”. Întâlnim expresia testul t al lui Student.
Numele de student este un pseudonim pentru William Sealy Gosset, contabil care lucra la fabrica de
bere Guiness în Dublin, Irlanda şi care în 1908 a introdus testul t. Problema este următoare: când
apelăm la testul z şi când apelăm la testul t? Dacă parametrii populaţiei sunt cunoscuţi, atunci se poate
calcula testul z mai degrabă decât testul t. Practic distribuţiile t sunt formulate pentru eşantioane mai
mici decât 30 şi pentru cele mai mari de 30. Valorile t şi z ale unei distribuţii teoretice diferă mult, în
consecinţă tabelele de valori z şi t nu pot fi folosite unul în locul altuia. Diferenţele între distribuţia z şi t
este insignifiantă în cazul în care eşantionul are un volum superior lui 30. Ca atare, tabele t pot fi
utilizate locul tabelelor z.

Condiţia este ca mărimea eşantioanelor să fie mai mare de 30 şi distribuţiile acestora să se


conformeze legii normale. În acest caz se poate utiliza legea normală centrată redusă pentru a testa
probabilitatea de apariţie a abaterii reduse obţinute. Indicatorul de diferenţe va fi, deci, binecunoscutul z.
X1  X 2
z
2
s1 s22

N2 N2
Există puţine diferenţe între această formulă şi cea utilizată anterior. Varianţa eşantionului ia
locul varianţei populaţiei.
Pentru test putem folosi o statistică t sau una z, deoarece avem valori mai mari de 3p.
Prezentat într-o formă detaliată, testul t pentru eşantioane mari, arată astfel:

Etapele testului t pentru eșantioane mari independente

Pasul 1: se calculează mediile celor două distribuții: X=34 ; Y=45


Pasul 2: se calculează cele două abateri standard: sx = 5,42; sY = 6,45
Pasul 3: se calculează erorile standard ale celor două medii (Nx=75; Ny= 97)

218
STATISTICĂ

sX 5,42 sY 6,45
sX    0,63; s Y    0,65
N X 1 75  1 N y 1 97  1
Pasul 4: se calculează eroarea standard a diferenței dintre medii:
s X Y  s X2  sY2  0,632  0,652  0,9
Pasul 5: se calculează valoarea t:
X  Y 34  45
t   12,2
s X Y 0,9
Pasul 6: se interpretează t: se respinge ipoteza de nul pentru p<0,01

Cazul eşantioanelor mici


În cazul în care mărimea eşantioanelor este egală sau mai mică decât 30 şi când varianţa
populaţiei este necunoscută se estimează că repartiţia eşantioanelor diferenţelor mediilor nu mai
urmează o lege normală, ci o lege t a lui Student. Concluziile se vor baza pe legea t a lui Student,
funcţie de numărul gradelor de libertate care se aplică. Formula de determinare a abaterii reduse va fi în
acest caz:
X1  X 2
t
s1 *  N1  1  s2 *  N 2  1
2 2
1 1
* 
N1  N 2  2 N1 N 2
Gradul de libertate este egal cu N1+N2-2.
Să presupunem că avem două eşantioane mici independente cu următorii indicatori cunoscuţi:
X 1 =22, s21=3,2, N1 = 24 şi X 2 =19, s22=2,6, N2=19. Vom aplica formula pentru efectuarea testului t
pentru a stabili semnificaţia diferenţei dintre medii.

22  19 3
T=  
3,2 * 22  1  2,6 19  1
2 2
1 1 11,24 * 21  6,76 *18
* 0,041* 0,0523
* 
22  19  2 22 19 39
3 3 3 3 3
      3,26
236,04  128,44 364,08 9,94 * 0,304 3,05 * 0,304 0,92
* 0,093 * 0,304
39 39
Valoarea lui t egală cu 3,26 o vom compara cu valoarea tabelară a lui t pentru un prag de risc
de 0,05 pentru 39 de grade de libertate. În tabel nu vom găsi valoarea 39, ci o valoare apropiată,
valoarea 40 a gradului de libertate. Observăm că valoarea tabelară găsită de noi (2,02) este mai mică
decât cea calculată în testul t. Observăm, de asemenea, că valorile tabelare mai mari corespund unor
praguri de risc mai mici. Concluzia: vom respinge ipoteza de nul, deci, diferenţele dintre mediile celor
două eşantioane nu sunt întâmplătoare, ci se datorează intervenţiei unor factori sistematici. Formularea
concluziei este următoarea: «Dacă vom respinge în mod constant ipoteza de nul în mai puţin de 5% din
cazuri o respingem pe nedrept», deci, în peste 95% din cazuri respingem pe drept ipoteza de nul.
p
0,20 0,10 0,05 0,02 0,01 0,001 0,0001 0,00001
f
1
2
3
……
40 2,02 2,43 2,71 3,55 4,32 5,05

219
AUREL STAN

COMPARAŢIA A DOUĂ MEDII PROVENIND DIN DOUĂ EŞANTIOANE PERECHE SAU CORELATE

În cazul acestui gen de eşantioane indivizii care le compun sunt aceeaşi în diferite etape ale
prelevării măsurărilor sau posedă similitudini care se pot considera, după regruparea prin cupluri, ca
echivalente (vârstă, aptitudini cognitive, funcţii ocupate). Măsurile distribuţiilor împerechiate sunt adesea
calificate ca "măsuri repetate". Din acest motiv calculul diferenţelor mediilor şi a variaţiei se realizează
"în interiorul" indivizilor şi nu între indivizi. Operaţiile se fac, deci, prin cupluri. După caz cuplurile se
compun din aceeaşi indivizi cu două măsurători, din indivizi "asemănători", având fiecare o măsură
distinctă. Se presupune că indivizii sunt extraşi în respectul tehnicii de eşantionare şi că distribuţiile
diferenţelor în interiorul fiecărui cuplu se face într-un mod normal.

Cazul micilor eşantioane. Legea lui Student. Deoarece analiza se face în interiorul cuplurilor,
pentru a obţine indicele (aici t) corespunzând diferenţei dintre cupluri de date, este suficient de a aplica
formula următoare:
D
t
sD
N
în care:
D - media diferenţelor cuplurilor de date (suma diferenţelor între fiecare cuplu de date împărţită la
numărul de cupluri de date);

sD 
D 2

 D 2 - abaterea standard a diferenţelor.


N
Nu există nimic fundamental diferit cu cea ce s-a văzut în cazul comparării mediilor rezultate din
eşantioane independente. Se face totdeauna raportul între abaterea mediilor şi eroarea standard
asociată acestei abaterii. În cazul eşantioanelor perechi abaterea între două distribuţii nu se aplică la
media distribuţiilor, ci pentru fiecare cuplu de date. Aici calculul abaterii între medii şi mai ales acela al
abaterii standard se face de la diferenţele conţinute în fiecare cuplu de date. Pentru determinarea
abaterii standard, numărătorul raportului nu este altul decât suma pătratelor abaterilor tuturor
diferenţelor observate în fiecare din cupluri prin raport la media acestor diferenţe.
Să presupunem că la acelaşi eşantion mic de 14 de subiecţi am aplicat un test de atenţie
concentrată, înainte şi după efectuarea unei activităţi obositoare care a durat mai multe ore. Rezultatele
obţinute înaintea efectuării unei sarcini foarte obositoare le vom nota cu X şi pe cele obţinute după
efectuarea unei sarcini foarte obositoare le vom nota cu Y.
Ceea ce prezintă importanţă este faptul că ele provin de la aceeaşi subiecţi. Vom avea 4 etape
de calcul:
Nr.crt. X Y D D2
1 72 70 5 25
2 64 60 4 16
3 81 80 1 1
4 87 83 4 16
5 65 62 3 9
6 69 63 6 36
7 70 65 5 25
8 89 86 3 9
9 76 71 5 25
10 64 61 3 9
11 55 52 3 9
12 68 63 5 25

220
STATISTICĂ

13 65 60 5 25
14 74 72 2 4 1. Calcularea mediei diferenţelor:
Σ 54 234
D
 D  54  3,857
N 14
2. Calculul varianţei diferenţelor şi a abaterii standard:

s 
2  D2
 D2 
234
 3,857 2  16.71  14,87 .
N 14
s = 1,84  s=1,36.
2

3. Calculul erorii standard a mediei diferenţelor:


s 1,36 1,36
sD     0,37.
N 1 13 3,6
D 3,857
4. Calculul valorii t: t =  =10,42.
sD 0,37
După ce am aflat valoarea lui t, vom compara valoarea lui t tabelar cu cea calculată de noi la un anumit
prag de risc. În cazul nostru concret pragul de risc adoptat este de 0,05 sau, exprimat procentual, 5%.
Gradele de libertate se calculează după formula: f = N-1, deci f = 14–1= 13. Valoarea tabelară
comparată este valoarea aflată la intersecţia liniei egală cu 13 şi a coloanei 0,05.

p
0,20 0,10 0,05 0,02 0,01 0,001 0,0001 0,00001
f
1
2
3
……
13 2,16 2,65 3,01 4,22 5,51 6,96

Observăm cu uşurinţă că valoarea tabelară (2,16) este mult mai mică decât valoarea calculată de
noi (10,42). Drept urmare, respingem ipoteza de nul şi adoptăm ipoteza alternativă care susţine că
diferenţa dintre medii este semnificativă. În concluzie considerăm diferenţele ca fiind expresia
intervenţiei unui factor sistematic.

TEST CU O IEŞIRE, TEST CU DOUĂ IEŞIRI

Cunoaştem faptul că ipoteza nulă susţine faptul că mediile eşantioanelor sunt identice. Ipoteza
alternativă susţine faptul că mediile sunt diferite. În fapt, se pot propune 3 ipoteze alternative:
 mediile sunt diferite (ipoteza 1);
 media 1 este superioară mediei 2 (ipoteza 2);
 media 2 este superioara mediei 1 (ipoteza 3).
Principiul primului caz este acela pe care noi l-am studiat în exemplele noastre. În statistică el
poarta numele de test bilateral sau test cu două ieşiri. În cazul ipotezelor 2 şi 3 se poate testa direct
sensul unei diferenţe. Când există ipoteza cu un sens se spune ca este vorba de un test unilateral sau
test cu o singură ieşire. Probabilitatea asociată acestui tip de test se găseşte modificată prin raport la
aceea care însoţeşte un test bilateral. Testul bilateral a fost cel studiat până în prezent.

221
AUREL STAN
T

Referinţţe bibliograffice
obligatorrii
▪ Cloccotici, V., Stan, A., Statistiică aplicată în
î psihologie,, Editura Poliirom, Iaşi, 20000
▪ Cloccotici, V., Stan, A., Statistiică aplicată în
î psihologie,, Editura Poliirom, Iaşi, 20000
suplimenntare
▪ Andrrei ,T., Stanccu, S., Statisttică - Teorie şi
ş aplicaţii, Edditura All, Buucureşti, 19955
▪ Andrrei ,T., Stanccu, S., Statisttică - Teorie şi
ş aplicaţii, Edditura All, Buucureşti, 19955
▪ Popaa, Marian(2008) Statisticăă pentru psihhologie, Edituura Polirom, Iaşi I

222
STATISTICĂ

UNITATEA DE ÎNVĂȚARE 9.
RELAȚIILE DE ASOCIERE ÎNTRE VARIABILE NOMINALE.
DIFERITE TIPURI DE COEFICIENŢI DE CORELAŢIE

RELAŢIILE DE ASOCIERE DINTRE VARIABILE

Noţiunea de relaţie este foarte comună şi îşi găseşte întrebuinţare ori de câte ori este vorba de
stabilit o legătură între două serii de fapte, seria A şi seria B. Chiar în cazul în care între cele două serii
de date există o legătură accentuată nu poate fi vorba de a realiza o previziune certă în privinţa valorilor
unei variabile plecând de la valorile celeilalte. Dar pot există mari şanse ca după A să apară B. Legătura
dintre variabile nu se face simţită doar printr-o succesiune temporală, ci şi printr-o apariţie simultană a
lui A şi B.
Descrierea relaţiilor este foarte importantă în psihologie, deoarece permite de a pune ordine în
observaţiile care pot fi făcute într-o mare diversitate a domeniilor de interes ştiinţific. Exemplu, în
domeniul clinic este deosebit de importantă relaţia dintre boală şi simptom. În domeniul psihologiei
şcolare poate fi făcută legătura între rezultatele la două probe verbale. De asemenea, provenienţa dintr-
un anumit mediu familiar (ce prezintă un specific în ceea ce priveşte nivelul cultural şi metode
educative) poate fi asociată cu anumite caracteristici individuale ale copilului. De asemenea, se poate
constata că, în medie, coeficientul de inteligenţă al copiilor provenind din mediile favorizate poate fi mai
mare decât al celor care provin din medii defavorizate. Constatarea este valabilă doar referitor la medie,
deoarece pot fi indicate cazuri în care copiii din mediile defavorizate au un coeficient de inteligenţă mai
mare decât cei din mediile favorizate.
Relaţiile dintre variabile sugerează ipoteze asupra surselor de variaţie, deci, se pot constitui în
suport pentru verificarea unor ipoteze cauzale. Exemplu, A poate fi una dintre cauzele lui B, şi invers, B
poate fi una dintre cauzele lui A.
Statistica are un rol indispensabil, atunci când există necesitatea de a stabili când variabilele A
şi B sunt ambele prezente, ambele absente, sau, când este prezentă doar una dintre ele. În absenţa
unei astfel de stabiliri se riscă de a nu se raţiona decât asupra cazurilor excepţionale care vor reţine
mult mai pronunţat atenţia. Exemplu, cazurile de eşec şcolar – cazuri de reuşită excepţională. Un alt
aspect este cel al coincidenţei apariţiei în comun a două variabile. Exemplu, şarlatanul care pretinde a
“descoperi” sexul copilului după ziua de naştere a mamei şi care în 50% din cazuri poate avea dreptate.
Statistica ajută psihologul să nu se comporte ca un şarlatan. Cu ajutorul statisticii se poate stabili cât de
mult observaţiile sale reale se îndepărtează de observaţiile aşteptate şi se poate verifica dacă relaţia
între două variabile este slabă sau neglijabilă.
Cuvinte similare pentru relaţie sunt nonindependenţă, asociaţie, legătură stohastică, corelaţie.
Nu există reguli stricte care să reglementeze folosirea acestui termen.
În majoritatea situaţiilor practice de prelucrare nu suntem în prezenţa unei singure variabile, ci a
mai multora care variază împreună. Abordarea relaţiei dintre două sau mai multe variabile se face
diferenţiat, în funcţie de specificul acestora şi de specificul demersului experimental. Pornind de la cele
mai simple scale existente, scalele nominale, ne confruntăm cu variabile calitative, adică variabile
exprimate sub forma unor atribute. Aceste atribute pot avea anumite frecvenţe în studiul pe grupuri,
care accepta un anumit tratament matematic, adaptat puterii informaţionale a acestui tip de scale. În
studiul relaţiilor dintre variabilele care satisfac exigenţele scalelor ordinale şi de interval ne vom ocupa
de corelaţiile simple, deoarece tratarea corelaţiilor multiple depăşeşte cadrul acestei lucrări. De fiecare
dată când se studiază relaţiile dintre variabile se urmăreşte punerea în evidenţă unor legături cu
stabilitate variabilă, funcţie de valoarea unor indici sau coeficienţi. Atunci când stabilim o corespondenţă
dintre două variabile observăm modul în care transformarea sau modificarea unei variabile dintr-o serie
are legătură cu schimbarea survenită în cealaltă serie.

223
AUREL STAN

RELAŢIA ÎNTRE DOUĂ VARIABILE NOMINALE

În privinţa variabilelor care satisfac exigenţele scalelor nominale se utilizează foarte frecvent în
cercetarea psihopedagogică testul  2 (se citeşte hi pătrat). Acest test statistic poate fi utilizat şi în cazul
variabilelor de interval, dar, din momentul folosirii, intervalele valorice îşi pierd caracterul ordonat
crescător, devenind simple clase de partiţie.
Testul  2 este un test introdus de Karl Pearson în anul 1904, deci are o utilizare relativ
îndelungată, dacă ţinem seama de perioada temporală în care s-a acordat psihologiei statutul de ştiinţă.
Variabila nominală este o variabilă calitativă care poate prezenta cel puţin două modalităţi sau categorii
distincte. De exemplu, variabila sex este o variabilă calitativă care prezintă două modalităţi, masculin şi
feminin. Variabila anotimp are patru modalităţi: primăvara, vara, iarna, toamna obţinute printr-o oarecare
metoda de investigaţie.
Există doua feluri distincte de a folosi testul  2 , care corespund unui anumit specific a modului
de prezentare a datelor, şi anume  2 de ajustare şi  2 t de independenţă.
În cazul testului  2 de ajustare suntem în prezenţa efectivelor observate ale unei singure
variabile. Aceste efective sunt comparate fie cu alte efective observate, fie cu efectivele teoretice care
se pot calcula în urma emiterii unei ipoteze, de obicei ipoteza de nul. În acest prim caz un cercetător
poate să verifice dacă un grup de persoane (selecţionate pentru o cercetare sau un studiu) posedă
aceleaşi caracteristici generale cunoscute în rândul populaţiei (cu date cunoscute în privinţa claselor de
vârsta, categoriilor de sex sau provenienţei sociale etc.). Se foloseşte de asemenea când dorim să
cunoaştem dacă o distribuţie de efective observate se conformează unei legi în care toate modalităţile
variabilei au teoretic aceeaşi probabilitate de apariţie (echipartiţia probabilă a modalităţilor).
Formula generală de calcul pentru testul  2 este următoarea:
 fo  ft 2
2 =  ft
în care cu fo s-au notat efectivele observate, cu ft efectivele teoretice sau alte efective observate.
Abaterea dintre efectivele observate sau reale şi cele teoretice (fo-ft) este ridicată la pătrat
pentru a evita situaţia de anulare a sumei algebrice. Deci  2 nu poate avea decât o valoare pozitivă,
fapt care-l plasează în rândul testelor cu o singură ieşire (care presupune o singură alternativă de
comparare). Avem două ipoteze la îndemână:
 Ipoteza nulă, notată cu H0. În cazul testului  2 de ajustare această ipoteză presupune că între cele
doua repartiţii de date (repartiţia empirică şi repartiţia teoretică sau între două repartiţii empirice) nu
există nici o deosebire (acestea sunt identice sau nesemnificativ depărtate).
 Ipoteza alternativă H1. Susţine existenţa unei diferenţe semnificative între cele două repartiţii.
Exprimarea rezultatului se face în formă probabilistică. În cazul în care se adoptă ipoteza nulă,
cea alternativă se respinge (şi invers). Valoarea numerică obţinută în urma efectuării testului  2 se
compară cu valorile unui tabel specific, care conţine valori teoretice, funcţie de gradele de libertate. Aşa
cum am spus anterior, se acceptă un risc de eroare. Deci, într-un anumit număr de cazuri putem să ne
înşelăm. În general, riscul de eroare acceptat este de 0,05, sau, exprimat procentual 5%, dar, în unele
cazuri speciale, exigenţele pot fi mai mari sau mai mici. În cazul în care valoarea numerică obţinută în
urma aplicării testului  2 este mai mică decât cea aflată la intersecţia gradului de libertate
corespunzător (vom preciza modul de calcul a acestor grade) şi pragul convenit de acceptare a ipotezei
de nul (0,05) (valoare prag), atunci vom accepta ipoteza de nul şi, în consecinţă, vom accepta faptul că
între cele două distribuţii de valori nu există o diferenţă semnificativă. Dacă valoarea calculată este mai
mare decât valoarea prag, atunci respingem ipoteza de nul. Formularea este următoarea: „Dacă

224
STATISTICĂ

respingem în mod constant ipoteza de nul, în mai puţin de 5% din cazuri o respingem pe nedrept”.
Tabelul cu valorile teoretice ale repartiţiei  2 se află printre anexele lucrării noastre.
Cel mai ilustrativ exemplu pentru distribuţiile de efective teoretice uniforme este cel cu faţetele
unui zar sau ale unei monede.

EXEMPLU PENTRU  2 DE REPARTIŢIE. După aruncarea unei monede în sus şi căderea acesteia pe o
suprafaţă plană pot rezulta două modalităţi: cap sau coroană. Dacă aruncăm în sus moneda de un
număr de 60 de ori putem obţine următoarea repartiţie empirică:

Cap Coroană
28 32

Din punct de vedere teoretic fiecare din faţete are şanse egale de a fi obţinută. Ca atare, distribuţia
teoretică va arăta în felul următor:

Cap Coroană
30 30

În cazul aruncării efective a zarului de 900 de ori, putem avea următoarea repartiţie empirică a
faţetelor:

Faţeta 1 Faţeta 2 Faţeta 3 Faţeta 4 Faţeta 5 Faţeta 6


121 162 135 174 182 124

Distribuţia teoretică se obţine după emiterea ipotezei că fiecare faţetă are şanse egale de a
apărea. Aceasta se prezintă în felul următor:

Faţeta 1 Faţeta 2 Faţeta 3 Faţeta 4 Faţeta 5 Faţeta 6


150 150 150 150 150 150

Atât în primul cât şi în al doilea exemplu observăm diferenţe între distribuţiile empirice (cele
rezultate din acţiuni practice de aruncare a unei monede sau a unui zar) şi cele teoretice (rezultate în
urma emiterii unei ipoteze privind modul de distribuire a faţetelor). În cazul primei repartiţii aplicarea
formulei  2 ne dă următorul rezultat:

2 
28  302  32  302
 0,13  0,13  0,26 .
30 30
Semnificaţia rezultatului de 0,26 o vom afla prin consultarea tabelei lui Fisher pentru valori  2 ,
tabelă calculată conform unor legităţi de distribuţie20. Numărul gradelor de libertate se calculează prin
intermediul formulei:
f =m-1=2-1=1
În această formulă f reprezintă este numărul gradelor de libertate şi m numărul de modalităţi
ale variabilei.

f P = 0,99 0,98 0,95 0,90 0,10 0,05 0,02 0,01


1 0,00016 0,00063 0,0039 0,0158 2,706 3,841 5,412 6,635
                                                            
20Tabela lui Fisher este preluată din lucrarea lui G. Milton Smith “Ghid simplificat de statistică”, Editura Didactică şi
Pedagogică, Bucureşti,1973, pag.168

225
AUREL STAN

La intersecţia liniei 1 (care semnifică “un grad de libertate”) şi a coloanei 0,05 (“prag de risc
0,05”) găsim valoarea 3,84. Valoarea  2 rezultată din calculul nostru este 0,26, valoare mult mai mică
decât 3,84. În concluzie, acceptăm ipoteza de nul (între repartiţia empirică şi cea teoretică nu este o
deosebire semnificativă).
Oferim, în continuare un exemplu fictiv din domeniul psihopatologic. Să presupunem că un
cercetător îşi propune să analizeze relaţia dintre anotimpuri şi puseele depresive survenite în rândul
unor pacienţi psihiatrici. Pentru a pune în evidenţă respectiva relaţie, cercetătorul a analizat situaţia
internărilor celor cu simptome depresive la un spital de psihiatrie în funcţie de anotimp. Registrele de
internare relevă următoarea situaţie în funcţie de anotimp:

Primăvara Vara Toamna Iarna


190 170 270 220

Ipotezele enunţate în studiul respectiv sunt:


 H0 – ipoteza nulă susţine că nu există nici o legătură dintre anotimp şi numărul de internări a
pacienţilor depresivi. Deci, crizele depresive intervin în proporţii egale în fiecare anotimp;
 H1 – Ipoteza alternativă susţine că există o legătură între anotimp şi puseele depresive. Ca atare, în
anumite anotimpuri acestea survin mai frecvent decât în altele.
Dacă am da curs primei ipoteze, pe care trebuie să o confirmăm sau să o infirmăm, ar trebui să
avem următoarea situaţie în registrele de internare (această distribuţie este teoretică, deoarece rezultă
în urma aplicării unei ipoteze).

Primăvara Vara Toamna Iarna


212,5 212,5 212,5 212,5

Efectivul teoretic de 212,5 din fiecare celulă rezultă din împărţirea numărului total de internări
sau a efectivului total (850) la 4 (numărul de anotimpuri existente într-un an). Un asemenea efectiv nu
poate fi observat, deoarece este absurd să spunem că la un spital s-au internat 212,5 oameni.
Aplicăm, în continuare, formula  2 :

 
2  fo  ft 2  190  212,52 
170  212,5
2

270  212,5
2

220  212,5
2

ft 212,5 212,5 212,5 212,5


= 4,66 + 13,00 + 15,5 + 0,25 = 32,25
Având în vedere faptul că avem 4 modalităţi ale variabilei calitative anotimp vom avea 3 grade
de libertate (f=m-1). Pentru comparaţia valorii calculate căutăm valoarea tabelară  2 , aflată la
intersecţia linei 3 (deoarece avem 3 grade de libertate) şi a coloanei 0,05 (pragul de risc).

f P = 0,99 0,98 0,95 0,90 0,10 0,05 0,02 0,01


1 ……..
2 ………
3 0,297 0,429 0,711 1,0647.779 7,779 9,488 11,889 18,277

Observăm că valoarea tabelară este de 9,488, deci o valoare mai mică decât cea calculată de
noi. Observăm, de asemenea, că valoarea calculată este superioară valorilor tabelare de la coloanele
0,02 şi chiar 0,01. Concluzia statistică se exprimă în felul următor: “Dacă respingem în mod constant
ipoteza de nul în mai puţin de 5% din cazuri o respingem pe nedrept şi chiar în mai puţin de 1%”.
Valoarea P, în cazul nostru, este mai mică de 0,05; 0,02 şi 0,01. Graniţa dintre admiterea şi respingerea
ipotezei de nul este fixată prin convenţie la 0,05.

226
STATISTICĂ

Pentru valori P mai mici de 0,05 se respinge ipoteza de nul, pentru valori P mai mari decât 0,05
2

se acceptă ipoteza de nul. Exprimat altfel, putem spune că dacă valoarea calculată de noi pentru 
(32,25) este mai mare decât valoarea tabelară găsită la pragul de siguranţă 0,05 (9,488) putem
respinge ipoteza de nul. În caz contrar am fi acceptat ipoteza de nul. Respingerea ipotezei de nul duce
automat la acceptarea ipotezei alternative. Ca atare putem să afirmăm că între anotimp şi frecvenţa de
apariţie a puseelor depresive există o legătură, adică în unele anotimpuri acestea sunt mai frecvente
decât în altele.
Aplicarea testului  de ajustare permite o concluzie globală şi nu o analiză amănunţită a
2

frecvenţelor modalităţilor variabilei. În cazul în care numărul de categorii se măreşte considerabil acest
test statistic îşi dovedeşte limitele (printr-o apreciere prea globală). Se impune, în acest caz, de a realiza
o serie de grupări ale modalităţilor variabilei sau de a le analiza două câte două.

1. Distribuţiile teoretice independente. Distribuţiile pentru care fiecare modalitate a variabilei posedă
o probabilitate teoretică independentă de alte modalităţi se numeşte distribuţie de frecvenţe teoretice
independente. Cele mai frecvente cazuri de aplicare în cercetarea psihopedagogică a testului  2 sunt
cele în care o probabilitate de apariţie este mai importantă decât alta.

EXEMPLU. Să presupunem că un cercetător este interesat de influenţa fenomenului destrămării


familiale asupra eşecului adaptare a copilului la mediul şcolar. El se confruntă cu următoarea situaţie
aparţinând şcolilor unui oraş.

Provenienţa copiilor
Familii dezorganizate Alte situaţii Total
174 5825 5999

În derularea efortului ştiinţific cercetătorul trebuie în primul rând să ştie dacă proporţia sau
procentul copiilor provenind din familii dezorganizate este aceeaşi cu aceea de la nivel naţional. Dacă la
nivel naţional statisticile indică faptul că 0,05 sau 5% din copii provin din familii dezorganizate (procent
imaginat) se procedează la calcularea efectivelor teoretice. Pentru alte situaţii vom avea 0,95. Pentru
exprimarea procentuală înmulţim expresia procentuală cu 100. Se porneşte de la ipoteza că proporţia
sau procentajul copiilor care provin din familii dezorganizate din şcolile respectivului oraş trebuie să fie
aceeaşi ca la nivel naţional.
Efectiv teoretic pentru copiii provenind din familii dezorganizate: 5999×0,05=299,95. Deci, dacă
s-ar respecta proporţia situaţiei de la nivel naţional efectivul teoretic al copiilor provenind din familii
dezorganizate ar trebui să fie 299,25 (se va ţine cont de faptul că este un efectiv teoretic, deoarece în
practică este absurd să afirmăm că există 299,25 copii în această situaţie). Pentru alte situaţii efectuăm
următorul calcul: 5999×0,95=5699,05. Am mai putea să procedăm astfel: 5999-299,95=5699,05.
Efectivul teoretic pentru alte situaţii va fi 5699,05.

Aplicăm formula pentru  2 :


174  299,952  5825  5699,052  52,30  2,78  55,08 .
299,95 5699,05
Gradele de libertate în acest caz este egal cu 1 (2-1). La pragul de 0,05 găsim valoarea tabelară egală
cu 3,841, iar la pragul de risc de 0,01 găsim valoarea tabelară de 6,635. Valoarea calculată pentru  2
este mai mare decât cele două valori tabelare. Practic putem spune că respingem ipoteza de nul şi
adoptăm ipoteza alternativă. Concluzia este aceea că efectivele de copii care provin din familii
dezorganizate sunt diferite semnificativ de cele care se găsesc la nivel naţionale.
În multe situaţii variabila poate avea mai mult de două modalităţi. Să presupunem că un
manager doreşte să cunoască dacă situaţia studiilor muncitorilor angajaţi la firma pe care o conduce

227
AUREL STAN

este conformă proporţiilor existente pe plan naţional. Să presupunem că situaţia studiilor muncitorilor
din întreprindere s-ar prezenta astfel:

Nr.crt. Modalităţi ale variabilei studii Efectiv Proporţie naţională


1 Fără nici o diplomă 10 0,04 (4%)
2 Diplomă de şcoală generală 17 0,09 (9%)
3 Şcoală generală +calificare de 6 luni. 164 0,40 (40%)
4 Şcoală generală + şcoală prof. de 2 ani 129 0,29 (29%)
5 Diplomă de liceu + scoală prof. de 2 ani 70 0,12 (12%)
6 Studii superioare + şcoală prof. de 2 ani 10 0,06 (6%)
Total 400 1,00 (100%)

Pentru a afla efectivele teoretice în vederea comparării celor doua serii de date înmulţim efectivul
real din întreprindere cu proporţia existentă la nivel naţional. Obţinem următorul tabel:

Nr.crt. Modalităţi ale variabilei studii Efectiv observat Efectiv teoretic


1 Fără nici o diplomă 10 16 (400×0,04)
2 Diplomă de şcoală generală 17 36 (400×0,09)
3 Şcoală generală +calificare de 6 luni 164 160 (400×0,40)
4 Şcoală generală + şcoală prof. de 2 ani 116 129 (400×0,29)
5 Diplomă de liceu + scoală prof. de 2 ani 70 48 (400×0,12)
6 Studii superioare + şcoală prof. de 2 ani 10 24 (400×0,06)
Total 400 400

În paranteză, la rubrica Efectiv teoretic, este trecută procedura de obţinere a acestora.


Din calculul  2 pătrat rezultă:
10  162  17  362  164  1602  129  1162  70  482  10  242 
16 36 160 116 48 24
= 3,6 + 10 + 0,1 + 1,45 + 10 +8,16 =33,31.
Pentru pragul de semnificaţie 0,05 şi pentru 5 grade de libertate (f = 6–1) găsim o valoare tabelară
egală cu 18,19. Deoarece valoarea de 31,31 obţinută prin calcul nostru este mai mare decât valoarea
tabelară vom respinge ipoteza de nul şi vom conchide că distanţa dintre cele două serii de valori este
una semnificativă. Distribuţia empirică nu se ajustează cu cea teoretică.

Testul  2 de independenţă  2 de independenţă stabileşte, în cazul confirmării ipotezei nule,


independenţa între două variabile studiate. În cazul contrar, ipoteza alternativă afirmă existenţa unei
legături între modalităţile celor două variabile. Practic se testează faptul dacă variaţiile repartiţiilor provin
de la un factor sistematic sau nu. Tabelul încrucişat al celor două variabile poartă numele de tabel de
contingenţă.
Să luăm cazul unor variabile cu statut diferit. Să presupunem că dorim să verificăm ipoteza
influenţei sexului asupra preferinţelor şcolare ale adolescenţilor. Un număr de 192 de adolescenţi (90 de
băieţi şi 102 fete) sunt chestionaţi în privinţa preferinţei pentru un anumit gen de discipline. Rezultatele
sunt expuse în tabelul următor:

Băieţi Fete Total


Discipline umaniste 42 58 100
Discipline exacte 48 44 92
Total 90 102 192

228
STATISTICĂ

De această dată avem în studiu două variabile, cu câte două modalităţi fiecare. Variabila sex are
modalităţile băieţi şi fete şi variabila preferinţa pentru un anumit gen de discipline are modalităţile
discipline umaniste şi discipline exacte.
Cu un risc de 0,05 se doreşte de a se şti dacă există o legătură între sexul adolescenţilor şi
preferinţa pentru anumite categorii de discipline. În acest caz avem 6 distribuţii: 2 distribuţii marginale şi
4 distribuţii parţiale.
Distribuţiile marginale sau totale sunt:
 distribuţia marginală a sexului adolescenţilor: 90 de băieţi şi 102 fete;
 distribuţia marginală a preferinţelor pentru discipline: 100 de preferinţe pentru discipline
umaniste şi 92 de preferinţe pentru discipline exacte.
Distribuţiile parţiale sunt:
 distribuţia parţială băieţilor în funcţie de preferinţe: 42 de preferinţe pentru discipline umaniste şi
48 de preferinţe pentru discipline exacte;
 distribuţia parţială a fetelor în funcţie de preferinţe: 58 de preferinţe pentru discipline umaniste şi
44 preferinţe pentru discipline exacte;
 distribuţia parţială a preferinţei pentru disciplinele umaniste în funcţie de sex (42 băieţi şi 58 de
fete);
 distribuţia parţială a preferinţei pentru disciplinele tehnice în funcţie de sex (48 de băieţi si 44 de
fete).
Dacă băieţii şi fetele ar avea preferinţe egale pentru disciplinele umaniste şi tehnice am avea
următoarea repartiţie teoretică, în cazul emiterii ipotezei de nul:

Băieţi Fete Total


Discipline umaniste 46,87 53,13 100
Discipline exacte 43,13 48,87 92
Total 90,00 102 192

Dacă noi comparăm efectivele marginale de la tabelul efectivelor observate şi a celor teoretice
observăm că acestea sunt identice. Modul de raţionament în cadrul emiterii ipotezei de nul este
următorul: „În total avem 192 subiecţi dintre care 90 de băieţi şi 102 fete. Exprimându-ne sub formă
90
procentuală putem spune că din totalul subiecţilor chestionaţi băieţii reprezintă 46,87% ( 100 ) şi
192
fetele 53,13% (putem face acelaşi fel de calcul sau putem să efectuăm scăderea 100% - 46,87%).
Înseamnă că dacă preferinţele băieţilor nu diferă de cele ale fetelor, disciplinele respective vor fi
preferate în funcţie de aceste procente”.
Efectivele teoretice se pot obţine la linia Discipline umaniste prin înmulţirea valorii marginale
egală cu 100 cu 0,4687, respectiv cu 0,5313. Efectivele teoretice de la linia Discipline exacte se pot
obţine prin înmulţirea valorii marginale egală cu 92 cu 0,4687, respectiv cu 0,5313.
După ce am calculat efectivele teoretice putem aplica formula pentru  2 :
42  46,87 2  58  53,132  48  43,122  44  48,882  0,50  0,44  0,55  0,48  1,97
46,87 53,13 43,12 48,88
Formula pentru gradele de libertate în pentru testul  2 de independenţă este: f = (c-1)*(l-1), în
care prin c desemnăm numărul de coloane ale tabelelor (în număr de două) şi prin l numărul de linii (de
asemenea, în număr de două). Din aplicarea formulei privind gradele de libertate rezultă:
f = (2 – 1)*(2 – 1) = 1
Valoarea de 1,97 o comparăm cu valoarea tabelară găsită la intersecţia liniei cuprinzând un
grad de libertate şi coloanei pentru pragul de semnificaţie egal cu 0,05.

229
AUREL STAN
T

Valoarea dee la această intersecţie este egală cu


V c 3,84 decci o valoare mai mare decât d cea
calculatăă de noi pentru  , egalăă cu 1,97. Înn acest caz acceptăm ipoteza de nul, deci, difereenţele de
2

preferinţee în privinţa disciplinelor şcolare nu sunt


s semnificcative. Efectiivele teoreticce se pot calcula şi în
alt mod. Reluăm exemplele date de noi anterior.
Distribuţţie observatăă Distrribuţie teoretică
Băieţi Fete Tottal Băieţi Fete Total
Disciplinne umaniste 42 58 1000 Discipline umanisste 46,887 53,13 100
Disciplinne exacte 48 44 92 Discipline exacte 43,13 48,87 92
Total 90 102 1922 Total 90 102 192
Efectivul correspunzător unei
u celule din d tabelul teeoretic de coontingenţe see calculează mult mai
uşor prinn împărţirea produsului
p diintre efectiveele marginalee ale unei celule la efectivvul total al unnei celule
(în cazull nostru 192). O celulă aree două efective marginalee: unul în linie şi altul în ccoloană. Penntru celula
100  90
9
din stângga sus (valoaare observatăă=42) facem următorul caalcul:  46,87
192
Distribuţie teorretică
Băieţţi Fete Tootal
Disscipline umaniste 46,87 → 1000
Disscipline exaccte ↓
Tootal 90 1992
Penttru celula dinn dreapta suss (valoare obsservata 58) calculăm
c astffel:
1000 x102
 53,131 ; pentru celula
c din stâânga jos (vaaloare obserrvată 48) faccem următorrul calcul:
192
90 x92
 43,12; peentru celula din dreaptta jos (valoare observaată 44) faceem următoruul calcul:
192
92x1022
S oferit ca exemplu ceel mai simpllu model care poate exxista în testuul  2 de
 48,88 . S-a
192
independdenţă. Se poot construi tabblouri de gennul:
 2x3 (o variabilă cu c 2 modalităăţi şi o alta cuu 3 modalităţţi);
 3x4 (o variabilă cu c 3 modalităăţi şi o alta cu
c 4 modalităţi).
Cândd numărul de modalităţi creşte apar dificultăţi rezzultate din globalizare. E Existenţa uneei legături
nu înseaamnă că aceaastă legăturăă se regăseştte în fiecare pereche.
p

Referinţţe bibliograffice
obligatorrii
▪ Cloccotici, V., Stan, A., Statistiică aplicată în
î psihologie,, Editura Poliirom, Iaşi, 20000
▪ Popaa, Marian(2008) Statisticăă pentru psihhologie, Edituura Polirom, Iaşi
I
▪ Miltoon-Smith, G., Ghid simpllificat de stattistică pentruu psihologie şi pedagogiee, Editura diddactică şi
pedaagogică, Buccureşti, 197
suplimenntare
▪ Reucchlin, M., Preecis de statisstique, Pressees Universitaaires de Frannce, Paris, 19975
▪ Vasilescu, I.P., Statistică
S infoormatizată peentru ştiinţe despre
d om, Editura Militarăă, Bucureşti, 1991

230
STATISTICĂ

UNITATEA DE ÎNVĂȚARE 10.


RELAŢIA ÎNTRE DOUĂ VARIABILE DE INTERVAL REGRESIA STATISTICĂ ŞI
ECUAŢIA DE REGRESIE

RELAŢIA ÎNTRE DOUĂ VARIABILE DE INTERVAL


Acest gen de corelaţii se întâlnesc frecvent în cercetarea psihopedagogică, atunci când dorim să
ştim dacă rezultatele a două teste variază împreună într-un anumit gradient sau când dorim să ştim
acelaşi lucru în privinţa a două serii de date, dintre care una reprezintă rezultatele unui test, iar alta
rezultatele unui criteriu (care reprezintă rezultatele şcolare sau rezultatele randamentului cuantificat într-
o profesie pentru care s-au folosit teste psihologice în procesul de selecţie profesională). În cazul unei
corelaţii de valoare înaltă putem prevedea performanţele profesionale ale subiecţilor sprijinindu-ne pe
rezultatele de la teste.
Să luăm, de exemplu, rezultatele folosite de noi la calculul coeficientului de corelaţie bazat de
diferenţa de rang, presupunând, de această dată, că ele ar satisface exigenţele unei scale de interval:

Nr.crt. X Y x y x2 y2 1.1.1. xy
1 47 6 - 12,93 - 5,93 167,18 24,81 68,92
2 52 9 - 7,93 - 2,39 62,88 5,43 18,48
3 75 17 15,07 5,67 227,10 32,15 85,45
4 81 10 21,07 - 1,33 443,94 1,77 - 28,02
5 66 11 6,07 - 0,33 36,84 0,11 - 2,00
6 39 7 - 20,93 - 4,33 438,06 18,75 90,63
7 47 6 - 12,93 - 5,33 167,18 24,41 68,92
8 55 11 - 4,93 - 0,33 24,30 0,11 1,63
9 61 17 1,07 5,67 1,14 32,15 6,07
10 70 13 10.07 1,67 101,40 2,79 16,82
11 66 12 6,07 0,67 36,84 0,45 4,07
12 49 14 - 10,93 2,67 119,46 7,13 - 29,18
13 59 10 - 0,93 - 1,33 0,86 1,77 1,24
14 63 12 3,07 0,67 9,42 0,45 2,06
15 69 15 9,07 3,67 82,26 13,47 33,29
Σ 899 170 1918,93 173,39 338,33

Formula de calcul pentru coeficientul de corelaţie Bravais-Pearson este următoarea:

rxy =  xy
 x2 *  y 2
în care cu rxy se notează coeficientul de corelaţie prin momentul produselor, cu x şi y se notează
variabilele de deviaţie. O altă formă în care se poate exprima această formulă este:
rxy = 
xy
n * sx * s y
La această formulă cu n se notează numărul total de pereche de rezultate luate în consideraţie,
cu sx şi sy se notează abaterile standard ale distribuţiilor valorilor variabilei X, respectiv Y.
Pentru a putea realiza un tabel în vederea calculării coeficientului de corelaţie prin momentul
produselor sau coeficientul Bravais–Pearson trebuie, în primul rând să calculăm mediile celor două
distribuţii de valori.

231
AUREL STAN

Astfel, X 
 X  899  59,93 şi Y 
Y  170  11,33 . Rubricile x şi y, conţinând aşa
N 15 N 15
numitele valori de deviaţie, sunt realizate prin scăderea din variabilele originale X şi Y a valorii mediilor
distribuţiilor respective. Rubricile x2 şi y2 sunt realizate prin ridicarea la pătrat a valorilor de deviaţie x şi
y, iar rubrica xy prin înmulţirea valorilor de deviaţie ale celor două variabile. Ultima linie a tabelului
conţine valorile sumelor necesare pentru calcularea coeficientului de corelaţie Bravais-Pearson.
Coeficientul de corelaţie Bravais Pearson este notat, de obicei, cu r, dar în multe cazuri găsim notaţia
rxy, pentru a preciza denumirea variabilelor aflate în corelaţie.
338,3 338,3 338,3
rxy =    0,587
1918,93 *173,39 332723,27 576,21
Observăm că valoarea corelaţiei este foarte apropiată de cea calculată prin procedeul Spearman.
Menţionăm că procedeul Bravais–Pearson prezintă mai multă încredere în privinţa preciziei.
Pentru date negrupate există încă o formulă uzuală care foloseşte valorile brute ale variabilelor
N  XY   X  Y
  
şi are următoarea formă: rxy= .
N  X   X  * N  Y   Y 
2 2 2 2

Aplicarea acestei formule presupune un necesar de calcule mai mare.

Corelaţiile între valorile a două variabile pot lua valori între –1,00 si +1,00 trecând, firesc, prin 0.
Valorile corelaţiile egale +1 şi –1 indică corelaţii perfecte şi sunt foarte rar întâlnite în cadrul distribuţiilor
empirice. Valoarea unui coeficient de corelaţie egală cu 0 indică o lipsă a legăturii de asociere între
valorile celor două variabile. 1,00 indică o consonanţa perfectă între două serii de valori provenind de la
aceiaşi subiecţi. Tendinţei de creştere valorică dintr-o serie îi corespunde o creştere strict proporţională
în cealaltă serie Valoarea coeficientului de corelaţie egală cu –1 indică, de asemenea, o consonanţă
perfectă, dar care se manifestă în sens invers; cu cât valorile unei serii cresc, cu atât valorile celeilalte
serii scad în aceeaşi proporţie. Corelaţia nulă, adică egală cu 0, nu ne spune nimic despre tendinţele
existente între cele două serii de valori (pur si simplu pentru că nu este nimic de spus). Valorile imediat
superioare sau inferioare valorii 0 a coeficientului de corelaţie conturează o tendinţă vagă între cele
două serii de date. În cazul unor studii care-şi propun doar conturarea slabă a unor tendinţe de asociere
a valorilor şirurilor de date, astfel de corelaţii pot avea o anumită importanţă. Dar, în majoritatea
situaţiilor funcţionează exigenţe de semnificaţie a indicelui de corelaţie. Semnificaţia poate fi calculată
r n2
prin intermediul tabelelor t ale lui Student (t= ) sau prin intermediul tabelelor legii r a lui Bravais
1 r2
Pearson. În ambele tabele se caută semnificaţia în limita gradelor de liberate (f=n-2). Vom calcula
valoarea t pentru ultima valoarea obţinută a coeficientului de corelaţie.
r * n  2 0,587 * 15  2 0,587 * 13 0,587 * 3,6 2,11
t=      2,61
1 r 2
1  0,587 2
1  0,344 0,656 0,809
Vom stabili semnificaţia acestei valori a lui t prin apelarea la tabela lui Student, adoptând pragul
de risc de 0,05 şi 13 grade de libertate.
p
0,20 0,10 0,05 0,02 0,01 0,001 0,001 0,0001
f
1
2
……..
13 2,16 2,65 3,01 4,22 5,51 6,96

232
STATISTICĂ

V
Valoarea callculată de nooi este mai mare
m decât vaaloarea tabelară aflată laa intersecţia liniei l care
desemneează 13 graade de liberrate şi coloaanei care inndică pragul de risc eggal cu 0,05. Această
constataare ne indică faptul că ne aflăm în faţaa unei corelaaţii semnificattive şi deci p<0,05. Dacă valoarea
calculatăă ar fi fost mai mică de 2,16 atunnci am fi avut p>0,05 şi ş corelaţia aar fi fost considerată
nesemnificativă. Ce înseamnă faptul declarării unei coorelaţii dreptt semnificatiive. Înseamnnă că în
legătura acestor doouă variabile intervine un u factor sisstematic, însseamnă că legătura lor nu este
întâmplăătoare. Fireştte ne asumăm un risc dee 5%, adică putem greşi în apreciereea noastră înn 5 cazuri
din 100.
Există în râândul anumittor cercetătoori tendinţa de d entuziasm mare în faţaa unor coefiicienţi de
corelaţiee de bun niveel. Desigur, studiile
s de staabilire a indiccelui (sau coeficientului) dde corelaţie au raţiuni
clare şi un
u folos de netăgăduit. Daar, nu trebuiee să uităm faaptul că un cooeficient de ccorelaţie nu reprezintă
r
altceva decât
d proporţţia varianţei comune
c existtente la cele două serii dee date.
De asemeneea, merită dee amintit faptuul că indicii de d corelaţie nu
n pot fi apreeciaţi direct în
î privinţa
proporţioonalităţii. Duppă aparenţe,, o corelaţie de 0.40 estte de două ori o mai mică decât o correlaţie de
0.80. Pentru a ne puttea face o im mpresie adecvvată va trebuui să comparrăm pătratelee valorilor resspectivilor
coeficiennţi, care suntt 0.16 si 0.644. Aceste păătrate traduc o disproporrţie de 1 la 4, şi nu de 1 la 2, cum
apărea inniţial.

IMPORTANT T
În cazul stabilirii unuii coeficient de corelaţie nu putem să stabilim
s clar relaţii
r de cauuzalitate întree variabila
X şi variaabila Y. Dacăă seriile de date
d X şi Y au a un coeficieent de corelaaţie înalt nu pputem precizza dacă X
este cauuza lui Y, daccă Y este cauuza lui X, sauu dacă atât X cât şi Y sunnt influenţate de o a treia variabilă,
Z.

Referinţţe bibliograffice
obligatorrii
▪ Cloccotici, V., Stan, A., Statistiică aplicată în
î psihologie,, Editura Poliirom, Iaşi, 20000
▪ Savaa, F.A. (2011/2004). Analliza datelor înn cercetarea psihologică. Ediția a II-a.. Cluj-Napocaa: ASCR.
suplimenntare
▪ Miltoon-Smith, G., Ghid simpllificat de stattistică pentruu psihologie şi pedagogiee, Editura diddactică şi
pedaagogică, Buccureşti, 1971
▪ Popaa Marian(20008) Statisticăă pentru psihoologie, Teoriee şi aplicaţii SPSS,
S Editurra Polirom, Iaaşi

ECUAŢIILE
C DE REGRESIE
R

Doomeniul regrresiei este unnul vast în doomeniul statisticii. Noi voom trata elem
mentar acestt concept.
Este util să facem o precizare, şi anume că c acest term men de regrresie nu aree un sens neegativ de
retrogradd, înapoiat, ci desemneează doar o serie de tehnici de prognoză înn domeniul statisticii.
Cunoscâând valoareaa unui coeficiient de corellaţie între seeriile de valori ale variabiilelor X şi Y se poate
realiza o prognoză asupra valorii unei variaabile pornindd de valoareea corespunnzătoare cunnoscută a
celeilaltee variabile (necunoscută). Această prrognoză se poate
p realiza cu ajutorul eecuaţiei de reegresie a
lui X în Y şi a ecuaţieei de regresiie a lui Y în X.
X Linia de reegresie sau linia maximeei ajustări a norului
n de
puncte dind diagramaa unei corelaaţii este o linnie care trebbuie să îndeplinească o condiţie eseenţială, şi
anume ca c suma pătrratelor distannţei dintre linie şi punctelee norului să fie
f un minim.. Ecuaţiile dee regresie
ale respeectivelor dreppte sunt urmăătoarele:

233
AUREL STAN

1. ECUAŢIA DREPTEI DE REGRESIE A LUI X CĂTRE Y: ~


x  bx * y
~
În această ecuaţie (exprimată în variabile de deviaţie) ~
x  X  X şi y  Y  Y . Dacă ţinem
seama de aceste ultime egalităţi putem să scriem ecuaţia dreptei de regresie a lui X către Y în felul
următor: X  bx * Y  Y   X , în care X este estimarea variabilei X şi bx este coeficientul de regresie
~ ~

s
a lui X în raport cu Y. Acest coeficient are următoarea formulă: bx = rxy* x , în care sx este abaterea
sy
standard a valorilor seriei X şi sy este abaterea standard a seriei de valori Y. şi rxy este coeficientul de

corelaţie între valorile variabilei X şi valorile variabilei Y. Notaţiile X, X , Y sunt cunoscute din explicaţiile
noastre anterioare.
~
2. ECUAŢIA DREPTEI DE REGRESIE A LUI Y ÎN RAPORT CU y  by * x în care ~
X: ~ y  Y Y ,
y  Y  Y . Făcând înlocuirile necesare obţinem: Y  by  X  X   Y
~

sy
Coeficientul de regresie a lui Y în raport cu X este: by  rxy *
sx
Vom exemplifica bazându-ne pe datele ultimului tabel realizat pentru calcularea coeficientului de
corelaţie prin momentul produselor. Pentru calcularea coeficienţilor de regresie avem nevoie de valorile

abaterilor standard ale distribuţiilor. Formula abaterii standard a seriei de date x este: sx = x 2
.
N
1918,93
Folosind valorile de la tabelul amintit vom avea: sx =  127,92  11,31 . Pentru datele
15

seriei Y valoarea abaterii standard se calculează astfel: s y  x 2


173,39

 11,59  3,39 .
N 15
Deoarece cunoaştem valoarea coeficientului de corelaţie prin momentul produselor (0,587), putem trece
la calcularea coeficienţilor de regresie.
s 11,31 0,587 * 3,33  1,95
bx = rxy * x  0,587 * 
sy 3,39
sy 3,39
by = rxy *  0,587 *  0,587 * 0,29  0,175
sx 11,31
Să presupunem că dorim să estimăm valoarea pe care un subiect ar obţine-o un subiect la
variabila Y în momentul în care ştim că valoarea variabilei X este egală cu 64. Facem precizarea că ne
referim la datele trecute în tabelul pentru calcularea coeficientului de corelaţie prin momentul
produselor). Calculele de efectuat sunt următoarele:
Y  by  X  X   Y  0,17564  59,93  11,33  0,175 * 4,07  11,33  0,712  11,33  12,14
~

Deci, atunci când un subiect ar obţine la variabila X rezultatul de 64 se estimează pentru Y un rezultat
de aproximativ 12.
Să presupunem că dorim să estimăm valoarea pe care un subiect ar obţine-o un subiect la
variabila X în momentul în care ştim că valoarea variabilei Y este egală cu 8. Calculele de efectuat sunt
următoarele:
X  bx Y  Y   X  1,958  11,33  59,93  1,95 *  3,33  59.93  6,49  59,93  53,43 .
~

Deci, ne vom aştepta ca la variabila X subiectul să obţină aproximativ 54.


O situaţie particulară în calcularea coeficientului de corelaţie avem atunci când ne aflăm în
prezenta a două şiruri de date, din care unul este compus din variabile continue sau discrete

234
STATISTICĂ

polihotomice, iar altul din variabile binare (valori 0 şi 1). O astfel de situaţie o întâlnim atunci când dorim
să calculăm coeficientul de corelaţie între rezultatele globale obţinute de subiecţi la un test şi rezultatele
aceloraşi subiecţi la un item exprimat dihotomic.
În tabelul care urmează redăm un exemplu de acest specific. Tabelul cuprinde rubrici necesare
calculării indicatorilor existenţi în formulă:

Nr.crt. X (rezultat global la test) x x2 Y (rezultat item)


1 15 - 0,33 0,11 1
2 19 - 3,67 13,47 0
3 17 - 1,67 2,79 1
4 13 - 2,33 5,43 0
5 21 5,67 31,15 1
6 20 4,67 21,81 0
7 12 - 3,33 11,09 1
8 10 - 5,33 21,41 0
9 11 - 4,33 18,75 0
10 17 1,67 2,79 1
11 13 - 2,33 5,43 1
12 16 0,67 0,45 1
13 12 - 3,33 11,09 0
14 15 - 0,33 0,11 1
15 19 3,67 13,47 1
Σ 230 167,30 9

Coeficientul de corelaţie realizat între aceste două serii de date se numeşte coeficient de
corelaţie biserial punctat. Facem o menţiune în privinţa celei de-a doua serii de date, adică cea
exprimată sub forma de 0 si 1. În cazul în care ne aflăm în prezenţa unui item aparţinând unui test de
randament valoarea 1 reprezintă rezolvarea corectă a unei sarcini şi valoarea 0 nerezolvarea acestei
sarcini. În cazul chestionarelor de personalitate valoarea 1 reprezintă răspunsul care pune în evidenţă
trăsătura specificată în manualul chestionarului sau în titlul chestionarului, iar nota 0 lipsa acestei
trăsături. Aceeaşi întrebare poate fi punctată diferit în funcţie de scopul testului sau mai bine zis de
destinaţia sa psihodiagnostică.

EXEMPLU la întrebarea: „Îţi este frică să traversezi o piaţă imensă?” se poate acorda nota 1 la
răspunsul "da" în cazul în care chestionarul îşi propune să diagnosticheze anxietatea şi nota 0 în cazul
în care chestionarul îşi propune să stabilească echilibrul emotiv şi stabilitatea comportamentală.
Formula coeficientului de corelaţiei biserial punctat este următoarea:
X  Xq
rpbis  p * pq
sx
în care X p este media aritmetică a variabilei continue a subiecţilor care au primit la item valoarea 1, iar
X q este media aritmetică a variabilei continue a subiecţilor care au obţinut la item nota 0; sx este
abaterea standard a întregii serii de date continue; p este proporţia acelor subiecţi care au rezolvat
corect itemul sau care au răspuns în sensul evidenţierii trăsăturii specificate în titlul testului; q = 1 - p,
deci proporţia acelor subiecţi care nu au rezolvat corect itemul sau care nu au răspuns în sensul
specificat în titlul chestionarului de personalitate.

15  17  21  12  17  13  16  15  19
Xp   16.1
9

235
AUREL STAN

19  13  20  10  11  12
Xq   14.1
6
230
p = 9/15 = 0.6; q = 1–p = 1–0.60 = 0.40; X   15.33 ;
15

sx = x 2
167,30
  11,15  3,33 .
N 15
După ce avem toate datele la dispoziţie putem trece la calcularea coeficientului de corelaţie biserial
punctat.
X  Xq 16,1  14,1
rpbis  p * p*q  * 0,60 * 0,40  0,60 * 0,49  0,29 .
sx 3,33
Valoarea de 0,29 a unei corelaţii i indică o slabă asociere între valorile itemului şi rezultatele de
ansamblu ale testului.
În analiza de itemi suntem puşi în situaţia de a efectua corelaţii între itemii unui test pentru a indica
gradul de omogenitate a acestora. Desigur, dacă corelaţia dintre doi itemi este egală cu 1,00 ne putem
pune întrebarea dacă îi putem menţine pe ambii în cadrul unui test psihologic. Raţiunile relaţionării
itemilor sunt mult mai extinse şi formează domeniul de interes a teoriei testului psihologic sau, pentru o
mai mare claritate, a unei părţi a teoriei testului, şi anume a analizei de itemi. Formula pentru calcularea
coeficientului  sau a coeficientului celor 4 câmpuri (pentru itemii i şi j cu exprimarea dihotomică a
pij  pi p j
rezultatelor) este următoarea:  = .
pi qi * p j qj
O altă variantă este:
pij  pi * p j
φ= .
pi  p 2 i * p j  p 2 j
Formula se referă la doi itemi: itemul i şi itemul j. În această formulă pij reprezintă proporţia
răspunsurilor punctate cu 1 comune itemilor i si j, pi proporţia itemilor punctaţi cu 1 la itemul i şi pj
proporţia itemilor punctaţi cu 1 la itemul j. qi = 1- pi şi qj = 1 – pj.
Să presupunem că la un test de inteligenţă aplicat pe 15 subiecţi avem următoarea repartiţie a
răspunsurilor la itemii i şi j, itemi cu punctare dihotomică (vezi tabelul alăturat).

   

236
STATISTICĂ

A
Avem toate datele la disspoziţie pentrru aplicarea
formulei de calcul a coeficientului
c φ. Nr.crt. Item i IItem j Conncordanţă
pij  pi * p j 1 1 0
  2 1 1 +
pi * qi * p j * q j
3 1 0
2  0,6 * 0,53
0,266 4 0 1

4 * 0,53
0,60 * 0,40 * 0,47 5 0 0
 0,052 0,052 6 1 1 +
  0,21 7 1 0
0,48 * 0,499 0,239
8 1 0
Coreelaţia obţinuttă este o correlaţie mică, cu valoare 9 0 1
negativăă. Semnifică o uşoară inversiune a tenndinţelor de 10 0 1
creştere valorile a ceelor doi itemi. 11 1 0
12 0 0
13 1 1 +
14 0 1
15 1 1 +
Σ 9 8 4
Referinţţe bibliograffice P pI = 0,60 pj = 0,53 pij = 0,266
obligatorrii Q qI = 0,40 qI = 0,47
▪ Cloccotici, V., Stan, A., Statistică aplicatăa în
psihoologie, Editura Polirom, Iaaşi, 2000
▪ Savaa, F.A. (2011/2004). Analliza datelor înn cercetarea psihologică. Ediția a II-a.. Cluj-Napocaa: ASCR.
▪ Popaa Marian(20008) Statisticăă pentru psihoologie, Teoriee şi aplicaţii SPSS,
S Editurra Polirom, Iaaşi
suplimenntare
▪ Reucchlin, M., Preecis de statisstique, Pressees Universitaaires de Frannce, Paris, 19975
▪ Miltoon-Smith, G., Ghid simpllificat de stattistică pentruu psihologie şi pedagogiee, Editura diddactică şi
pedaagogică, Buccureşti, 1971

237
STATISTICĂ

Anexa 1. Tabela legii normale reduse (probabilităţi bilaterale)

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 1,00000 0,99202 0,98404 0,97607 0,96809 0,96012 0,95216 0,94419 0,93624 0,92829
0,1 0,92034 0,91241 0,90448 0,89657 0,88866 0,88076 0,87288 0,86501 0,85715 0,84931
0,2 0,84148 0,83367 0,82587 0,81809 0,81033 0,80259 0,79486 0,78716 0,77948 0,71182
0,3 0,76418 0,75656 0,74897 0,74140 0,73386 0,72634 0,71885 0,71138 0,70395 0,69654
0,4 0,68916 0,68181 0,67449 0,66720 0,65994 0,65271 0,64552 0,63836 0,63123 0,62413
0,5 0,61708 0,61005 0,60306 0,59611 0,59920 0,58232 0,57548 0,56868 0,59191 0,55519
0,6 0,54851 0,54186 0,53526 0,52869 0,52217 0,51569 0,50925 0,50286 0,49650 0,49019
0,7 0,48393 0,7770 0,47152 0,46539 0,45930 0,45325 0,44725 0,44130 0,43539 0,42953
0,8 0,42371 0,4]794 0,41222 0,40654 0,40091 0,39532 0,38979 0,38430 0,37886 0,37347
0,9 0,36812 0,36282 0,35757 0,35237 0,34722 0,34211 0,33706 0,33205 0,32709 0,32217
1,0 0,31731 0,31250 0,30773 0,30301 0,29834 0,29372 0,29914 0,28462 0.28014 0,27571
1,1 0,27133 0,26700 0,26271 0,25848 0,25429 0,25014 0,24605 0,24200 0,23800 0,23405
1,2 0,23014 0,22628 0,22247 0,21870 0,21498 0,21130 0,20767 0,20408 0,20055 0,19705
1,3 0,19360 0,19020 0,18684 0,18352 0,18025 0,17702 0,17383 0,17069 0,16759 0,16453
1,4 0,16151 0,15854 0,15561 0,15272 0,14987 0,14706 0,14429 0,14156 0,13887 0,13662
1,5 0,13361 0,13104 0,12851 0,12602 0,12356 0,12114 0,18876 0,11642 0,11411 0,11183
1,6 0,10960 0,10740 0,10523 0,10310 0,10101 0,09894 0,09691 0,09492 0,09296 0,09103
1,7 0,08913 0,08727 0,08543 0,0363 0,08186 0,08012 0,07841 0,07673 0,07508 0,07345
1,8 0,07186 0,07030 0,06876 0,06725 0,06577 0,06431 0,06289 0,06148 0,06011 0,05876
1,9 0,05743 0,05613 0,05486 0,05361 0,05238 0,05118 0,05000 0,04884 0,04770 0,4659
2,0 0,00450 0,04443 0,04338 0,04236 0,04135 0,4036 0,03940 0,03845 0,03753 0,03662
2,1 0,03573 0,03486 0,03401 0,03317 0,03235 0,03156 0,03077 0,03001 0,02926 0,02852
2,2 0,02781 0,02711 0,2034 0,02575 0,02509 0,02445 0,02382 0,02321 0,02261 0,02202
2,3 0,02145 0,02089 0,02034 0,01981 0,01928 0,01877 0,01827 0,01779 0,01731 0,01685
2,4 0,01640 0,01595 0,01552 0,01510 0,01469 0,01429 0,01389 0,01351 0,01314 0,01277
2,5 0,01242 0,01207 0,01174 0,01141 0,01109 0,01077 0,01047 0,01017 0,00988 0,00960
2,6 0,00932 0,00905 0,00879 0,00854 0,00829 0,00805 0,00781 0,00759 0,00736 0,00716
2,7 0,00693 0,00673 0,00653 0,00653 0,00614 0,00596 0,00578 0,00561 0,00544 0,00527
2,8 0,00511 0,00495 0,00480 0,00465 0,00451 0,00437 0,00424 0,00410 0,00398 0,00385
2,9 0,00373 0,00361 0,00350 0,00339 0,00328 0,0318 0,00308 0,00298 0,00288 0,00279
3,0 0,00270 0,00261 0,00253 0,00245 0,00237 0,00269 0,0221 0,00214 0,00207 0,00200
3,1 0,00194 0,00187 0,00181 0,00175 0.00169 0,00163 0,00158 0,00152 0,00147 0,00142
3,2 0,00137 0,00133 0,00128 0,00124 0,00120 0,00115 0,00111 0,00108 0,00108 0,00100
3,3 0,00097 0,00093 0,00090 0,00087 0,00084 0,00081 0,00078 0,00075 0,00072 0,00070
3,4 0,00067 0,00065 0,00063 0,00060 0,00058 0,00056 0,00054 0,00052 0,00050 0,00048
3,5 0,00047 0,00045 0,00043 0,00042 0,00040 0,00039 0,00037 0,00036 0,00034 0,00033
3,6 0,00032 0,00031 0,00029 0,00028 0,00027 0,00026 0,00025 0,00024 0,00023 0,00022
3,7 0,00022 0,00021 0,00020 0,00019 0,00018 0,00018 0,00017 0,00016 0,00016 0,00015
3,8 0,00014 0,00014 0,00013 0,00013 0,00012 0,00012 0,00011 0,00011 0,00010 0,00010
3,9 0,00010 0,00009 0,00009 0,00008 0,00008 0,00008 0,0007 0,00007 0,00007 0.00007
4,0 0,0006 0,0006 0,0006 0,00006 0,00005 0,00005 0,00005 0,00005 0,00005 0,00004

243
AUREL STAN

TABELUL LUI FISHER DE VALORI χ2

F P = 0,99 0,98 0,95 0,90 0,10 0,05 0,02 0,01


1 0,00016 0,00063 0,0039 0,0158 2,706 3,841 5,412 6,635
2 0,0201 0,0404 0,103 0211 4,605 5,991 7,824 9,210
3 0,115 0,185 0,352 0,584 6,251 7,815 9,837 11,345
4 0,297 0,429 0,711 1,064 7,779 9,488 11,668 13,277
5 0,554 0,752 1,145 1,610 9,236 11,070 13,388 15,086
6 0,872 0,134 1,635 2,204 10,645 12,592 16,622 16,812
7 1,239 0,564 2,167 2,833 12,017 14,067 16,622 18,475
8 1,646 2,032 2,733 3,490 13,362 15,507 18,168 20,090
9 2,088 2,532 3,325 4,168 14,684 16,919 19,679 21,666
10 2,558 3,059 3,940 4,865 15,987 18,307 21,161 23,209
11 3,053 3,609 4,575 5,578 17,275 19,675 22,618 24,725
12 3,571 4,178 5,226 6,304 18,549 21,026 24,054 26,217
13 4,107 4,765 5,892 7,042 19,812 22,362 25,472 27,688
14 4,660 5,368 6,571 7,790 21,064 23,685 26,873 29,141
15 5,229 5,985 7,261 8,547 22,307 24,996 28,259 30,578
16 5,812 6,614 7,962 9,312 23,542 26,296 29,633 32,000
17 6,408 7,255 8,672 10,085 24,769 27,587 30,985 33,409
18 7,015 7,906 9,390 10,875 25,989 28,869 32,346 34,805
19 7,633 8,567 10,117 11,651 27,204 30,144 33,687 36,191
20 8,260 9,237 10,851 12,448 28,412 31,410 35,020 37,566
21 8,897 9,915 11,591 13,240 29,615 32,671 36,343 38,932
22 9,542 10.600 12,338 14,041 30,813 33,924 37,659 40,289
23 10,196 11,293 13,091 14,848 32,007 35,172 38,968 41,638
24 10,856 11,992 13,848 15,659 33,196 36,415 40,270 42,980
25 11,524 12,697 14,611 16,473 34,382 37,652 41,566 44,314
26 12,198 13,409 15,379 17,292 35,563 38,885 42,856 45,642
27 12,879 14,125 16,151 18,114 36,741 40,113 44,140 46,263
28 13,565 14,847 16,928 18,839 37,916 41,337 45,419 48,278
29 14,256 15,574 17,708 19,768 39,087 42,557 46,693 49,588
30 14,953 16,306 18,493 20,599 40,256 43,773 46,962 50,892
F P=0,99 0,98 0,95 0,90 0,10 0,05 0,02 0,01

244
STATISTICĂ

TABELUL t A LUI STUDENT

p
0,20 0,10 0,05 0,02 0,01 0,001 0,0001 0,00001
f
1 3,08 6,31 12,71 31,82 63,66 636,63 63663,8 62725,7
2 1,89 2,92 4,30 6,97 9,93 31,60 100,00 316,39
3 1,64 2,36 3,18 4,54 5,84 12,93 28,00 60,42
4 1,54 2,13 2,78 3,75 4,61 8,61 15,55 27,78
5 1,48 2.02 2,57 3,37 4,03 6,87 11,18 17,90
6 1,44 1,95 2,45 3,14 3,71 5,96 9,08 13,56
7 1,42 1,90 2,37 3,00 3,50 5,41 7,89 11,22
8 1,40 1,86 2,31 2,90 3,36 5,04 7,12 9,78
9 1,39 1,84 2,26 2,82 3,25 4,78 6,59 8,83
10 1,37 1,81 2,23 2,77 3,17 4,59 6,21 8,15
11 1,37 1,80 2,20 2,72 3,11 4,44 5,92 7,65
12 1,36 1,78 2,18 2,68 3,06 4,32 5,51 7,26
13 1,35 1,77 2,16 2,65 3,01 4,22 5,36 6,96
14 1,35 1,76 2,15 2,63 2,98 4,14 5,24 6,71
15 1,34 1,76 2,13 2,60 2,95 4,07 5,13 6,50
16 1,34 1,75 2,12 2,58 2,92 4,02 5,04 6,33
17 1,34 1,74 2,11 2,57 2,90 3,97 4,97 6,19
18 1,33 1,74 2,10 2,55 2,88 3,92 4,90 6,06
19 1,33 1,73 2,10 2,54 2,85 3,89 4,84 5,95
20 1,33 1,73 2,09 2,53 2,83 3,85 4,78 5,86
21 1,33 1,72 2,08 2,52 2,82 3,82 4,74 5,77
22 1,32 1,72 2,08 2,51 2,81 3,79 4,74 5,70
23 1,32 1,72 2,07 2,50 2,80 3,77 4,69 5,63
24 1,32 1,71 2,07 2,49 2,80 3,75 4,66 5,57
25 1,32 1,71 2,06 2,49 2,70 3,73 4,62 5,51
26 1,32 1,71 2,06 2,48 2,78 3,71 4,59 5,46
27 1,32 1,71 2,05 2,47 2,77 3,69 4,56 5,42
28 1,31 1,70 2,05 2,47 2,77 3,68 4,53 5,37
29 1,31 1,70 2,05 2,46 2,76 3,66 4,51 5,34
30 1,31 1,70 2,04 2,46 2,75 3,65 4,48 5,30
31 1,31 1,70 2,04 2,45 2,75 3,64 4,46 5,27
32 1,31 1,70 2,04 2,45 2,74 3,62 4,44 5,24
33 1,31 1,69 2,04 2,45 2,74 3,61 4,42 5,21
34 1,31 1,69 2,03 2,44 2,73 3,60 4,41 5,18
35 1,31 1,69 2,03 2,44 2,73 3,59 4,39 5,16
36 1,31 1,69 2,03 2,44 2,72 3,58 4,37 5,13
37 1,31 1,69 2,03 2,43 2,72 3,58 4,36 5,11
38 1,31 1,69 2,03 2,43 2,71 3,57 4,35 5,09
39 1,31 1,69 2,02 2,43 2,71 3,56 4,33 5,07
40 1,31 1,69 2,02 2,43 2,71 3,55 4,32 5,06

245

S-ar putea să vă placă și