Sunteți pe pagina 1din 65

SCOPUL UNITII DE CURS Familiarizarea cursanilor cu problemele principale ale statisticii infereniale aplicate n psihologie; Informarea cursanilor asupra

ra principalelor tipuri de aplicaii ale statisticii infereniale n domeniul psihologic de cercetare; Informarea cursanilor asupra specificului variabilelor psihologice supuse procesului de prelucrare statistic; Informarea cursanilor asupra limitelor interpretrii statistice n cercetarea psihologic OBIECTIVE OPERAIONALE n urma studierii acestei uniti de curs, studenii trebuie s-i formeze urmtoarele deprinderi intelectuale: S opereze cu principalele concepte statistice aplicate n domeniul psihologiei; S precizeze principalele scale de msur utilizate n domeniul cercetrii psihologice i s disting specificul acestora n cazul unor cercetri concrete; S precizeze situaiile de aplicare n psihologie a conceptelor statistice referitoare diferenierea i asocierea seriilor de valori ale unei variabile; S precizeze specificul principalilor indicatori statistici i s cunoasc etapele calculrii lor. S precizeze sensul i non-sensul indicatorilor statistici; S precizeze sensul diferitelor abateri de la distribuia normal; S poat utiliza corect datele coninute n tabelul anex. EVALUARE Se va realiza n cadrul unui examen scris la sfritul semestrului. Pentru examen se vor stabili dou tipuri de subiecte: un tip referitor la teoria statistic i un tip referitor la aplicarea n practic a cunotinelor dobndite. n cadrul activitilor tutoriale se vor exersa subiectele cu caracter practic i se va verifica realizarea exerciiilor de la sfritul capitolelor. Tipurile de subiecte pentru examen vor fi egal ponderate pentru nota final obinut la examen

STATISTIC I

INTRODUCERE
ntr-o definiie succint, statistica este un ansamblu de metode care au drept obiect colectarea, organizarea, tratamentul i interpretarea datelor de observaie care se refer la grupuri de persoane sau de obiecte. Exist discuii, care nu vor fi comentate n manualul nostru, asupra autonomiei statisticii ca tiin, din cauza faptului c o bun parte din metodele statisticii aparine domeniului matematic, n consecin se susine c statistica nu ar fi dect matematic aplicat, afirmaie care nu poate fi contestat. ns, dezvoltarea statisticii a prilejuit dezvoltarea unor modaliti de abordare a studiului datelor i a unor exigene metodologice de cercetare specifice care-i o confer un statut aparte, inconfundabil n ansamblul tiinelor moderne. Disciplina statisticii are o vast arie aplicativ, n domenii dintre cele mai diverse. Este foarte greu de indicat un domeniu al activitilor teoretice i practice n care s nu-i gseasc utilitatea. Statistica aplicat n psihologie va expune cteva consideraii teoretice strict necesare, fr s se preocupe de fundamentarea matematic a procedeelor folosite, chestiune care preocup specialitii n statistic teoretic, i va insista asupra specificului aplicativ al unor proceduri statistice n cercetarea psihologic sau n practica profesional ce presupune prelucrarea i interpretarea datelor. Interveniile statistice din domeniul psihologic se refer mai ales la acele date care provin de la grupuri de persoane, dar acest aspect nu poate fi generalizat. Originile preocuprilor statistice pot fi defalcate n funcie de considerarea acestora drept practici istoricete atestate sau drept contribuii tiinifice sistematizate. n primul caz se poate vorbi de o existen milenar (5-milenii) a acestora, n al doilea caz de una secular (4 secole anterioare). Nevoia de a colecta date cantitative asupra populaiei i condiiilor sale materiale de existen se face simit din momentul n care apar comunitii umane organizate (semnul apariiei acestora este dat naterea instituiilor de reglare a desfurrii vieii n comunitate, apariia statelor constituind forma evoluat a unor astfel de instituii). n China, Egipt, Grecia i Roma antic apar recensminte cerute de funcionarii administrativi, practici continuate n evul mediu (releveurile realizate la ordinele lui Charlemagne, Domesday Book a lui Wilhelm Cuceritorul, spre 1090) i n nceputurile perioadele moderne ale istoriei, prin numeroase inventare sau releveuri realizate ca urmare a unor ordonane regale sub impulsul lui Sully, a lui Colbert i a lui Vauban. n secolul al XVII-lea se profileaz concepte relative la bazele i la mijloacele studiilor statistice, deci putem vorbi nceputurile statisticii teoretice. n aceast perioad i contureaz apariia a dou coli de gndire n acest domeniu. coala german, numit i coala descriptiv, de la care pare c deriv cuvntul statistic (cuvntul german die Statistik), este fondat de ctre Herman Conring (1606-1681), profesor la Universitatea din Helmstadt, ale crui contribuii vor fi continuate prin Gottfried Achenwall (1719-1772). Cea de-a doua coal, denumit aritmetica politic are ca fondatori pe John Graunt
93

AUREL STAN

(1620-1764), Gregory King (1648-1712), Edmond Halley 1656-1742) i pe sir William Petty (16231687), i pune n eviden, dincolo de descriere, anumite permanene statistice, de exemplu raportul numrului de nateri masculine i acela al celor feminine. Edmond Hailley prezint un tabel de mortalitate care este baza lucrrilor actuariale contemporane, apoi un reprezentant al colii germane, Johann Peter Sssmilch (1707-1767), public importante lucrri asupra procentului de masculinitate la natere i asupra evoluiei acestuia pn la vrsta de 20 de ani. De o deosebit importan n fundamentarea teoretic a statisticii este apariia, n 1812, a lucrrii lui Pierre Simon de Laplace (1749-1827), intitulat Teoria analitic a probabilitilor, care pune n eviden avantajele care pot fi trase din aceast teorie n studiul fenomenelor naturale. n care cauzele sunt prea complexe pentru a le putea cunoate exhaustiv i a le analiza individual. Ca expresie a dezvoltrii statisticii, apar o serie de statistici autonome consacrate anumitor domenii de specialitate precum statistica aplicat n mecanic, agronomie i economie, a cror dezvoltare nu are rost n lucrarea noastr simplificat. Cele mai multe din aplicaiile statisticii se afl, fr ndoial, n domeniul economic i administrativ. Nu ncercm s facem o istorie amnunit a statisticii, lucrare care ar trebui s fie deosebit de laborioas, ci s punctm momente importante ale evoluiei acesteia, legate de aplicarea acestei discipline n domeniul tiinelor sociale. nceputul n aceast privin este fcut de savantul belgian Adolphe Quetelet, care a avut preocupri tiinifice de o larg diversitate n domeniul aplicaiilor statisticii1. Adolphe Qutelet (1796-1874) extinde cmpul de aplicare a metodei statistice n domeniile antropometric, psihologic i social. La iniiativa sa se reunete la Bruxelles, n 1853, primul congres internaional de statistic, precursor al Institutului internaional de statistic, fondat la Londra n anul 1885, instituie tiinific care a rmas deosebit de prestigioas pn n zilele noastre. Adolphe Qutelet a introdus noiunea de om mediu, controversat de-a lungul timpului, concept preluat de o serie statisticieni i sociologi. Ca urmare a lucrrilor tiinifice aparinnd lui Qutelet, acelora ale lui Francis Galton (1822-1911) i Karl Pearson (1857-1936), se fondeaz biostatistica sau biometria. n domeniul tiinelor umane, studiile lui Charles Spearman asupra comportamentului indivizilor, dezvoltate n psihologia aplicat, uman i animal, au condus la metode de analiz factorial, o prelungire logic a studiului corelaiilor. Francis Galton, Charles Spearman i Karl Pearson pot fi considerai ntemeietorii prestigioasei coli psihometrice engleze, care a influenat semnificativ modul de prelucrare a datelor n cercetrile psihologice.

Pentru cei care doresc s cunoasc mai amnunit aspecte ale istoriei statisticii romneti i internaionale le recomandm lucrarea lui Mihai arc Tratat de statistic aplicat, Editura Didactic i Pedagogic R.A., Bucureti, 1998 i pe cea coordonat de Vladimir Trebici Mic enciclopedie de statistic, Editura tiinific i enciclopedic, Bucureti, 1985.

94

STATISTIC I Psihologia devine tiin de sine stttoare abia n a doua jumtate a secolului al XIX-lea, odat cu accentuarea laturii experimentale n cercetare, n ale crei nceputuri au fost marcate acumulri de date care erau deficitare sub aspectul interpretrii lor. Procedeele statistice utilizate de psiholog vin, totodat, n ntmpinarea nevoii de diversificare a metodelor de cercetare, fapt ce conduce la interpretarea mai adecvat a rezultatelor investigaiilor tiinifice. Printre lucrrile de importan din ultimele decenii, enumerm pe cele ale lui Fisher, dEgon, Sharpe, Pearson Jerzy Neyman asupra teoriei testelor i acelea referitoare la estimaii, nscute din cercetrile empirice asupra aplicrii metodei sondajelor . Apariia unor puternice mijloace de calcul a permis, pe de alt parte, de a pune n aplicare noi metode de statistic descriptiv (care nu recurg la modele, nici la ipoteze), aplicabile la marile tabele de date multidimensionale. Aflate n germene la Charles Spearman i E. Pearson, aceste metode se regrupeaz sub numele de analiz a datelor, fiind dezvoltate prin H. Hotelling n anii 1930 i n Frana prin J.P. Benzecri n anii 1960. Actualmente, preocuprile de analiz statistic a datelor din domeniul tiinelor sociale, n general vorbind, sunt deosebit de intense, realizndu-se progrese teoretice i practice. Sub acest ultim aspect sunt de remarcat apariia unor programe computerizate destinate uurrii muncii de calcul (cel mai cunoscut i cel mai utilizat fiind SPSS-ul). Folosirea unor astfel de programe presupune, pentru exploatarea corect a rezultatelor, cunoaterea fundamentelor teoretice ale statisticii.

95

AUREL STAN

I. STATISTIC DESCRIPTIV
O diviziune fundamental o disciplinei statisticii este n statistic descriptiv i statistic inferenial, diviziune care ine cont de ordinea istoric a apariiei celor dou ramuri. Statistica descriptiv s-a constituit n secolele XVII-XIX i se ocup cu descrierea fenomenelor statistice investigate prin culegerea i clasificarea datelor obinute dintr-o cercetare empiric, realizarea de rezumate i sinteze cu ajutorul unui limbaj numeric. Este un ansamblu de tehnici permind descrierea grupurilor de date i luarea deciziilor n absena unei informaii complete. Scopul unui astfel de demers este de a aduce datele ntr-o form clar i utilizabil. Informaiile de baz produse prin statisticile descriptive sunt media valorile maximale i minimale, diferite msurri ale variaiei i datele cuprinznd forma sau configuraia distribuiei variabilelor. Msurrile reprezint comportamente, competene, obinuine, aptitudini, capacitii sau alte tipuri de conduite care caracterizeaz performanele i definesc variabilele dependente. n statistic sunt utilizate mai multe metode sunt utilizate pentru (re)prezentarea organizat a datelor: histogramele, curbele, poligoanele de frecven, diagramele circulare. Examenul vizual al datelor prin intermediul graficelor constituie o manier economic, simpl i eficace de a observa distribuia eantionului prin raport la distribuia normal. Calculele realizate n statistica descriptiv duc la constituirea de valori relative, valori medii, dispersii, abateri. Statistica descriptiv trebuie considerat ca o etap a demersului statistic ce permite o exprimare cantitativ clar i coerent a mulimilor de date.

I.1.NOIUNI FUNDAMENTALE nelegerea aseriunilor statistice este posibil din momentul n care ne nsuim o serie de noiuni fundamentale. ncepem prin a preciza care sunt noiunile fundamentale n statistic i cu eventuale precizri referitoare la unele sensuri specifice care opereaz n domeniul statisticii n legtur cu aceste noiuni. Una din aceste noiuni este cea de variabil. Este o noiune de care nu ne putem dispensa n explicaia tiinific, totalitatea studiilor experimentale apelnd frecvent la ea pentru a expune raiunea acestui demers tiinific, modul de derulare i concluziile trase. Este frecvent folosit mpreun cu noiunile de variaie i variabilitate. n Grand dictionnaire de la psychologie variabila este definit ca o entitate abstract care servete ca suport pentru o multitudine de valori2. Proprietatea variabilei de a lua anumite valori se numete variabilitate, iar oscilaiile valorice ale variabilei poart numele de variaie. Variaiile pot fi previzibile i imprevizibile. Variaiile sunt considerate previzibile n situaia n care orice

Grand dictionnaire de la psychologie, Larousse, 1992, p. 816

96

STATISTIC I valoare succesiv dintr-o serie poate fi determinat cu precizie sau mcar aproximat. Variaiile sunt imprevizibile cnd valorile succesive ale unei serii nu pot fi prevzute. Arthur Reber, autorul unui reputat dicionar de psihologie atrage atenia asupra faptului c, dei variabila este o entitate care sufer schimbri, ea este de fapt o abstracie, o form, o cantitate3. Astfel, dac realizm cercetri n domeniul senzaiilor auditive i suntem interesai de intensitatea tonului, variabila operativ este intensitatea; ntr-un studiu n care avem ca variabil dificultatea unui test, dificultatea este variabila real. Tonul i testele utilizate sunt doar moduri care permit intensitii i dificultii s se manifeste. Precizri necesare sunt fcute n matematic i logic unde noiunea de variabil este surprins mai explicit prin tratarea variabilei ca simbol care reprezint clase de lucruri sau domenii de valori care satisfac anumite condiii i nu orice lucru sau valoare particular. O valoare particular a variabilei este denumit modalitate sau variant de variaie. A desemna o variabil nseamn a-i atribui un nume i a-i indica modalitile pe care le poate lua n cadrul unui sistem bine precizat. O analiz tiinific se poate realiza doar cu condiia ca obiectul pe care ea se exercit s aib o structur relativ stabil. Dac modalitile variabilei pot fi ierarhizate dup un anumit criteriu, acestea poart numele de nivele Variabila este opus constantei, care nu are dect o singur valoare, fix i nesupus oscilaiei. Definiia unei variabile i a modalitilor sale nu este independent de descrierea dispozitivului experimental n care a intervine. n funcie de ipoteza sa, cercettorul selecioneaz strile pertinente ale variabilei pe care el o studiaz. O variabil are cel puin dou modaliti. Exist dou condiii pe care trebuie s le ndeplineasc o variabil: 1. s fie alctuit dintr-un ansamblu de valori exclusive, n consecin fiecare din elementele unei variabile nu poate lua dect o singur valoare. 2. ansamblul de valori sau de modaliti ale unei variabile trebuie s fie exhaustiv toate elementele trebuie s poat fi caracterizate de ansamblul de valori. Exist un sistem de clasificare a variabilelor care funcioneaz prin considerarea unei serii de criterii. Vom enumera doar denumirile rezultnd din apelarea la cele mai frecvente criterii. Astfel, dac lum n consideraie gradul de dependen se distinge ntre variabile independente i variabile dependente. Distincia ntre variabile dependente i independente este cel mai frecvent folosit. Variabilele independente (notate curent cu VI) sunt variabile manipulate sau fixate de ctre experimentator. Mai clar, variabila independent este o caracteristic - a subiectului, a ambianei sale fizice sau sociale, a sarcinii, a stimulului sau stimulilor prezentai - care este manipulat de ctre cercettor n scopul de a controla sau de a analiza efectul sau efectele sale asupra comportamentului studiat4. Variabil independent este orice variabil ale crei valori sunt, n principiu, independente de schimbrile care au loc cu alte variabile. ntr-un experiment, variabila independent poate fi orice variabil care este manipulat specific, astfel nct s se observe efecte asupra variabilei dependente. Variabila independent mai este numit i variabil experimental sau controlat. Variabilele dependente (notate curent cu VD) sunt variabile observate de experimentator i care fac obiectul unei msurri. Variabila dependent este orice variabil ale crei valori sunt, n principiu, rezultatul
3 4

Reber, Arthur S., "Dictionary of Psychology", Penguin Books, London, 1985, pag.811 J.-P. Rossi & Al., La mthode exprimentale en psychologie, Dunod, Paris, 1997, pag.22

97

AUREL STAN

schimbrilor care au loc ntr-una sau mai multe variabile independente. n matematic, noiunea de dependen este exprimat printr-o formul de tipul y = f ( x) . Prin aceast form de prezentare a dependenei se exprim faptul c valorile lui y sunt dependente (sau n funcie de) valorile lui x. n cercetarea psihologic situaia devine: comportamentul subiectului luat n considerare (y) este dependent de manipularea unui factor (x). n cercetarea psihologic, variabila dependent este, n general, un rspuns furnizat de ctre subiect sau o caracteristic a acestui rspuns. O alt accepiune este aceea c variabila dependent este o variabil care este estimat dintr-o alt variabil ale crei valori sunt date. Efectul variabilelor independente este observat pe variabilele dependente. Exemplu: dac ne propunem s cercetm efectul diferitelor forme de psihoterapie asupra sensibilitii, variabila independent este forma de psihoterapie (terapie psihanalitic, terapie comportamental, terapie experienial, terapie adlerian, terapie sistemic) i variabila dependent este efectul asupra sensibilitii pe un anumit plan. Relaia dintre variabila numit independent i variabila numit dependent este una presupus cauzal. Relaia cauzal trebuie s fie demonstrat, nu doar afirmat. Pentru demonstrare se cer urmate regulile unei metodologii competent elaborate. n caz contrar, putem fi robii aparenelor constituite n aa-numitele artefacte. Calitile unei bune variabile dependente sunt pertinena (variabila dependent trebuie s fie un indicator pertinent al comportamentului) i sensibilitatea (variabila dependent trebuie s exprime variaii comportamentale foarte fine). Ce este o variabil intermediar? O noiune care se ntlnete n lucrrile de psihologie experimental este cea de variabil intermediar. Introducerea i utilizarea sistematic a acestei noiuni este atribuit lui Edward Chase. Tolman, cunoscutul psiholog american specializat n nvarea la animal. El nu prsete total domeniul behaviorismului, dar modific viziunea acestui curent prin folosirea noiunii de intenionalitate. n concepia sa, comportamentul este un fenomen molar care permite unei fiine de a atinge un obiect scop prin alegerea unor mijloace. Acest fapt implic o referin necesare la variabile intermediare de tip motivaional i cognitiv definite obiectiv. Noiunea de variabil intermediar cunoate o frecvent utilizare n domeniul nvrii, mai ales n studiile cunoscutului teoretician bahaviorist Clark Leonard Hull. n anul 1928, E.C. Tolman enumer dou tipuri de variabile intermediare care se intercaleaz ntre variabilele dependente i cele independente pentru a determina comportamentele. Variabilele intermediare cuprinse n primul tip, considerate mai elementare, sunt ereditatea vrsta i educaia i sunt direct legate de variabilele independente. Cele din al doilea tip sunt nevoile, dorinele, atitudinile i ipotezele, fiind considerate mai complexe, n calitate de combinaii ntre anumite variabile independente i variabile intermediare elementare. Actualmente, variabilele intermediare din prima categorie sunt tratate ca variabile independente. Introducerea acestor variabile i are raiunea n dificultile teoretice ale curentului behaviorist strict, n care domina schema S-R (stimul-reacie). n aceast schem, ereditatea, vrsta i educaia nu
98

STATISTIC I descriu nici stimulul, nici rspunsul. A doua categorie de variabile intermediare este constituit din nevoi, dorine, atitudini, ipoteze care nu pot fi controlate de ctre experimentator. J.P. Rossi consider c exist o a treia categorie de variabile intermediare care trimite la mecanismele intermediare5. Astfel, activitatea de organizare care permite de a reine mai bine o list de cuvinte a fost adesea clasat n rubrica variabilelor intermediare, deoarece activitatea de structurare este un tratament care se situeaz ntre S i R. Paul Fraisse a insistat n studiile sale asupra faptului c rspunsul este funcie a interaciunii ntre situaie i personalitatea subiectului. Jean-Franois Le Ny consider n Grand dictionnaire de la psychologie c noiunea de variabil intermediar poate fi definit ca o variabil ipotetic presupus a fi funcie a unei variabile de ambian i ca determinnd direct o variabil de comportament6. Astfel, noiunea lui C.L. Hull i a teoreticienilor behavioriti, n general, de for a motivaiei (Drive) era considerat, pe de o parte, ca fiind o funcie direct a duratei de privare (de hran, butur etc.) i, pe de alt parte, ca determinnd n mod direct vigoarea comportamentului. Totui, noiunea de variabil intermediar este puin utilizat astzi lucru datorat modului n care sunt privite aspectele care in de persoan. Aceste aspecte sunt, de fapt, mecanisme interne. De exemplu, s-a artat c organizarea informaiei permite o mai bun reinere a unei liste de cuvinte. Activitatea de organizare este o variabil intermediar. Ea presupune o tratare a informaiei i constituie un intermediar ntre S i R. Din momentul introducerii modelelor de tratare a informaiei, noiunea de variabil intermediar i-a pierdut raiunea de a exista. Astfel, putem vorbi de variabile independente, variabile dependente, stri ale subiectului i procese se tratare a informaiei. Acestea din urm sunt mai mult ipotetice dect intermediare. Dac lum n consideraie natura i fineea variaiei, atunci vorbim de variabile discrete i variabile continue. Cele discrete sau discontinue sunt variabilele ale crei valori posibile sunt n numr limitat i sunt exprimate prin valori izolate, nedifereniate. De obicei, pentru a le exprima se folosesc numere ntregi. De exemplu, variabila numrul de persoane care locuiesc ntr-un apartament este o variabil discret. Aceast variabil poate lua valorile 1, 2, 3, 4 .a.m.d., dar nu valoarea 2,5 sau 3,7. O variabil este continu n cazul cnd are teoretic un numr nelimitat de variante. Ca atare, ntre dou variante de variaie succesive se poate interpune o a treia. Dac msurarea se realizeaz n centimetri, ntre valoarea 2 cm i 3 cm se poate interpune valoarea 2,5 cm.

5 6

idem pag.45 Grand dictionnaire de la psychologie, Larousse, 1992, p. 816

99

AUREL STAN

Continuitate versus discontinuitate Arthur S. Reber precizeaz c ideea de continuitate se refer la absena unor ntreruperi, pauze sau etape (n cazul existenei unor etape acestea sunt foarte mici i astfel, nedetectabile)7. Discontinuitatea este opusul continuitii. Autorul englez spune c discontinuitatea este prezent atunci cnd nu sunt reprezentate toate valorile posibile8. El explic prezena ghilimelelor prin faptul c situaia este mai delicat n legtur cu reprezentarea valorilor. Astfel, este posibil ca variaia s se manifeste ca o serie de valori discrete (discontinue) care, de fapt, prezint o variaie subiacent continu. Reber ia ca exemplu nlimea variaia valorilor luate de nlime este discontinu fiind msurat n uniti discrete (de obicei cm), dar subiacent, este prezent o variaie continu ntruct putem avea toate nlimile posibile. Diferena se observ mai bine atunci cnd opunem variaia aparent discontinu cu una ntr-adevr discontinu cum este numrul de erori de nvare n cadrul unui experiment. Este adevrat c n msurtorile pe care le efectum, depindem foarte mult de precizia instrumentului de msur utilizat. Astfel, timpul de reacie este o variabil continu, dar poate prea discret dac folosim un cronometru clasic care msoar doar secundele. Instrumentele moderne pot evidenia un numr foarte mare de posibilitii ntre 25 de secunde i 26 de secunde, dac pot evidenia zecimile, sutimile, miimilor, milionimile de secund. Dac nu avem instrumente perfecionate de msur, distincia dintre variabilele continue i cele discrete poate deveni arbitrar. Cele mai multe din variabilele utilizate n psihologie (n special scorurile testelor i chestionarelor psihologice) sunt discrete. O distincie frecvent utilizat se face ntre variabilele dihotome sau dihotomice i variabilele polihotome sau polihotomice. Variabilele dihotomice sunt variabile care au dou 2 modaliti: adevrat fals; corect-incorect; da nu, prezen-absen, acord dezacord; masculin-feminin etc., i care primesc, de obicei , valorile numerice 1 - 0. Real i artificial n dihotomie Dany Laveault i Jacques Grgoire9 fac diferena ntre variabile real dihotomice i artificial dihotomice. O variabil real dihotomic presupune mprirea natural n 2 categorii (de exemplu, variabila sex are natural dou modaliti: masculin (care se poate nota cu 1) i feminin (care se poate nota cu 0), iar variabilele artificial dihotomice corespund transformrii convenionale a valorilor variabilelor polihotomice (continue sau discontinue). De exemplu, n urma aplicrii unui test subiecii dintr-un grup, acetia pot obine iniial note ntre 1 i 40, dar, ulterior, acetia pot fi mprii n 2 subgrupe: cei care au scoruri mai mici dect mediana sunt ncadrai n subgrupul A

Reber, Arthur S., "Dictionary of Psychology", Penguin Books, London, 1985, pag.811 idem 9 Dany Laveault & Jacques Grgoire, Introduction aux theories des testes en sciences humaines, De Boeck Universite, 1997, pp. 234235
7 8

100

STATISTIC I cu rezultate slabe (scoruri uniformizate prin notarea cu 0), iar cei cu scoruri peste median intr n subgrupul B cu rezultate bune (uniformizate prin notarea cu 1). Aceast mprire poate fi fcut i n funcie de existena unei valori criteriu, care mparte grupul iniial n reuii (notai cu 1) i nereuii (notai cu 0). Criteriul de dihotomizare poate avea i un caracter convenional. O distincie cu care se opereaz frecvent este cea ntre variabile cantitative i variabile cantitative. n primul caz exprimarea variantelor sau modalitilor variabilelor se face prin intermediul numerelor (timp, greutate, lungime), n al doilea caz prin intermediul atributelor (apartenen etnic, religioas, sex). Variabila cantitativ timp de reacie va putea avea ca variante sau modaliti 23; 25; 19; 30 sutimi de secund, pe cnd variabila calitativ apartenen religioas va avea ca modaliti: ortodox, catolic, protestant, mahomedan, budist etc. Variabile calitative Sex (masculin, feminin) Culoarea ochilor (albatri, cprui, verzi,etc. Variabile cantitative Performan fizic sau psihic msurat (Q.I.= 101,sau Q.I.= 83) Vrsta ( 17,19 23 etc.)

Tabelul I. Exemplificri pentru variabile calitative i variabile cantitative O clasificare prezent n studiile experimentale este n funcie de posibilitatea cercettorului de a manipula apariia modalitilor variabilei pe care el o studiaz. Vorbim n acest caz de variabile provocate i de variabile invocatei. Modalitile primei variabile ale acestui criteriu de clasificare pot fi create de ctre experimentator, n sensul c st n puterea acestuia de a le manevra. De exemplu, variabila intensitate sonor poate avea n cadrul unui experiment trei modaliti sau stri: slab, medie, puternic. n funcie de interesul tiinific, experimentatorul poate varia cele trei stri, poate s provoace aceste stri. Dar dac interesul tiinific se manifest n privina coeficientului intelectual, nu mai st n puterea experimentatorului de a manevra fora intelectual a cuiva. n acest caz, variabila coeficient intelectual este invocat, cercettorul putnd doar cuta i mobiliza pentru un studiu persoane care au diferii coeficieni intelectuali (ex. 75, 90, 100,105). O noiune indispensabil pentru exprimarea statistic este cea de unitate statistic, avnd sensul de element al unei mulimi statistice. Un termen similari este cel de individ statistic. Unitile statistice pot fi indivizi umani sau obiecte care sunt purttori ai unei anumite caracteristici ce prezint interes pentru o anumit cercetare. Mulimea statistic poate fi o populaie statistic, adic totalitatea indivizilor care satisfac exigenele unei anumite definiii riguros formulate, sau un eantion, un subansamblu de indivizi ai populaiei care are caracteristica de a fi reprezentativ, adic din analiza acestuia este permis de a se trage aproximativ aceleai concluzii ca i din analiza ntregii populaii. Eantionul este un univers redus al populaiei. Raportul dintre populaie i eantion statistic este mai bine exprimat prin raportul dintre mulime i submulime. Selecionarea indivizilor dintr-o populaie pentru constituirea unui eantion poate fi aleatorie sau conform unui algoritm de selecie. n procedura aleatorie de selecie, orice individ trebuie s aib anse egale de a fi ales. ntr-o oper aprut postum, intitulat Ars
101

AUREL STAN

conjectandi, matematicianul elveian Jacques Bernoulli, unul din clasicii teoriei probabilitilor, a artat c o tragere la sori corect fcut permite de a obine un eantion care s aib caracteristici similare acelora ale populaiei. Deci, nu orice grup de indivizi formeaz un eantion, ci doar acel grup constituit prin respectarea unor reguli riguroase. Cnd ntr-un studiu ntlnim termenul de lot sau de grup, trebuie existe suspiciunea c acesta a fost compus prin apelarea la o procedur de extragere care nu respect strict metodologia de constituire a eantioanelor. Biais-ul, termen ce s-a impus n ultima perioad n limbajul tiinific cu semnificaia de eroare sistematic, mrete riscul de a proceda la generalizri eronate. Populaiile pot fi finite, cnd mrimea sa este riguros delimitat cantitativ, i infinite cnd mrimea lor nu poate fi determinat cu precizie sau este n continu cretere cu o rat imprevizibil. Populaia poate fi definit extensiv, atunci cnd elementele sale pot fi listate (de exemplu, lista nominal a pensionarilor dintr-un cartier din Iai). Definirea intensiv a populaiei presupune indicarea principiului care st la baza constituirii sale (exemplu, toi elevii liceului Mihai Eminescu din Iai din primul semestru al anului 2003). Variabilele nu descriu indivizii statistici n ansamblul lor, ci prin intermediul unor caracteristici. O caracteristic este o proprietate a unei uniti statistice care prezint interes pentru o anumit cercetare. Individul statistic este purttor al unei caracteristici. Aceast caracteristic este descriptibil printr-un ansamblu de reliefri ale caracteristicii. Aceste reliefri sunt variantele de variaie sau modalitile. Caracteristica pe care noi ne propunem s o descriem statistic poate fi manifest, n cazul n care poate fi descris sau msurat n mod direct (greutatea corporal, culoarea ochilor, sexul, nivelul veniturilor) sau latent (voalat), n cazul n care poate fi msurat doar indirect. De exemplu, dac ne propunem s examinm introversiunea, aceasta nu se poate face n mod direct, ci prin intermediul unei ntregi serii de semne ale introversiunii detectabile prin ntrebrile unui chestionar sau prin analiz clinic. O caracteristic este operaional definit atunci cnd se poate decide care sunt reliefrile caracteristicii respective. Practic, din punct de vedere psihologic, operaionalizarea este traducerea unui concept teoretic n comportamente observabile. Calitatea tiinific a unor cercetri depinde foarte mult de calitatea operaionalizrii conceptuale care se realizeaz n cursul realizrii lor. Este necesar s facem i cteva precizri asupra variabilitii, n scopul de a evidenia aspecte care sunt frecvent ntlnite n studii tiinifice. Variabilitatea este intraindividual atunci cnd se raporteaz la diferenele existente ntre momentele sau situaiile diferite n care se afl acelai individ. De exemplu, atunci cnd se cerceteaz timpul de reacie la aceeai persoan n momente temporale diferite, se pot obine valori diferite. Diferena dintre cea mai mic i cea mai mare variant de variaie poart numele de amplitudine de variaie sau de plaj de variaie. Variabilitatea interindividual face referire la diferenele existente ntre indivizi (desigur, referindu-se la aceeai caracteristic). Variabilitatea intragrup caracterizeaz oscilaiile valorice n cadrul unui grup bine precizat i variabilitatea intergrup caracterizeaz aceste oscilaii la nivelul indicatorilor aparinnd la grupuri diferite. Indicatorii statistici nu sunt doar simple valori ale variabilei, ci valori reprezentative care caracterizeaz ansamblul valorilor unui grup.

102

STATISTIC I Variabile i factori. Termenii tiinifici de variabil i factor sunt des folosii ca sinonimi ceea ce poate crea o serie de confuzii. n esen, orice factor poate fi o variabil, dar nu orice variabil poate fi un factor. Nu exist o coresponden perfect ntre variabil i factor. n unele lucrri tiinifice, termenul factor este folosit abuziv. n general, prin factor se nelege orice are o influen cauzal, un anumit efect asupra unui fenomen. n acest sens factorul este considerat o condiie antecedent sau o cauz. Prin extensie, factorul poate fi considerat o variabil independent. Acest sens e propriu procedurilor statistice bazate pe analiza de varian. Distincia ntre factori sistematici i aleatori este fundamental. Factorul este sistematic, n cazul n care alegerea modalitilor poate fi sistematic, i aleatoriu, n cazul n care modalitile sale sunt stabilite prin tragere la sori. O convenie frecvent respectat este aceea de a denumi factorul printr-o liter majuscul i o cifr care indic numrul modalitilor. De exemplu, n cadrul notaiei S3 desemnm prin S factorul studii i prin 3 numrul de modaliti. Desemnarea nivelelor se face prin utilizarea literelor minuscule: s1= studii superioare, s2=studii medii i s3=studii generale. Prin convenie factorii aleatorii sunt subliniai. Factorii crora experimentatorul vrea s le studieze efectele sunt numii principali, iar cei pe care experimentatorul trebuie s-i controleze pentru c el tie c acetia au un efect asupra fenomenului studiat sunt numii secundari. Factorul poate fi unul din rezultatele unei analize factoriale, termen care nu reprezint un concept unitar, ci mai curnd este utilizat ca termen umbrel pentru un numr de proceduri statistico-matematice care-i propun s localizeze un numr mai mic de dimensiuni clusteri sau factori ntr-un set mai mare de variabile independente sau itemi. Primul element distinctiv al unei analize factoriale este reducerea datelor. Analiza factorial este o reacie contra beiei de cuvinte n cercetarea psihologic care tinde s considere c oamenii i aciunile umane au attea caliti cam cte adjective i atribute exist ntr-o limb. A exprima mult prin puin, principiul parcimonieii, este esenial n analiza factorial, indiferent de formele pe care le mbrac aceast analiz. Ca atare, factorul este o variabil subiacent care st la baza variaiei altor variabile, este o esen ireductibil i irepetabil care servete de suport lumii fenomenologice cu o mare varietate de manifestri.

103

AUREL STAN

II. GRUPAREA I SISTEMATIZAREA DATELOR


II.1.MSURAREA N PSIHOLOGIE O prim ntrebare care se pune atunci cnd abordm problema prelucrrii datelor obinute ntr-o cercetare psihologic este: haina numeric se potrivete la fel de bine exprimrii rezultatelor ca n domeniul fizicii, chimiei, biologiei, sau are un anumit specific care trebuie lmurit? n esen, trebuie s stabilim dac faptul psihic este la fel de bine fundamentat cantitativ ca n domeniile amintite. Dezbaterile pe aceast tem dureaz de secole, opunnd la nceputurile lor concepia lui Immanuel Kant i celei aparinnd lui Johann Herbart. Prima concepie susine c psihologia nu va ajunge niciodat tiin experimental, deoarece faptul psihic nu posed dect o singur variabil, timpul. A doua concepie susine c psihologia va putea deveni experimental i cantitativist, ntruct posed pe lng variabila timp i variabilele intensitate i calitate. Dezbaterile pe aceast tem nu au ncetat, fiind sintetizate foarte bine ntr-o lucrare de erudiie a lui Vasile Pavelcu: Ambele atitudini sunt fireti cci, dac am aplica metrismul matematic la prerile nsei, ivite n rndul oamenilor de tiin, cu privire la psihologia matematic, am constata abateri statistice naturale, att n sens pozitiv, ct i n cel negativ, fa de medie. Extremele sunt egal de primejdioase pentru dezvoltarea unei tiine. O ncredere exagerat, nejustificat suficient ntr-o metod, duce fatal spre dezamgirea i prsirea total a acesteia. Un scepticism anticipat, i la fel de nejustificat, bareaz drumul ncercrilor i verificrilor, fr de care nu putem face dovada tiinific10. Rspunsul la ntrebarea anterioar presupune o scurt incursiune n domeniul teoriei msurrii. Nevoia de msurare a venit odat cu apariia i dezvoltarea cercetrii experimentale n psihologie. Pentru a fi considerat tiinific, cercetarea psihologic trebuie s se supun rigorilor care domina tiinele cu un statut bine precizat, cum sunt fizica, fiziologia i chimia, n care experimentul era frecvent practicat. Promotorii experimentului psihologic considerau c prin intermediul acestuia psihologia se deprteaz de viziunea speculativ i adera la exigenele spiritului pozitiv, atotputernic la sfritul secolului XIX i nceputul secolului XX, perioad n care avntul cercetrii experimental-psihologice a fost foarte pronunat. Personalitile dominante n aceast perioad au fost E.H. Weber, G.T. Fechner, W. Wundt, H. Ebbinghaus, H. Helmholtz, S. Hull, J.McK. Cattell. Domeniul n care aceti savani au lucrat a fost unul relativ ngust, cel al structurilor psihice elementare (senzaii, percepii). ncercrile de a extinde tehnicile experimental-statistice la fenomene psihice complexe a dus la apariia unor eecuri i nereuite n cercetare. Perfecionarea tehnicilor de investigaie s-a fcut paralel cu progresul concepiilor psihologice i a aparatului statistico-matematic. Necesar cercetrilor complexe n care interrelaionarea era complex. Cercettori precum Ch.
10

Vezi Pavelcu, Vasile Problema msurii n psihologie, Extras din Cercetri pedagogice, vol. I, 1943. Tipografia Alexandru A. Terek, Iai, pag.3.

104

STATISTIC I Spearman, H.P. Kelley, H. Hotteling, L.L. Thurstone, C. Burt, L. Guttman, S.S. Stevens au perfecionat i rafinat concepia de cercetare n psihologie i au elaborat tehnici cantitative complexe, aa cum este analiza factorial. ntr-o lucrare clasic de psihometrie, care se menine n actualitate, Nicolae Mrgineanu red complexitatea situaiei cercetrii din domeniul psihologic: Una dintre caracteristicile de baz ale tiinei contimporane, n opoziie cu tiina antebelic i mai ales cu aceea a secolului trecut, e de a nu te mulumi numai cu studiul relaiilor dintre diferite, ci de ncerca i studiul structurii i configuraiei acestor relaii. Relaia nu e torul; ea e ntotdeauna o parte i un aspect dintr-un sistem. Ori acest sistem nu pare a fi indiferent pentru relaie; pentru ca sensul relaiei s fie prins n ntregime, relaia trebuie raportat i la el. Sistemul pare chiar s aib ultimul cuvnt, proprietile de baz ale relaiilor nefiind dect funciuni ale sale.11 A msura nseamn a aloca numere lucrurilor i fenomenelor conform unor reguli. Fr o concepie clar asupra realitii msurabile nu se poate vorbi de precizie i de apreciere cantitativ a fenomenelor. Pentru depirea unei concepii rigide s-a ajuns la o concepie nou privind puterea msurrii, elaborndu-se gradiente ale forei de msurare. A luat astfel natere concepia scalelor de msur. Elaborarea teorie scalelor de msur nu reprezint doar un compromis, o convenien, ci o adaptare la realitii msurabile specifice i complexe. Problema scalelor de msur. n sens general, o scal este o procedur sau un plan ce permite aranjarea obiectelor sau evenimentelor n serii progresive. n sens concret, o scal este un instrument sau un dispozitiv ce permite ordonarea numeric a obiectelor sau fenomenelor prin determinarea unei valori proprii. n examinarea psihologic, scala desemneaz un instrument de examinare sau testare psihologic care posed itemi i sarcini structurai n legtur cu o anumit dimensiune. n acest ultim sens, avem scala metric a inteligenei Binet-Simon, scala de performan Grace-Arthur. Scala de dezvoltare A.L. Gessel. Exist scale de atitudini, de preferine, de inteligen. Valorile pe care le obin variabilele n cursul unor procese de msurare nu au aceeai putere informaional, adic nu comunic la fel de profund n privina anumitor caracteristici pe care le studiaz. Neglijarea acestui aspect poate duce la apariia unor confuzii n interpretarea rezultatelor unor cercetri. Este foarte important de a preciza pe ce scal de msur pot fi apreciate valorile unei variabile i dac operaiile sau tratamentele statistice sunt pertinente, adic dac sunt adaptate, ajustate proprietilor specifice ale unei anumite scale. Practic, scala de msur este un instrument de msur care prezint anumite gradaii dup care se ghideaz cel care dorete s fac aprecieri n procesul de msurare dintr-un anumit domeniu. n sens strict scala de msur presupune c modalitile sau valorile sunt cel puin ordonate, deci exclude observaiile care sunt doar calitativ diferite. n sens larg, scala de msur se raporteaz i la observaii care pot fi doar calitativ diferite. Crearea i fundamentarea teoretic a scalelor de msur sunt legate de numele cercettorului englez S.S. Stevens care, n anul 1946, a stabilit 4 niveluri sau tipuri de scale de msur, inegale n privina puterii: msuri nominale, ordinale, de interval, i de raport. Ali autori care s-au ocupat de aceast problem au artat c se pot concepe nenumrate tipuri de scale, dar cea mai mare parte
11

vezi Nicolae Mrgineanu, Elemente de Psihometrie, Ed. Institutului de Psihologie al Universitii din Cluj, 1938

105

AUREL STAN

dintre ele nu au o real semnificaie practic prin diversele grupe de transformri numerice pe care le-ar presupune12. Scala nominal (denumiri similare scala categorial sau scala formal) reprezint tipul de scal care indic cel mai slab grad al msurii. Modalitile scalei nominale sunt definite n aa fel nct fiecare observaie nu poate fi plasat doar ntr-o singur modalitate. Ea asigur doar simpla difereniere calitativ a observaiilor fcute de un cercettor. Chiar atunci cnd utilizeaz numere n exprimare realitii supus msurii, aceast scal nu indic alte proprieti dect acelea de a fi simple etichete pentru distingerea diferitelor modaliti ale unei variabile. Ea poate asigura identitatea a dou elemente. La nivelul scalei nominale modalitile X,Y i Z pot fi reprezentate prin 1,2 i 3, sau la fel de bine prin 14, 23, 8. Important este ca aceste simboluri s fie diferite. n acest caz 1 nu este mai mic dect 2 i nici acesta, la rndul lui, nu este mai mic dect 3. Ele sunt doar simboluri diferite. Observaiile pot fi exprimate i prin simboluri alfanumerice: a1, a2 i a3 sau chiar prin simboluri pictografice. Astfel de scale sunt frecvent utilizate n psihologie i, n general, n tiinele sociale, atunci cnd se uzeaz de clasificri: tipologiile psihologice, nomenclatoarele profesiilor, nosologiile psihiatrice (sisteme de clasificare a bolilor). De exemplu, variabila categorie socio-profesional poate avea modalitile: elev, student, funcionar, cadru mediu, cadru superior, patron, manager, omer, pensionar. Prin codificare, atribuim un simbol distinct fiecrei modaliti a variabilei. Redm ntr-un tabel diferite variante de codificare: varianta 1-alfabetic, varianta 2-numeric, varianta 3-alfanumeric. Modalitatea variabilei Elevi Studeni Funcionari Cadre medii Cadre superioare Manageri Patroni omeri Pensionari Varianta 1 A B C D E F G H I Varianta 2 1 2 3 4 5 6 7 8 9 Varianta 3 a1 a2 a3 a4 a5 a6 a7 a8 a9

Tabelul nr.2 Codificri posibile pentru modalitile variabilei categorie socio-profesional n cadrul unei scale nominale

Recodificarea modalitilor n funcie de variante este corect dac asigur fiecrei modaliti o notare distinct de a celorlalte, aa cum rezult din tabelul urmtor. Modalitatea variabilei Varianta 1 Varianta 2 Varianta 3 Elevi C 9 a7 Studeni I 8 a3 Funcionari A 5 a5 Cadre medii D 3 a9 Cadre superioare F 7 a8 Manageri B 1 a2 Patroni E 4 a6 omeri G 6 a4 Pensionari H 2 a1
Tabelul nr. 3 Cuprinde recodificarea corect a modalitilor variabilei Categorie socio-profesional din tabelul 1
vezi Dick, P., Tournobis, Jocelyne, Flieler, A., Kop, Jeana-Luc, La Psychomtrie, Presses Universitaires de France, Paris, 1994
12

106

STATISTIC I Scala ordinal introduce ordinea ntre elementele unei serii de observaii. Transformrile efectuate trebuie, de aceast dat, s lase ordinea invariant, neschimbat. ntr-o astfel de situaie a<b<c i 1<2<3. Ultima serie poate fi nlocuit prin 7;13;19 (care respect ordinea iniial, primul element mai mic dect al doilea i acesta l, la rndul lui, mai mic dect la treilea, dar nu prin 7;5;15 (care nu o respect). Exemplificrile scalelor nominale n domeniul disciplinelor psiho-sociale sunt, de asemenea, numeroase (clasele de vrst, nivelurile colare, fazele dezvoltrii intelectuale). Chiar scorurile brute la probele de aptitudini sau la chestionarele de personalitate, considerate n mod strict, se ncadreaz n rndul scalelor ordinale. ntr-o astfel de scal putem s spunem c elementul b este mai mare dect elementul a, dar nu putem s precizm cu ct este mai mare. Cel mai bune exemple pentru scalele ordinale sunt scalele de atitudini sau scalele de apreciere. Variabila atitudine fa de fenomenul homosexualitii poate avea urmtoarele modaliti ordonate sau nivele: a) total dezacord; b) dezacord; c) acord parial; d) acord total. Aceste serie de modaliti este ngheat, n sensul c nu poate fi schimbat locul ierarhic al unui nivel. Scala de interval introduc ordinea ntre modalitile unei serii de observaii dar i semnificaia distanei dintre acestea. Valorile pentru acest tip de scale sunt numerice. Numerele pot fi ntregi (variabila fiind calificat n acest caz discontinu sau discret) sau s cuprind i valori reale (caz n care variabila este discontinu, exist posibilitatea interpunerii unei noi valori ntre dou valori succesive). Exemple de variabile discontinue de interval din domeniul psihologiei: scorurile la itemii testelor (itemul este o component informaional elementar a unui test sau chestionar); scorurile la testele sau chestionarele psihologice n ansamblul lor (aptitudini, atitudini). Exemple de variabile continue de interval din domeniul psihologiei: timpul de reacie verbal, msurarea parametrilor biologici (n cazul studiilor psihofiziologice). Pentru acest tip de variabil, nu pot exista valori definite n avans. De aceast dat putem preciza c b este mai mare dect a, dar i cu ct este mai mare. Distana capt semnificaie. Dac avem 4 elemente (A,B,C,D) egale cu 4,8,12,16 putem preciza c distana dintre elementele B-C (8-4) este cu 4 mai mic dect distana dintre elementele A-D. Aceste scale au fost destinate s joace un rol considerabil n psihologie n funcie de dezvoltarea instrumentelor de analiz care solicit acest nivel de msur. Scalele de raport. Corespund scalelor pe care Stevens le-a numit scale de interval cu origine raional. Sunt puin utilizate n cercetarea psihologic. Valorile acestui tip de scal sunt numerice i pot fi supuse operaiunilor aritmetice. La acest tip de scal se folosete i are sens valoarea nul (0). n cazul scalelor de interval, valoarea 0 este pur convenional, cum este valoarea 0 a unui termometru. n cazul scalei de raport, valoarea 0 marcheaz absena unui fenomen, situaie greu de acceptat n psihologie. Rapoartele nu sunt alterate printr-o transformare de similaritate (adic o transformare liniar n care b = 0). O reprezentare de acest tip este deci legat de o constant multiplicative. Menionm scalele nominale i ordinale mai sunt numite i scale calitative, pe cnd scalele de interval i de raport sunt numite scale cantitative. Scalele, aa cum sunt enumerate anterior, formeaz un ansamblu ierarhic de la slab la puternic ale crui trepte se disting n privina n privina forei informaionale. O scal situat pe o treapt superioar are proprietile unei scale inferioar, plus o serie de proprieti suplimentare. Operaiile i transformrile statistico-matematice care se pot efectua
107

AUREL STAN

n cadrul unei scale sunt condiionate de puterea informaional a scalei respective. Cu ct naintm spre vrful ierarhiei scalare, cu att numrul de operaii permise este mai mare i transformrile sunt mai complexe. Pe parcursul lucrrii noastre vom face specificaii necesare n aceast privin, de cte ori este cazul13. II.2 CONSIDERAII ASUPRA GRUPRII DATELOR Operaiile de grupare sunt strict necesare n activitatea de cercetare tiinific efectuat cu ajutorul unor metode de investigaie specifice psihologiei. Primul lucru asupra cruia ne ndreptm atenia atunci cnd suntem n faa unor date neordonate rezultate dintr-o cercetare este s ne ntrebm asupra puterii informaionale a unor astfel de date. Aparin scalei nominale, ordinale, de interval sau de raport? Fiecare din aceste scale pun probleme specifice de prelucrare, sistematizare i de reprezentare grafic. n ceea mai mare parte a cazurilor, psihologul se gsete n faa unor valori care sunt de nivelul scalei de interval, este adevrat, cu respectarea anumitor convenii care confer datelor acest statut. n funcie de modul de sistematizare a datelor ele ne vorbesc mai mult sau mai puin consistent. Gruparea. n cazul n care modalitile de care dispunem au valoare scalar nominal sau ordinal grupare presupune stabilirea frecvenelor specifice fiecrei modaliti. Frecvenele absolute rezult din nsumarea tipurilor distincte ale modalitilor sau nivelelor. Frecvenele relative traduc cuantumul procentual al fiecrei frecvene absolut, adic valoarea procentului din total reprezentat de o anumit modalitate a variabilei. De exemplu, dac ntr-o cercetare ne propunem s grupm variabila nominal tip de studii superioare, cu modalitile studii umaniste, studii economice, studii tehnice, putem avea urmtoarea situaie (situaie imaginat): Nr. crt. 1 2 3 Tip de studii Studii umaniste Studii economice Studii tehnice Total Frecvena (f) 75 43 14 N = 132 Frecvena relativ(f%) 56,8% 32,6% 10,6% 100%

Tabelul nr.4 Cuprinde modul de nregistrare a frecvenei a modalitilor sau categoriilor unor scale nominale

Frecvena relativ se obine prin nmulirea cu o sut a raportului dintre frecvena relativ i efectivul total. Astfel frecvena relativ 32,5% se obine astfel: 32,5% =

43 * 100 . Frecvenele relative 132 dau o informaie mai precis, mai ales n cazul n care nu se cunoate efectivul total (N =132). Astfel, frecvena absolut egal cu 43 specific modalitii studii medii nu ne comunic prea mult dac nu tim cunoatem valoarea 132, pe cnd valoarea 32,6 ne comunic faptul c modalitatea studii medii cuprinde aproximativ o treime din numrul total al subiecilor.

pentru informaii suplimentare vezi: Valentin Clocotici, Aurel Stan, Statistic aplicat n psihologie, Editura Polirom, Iai, 2000.

132

108

STATISTIC I Pentru variabilele ale cror modaliti se prezint sub form numeric, drumul ordonrii este ceva mai lung. n acest caz, o mas de cifre neordonat ne transmite foarte puin sens. Exemplificrile pe care le vom face pe parcursul lucrrii noastre sunt, n cea mai mare parte, specifice cercetrii psihologice. S presupunem c avem n fa urmtoarele valori rezultate din corectarea unui test psihologic, mai clar spus avem n fa notele brute obinute de 91 de subieci la testul AD-P (atenie distributiv Praga), avnd studii medii, vrsta ntre 35-40 ani, provenind din mediul urban:
22 82 43 46 53 43 64 66 42 55 37 50 59 35 43 49 50 73 61 56 54 70 43 39 56 26 50 67 76 53 55 58 35 38 69 63 63 33 47 53 52 48 32 78 62 46 48 54 48 50 55 49 55 46 42 40 55 36 57 33 55 53 28 68 47 62 66 72 38 60 38 64 59 58 69 72 29 43 67 47 63 55 78 29 53 35 47 56 55 40 57

Menionm c ansamblul valorilor unei variabile poart numele de distribuie. Exist distribuii teoretice, denumire care indic faptul c valorile sunt repartizate conform rigorilor unui anumit model matematic de distribuie, i distribuii empirice, rezultate din cercetri concrete. n cazul nostru de exemplificare, vom opera pe o distribuie empiric. n momentul n care ordonm datele cresctor, ansamblul valorilor ncepe s capete un sens pentru cei care i propunem s le cerceteze. Prezentm, n continuare, ordonarea acestor date. Putem observa cu uurin care este cea mai mic i care este cea mai mare valoare a variabile pe care o notm cu X (care reprezint performana unor subieci la testul AD-P), deci extremele performanelor.
22 35 42 47 50 55 56 62 68 82 26 36 43 47 50 55 57 63 69 28 37 43 48 52 55 57 63 69 29 38 43 48 53 55 58 63 70 29 38 43 48 53 55 58 64 72 32 38 46 48 53 55 59 64 72 33 39 46 49 53 55 59 66 73 33 40 46 49 53 55 60 66 76 35 40 47 50 54 56 61 67 78 35 42 47 50 54 56 62 67 78

Avem n total 91 de rezultate ale subiecilor. n acest caz, valoarea 1 este numit volumul distribuie. Se noteaz cu N. Dup aceast ultim ordonare putem s efectum o grupare a datelor, operaiune care se poate avea dou opiuni: 1. Gruparea pe variante de variaie; 2. Gruparea pe intervale de variaie. Este un tip de ordonare care poate are cea mai larg rspndire, indiferent de domeniu. Unele domenii i impun o serie de modele proprii de prezentare a datelor, funcie de particularitile tipului de cercetare (date rezultate n urma unei observaii, date rezultate dintr-un experiment, date rezultate dintro anchet).

109

AUREL STAN

II.2.1. Gruparea pe variante de variaie.

n cazul n care optm pentru primul fel de grupare, stabilim ct de frecvente sunt valorile diferite pe care le-au obinut subiecii, adoptnd o ordonare ascendent sau descendent a valorilor distincte. Rezultatele unei variabile care nu au suferit nc tratamente de transformare valoric poart numele de valori brute sau note brute. Dac aceast operaiune este efectuat empiric, se ordoneaz cresctor sau descresctor aceste valori, apoi se parcurge ntreaga serie de valori neordonate i se trage cte o linie ori de cte ori ntlnim o valoare identic. n exemplul nostru ordonarea este ascendent. Pentru o bun citire a rezultatelor gruprii empirice se realizeaz grupri de cte 5 valori identice, prin a 5-a linie se bareaz 4 liniue anterioare. Tipul de marcare IIII cuprinde 5 valori identice ale variabilei. Nota brut
22 26 28 29 32 33 35 36 37 38 39 40 42 43 46

Marcare
I I I II I II III I I III I II II IIII III

Fr
1 1 1 2 1 2 3 1 1 3 1 2 2 4 3

Nota brut
47 48 49 50 52 53 54 55 56 57 58 59 60 61 62

Marcare
IIII IIII II IIII I IIII II IIII III III II II II I I II

Fr.
4 4 2 3 1 5 2 8 3 2 2 2 1 1 2

Nota brut
63 64 66 67 68 69 70 72 73 76 78 82

Marcare
III II II II I II I II I I II I

Fr.
3 2 2 2 1 2 1 2 1 1 2 1

Tabelul nr.5 Conine ordonarea pe variante de variaie i marcrile corespunztoare ale frecvenei valorilor

Asemenea contorizri ale datelor se realizeaz n momentul n care tindem s realizm o analiz foarte amnunit, deci cnd ntr-o cercetare opereaz un spirit analitic pronunat. n momentul n care urmrim observarea tendinei centrale a datelor, atunci efectum o grupare pe intervale de variaie. Problema care se pune n acest caz este aceea a numrului optim de intervale n care pot fi grupate datele avute la dispoziie.
II.2.2. Gruparea pe intervale de variaie Aceasta poate lua forma intervalelor egale sau inegale. n majoritatea cazurilor n cercetrile psihologice gruparea se face pe intervale egale. Gruparea pe intervale de variaie presupune urmtoarele etape: alegerea sau determinarea mrimii intervalului de variaie. Mrimea intervalului de variaie depinde de amplitudinea i de numrul de grupe sau de clase dorit. Amplitudinea unei distribuii este distana dintre cea mai mare i cea mai mic valoare. Vom nota cu A amplitudinea distribuiei, notaie acceptat n mare parte de autorii de specialitate. Formula de calcul este urmtoarea: A = Xmax-Xmin+1, n care: Xmax reprezint cea mai mare valoare i Xmin cea mai mic valoare. n cazul nostru concret X max = 82, X min = 22. Procednd la calculare vom avea A = 82 22 + 1 = 61.

Cifra 61 ne spune c ntre cea mai mare i cea mai mic valoare se gsesc teoretic 61 de valori ale variabilei distincte una de alta. Distribuiile empirice (rezultate n urma unor cercetri concrete) nu au, de obicei, toate variantele posibile. n exemplu nostru lipsesc valorile variabilei egale cu 23, 24, 27 etc. Practic, avem un numr de 43 variante distincte ale variabilei. Notm cu i mrimea unui
110

STATISTIC I

A , n care A este amplitudinea k distribuiei, iar k este numrul de intervale n care dorim s mprim distribuia. De exemplu, dac dorim s facem o mprire a distribuiei valorilor n 9 intervale vom avea urmtorul rezultat: 61 i= = 6.77. Dac valorile concrete ale variabilei nu conin zecimale vom proceda la ntregirea 9 valorii i, care se face totdeauna prin adugire. Deci, n urma ntregirii, i = 7. Dac ntregirea s-ar face prin scdere, ar rmne valori n afara intervalelor, valori nealocate unor intervale. Dar, dac vom considera mrimea unui interval egal cu 7, vom mri artificial mrimea amplitudinii cu 2, deoarece 9 7 = 63. Pentru a mpri ponderat diferena la cele dou capete ale distribuiei vom ncepe primul interval de la 21 i ultimul interval va avea valoarea superioar egal cu 83, deci va fi mai mare cu 1. Crearea tabelului cu intervale. Intervalele care rezult sunt urmtoarele:
interval, mrime care se calculeaz dup urmtoarea formul: i =
1 Nr.crt. 1. 2. 3. 4 5. 6. 7. 8. 9. 2 Interval 21 27 28 34 35 - 41 42 - 48 49 - 55 56 - 62 63 - 69 70 - 76 77 - 83 3 Centru interval 24 31 38 45 52 59 66 73 79 4 Marcare II IIII I IIII IIII I IIII IIII IIII II IIII IIII IIII IIII II IIII IIII III IIII IIII II IIII III Total 5 Frecvena 2 6 11 17 22 13 12 5 3 N = 91

Tabelul 6. Conine gruparea pe variante de variaie i marcarea frecvenelor valorile pentru fiecare interval

Pe lng rubricile cuprinznd numrul curent i mrimea intervalului au fost trecute, pentru o mai bun nelegere a tabelului, rubrici cuprinznd marcarea variabilelor componente ale unui interval i frecvena acestora pe un interval. La o prim privire, intervalele creeaz impresia c au valoarea 6, i nu 7, cum am anunat anterior. Dar aceste intervale includ limita inferioar i limita superioar. Intervalul 2127 conine urmtoarele valori teoretice: 21,22,23,24,25,26,27. Deci, are 7 componente numerice distincte. n unele cazuri se face precizarea dac limitele intervalelor sunt sau nu incluse n interval sau se face precizarea care sunt limitele reale ale intervalelor, n cazul existenei unor valori zecimale. Astfel, intervalul 21 27 poate avea limita inferioar 20,5 i limita superioar 27,5 dac am fi avut zecimale.. Ca atare, dac am fi ntlnit valorile 20,7 sau 27,3 le-am fi marcat la intervalul anunat anterior. Centrul intervalului se obine prin mprirea la 2 a adiiei valorii limitei inferioare a intervalului i a celei superioare. Astfel la intervalul nr.1, centrul intervalului, egal cu 24, s-a obinut n felul urmtor: 24 21 + 27 48 = = . Stabilirea centrului intervalului poate fi util pentru uurarea unor calcule, situaie n 2 2 care centrul intervalului este considerat o valoare reprezentativ a intervalului. O problem care se pune la gruparea pe intervale de variaie este aceea a numrului optim de intervale n care se divizeaz distribuia. Exist n aceast privin o serie de formule de calcul i de tabele fixnd numrul de intervale. n primul rnd amintim formula lui H.D. Sturges; care fixeaz

111

AUREL STAN
X max X min

mrimea intervalului i =

1 + 3 . 22 lg N

n care Xmax este cea mai mare valoare a distribuie,

Xmin - cea mai mica valoare i N - numrul total de rspunsuri ale subiecilor. Dup ce am stabilit mrimea intervalului se poate determina foarte uor numrul de intervale Pentru valori nu prea mari ale lui N (sub 100) se folosete formula Hahn-Shapiro: k=Int(N/5), n care k exprim numrul de intervale, INT exprim partea ntreag a expresiei numerice din parantez (ntregire prin scdere, de exemplu, INT (3,7)=3). Ilie Puiu Vasilescu exemplific, n una din lucrrile sale consacrate statisticii aplicate, o serie de tabele care indic numrul de intervale n funcie de numrul de subieci14. Redm, n continuare, unul din aceste tabele, i anume tabelul lui Bendat i Piersol: N 200 400 600 800 1000 1500 2000 K 16 20 24 27 30 35 39
Tabelul 6. Tabelul Bendat Piersol referitor la numrul optim de intervale n care se pot diviza distribuiile

n acest tabel prin n s-a notat numrul r de rspunsuri ale subiecilor la o anumit solicitare i prin k numrul de intervale necesare. Astfel, la 200 de subieci sunt necesare 16 intervale, ntre 201 i 400 sunt necesare 20 de intervale, ntre 401 i 600 avem nevoie de 24 de intervale, .a.m.d. n practic gruprii datelor pe un numr relativ mic de rspunsuri (n jur de 100) se realizeaz 7; 9; 11; 13 intervale. Numrul de intervale este impar, fapt ce pune mai bine n eviden tendina central. n urmtoarea etap se realizeaz un tabel cu frecvenele i alte rubrici necesare efecturii calculelor statistice. Tabele se elaboreaz conform unor reguli. Aceste reguli15 sunt: 1. s faciliteze percepia rapid i exact a informaiilor prezentate; 2. s cuprind numai informaii strict necesare caracterizrii fenomenului studiat; 3. s aib un titlu scurt, clar, care s sintetizeze coninutul informativ al datelor; 4. s fie numerotate pentru a putea fi identificate uor n textul de analiz, 5. s fie nsoite de note explicative care s explice noiunile cu mai multe sensuri; 6. notele explicative trebuie s explice sursa datelor; 7. liniile i coloanele tabelului trebuiesc numerotate pentru a putea fi identificate uor in text; 8. n tabele nu se admit rubrici incomplete. Exemplificm rubricile cu frecvene pe datele anunate de noi anterior:
Nr.crt. 1 2 3 4 5 6 7 8 9 Total Interval 21 27 28 34 35 41 42 48 49 55 56 62 63 69 70 76 77 83 f 2 6 11 17 22 13 12 5 3 N=91 f% 0,02 (2%) 0,07 (7%) 0,12 (12%) 0,19 (19%) 0,24 (24%) 0,14 (14%) 0,13 (13%) 0,05 (5%) 0,03 (3%) 1,00 (100%) fc 2 8 19 36 58 71 83 88 91 fc 0,02 (2%) 0,09 (9%) 0,21 (21%) 0,40 (40%) 0,64 64%) 0,78 (78%) 0,91 (91%) 0,97 (97%) 1,00 (100%) fc 91 89 83 72 55 33 20 8 3 fc% 1,00 (100%) 0,98 (98%) 0,90 ( 90%) 0,78 ( 78%) 0,59 ( 59%) 0,36 ( 36%) 0,22 ( 22%) 0,09 ( 9%) 0,03 ( 3%)

Tabelulul nr.7 Cuprinde intervalele de variaie i tipurile de frecvene

14 15

Vezi Vasilescu, Ilie Puiu, Statistic informatizat pentru tiinele despre om, Editura militar, Bucureti, 1991, pag. 27 Vezi Porojan, Dumitru Statistica i teoria sondajului Casa de editur i pres ansa SRL, Bucureti, 1993, pag. 39

112

STATISTIC I Legend: f = frecven simpl sau frecven absolut; f% = frecven simpl relativ; fc = frecven cumulat ascendent; fc% = frecven relativ cumulat ascendent; fc = frecven absolut cumulat descendent; fc% = frecven relativ cumulat descendent;

Frecvena simpl notat cu f, indic numrul de rezultate ale subiecilor care se gsesc n intervalul respectiv. De exemplu, n intervalul 3, cu limitele 35 41 (limita inferioar 35, limita superioar 41) se gsesc 11 rezultate ale subiecilor. Deci, 11 subieci au obinut la proba AD-P rezultate (sau scoruri) cuprinse ntre 35 i 41. Dac adiionm toate cele 9 frecvene simple va rezulta valoarea 91, reprezentnd ansamblul rezultatelor subiecilor care au participat la examinare (notat cu N mare. N reprezint volumul distribuiei). Frecvena simpl relativ, notat cu f%, indic cota parte de subieci (este exprimat sub form de proporie) din totalul de 91, existent n intervalul respectiv. n dreptul intervalului 3 (35 41) se vor afla 0,12 din totalul rezultatelor subiecilor, sau, exprimat sub form procentual, 12% din acest total(valoare trecut n parantez). Frecvena cumulat ascendent indic numrul rezultatelor subiecilor care se gsesc pn n dreptul intervalului respectiv (inclusiv acest interval). De exemplu, n dreptul intervalului 3 de la rubrica fc se gsete valoarea 19, semnificnd faptul c pn n dreptul intervalului 3, inclusiv acesta, se gsesc 19 rezultate ale subiecilor, sau mai clar, primele 19 rezultate ale subiecilor ordonate cresctor. Valoarea 19 se obine prin adiia primelor 3 frecvene simple (19 = 2+6+11). Valoarea corespunztoare a intervalului 4, din rubrica fc este 36. Ea se obine din adiia valorilor primelor 4 frecvene simple (36 = 2+6+11+17). Primele valori din rubricile f i fc coincid (ambele au valoarea 2). Frecvena relativ cumulat ascendent reprezint cota parte din totalul rezultatelor subiecilor existent pn la un anumit interval. Ea ne informeaz despre proporia rspunsurilor subiecilor ( n parantez este trecut forma de exprimare procentual) pn la un anumit interval. De exemplu, n dreptul intervalului 4 la rubrica fc% se gsete valoarea 0,40, care provine din adiia frecvenelor simple relative de la intervalele 1- 4 (0,02 + 0,07 + 0,12 + 0,19). Aceast valoare ne spune c pn la intervalul 4, inclusiv acesta, se gsesc 0,40 din totalul rspunsurilor subiecilor, sau, exprimat sub form procentual, 40% din totalul acestora. Frecvena cumulat descendent exprim numrul rspunsurilor subiecilor care se gsete dincolo de un anumit interval Astfel, valoarea 72 a intervalului 4 din rubrica fc exprim faptul c dincolo de intervalul 4 (inclusiv acesta) se gsesc 72 de rspunsuri ale subiecilor. Valoarea 72 se obine scznd din numrul total al subiecilor (N = 91) adiia frecvenelor simple a primelor 3 intervale. Astfel 72=91(2+6+11). Dac ar trebui s calculm frecvena cumulat descendent a intervalului 5 vom scdea din totalul rspunsurilor adiia primele 4 valori, iar pentru intervalul 6 adiia primelor 5 valori (55 = 91(2+6+11+17) i 33=91(2+6+11+17+22)). Frecvena relativ cumulat descendent, notat cu fc% exprim o situaie identic, exprimat sub form de proporie, n parantez sub form procentual). Tabelul cuprinznd frecvenele unei distribuii pe intervale de variaie are o utilitate deosebit pentru calculul diferiilor indicatori statistici.

113

AUREL STAN

II.3. REPREZENTRILE GRAFICE ALE REZULTATELOR.

Formele de reprezentare grafic ale distribuiilor valorilor unei variabile (distribuii univariate, n care exist o singur variabil care ia diferite valori) sunt foarte diversificate, Ele au menirea de a vizualiza tendinele existente n interiorul unei distribuii. Prin aceast form grafic unele tendine existente ntr-o distribuie sunt scoase foarte uor n eviden. Noi vom prezenta cele mai frecvent utilizate forme de exprimare grafic. Folosim pentru exemplificare distribuia de valori prezentat n tabelul anterior.
II.3.1. Reprezentarea grafic prin coloane Prezint n cadrul unui sistem de axe rectangulare intervalele de distribuie pe abscis i frecvena acestora pe ordonat. Intervalele de distribuie sunt prezentate prin marcaje echidistante pe axa absciselor, din care nal coloane proporionale cu frecvena acestor intervale.

25
Frecventa intervalelor

22 17 11 13 12

20 15 10 6 5 0
"21-27" "28-34" "35-41"

2
"42-48" "49-55" "56-62" "63-69" "70-76"

"77-83"

Intervale de variatie

Figura 1. Reprezentarea grafic prin coloane sau prin bare

O form a reprezentrii grafice prin coloane este histograma, n care coloanele sunt lipite unele de altele.

114

STATISTIC I
25 20
Frecventa intervalelor

15 10 5 0 2
"21-27"

22 17 11 6
"28-34" "35-41" "42-48" "49-55" "56-62" "63-69"

13

12 5
"70-76"

3
"77-83"

Intervale de variatie

Figura 2. Reprezentarea grafic sub forma histogramei O alt form frecvent utilizat de reprezentare grafic a rezultatelor este poligonul frecvenelor. Acesta se obine prin unirea printr-un segment de dreapt a mijlocului liniilor superioare care marcheaz coloanele histogramelor. Se pot obine i prin unirea prin segmente de dreapt a punctelor care ar reprezenta frecvena fiecrui interval, pornind din centrul acestuia
Figura 3. Reprezentarea grafic prin poligonul frecvenelor.

25
Frecventa intervalelor

20 15 10 5 0 2
"21-27" "28-34" "35-41 "42-48"

22 17 11 6 13 12

3
"77-83"

"49-55"

"56-62"

"63-69"

70-76"

Intervale de variatie

Dac marcm pe abscis fiecare interval prin liniue echidistante i unim printr-o linie continu punctele reprezentnd frecvena intervalelor obinem curba distribuiei.

115

AUREL STAN

25 22 20 Frecventa intervaleor 17 15 13 10 6 2 0 "21-27" "28-34" "35-41 "42-48" "49-55" "56-62" "63-69" Intervalele de variatie 11 12

5 3

70-76" "77-83"

Figura 4. Reprezentare grafic sub forma curbei frecvenelor

Reprezentrile grafice ale variabilelor calitative cunosc o serie de particulariti, determinate de specificul scalei de msurare. Astfel, pentru a nu crea iluzia unei forme de distribuiei (deoarece modalitile unei variabile nominale i pot schimba locul fr a denatura reprezentarea fenomenului studiat) se adopt ca forme de reprezentare grafic diagrama n tronsoane i diagrama circular. Pentru exemplificare, folosim datele tabelului anterior referitor la tipul de studii. Diagrama prin tronsoane

14 43 c b 75 a

a-studii umaniste;b-studii economice;c-studii tehnice

a studii tehnice 11% studii economice 33% studii umaniste 56%

Diagrama circular

Figura 5. Cuprinde modaliti de reprezentare grafic specifice scalelor nominale(n primul tip de reprezentare grafic sunt trecute frecvenele absolute, n al doilea tip frecvenele relative).

116

STATISTIC I
II.4. PROTOCOALE DE PREZENTARE A DATELOR. Noiunea de protocol de prezentare a datelor este foarte frecvent utilizat n domeniul cercetrilor calitative i cantitative din cadrul disciplinelor socio-umane. Este un tablou al rezultatelor de baz care nregistreaz rezultatul fiecrui subiect n fiecare din condiiile experimentale.

Pentru a nu folosi termeni tiinifici nc necunoscui studenilor anului I, menionm c experimentul este o metod de investigaie care presupune varierea elementelor constitutive ale unei situaii n scopul de a provoca un fenomen i de a msura evoluia sa. Elaborarea unui experiment este fcut n scopul de a analiza modificrile rspunsului n funcie de caracteristicile stimulului, ale situaiei, ale sarcinilor sau ale subiecilor. Am amintit anterior c variabilele independente n cadrul unui experiment poart numele de factori. Anumii autori (H. Rouanet) disting variabila independent de factor, n sensul c factorul este o anumit operaionalizare a variabilei. Operaionalizarea conceptual a fost explicat anterior.. Un plan factorial este un plan de cercetare n care fiecare modalitate a factorului este combinat cu fiecare modalitate a altor factori. Numrul condiiilor experimentale ntr-un anumit plan factorial este egal cu produsul numrului de modaliti a fiecrui factor. Dac dorim s studiem particularitile atitudinale n funcie de mediul de provenien i sex, vom avea un plan experimental 2x2: variabila mediu de provenien (notat cu P2) are modalitile rural (notat p1) i urban(notat p2) i variabila sex(notat S2) are modalitile masculin(notat s1) i feminin (notat s2). 4 condiii experimentale ofer surse de date care vor fi supuse analizei: condiia 1(p1s1), condiia 2(p1s2), condiia 3(p2s1), condiia 4(p2s2).
Protocol de tip Sn protocol de structur subiect-rezultat total. n cadrul acestui tip de protocol, fiecrui subiect si dintr-un ansamblu format din n subieci i corespunde o valoare a variabilei Xi.16 Exemplu:

Si S1 S2 S3 S4 Sn

Xi X1 X2 X3 X4 Xn

Si 1 2 3 4 87

Xi 17 19 27 33 27

Tabelul 8. Protocol de tip Sn n partea din dreapta se d un exemplu concret

Protocol de structur S <G>. Protocol de structur subiect-grup de apartenen. Astfel de protocoale se construiesc n cazul n care rezultatele numerice aparin la subieci care fac parte din grupuri diferite sau care au fost plasai n situaii diferite i constituie grupuri independente de msurtori. Exemplificm:

Explicaii suplimentare n lucrarea Valentin Clocotici, Aurel Stan, Statistic aplicat n psihologie, Polirom, Iai, 2000, pag.94-103
16

117

AUREL STAN

S S1 S2 S3 Si Sn

G G1 G1 G2 Gi Gq

Xi X1 X2 X3 Xi Xn

S 1 2 3 35 143

G Grup 1 Grup 1 Grup 2 Grup 3 Grup 7

Xi 12 19 23 35 29

Tabelul 9. Protocol de baz de tipul subiect grup de apartenen

Protocol de tipul S*T protocol de structur subiect-condiii de investigaie. Se realizeaz n situaia n care subiecii(S) sunt supui la mai multe condiii de solicitare psihic. Vom exemplifica pentru dou condiii: sunt prezentate rezultatele aceluiai subiect n condiia T1 i condiia T2

S S1 S2 S3 . Sg

T1 X11 X21 X31 . Xp1

T2 X12 X22 X32 Xp2

S 1 2 3 123

T1 23 34 28 .. 21

T2 29 31 39 26

Tabelul 10. Protocol de baz de tipul subiect condiii de investigaie. n ultimele trei coloane din dreapta se exemplific cu o examinare concret.

Suportul protocolului este cadrul n care rezultatele individuale nu au fost reportate. Subprotocolul este o parte a protocolului de baz; rezultatele obinute printr-o parte din subieci i/sau ntr-o parte a condiiilor experimentale

Mai putem vorbi de protocoale derivate. Acest tip de protocol este obinut dup ce s-a realizat anumite operaiuni (transformri ale variabilelor dependente, diferite calcule, condensri i rafinri ale modalitilor) asupra protocolului de baz. De exemplu, calculul mediei rezultatelor obinute de subieci ntr-o condiie experimental. Calculele pot s rezide n transformarea variabilei dependente (prin transformare logaritmic, de exemplu), n rezumarea rezultatele prin intermediul diferitelor tipuri de indicatori (tendin central, dispersie), n nsumarea datele individuale i n calcularea frecvenelor sau a procentajelor. n general, cercettorul va prezenta datele ntr-un tablou al rezultatelor care constituie un protocol derivat.
Exemplificare. Protocoale derivate17 Doi cercettori francezi, J.P. Rossi i C. Loridan, au efectuat n anul 1987 un studiu asupra modelelor fonologice de identificare a stimulilor scrii. n timpul efecturii studiului au calculat durata pauzelor oculare asupra stimulului: (cuvinte sau ne-cuvinte) care aveau 2-3 silabe sau 4-5 silabe n

17

dup J.P. Rossi & Al., La mthode exprimentale en psychologie, Dunod, Paris, 1997, pag.61

118

STATISTIC I situaii de detecie a literelor(subiectul trebuie s spun dac o anumit liter era prezent printre stimuli) i de decizie lexical (subiectul trebuia s spun dac stimulul era un cuvnt). n urma prelucrrii rezultatelor, autorii au ntocmit urmtorul tabel:
Numr silabe n1 n2 m s m s Detecie litere (t1) Cuvinte(m1) Necuvinte(m2) 457 473 133 126 460 482 126 105 Decizie lexical (t2) Cuvinte(m1) Necuvinte(m2) 414 497 111 137 468 579 145 176

n acest tabel sunt nregistrate duratele pauzelor oculare. Explicarea acestei cercetri opereaz cu urmtorii termenii: factor principal sistematic, notat T2, cu modalitile t1 (detecia literelor) i t2 (decizia lexical). Prin aceast se permite o prim diviziune n dou coloane a rezultatelor; tipul de stimul, notat cu M2, cu modalitile m1 (cuvinte) i m2 (necuvinte). Cu M2 se permite subdivizarea coloanelor t1 i t2 (sarcinile); numrul de silabe, notat N2, cu modalitile n1 (2 sau 3 silabe) i n2 (4 sau 6 silabe). N2 este indicat pe linii. Variabila dependent este durata pauzelor oculare. n tabel sunt nregistrate mediile interindividuale (m), ca indicator de tendin central, i abaterile standard (s), ca indicator de mprtiere. Lectura tabelului presupune punerea n coresponden a liniilor i coloanelor. Valoarea 457 semnific durata medie a pauzelor oculare n sarcina de detecie a literelor cnd stimulii sunt cuvinte de 2-3 silabe. Valoarea 497 semnific durata medie a pauzelor oculare cnd stimulii sunt necuvinte de 2-3 silabe. Protocolul prezint un indicator de tendin central i un indicator de mprtiere care fac bilanul datelor experimentale. Un protocol de baz cuprinde durata pauzelor oculare obinute de fiecare subiect pentru fiecare din stimulii prezentai, deoarece n fiecare condiie experimental sunt utilizai mai muli stimuli diferii.

II.5. TRANSFORMAREA VALORILOR BRUTE N CUANTILE Care este raiunea acestei transformri? n marea majoritate a examinrilor psihologice se cere o raportare valoric a rezultatelor obinute. Rezultatul brut al unui test sau chestionar psihologic nu ne poate da dect o indicaie vag n privina aprecierii unui rezultat. Pentru a veni n ntmpinarea dezideratului de raportare valoric a rezultatelor s-au creat dou sisteme de norme. Unele dintre acestea sunt cuantilele, iar celelalte sunt variabilele normate care vor fi tratate n seciunea din lucrare afectat indicatorilor de mprtiere. Cuantilul este un element al unei serii ordonate de valori ale unei variabile care separa dou cuantumuri procentuale din volumul total al valorilor variabilei. Practic, este o born numeric separnd dou cuantumuri procentuale ale ansamblului valorilor Valorile variabilei separate prin intermediul unui cuantil sunt ordonate cresctor sau descresctor, operaie anterioar stabilirii cuantilului. Separaia unui ansamblu de valori ale variabilelor n cuantile constituie una din formele de etalonare a testelor, adic de creare a unor scale de apreciere a valorii performanelor obinute la diferite sisteme de solicitare psihic. Etaloanele permit de a situa un subiect care a obinut un scor
119

AUREL STAN

determinat ntr-o anumit clas valoric a subiecilor pentru care testul a fost etalonat. Se va vorbi de intercuantile (de interdecile, de exemplu) pentru a desemna n+1 zone de distribuie delimitate prin cuantile (prin n desemnnd numrul cuantilelor). Uneori se utilizeaz termenul de interquantil n loc de quantil. Distincia clar se face prin precizarea faptului c interqantilul este un interval numeric, pe cnd
quantilul este reprezentat de o singur valoarea numeric. Lucrrile se specialitate ale lui Maurice Reuchlin consacrate statisticii aplicate n psihologie fac clar aceast separaie de sensuri pentru cele dou noiuni18. Cuantilele i intercuantilele numerotate cu 1 corespund, n general n Frana, celor mai bune rezultate, iar n SUA rezultatelor celor mai slabe. Este o chestiune de convenie a notrii. Dac ntr-o distribuie se vor reprezenta intercuantilele prin clase determinnd intervale pe axa absciselor, se va asigura la aceast distribuie grafic o form rectangular, efectivele teoretice ale tuturor interquantilelor fiind egale prin definiie. La nceputul procedurii de cuantilaj (form particular a etalonajului) se alege o metric, adic un numr de niveluri pe care scala permite de a le discrimina. Dac o scal cuprinde n niveluri i dac efectivul total al unui eantion este N, efectivul fiecrui nivel va fi teoretic

N . Scala n cuantile va corespunde, deci, unui model n

rectangular. Cele mai utilizate tipuri n cuantile sunt prezentate n tabelul care urmeaz: Nr.crt.. 1 2 3 4 5 6 7 8 9 Nr interquantile 3 4 5 6 7 8 9 10 100 Nr quantile 2 3 4 5 6 7 8 9 99 Denumire tehnic Trecil Quartil Quintil Sextil Septil Octiil Nonil Decil Centil. Tabelul nr. 11 Conine denumirile formelor de etalonare prin intermediul cuantilelor, gradiente de la 3 la 10

Pentru a construi un decilaj (sistem de clasificare cuprinznd 9 cuantile i 10 intercuantile) se procedeaz n aa fel nct clasele scalei rezultate s conin fiecare un acelai numr de scoruri din eantionul de referin. Este vorba de o convenie care va face distribuia rectangular (n care fiecare diviziune are un numr egal de subieci). Dac scala este constituit din 10 clase egale n efectiv, acest efectiv va trebui s aib 10% din numrul total al subiecilor. Limitele valorice ale interquantilului I vor conine primele 10 % din notele brute, celor mai slabe din distribuie, ale interquantilului II conin 10% din rezultatele care urmeaz, i aa mai departe, pn la interquantilul X. Quantilul I va separa primii 10% din subieci de urmtorii 90%, quantilul II primii 20% din subieci de urmtorii 80 %, i aa mai departe, pn la quantilul IX care va separa primii 90% de urmtorii 10% . Oferim un exemplu imaginat: un psiholog examineaz un numr de 360 de subieci cu un anumit test n vederea etalonrii acestuia. Procedura de etalonare se pune n practic n faza construirii unor instrumente de investigaie psihologic sau n cazul reevalurii acestora. Notele testului variaz, in exemplu nostru, ntre 0 i 35. Exemplu dat este unul imaginat i nu va conine primele 5 valori (1,2,3,4,5) i ultimele 3 (33,34 i 35). De obicei, n examinare se obin foarte rar scorurile cele mai mici i scorurile cele mai mari ale testului sau chestionarului. Dac datele ar fi fost reale, ar fi trebuit s se fac o serie de precizri cu privire la constituirea eantionului de etalonaj, adic la proveniena subiecilor examinai, la vrst, nivel de studii, sex etc. De asemenea, ar fi trebuit s se fac precizri cu

18

Vezi Maurice Reuchlin, Prcis de statistique, PUF, Paris, 1976, pag. 67-78

120

STATISTIC I privire la tehnicile folosite pentru selectarea subiecilor n eantion. naintea operaiunii de etalonare, datele se organizeaz cresctor n variante de variaie. Tabelul ntocmit n vederea stabilirii scalei de etaloane n 10 interquantile (sau n 10 clase) va arta n felul urmtor.
X 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 n 3 7 4 6 8 11 14 17 16 19 24 22 26 21 24 18 19 17 14 16 14 11 9 7 6 5 2 nc 3 10 14 20 28 39 53 70 86 105 129 151 177 198 222 240 259 276 290 306 320 331 340 347 353 358 360 nct Interdecil Decil Numerotare % interdecil Separaie decil

36 72 108 144 180 216 252 288 324 331 340 347 353 358 360

0 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

11 13 15 17 18 20 22 24 26

I II III IV V VI VII VIII IX

10,88% 8,61% 9,72% 12,77% 7,22% 12,50% 10,27% 8,61% 8,33%

10,88%/89,12% 19,49%/80,51% 29,21%/70,79% 41,98%/58,02% 49,20%/50,80% 61,70%/38,30% 71,97%/28,03% 79,58%/20,42% 87,91%/12,09%

27-32

12,09%

Tabel nr. 12. Coloanele tabelului conin etape ale procedurii de etalonare prin metoda quantilelor a rezultatelor obinute la un test psihologic de subieci unui eantion

Notaiile folosite n tabel : X: nota brut n: frecvena absolut a unei variante de variaie nc:frecvena cumulat absolut nct: frecvena cumulat absolut necesar teoretic pentru calcularea interquantilelor i quantilelor. Jocul frecvenelor cumulate absolute face s nu putem tia distribuia exact acolo unde trebuie. n acest caz ne limitm n calcul la cele mai apropiate valori de cele teoretice. Astfel, la primul decil ar fi trebuit s ne oprim la valoarea 36. Valoarea 39 folosit de noi ca valoare delimitativ pentru primul decil este cea mai apropiat valoare de 36. Procednd n acest fel am realizat un compromis metodologic. n cazul cnd dorim s stabilim o scal n centile sau percentile, avem la ndemn o procedur puin diferit. Pentru a pune n aplicare aceast procedur trebuie s avem distribuii ale cror amplitudini sunt de ordinul sutelor. Raiunea construirii scalelor care fac apel la centile este de a asigura
121

AUREL STAN

o discriminare foarte fin a subiecilor, dar n cazul n care amplitudinea distribuiei este sub 100 asigurm o fals finee a diferenierii. Redm, n continuare, un tabel ale crui coloane indic paii de urmat n procedura de calcul: Lum exemplu a 127 de subieci care au fost examinai cu un anumit test (exemplul este fictiv).
Nr.crt. X f f% C fc% Percentila 1. 11 2 1,57 2 1,57 0,79 2. 12 5 3,94 7 5,51 3,54 3. 13 7 5,51 14 11,02 8,27 4. 14 11 8,68 25 19,69 15,36 5. 15 19 14,96 44 34,65 27,17 6. 16 26 20,47 70 55,12 44,89 7. 17 18 14,17 88 69,29 62,21 8. 18 15 11,81 103 81,10 74,50 9. 19 11 8,66 114 89,76 85,43 10. 20 7 5,51 121 95,28 92,52 11. 21 4 3,15 125 98,43 96,85 12. 22 2 1,57 127 100,00 99,22 Tabel nr. 13. Coloanele tabelului indic etapele necesare calculrii valorilor percentile

Avem n fa un exemplu simplu, deoarece n practic este foarte puin probabil s se gseasc un test la care s se poat obine doar 12 valori distincte. Procedura exemplificat de noi este folosit de autori reputai n domeniul psihometric ca David Magnusson19, J.J. Bernier i B. Pietrulewicz20. Prin aceast procedur se ncearc a se ameliora impreciziile metodei prezentate la calculul decilelor. Coloana notat cu X conine diferitele variante ale variabilei obinute n urma unei examinri cu un anumit test. A doua coloan, notat cu f , conine frecvenele diferitelor valori ale variabilei. n total au fost cuprini n analiz 127 de rezultate ale subiecilor. Cu f% a fost notat frecvena simpl relativ, care se obine prin nmulirea cu 100 a rezultatului mpririi fiecrei frecvene simpl la 127 (numrul total de subieci examinai). Cu fc a fost notat frecvena absolut cumulat ascendent, iar cu fc% frecvena relativ cumulat ascendent. Valorile din aceast coloan se obin prin nmulirea cu 100 a rezultatului mpririi fiecrei valori din coloana fc la 127. Ultima coloan conine transformarea n valori percentile a valorilor iniiale ale testului. Cum se obin aceste valori? Valoarea 13, de exemplu, este considerat mijlocul unui interval de clas care se ntinde de la 12,5 pn la 13,5. Ca atare, valoarea percentil este constituit din frecvena cumulat relativ anterioar valorii 13 i din adugarea din frecvena relativ din dreptul valorii 13. 8,27 = 5,51 +
5,51 2 8,68 2

15,36 = 11,02 +

Ce ne spune o valoare percentil? Ea ne spune, de exemplu, c sub valoarea 16 se gsesc aproximativ 45% din totalul subiecilor, iar peste aceast valoare se gsesc aproximativ 55 % din totalul subiecilor.
19 20

vezi David Magnusson, Testtheorie, Verlag Fraanz Deutlicke Wien, 1973, pag 252 vezi J.J. Bernier, B. Pietrulewicz, La psychometrie, Gaetan Morin Editeur, Montreal, Casablanca, 1997, pag. 371-372

122

STATISTIC I n cazul ordonrii valorilor variabilei pe intervale de variaie procedura este puin diferit. Folosim exemplul de la nceputul seciunii referitoare la gruparea datelor. Rubricile tabelului sunt cunoscute din comentariile noastre anterioare. n cazul n care dorim s construim o scal n quartile (trei quartile mpart distribuia n 4 clase) vom stabili n primul rnd quota, adic un cuantum procentual de subieci separat de valorile quartilelor. Deci, quartilele se refer la valorile distribuiei, iar quota la un cuantum procentual al efectivului total. Quota pentru primul quartil va fi de 25% din efectivul total (22,75 n valoare absolut), quota pentru cel de-al doilea quartil va fi de 50% (45,5 n valoare absolut) i quota pentru cel de-al treilea quartil va fi de 75% (68,25 n valoare absolut). Nr.crt 1 2 3 4 5 6 7 8 9 Total Interval 21 27 28 34 35 41 42 48 49 55 56 62 63 69 70 76 77 83 f 2 6 11 17 22 13 12 5 3 N=91 Fc 2 8 19 36 58 71 83 88 91 fc% 0,02 (2%) 0,09 (9%) 0,21 (21%) 0,40 (40%) 0,64 64%) 0,78 (78%) 0,91 (91%) 0,97 (97%) 1,00 (100%)

Tabelul 14. Coloanele tabelului conin etape de calcul pentru obinerea quantilelor i interquantilelor n condiiile gruprii de variante de variaie

Valoarea primei quote va cuprinde 25% din rezultatele subiecilor examinai.. Dac privim la rubrica fc% a tabelului observm c primii 25% din subieci sunt delimitai de intervalul numrul 4 care cuprinde pn la el 40% din subieci (inclusiv intervalul 4). Intervalul anterior nu putea s fac o astfel de separaie, deoarece pn la el se gsesc doar 21% din rezultatele subiecilor (19 rezultate n valoare absolut). Formula de calcul pe care o aplicm pentru calculul quantilelor pentru date organizate pe variante de variaie este urmtoarea. i*d ; Q = X sup + f n care: Q = denumire generic pentru quantil; Xsup= valoarea superioar a intervalului anterior celui n care se afl quota; i = mrimea intervalului de variaie; d = diferena dintre valoarea absolut a quotei i frecvena cumulat absolut anterioar intervalului n care se afl quota; f = frecvena simpl absolut a intervalului n care se afl quota Pentru cazul nostru particular de calcul a quartilelor, form particular a quantilelor, vom nota quartilul 1 cu Q1, quartilul 2 cu Q2, quartilul 3 cu Q3. Pentru Q1 am amintit c valoarea procentual a quotei este de 25%, iar valoarea absolut este de 22,75 (25% din 91; 910,25=22,75). Valoarea absolut a quotei primului quartil se afl n intervalul 4. Xsup sau valoarea superioar a intervalului anterior celui n care se afl quota este egal cu 41. Intervalul anterior este intervalul 3 (35-41). Valoarea superioar sau limita superioar a acestuia este 41. Mrimea unui interval (i) este egal cu 7.
123

AUREL STAN

Diferena dintre valoarea absolut a quotei (22,75) i frecvena absolut cumulat ascendent a intervalului anterior celui n care se afl quota (19) este egal cu 3,75 (deci, d=22,7519=3,75). Frecvena intervalului n care se afl quota este egal cu 17. Intervalul 4 are frecvena egal cu 17. Avem la dispoziie toate datele necesare calculrii primului quartil. 7 * 3,75 26,25 = 41+ = 41 + 1,54 = 42,54 Q1 = 41+ 17 17 n continuare, trecem la calcularea celui de-al doilea quartil. Al doilea quartil separ primele 50% din rezultatele subiecilor de urmtoarele 50%. De aceast dat quota va fi egal cu 50% din efectivul 91 total, deci, va avea valoarea 45,5 ( = 45,5 ). De aceast dat quota se va situa n intervalul 6, adic 2 intervalul 49 55. Limita superioar a intervalului anterior celui n care se afl quota (Xsup) va fi egal cu 48, diferena ntre quot i frecvena cumulat ascendent anterioar va fi egal cu 9,5 (d = 45,5 36 = 9,5) i frecvena pe intervalul n care se afl quota va fi egal cu 22. Din efectuarea calculelor rezult: 7 * 9,5 66,5 = 48 + = 48 + 3,02 = 51,02 Q2 = 48+ 22 22 Pentru calcularea celui de-al treilea quartil, care separ primele 75% dintre rezultatele subiecilor de ultimele 25% din acestea, quota va fi egal cu 75%, adic are valoarea 68,25. Aceast valoarea se va gsi n rubrica fc n dreptul intervalului 6 (56 62). Valoarea superioar a intervalului anterior celui n care se afl quota va fi egal cu 55 (Xsup.). Diferena dintre quot i frecvena cumulat ascendent a intervalului anterior celui n care se afl quota este egal cu 10,25 (d = 68,25 58,00). Frecvena intervalului n care se afl quota specific quartilului 3 este egal cu 13. Dup ce am aflat respectivele valori, putem trece la calcularea quartilului 3. 71,75 7 * 10,25 Q3 = 55 + = 55 + = 55 + 5,51 = 60,51 13 13 Deoarece valorile quartilelor prezint zecimale (ele rezult din interpolare) putem s procedm la ntregire. Prezentm situaia rezultat n tabelul urmtor. Nr.crt. Notare Valoare ntregire Notare interquartile Limite quartille 1 Q1 42,54 43 I 43 2 Q2 51.02 51 II 44 51 3 Q3 60,51 61 III 52 61 4 IV 62
Tabelul 15. Conine exemplificri pentru valorile i notrile quartilelor

Procedura este identic pentru celelalte variante ale cuantilelor. Datele pentru efectuarea calculelor variaz n funcie de mrimea valorilor variabilei i de dimensiunea quotei. Se observ foarte uor c interquartilele nu sunt egale n privina dimensiunii intervalelor, ci n privina numrului de rezultate coninute. De exemplu: pn la valoarea 43 se gsesc primele 25% dintre rezultate, ntre valorile 44 i 51 ale variabilei se gsesc urmtoarele 25% dintre rezultate, .a.m.d.

124

STATISTIC I
EXERCIIU

Urmtoarele rezultate aparin unor subieci care au efectuat un test psihologic. 111,116,118,56,58,90,75,65,76,55,47,69,83,100,87,70,,81,73,69,94,85,76,79,81,85,61,58,73, 97,101,89,98,66,85,93,67,84,75,57,80,78,94,107,69,75,97,83,89,72,84,103,107,80,73,79,85, 110,59,63,85,78,63,101,97,93,83,87,69,101,93,83,77,98,64,68,78,96,103,98,81,75,85,89,93, 98,58,109,113,58,69,75,87,89,93,87,85,88,89,73,90,78,108,59,70,82,75,72,80 Pentru gruparea i sistematizarea rezultatelor efectuai urmtoarele sarcini de prelucrare statistic: stabilii amplitudinea distribuiei; realizai o grupare pe variante de variaie; realizai o grupare pe intervale de variaie n 7 i 9 clase; realizai histograma distribuiei grupate pe intervale de variaie; calculai valorile quartilelor i decilelor, a interquartilelor i a interdecilelor.

125

AUREL STAN

III. INDICATORII STATISTICI

n activitatea de cercetare a unei serii de date avem nevoie de expresii numerice precise care s descrie condensat caracteristicile acesteia. Aceste mrimi poart numele de indicatori statistici.. Indicatorul statistic este o mrime cu ajutorul creia se caracterizeaz un fenomen sub raportul structurii, interdependenelor, i modificrilor n timp i spaiu. Expresia numeric este legat de calitatea fenomenului studiat i, n consecin, indicatorul statistic este expresia numeric a unei categorii riguros definite. Din punct de vedere numeric indicatorul statistic poate fi o mrime absolut (volum, efectiv, total) sau o mrime derivata (medie, indice, coeficient). Indicatorul statistic este rezultatul unei observri i prelucrri statistice. n activitatea de prelucrare a datelor din domeniul psihopedagogic, i nu numai din acesta, se fac raportri la 4 feluri de indicatori: 1. indicatori de nivel sau de tendin central (medie, median, modul); 2. indicatori de mprtiere (amplitudine, abatere quartil, abatere medie, varian, abatere standard); 3. indicatori de asimetrie 4. indicatori de exces sau de boltire Media exprim nivelul atins de o variabila numeric atunci cnd aceast variabil este uniform repartizat pe unitile care compun o populaie determinat. Cuvntul medie, fr nici o alt specificaie, se folosete n accepia de medie aritmetic, medie fundamentat n teorie i comod de utilizat n practic. Alte medii uzuale sunt: media armonic, media geometrica i media ptratic. Notaia uzual pentru media aritmetic este X , dar se pot ntlni i alte notaii. n sens general, media trebuie s satisfac anumite condiii. Acestea sunt: Medie trebuie s fie definit n mod precis. Aceast cerin nu poate fi lsat doar pe seama simplei aprecieri subiective a celui care efectueaz aciunea de observare; medie trebuie sa fie expresia tuturor observaiilor fcute. n caz contrar, ea nu poate fi n mod real o valoare tipic a ntregii repartiii; Este de dorit ca media s posede proprieti simple i evidente, fcnd posibil nelegerea sensului su general. O medie nu trebuie s aib un caracter matematic prea abstract; Este de dorit ca o medie s poat fi calculat cu uurin i rapiditate. Dintre dou medii cu proprieti asemntoare va fi preferata aceea care se poate calcula mai uor. ns, nu trebuie s acordm o prea mare atenie uurinei n calcul n detrimentul altor exigene; Este de dorit ca media sa fie afectat ct mai puin de fluctuaiile de selecie. n eantioanele extrase (eantionul are sensul de subansamblu al unei populaii) din aceeai populaie mediile vor fi rareori identice, iar o form anumit de medie poate conduce la diferene mai mari dect alta. Dintre doua forme de medii va fi mai bun aceea care prezint mai mult stabilitate. Medie trebuie s poat fi rapid studiat cu ajutorul calculului algebric.

126

STATISTIC I n marea majoritate a cazurilor de cercetrile psihopedagogice referinele se fac la media aritmetic., motiv pentru care nu prezentm celelalte feluri de medii: media geometric, media ptratic, media armonic (avem, desigur, n vedere i caracterul simplificat al acestui curs). Referindu-ne n mod special la media aritmetic, adic media obinut ca raport ntre suma valorilor observate ale unei variabile i numrul lor, menionm care sunt proprietile acesteia: Dac lum n consideraie diferenele dintre fiecare observaie n parte i media aritmetic, observm c suma algebric a acestor diferene va fi egal cu 0; Suma ptratelor abaterilor respective este un minim pentru ansamblu de valori. Suma ptratelor abaterilor de la fiecare valoare individual a variabilei i media aritmetic este mai mic dect suma abaterilor ridicate la ptrat n jurul oricrei alte valori n afar de media aritmetic; Nr.crt. 1 2 3 4 5 6 7 8 9 10 11 Total X 11 15 15 19 22 21 17 12 17 19 18 187 x=X-X -6 -2 -2 2 5 4 0 -5 0 2 1 0 x2 36 4 4 4 25 16 0 25 0 4 1 119 X-15 -4 0 0 4 7 6 2 -3 2 4 3 21 (X-15)2 16 0 0 16 49 36 4 9 4 16 9 159 X-19 -8 -4 -4 0 3 2 -2 -7 -2 0 1 -7 (X-19)2 64 16 16 0 9 4 4 49 4 0 1 159

Tabelul 16. Cuprinde compararea sumei deviaiei valorilor de la medie n comparaie cu suma deviaiilor de la alte valori

Volumul sau efectivul acestei distribuii este 11. Media o aflm prin divizarea sumei tuturor valorilor individuale (187) la 11, rezultatul fiind 17. Prin x se noteaz deviaiile fiecrei valori de la medie, motiv pentru care valoarea obinut se numete valoare de deviaie. n tabel se observa clar c suma ptratelor diferenei de la alt valoare dect media aritmetic este o valoare mai mare dect suma ptratelor abaterilor de la media aritmetic. Astfel, din consultarea tabelului rezult:

x < (X 15) ; x < (X 15) : x < (X 19)


2

Folosirea mediei n prelucrarea statistic a datelor din domeniul psihopedagogiei este frecvent n trei tipuri de situaii, din care unele pot fi rezolvate prin folosirea medianei i a modulului: Situaia n care se pune problema de a aprecia o observaie ntr-o distribuie. Exemplu: O not poate fi apreciat ca superioar sau inferioar mediei. n general, se precizeaz aceast constatare. Situaia n care se compar un grup de observaii cu un altul. Exemplu: ntr-un proces de nvare care comport o serie de ncercri succesive pot s fie lsate intervale de timp (nvare distribuit) sau nu (nvare masat). Se constat, n general c rezultatul unui grup de subieci n nvarea distribuit este superior rezultatului n nvarea masat. Dac cineva consider c aceast

127

AUREL STAN

diferen este prea mare pentru a putea s se explice doar prin variaii fortuite, aceasta va conduce la o explicaie psihologic; Situaia n care seriile de date provin de la o surs de variaie sistematic sau de la mai multe. Se poate calcula valoarea medie asociat la fiecare din strile acestei surse Aceast medie permite de a descompune variaiile observate n mai multe abateri (care se numesc "efecte") i de a analiza astfel importana relativ a diferitelor surse sistematice sau fortuite. Posibilitatea unei astfel de analize este esenial pentru explicarea fenomenelor observate.
III.1. CALCULUL MEDIEI ARITMETICE

Avem trei situaii diferite n procedura de calcul a mediei aritmetice:: situaia n care variabilele sunt negrupate; 1. situaia n care variabilele sunt grupate pe variante de variaie; 2. situaia n care variabilele sunt grupate pe intervale de variaie. 3. n cazul n care variabilele sunt negrupate se adiioneaz toate valorile variabilei i rezultatul final se mparte la efectivul total al observaiilor. S presupunem c n urma efecturii unui experiment privind timpul de reacie intraindividual am obinut urmtoarele rezultate: ale variabilei (notat de noi cu X) timp de reacie intraindividual: 21, 24, 28, 31, 17, 20, 22, 16, 18, 27, 22, 19, 26, 29, 30. n total avem 15 observaii succesive efectuate pe aceeai persoan. n acest caz media se calculeaz prin urmtoarea formul: X = n care X este notarea mediei aritmetice, X este suma valorilor N individuale ale variabilei X i N exprim numrul total de observaii sau efectivul distribuiei. n cazul nostru concret: X =

350 = 23,3 . Litera greceasc are sensul de sum. Formula pentru date N 15 negrupate se practic n situaia n care avem puine date la dispoziie. n cazul n care numrul valorilor unei variabile devine mare, este necesar operaiunea de grupare a datelor. S presupunem c pentru aceeai situaie experimental am cules date de ordinul sutelor i am procedat la o grupare a lor conform tabelului nr. 17. =

n care X este variabila N ordonat pe variante de variaie, f frecvena variantelor de variaie i N este volumul observaiilor sau n acest caz, formula pentru calculul mediei este urmtoarea X = efectivul total al acestora. N = fX = 302 Litera greceasc exemplul nostru concret obinem: 23,25 =

fX

(sigma) are sensul sum de. Pentru

7023 . 302 n cazul n care avem la dispoziie un numr mare de date i de variante de variaie (i seriile de valori au o amplitudine de variaie mare) folosim gruparea datelor prin intermediul intervalelor de variaie i o formul specific pentru medie.

128

STATISTIC I Nr.crt. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 X 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 F 5 11 17 24 30 35 38 32 28 20 18 16 13 9 6 N = 302 fX 90 187 306 456 600 735 836 736 672 500 668 432 364 261 180 fX = 7023
Tabelul 17. Cuprinde exemplificare pentru modul de calcul al mediei aritmetice n cazul gruprii datelor pe variante de variaie

EXEMPLU: S presupunea c n urma efecturii unui examen psihologic n care am folosit i o prob de atenie (foarte rar un examen psihologic se reduce la o singura prob, de cele mai multe ori se folosete n cursul unui astfel de examen un ansamblu de procedee de investigaie) rezultatele au fost grupate, aa cum se prezint n tabelul care urmeaz. Precizm c n acest tabel am trecut date care sunt necesare pentru aplicarea a dou formule diferite de calcul. n una din formule folosim frecvenele nmulite cu centrul intervalului notelor brute, iar n alta folosim variabila codificat u, variabil a crei intervenie este justificat de comoditatea n operaiile de calcul. Nr.crt Intervalul Xi f fXI u Fu 1 27 - 31 29 7 203 -3 -21 2 32 - 36 34 13 442 -2 -26 3 37 - 41 39 20 780 -1 -20 4 42 - 46 44 27 1188 0 0 5 47 - 51 49 25 1225 1 25 6 52 - 57 54 17 918 2 34 7 56 - 62 59 9 531 3 27 f = N = 118 fXi = 5287 fu = 19
Tabelul 18. Cuprinde exemplificare pentru modul de calcul al mediei aritmetice n cazul gruprii datelor pe intervale de variaie

n cazul folosirii primei variante de calcul anunate a mediei aritmetice aplicm urmtoarea formul: X = . n cazul de fa f reprezint frecvena pe interval, Xi desemneaz centrul N intervalului (i variaz de la 1 la 7, numrul total al intervalelor) i N numrul total al rezultatelor subiecilor (N=118). Prin aplicarea formulei rezult: 5287 X = = 44,8 , n care 5287 reprezint suma produselor dintre centrele intervalelor i frecvenelor 118 acestora, iar 118 numrul total al rezultatelor subiecilor sau efectivul total. Atragem atenia asupra faptului c o asemenea formul aproximeaz valoarea mediei aritmetice. Aceast aproximare poate fi acceptat n cazul n care variabilele sunt repartizate armonios pe lungimea intervalului. Dac n intervalul 1 (27 31) vom avea valorile 27, 28, 29,29,29, 30, 31 atunci centrul intervalului este reprezentativ pentru acesta, dar dac vom avea n acest interval 7 valori de 27 sau 7 valori de 31 centrul intervalului de variaie nu mai ndeplinete aceast condiie. Ca atare, acest mod de calcul nu se recomand n situaia n care distribuiile valorilor prezint asimetrii puternice.
129

fX

AUREL STAN

Realizarea rubricii variabilei codificate u, utilizat n cel de-al doilea procedeu de calcul pentru variabile ordonate pe intervale de variaie, presupune fixarea n dreptul unui interval a valorii 0 a variabilei codificate. Aceast fixare este arbitrar, ns, de regul, se realizeaz n dreptul intervalului modal, adic n dreptul acelui interval care are frecvena cea mai mare. n cazul exemplificat de noi acest interval poart numrul curent 4 (42 46) Valoarea central a acestui interval va fi o valoare de referin i o vom nota cu A. n cazul nostru A = 44. Valorile coloanei u se stabilesc prin mprirea diferenei dintre valoarea variabil Xi i constanta A la mrimea intervalului (i). Urmnd procedura de 39 44 34 44 29 44 , -3 = .a.m.d. Pentru valorile mai mici ale , -2 = calcul vom obine: -1= 5 5 5 variabilei XI dect constanta A se obin valori negative ale variabilei codificate u, i pentru valori mai mari ale variabilei Xi dect constanta A se obin valori pozitive ale variabilei codificate u. n cazul folosirii n calcul al variabilei codificate u, formula de calcul va fi urmtoarea:
, N n care A este o constant egal cu mrimea centrului intervalului pentru care variabila u = 0, i este mrimea unui interval, fu este produsul din frecvena intervalului i variabila codificat u, f este frecvena simpl unui interval i u variabila codificat. 5 * 19 = 44,8. Facem nc o dat precizarea c aceste Prin aplicarea formulei obinem X = 44 + 118 proceduri de calcul fac posibil apariia unei anumite erori, eroare datorat faptului c se lucreaz cu mrimi de reprezentare. Astfel, centrul intervalului este considerat reprezentativ pentru ntregul interval, situaie care antreneaz erori mari n cazul n care distribuia valorilor are asimetrii accentuate, de stnga sau de dreapta. n acest caz se impune o operaiune de micorare a mrimii intervalului pn la limite care asigura o marja de eroare acceptabil. Cea mai corect modalitate de calcul a mediei este cea rezultat din adiia variabilelor brute si divizarea sumei acestor variabile brute la numrul de observaii. Prezena unor instalaii de calcul electronic, chiar mai puin performante, fac din calculul mediilor, si nu numai a lor, o operaiune banal, executat ntr-un timp extrem de scurt. Problema calcului mediilor se pune i in cazul analizei de itemi. Itemul este o component informaional elementar a unui test sau chestionar psihologic, care se prezint dihotomic din punct de vedere cantitativ n cea mai mare parte din cazuri. Analiza de itemi este o operaiune strict necesar n cazul n care dorim s ne asigurm de faptul c testul ndeplinete o serie de exigene funcionale. S lum dou exemple (fictive) de modaliti de prezentare a itemilor unor probe psihologice. Nr.crt. 1 2 3 4 5 6 7 8
130

= A+

i * fu

Itemii testului A 1 2 0 1 1 1 1 1 0 0 1 0 1 0 0 1 1 0

3 0 1 0 1 0 0 0 1

4 0 0 1 1 0 0 1 1

Nr.crt. 1 2 3 4 5 6 7 8

1 2 3 1 1 2 3 1 2

Itemii testului B 2 3 5 4 1 4 1 2 3 2 5 4 2 4 3 1 2 3

4 4 2 1 4 1 4 2 3

STATISTIC I 9 10 11 fi pi qi 1 1 0 7 0,63 0,37 1 0 1 6 0,54 0,46 0 1 0 4 0,36 0,64 0 1 0 5 0,45 0,55 9 10 11 fI pi qi 3 3 2 23 0,41 0,59 4 2 1 29 0,52 0,48 5 4 4 37 0,67 0,33 4 4 3 36 0,65 0,33

Tabelul 19. Cuprinde exemplificare pentru modul de calcul al mediei itemilor

n cazul primului exemplu (testul A) avem situaia de examen a 11 subieci la un test cu 4 itemi (exemplul este teoretic, deoarece un test trebuie sa aib cel puin 20 itemi pentru a putea fi numit test). Acest mod de organizare a rezultatelor obinute de un grup de subieci la un test psihologic (subieciitemi) se numete matricea lui Stern, de la numele psihologului german W. Stern. La fiecare item din cadrul testului A se pot obine valorile 1 (caz n care exprim soluia corect la o situaie problematic sau rspuns la un chestionar de personalitate care pune n eviden trstura psihic ce trebuie diagnosticat) sau 0 (caz n care exprim soluia incorect sau rspuns care nu pune n eviden trstura psihic cercetat). La testul B rspunsurile la itemi au o distribuie cantitativ polichotomic, notele variind ntre 1 i 5 (situaie ntlnit mai ales la chestionarele de atitudini) n cazul testului A, notaia fi indic punctajul total obinut de toi subiecii la itemul 1 notaia pi proporia de rspunsuri corecte i totodat media rspunsurilor corecte la itemi (i-ul variaz ntre 1 i 4, deci, vom avea f1,f2,f3,f4, respectiv p1,p2,p3,p4,). n acest notaia pi exprim indicele de dificultate i, f totodat, media rezultatelor ansamblului subiecilor la itemi. Deci pi= i (n care notaia N exprim N numrul total al subiecilor). n cazul testului B pi exprim indicele de dificultate a itemului, dar nu i media rezultatelor ansamblului subiecilor la itemi. La testul B, valoarea pi se obine prin mprirea valorii totale a punctajului obinut la un anumit item de ctre cei 11 subieci la valoarea maximal pe fi . n cazul dat de noi care ar fi putut-o obine cei 11 subiecii la un anumit item. n acest caz, pi = f i max ca exemplu, la testul B, valoarea fI max = 55, obinut prin nmulirea valorii 5 (valoare maxim pe care ar fi putut s o obin un subiect pentru un rspuns) cu 11 (numrul total al subiecilor). De exemplu, la 23 testul B, p1= = 0,40 . Pentru media itemilor din testul B se va folosi alt notaie, conform unei uzane 55 de notare.

III.2. CALCULUL MEDIANEI

Mediana, numit i valoare mijlocie, este o valoare caracteristic real (concret) a unei distribuii, sau rezultnd n urma unei operaii de interpolare, care mparte valorile ordonate cresctor sau descresctor n dou pri egale, n aa fel nct numrul valorilor mai mari s fie egal cu numrul valorilor mai mici dect mediana. Mediana poate fi stabilit intr-o serie de date ordonate cresctor sau descresctor. n cadrul unui ir impar de valori, mediana este valoarea unei variante concrete a distribuiei, i anume valoarea cu rangul n+1/2. Pentru median folosim notaia Me.

131

AUREL STAN

EXEMPLU: n distribuia 1,2,3,5,7,9,10,12,13,14,18 avem un total de 11 valori ale variabilei X.. Dac valorile ar fi fost trecute n ordinea 7,1,13,18,2,10,5,3,9,12,14 ar fi trebuit s le ordonm cresctor. Deci, prima operaiune necesar pentru calculul medianei este ordonarea valorilor. Mediana va avea valoarea cu 11 + 1 N +1 = 6 , deci a 6-a valoare din irul rangul . n exemplul nostru, mediana va avea rangul 2 2 ordonat cresctor, valoare egal cu 9. n stnga valorii 9 se gsesc 5 valori mai mici (1,2,3,5,7) i n dreapta 5 valori mai mari (10,12,13,14,18). n cazul n care seria are un numr par valori, medianei se obine prin interpolare, situndu-se N N +2 ntre valoarea cu rangul i valoarea cu rangul . Exemplu: n distribuia 2 2 8 17,18,22,24,28,30.35.37 (N=8) valoarea medianei se va situa ntre valorile rangurilor 4 i 5 2

8 + 2 . n cazuri de acest gen valoarea medianei va fi media aritmetic a valorilor variabilei care au 2 24 + 28 rangurile 4 i 5, deci, Me = = 26 . 2 n cazul unei distribuii de frecvene pe variante de variaie mediana poate avea o semnificaie mai puin clar, situaie cauzat de modul de determinare.
Tabelul 20. Cuprinde modul de organizare a F fc fc% datelor pentru determinarea medianei 10 10 0,07 (7%) 15 25 0,17 (17%) n tabelul alturat am realizat ordonarea 20 45 0,30 (30%) 30 75 0,51 (51%) pe variante de variaie a unei variabile care 20 95 0,64 (64%) cuprinde 148 de rezultate la o anumit prob 15 110 0,74 (83%) psihologic. Tabelul cuprinde rubricile: 13 123 0,83 (83%) variantele variabilei (X), frecvenele variantelor 11 134 0,91 (91%) de variaie (f), frecvenele cumulate ascendent 9 143 0,97 (97%) (fc) i frecvenele relative cumulate ascendent 5 148 1,00 (100%) N=148 (fc%). Valoarea medianei trebuie s separe primii 50% din subieci de urmtorii 50%. Valoarea mediana este considerata cea corespunztoare procentului frecvenei relative cumulate ascendent mai apropiat de valoarea 50%, de n cazul nostru valoarea 8 (n dreptul frecvenei cumulate ascendent egal cu 75. Observm pe rubrica frecvenei relative cumulate ascendent c aceast valoare se afl la varianta de variaie cu numrul curent 4. Valoarea 8 este considerat mediana acestei distribuii, dar aceast stabilire se face prin acceptarea unui compromis, deoarece avem 30 de valori 8 ale variabilei X. Practic, avem 35 de valori mai mici dect 8 (10+15+20) i 73 de valori mai mari (20+15+13+11+9+5). Compromisul const n faptul de a accepta i valoarea 8 n calcularea primelor 50% din valori i urmtoarelor 50% din acestea. n sens strict o astfel de determinare poate s nu corespunda definiiei medianei dup care numrul valorile mai mici si mai mari dect ea s fie egale ntre ele.

Nr.crt. 1 2 3 4 5 6 7 8 9 10

X 5 6 7 8 9 10 11 12 13 14

132

STATISTIC I
III.3. DETERMINAREA MODULULUI

Modulul este valoarea variabilei cu frecvena cea mai mare n cadrul unei distribuii. Vom nota acest indicator statistic prin Mo. S lum, de exemplu, urmtoarea distribuie de valori: 11,17,13,12 17,9,8,17,14,19,20,17,15,16,14,18. Dup ce ordonm aceast distribuie (8,9,11,12,13,14,14,15,16,17,17,17,17,18,19,20) observm c valoarea 17 este cea mai frecvent n cadrul acestei distribuii, ea repetndu-se de 4 ori. n acest caz, valoarea variabilei egal cu 17 va constitui valoarea mod a distribuiei sau modul acesteia. Exist cazuri cnd ntr-o distribuie, dou sau mai multe valori au frecvena cea mai mare. Distribuiile vor numite, n aceast situaie, multimodale (bimodale, cnd dou valori au frecvenele cele mai mari, trimodale cnd trei valori au frecvenele cele mai mari, .a.m.d.). De exemplu, distribuia format din valorile ordonate 4,5,6,7,7,7,8,9,9,9,10,11 este bimodal, deoarece avem dou valori ale variabilei cu frecvene maxime, valorile 7 i 9. Multimodalitatea indic, de obicei, o eterogenitate valoric a subiecilor supui unui examen, dar, mai pot exista i alte explicaii.

III.4. INDICATORI DE MSUR A MPRATIERII

Indicatorii de msur a mprtierii frecvent utilizai n analiza statistic a datelor din domeniu psihopedagogic (i nu numai din acest domeniu) sunt: amplitudinea; variana; abaterea standard; abaterea medie; abaterea quartila sau amplitudinea semiinterquartil. Indicatorii de msur a mprtierii trebuie s satisfac condiii similare cu cele enunate pentru indicatorii de msur a localizrii sau indicatorii de nivel: s se bazeze pe toate observaiile; s fie uor de calculat; s fie afectate ct mai puin posibil de fluctuaiile de selecie i adecvate unui studiu algebric. Cea mai simpl msur a mprtierii este amplitudinea, care se obine prin efectuarea diferenei dintre cea mai mare i cea mai mic valoare observat la care se adaug valoarea 1. Obiecii cu privire la folosirea amplitudinii exist n situaii n care viteza de calcul i simplitatea n interpretare nu sunt cerine importante. Amplitudinea este afectat de fluctuaiile de selecie mari de la eantion la eantion. Notm amplitudinea cu A. S lum exemplul timpului de rezolvare a unei sarcini: 55,5 6, 65, 54, 66, 58, 62, 61, 12, 56, 68, 67, 59, 57, 60, 145 (exprimat n zecimi de secund). n acest caz, avem doua valori extreme, foarte puternic distanate de restul valorilor, i anume valorile 12 si 145, care aparin, probabil, n primul caz unui supradotat, iar n al doilea unui hipofren (denumire folosit pentru a desemna o persoan cu randament intelectual de limit). Dac valorile de acest gen sunt intr-un numr foarte mic, se pot elimina practic din operaiunile de grupare. Dac la datele amintite am efectua calculul amplitudinii, vom gsi o valoare de cteva ori mai mare dect n cazul n care le eliminm din calculele noastre. n primul caz, amplitudinea se calculeaz n modul urmtor: Xmax Xmin +1=145 12 + 1= 134.
133

AUREL STAN

n cazul eliminrii valorilor puternic distanate, avem: A = Xmax Xmin + 1 = 68 54 + 1 = 15. Ultima determinare a amplitudinii este evident mai realist, deoarece este amplitudinea care caracterizeaz majoritatea datelor. Amplitudinea nu ine cont de forma repartiiei, deoarece ntre limitele de variaie se poate obine aceeai valoare pentru amplitudinea unei curbe de frecvente simetrice sau unei curbe de frecvene n form de J, I sau U. Abaterea medie este media aritmetic a abaterilor valorilor individuale ale variabilei X fa de media aritmetic a valorilor distribuiei luate n valoarea absolut. Vom nota acest indicator de mprtiere cu AM. Pentru distribuii negrupate vom utiliza urmtoarea formul pentru calculul abaterii medii: AM. =

XX
N

, n care cu X se noteaz variabila, cu X media distribuiei i cu N numrul

total al valorilor variabilei. Dac vom nota cu x diferena X - X , vom avea urmtoarea formul pentru x . Variabila x se numete variabil de calculul abaterii medii pentru date negrupate: AM = N deviaie. n cazul n care avem variabilele grupate pe variante de variaie, vom utiliza urmtoarele , n care cu f se noteaz frecvena variantei de variaie N N Prezentm, n continuare, tabelele care se ntocmesc pentru evidenierea etapelor calculrii abaterii medii pentru variabile negrupate (i neordonate) i pentru variabile grupate de variante de variaie. Exemplele cuprind valori diferite: Variabile negrupate ( i neordonate) Variabile grupate pe variante de variaie Nr.crt. X Nr.crt. X f FX x fx x fx x (X- X ) 1 2 3 4 5 6 7 8 9 12 13 19 20 14 16 15 17 18 144 -4 -3 3 4 -2 0 -1 1 2 0 4 3 3 4 2 0 1 1 2 20 1 2 3 4 5 6 7 8 9 14 16 19 21 23 24 25 26 28 3 6 9 13 17 12 9 5 2 76 42 96 171 273 391 288 225 130 56 1672 -8 -6 -3 -1 1 2 3 4 6 - 24 - 36 - 27 - 13 17 24 27 20 12 0 24 36 27 13 17 24 27 20 12 200 formule: AM =

f X X

sau AM =

f x

Tabelul 21. Cuprinde etapele decalcul pentru determinarea abaterii medii n tabelul din stnga s-au fcut urmtoarele notaii n coloane: X valorile variabilei; x valorile variabilei de deviaie;
x - valorile variabilei de deviaie n valoarea absolut.

Valoarea medie pentru valorile tabelului cu variabile negrupate se obine prin aplicarea formulei anunate anterior: X =

X = 144 = 16 . Rubrica x se obine scznd din valoarea mediei distribuiei


N

134

STATISTIC I valoarea variabilei. Astfel, prima valoarea din rubrica x, egal cu 4, se obine efectund scderea 12-16, a doua valoarea, egal cu 3, se obine efectund scderea 13 - 16, .a.m.d. Se observ uor faptul c suma abaterilor variabilelor de la medie este egal cu 0. Abaterea medie se poate calcula doar prin adiia valorilor absolute care sunt trecute n rubrica notat cu x . Suma valorilor absolute a deviaiilor de la medie este egal cu 20. Dup ce aflm aceast valoare putem trece la aplicarea formulei pentru calculul abaterii medii. AM= 20 = 2,22 . N 9 n tabelul din dreapta s-au fcut urmtoarele notaii n coloane: X - valorile variantelor de variaie; f - Frecvenele variantelor de variaie; fX - valorile produsului dintre variantele de variaie i frecvenele acestora; x - valoarea variabilei de deviaie; fx - valorile produsului dintre variabila de deviaie i frecvena variantelor de variaie; = f x - valorile produsului dintre variabila de deviaie n valoare absolut i frecvenele variantelor de variaie. n acest tabel

f = N = 76 , deci avem n total 76 de valori ale variabilei X (care sunt grupate n

9 variante de variaie). Pentru a trece la calculul abaterii medii trebuie s calculm, n primul rnd, media aritmetic. fx este egal cu 0 i nu N 76 cea de la rubrica x, din cauza existenei frecvenelor pentru variantele de variaie. Pentru calculul abaterii medii folosim suma de la rubrica f x care este egal.cu 200. Dup calcularea acestor valori putem trece la calculul abaterii medii. AM =
X=

(fX ) = 1672 = 22 . n tabelul din dreapta suma de la rubrica

(f x ) = 200 = 2,63
N

76

Variana i abaterea standard se gsesc ntr-o strns legtura una cu alta. Valoarea abaterii standard se obine prin extragerea rdcinii ptrate din valoarea varianei. Aceti doi indicatori de mprtiere sunt foarte frecvent utilizai n demersurile analizei statistice n toate domeniile de activitate. Variana sau dispersia este un indicator sintetic care prezint o importan accentuat, deoarece cu ajutorul ei se studiaz influena factorilor care acioneaz n cadrul mulimilor de date. Variana se calculeaz ca medie aritmetic a ptratelor abaterilor valorilor individuale ale unei variabile de la media lor aritmetic. Reamintim faptul c suma acestor abateri este egal cu 0, motiv pentru care fiecare valoare individual a abaterii se ridic la ptrat naintea operaiei de adiie. Vom nota variana unei distribuii prin s2 i abaterea standard prin s. Formula pentru calcularea

varianei sau dispersiei pentru valori negrupate ale unei variabile este:

. Corespunztor N explicaiilor anterioare, formula abaterii standard pentru acelai fel de valori ale variabilei este s2

135

AUREL STAN

. N Ridicarea la ptrat nu trebuie considerat un procedeu artificial, deoarece simpla suma a abaterilor de la medie ar da in mod automat zero. Ridicarea la ptrat este cel mai simplu procedeu pentru a asigura datelor acelai semn. Ca i alte calcule ale indicatorilor statistici avem cazul datelor negrupate i cazul datelor grupate Rubricile necesare calculului le prezentm n tabelul care urmeaz: Nr. crt. 1 2 3 4 5 6 7 8 9 10 X 11 14 16 18 20 22 17 18 15 19 170 x -6 -3 -1 1 3 5 0 1 -2 2 0 x2 36 9 1 1 9 25 0 1 4 4 90
Tabelul 22. Cuprinde etape de clacul pentru determinarea varianei i abaterii standard (date negrupate)

urmtoarea: s =

n primul rnd se calculeaz media cu formula X = 170 = 10,00 . specific datelor negrupate: X = N 10 Dup ce am calculat valoarea mediei trecem la completarea rubricii x, care se obine din efectuarea diferenei dintre fiecare valoare individual a variabilei X i

valoarea mediei aritmetice ( X = 10,00 ). Apoi trecem la realizarea rubricii x2 prin ridicarea la ptrat a fiecrei valori din rubrica x.. Dup ce am nsumat valorile din rubrica x2 (x2 = 90), putem trece la calcularea varianei

x2 90 90 i a abaterii standard. s = = 9,00 i s = = = 9 = 3. N N 10 10 n cazul n care avem date grupate pe variante de variaie, se ntocmete tabelul (date fictive): Date grupate pe variante de variaie Nr.crt X f fX x x2 fx2 1 17 2 34 - 5,23 27,35 57,71 2 19 5 95 - 3,23 10,43 52,16 3 20 9 180 - 2,23 4,97 44,76 4 21 13 273 - 1,23 1,51 19,67 5 22 18 396 - 0,23 0,05 0,95 6 23 12 276 0,77 0,59 7,11 Tabelul 23. Cuprinde etape de clacul 7 24 10 240 1,77 3,13 31,33 pentru determinarea varianei i 8 26 6 156 3,77 14,21 85,28 abaterii standard (date grupate pe 9 28 3 84 5,77 33,29 99,88 variante de variaie) 78 1734 395,85
2

x =

Explicaia rubricilor a fost dat la tabelele constituite anterior. Avem un total de 78 de valori. Aplicm formula pentru calcularea mediei: X =
2

Rubrica x se constituie prin N N scderea valorii 22,23 din valorile variantelor de variaie. Din aplicarea formulei pentru calcularea varianei rezult: s2 = 78

(fX ) = 1734 = 22,23

N ptrate din valoarea varianei.


136

(fx ) = 395,85 = 5,075. Abaterea standard se obine prin extragerea rdcinii

STATISTIC I s=
s 2 = 5,075 = 2,25

Pentru calcularea varianei i abaterii standard n condiiile existenei unei distribuii de valori pe intervale de variaie avem la dispoziie formule care utilizeaz variabila codificat u. Utilizarea unor astfel de variabile asigur n calcul valori numerice relativ mici. Formula pentru calcularea varianei este: (fu 2 ) (fu ) 2 . Pentru calcularea abaterii standard putem n aplicare urmtoarea s2 = i2* N N
formul: s = i*

(fu ) (fu )
2

. Se observ clar c valoarea abaterii standard care se va


2

obine este rdcin ptrat din valoarea varianei. Oferim pentru exemplificare urmtoarea grupare pe intervale de variaie: Nr.crt 1 2 3 4 5 6 7 Valori grupate pe intervale de variaie Interval (i = 5) f u fu 19 23 9 - 3 - 27 24 28 13 - 2 - 26 29 33 19 - 1 - 19 34 38 24 0 0 39 43 20 1 20 44 48 14 2 28 49 - 53 10 3 30 109 6 u2 9 4 1 0 1 4 9 Fu2 81 52 19 0 20 56 90 318

Tabelul 24. Cuprinde etape de clacul pentru determinarea varianei i abaterii standard (date grupate pe intervale de variaie)

Am explicat anterior modul cum se stabilesc valorile variabilei u. n acest exemplu am fixat arbitrar valoarea u = 0 n dreptul intervalului modal, adic intervalul care are cea mai mare frecven (intervalul 34 38, care are frecvena 24). Prin i am nota mrimea intervalului (i = 5) Aplicnd formula varianei vom obine:
318 6 2 s2 = 25 = 25[2,91 0,003] = 72,5. Abaterea standard o obinem prin extragerea 108 108

rdcinii ptrate din aceast valoare. s =

72,5 = 8,51 ( prin aproximare 8,5).

Menionm o proprietate matematic important a abaterii standard care are aplicaii frecvente n domeniul nostru de interes. Amplitudinea unei curbe normale Gauss-Laplace poate fi aproximat satisfctor de urmtoarea formul: A = 6 s. n sectorul distribuiei cuprins ntre valoarea mediei i o mrime a abaterii standard se gsesc aproximativ 68% din valorile unei distribuii. ntre valoarea mediei i dou mrimi ale abaterii standard se afl aproximativ 95% din valorile unei distribuii normale Gauss-Laplace, iar ntre valoarea mediei aritmetice i trei mrimi ale mrimi ale abaterii standard se gsesc 99,958% din valorile distribuiei. S lum exemplul unei distribuii de 118 de rezultate, avnd media aritmetic egal cu 64 i abaterea standard egal cu 8. ntre valoarea 56 (64 8) i valoarea 72, (64 + 8) se vor gsi aproximativ

137

AUREL STAN

68% dintre valorile distribuiei. ntre valoarea 48 (64 (28)) i valoarea 78 (64 + (28)) se vor gsi aproximativ 95% dintre valori. ntre valoarea 40 (64 (38)) i valoarea 88 (64 + (38)) se vor gsi aproximativ 99,958% dintre valorile distribuiei, deci marea majoritate a acestor valori. Aceast proprietate a abaterii standard ntr-o distribuie teoretic Gauss-Laplace are aplicaii n construirea etaloanelor testelor. Rezultatul cantitativ global obinut de un subiect la un anumit test psihologic poart denumirea de scor. Scorul este o nsumare rezultatelor obinute la componentele elementare ale testului, componente care poart denumirea de itemi. Cunoaterea scorului unui anumit subiect la un anumit test nu ne poate oferi aprecierea valoric a subiectului, deoarece aceasta se face prin raportare la valorile obinute la respectivul test de un grup, numit i grup de referin (care trebuie s ndeplineasc o serie de exigene privind omogenitatea). Aceast situaie de incertitudine valoric a scorului n privina unui subiect se datoreaz i amplitudinii foarte diferite a distribuiilor valorilor oferite de teste. Astfel, la testul Bourdon-Amfimov (destinat diagnosticrii ateniei concentrate) se pot obine scoruri ntre 1 i 776. La testul M.P. Raven (folosit n diagnosticul inteligenei) se pot obine scoruri ntre 1 i 60 i la testul AD-P (atenie distributiv Praga) se pot obine scoruri ntre 1 i 100. n acest caz, nu putem compara randamentul exprimat prin scorul 245, obinut de un subiect la testul Bourdon-Amfimov, cu randamentul exprimat prin scorul 172, obinut de acelai subiect la testul Kraepelin, sau cu randamentul exprimat prin scorul 33, obinut la testul M.P Raven. Chiar dac testele amintite ar avea aceeai amplitudine a scorurilor, randamentele obinute de un grup de subieci la respectivele teste ar putea fi foarte diferite. Iat de ce, scorurile testelor (pentru a putea fi pune n eviden valoarea unui randament individual) trebuiesc raportate la scale valorice cu acelai numr de trepte, care sunt stabilite dup ce testul a fost efectuat de un grup de referin (difereniat n funcie de scor, vrst, mediu de provenien, nivel de studii etc.). Aceste scale standardizate se construiesc respectnd o serie de exigene i viziuni teoretice. Numrul treptelor scalelor pe care dorim s facem aprecierea rezultatelor subiecilor se stabilete n funcie de oportunitile situaiei de evaluare n care ne aflm. Vom efectua o gradare pe curb a unei scale cu 7 trepte (A, B, C, D, E, F, G), deci un numr impar de trepte. Utilizm exemplul dat anterior (distribuie de 118 scoruri, avnd media egal cu 64 i abaterea standard egal cu 8). n primul rnd, trebuie stabilit baza de gradare, notat de noi cu BG. A Formula bazei de gradare este: BG = , n care A este amplitudinea distribuiei i k numrul de clase k n care dorim s facem gradarea pe curb. Amplitudinea distribuiei poate fi foarte bine aproximat ntr-o distribuie teoretic Gauss-Laplace prin nmulirea abaterii standard cu 6, aa cum am explicat anterior. Deci, A=68 = 48. Dup ce am aflat valoarea amplitudinii putem trece la calcularea bazei de 48 = 6,86. n cazul unui numr impar de clase, vom mpri baza de gradare la 2 gradare BG = 7 BG = 3,43 ). Pentru delimitarea limitei inferioare a clasei centrale, clasa D, vom scdea din valoare ( 2 mediei jumtate din baza de gradare i pentru delimitarea limitei superioare a acesteia vom aduna la valoarea mediei jumtate din valoarea bazei de gradare. Limita inferioar a clasei centrale va fi 61,57 (64 3,43 = 60,57) i limita superioar 67,43 (64 + 3,43). Delimitarea claselor inferioare i superioare ale clasei D se va face prin scderi succesive, respectiv adunri succesive, la limitele clasei centrale a ntregii valori a bazei de gradare. Astfel pentru delimitarea limitei inferioare a clasei C vom scdea: 60,57 6,86 = 53,71. Pentru stabilirea limitei inferioare a clasei B vom scdea, din nou, 6,86 din
138

STATISTIC I valoarea rezultat anterior (54,71 6,86 = 46,85). Orice valoarea mai mic de 46,85 va face parte din clasa A. Pentru calcularea limitelor claselor din dreapta clasei centale D procedm prin adunarea succesiv a bazei de gradare. Astfel, pentru delimitarea limitei superioare a clasei E vom aduna la limita superioar a clasei D valoarea ntreag a bazei de gradare (67,43+6,86=74,29). Pentru calcularea limitei superioare a clasei F vom aduga la valoarea rezultat din ultima adunare valoarea ntreag a unei baze de gradare (74,29 + 6,86 = 81,15). Orice valoare mai mare dect 81,15 va face parte din clasa G. Redm ntr-un tabel clasele rezultatele: Nr.crt. 1 2 3 4 5 6 7 Clasa A B C D E F G Limite clasei 46,84 46,85 53,70 53,71 60,56 60,57 67,43 67,44 74,29 74,30 81,15 81,16 ntregire 47 49 54 56 61 63 67 68 74 75 - 81 82

Tabelul 25. Cuprinde determinarea claselor standard prin procedeul gradrii pe curb

Facem precizarea c, n cazul n care valorile rezultatelor nu se prezint cu zecimale, putem proceda la ntregirea limitelor claselor. Astfel, valoarea 47,84 din clasa A va deveni 48, Pentru a nu crea confuzii n privina apartenenei unui rezultat la o anumit clas, limita inferioar a clasei urmtoare va fi mrit cu o unitate i vom ntregi limita superioar a clasei urmtoare. Dac valoarea aflat dup virgul depete 0,5 ntregirea se va face prin adugire, iar dac aceast valoarea este mai mic de 0,5, ntregirea se va face prin scdere. Astfel 54,70 va deveni 55 iar 64,43 va deveni 64. Micile deplasri ale limitelor claselor n urma operaiei de ntregire nu afecteaz semnificativ valoarea acestora. n cazul n care numrul de clase n care dorim s facem gradarea pe curb este par (6,8,10), se procedeaz direct la adiia,respectiv scderea, bazei de gradare din medie, fr a o mai mpri pe aceasta n dou (n cazul unui numr par de clase nu mai avem o clas central) Prin intermediul abaterii standard i a mediei putem efectua i conversiuni ale valorii distribuiilor, obinndu-se aa-numitele variabile normate. Cele mai cunoscute dintre aceste variabile sunt variabilele

z. Formula pentru transformarea scorurilor brute n variabile normate z este urmtoarea: z =

XX , s

n care X este variabila original, X este media aritmetic a distribuiei originale i s abaterea standard. Dac transformm toate variabilele originale ale unei distribuii n variabile normate z obinem o nou distribuie, care are media 0 i abaterea standard 1. Noile variabile vor avea majoritatea valorilor ntre 3 i 3, indiferent care vor fi valorile variabilelor originale. Forma unei distribuii nu se schimb prin aceast transformare. Ce ne spune, de fapt, o anumit valoare z? Ea ne d informaii asupra distanei, exprimat n abateri standard, dintre o valoare a distribuiei i medie. O valoare z = -1,22 ne informeaz asupra faptului c respectiva valoare se gsete plasat n stnga mediei (unde se gsesc plasate valorile mai mici dect media), i anume la o deprtare de -1,22 abateri standard de medie. O valoare z = 2,34 ne indic faptul c respectiva valoare se gsete la dreapta medie (acolo unde se gsesc valorile mai mari dect media) la deprtare de 2,34 abateri standard. Valoarea z ne permite s facem aprecieri poziiei relative a unui rspuns n ansamblul rspunsurilor. Aceste fapt este posibil datorit
139

AUREL STAN

proprietilor matematice ale distribuiei Gauss-Laplace, denumit i distribuia normal. ntr-o astfel de distribuie teoretic (construit prin intermediul unei funcii matematice) valorile mediei, medianei i modulului se confund. La acest gen de distribuie exist a perfect simetrie a valorilor n jurul mediei. Tabele matematice special realizate pentru acest scop ne indica ce cuantum procentual din efectivul total se afl ntre medie i a anumit valoare a distribuie. Prin deducie se poate stabili acest cuantum ntre dou valori oarecare ale distribuiei. Pentru a putea efectua o astfel de determinare trebuie s consultm tabelul de valori cuprins n anexele lucrrii, intitulat Tabelul legii normale reduse. n prima coloan (z) a tabelului sunt trecute valori progresive z cu rata de 0,1 (0,0; 0,1; 0,2; 0,3 .a.m.d. ). Ele formeaz capete de linii Aceste valori merg pn la z = 4,00. Am precizat anterior c valorile z pot oscila pn la 3. Acest lucru este valabil n marea majoritate a cazurilor. ntr-un foarte mic numr de cazuri (100% - 99,958%) variabilele normate z pot primi valori mai mare dect 3. n prima linie (z) sunt trecute valori z progresive cu rata de 0,01 (0,00; 0,01;. 0,02; 0,03 .a.m.d.). Aceste valori formeaz capete de coloane. Aceste fraciuni de valori z merg pn la 0,09. Din intersecia irurilor de valori care porneasc din capetele de linii i a celor care pornesc din capetele de coloan putem indica proporiile rezultate (sau procente, dac nmulim cu 100 proporia) care se gsesc n afara unui interval valoric format din variabile z. Dac cunoatem proporia de rezultate din efectivul total care se afl n afara unui interval valoric z, putem foarte simplu s aflm ct se afl n interiorul acestui interval. S lum exemplul unei valori z = 1,42. Pentru a afla informaia dorit vom citi din tabel proporia aflat la intersecia liniei 1,4 i coloanei 0,02 (1,4 + 0,02 = 1,42).
z 0,00 0.01 0,02 0,03 0,04 0,05 0,06 0,07 0,0 0,1 0,02 .. . 1,4 0,15561 Tabelul 26. Cuprinde exemplificare pentru modul de lucru cu tabela legii normale reduse 0,08 0,09

La aceast intersecie vom afla proporia 0,15561, aproximativ 0,16. Ce semnific aceast proporie? Ea semnific faptul c n afara intervalului exprimat n valori z) - 1,42 i 1,42 se gsete aproximativ 0,16 din efectivul total al distribuiei sau 16% din efectivul acestei distribuii. n interiorul intervalului se va afla 0,84 din efectivul acestei distribuii (1,00 0,84) sau, exprimat procentual, 84 % din acest efectiv. Proporia aflat n afara intervalului amintit (0,16) se afl plasat la cele dou capete opuse ale distribuiei. Jumtate din aceast proporie (0,08) se afla n stnga variabilei z = -1,42 (valori mai mici dect aceasta) i cealalt jumtate (0,08) se va afla la dreapta valorii variabilei z = 1,42 (valori mai mari dect aceasta. Dac transformm scorul brut al unui subiect n variabile z i obinem valoarea -1,42 aceasta semnific faptul c subiectul respectiv a obinut un rezultat mai bun dect 0,08, sau, exprimat procentual, 8% din totalul rezultatelor subiecilor i mai slab dect 0,92 sau, exprimat procentual, 92% din totalul subiecilor (100%-0,08). Dac dup transformarea scorurilor brute un subiect obine o valoarea z = 1,42, aceasta semnific faptul c 0,92 sau, exprimat procentual, 92% din totalul rezultatelor sunt mai slabe dect rezultatul obinut respectivul subiect. Doar 0,08 (sau 8%) din totalul rezultatelor vor fi mai bune dect rezultatul obinut de respectivul subiect. O aplicaie frecvent a tabelului legii normale reduse este calcularea cotei procentuale de subieci existeni n claselor determinate prin gradarea pe curb. Lum exemplul dat anterior, n care distribuia
140

STATISTIC I rezultatelor a 118 subieci avea o medie de 64 i o abatere standard de 8. Pentru aceasta transformm limitele superioare a claselor stabilite n variabile z. Pentru aceasta lum n consideraie primele 3 limite superioare ale claselor stabilite i ntocmim urmtorul tabel: Nr.crt. 1 2 3 Variabile originale 46,84 53,70 60,56 Variabile z - 2,145 - 1,287 - 0,375
Proporie tabelar 0,0323 0,1970 0,667 njumtire 0,016 ( sau 1,6%) 0,0985 (9,85%) 0,333 (33,3%)

Tabela 27. Cuprinde exemplificare pentru determinarea proporiilor suprafeei curbei normale Gauss prin intermediul valorilor z

Deci, clasa A va avea conine 0,016 rezultate ale subiecilor sau 1,6% dintre acestea. Deoarece modul de construire a claselor se bazeaz pe simetria acestora, clasa G care este simetric clasei A va conine , de asemenea, 1,6% dintre rezultatele subiecilor. Deosebirea const n aceea c 1,6% din rezultatele coninute de clasa A sunt cele mai slabe, pe cnd 1,6% din rezultatele coninute de clasa G sunt cele mai bune. Pentru a afla proporia de subieci existeni n clasa B vom scdea din proporia 0,0985 proporia 0.016 i se va obine rezultatul 0,0825. Scderea este justificat de faptul c 0,0985 conine proporia rezultatelor claselor A i B. Clasa simetric clasei B este clasa F, care va conine, de asemenea, 0,0825 din ansamblul rezultatelor subiecilor sau, exprimat sub form procentual, 8,25% din efectivul total al rezultatelor. Pentru a afla proporia clasei C se va scdea din 0,333 proporia 0,0985 (coninut de clasele A i B la un loc).Va rezulta proporia 0,234 sau, exprimat sub form procentual 23,4% din total. Clasa simetric clasei C este clasa E, care va avea aceeai proporie de rezultate. Procentul clasei centrale D se va afla scznd din valoarea 1,00 sumele proporiilor celorlalte clase. Vom avea: 1,00-(20,016)-(20,0825)-(20,234)=1,00-0,665=0,335. n exprimare procentual clasa central D va conine 33,5 % din totalul rezultatelor. n tabelul care urmeaz transformm proporiile i procentele n valori absolute: Nr.crt Clasa 1 A 2 B 3 C 4 D 5 E 6 F 7 G TOTAL Limite clasei 46,84 46,85 53,70 53,71 60,56 61,57 67,43 67,44 74,29 74,30 81,15 81,16 ntregire 47 48 54 55 - 61 62 - 67 68 - 74 75 - 81 82 % din total 1,6,5% 8,25,0% 23,4% 33,5% 23,4% 8,25,0% 2,5% 100% Valori absolute 0,016*118 = 1,88 0,0825*118 = 9,73 0,234*118 = 27,61 0,335*118 = 39,53 0,234*118 = 27,61 0,0825*118 = 9,73 0,016*118 = 1,88 ntregire 2 10 28 40 28 10 2 120

Tabelul 28. Cuprinde exemplificare pentru determinarea proporiile claselor normalizate

Operaiunea de ntregire este necesar, deoarece nu are sens s se spun c ntr-o clas se afl rezultatele a 1,88 de subieci. n urma analizei acestui tabel se poate spune c 2 dintre subieci au obinut rezultate care-i situeaz n clasa A (cele mai bune rezultate), 10 subiecii au obinut rezultate care-i situeaz n clasa B, a doua clas valoric, .a.m.d. Jocul ntregirilor face ca suma total s fie puin mai mare (120, n loc de 118). Observm c aceste clase construite pe baza mediei i a abaterii
141

AUREL STAN

standard sunt egale ca valoare (jocul aproximrilor face s existe mici diferene), dar nu i n privina numrului de rezultate ale subiecilor coninute n ele. Acest gen de mprire n clase este realist, deoarece rezultate de excepie i rezultate foarte slabe obin un numr foarte mic de subieci. Variabilele normate z sunt foarte utile n indicarea poziiei relative a rezultatului unui subiect n ansamblul rezultatelor ansamblului subiecilor n cadrul variabilelor z sunt foarte evidente, trei deficiene: valoarea foarte mic a amplitudinii (de la 3 la 3), obinerea de valori negative i exprimarea sub form zecimal, fr posibilitatea ntregirii (deoarece, n unele cazuri, s-ar deforma semnificativ valoarea unui rezultate. Pentru a se remedia aceste deficiene s-au creat alte tipuri de variabile normate, care se obin tot printr-o transformare liniar pornind de la medie i abatere standard. Teoretic se pot calcula o infinitate de tipuri de variabile normate bazate pe transformri liniare, dar, n practic se utilizeaz un numr restrns, dintre care amintim variabilele T, create de McCall, i variabile Hull, create de un cercettor american cu acelai nume. Formula pentru transformarea variabilelor originale a unor distribuii n variabile normate T este 10 X X . Dac transformm toate valorile originale ale unei distribuii dup urmtoarea: T = 50 + s formula amintit anterior obinem o nou distribuie care va avea valoare mediei aritmetice egal cu 50

X X , formula se poate s scrie i n modul urmtor: T= 50 + 10 z. Noile valori obinute dup transformare vor oscila aproximativ ntre 18 i 82. Pentru a avea la dispoziie variabile normate care s oscileaz ntre 1 i 100 (cu aproximaie), foarte comode de utilizat n practic, s-au creat variabilele Hull, avnd urmtoarea formul 14 X X . Formul alternativ de constituire este: H = 50 + 14z. Dac de constituire: H = 50 + s transformm toate valorile originale ale unei variabile dup formula lui H vom obine o nou distribuie cu media 50 i abaterea standard egal cu 14. Atenionm asupra faptului c variabilele normate i pierd valoarea practic de utilizare dac distribuia empiric (distribuie ale crei valori sunt obinute dintr-o cercetare concret) se deosebete semnificativ de o distribuie normal Gauss-Laplace. Distribuiile empirice i cele teoretice sunt diferite n marea majoritate a cazurilor. Este important de a ti dac aceast diferen este semnificativ sau nu. Pentru a stabili aceast difereniere exist anumite proceduri statistice. Exemplu de transformare n variabile normate z, T i H. S presupunem c avem o distribuie empiric cu media egal cu 73 i abaterea standard de egal cu 15. Ne propunem s transformm valorile variabilei X egale cu 37, 63, 78, 85, 92 , conform formulelor stabilite pentru variabile normate z, T i H. n mod uzual, n domeniul aplicrii testelor psihologice pentru denumirea unei operaiuni de acest gen se folosete expresia transformare a scorurilor brute n note z, T i H. Nu procedm la ntregirea notelor z, deoarece deformarea rezultatului ar fi semnificativ atunci cnd este vorba de o cifr mic. La notele T i H deformarea rezultatelor prin ntregire este nesemnificativ. Formulele de transformare sunt cele pe care le-am expus anterior. Faptul transformrii presupune c anterior ne-am asigurat de existena condiiilor care o permite. n cazul existenei unor asimetrii puternice, operaiunea de transformare nu ne este de folos practic.
i valoarea abaterii standard egal cu 10. Dac avem n vedere faptul c z=

142

STATISTIC I Nr.crt. 1 2 3 4 5 Variabila original X 37 63 78 85 92 Note z - 2,40 - 0,67 0,33 0,80 1,27 Note T 26 43,33 53,33 58 62,67 ntregire 26 43 53 58 63 Note H 16,40 40,67 54,67 61,20 67.33 ntregire 16 41 55 61 67

Tabelul 29. Cuprinde exemplificare pentru transformarea valorilor brute n note standard

III.5. STABILIREA ABATERII QUARTILE

Abaterea quartill, notat cu Q, este un indicator de apreciere a mprtierii, care se calculeaz prin mprirea la 2 a diferenei dintre valoarea quartilului 3 (Q3) i cea a quartilului 1 (Q1). Intervalul ( X 1Q ) cuprinde 50% din rezultatele unei distribuii. Amplitudinea unei distribuii are aproximativ 7,5 abateri quartile. Relaia se verific mai ales n situaia n care distribuia empiric se conformeaz exigenelor teoretice unei distribuii normale Gauss-Laplace. Se poate efectua o gradare pe curb prin folosirea medianei i abaterii quartile, aa cum s-a fcut cu media i abaterea standard. Oferim un exemplu concret pentru calcularea abaterii quartile. S presupunem c media unei distribuii este egal 74, quartilul 3 (Q3) este egal cu 85 i quartilul 1 (Q1) este egal cu 62. Numrul de rezultate ale subiecilor este egal cu 186 (N = 186) Modul de stabilire a acestor forme particulare a quantilelor l-am tratat anterior. Dup aflarea celor dou valori, putem trece la calculul abaterii quartile. Q 3 Q1 85 62 = = 11,5 . ntre valorile 62,5 (74 11,5) i 85,5 ( 74 + 11,5) se gsesc aproximativ Q= 2 2 50% dintre rezultate (93 de rezultate).
III.6. STABILIREA INDICATORILOR DE ASIMETRIE Indicatorii de nivel i de mprtiere au un mare rol n descrierea unora din caracteristicile unei distribuii, dar sunt insuficieni pentru formarea unei imagini complete asupra tendinelor care exist n aceasta. Distribuiile pot s aib medii i variane egale, dar s nu fie la fel de simetrice. Stabilirea indicatorilor de asimetrie prezint importan n aprecierea existenei unor influene n irul de date (datorate compoziiei eantionului sau erorilor de construcie a unui test psihologic, de exemplu) Apreciere asimetriei unei distribuii se poate face n cel mai simplu mod prin compararea valorilor mediei i medianei. Cnd media este inferioar medianei avem o asimetrie negativ. Dac mediana este inferioar mediei avem o asimetrie pozitiv a distribuiei de valori. Asimetria negativ presupune ngrmdirea de valori n dreapta mediei, adic existena mai multor valori superioare mediei dect cele inferioare acesteia. Cnd valorile mai mici dect media sunt n numr superior celor mai mari dect aceasta suntem n situaia unei asimetrii pozitive. Distribuia rezultatelor la un test prezentnd o puternic asimetrie de dreapt indic deosebita calitate intelectual a celor ce efectueaz testul (daca acest test este de inteligen) sau a modului de construcie a probei psihologice (cu prea multe situaii problematice uoare). n cazul n care avem drept scop s selectm o categorie de personal puternic performanta, se urmrete deliberat asigurarea asimetriei de stnga n timpul construciei probei. Amintim c astfel de procedee de construcia sunt de excepie. n majoritatea cazurilor, constatarea unei asimetrii semnificative a rezultatelor constituie un semnal pentru remedierea construciei probelor. Procedeul simplei comparaii a mediei i medianei are o valoare aproximativ. Egalitatea
143

AUREL STAN

medianei mediei nu ne asigur n privina simetriei unei distribuii. n cazul n care dorim sa fim mai precii trebuie sa calculam o serie de indicatori. Unul dintre acetia se bazeaz pe diferena dintre medie i median. l vom nota cu S. Formula este urmtoarea: S = 3 X Md n care cu X am notat s
3

x media, cu Md mediana i cu S indicatorul de asimetrie. n alt caz vom folosi formula: S =


abaterea standard a distribuiei. n cazul variabilelor grupate se folosete la numrtor

Ns 3

, n care

S este indicatorul de asimetrie (Skwenes), x este variabila de deviaie (X- X ), N este efectivul total i s

fx

. Vom

folosi tabelul cu date grupate pe variante de variaie creat pentru exemplificarea etapelor de calcul n vederea determinrii mediei aritmetice.
Date grupate pe variante de variaie Nr.crt X f fX x x2 fx2 x3 fx3 1 17 2 34 - 5,23 27,35 54,71 - 143,06 - 286,11 2 19 5 95 - 3,23 10,43 52,16 - 33,70 - 168,49 3 20 9 180 - 2,23 4,97 44,76 - 11,09 - 99,81 4 21 13 273 - 1,23 1,51 19,67 - 1,86 - 24,19 5 22 18 396 - 0,23 0,05 0,95 0,01 0,22 6 23 12 276 0,77 0,59 7,11 0,46 5,48 7 24 10 240 1,77 3,13 31,33 5,55 55,45 8 26 6 156 3,77 14,21 85,28 53,58 321,50 9 28 3 84 5,77 33,29 99,88 192.10 576,30 78 1734 395,85 380,35 Tabelul 30. Cuprinde exemplificare pentru etapele de calcul necesare stabilirii indicatorului de asimetrie

Pentru a avea la dispoziie toate datele aplicrii formulei coeficientului de asimetrie S va trebui s calculm abaterea standard a distribuiei. Aplicm formula pentru calcularea abaterii standard pentru variabile grupate pe variante de variaie: s=

(fx ) =
2

de asimetrie: S =

(fx ) =
3

380,35 = 4,87 = 2,2 . Aplicm, n continuare formula pentru calculul coeficientului 78

Ns

380,35 = 0,45. 78 * 10,64

Cnd valoarea coeficientului este 0, atunci distribuia este perfect simetric. Valoarea negativ indic o asimetrie negativ, valoarea pozitiv o asimetrie pozitiv. Valoarea obinut la distribuia exemplificat indic o asimetrie pozitiv.
III.7. INDICATORI DE BOLTIRE SAU INDICATORI DE EXCES

Pentru a caracteriza n ntregime o distribuie de valori trebuie s adugm la indicatorii de nivel, mprtiere i asimetrie indicatorii de exces sau de kurtosis. Kurtoza este gradul de aplatizare a unei distribuii. Se disting n aceasta privin 3 tipuri de distribuii: distribuiile leptokurtice (ascuite), n care se gsete un mare numr de valori cuprins la centrul distribuiei, distribuiile platicurtice care sunt evazate i se caracterizeaz printr-o mare ntindere a scorurilor i distribuiile mezocurtice, reprezentate printr-o distribuie apropiat celei normale. Exista o formul adecvat de calcul a excesului pentru

144

STATISTIC I scalele ordinale K= (C 75 C 25) ) . Prin K am notat coeficientul de exces, prin C75 centilul 75, prin C25

C 90 C10

centilul 25, prin C90 centilul 90 i prin C10 centilul 10. Conform acestei formule, o distribuie poate fi considerat mezokurtic atunci cnd valoarea lui K se situeaz n jurul valorii 0,2632. Distribuia va fi considerata drept leptokurtic atunci cnd K este mai mic dect 0,2632 i drept platicurtic cnd K este mai mare dect 0,2632. Coeficientul de exces pentru distribuii care satisfac exigenele scalelor de
. n aceast N * s4 formul K este coeficientul de exces a unei distribuii, x4 este puterea a patra a variabilei de deviaie

x interval se noteaz, de asemenea, cu K. Formula de calcul este urmtoarea: K =

(X- X ), s4 este puterea a patra a abaterii standard a distribuiei. n cazul variabilelor grupate pe variante de variaie la numrtor apare (f*x4). Pentru exemplificare am adaptat tabelul prezentat anterior. Abaterea standard are aceeai valoare (s = 2,2; s4 = 23,42). Date grupate pe variante de variaie Nr.crt X f fX x x4 f*x4 1 17 2 34 - 5,23 748,18 1496,36 2 19 5 95 - 3,23 108,85 544,23 3 20 9 180 - 2,23 24,73 222,57 4 21 13 273 - 1,23 2,29 29,76 5 22 18 396 - 0,23 0,00 0,05 6 23 12 276 0,77 0,35 4.22 7 24 10 240 1,77 9,82 98,15 8 26 6 156 3,77 202.01 1212,04 9 28 3 84 5,77 1108,42 3325,25 78 1734 6932,62
Tabelul 31. Cuprinde exemplificare pentru etapele de calcul necesare stabilirii indicatorului de exces

K=

(fx ) =
4

continuare,

aplicm

formula

pentru

calculul

coeficientului

de

exces:

N*s

6932,32 6932,62 = = 3,79 78 * 23,42 1826,26

Dup ultima formul folosit o distribuie este considerat mezokurtic cnd K = 3. n cazul n care K>3 distribuia este leptokurtic, iar n cazul n care K<3 ea este platikurtic. Rezultatul obinut de noi indic o distribuie leptokurtic.

EXERCIII

1. Se dau urmtoarele valori negrupate ale unei variabile: 15,31, 21,17, 19, 22, 27, 23, 26, 30, 20, 25,28, 27, 18, 17. S se determine cele 4 tipuri de indicatori statistici amintii n curs.

145

AUREL STAN

2.Se dau urmtoarele valori ale unei variabile, organizate pe variante de variaie: Nr. crt. Valorile variabilei (X) Frecvena (f) 1 21 4 2 22 5 3 23 7 4 24 11 5 25 13 6 26 20 7 27 25 8 28 30 9 29 22 10 30 19 11 31 17 12 32 13 13 33 5 14 34 3 S se determine tipurile de indicatori amintii n curs.

146

STATISTIC I

IV. MODELELE TEORETICE DE RAPORTARE

Am insistat anterior asupra faptului c o mulime de cifre rezultat din colectarea notelor brute ale unui mare numr de persoane care au efectuat un test psihologic nu ne ofer nici o informaie relevant dac nu realizm o serie de operaii preliminare. Ordonarea i sistematizarea acestor date ncep s confere sens acestei mulimi de date. Realizarea histogramei, a poligonului frecvenelor, a curbei frecventelor sau a altor forme de reprezentare spaial a distribuiilor empirice ofer imaginea tendinei generale care exist n cadrul mulimii de date. Interpretarea unor reprezentri grafice a distribuiilor empirice este posibil doar prin raportare la nite modele, care au o fundamentare matematic riguroas. Cele mai frecvente raportri ale distribuiilor i reprezentrilor lor grafice se fac la modelul distribuiei i curbei normale a lui Gauss-Laplace. Modelul amintit nu este nici mai bun, nici mai ru dect alte modele de distribuii (modelul Poisson, modelul binomial, modelul uniform discret, modelul Snedecor-Fisher, modelul hipergeometric)21, ci cel mai frecvent utilizat i mai adaptat datelor oferite de cercetrile psihopedagogice. Raportarea la distribuia normal este una din cele mai frecvente proceduri n analiza datelor rezultate din cercetrile cantitative ale domeniului psihologic. n unele cazuri, aceast modalitate de raportare devine un gest reflex, automatic, lipsit de discernmnt din partea cercettorului puin abilitat n privina exploatrii metodelor cantitative. Asemnarea unei distribuii empirice cu o distribuie normal pare s indice c cercetarea merge pe drumul cel bun, c o anumit caracteristic psihic se manifest armonios pe ansamblul unui grup. Este binecunoscut faptul c orice msurare capt sens prin raportarea la un model teoretic. Curba normal Gauss-Laplace este unul din modelele cu care se opereaz n cercetarea cantitativ, dar nu singurul. Exist alte modele frecvent utilizate, dar nu la fel de populare. De unde vine popularitatea curbei n clopot? Aceast distribuia pare multor cercettori natural i fireasc, manifestndu-se parc n firea lucrurilor, i probabil cred, c dac nu ar fi inventat-o celebrul matematician german, ar fi fcut-o ei cu siguran. Acumularea de fapte de via nregistrate n registrele oficiale ale statelor din Occident cu sistem administrativ evoluat din secolul XVII i XVII parc anuna curba lui Gauss. Astfel, n secolul XVIII s-a remarcat o mare stabilitate a recensmntului efectuat asupra marilor colectiviti (naterile, cstoriile, decesele). Acest fapt era interpretat ca o manifestare a providenei, a unei ordini divine, impunnd o aezare cantitativ armonioas pentru societate n ansamblul su, dincolo de indivizii volatili i imprevizibili. n 1832, matematicianul german Carl-Friedrich Gauss (1777-1855), profesor la Universitatea din Gttingen, supra-numit prinul matematicienilor stabilete o curb de erori, care va purta ulterior numele su, oferind o reprezentare n clopot a erorilor de observaie pentru msurtori mai ales astronomice. Curba normal a repartiiei, numit i curba normal Gauss-Laplace este simetric, are
O descriere a acestor modelele gsii n lucrarea lui Ilie Puiu Vasilescu, Statistic informatizat pentru tiinele despre om, Editura militar, Bucureti, 1991, pag. 53-96, de asemenea n lucrarea Statistica aplicat n psihologie de Valentin Clocotici i Aurel Stan, lucrare n curs de apariie la Editura Polirom.
21

147

AUREL STAN

vrf unic, cu ordonat maxim centrat pe medie i divizeaz repartiia valorilor n dou pri egale (media, mediana i modul coincid). Cu ct abaterea standard este mai slab cu att curba se strnge mai mult, se apropie asimptotic de axa x. Exist o relaie fix ntre abaterea standard a unui eantion i procentajul poriunilor de suprafa situate sub curb ntre dou limite Statisticianul, matematicianul i astronomul belgian Lambert Adolphe Jacques Quetelet (17961874), autor al lucrrii Sur lhomme et le dveloppment de ses facults ou essai de physique sociale, 1835, a pus n eviden faptul c distribuiile obinute pe caracteristici foarte variate au aceeai alur (ceea ce se va numi mai trziu curba n clopot) i propune o interpretare. El demonstreaz matematic c aceast form rezult din compunerea unui mare numr de erori mici i independente unele de altele. Abaterile, prin raportare la tendina central (valoare care corespunde vrfului curbei) vor fi nite imperfeciuni n realizarea efectiv a unui obiect perfect. Noiunea pus n circulaie de Quetelet este aceea de om mediu. La baza filosofrilor savantului belgian se afla considerentul c media descrie un subiect ideal, descrcat de erorile cu care natura l-a creat. Apreciaz c media este mai adevrat dect o valoare msurat. Omul mediu este proslvit ca expresie a adevrului. Cu toat strduina lui Quetelet de a impune omul mediu, aceast noiune a fost o prezen foarte controversat n cmpul preocuprilor tiinifice socio-umane. Distribuie normal se contureaz atunci cnd o caracteristic (de exemplu, n cazul nostru, inteligena) se nate din aciunea conjugat a mai multor surse de variaie care, firesc, o influeneaz. Avantajele acestui tip de distribuie rezid n posibilitatea unui mai bun tratament statistic a seriilor de rezultate repartizate ntr-un mod normal (n uniti de abateri standard). Comentnd ntr-o lucrare presupoziiile curbei lui Gauss. Jean Jacques Bonniol i Michel Vial se exprim poetic vorbind despre armul discret al simetriei22. Modelul gaussian a fost adoptat cu uurin din cauza faptului c el prezint toate aparenele de eviden: simetria armonioas, calcule simple, coeren cu (sau legitimare a) ideile existente asupra distribuiei aptitudinilor, coeren, cu imperativele seleciei sociale i a alegerii celor mai buni, cu obinuinele mentale i socio-culturale. Distribuia normal se verific experimental asupra variabilelor aleatoare i pare s dea seama de un fel de lege a naturii. Forma ca atare a curbei Gauss Laplace are o mare putere de sugestie pentru cei nclinai spre filosofare a faptelor, obiectelor, evenimentelor lumeti. Tot ce fiineaz n aceast lume are un nceput, o evoluie, un vrf de glorie sau de vitalitate, dup care urmeaz cderea, declinul i aneantizarea. Fiinele de orice gen, creaiile umane, alctuirile sociale, imperiile i mririle lumeti sunt tiranizate n existena lor de legea lui Gauss-Laplace. Dar, distribuia normal nu este divin i universal, cum a crezut la nceput Einstein. Exist distribuii n U, n J, n I, asimetrice de dreapta, asimetrice de stnga i altele. n scopul de a conserva avantajele distribuiei normale se modific valorile aceste distribuii prin transformarea mai ales n valori z sau T, adic se pun n funciune procedeele de normalizare. Generalizarea acestui model probabilist ajunge la legea normal redus, la care se rezum cteva caracteristici. ntr-o distribuie normal media, mediana i modul coincid, sigma sau abaterea standard delimiteaz zonele n care procentajele sunt cunoscute i stabile. Exemplificm noiunea de model de distribuie i deviaiile de la un model prin raportare la
22

Jean Jacques Bonniol, Michel Vial, Les modles de lvaluation. Textes fondateurs avec commentaires, De Boeck & Larcier s.a.1997, Paris, Bruxelles, pag.71

148

STATISTIC I modelul binomial, model foarte apropiat modelului normal de distribuie. Frecvenele variantelor sau intervalelor de distribuie sunt proporionale cu valorile urmtoarelor serii: 2 intervale: 3 intervale: 4 intervale: 5 intervale: 6 intervale: 7 intervale: 8 intervale: 9 intervale: 1 1 1 1 1 1 1 1 1 2 3 4 5 6 7 8

1 3 6 10 15 21 28

1 4 10 20 35 56

1 5 1 15 6 1 35 21 7 1 70 56 28 1

Cum citim aceste serii de valori care formeaz aa-numitul Triunghi al lui Pascal? Facem referire la algoritmul de repartiie pentru 4 intervale. irul 1 3 3 1 semnific faptul c n modelul binomial pentru 4 intervale, al doilea interval va avea un efectiv de trei ori mai mare dect primul, al treilea interval va avea un efectiv de trei ori mai mare dect primul i al patrulea interval va avea un efectiv egal cu primul. Deci, un prim efectiv de baz se multiplic conform unui algoritm. Dac vom avea 2940 de valori ale unei distribuii empirice i dorim s le distribuim dup modelul binomial n 9 clase pentru a putea determina ulterior ct de mult se distaneaz de acest model teoretic o anumit distribuie empiric, procedm n felul urmtor: 1) se adiioneaz toate cifrele din dreptul specificaiei 9 (1+8+28+56+70+56+28+8+1=326) ; 2) mprim efectivul total al distribuiei la 326 (2940:326 = 9,01, aproximativ 9); 3) valoarea rezultat o nmulim cu fiecare cifr a irului de date din dreptul specificaiei 9 intervale. Specificaie 9 Nr. interval Efectiv rezultat 1 1 9 8 2 72 28 3 252 56 4 504 70 5 630 56 6 504 28 7 252 8 8 72 1 9 9

Exprimat grafic sub form de histogram, situaia rezultat se prezint astfel:


700 600 500 400 300 200 100 0 9 1 252 72 2 3 4 5 6 7 252 72 8 9 9 540 630 540

Figura 6. Organizarea cantitativ a modelului binomial n 9 clase pentru 2940 de rezultate (exprimat printr-o histogram)
149

AUREL STAN

Exprimat sub form de curb, vom avea urmtoarea reprezentare grafic


700 600 500 400 300 200 100 0 1 9 2 3 4 5 6 7 8 9 72 252 252 72 9 540 630 540

Figura 7. Organizarea cantitativ a modelului binomial n 9 clase pentru 2940 de rezultate (exprimat printr-o curb a frecvenelor)

Distribuia empiric (aa cum rezult dintr-o cercetare concret) deviaz foarte frecvent de la o distribuie teoretic. n exprimare statistic se folosete sintagma pentru aceast deviaie de distan fa de modelul teoretic. n cercetarea practic nu are importan dac o distribuie empiric se distaneaz de una teoretic, ci dac aceast deviaie este semnificativ sau nu. Dac distana dintre cele dou distribuii este una semnificativ, putem spune c ieim din model, situaie care modific o serie de proceduri de raportare. Astfel, pentru valorile unei distribuii empirice nu mai au sens exprimrile prin intermediul valorilor normalizate. Exemplificm, prin intermediul unei reprezentri grafice realizate prin programul SPSS-10, distana ntre o distribuia teoretic i una empiric.
14

12

10

Std. Dev = 6,95 Mean = 24,4 N = 63,00 12,5 15,0 17,5 20,0 22,5 25,0 27,5 30,0 32,5 35,0 37,5

Figura 8. Exemplificare distanrii dintre o distribuie empiric (histogram pentru 63 de rezultate) i o distribuie teoretic (curba lui Gauss) 150

STATISTIC I Se cunosc mai multe forme de deviere sau distanare de la un model teoretic gaussian. Exemplificrile sunt fcute din domeniul psihologic Curba cu asimetrie de dreapta sau asimetrie negativ semnific faptul ca o proba psihologic 1. este prea uoara pentru subiecii la care a fost aplicata sau ca grupul de subieci este selecionat din superdotai. n aceast form de asimetrie se pot detecta cu uurin subiecii foarte slabi, situai n stnga distribuiei. I se spune pozitiv, deoarece diferena dintre valoarea mediei i valoarea medianei d o valoare negativ

120 100 80 60 40 20 0 1 2 3 4 5 6 7 8 9 10

Figura 9. Curba cu asimetrie de dreapta sau asimetrie negativ

Curba cu asimetrie de stnga sau asimetrie pozitiv .Semnific faptul c rezultatele unei probe 2. sunt foarte grele, sau faptul subiecii sunt selecionai dintre cei foarte slab dotai aptitudinal. I se spune pozitiv deoarece diferena dintre valoarea mediei i valoarea medianei d o valoare pozitiv. Cu o astfel de reprezentare grafic ies foarte bine n eviden subiecii buni i foarte buni.
120 100 80 60 40 20 0 1 2 3 4 5 6 7 8 9 10

Figura 10. Curb cu asimetrie de stnga sau asimetrie pozitiv

3. Curba platikurtic semnific ridicarea exagerata a coeficientului de variaie. Amplitudinea distribuiei sau plaja de variaie este foarte extins. Nu se poate observa nici o tendin de reliefare n distribuia datelor

151

AUREL STAN

150 100 50 0 1 2 3 4 5 6 7 8 9 10 11

Figura 11. Curb aplatizat sau platikurtic

4. Curba mezokurtica este apropiat ca form curbei normale Gauss-Laplace. Semnific un echilibru in privina repartiiei rezultatului subiecilor.
60 50 40 30 20 10 0 1 2 3 4 5 6 7 8 9

Figura 12. Curba mezokurtic

Curba leptokurtica semnific faptul c majoritatea datelor sunt masate n puine intervale n jurul 5. mediei i ngustimea coeficientului de variaie

250 200 150 100 50 0 -50 1 2 3 4 5 6 7 8 9

Figura 13. Curba leptokurtic

6. Curba bimodal (cu dublu modul) semnific faptul existenei n grupul de subieci examinai a doua subgrupuri eterogene cu dotri aptitudinale diferite. Menionm, totodat, c acest fel de curb rezulta i in cazul adoptrii unei tehnici de construcie a testului psihologic care-si propune s dea rezultate sub forma dihotomic (apt-inapt, admis-respins);

152

STATISTIC I
30 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 11 12

Figura 14. Curba bimodal

7. Curma multimodal semnifica existena n grupul examinat a mai multor subgrupe eterogene valoric.
40 30 20 10 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Figura 15. Curba multimodal

8. Curba n U semnific plasarea majoritii rezultatelor la extremitile plajei de variaie. n mediile de populaie puternic divizate pe criterii etnice, rasiale sau religioase se obin astfel de rezultate n cazuri n care se efectueaz chestionare de opinii n privina calitilor unei anumite grupri cu eantioane compuse din numere egale de opozani;
200 150 100 50 0 1 2 3 4 5 6 7 8 9

Curba 16. Curba n U

9. Curba n I se ntlnete n cazul n care majoritatea covritoare a subiecilor se situeaz la limita inferioar a plajei de variaie. Se ntlnesc astfel de situaii cnd transpunem grafic situaia erorilor la proba tblielor de corectura Bourdon-Amfimov;

153

AUREL STAN

200 150 100 50 0 1 2 3 4 5 6 7 8 9 10 11

Figura 17. Curba n I

10. Curba n j. Situaia se ntlnete cnd transpunem grafic valoarea indicilor de calitate la probele creion hrtie de atenie concentrata.
250 200 150 100 50 0 1 2 3 4 5 6 7 8 9 10 11

Figura 18. Curba n J

n interpretarea unor astfel de forme de distribuie care deviaz de la o distribuie teoretic Gauss-Laplace este necesar o anumit elasticitate n interpretare, deoarece anumite condiii particulare de desfurare a unui examen sau experiment favorizeaz apariia unui anumit tip de distanare. Explicaiile pe care le-am dat noi constituie doar una din interpretri. De exemplu, la apariia unei distribuii asimetrice pozitive se poate ntmpla ca subiecii s nu fi neles explicaiile de realizare a unei anumite sarcini.

154

STATISTIC I

BIBLIOGRAFIE

Andrei, T., Stancu, S., Statistic - Teorie i aplicaii, Editura All, Bucureti, 1995 Dickes, P., Tournois, J., Flieler, A., Kop, J.L., La psychometrie, Presses Universitaire de Frances, Paris, 1993 Gueguen, N., Manuel de statistique pour psychologues, Dunod, Paris, 1997 Horst, P., Messung und Vorhersage, Verlag Juliusz Beltz, Weinheim, Berlin, Basel, 1971 Lienert, G.A., Testaufbau und Testanalyse,Verlag Juliusz Beltz,Weinheim/ Berlin, 1967 Milton-Smith, G., Ghid simplificat de statistic pentru psihologie i pedagogie, Editura didactic i pedagogic, Bucureti, 1971 Nowak, A., Metode cantitative n psihologie i sociologie,Oscar Print, Bucureti, 1998 Porojan, D., Statistica i teoria sondajului, Casa de editur ansa SRL, Bucureti, 1993 Radu, I., Miclea, M., Moldovan, O., Neme, S., Szamoskozy, S., Metodologia psihologic i analiza datelor, Editura Sincron, Cluj, 1993 Reuchlin, M., Les Methodes quantitatives en psychologie, Presses Universitaires de France, Paris, 1962 Reuchlin, M., Precis de statistique, Presses Universitaires de France, Paris, 1975 Rotariu,T., Metode statistice aplicate n tiinele sociale, Polirom, Iai, 1999 Trebici, V. (coord), Mic enciclopedie de statistic, Editura tiinific i enciclopedic, Bucureti, 1985 arc, M., Tratat de statistic aplicat, Editura didactic i pedagogic, R.A. Bucureti, 1998 Vasilescu, I.P., Statistic informatizat pentru tiine despre om, Editura Militar, Bucureti, 1991

155

AUREL STAN

Anexa 1. Tabela legii normale reduse (probabiliti bilaterale)


Z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 0,00 1,00000 0,92034 0,84148 0,76418 0,68916 0,61708 0,54851 0,48393 0,42371 0,36812 0,31731 0,27133 0,23014 0,19360 0,16151 0,13361 0,10960 0,08913 0,07186 0,05743 0,00450 0,03573 0,02781 0,02145 0,01640 0,01242 0,00932 0,00693 0,00511 0,00373 0,00270 0,00194 0,00137 0,00097 0,00067 0,00047 0,00032 0,00022 0,00014 0,00010 0,0006 0,01 0,99202 0,91241 0,83367 0,75656 0,68181 0,61005 0,54186 0,7770 0,4]794 0,36282 0,31250 0,26700 0,22628 0,19020 0,15854 0,13104 0,10740 0,08727 0,07030 0,05613 0,04443 0,03486 0,02711 0,02089 0,01595 0,01207 0,00905 0,00673 0,00495 0,00361 0,00261 0,00187 0,00133 0,00093 0,00065 0,00045 0,00031 0,00021 0,00014 0,00009 0,0006 0,02 0,98404 0,90448 0,82587 0,74897 0,67449 0,60306 0,53526 0,47152 0,41222 0,35757 0,30773 0,26271 0,22247 0,18684 0,15561 0,12851 0,10523 0,08543 0,06876 0,05486 0,04338 0,03401 0,2034 0,02034 0,01552 0,01174 0,00879 0,00653 0,00480 0,00350 0,00253 0,00181 0,00128 0,00090 0,00063 0,00043 0,00029 0,00020 0,00013 0,00009 0,0006 0,03 0,97607 0,89657 0,81809 0,74140 0,66720 0,59611 0,52869 0,46539 0,40654 0,35237 0,30301 0,25848 0,21870 0,18352 0,15272 0,12602 0,10310 0,0363 0,06725 0,05361 0,04236 0,03317 0,02575 0,01981 0,01510 0,01141 0,00854 0,00653 0,00465 0,00339 0,00245 0,00175 0,00124 0,00087 0,00060 0,00042 0,00028 0,00019 0,00013 0,00008 0,00006 0,04 0,96809 0,88866 0,81033 0,73386 0,65994 0,59920 0,52217 0,45930 0,40091 0,34722 0,29834 0,25429 0,21498 0,18025 0,14987 0,12356 0,10101 0,08186 0,06577 0,05238 0,04135 0,03235 0,02509 0,01928 0,01469 0,01109 0,00829 0,00614 0,00451 0,00328 0,00237 0.00169 0,00120 0,00084 0,00058 0,00040 0,00027 0,00018 0,00012 0,00008 0,00005 0,05 0,96012 0,88076 0,80259 0,72634 0,65271 0,58232 0,51569 0,45325 0,39532 0,34211 0,29372 0,25014 0,21130 0,17702 0,14706 0,12114 0,09894 0,08012 0,06431 0,05118 0,4036 0,03156 0,02445 0,01877 0,01429 0,01077 0,00805 0,00596 0,00437 0,0318 0,00269 0,00163 0,00115 0,00081 0,00056 0,00039 0,00026 0,00018 0,00012 0,00008 0,00005 0,06 0,95216 0,87288 0,79486 0,71885 0,64552 0,57548 0,50925 0,44725 0,38979 0,33706 0,29914 0,24605 0,20767 0,17383 0,14429 0,18876 0,09691 0,07841 0,06289 0,05000 0,03940 0,03077 0,02382 0,01827 0,01389 0,01047 0,00781 0,00578 0,00424 0,00308 0,0221 0,00158 0,00111 0,00078 0,00054 0,00037 0,00025 0,00017 0,00011 0,0007 0,00005 0,07 0,94419 0,86501 0,78716 0,71138 0,63836 0,56868 0,50286 0,44130 0,38430 0,33205 0,28462 0,24200 0,20408 0,17069 0,14156 0,11642 0,09492 0,07673 0,06148 0,04884 0,03845 0,03001 0,02321 0,01779 0,01351 0,01017 0,00759 0,00561 0,00410 0,00298 0,00214 0,00152 0,00108 0,00075 0,00052 0,00036 0,00024 0,00016 0,00011 0,00007 0,00005 0,08 0,93624 0,85715 0,77948 0,70395 0,63123 0,59191 0,49650 0,43539 0,37886 0,32709 0.28014 0,23800 0,20055 0,16759 0,13887 0,11411 0,09296 0,07508 0,06011 0,04770 0,03753 0,02926 0,02261 0,01731 0,01314 0,00988 0,00736 0,00544 0,00398 0,00288 0,00207 0,00147 0,00108 0,00072 0,00050 0,00034 0,00023 0,00016 0,00010 0,00007 0,00005 0,09 0,92829 0,84931 0,71182 0,69654 0,62413 0,55519 0,49019 0,42953 0,37347 0,32217 0,27571 0,23405 0,19705 0,16453 0,13662 0,11183 0,09103 0,07345 0,05876 0,4659 0,03662 0,02852 0,02202 0,01685 0,01277 0,00960 0,00716 0,00527 0,00385 0,00279 0,00200 0,00142 0,00100 0,00070 0,00048 0,00033 0,00022 0,00015 0,00010 0.00007 0,00004

156

S-ar putea să vă placă și