Sunteți pe pagina 1din 12

PSIHOLOGIE EXPERIMENTAL CURS

GHERASIM CTLIN MARIUS ph.d

CAPITOLUL IV IV. INDICI STATISTICI DE START................................................................................3


IV.1. DETERMINAREA VALORII CENTRALE sau a TENDINEI CENTRALE............4 IV.2. DETERMINAREA INDICILOR DE DISPERSIE........................................................6 IV.3.SEMNIFICAIA ABATERII STANDARD...................................................................8 IV.4.FRECVENA...................................................................................................................10 IV.5.SUMAR............................................................................................................................11 BIBLIOGRAFIE.......................................................................................................................11 EXERCIII...............................................................................................................................11 NTREBRI CU RSPUNSURI MULTIPLE.......................................................................12

IV.INDICI STATISTICI DE START


OBIECTIVELE MODULULUI Dup parcurgerea acestui modul studentul va cunoate: formula de definiie i formula de calcul a indicilor statistici de determinare a tendinei centrale (media, mediana, modul) condiiile de determinare i formulele de calcul a indicilor variabilitii- variana (dispersia) i abaterea standard semnificaia abaterii standard funcia cotelor standardizate z condiiile de utilizare a frecvenei ca indice statistic

4.1. DETERMINAREA "VALORII CENTRALE"SAU A "TENDINEI CENTRALE"


n exemplul analizat n Modulul 2 (Fig. 2.2. i Tab. 2.5.) s-a putut constata cum datele tind s se concentreze parc n jurul unei valori centrale; efectivele cele mai mari (16 i 10, respectiv 9) corespund n acest caz claselor situate la mijlocul irului. Acest aspect l ntlnim destul de frecvent n experimentele psihologice. n anumite situaii, majoritatea rezultatelor pot s graviteze fie n partea dreapt, fie n partea stng a seriei de variaie. Se vorbete atunci de distribuii asimetrice. i n aceste cazuri datele tind s graviteze n jurul unor valori. Indicii prin care se determin n mod curent "tendina central" a rezultatelor sunt media, mediana i modul. Media, pe care o notm cu m, nu este altceva dect suma valorilor, a datelor numerice, mprit la numrul acestora. Formula ei de definiie este m=x/N, n care nseamn "sum de", x reprezint valorile sau rezultatele individuale, iar N constituie efectivul grupei studiate. n capitolele ce urmeaz va fi vorba de formule de definiie, necesare pentru nelegerea unui indice statistic i de formule de calcul, care indic procedurile statistice aplicabile pentru determinarea unui indice (media, abaterea standard, variana etc). Psihologul care beneficiaz de serviciile unui calculator, dotat cu programe informatice pentru prelucrarea statistic a datelor, se poate dispensa de cunoaterea i stpnirea formulelor de calcul. Calculatorul ofer la cerere, rezultatul calculului, indiferent de procedura aplicat. Ca exerciiu preliminar, parcurgerea acestor tehnici este util pentru a ne da seama de transformarea ce se produce asupra datelor brute. De asemenea, n absena serviciilor unui calculator sau a programelor informatice necesare, stpnirea formulelor de calcul devine necesar, eventual n vederea improvizrii unui program. Revenind la formula de definiie a mediei, ntruct N este totdeauna dat, urmeaz s stabilim procedee de calcul pentru x (suma valorilor numerice), pe care o notm cu T (iniiala cuvntului "total"). Cnd volumul datelor noastre este destul de restrns, pentru a-l determina pe T facem o simpl adunare fr s mai grupm valorile. Metoda da calcul presupune distribuie statistic dat, ca aceea din tabelul 3.1. Precizm c, pentru a pstra notaia acreditat de lucrri clasice n domeniu, cu f am notat efectivele i nu frecvena relativ (proporiile), raportat la ntreg. Vom avea trei coloane: valorile lui x grupate n clase, valorile centrale xk, i efectivele 3

corespunztoare f. Pentru calcularea lui T adugm o coloan n plus cu produsele fxxk. Aadar nmulim fiecare valoare central xk cu efectivul corespunztor clasei respective, iar produsele nscrise n coloana fxxk le adunm i obinem totalul T. tiind c m = T/N, vom efectua mprirea i vom obine media. n exemplu nostru: m = 672/51 = 13,17. Tabelul 3.1 Calcularea mediei x 3-5 6-8 9-11 12-14 15-17 18-20 21-23 24-26 xk 4 7 10 13 16 19 22 25 f 3 5 9 16 10 4 3 1 N = 51 fxxk 12 35 90 208 160 76 66 25 T = 672

Aa cum s-a precizat, media pune n eviden tendina central a rezultatelor constate ntr-o experien. Prin calcularea mediei obinem o msur a nivelului mediu relativ la un eantion studiat, fapt care permite apoi comparaii ntre grupe. Mediana este un alt indice al tendinei centrale, care se utilizeaz mai ales cnd avem de-a face cu distribuii asimetrice. De exemplu, n cronometrri se nregistreaz succesiv timpul de execuie a unei operaii de producie la un muncitor; distribuia empiric obinut este, de regul, asimetric i atunci se reine mediana ca msur a timpului de lucru. Pentru a gsi mediana - pe care o notm cu med - trebuie s aranjm, n cazuri mai simple, toate datele (valorile) n ordine crescnd sau descrescnd. Mediana este acea valoare care mparte irul ordonat n dou grupe egale ca numr. Cu alte cuvinte, mediana se gsete la mijlocul irului: jumtate din valori se afl deasupra, iar cealalt jumtate dedesubt. Locul sau rangul pe care l ocup mediana n irul ordonat se detrmin cu ajutorul formulei (N+1)/2 (care nu este formula de definiie pentru med). Cnd valorile constituie un numr fr so, mediana va corespunde determinantei din mijloc. Astfel, n seria valorilor: 4, 4, 5, 6, 6, 7, 7, 7, 7, 8, 9, med = 7 pentru c 7 este valoarea care mparte irul ordonat exact n dou. Formula (N + 1)/2 ne indic locul pe care se gsete mediana. n cazul nostru med este valoarea situat pe locul al 6- lea n irul ordonat [(11 + 1)/2 = 6]. Dac valorile ordonate sunt n numr cu so, mediana se va gsi la mijlocul irului, ntre dou valori consecutive. Fie datele ordonate: 3, 4, 4, 5, 6, 7, 7, 8, 8, 9; deci 10 valori. Mediana se va gsi pe locul 5,5 deoarece (N + 1)/2 este n cazul acesta (10 + 1/2) adic 5,5. Cutnd n irul dat valoarea situat pe locul 4

5,5 constatm c ea se gsete ntre dou valori consecutive:6 i 7. n consecin vom face media celor dou valori: med va fi egal cu 6,5.

Tabelul 3.2. Calculul medianei n cazul datelor grupate f Interval xk 24-26 25 1 21-23 22 3 18-20 19 4 15-17 16 10 12-14 13 16 9-11 10 9 6-8 7 5 3-5 4 3 i=3 N = 51

fc 51 50 47 43 33 17 8 3

Cnd datele sunt grupate ca n tabelul 3.2 localizm mai nti intervalul n care se gsete mediana lund ca reper N/2. n exemplul citat N/2 = 51/2 = 25,5 deci mediana se afl n intervalul (12 - 14) ale crui limite exacte sunt 11,5 i 14,5 (variabila fiind considerat continu). Formula care ne d valoarea medianei este urmtoarea:

N Fs med = l + 2 i fi
n care: l este limita inferioar a intervalului reperat, Fs este totalul frecvenelor situate sub l (n exemplul dat 3 + 5 + 9 = 17), fi= frecvena corespunztoare intervalului localizat, iar N i i sunt notaii cunoscute n exemplul ales vom avea:

med = 11,5 +

25,5 17 3 = 13,09 16

Spre deosebire de medie, mediana prezint avantajul de a nu fi afectat de variaiile extreme ale seriei, fapt care o face potrivit pentru studiul distribuiilor asimetrice. Modul este valorea care se repet mai des ntr-un ir de rezultate, adic valoarea care prezint frecvena cea mai mare. De exemplu, n seria de date 4, 5, 6, 6, 7, 7, 7, 7, 8, 9, modul este 7, deoarece 7 este valoarea cu frecvena cea mai mare. Cnd datele sunt grupate, modul este clasa care reunete cei mai muli din subieci, mai precis valoarea centaral a acestei clase. De exemplu, n tabelul 3.2., clasa care ntrunete frecvena maxim este 12 14, a crei valoare central este 13. Dup cum se vede, modul poate fi determinat prin simpla examinare a valorilor, fr s fie necesare operaii de calcul. Ca indice al tendinei centrale, modul este foarte aproximativ i se ia n considerare mai ales la prima inspecie a datelor. n cazul distribuiilor normale modul, mediana i media coincid sau prezint valori foarte apropiate. 5

4.2. DETERMINAREA INDICILOR DE DISPERSIE


Media, mediana i modul caracterizeaz un singur aspect al distribuiei statistice: tendina general a datelor. Este necesar s cunoatem i modul n care se repartizeaz diferite rezultate n jurul "valorii centrale", adic organizarea interioar a distribuiei. De exemplu, dou distribuii statistice - cum sunt cele redate n figura 3.1. - pot avea aceeai medie, dar ele s fie totui foarte diferite sub aspectul variabilitii, respectiv al omogenitii.

Figura 3.1. Se pune deci problema de a gsi indicatori prin intermediul crora se poate msura variaia sau mprtierea datelor n jurul mediei. Aceti indicatori sunt: dispersia sau variana, i abaterea standard.Cu ajutorul lor se obin informaii asupra variabilitii grupului studiat. Dispersia i abaterea standard Dispersia sau variana se noteaz cu 2 sau cu s2 i are ca formul de definiiie:
2

=s

( x m) =
N 1

n care (x-m) reprezint abaterea fiecrei valori de la media calculat, iar N este efectivul grupei de msurri. Abaterea standard sau abaterea tip - care se noteaz cu sau cu s - nu este altceva dect rdcina ptrat din valoarea dispersiei: = 2 Aadar, pentru a determina abaterea standard trebuie oricum s aflm mai nti dispersia 2. Indicele de dispersie cel mai exact i mai des utilizat este de fapt abaterea standard, avnd avantajul de a fi exprimat n aceleai uniti ca i datele iniiale pe care le prelucrm. De exemplu, dac studiul se bazeaz pe note, abaterea standard este exprimat tot n note, permind s se analizeze mai corect gradul de variabilitate al grupului. Abaterea tip se folosete, de asemenea, n discutarea distribuiilor normale. Dispersia are avantajul de a nu cuprinde radicalul n expresia ei algebric i astfel se preteaz mai uor la calcule teoretice. Dac analizm formula de definiie a dispersiei ne dm seama c numai expresia de la numrtor, adic suma ptratelor abaterilor de la medie, ridic probleme mai dificile pentru calcul. Vom numi pe scurt aceast expresie suma ptratelor. Determinarea sumei ptratelor nu se face utiliznd expresia de definiie (x-m)2 deoarece 6

comport operaii laborioase i de cele mai multe ori cu numere zecimale. Transformnd expresia de definiie, se obine o formul convenabil de calcul:

( x m) = x
compun grupul iniial de date. Formula de calcul a dispersiei devine astfel:

T2 N

n care notaiile sunt deja cunoscute. x2 reprezint totalul ptratelor celor N rezultate (valori) care

2 =

x2

T2 N N 1

De notat c T2 i x2 sunt valori cu totul diferite, ceea ce se poate verifica n tabelul 3.3. n ceea ce privete determinarea disprsiei, avnd datele grupate, ne referim din nou la cele dou metode utilizate pentru calculul mediei. Metoda de calcul ilustrat prin tabelul 3.3, ne-a condus la determinarea lui T prin nsumarea produselor fxx, tiind c fxx'T. Ridicnd acum la ptrat pe T i mprind apoi cu N (efectivul grupei), avem stabilit T2/N din formula de calcul a sumei ptratelor stabilit mai sus. Ne rmne s calculm doar x2. Pentru aceasta la tabelul care a condus la determinarea lui T mai adugm o coloan fxx2 n care vom nscrie produsele (fxx) x x (adic produsele fxx notate n coloana precedent se mai nmulesc o dat cu valorile x). Pentru ilustrare s urmrim exemplul din tabelul 3.3. Tabelul 3.3. Note, x 3 4 5 6 7 8 9 10 f 2 2 3 7 10 8 4 2 N = 38 fxx 6 8 15 42 70 64 36 20 T = 261
2

(fxx)xx 18 32 75 252 490 512 324 200 x = 1903

nsumnd produsele nscrise n coloana (f x x) x x sau, pe scurt fxx2, se obine x2 i n felul acesta avem asigurate toate elementele necesare pentru determinare sumei ptratelor potrivit formulei. Exemplul ales constituie oarecum un caz particular, avnd ca interval de grupare i = 1. Valorile centrale xk coincid cu valorile lui x. Aceasta este situaia seriilor de variaie mai mici, cnd distana dintre valorile extreme nu este mai mare i permite o grupare mai simpl a datelor (de pild, n cazul notelor 7

colare). Cnd intervalul de grupare este mai mare dect 1 i lucrm cu valori centrale xk, produsele vor fi fxxxxxk, adic fxxk2. Fcnd nlocuirile necesare n exemplul dat vom avea:

( x m)

= 1903

68121 = 110,4 38

Pentru a determina dispersia sau variana, mprim rezultatul obinut la N - 1.

2 =

110,4 =3 37

n continuare extragem rdcina ptrat din 2 sau s2 i obinem abaterea tip: = 3 = 1,7 Se poate observa c pentru determinarea dispersiei n tabelul de calcul utilizat la medie se adaug doar nc o coloan fxx2. Pentru uurarea caculelor trebuie utilizate tabele matematice uzuale, care ne dau n2 i

n pentru orice numere pn la 10.000.


n ncheiere sunt necesare dou precizri eseniale: n prezent, determinarea indicilor statistici se face cu ajutorul calculatorului, care preia munca

de rutin a cercettorului. Acesta din urm decide ns ce indici va calcula, ce tabele i grafice sunt necesare n funcie de natura datelor, va ntrevedea forma distribuiei i obiectivele cercetrii. Programele informatice aplicate vor sugera modul n care trebuie pregtit i organizat materialul brut pentru prelucrarea statistic; psihologul - cercettor stpnete datele de intrare i "citete" datele de ieire pe care le interpreteaz. Datele numerice sunt culese pe loturi sau grupuri extrase dintr-o colectivitate mai larg numit populaie. Elementele unui lot sau grup trebuie alese dup regulile seleciei aleatoare pentru a putea formula concluzii valabile. Notm indicii obinui pe eantion cu m i respectiv cu

4.3. SEMNIFICAIA ABATERII STANDARD


Distingem: abaterea standard n populaie; abaterea standard obinut pe o colecie de date (eantion dintr-o populaie). Distingem, de asemenea, variabilitatea inter-individual (ntre indivizi) i variabilitatea intraindividual (pentru acelai individ). De exemplu, distribuia CI pe o colectivitate reflect variana inter iar distribuia timpilor de reacie la un singur individ arat variana intra. Fenomenul variabilitii inter i intra este att de obinuit i nu ne mai ntrebm asupra cauzei sau sursei deoarece se mbin aici mai multe surse. Abaterea standard poate fi luat ca unitate de msur pe abscisa unui poligon sau a unei curbe de frecven, n cazul unei histograme experimentale simetrice Dorim deci, s lum abscisa n uniti . Pentru aceasta pornim de la medie n dreapta i n stnga. Adugm 1 =5 la m =25 i obinem 30. Distana dintre 25 i 30 este de 1 , ea are o ntindere 8

de 5 uniti brute. La fel este situat 35 la distana de +2 deasupra mediei i-i corespunde o ntindere n uniti brute de 10. Mai adugm 1 la 35 i obinem 40; observm c distana total ntre m i 40 este de +3 ntr-o distribuie simetric ideal, aproximativ 3 acoper distana ntre m i cota cea mai mare a distribuiei. n acelai fel procedm n partea stng, adic sub medie. Scdem succesiv 5 din 25, i apoi 5 din 20, i 5 din 15, adic nti -1 apoi -2 i -3 . Deci ntr-o distribuie simetric tipic exist numai aproximativ 3 deasupra mediei i -3 sub medie, ceea ce putem scrie 3 . nseamn c amplitudinea sau ntinderea variaiei - notat cu V - este de aproximativ 6 sau c abaterea standard este a asea parte din V. Abaterea standard devine o unitate de msur pentru ntinderea variaiei. Relaia artat se verific pe msur ce N crete (de exemplu la N = 50, raportul V/ este de cca 4,5, la N = 90, raportul devine 5 etc). S reinem dou idei:

msoar distana la care se afl o cot oarecare n raport cu m , devine unitate de msur pentru V.
n practic, este necesar utilizarea unor registre diferite de variaie. De exemplu n cazul

inteligenei se opereaz n mod curent cu registrul 70-140, ntr-o prob de memorie se obin valori ntre 212, n cazul msurrii timpului de reacie se nregistreaz fraciuni de secund. Se pune problema comparrii i combinrii acestor date heterogene. Soluia este oferit de cotele z.

Cote z O distan, un interval dat n cote brute poate fi exprimat n uniti , mprind distana respectiv (x- m ) cu . n felul acesta avem un punct de referin zero. Lund drept unitate trecem de la cotele brute x la cote transformate z. Aceast nou variabil z se numete variabil standardizat. Cota z: o valoare care ne arat ct se distaneaz, n uniti , o cot brut de media distribuiei respective. Formula de trecere de la variabila brut x la variabila normat sau standardizat z este urmtoarea:

z=

xm

ntr-o distribuie tipic normal, n care exist trei abateri standard deasupra mediei i trei dedesubt, cea mai mare cot z pe care o putem obine este + 3, iar cea mai mic - 3. Amplitudinea cotelor z este ntre + 3 i - 3 trecnd evident prin zero.

Exemplu: Avem un test de inteligen i altul de aptitudine mecanic. Rezultatul final condensat este: 9

Tabelul 3.5.

m
Aptitudinea mecanic Inteligen 100 60

10 6

Transpunerea cotelor brute x n cote z permite compararea lor direct. Cu ajutorul cotelor z avem abaterea unei valori de la medie n termeni de uniti . Odat cu acestea, variabile diferite sunt aduse la un numitor comun, fiind exprimate n aceleai uniti, devin deci comparabile. Media i abaterea standard servesc la interpretarea datelor; semnificaia lor se stabilete n cadrul unor raionamente bine precizate, care vor fi prezentate n Capitolul 4. n ncheiere trebuie s precizm c valorile caracteristice studiate ( m, med , ) nu se determin pentru orice distribuie statistic. Dac distribuia rezultatelor este normal sau aproape normal, se deterin media, dispersia i abaterea standard; dac distribuia este asimetric, se determin mediana. n cazul distribuiilor particulare, n form de i sau j de exemplu, este bine s ne mulumim cu un grafic (P.Fraisse, 1963) i s determinm modul, respectiv frecvena.

4.4. FRECVENA
Alturi de medie i abaterea standard, un indice statistic adesea utilizat este frecvena. ntr-o colecie de date, fiecare element fie c prezint o caracteristic A, fie c nu. Notm cu N efectivul total al unui grup i cu n numrul de elemente care prezint caracteristica A. Frecvena caracteristicii A n lotul studiat este n din N sau n/N, care se mai numete i frecven relativ. Se vorbete, de pild, de frecvena accidentelor de circulaie, clasificndu-le dup diferite criterii, sau de frecvena muncitorilor accidentai ntr-o uzin .a.m.d. De asemenea, cnd se aplic un test se vorbete de frecvena persoanelor care au obinut un anumit rezultat, o cot determinat. Procentajele se obin plecnd de la frecvene conform formulei: n/N x 100. Exemplu (dup Faverge): ntr-o statistic asupra erorilor de la casierie, s-au observat 134 erori n plus i 289 erori n minus. Frecvena f a erorilor n plus este: f = 134/423 = 0,32; (423 = 134 + 289). De reinut: distincia dintre frecvene absolute sau efective - notate, de regul, cu n - i frecvene relative sau proporii, notate cu f. n exemplul de mai sus se poate urmri modul de trecere de la frecvena absolut la cea relativ.

10

4.5. SUMAR
Caracterizarea datelor cuantificate prin scale de interval se realizeaz prin intermediul unui set de indici descriptivi incadrai n dou categorii: indicii tendinei centrale, respectiv ai variabilitii. n prima categorie sunt inclui: media, mediana, respectiv modul. n a doua categorie se pot meniona: dispersia (variana) i abaterea standard. Cotele z permit exprimarea datelor n funcie de medie i abaterea standard i asigur cuantificarea n uniti standard. n cazul scalelor nominale sau ordinale se utilizeaz ca indice descriptiv frecvena. Bibliografie Faverge, J.M. (1965). Mthodes statistiques en psychologie applique. t.I Paris, P.U.F. Jaccard J & Becker, M. (1997). Statistics for the behavioral sciences (third edition), Brooks, Cole Publishing Company, Pacific Grove. Rouanet, H., Le Roux, B., Best, C. (1987). Statistique en sciences humaines: procedures naturelles, Paris, Bordas. Spence, J., Underwood, B.J., Duncan, C.P., Cotton, J.W. (1968). Elementary statistics, New York, Appleton EXERCIII 1. S-a aplicat o prob de memorie unui grup de elevi din coala normal, respectiv unui grup de elevi din coala ajuttoare/ special. Rezultatele obinute de cele dou grupuri sunt prezentate n tabelul de mai jos. Realizai histogramele i calculai media, mediana i modul pentru rezultatele fiecrui grup. Ce se poate spune despre cele dou distribuii din inspecia indicilor calculai? coala normal coala special 8 5 5 6 12 5 7 7 5 6 9 5 9 8 15 5 6 10 9 14 8 5 14 5 9 12

2. n urma administrarii unei probe experimentale pe un grup de subieci a rezultat urmtoarea distribuie a scorurilor: Rezultate 4 5 6 7 8 9 10 11 12 Frecven 2 0 3 4 5 5 6 4 2

11

ntocmii histograma corespunztoare. Calculai media, mediana, modul i abaterea standard. Ce se poate spune despre distribuia rezultat? 3. Datele de mai jos provin de la un eantion extras dintr-o populaie cu media m = 4 i = 1,63: 1 2 2 3 3 3 4 4 4 4 5 5 5 6 6 7 a. reprezentai grafic distribuia dat; b. transformai distribuia dat ntr-o distribuie z. 4. Rezultatele unei lucrri de control prin care s-a ncheiat o experien (exprimate n note) au fost urmtoarele: 5, 7, 10, 4, 7, 7, 3, 9, 8, 6, 7, 8, 7, 4, 9, 10, 7, 5, 7, 6, 9, 6, 8, 6, 9, 8, 3, 7, 8, 5, 7, 6, 8, 7, 6, 8, 7, 6. (N = 38).. a. S se ntocmeasc histograma i poligonul frecvenelor. b. S se calculeze media, mediana, modul pe baza acestor date. NTREBRI CU RSPUNSURI MULTIPLE 1. n ce situaii se folosete preferenial mediana ca aproximare a tendinei centrale? a) cnd numrul de date este redus b) cnd distribuia este asimetric c) cnd media = mediana = modul d) cnd distribuia este simetric e) cnd distribuia este nclinat spre dreapta R. a,b,e 2. Cum este numit distribuia n cadrul creia media = mediana = modul? a) distribuie asimetric b) distribuie normal c) distribuie gaussian d) distribuie n form de I e) distribuie bimodal R. b,c 3. Ce semnificaie are abaterea standard? a) reprezint o unitate de msur standard b) caracterizeaz tendina central a datelor c) reflect n mod standardizat dispersia datelor n jurul mediei d) reflect variana datelor e) reflect valoarea modal a datelor nregistrate R. a,c 12

S-ar putea să vă placă și