Documente Academic
Documente Profesional
Documente Cultură
corespunztoare f. Pentru calcularea lui T adugm o coloan n plus cu produsele fxxk. Aadar nmulim fiecare valoare central xk cu efectivul corespunztor clasei respective, iar produsele nscrise n coloana fxxk le adunm i obinem totalul T. tiind c m = T/N, vom efectua mprirea i vom obine media. n exemplu nostru: m = 672/51 = 13,17. Tabelul 3.1 Calcularea mediei x 3-5 6-8 9-11 12-14 15-17 18-20 21-23 24-26 xk 4 7 10 13 16 19 22 25 f 3 5 9 16 10 4 3 1 N = 51 fxxk 12 35 90 208 160 76 66 25 T = 672
Aa cum s-a precizat, media pune n eviden tendina central a rezultatelor constate ntr-o experien. Prin calcularea mediei obinem o msur a nivelului mediu relativ la un eantion studiat, fapt care permite apoi comparaii ntre grupe. Mediana este un alt indice al tendinei centrale, care se utilizeaz mai ales cnd avem de-a face cu distribuii asimetrice. De exemplu, n cronometrri se nregistreaz succesiv timpul de execuie a unei operaii de producie la un muncitor; distribuia empiric obinut este, de regul, asimetric i atunci se reine mediana ca msur a timpului de lucru. Pentru a gsi mediana - pe care o notm cu med - trebuie s aranjm, n cazuri mai simple, toate datele (valorile) n ordine crescnd sau descrescnd. Mediana este acea valoare care mparte irul ordonat n dou grupe egale ca numr. Cu alte cuvinte, mediana se gsete la mijlocul irului: jumtate din valori se afl deasupra, iar cealalt jumtate dedesubt. Locul sau rangul pe care l ocup mediana n irul ordonat se detrmin cu ajutorul formulei (N+1)/2 (care nu este formula de definiie pentru med). Cnd valorile constituie un numr fr so, mediana va corespunde determinantei din mijloc. Astfel, n seria valorilor: 4, 4, 5, 6, 6, 7, 7, 7, 7, 8, 9, med = 7 pentru c 7 este valoarea care mparte irul ordonat exact n dou. Formula (N + 1)/2 ne indic locul pe care se gsete mediana. n cazul nostru med este valoarea situat pe locul al 6- lea n irul ordonat [(11 + 1)/2 = 6]. Dac valorile ordonate sunt n numr cu so, mediana se va gsi la mijlocul irului, ntre dou valori consecutive. Fie datele ordonate: 3, 4, 4, 5, 6, 7, 7, 8, 8, 9; deci 10 valori. Mediana se va gsi pe locul 5,5 deoarece (N + 1)/2 este n cazul acesta (10 + 1/2) adic 5,5. Cutnd n irul dat valoarea situat pe locul 4
5,5 constatm c ea se gsete ntre dou valori consecutive:6 i 7. n consecin vom face media celor dou valori: med va fi egal cu 6,5.
Tabelul 3.2. Calculul medianei n cazul datelor grupate f Interval xk 24-26 25 1 21-23 22 3 18-20 19 4 15-17 16 10 12-14 13 16 9-11 10 9 6-8 7 5 3-5 4 3 i=3 N = 51
fc 51 50 47 43 33 17 8 3
Cnd datele sunt grupate ca n tabelul 3.2 localizm mai nti intervalul n care se gsete mediana lund ca reper N/2. n exemplul citat N/2 = 51/2 = 25,5 deci mediana se afl n intervalul (12 - 14) ale crui limite exacte sunt 11,5 i 14,5 (variabila fiind considerat continu). Formula care ne d valoarea medianei este urmtoarea:
N Fs med = l + 2 i fi
n care: l este limita inferioar a intervalului reperat, Fs este totalul frecvenelor situate sub l (n exemplul dat 3 + 5 + 9 = 17), fi= frecvena corespunztoare intervalului localizat, iar N i i sunt notaii cunoscute n exemplul ales vom avea:
med = 11,5 +
25,5 17 3 = 13,09 16
Spre deosebire de medie, mediana prezint avantajul de a nu fi afectat de variaiile extreme ale seriei, fapt care o face potrivit pentru studiul distribuiilor asimetrice. Modul este valorea care se repet mai des ntr-un ir de rezultate, adic valoarea care prezint frecvena cea mai mare. De exemplu, n seria de date 4, 5, 6, 6, 7, 7, 7, 7, 8, 9, modul este 7, deoarece 7 este valoarea cu frecvena cea mai mare. Cnd datele sunt grupate, modul este clasa care reunete cei mai muli din subieci, mai precis valoarea centaral a acestei clase. De exemplu, n tabelul 3.2., clasa care ntrunete frecvena maxim este 12 14, a crei valoare central este 13. Dup cum se vede, modul poate fi determinat prin simpla examinare a valorilor, fr s fie necesare operaii de calcul. Ca indice al tendinei centrale, modul este foarte aproximativ i se ia n considerare mai ales la prima inspecie a datelor. n cazul distribuiilor normale modul, mediana i media coincid sau prezint valori foarte apropiate. 5
Figura 3.1. Se pune deci problema de a gsi indicatori prin intermediul crora se poate msura variaia sau mprtierea datelor n jurul mediei. Aceti indicatori sunt: dispersia sau variana, i abaterea standard.Cu ajutorul lor se obin informaii asupra variabilitii grupului studiat. Dispersia i abaterea standard Dispersia sau variana se noteaz cu 2 sau cu s2 i are ca formul de definiiie:
2
=s
( x m) =
N 1
n care (x-m) reprezint abaterea fiecrei valori de la media calculat, iar N este efectivul grupei de msurri. Abaterea standard sau abaterea tip - care se noteaz cu sau cu s - nu este altceva dect rdcina ptrat din valoarea dispersiei: = 2 Aadar, pentru a determina abaterea standard trebuie oricum s aflm mai nti dispersia 2. Indicele de dispersie cel mai exact i mai des utilizat este de fapt abaterea standard, avnd avantajul de a fi exprimat n aceleai uniti ca i datele iniiale pe care le prelucrm. De exemplu, dac studiul se bazeaz pe note, abaterea standard este exprimat tot n note, permind s se analizeze mai corect gradul de variabilitate al grupului. Abaterea tip se folosete, de asemenea, n discutarea distribuiilor normale. Dispersia are avantajul de a nu cuprinde radicalul n expresia ei algebric i astfel se preteaz mai uor la calcule teoretice. Dac analizm formula de definiie a dispersiei ne dm seama c numai expresia de la numrtor, adic suma ptratelor abaterilor de la medie, ridic probleme mai dificile pentru calcul. Vom numi pe scurt aceast expresie suma ptratelor. Determinarea sumei ptratelor nu se face utiliznd expresia de definiie (x-m)2 deoarece 6
comport operaii laborioase i de cele mai multe ori cu numere zecimale. Transformnd expresia de definiie, se obine o formul convenabil de calcul:
( x m) = x
compun grupul iniial de date. Formula de calcul a dispersiei devine astfel:
T2 N
n care notaiile sunt deja cunoscute. x2 reprezint totalul ptratelor celor N rezultate (valori) care
2 =
x2
T2 N N 1
De notat c T2 i x2 sunt valori cu totul diferite, ceea ce se poate verifica n tabelul 3.3. n ceea ce privete determinarea disprsiei, avnd datele grupate, ne referim din nou la cele dou metode utilizate pentru calculul mediei. Metoda de calcul ilustrat prin tabelul 3.3, ne-a condus la determinarea lui T prin nsumarea produselor fxx, tiind c fxx'T. Ridicnd acum la ptrat pe T i mprind apoi cu N (efectivul grupei), avem stabilit T2/N din formula de calcul a sumei ptratelor stabilit mai sus. Ne rmne s calculm doar x2. Pentru aceasta la tabelul care a condus la determinarea lui T mai adugm o coloan fxx2 n care vom nscrie produsele (fxx) x x (adic produsele fxx notate n coloana precedent se mai nmulesc o dat cu valorile x). Pentru ilustrare s urmrim exemplul din tabelul 3.3. Tabelul 3.3. Note, x 3 4 5 6 7 8 9 10 f 2 2 3 7 10 8 4 2 N = 38 fxx 6 8 15 42 70 64 36 20 T = 261
2
nsumnd produsele nscrise n coloana (f x x) x x sau, pe scurt fxx2, se obine x2 i n felul acesta avem asigurate toate elementele necesare pentru determinare sumei ptratelor potrivit formulei. Exemplul ales constituie oarecum un caz particular, avnd ca interval de grupare i = 1. Valorile centrale xk coincid cu valorile lui x. Aceasta este situaia seriilor de variaie mai mici, cnd distana dintre valorile extreme nu este mai mare i permite o grupare mai simpl a datelor (de pild, n cazul notelor 7
colare). Cnd intervalul de grupare este mai mare dect 1 i lucrm cu valori centrale xk, produsele vor fi fxxxxxk, adic fxxk2. Fcnd nlocuirile necesare n exemplul dat vom avea:
( x m)
= 1903
68121 = 110,4 38
2 =
110,4 =3 37
n continuare extragem rdcina ptrat din 2 sau s2 i obinem abaterea tip: = 3 = 1,7 Se poate observa c pentru determinarea dispersiei n tabelul de calcul utilizat la medie se adaug doar nc o coloan fxx2. Pentru uurarea caculelor trebuie utilizate tabele matematice uzuale, care ne dau n2 i
de rutin a cercettorului. Acesta din urm decide ns ce indici va calcula, ce tabele i grafice sunt necesare n funcie de natura datelor, va ntrevedea forma distribuiei i obiectivele cercetrii. Programele informatice aplicate vor sugera modul n care trebuie pregtit i organizat materialul brut pentru prelucrarea statistic; psihologul - cercettor stpnete datele de intrare i "citete" datele de ieire pe care le interpreteaz. Datele numerice sunt culese pe loturi sau grupuri extrase dintr-o colectivitate mai larg numit populaie. Elementele unui lot sau grup trebuie alese dup regulile seleciei aleatoare pentru a putea formula concluzii valabile. Notm indicii obinui pe eantion cu m i respectiv cu
de 5 uniti brute. La fel este situat 35 la distana de +2 deasupra mediei i-i corespunde o ntindere n uniti brute de 10. Mai adugm 1 la 35 i obinem 40; observm c distana total ntre m i 40 este de +3 ntr-o distribuie simetric ideal, aproximativ 3 acoper distana ntre m i cota cea mai mare a distribuiei. n acelai fel procedm n partea stng, adic sub medie. Scdem succesiv 5 din 25, i apoi 5 din 20, i 5 din 15, adic nti -1 apoi -2 i -3 . Deci ntr-o distribuie simetric tipic exist numai aproximativ 3 deasupra mediei i -3 sub medie, ceea ce putem scrie 3 . nseamn c amplitudinea sau ntinderea variaiei - notat cu V - este de aproximativ 6 sau c abaterea standard este a asea parte din V. Abaterea standard devine o unitate de msur pentru ntinderea variaiei. Relaia artat se verific pe msur ce N crete (de exemplu la N = 50, raportul V/ este de cca 4,5, la N = 90, raportul devine 5 etc). S reinem dou idei:
msoar distana la care se afl o cot oarecare n raport cu m , devine unitate de msur pentru V.
n practic, este necesar utilizarea unor registre diferite de variaie. De exemplu n cazul
inteligenei se opereaz n mod curent cu registrul 70-140, ntr-o prob de memorie se obin valori ntre 212, n cazul msurrii timpului de reacie se nregistreaz fraciuni de secund. Se pune problema comparrii i combinrii acestor date heterogene. Soluia este oferit de cotele z.
Cote z O distan, un interval dat n cote brute poate fi exprimat n uniti , mprind distana respectiv (x- m ) cu . n felul acesta avem un punct de referin zero. Lund drept unitate trecem de la cotele brute x la cote transformate z. Aceast nou variabil z se numete variabil standardizat. Cota z: o valoare care ne arat ct se distaneaz, n uniti , o cot brut de media distribuiei respective. Formula de trecere de la variabila brut x la variabila normat sau standardizat z este urmtoarea:
z=
xm
ntr-o distribuie tipic normal, n care exist trei abateri standard deasupra mediei i trei dedesubt, cea mai mare cot z pe care o putem obine este + 3, iar cea mai mic - 3. Amplitudinea cotelor z este ntre + 3 i - 3 trecnd evident prin zero.
Exemplu: Avem un test de inteligen i altul de aptitudine mecanic. Rezultatul final condensat este: 9
Tabelul 3.5.
m
Aptitudinea mecanic Inteligen 100 60
10 6
Transpunerea cotelor brute x n cote z permite compararea lor direct. Cu ajutorul cotelor z avem abaterea unei valori de la medie n termeni de uniti . Odat cu acestea, variabile diferite sunt aduse la un numitor comun, fiind exprimate n aceleai uniti, devin deci comparabile. Media i abaterea standard servesc la interpretarea datelor; semnificaia lor se stabilete n cadrul unor raionamente bine precizate, care vor fi prezentate n Capitolul 4. n ncheiere trebuie s precizm c valorile caracteristice studiate ( m, med , ) nu se determin pentru orice distribuie statistic. Dac distribuia rezultatelor este normal sau aproape normal, se deterin media, dispersia i abaterea standard; dac distribuia este asimetric, se determin mediana. n cazul distribuiilor particulare, n form de i sau j de exemplu, este bine s ne mulumim cu un grafic (P.Fraisse, 1963) i s determinm modul, respectiv frecvena.
4.4. FRECVENA
Alturi de medie i abaterea standard, un indice statistic adesea utilizat este frecvena. ntr-o colecie de date, fiecare element fie c prezint o caracteristic A, fie c nu. Notm cu N efectivul total al unui grup i cu n numrul de elemente care prezint caracteristica A. Frecvena caracteristicii A n lotul studiat este n din N sau n/N, care se mai numete i frecven relativ. Se vorbete, de pild, de frecvena accidentelor de circulaie, clasificndu-le dup diferite criterii, sau de frecvena muncitorilor accidentai ntr-o uzin .a.m.d. De asemenea, cnd se aplic un test se vorbete de frecvena persoanelor care au obinut un anumit rezultat, o cot determinat. Procentajele se obin plecnd de la frecvene conform formulei: n/N x 100. Exemplu (dup Faverge): ntr-o statistic asupra erorilor de la casierie, s-au observat 134 erori n plus i 289 erori n minus. Frecvena f a erorilor n plus este: f = 134/423 = 0,32; (423 = 134 + 289). De reinut: distincia dintre frecvene absolute sau efective - notate, de regul, cu n - i frecvene relative sau proporii, notate cu f. n exemplul de mai sus se poate urmri modul de trecere de la frecvena absolut la cea relativ.
10
4.5. SUMAR
Caracterizarea datelor cuantificate prin scale de interval se realizeaz prin intermediul unui set de indici descriptivi incadrai n dou categorii: indicii tendinei centrale, respectiv ai variabilitii. n prima categorie sunt inclui: media, mediana, respectiv modul. n a doua categorie se pot meniona: dispersia (variana) i abaterea standard. Cotele z permit exprimarea datelor n funcie de medie i abaterea standard i asigur cuantificarea n uniti standard. n cazul scalelor nominale sau ordinale se utilizeaz ca indice descriptiv frecvena. Bibliografie Faverge, J.M. (1965). Mthodes statistiques en psychologie applique. t.I Paris, P.U.F. Jaccard J & Becker, M. (1997). Statistics for the behavioral sciences (third edition), Brooks, Cole Publishing Company, Pacific Grove. Rouanet, H., Le Roux, B., Best, C. (1987). Statistique en sciences humaines: procedures naturelles, Paris, Bordas. Spence, J., Underwood, B.J., Duncan, C.P., Cotton, J.W. (1968). Elementary statistics, New York, Appleton EXERCIII 1. S-a aplicat o prob de memorie unui grup de elevi din coala normal, respectiv unui grup de elevi din coala ajuttoare/ special. Rezultatele obinute de cele dou grupuri sunt prezentate n tabelul de mai jos. Realizai histogramele i calculai media, mediana i modul pentru rezultatele fiecrui grup. Ce se poate spune despre cele dou distribuii din inspecia indicilor calculai? coala normal coala special 8 5 5 6 12 5 7 7 5 6 9 5 9 8 15 5 6 10 9 14 8 5 14 5 9 12
2. n urma administrarii unei probe experimentale pe un grup de subieci a rezultat urmtoarea distribuie a scorurilor: Rezultate 4 5 6 7 8 9 10 11 12 Frecven 2 0 3 4 5 5 6 4 2
11
ntocmii histograma corespunztoare. Calculai media, mediana, modul i abaterea standard. Ce se poate spune despre distribuia rezultat? 3. Datele de mai jos provin de la un eantion extras dintr-o populaie cu media m = 4 i = 1,63: 1 2 2 3 3 3 4 4 4 4 5 5 5 6 6 7 a. reprezentai grafic distribuia dat; b. transformai distribuia dat ntr-o distribuie z. 4. Rezultatele unei lucrri de control prin care s-a ncheiat o experien (exprimate n note) au fost urmtoarele: 5, 7, 10, 4, 7, 7, 3, 9, 8, 6, 7, 8, 7, 4, 9, 10, 7, 5, 7, 6, 9, 6, 8, 6, 9, 8, 3, 7, 8, 5, 7, 6, 8, 7, 6, 8, 7, 6. (N = 38).. a. S se ntocmeasc histograma i poligonul frecvenelor. b. S se calculeze media, mediana, modul pe baza acestor date. NTREBRI CU RSPUNSURI MULTIPLE 1. n ce situaii se folosete preferenial mediana ca aproximare a tendinei centrale? a) cnd numrul de date este redus b) cnd distribuia este asimetric c) cnd media = mediana = modul d) cnd distribuia este simetric e) cnd distribuia este nclinat spre dreapta R. a,b,e 2. Cum este numit distribuia n cadrul creia media = mediana = modul? a) distribuie asimetric b) distribuie normal c) distribuie gaussian d) distribuie n form de I e) distribuie bimodal R. b,c 3. Ce semnificaie are abaterea standard? a) reprezint o unitate de msur standard b) caracterizeaz tendina central a datelor c) reflect n mod standardizat dispersia datelor n jurul mediei d) reflect variana datelor e) reflect valoarea modal a datelor nregistrate R. a,c 12