Sunteți pe pagina 1din 58

Ciprian RULEA

STATISTIC PSIHOLOGIC I PRELUCRAREA INFORMATIZAT A DATELOR

CUPRINS

Capitolul 1. Evolu ia statisticii i obiectul ei de studiu ........................................................ 3 1.1. Evolu ia istoric a statisticii ......................................................................................... 3 1.2. Obiectul de studiu i rolul statisticii............................................................................. 5 1.3. Programe-software utilizate n statistica social .......................................................... 6 1.4. No iuni introductive privind utilizarea programului SPSS ........................................ 11 Capitolul 2. No iuni fundamentale folosite n statistic..................................................... 16 2.1. Colectivitatea i unitatea statistic. ............................................................................ 16 2.2. Variabile statistice. ..................................................................................................... 17 2.3. Cunatificarea i msurarea fenomenelor sociale........................................................ 18 2.4. Scale de msur.......................................................................................................... 19 2.5. Definirea variabilelor statistice cu ajutorul SPSS. ..................................................... 21 Capitolul 3. Ordonarea, gruparea i prezentarea datelor statistice ................................. 23 3.1. Serii (distribu ii) statistice .......................................................................................... 23 3.2. Gruparea (sistematizarea) datelor............................................................................... 25 3.3. Prezentarea datelor sub form de tabele..................................................................... 27 3.4. Reprezentarea grafic a datelor statistice ................................................................... 29 3.5. Utilizarea SPSS pentru gruparea i prezentarea datelor sub form de tabele ............ 33 Capitolul 4. Indicatori ai tendin ei centrale........................................................................ 39 4.1. Mediile ....................................................................................................................... 39 4.2. Quantilele: mediana, quartilele, decilele i centilele.................................................. 41 4.3. Modul ......................................................................................................................... 42 4.4. Rela ia dintre indicatorii tendin ei centrale ................................................................ 42 4.5. Reprezentri de tip Boxplots ...................................................................................... 43 4.6. Utilizarea SPSS pentru calcularea i reprezentarea indicatorilor de pozi ie .............. 43 Capitolul 5. Indicatori ai varia iei i indicatori ai formei.................................................. 47 5.1. Indicatori simpli ai varia iei ....................................................................................... 47 5.2. Indicatori sintetici ai varia iei..................................................................................... 50 5.3. Indicatori ai formei distribu iei .................................................................................. 54 5.4. Utilizarea SPSS pentru calcularea indicatorilor varia iei i ai formei........................ 55

1. EVOLU IA STATISTICII I OBIECTUL EI DE STUDIU


1.1. 1.2. 1.3. 1.4. Evolu ia istoric a statisticii Rolul i scopul statisticii Programe-software utilizate n statistica social No iuni introductive privind utilizarea programului SPSS

1.1. EVOLU IA ISTORIC A STATISTICII Pe msur ce omenirea a evoluat, statistica s-a ndeprtat radical de statutul de ramur a matematicii aplicate, n zilele noastre, fiind considerat att o tiin , o metod de cunoatere a realit ii socioeconomice, ct i o disciplin de nv mnt. Evolu ia ei a cunoscut numeroase modificri, precizri, transformri n ceea ce privete obiectul ei de studiu dar i din perspectiva instrumentelor, metodelor sale de cercetare. Ca i alte tiin e (matematica, de exemplu) i aceast disciplin a parcurs drumul lung i sinuos de la necesit ile practicii la elaborrile teoretice. Lucrri cu caracter statistic, impuse de nevoile conducerii treburilor publice, apar nc din antichitate. n Egipt, Grecia i Roma antic erau realizate recensminte destinate eviden ierii resurselor umane i materiale ale statelor respective. Aceste preocupri ns, au fost considerate naive i pretiin ifice, adevratul n eles al statisticii, acela de tiin , datnd doar de la jumtatea secolului al XVII-lea. Prima analiz statistic, n spirit tiin ific, a unor date culese n prealabil, este datorat lui John Graunt (1662) care, pe baza datelor extrase din ntiin rile sptmnale cu privire la numrul deceselor nregistrate la Londra, a izbutit s trag concluzii valabile asupra unor fenomene sociale, precum: natalitatea i mortalitatea, echilibrul numeric .a. Prin aceste preocupri el este considerat printele demografiei. n Anglia, alturi de Graunt, titlul de inventator al John Graunt (1620 - 1674) statisticii i se atribuie i lui William Petty (1623-1687), comerciant englez, preocupat n timpul liber de care introduce conceptul de aritmetic politic definit fenomenele demografice din Londra, public ca studiul fenomenelor social-economice prin n 1662 articolul Natural and Political Observations on the Bills of Mortality. Ideile intermediul cifrelor, al msurilor i greut ilor. sale au fost preluate de Sir William Petty i de Paralel cu aceste prime preocupri s-a creat, n astronomul Edmond Halley i apoi recunoscute Germania, un curent de gndire care i propunea s de ctre Societatea Regal Englez descrie situa ia diferitelor state constituite la acea vreme din punct de vedere al popula iei, bog iilor, industriei, comer ului i finan elor. Aceast preocupare se apropie mai mult de sensul etimologic al cuvntului statistic: n limba latin status, are sensul de stare sau stat. Astfel unii autori atribuie germanului Gottfried Achenwall (1719-1772) meritul de a fi ntrebuin at pentru prima dat termenul de statistic, dnd ntietate colii descriptive germane. Spre deosebire de coala englez a aritmetice politice, care punea accentul pe colectarea cifrelor i analiza lor, coala descriptiv german era orientat spre alctuirea de monografii i spre compararea calitativ a resurselor statelor. Recunoscnd meritul ambelor curente de gndire, T. Rotariu (1999, p.15) consider c tiin a statistici, aa cum arat ea astzi, datoreaz aproape totul colii engleze, ns contribu ia universitar german nu poate fi neglijat chiar i numai pentru motivul c respectivei coli i datorm numele acestei tiin e. n spiritul acestei coli descriptive, au fost elaborate i n rile romne n secolele XVIII i XIX o serie de lucrri ce au contribuit la dezvoltarea statisticii. Prima i cea mai reprezentativ lucrare de acest gen este

Descriptio Moldaviae (1716) a lui Dimitrie Cantemir (1673-1723), o monografie cu caracter geografic, politic, economic, social i cultural, care l impune pe autorul ei printre fruntaii statisticii descriptive europene (D. Porojan, 1993). i al i cronicari precum Grigore Ureche sau Ion Neculce au avut preocupri asemntoare, iar n 1859, sub domnia lui Alexandru Ioan Cuza, se nfiin eze primul Birou de Statistic al rii Romneti, condus de Dionisie Pop Mar ian (A. Popescu, 2000) nc din secolul al XVII-lea s-a observat c msurtorile repetate ale unui obiect oarecare pot fi reprezentate grafic sub forma unei curbe n form de clopot. Ecua ia curbei normale a fost publicat n 1733 de ctre Abraham de Moivre iar lucrrile acestuia au fost dezvoltate ulterior de Pierre Simon de Laplace i Karl Friedrich Gauss. n zilele noastre curba normal poart numele savantului german: clopotul/curba lui Karl Friedrich Gauss (1777 - 1855) Gauss.
astronom, matematician i fizician german. A fcut descoperiri importante n materie de mecanic celest, electromagnetism, optic. A dezvoltat teoria numerelor. A pus premisele geometriei hiperbolice noneuclidiene

Exemplu: Calificativele ob inute n urma examenului de statistic de 110 studen i, alei aleator. Odat cu progresele fcute n culegerea datelor i cu creterea interesului fa de observa ia i msurtorile tiin ifice, statistica a devenit un instrument indispensabil pentru toate tiin ele sociale. Un nume de referin este cel al francezului Frdric Le Play (1806-1870). Acesta este recunoscut prin introducerea n analiza sociologic a mijloacelor cantitative (T. Rotaru et.al., 1999, p.15). ns, cea mai mare contribu ie n aceast direc ie o are belgianul Adolphe Qutelet (1796-1874), care, la nceputul secolului al XIX-lea, aplic teoria probabilit ilor la studiul fenomenelor sociale, introducnd conceptul de statistic moral. Sub ini iativa sa s-a organizat n 1853 primul Congres Interna ional de Statistic, la care s-a constituit Institutul Interna ional de Statistic. Adevratul nceput al statisticii moderne poate fi fixat la nceputul secolului al XX-lea odat cu apari ia lucrrilor lui Karl Pearson (creatorul statisticii inferen iale sau inductive) i Ronald Aylmer Fisher (a elaborat teoria riguroas a tragerilor concluziilor din datele observate). Alte nume de referin n fundamentarea statisticii sociale sunt: C.E. Spearman, G.U. Yule, M.G. Kendall, A.A. Markov 1.2. OBIECTUL DE STUDIU I ROLUL STATISTICII n dezvoltarea sa statistica s-a preocupat de acele fenomene i procese care se produc ntr-un numr mare de cazuri, denumite fenomene colective (de mas) sau, dac ne referim strict la tiin ele sociale, fenomene 4

sociale de mas. Aceste fenomene de mas se afl sub inciden a legii numerelor mari1 potrivit creia varia iile ntmpltoare de la tendin a general se compenseaz reciproc ntr-un numr mare de cazuri individuale. Aplicarea metodelor statisticii n vederea interpretrii datelor oferite de observarea fenomenelor de mas permite formularea unor legi statistice. Acestea exprim media strilor unei mase de evenimente, tendin a dominant care-i face loc printr-un mare numr de abateri ntmpltoare de la aceast medie. Legea statistic poate fi eviden iat numai dac este supus observrii unui numr suficient de mare de elemente ale ansamblului de studiat (legea numerelor mari). n concluzie, statistica studiaz aspectele cantitative ale fenomenelor de mas, fenomene care sunt supuse ac iunii legilor statistice i care se manifest n condi ii concrete, variabile n timp i spa iu. ncercnd o defini ie sintetic, putem afirma c statistica reprezint un ansamblu de metode i tehnici utilizate pentru a colecta, a descrie i a analiza date ob inute n urma unor investiga ii tiin ifice.
CASETA 1.1. EXIST SAU NU EXIST STATISTIC SOCIAL (sursa: T. Rotariu et.al., 1999, pp. 21-22)
nu exist dect o tiin numit pe scurt Statistic (sau Statistic general sau Statistic teoretic sau Teorie a statisticii) , n rest, e vorba de subramuri sau capitole ale unor tiin e particulare (empirice) care utilizeaz instrumentul statistic. Astfel, avem dubii serioase asupra temeiniciei preten iei de a sus ine existen a unor domenii statistice de sine stttoare i, cu att mai mult, de a crede c pot fi pregti i statisticieni astfel profila i. Aplicarea statisticii ntr-un domeniu social, adic utilizarea instrumentelor statistice n scopul de a produce cunotin e n respectivul domeniu, nu se poate face dect de ctre cineva care stpnete bine cunotin ele din acel cmp social. Aa cum statistica se aplic n biologie ori n fizic doar de ctre biologi, respectiv fizicieni, tot aa ar trebui s se petreac lucrurile i n tiin ele sociale. Eventual, statisticianul (adic cel care stpnete cunotin e din domeniul statistici generale) poate colabora cu un economist, sociolog, psiholog etc. Dar, desigur, mult mai simplu i mai productiv este ca, n aceste discipline, specialiti s fie pregti i s n eleag i s aplice ct mai corect instrumentele statistice.

Statistica a ptruns n toate domeniile tiin elor naturii i ale tiin elor sociale, formnd discipline de grani precum statistica matematic, statistica fizic, statistica economic, statistica social, biostatistica etc. Dintre acestea, aa-zisa statistic social se suprapune mult timp i n mare msur peste statistica teoretic general, propunndu-i s culeag, prelucreze i s interpreteze informa iile numerice referitoare la fenomenele sociale2. Chiar dac vom folosi de multe ori termenul de statistic social, nu considerm justificat preten ia unora de a considera statistica social ca o tiin de sine stttoare ci, mai degrab ca o disciplin preocupat de a ilustra modul specific n care statistica general se aplic n domeniul social (vezi caseta 1.1.). Astfel, statistica reprezentnd un corp de metode tiin ifice are rolul de a ne nv a cum s organizm observarea fenomenelor de mas i s ob inem datele necesare, cum s prelucrm aceste date i cum s formulm ipoteze cu privire la rela iile eviden iate de aceste date. De asemenea, statistica ofer metode pentru testarea ipotezelor i pentru confruntarea realit ii cu predic iile formulate pe baza ipotezelor. n urma dezvoltrii istorice prezentate mai sus statistica modern s-a separat n dou pr i distincte dar complementare: a) statistica descriptiv, se refer la regulile observrii statistice directe i la ob inerea informa iilor ce rezult din prelucrarea datelor empirice. Aici sunt incluse mijloacele clasice ale statisticii: gruparea datelor, distribu iile de frecven e, corela ia i regresia, analiza rela iilor dinamice.
1

Legea numerelor mari a fost formulat de J. Bernoulli n 1713, preciznd c ntr-un numr suficient de mare de cazuri individuale, influen ele factorilor se pot compensa n aa fel nct s se ajung la o anumit valoare tipic pentru ntreaga colectivitate. 2 pentru mai mute informa ii vezi T. Rotariu et.al., 1999, pp. 15-18.

b) statistica inductiv (inferen a statistic), se refer la organizarea observrii statistice indirecte, prin metode i tehnici de estimare a nsuirilor unei popula ii statistice din observa ii efectuate asupra unei submul imi de unit i statistice, numit eantion. Include aplica ii statistice ale teoriei probabilit ii. 1.3. PROGRAME-SOFTWARE UTILIZATE N STATISTICA SOCIAL Cele mai cunoscute programe utilizate de cercettorii din sociologie, economie, psihologie, asisten social, pedagogie etc. atunci cnd realizeaz prelucrri statistice complexe sunt: SPSS, SYSTAT, STATISTICA, MINITAB .a. Vom descrie pe scurt dou din aceste software-uri i vom prezenta no iunile de baz necesare utilizrii unuia dintre ele (SPSS). * SPSS (Statistical Package for the Social Sciences) Statistical Package for the Social Sciences (pe scurt, SPSS) este un produs al firmei americane SPSS Inc., destinat gestionrii i analizei statistice a datelor. Firma SPSS este binecunoscut n ntreaga lume. Avnd 1.200 de angaja i n 60 de ri, ea s-a impus n domeniul realizrii de soft pentru prelucrarea statistic a datelor prin dou produse: SPSS i SYSTAT. Versiunile pentru Windows ale ambelor pachete de programe au aprut la nceputul anilor 90. Ultima versiune pentru Windows, SPSS 14.0, lansat n septembrie 2005, ofer o foarte mare varietate de prelucrri statistice, de la cele mai des folosite n practic (statistici descriptive, teste statistice) i pn la cele care pretind cunotin e statistice avansate (modele liniare generale, analiza MANOVA etc.). Vizualizarea datelor este posibil prin tabele cu una, dou sau trei dimensiuni i prin diverse reprezentri grafice, n plan i n spa iul tridimensional. Prima variant a produsului SPSS a fost elaborat n urm cu aproape 40 de ani. De atunci, fiecare dintre marile schimbri care au avut loc n lumea calculatoarelor a fost urmat, la scurt vreme, de apari ia unei noi versiuni. Iat cum este caracterizat pe scurt acest produs, n scop de reclam, de ctre cei care l comercializeaz: Suple e n stabilirea condi iilor de prelucrare a datelor; Prezentare sugestiv a rezultatelor, n tabele i grafice; Solu ionarea problemelor complexe prin metode statistice avansate; Simplitate n manevrare. Acest produs, SPSS for Windows se adreseaz tuturor celor care au de efectuat calcule statistice, indiferent de domeniul n care i desfoar activitatea (sociologie, psihologie, pedagogie, asisten social, urmrirea produc iei i a vnzrilor, marketing, cercetare tiin ific etc.). Dintre cei care folosesc produsul SPSS la ora actual, jumtate lucreaz n industrie i afaceri, peste o treime n cercetare i nv mnt, iar majoritatea celorlal i n institu ii guvernamentale. Acest produs mbin facilit ile oferite de programe cunoscute, cum sunt Excel i Quattro Pro, pentru condensarea datelor n tabele i pentru reprezentri grafice, cu posibilit ile de prelucrare statistic mai mult sau mai pu in sofisticat, n func ie de complexitatea problemelor de rezolvat. Unele metode de calcul aplicate de SPSS/Windows nu sunt accesibile n alte programe de analiz statistic, precum BMDP, SYSTAT sau STATISTICA. SPSS for Windows este realizat sub form modular. n consecin , fiecare utilizator are libertatea de a achizi iona doar acele componente care i sunt necesare. Prezentm n continuare cteva dintre modulele, cu denumirea sub care sunt comercializate. Base module realizeaz gestionarea datelor i a fiierelor, transformarea datelor, diverse reprezentri grafice (histograme, diagrame de structur, nori statistici etc.), precum i prelucrrile statistice cele mai cunoscute i mai frecvent utilizate: calculul frecven elor, al indicilor tendin ei centrale i al indicatorilor variabilit ii;

Sursa acestui material este http://www.spss.com. La aceeai adresa pot fi gsite i alte informa ii interesante.

calculul unor msuri de asociere i testarea independentei probabilistice pentru date incluse n tabele de contingen ; compararea mediilor i a dispersiilor eantioanelor; analiz de varian unifactorial; calculul coeficien ilor de corela ie Pearson, Kendall i Spearman; analiza de regresie liniar; teste neparametrice. Modulul Professional Statistics include proceduri care servesc la cercetarea rela iilor dintre variabile, prin urmtoarele metode: analiz de discriminant; analiz factorial; analiz de clusteri; scalarea multidimensional; regresia ponderat; analiza fidelit ii. Advanced Statistics permite efectuarea unor prelucrri statistice complicate, necesare atunci cnd datele nu ndeplinesc condi iile de aplicare a prelucrrilor statistice obinuite (mai simple). Asemenea metode sunt: analiz de regresie logistic; diverse extinderi ale analizei de variant unifactorial ANOVA; analiz de variant multivariat MANOVA; analiz logliniar; analiz de regresie neliniar. Tables servete la condensarea datelor n tabele cu una, dou sau trei dimensiuni. Fiecare dimensiune este definit printr-o variabil sau printr-un grup de variabile (de exemplu, pe linii se poate reprezenta profesia i sexul subiec ilor, iar pe coloane, rspunsurile posibile la un item dintr-un chestionar). Tabelele pot con ine, alturi de valorile variabilelor, frecven e i valori ale unor indicatori statistici (media, abaterea standard etc.). Exact Tests determin nivelul de semnifica ie (valorile p) pentru: teste neparametrice aplicate la un eantion, la dou eantioane indepen-dente sau perechi i la k eantioane dependente sau independente; teste aplicate tabelelor de contingen 2x2 i rxc; teste de semnifica ie pentru coeficien ii de corela ie Pearson i Spearman; teste referitoare la rela iile dintre variabile msurate pe scal nominal sau pe scala ordinal. Acest modul calculeaz valori exacte pentru nivelurile de semnifica ie ale statisticilor, spre deosebire de modulul de baz, care calculeaz doar valori asimptotice. Este foarte dificil de descris, n cteva cuvinte, un produs complex, cum este SPSS. Vom ncerca s enumerm doar cteva dintre caracteristicile care l fac att de cutat pe pia . Diversitatea mare a condi iilor de prelucrare Orice prelucrare se poate face n condi ii extrem de variate. Spre exemplu, calculul frecven elor poate fi nso it sau nu de afiarea tabelului de frecven e, de reprezentarea grafic prin histogram sau prin diagram n coloane, de calculul unor indici statistici cum ar fi cuantile, indici ai tendin ei centrale (media, mediana, modul), parametri de mprtiere (dispersia, valoarea minim i maxim); reprezentarea grafic poate lua n considerare frecven ele absolute ale valorilor sau procentele; peste histogram se poate sau nu suprapune curba normal. Uurin n nv are, uurin n prelucrare Utilizatorul nu are nevoie s citeasc un manual pentru a ti cum s comande o prelucrare. Op iunea Help este accesibil permanent i i poate explica semnifica ia diverilor termeni din meniuri i csu e de dialog. n plus, un program tutorial on-line ofer explica ii i exemple care ajut la orientarea rapid printre prelucrrile numeroase care pot fi realizate de acest produs.

Sursa: M., Albu i V., Rusu SPSS / Windows 7.0. PC Report, pag. 51-53, 1996

SPSS poate fi folosit i de persoane pu in ini iate n statistic. Pentru orice no iune, dintr-o csu de dialog sau chiar dintr-o list de ieire, se ob ine afiarea unui text explicativ dac se indic denumirea respectiv, pe ecran, cu mouse-ul i se alege din meniul care apare, op iunea Whats This? Cu SPSS se pot chiar reactualiza i completa cunotin ele de statistic, ntruct butonul Help permite accesul la un glosar de termeni statistici. Simplitate n manevrarea datelor de intrare Introducerea i modificarea datelor este o opera ie simpl, datorit existen ei unui editor gen spreadsheet. Pe ecran este afiat un tabel, ale crui linii corespund cazurilor (subiec i care rspund unui chestionar sau obiecte observate) i n ale crui coloane figureaz variabilele (rspunsuri date de subiec i ori rezultatele unor msurtori sau observa ii). Utilizatorul poate naviga prin acest tabel, dup dorin , inspectnd valorile existente, schimbnd unele date, adugnd sau tergnd cazuri i variabile. SPSS adapteaz automat dimensiunile tabelului astfel nct s nu se piard nici o valoare introdus. Nu exist limitri n privin a numrului de cazuri sau de variabile care pot fi incluse n fiier. Comunicarea bidirec ional cu alte programe Datele prelucrate de SPSS pot fi preluate i din fiiere provenind din alte programe, cum sunt: tabele create de Lotus 1-2-3 i Excel, baze de date create de dBase, fiiere de date salvate n format SYLK (symbolic link), fiiere de text ASCII. De asemenea, fiierele de date create de SPSS pot fi exportate n Lotus 1-2-3 i Excel sau pot fi salvate n format SYLK ori ca fiiere de text ASCII. Transformarea automat a datelor de intrare nainte de efectuarea prelucrrilor statistice, datele pot fi modificate automat de ctre SPSS, pe baza unor algoritmi indica i de utilizator pentru recodificarea valorilor sau prin aplicarea unor func ii matematice. De exemplu, ntr-un fiier n care cazurile sunt reprezentate de diverse mrfuri iar variabilele de caracteristici ale acestora, toate preturile pot fi schimbate prin adugarea TVA-ului sau toate mrfurile produse nainte de 1995 pot primi o aceeai valoare a datei de fabrica ie care s semnifice nainte de 1995. Selectarea cazurilor prelucrate Utilizatorul poate alege cazurile care s fie luate n considerare la efectuarea prelucrrilor, formulnd condi ii asupra valorilor uneia sau a mai multor variabile. De exemplu, n studiul rela iei dintre nivelul de colarizare i preferin a pentru diverse genuri muzicale pot fi incluse, din ntregul fiier de date, doar persoanele domiciliate n mediu urban. Tratarea special a datelor necunoscute Utilizatorul poate decide cum s fie tratate de SPSS cazurile n care valoarea unei variabile nu este cunoscut sau nu prezint interes pentru cercetare. Ele pot s fie sau s nu fie incluse n calcule. Eviden ierea excep iilor Grafice diverse permit depistarea rapid a valorilor aberante. Acestea sunt valori izolate, diferite mult de celelalte din fiier, care ar putea fi datorate unor erori la introducerea datelor. Controlul asupra afirii informa iilor Utilizatorul are controlul deplin asupra tuturor variabilelor prelucrate. El decide cum s se afieze valorile n listele de ieire (pe ce lungime, cu cte cifre zecimale) i ce text s fie scris n locul denumirilor de variabile (dac acestea nu sunt destul de sugestive) sau n locul valorilor variabilelor (dac n fiierul de date s-au introdus coduri). De exemplu, dac pentru variabila corespunztoare mediului de domiciliu al subiec ilor, cu denumirea MEDDOM, s-au introdus n fiier valorile U i R, n listele de ieire poate s apar scris Urban n loc de U i Rural n loc de R, iar numele variabilei s fie nlocuit cu textul Mediu de domiciliu. Simplitate n selectarea op iunilor Alegerea modului de prelucrare a datelor este deosebit de simpl, datorit meniurilor i a cutiilor de dialog la care se ajunge prin manevrarea mouse-ului. Pentru utilizatorii crora nu le place s foloseasc mausul, exist posibilitatea de a indica prelucrrile dorite prin scrierea de comenzi.SPSS nu uit ce-a fcut Dac un grup de prelucrri se efectueaz periodic (de exemplu, dac intereseaz situa ia zilnic a vnzrilor pe magazine i produse) nu este nevoie s se repete de fiecare dat ntreaga succesiune de cutri prin meniuri i de alegeri de op iuni. I se poate cere SPSS-ului s nregistreze ntr-un fiier de comenzi toate 8

aceste opera ii, executate de utilizator o singur dat. Fiierul va fi rulat ori de cte ori este necesar. La nevoie, fiierul poate fi modificat, adugndu-se sau tergndu-se comenzi. tiind c o imagine face mai mult dect un discurs... Rezultatele prelucrrilor statistice se pot vizualiza prin tabele de diverse formate (sunt posibile 16 stiluri de ntocmire a tabelelor) i prin multe tipuri de reprezentri grafice: histograme, diagrame n coloane izolate sau grupate, diagrame de structur circulare, nori statistici n care punctele corespunztoare unor grupe diferite de cazuri sunt colorate diferit, diagrame care indic n acelai timp media, valorile extreme i reparti ia valorilor unei variabile pentru valori diferite ale altei variabile (de exemplu, reprezentarea grafic a vrstei persoanelor, n func ie de localitatea de domiciliu). Chiar i rezultatele pot fi modificate Listele de rezultate, tabelele i graficele realizate de SPSS pot fi incluse n rapoarte, aa cum se prezint pe ecran sau modificate. Utilizatorul poate interveni n ele prin: editarea de text; schimbarea caracteristicilor fontului (tip, stil, culoare, mrime); modificarea desenelor prin deplasarea axelor, rotirea lor sau chiar schim-barea tipului de grafic; ascunderea unor variabile din tabele; reorganizarea informa iilor din tabele (de exemplu, un tabel de frecvente, care con ine pe linii rspunsurile la un chestionar, iar pe coloane localitatea de domiciliu si, n cadrul fiecrei localit i, sexul clien ilor, poate fi transformat ntr-un tabel cu numai dou coloane, corespunztor sexului i cu grupe de linii, cte o grup pentru fiecare localitate). Toate aceste opera ii sunt uor de executat, datorit existentei a trei editoare: de text, de tabele i de grafice. Spre exemplu, schimbarea locului unei coloane dintr-un tabel se face trgnd cu mouse-ul de iconi a corespunztoare ei. STATISTICA for Windows Este un sistem accesibil, integrat pentru analiza statistic i grafic de date; con ine proceduri analitice avansate pentru tiin ele socio-umane, inginerie, domeniul financiar i aplica ii de explorare a datelor. Sistemul con ine, pe lng procedurile de uz general, implementri de module specializate - ns accesibile pentru tiin e sociale, cercetri biomedicale sau inginerie. Posibilit ile oferite de STATISTICA ncurajeaz abordarea de ci noi i creative de verificare a ipotezelor i explorare a datelor experimentale. Facilit i unice de analiz cantitativ: vitez de calcul suport analize pe colec ii imense de date (matrice 32.000 x 32.000 variabile), analiz de coresponden e sau estimare nelinear pe colec ii nelimitate, proiectare experimental cu pn la 128 factori... precizie a opera iilor numerice sute de teste, metode i proceduri incluse ntr-un singur sistem sute de tipuri de grafice sau reprezentri de complexitate nelimitat, accesibile interactiv sau programabile prin limbajul inclus Statistica Basic interfa a utilizator flexibil, cu facilita i de simplificare prin shortcut-uri sau macrocomenzi, wizard-uri, SCL. Transferul de date se face n toate formatele standard, incluznd i accesul la baze de date ODBC. Quick STATISTICA for Windows Este un subset care con ine toate procedurile grafice ale pachetului Statistica, procedurile de organizare a datelor i o selec ie bogat de statistici: statistic descriptiv, frecven e, ntreruperi (breakdown), tabele, corelri, teste de diferen de grup, ANOVA, regresii, distribu ii, nonparametrice, probabilita i. Se livreaz ca baz pentru pachetele aplicative. STATISTICA Industrial System (add-on) Este un set de module complementare (pachetului Statistica sau Quick Statistica), ce furnizeaz cea mai larga selec ie de statistici industriale oferite ntr-un singur pachet. Printre acestea se afl diagrame de control al calit ii configurabile, cu op iuni de achizi ie de date n timp real, planuri de eantionare i o selec ie de metode de proiectare experimental.

Daca ave i o versiune anterioar de STATISTICA, ultimele facilit i se pot lua direct de la website-ul StatSoft. Celelalte produse curente sunt: STATISTICA Neural Networks i STATISTICA Connectivity Kit Lansarea STATISTICA Connectivity Kit coincide cu lansarea noului modul Interactive Quality Control care va oferi op iuni analitice avansate speciale i configurabilitate ce permite suportul unei mari variet i de aplica ii shop-floor. Modulul Interactive Quality Control va merge mult mai repede cu Connectivity Kit (dup ultimele clasamente) dect actualul modul Quality Control. Noul modul Interactive QC nu e o nlocuire pentru actualul modul QC (pe care continum s-l vindem din cauza compatibilit ii i pentru c noul modul Interactive QC nu suport toate tipurile de charting posibile n modulul QC). Firma StatSoft - unul dintre cei mai mari productori de software pentru statistic i grafic analitic din lume, prezint lunar un buletin informativ con innd ultimele nout i despre Statistica.3 1.4. NO IUNI INTRODUCTIVE PRIVIND UTILIZAREA PROGRAMULUI SPSS n capitolele aplicative ne vom referi la programul SPSS versiunea 11.0 sub sistemul de operare Windows.4 Aceste capitole se vor a constitui un ghid de laborator care s-l orienteze i ndrume pe utilizator n dorin a acestuia de a-i nsui procedurile i tehnicile oferite de programul SPSS pentru prelucrarea statistic a datelor. Deschiderea programului Pentru pornirea unei sesiuni de lucru n SPSS exist urmtoarele posibilit i: Daca pe desktop se afl shortcut-ul (icon-ul) SPSS se pozi ioneaz cursorul pe respectivul icon i se tasteaz dublu-clik pe butonul stnga al mouse-ului.

Dublu-clik pe butonul stnga al mouse-ului

Dup ce sistemul de operare Windows a fost ncrcat, se apas o singur dat pe butonul stnga al mouse-ului pe urmtorul traseu: Start Programs SPSS for Windows SPSS 11.0 for Windows Dup deschiderea programului SPSS, pe ecran va aprea o fereastr de ntmpinare. Este de fapt o fereastr de date (Data View) din cadrul editorului de date (SPSS Data Editor), fr titlu - denumit totui Untitled - i, aten ie!, fr s fie salvat n memoria calculatorului. O a treia posibilitate de deschidere a SPSS-ului o reprezint accesarea (prin dublu-clik) a oricrui fiier acceptat de program. Exemple: bazele de date n SPSS sunt fiiere cu extensia *.sav; fiierele de tip syntax au extensia *.sps; fiierele de tip output au extensia *.spo etc. Ferestrele n SPSS SPSS folosete mai multe tipuri de ferestre, fiecreia dintre ele fiindu-i asociat un anumit tip de fiier. Iat cele mai importante dintre ele:
3 4

Pentru mai multe informa ii a se accesa: http://www.statsoftinc.com Unele dintre informa iile prezentate nu sunt integrate n versiunile mai vechi (de exemplu, versiunea 7.0) i sunt diferite sub alte sisteme de operare sau pentru sistemele Macintosh.

10

Fereastra de editare a datelor (Date Editor) se deschide implicit la lansa-rea unui fiier de tip baz de date, fiier care n SPSS are extensia *.sav. n aceast fereastr sunt introduse i afiate datele de lucru sub forma unui tabel n care liniile reprezint cazurile (subiec ii) iar coloanele variabilele cercetrii. Fereastra de editare este, la rndul ei, compus din dou foi (ferestre): - fereastra de date (Data View), folosit pentru introducerea i vizualizarea seriilor statistice simple (a datelor brute) vezi figura 1.1. - fereastra de gestionare a variabilelor (Variable View), folosit pentru definirea i modificarea variabilelor vezi figura 1.2. Accesarea uneia dintre aceste dou ferestre se realizeaz prin ac ionarea icon-ului corespunztor din partea stng-jos a ferestrei de ntmpinare.
Fereastr pentru introducerea datelor (Editor de celule)

Bar de titlu

Bar de meniuri

Bara de instrumente Variabile (variables) cazuri (cases) Bara de derulare (defilare) celule (cells)

Figura 1.1. Fereastra de ntmpinare a programului SPSS Fereastra de gestionare a rezultatelor sau Fereastra de ieire (Output SPSS Viewer), folosit pentru afiarea i editarea rezultatelor prelucrrilor statistice (tabele, grafice, indicatori statistici) vezi figura 1.3. Fereastra Output Viewer este structurat n dou cadrane sau zone: cadranul din stnga cuprinsul prezint sub forma unei schi e obiectele con inute n fereastr i cadranul/zona din dreapta con inutul n care sunt afiate rezultatele ob inute prin respectiva analiz. Pentru apari ia acestei ferestre ntlnim urmtoarele situa ii: - SPPS deschide automat aceast fereastr atunci cnd este solicitat s fac prelucrri i analize statistice (Aten ie: fiierul astfel format va avea denumirea OUTPUTx i nu este salvat n memoria calculatorului; pentru aceasta trebuie parcurs traseul File - Save sau File - SaveAs); - este deschis de ctre utilizator prin accesarea unuia dintre fiierele cu extensia *.spo salvate anterior n memoria calculatorului.

11

Figura 1.2. Fereastra de gestionare a variabilelor

Figura 1.3. Fereastra de gestionare a rezultatelor Fereastra de editare a comenzilor (Syntax Editor) permite scrierea comenzilor de ctre utilizator i salvarea acestora ntr-un fiier de tip sintax cu extensia *.sps. Variantele recente ale SPSS con in meniuri pull-down i casete de dialog care permit lansarea comenzilor fr a scrie sintaxa acestora. Crearea sau deschiderea unei baze de date. Salvarea i modificarea numelui ei. n situa ia n care dorim s deschidem fiiere de date salvate anterior, pentru a le completa i/sau modifica, sau cnd dorim s avem acces la baze de date gata create, se parcurge urmtorul traseu:

Fil 12

e Open Data

Mai simplu, se poate face clik pe icon-ul <Open File> din Bara de instrumente. n fereastra care va aprea (figura 1.4.) se va preciza calea, tipul i numele fiierului ce dorim s-l deschidem. Figura 1.4. Fereastra de deschidere a unui fiier de date i mai simplu, se poate face dublu-clik pe shortcut-ul corespunztor fiierului ce trebuie deschis Pentru gestionarea optim a fiierelor utilizate se impune salvarea acestora cu nume ct mai sugestive pentru a putea fi recunoscute cu uurin . Salvarea fiierelor de orice fel n SPSS se face dup urmtorul traseu: File Save. Mai simplu, se poate face clik pe icon-ul <Save File> din Bara de instrumente. Dac se dorete salvarea unui fiier cu alt nume se parcurge traseul urmtor: File Save As. n fereastra care va aprea (figura 1.5.) se va preciza calea, tipul i noul nume al fiierului ce dorim s-l salvm.

Figura 1.5. Fereastra de salvare a unui fiier de date EXERCI


II I PROBLEME

1. Dup ce a i creat n My Documents un director (folder) cu numele Laborator statistica realiza i n interiorul lui urmtoarele cerin e: - crea i un fiier de date n SPSS; - salva i fiierul cu numele Laborator 1 i prsi i SPSS; - redeschide i fiierul Laborator 1 cuta i mai multe ci pentru aceasta; - face i modificri n interiorul lui i salva i-l cu numele Laborator 2 fr s afecta i fiierul anterior. 2. n folderul Laborator statistica crea i un fiier de date n Excel (extensia *.xls) cu numele Baza de date in Excel i care s con in ini ialele i vrsta a 10 subiec i. Prsi i programul Excel i deschide i programul SPSS. Deschide i fiierul Baza de date in Excel n SPSS i salva i-l cu numele: Baza de date in SPSS. 3. S se solicite Ajutor (Help) programului pentru deschiderea unui fiier de date n SPSS i pentru deschiderea unei baze de date create cu programul Excel. Care sunt tipurile de fiiere de date pe care le putem deschide n SPSS? Care sunt regulile transferului datelor din Excel n SPSS?

13

2. NO IUNI FUNDAMENTALE FOLOSITE N STATISTIC


2.1. 2.2. 2.3. 2.4. 2.5. Colectivitatea i unitatea statistic. Variabile statistice. Cunatificarea i msurarea fenomenelor sociale. Scale de msur. Definirea variabilelor statistice cu ajutorul SPSS.

Statistica aplicat n tiin ele sociale are la baz principiile, tehnicile i metodele avansate de statistica teoretic general. Aceasta din urm, folosete un numr mare de no iuni i concepte, cu caracter general, care formeaz vocabularul de baz al statisticii. n statistica social, s-au ncet enit de-a lungul timpului, urmtoarele concepte fundamentale: COLECTIVITATEA (POPULA IA) STATISTIC reprezint totalitatea elementelor simple sau complexe supuse studiului statistic. (exemple: elevii unei coli, popula ia unui ora) UNITATEA STATISTIC (INDIVIDUL STATISTIC) reprezint elementele componente (constitutive) ale colectivit ilor statistice. Ele pot fi: - simple (exemple: elevul, studentul, muncitorul); - complexe, acestea sunt rezultatul organizrii sociale i economice a colectivit ii (exemple: familia, echipa, clasa de elevi, grupa de studen i). CARACTERISTICA (VARIABILA) STATISTIC reprezint nsuirile sau trsturile ce definesc i delimiteaz unit ile statistice (exemple: vrsta, notele colare) VALOAREA (VARIANTA), notat cu x, y reprezint forma concret de manifestare a caracteristicilor la nivelul fiecrei unit i statistice (exemple: 18 ani, nota 7). FRECVEN A ABSOLUT, notat cu fx, fy reprezint numrul de unit i la care se nregistreaz aceeai variant (exemple: 12 elevii au 18 ani, 3 studen i au ob inut nota 7). FRECVEN A RELATIV (PONDEREA), notat cu frx, fry se ob ine prin ponderarea frecven ei absolute, altfel spus, reprezint procentul unei frecven e absolute din totalul frecven elor. (exemplu: din 48 de elevii ai unei clase 12 au vrsta de 18 ani, deci ponderea acestora este de 25%) INDICATORII STATISTICI reprezint expresia numeric a unor determinri obiective ce rezult dintr-o cercetare statistic (exemple: media, mediana, abaterea standard). 2.1. COLECTIVITATEA (POPULA IA) I UNITATEA STATISTIC Dup cum am specificat n primul capitol (vezi subcapitolul 1.2.) statistica este preocupat de studierea fenomenelor de mas, a acelor ansambluri finite de elemente care sunt, n mod esen ial, de aceeai natur calitativ, apar in aceluiai teritoriu i aceluiai timp, altfel spus, sunt statistic omogene. (E. Jaba & A. Grama, 2004) Aceste ansambluri sunt cunoscute sub denumirea de colectivit i, popula ii, mul imi. COLECTIVITATEA STATISTIC (POPULA IA STATISTIC) reprezint totalitatea elementelor simple sau complexe supuse studiului statistic. n func ie de natura elementelor componente, colectivit ile statistice pot fi formate din ansambluri de fiin e, de obiecte sau de evenimente Exemple: - elevii unei coli, popula ia unui ora, - numerele unui anumit ziar aprute ntr-o lun de zile, - accidentele rutiere comise pe raza unui jude , - opiniile electorale nregistrate ntr-un sondaj.

Dup numrul elementelor componente, colectivit ile statistice pot fi totale sau par iale. Primele cuprind totalitatea elementelor componente, n timp ce colectivit ile par iale, cunoscute sub denumirea de eantioane, cuprind un numr reprezentativ de unit i extrase dintr-o colectivitatea total. Din acest punct de vedere ntlnim cercetri exhaustive - n cazul popula iilor statistice totale - i cercetri selective ce folosesc proceduri de selec ie a indivizilor ce vor inclui n eantion. Problema ce apare atunci cnd apelm la studii selective este aceea de a evalua ncrederea pe care putem s o acordm valorilor calculate n cadrul unui eantion ca reprezentnd valori similare pe popula ia ntreag, sau, altfel spus, de a aplica teste de semnifica ie. Mai mult, aceast evaluare se face diferit pentru eantioane mici (sub 30 de indivizi) fa de cele considerate eantioane mari. Semnalm faptul c aceast problem nu apare deci, nu se folosesc teste de semnifica ie n cazul cercetrilor exhaustive (T. Rotaru et.al., 1999). UNITATEA STATISTIC (INDIVIDUL STATISTIC) reprezint elementele componente (constitutive) ale colectivit ilor statistice. Ele pot fi fiin e, lucruri, precum i fapte, evenimente referitoare la acestea. Dup gradul de complexitate se clasific n: - simple, formate dintr-un singur individ (exemple: elevul, studentul, angajatul); - complexe, acestea sunt rezultatul organizrii sociale i economice a colectivit ii (exemple: familia, departamentul, clasa de elevi, grupa de studen i). Dei, att termenul de individ ct i cel de popula ie statistic ne duc cu gndul la natura uman a lucrurilor, exemplele de mai sus pot fi completate cu unit i statistice referitoare la lucruri (piesele unui lot supus controlului de calitate) sau la ac iunea omului asupra lucrurilor (msurarea repetat a unui acelai obiect, aruncarea zarului). 2.2. VARIABILE STATISTICE VARIABILELE STATISTICE (CARACTERISTICILE STATISTICE) reprezint nsuirile ce definesc i delimiteaz unit ile statistice. Ele exprim trsturile esen iale purtate de unit ile statistice ale unei colectivit i, adic dimensiunile prin care se observ, se cuantific, se msoar i nregistreaz fiecare unitate din colectivitate. Popula iile umane, cele mai des ntlnite n studiile sociale, pot fi caracterizate, de exemplu, prin urmtoarele variabile: sex, vrst, nivel de colarizare, coeficient de inteligen , tip temperamental .a. Valorile unei variabile statistice se mai numesc variante sau atribute ale variabilei i se ob in prin ac iuni concrete de cuantificare i msurare a unit ilor unei colectivit i statistice. De exemplu, variabila mediul de provenien are ca variante: urban i rural; iar variabila notele la examenul de statistic are ca valori numerele ntregi de la 1 la 10. Caracteristicile statistice au proprietatea de a-i modifica nsuirile n timp i spa iu, de la o unitate la alta, n func ie de influen ele exercitate de o multitudine de factori esen iali i ntmpltori care ac ioneaz la nivelul fiecrei unit i din colectivitate. Aceast proprietate d variabilelor statistice caracterul de variabil aleatorie. n practica de cercetare sunt luate n considerare numai acele variabile care prezint cel pu in dou valori. Dac, dup o anumit caracteristic toate unit ile ar fi identice, aceasta nu ar mai necesita nici un fel de analiz, nemaifiind nevoie s se investigheze cum se manifest indivizii statistici i care sunt cauzele acestei varia ii. S presupunem c to i studen ii ar ob ine nota 10 la disciplina statistic social; nu ar avea nici o relevan s verificm dac exist o legtur ntre aceste note i mediile acelorai studen i la examenul de bacalaureat! Aadar, cu ct o variabil mbrac forme mai diverse, cu att ea capt o valoare de cunoatere mai mare. Numai diversitatea formelor de manifestare a unei nsuiri i confer acesteia un interes din partea cercettorului. (T. Rotaru et.al., 1999) Dup modul de exprimare, variabilele statistice se clasific n: o variabile cantitative sau numerice, exprimate prin numere stabilite prin numrare/msurare direct sau calcule ulterioare. Numrul stabilit este un numr

15

cardinal ce red intensitatea cu care se manifest nsuirea respectiv n cazul individului respectiv. La rndul lor, variabilele cantitative se clasific dup natura varia iei n: - variabile discrete, cu varia ie discontinu, care pot lua numai valori ntregi, de regul, pozitive. Exemple: numrul de membrii din gospodrie, numrul cuvintelor memorate la o prob de memorie. - variabile continue, cu varia ie continu, care pot lua orice valoare ntr-un interval dat. Exemple: mediile colare anuale, venitul lunar. o variabile calitative, numite i variabile atributive, categoriale, nominale, sunt caracteristici ale cror variante de manifestare sunt exprimate atributiv, prin cuvinte. Exemple: sexul, mediul de provenien , tipul temperamental. Dup natura lor, variabilele statistice pot fi: - variabile de timp, desemneaz apartenen unit ilor la un anumit moment sau interval de timp. - variabile de spa iu, exprim teritoriul cruia i apar in i se manifest unit ile colectivit ii. (A. Popescu, 2000) Dup modul de ob inere, distingem - variabile primare, ob inute prin nregistrare direct. Exemplu: notele ob inute de studen i la fiecare disciplin de studiu. - variabile derivate, rezultate n urma unor calcule ulterioare. Exemplu: mediile anuale ob inute de studen i n fiecare an de studiu. Atragem aten ia c ntr-un studiu statistic sunt re inute numai acele caracteristici care prezint interes pentru cercetarea ntreprins. Pot fi zeci, chiar sute de variabile ce pot caracteriza indivizii unei popula ii statistice. De mult ori ne limitm la a analiza doar cteva dintre ele. De asemenea, tot cercettorul este cel care stabilete, uneori, modul de exprimare i/sau natura varia iei unei variabile. O variabil cantitativ poate fi exprimat calitativ, dup cum i o variabil cantitativ continu poate fi transformat, prin rotunjire, ntr-o variabil discret. Exemplul clasic n sus inerea observa iilor de mai sus este cel al variabilei vrst: exprimat n ani-luni-zile reprezint o variabil cantitativ continu, exprimat n ani mplini i este o variabil cantitativ discret, iar atunci cnd folosim categoriile tnr-adult-vrstnic, avem o variabil calitativ. n fine, nu trebuie uitat faptul c de foarte multe ori variantele sau atributele variabilelor calitative sunt codificate cu ajutorul numerelor. Aceste coduri reprezint nite identificatori, acordarea lor fiind pur conven ional, deci ele nu se supun opera iilor matematice sau prelucrrilor statistice bazate pe opera ii matematice (E. Jaba & A. Grama, 2004). De exemplu, ntrebarea V place cursul de statistic social? poate fi codificat prin 0NU i 1DA sau Starea civil poate fi codificat prin 1-necstorit, 2-cstorit, 3-divor at, 4-vduv, 5-alte variante; n ambele exemple ar fi inutil calcularea mediei, a abaterii standard sau a oricrui alt indicator rezultat n urma unor calcule matematice. 2.3. CUNATIFICAREA I MSURAREA FENOMENELOR SOCIALE. De foarte multe ori n sfer tiin elor sociale i comportamentale rezultatele ob inute n urma unor demersuri empirice sunt exprimate calitativ. Partidul cu care a votat un alegtor, tipul temperamental al unui manager sau calificativul ob inut de un elev de clasa I sunt exemple de exprimri calitative ale unor caracteristici. n toate aceste situa ii vom putea utiliza aparatul statistic doar dac vom face apel la opera iile de cuantificare i msurare. Conform Dic ionarului de Sociologie (coord: C. Zamfir & L. Vlsceanu, 1998, p.145), cuantificarea reprezint opera ia teoretic de descriere cantitativ a fenomenelor i proceselor sociale n vederea msurrii i/sau evalurii acestora n acelai sens, I. Mrgineanu (1982) face distinc ie ntre cuantificare, desfurat cu preponderen la nivel teoretico-metodologic i 16

msurare, opera ie preponderent empiric, prin care se determin modalitatea de manifestare a fenomenului respectiv i prin care se atribuie valori numerice unor caracteristici i dimensiuni ale fenomenelor studiate. Sintetiznd o serie de considera ii referitoare la cele dou concepte, N. Luduan i F. Voiculescu (1997) consider cunantificarea ca o opera ie complex, ce implic trecerea de la conceptele abstracte la dimensiuni i indicatori cantitativi, care, ulterior, prin ac iuni concrete s fie nregistra i i, eventual, msura i. Cunatificarea, sus in aceiai autori, este o opera ie prin care pornindu-se de la analiza conceptelor tiin ifice, pe de o parte i de la analiza naturii fenomenelor studiate, pe de alt parte sunt dezvluite i definite componentele, dimensiunile i expresiile cantitative ale domeniului cercetat, astfel nct s devin posibil colectarea, nregistrarea i exprimarea cantitativ a datelor i folosirea aparatului statistico-matematic de analiz a acestora (p.22). Mult mai contestat n tiin ele sociale, termenul de msurare se refer la opera ia de atribuire de valori (sub form de cifre sau simboluri) unit ilor statistice ale unei colectivit i observate, pe baza unui set de reguli de atribuire a valorilor. Utilizarea acestor reguli este posibil numai prin intermediul instrumentelor de msur: termometru sau rigla, n cazul msurrii temperaturii sau lungimii; testul sau chestionarul, n cazul msurrii unor variabile psihologice sau sociologice. Odat instrumentele construite, procesul de msurare const n citirea pe scalele acestor instrumente a unor valori reprezentnd numrul de unit i fundamentale de msur. (V. Clocotici & A. Stan, 2001) Scalele (nivelurile) de msur nu sunt altceva dect regulile prin care sunt atribuite valori unit ilor statistice. Cunoaterea propriet ilor nivelurilor de msur, sus ine I. Mrginean (1982, p.70), prezint importan deoarece s-a dovedit c o serie determinat de date permite, n mod legitim, s se adopte un anumit nivel de msur sau tip de scal i nu altul. Practica statistic, innd cont de natura variabilelor i, mai ales, de modul lor de exprimare (vezi subcapitolul 2.2.), opereaz cu patru tipuri fundamentale de scale (niveluri de msurare): scala nominal, scala, ordinal, scala de interval i scala de raport. Fiecare dintre aceste scale se remarc prin procedee specifice de exprimare numeric, ceea ce determin utilizarea anumitor opera ii de analiz i prelucrare a datelor, foarte pu ine pentru nivelul nominal i extrem de multe pentru cel de raport. ncheiem prin a remarca unele propriet i pe care trebuie s le ndeplineasc o scal de msur: - s fie consistent, - s fie corect, - s fie exhaustiv i - s fie mutual exclusiv. Scala are consisten intern dac produce rezultate (aproape) identice, atunci cnd este folosit n mod repetat pentru acelai obiect sau fenomen; este corect dac produce informa ia pe care o ateptm de la ea; are proprietatea de a fi exhaustiv atunci cnd poate msura toate entit ile crora le este destinat; i este mutual exclusiv atunci cnd, n urma msurrii, fiecare entitate primete o singur valoare (V. Clocotici & A. Stan, 2001). 2.4. SCALE DE MSUR Scala nominal. Este cel mai simplu tip de scal i presupune doar diferen ierea calitativ a obiectelor i fenomenelor msurate. Aplicarea unei scale nominale la o colectivitate statistic nseamn, n esen , o clasificarea a indivizilor dup o caracteristic sau un atribut. Prin intermediul acestei scale se exprim apartenen a unit ilor statistice investigate la o categorie. Din aceste considerente, ntlnim acest tip de scal i cu denumirile de scal calitativ, categorial sau de clasificare.

17

Condi ia fundamental ce se cere unei scale nominale este, de fapt, cerin a elementar impus oricrei clasificri: dat fiind mul imea claselor scalei i mul imea indivizilor, fiecare individ s se gseasc n una i numai una dintre clase (T. Rotaru et.al., 1999). Un exemplu clasic de variabil nominal utilizat n cercetrile psiho-sociale este caracteristica sex, ale crei variante (categorii, atribute) sunt: masculin i feminin. Chiar dac, n activitatea concret de nregistrare a datelor, celor dou categorii le sunt atribuite codurile 1 i 2, aceste numere sunt doar nite simboluri, ntre ele existnd un raport de echivalen i nu unul de ordine. Alte scala nominale utilizate n psihologie i sociologie sunt: - tipurilor temperamentale stabilite de Jung i Eycenck: introvertit, extravertit, ambivert; - starea civil: necstorit, cstorit, vduv, ; op iunea politic: partidul A, partidul B, Scala ordinal. Ca i cea nominal, scala ordinal se folosete pentru exprimarea strilor unor variabile calitative. n plus, acest tip de scal vine cu cerin a ca ntre categoriile (clasele) scalei s existe o rela ie de ordine. Aceste scalele sunt cunoscute i sub numele de scale de ordine, scale de rang sau scale ierarhice. O scal ordinal permite ordonarea observa iilor, persoanelor, situa iilor de la mic la mare, de la simplu la complex etc., permi nd astfel realizarea unor ierarhi (ranguri). n cazul scalelor ordinale putem stabili ierarhia celor n variante ale variabilei, ns nu putem preciza valoare diferen ei dintre dou variante. Cel mai frecvent folosim acest tip de scal n studiul atitudinilor. Rspunsurile la o ntrebare de genul Ct de mul umit sunte i de rela iile din colectivul din care face i parte? pot fi cuantificate printr-o scal ordinal, ale crei clase sunt: mul umit, i mul umit i nemulumit, nemul umit. Un alt exemplu de scal ordinal este ierarhia nevoilor umane n concep ia psihologului american A. Maslow. Scala stabilit de el cuprinde urmtoarele categorii, ordonate de la simplu la complex : nevoi fiziologice; nevoi de securitate; nevoi sociale, de apartenen la grup; nevoia de stim, de a fi apreciat de ceilal i; nevoia de autorealizare (V. Clocotici & A. Stan, 2001). Clasele pot fi i aici codificate prin cuvinte care s exprime semnifica ia lor sau prin simboluri. Dac n cazul scalelor nominale simbolurile puteau fi atribuite oricum, de data aceasta ele trebuie s eviden ieze ordinea claselor. Cel mai frecvent i simplu mod de a eviden ia ordinea este folosire numerelor naturale: 1, 2, 3 . Atragem aten ia c aceste simboluri numerice reprezint numere ordinale i nu cardinale, n consecin , opera iile aritmetice (adunarea, scdere, nmul irea i mpr irea) nu pot fi utilizate nici de aceast dat (T. Rotaru et.al., 1999). Scala de intervale. mpreun cu scalele de rapoarte, sunt utilizate pentru msurarea variabilelor cantitative i presupune atribuirea de valori numerice unit ilor colectivit ii. Din acest motiv ele se mai numesc scri metrice sau numerice. Pe lng cele dou propriet i impuse de nivelurile anterioare de msurare, i anume: - fiecare individ s se gseasc n una i numai una dintre clase, - ntre categoriile (clasele) scalei s existe o rela ie de ordine, scalele metrice adaug o a treia: - are sens luarea n considerare a distan elor dintre categoriile scalei. Aceast proprietate face ca datele experimentale ob inute pe o scal metric s suporte aproape toate prelucrrile statistice posibile. Caracteristic pentru scala de interval este faptul c utilizeaz o valoare 0 conven ional. Astfel, msurarea cu acest tip de scal este independent de originea aleas i de unitatea de msur folosit, putndu-se trece de la un sistem de msurare la altul. Exemplul clasic l reprezint msurarea temperaturii n sistemul Celsius i n sistemul Fahreinheit. Trecnd de la un sistem de msurare la altul, deci schimbnd zeroul conven ional i valorile temperaturii, raportul dintre dou modificri de temperatur rmne acelai (E. Jaba & A. Grama, 2004). 18

Un alt exemplu de astfel de scal l reprezint scalele pentru msurarea inteligen ei. Scala de rapoarte sau scala de propor ii (sau scala de interval cu origine ra ional). Face parte din categoria scalelor metrice, fiind folosit tot pentru exprimarea variabilele cantitative. Aceast scal de msur posed ca note distinctive existen a unei origini naturale (a unui 0 absolut) i precizarea clar a semnifica iei unit ii de msur, ceea ce face posibil compararea raporturilor dintre grada iile scalei. Scala de rapoarte se folosete pentru msurarea valorilor unor variabile precum venitul, nl imea, timpul de reac ie .a. Dup uni autori (Kinnear i Gray, 2000, cf. F. Sava, 2004) i dup cum reiese i din utilizarea programului SPSS, n care exist doar trei niveluri de msurare, tendin a actual este de a renun a la diferen ierea ntre ultimele dou tipuri de scale. Aceasta pentru c majoritatea procedurilor statistice utilizate n cazul scalelor de intervale sunt valabile i pentru scalele de rapoarte. Termenul generic sub care se reunesc cele dou tipuri scale este cel de scal numeric sau metric. 2.5. DEFINIREA VARIABILELOR STATISTICE CU AJUTORUL SPSS Pentru crearea unei baze de date se ncepe prin definirea variabilelor. Dup apari ia ferestrei de ntmpinare din editorul de date SPSS se deschide fereastra de gestionare a variabilelor unde, pentru fiecare variabil, sunt specificate urmtoarele caracteristici: Name numele variabilei (de exemplu: sex). Type tipul variabilei, poate fi numeric, dat calendaristic, string .a. (de exemplu: numeric). Width numrul de caractere al variabilei (ex.: 1). Decimals pentru variabilele numerice trebuie specificat numrul de caractere dup virgul al variabilei (ex.: 0). Label comentariu (eticheta) ce nso ete variabila (ex.: sexul subiectului). Values valorile pe care le poate lua variabila i comentariile/etichetele ataate acestora (ex.: 1 = masculin; 2 = feminin). Missing specificarea cazurilor omise (ex.: None). Columns numrul de spa ii alocat n editorul de date acestei variabile (ex.: 8). Align alinierea acestei variabile n editorul de date, poate fi aliniere la stnga, la dreapta sau centrat (ex.: Center). Measure Nivelul de msurare al variabilei (tipul scalei), poate fi numeric (scale), nominal i ordinal (ex.: Nominal). Iat cum va arta variabila dat ca exemplu mai sus:

Figura 2.1. Exemplu de definire a variabilelor 19

Odat completate aceste cmpuri pentru fiecare variabil se revine la fereastra de date i se poate ncepe introducerea datelor. Se observ c fiecare coloan reprezint o variabil, capul tabelului fiind constituit din numele variabilelor definite anterior, iar fiecare caz (case) de pe vertical reprezint un subiect. EXERCI
II I PROBLEME

1. S se creeze n SPSS un fiier de date cu urmtoarele variabile: - ini ialele subiectului, - sexul, - vrsta, - venitul lunar, - mediul de provenien , - nl imea (n cm), - starea civil, - rspunsul dat pe o scal tip Likert cu 5 trepte la ntrebarea n ce msur sunte i satisfcut de posturile de radio locale?, - rspunsul dat la ntrebarea deschis De ce v este team cel mai mult n momentul de fa ?, - coeficientul de inteligen , - grad de introversie-extraversie (scala din EPQ), - data testrii (chestionrii).

2. Construi i n SPSS un fiier de date cu variabile preluate dintr-o cercetare recent desfurat de dumneavoastr (lucrarea de licen , dac e cazul)

3. S se solicite Ajutor (Help) programului pentru definirea nivelului de msurare (Measure) al unei variabile. Pentru variabila vrst s se dea exemple de utilizare a celor trei niveluri de msurare.

20

3. O R DO N AR E A, G R U PA R E A I P R E ZE N T A RE A D A T E L O R S T AT I S T I C E
3.1. 3.2. 3.3. 3.4. 3.5. Serii (distribu ii) statistice Gruparea (sistematizarea) datelor Prezentarea datelor sub form de tabele Reprezentarea grafic a datelor statistice Utilizarea SPSS pentru gruparea i reprezentarea grafic a datelor statistice

3.1. SERII (DISTRIBU II) STATISTICE n cazul unui numr foarte mare de date este imposibil (i inutil) analiza fiecrei valori n parte. n aceast situa ie, naintea prelucrrii i analizei datelor se procedeaz la ordonarea, gruparea i organizarea lor. Rezultatul ordonrii i gruprii datelor statistice l constituie seriile (distribu iile) statistice (mai precis, seriile statistice de frecven e). Acestea sunt formate din dou iruri paralele de date din care unul reprezint variantele/valorile variabilei (sau grupele de variante) iar cellalt numrul de unit i statistice corespunztoare fiecrei valori sau variante (frecven ele absolute sau relative). Fiecare frecven asociat valorii sau variantei respective a caracteristicii studiate reprezint un termen al seriei statistice.
variantele/valorile variabilei (sau grupele de variante)

Exemplu: x (vrsta) f
termen al seriei statistice

20 ani 14

30 ani 36

40 ani 47

50 ani 21

frecven ele absolute

n func ie de modul de prezentare al variantelor, seriile statistice, se mpart n: serii simple ob inute prin simpla niruire a valorilor individuale. Acestea sunt ulterior supuse opera iilor de ordonare i grupare (dac numrul lor este suficient de mare), ob inndu-se astfel unul din urmtoarele dou tipuri de serii. serii de (pe) variante cnd fiecrei variante i revine un anumit numr de unit i. serii de (pe) intervale cnd fiecrui interval, mrginit de o limit inferioar i de una superioar, i revine un anumit numr de unit i. Ultimele dou tipuri se mai numesc i serii (reparti ii) de frecven e i formeaz ceea ce numim o distribu ie statistic. n func ie de natura i modul de manifestare ale variabilei studiate distingem dou tipuri principale de serii statistice: serii statistice cantitative sau calitative. La acestea putem aduga alte dou tipuri de distribu ii statistice, la care criteriul dup care se face diferen ierea este spa iul sau timpul: serii statistice spa iale i cronologice. Aceste criterii nu numai c realizeaz o clasificare a seriilor statistice dar, vom vedea n capitolele urmtoare, determin limitele i specificul prelucrrilor statistice complexe. Atunci

cnd variabilele sunt cantitative vom vorbi despre tehnici satistice parametrice; n cellalt caz, al caracteristicilor calitative, prelucrrile ce le vom efectua vor fi de tip non-parametric. a) Serii statistice cantitative, n care att variantele caracteristicii ct i frecven ele sunt exprimate numeric. Extrem de important pentru momentul gruprii datelor (vezi subcapitolul 2.2.) este tipul variabilei cantitative, dat de natura sa i/sau de capacitatea cercettorului de a realiza cuantificarea variabilei cu o precizie mai mic sau mai mare: - variabile discrete (discontinue), n situa ia n care pot lua doar valori ntregi sau multiplii ntregi ai unor numere date (exemple: numrul membrilor unei familii, notele colare, coeficientul de inteligen ); - variabile continue, atunci cnd pot lua orice valori dintr-un interval finit sau infinit (exemple: nl imea, mediile colare anuale). b) Serii statistice calitative, n care caracteristica este exprimat nominal prin cuvinte (exemple: sexul, calificativele colare). Aa cum am specificat i n capitolul anterior, proprietatea unei caracteristici de a fi calitativ sau cantitativ ine nu numai de natura ei, ci i de modul cum este considerat n cadrul cercetrii (de exemplu, vrsta, poate fi variabil cantitativ exprimat n ani mplini i, sau calitativ exprimat nominal: copii, adolescen i, adul i, vrstnici). c) Variabile i serii statistice spa iale sau teritoriale, sunt cele n care criteriul de diferen iere a termenilor seriilor statistice l reprezint un element spa ial (exemple: jude ul, oraul, zona istoric, sunt caracteristici spa iale des utilizate n studiile sociologice la nivel na ional) d) Variabile i serii statistice cronologice, sunt cele n care timpul este criteriul ce diferen iaz termenii seriei statistice (exemple: cercetrile longitudinale se refer la evolu ia unui fenomen n timp zile, luni, ani; recensmintele au n vedere evolu ia unor indicatori n anumite intervale de timp de regul, un deceniu). n concluzie, seria statistic de frecven e este rezultatul opera iilor de ordonare i grupare. Prezentarea seriilor statistice se face sub forma niruirii, pe orizontal sau pe vertical, a unor perechi de numere sau expresii, n care primul element reprezint caracteristica (ce poate fi cantitativ sau calitativ, spa ial sau cronologic), iar al doilea frecven a, ntotdeauna numeric, a variantelor sau grupelor de variante ce delimiteaz caracteristica respectiv. n rapoartele de cercetare aceste serii statistice, unele reflectnd mai multe caracteristici concomitent, sunt ilustrate cu ajutorul tabelelor i al graficelor. Reamintim urmtoarele nota ii cu care operm n prezentarea i prelucrarea seriilor statistice: - variantele sau grupele (clasele) de variante, xi: x1, x2, xk, - frecven a variantei xi (numrul de apari ii), fi: f1, f2, fk, - numrul total de variante (total frecven e) n: n = fi i = 1, 2, k, n cazul seriilor statistice de intervale se presupune c toate valorile din interiorul fiecrei grupe (clase) se concentreaz n valoarea central a clasei, notat tot cu xi. Aceast valoare va nlocui n seria statistic intervalul respectiv i se calculeaz ca medie aritmetic a valorilor extreme ale intervalului:  EMBED Equation.3  (1)

Men ionm faptul c o serie statistic poate reda pe lng frecven ele absolute (f sau fa) i pe cele relative (fr). Acestea sunt absolut necesare cnd se dorete compararea unor serii statistice (eantioane) cu numrul total de variante (n) diferit (de exemplu: n cazul a dou clase cu numr total de elevi diferit). Mai mult, atunci cnd prelucrrile statistici ulterioare o impun, putem determina i alte frecven e: - frecven a (absolut sau relativ) cumulat cresctor, dat de suma frecven elor valorilor care apar pn la valoarea xi respectiv, inclusiv; 22

frecven a (absolut sau relativ) cumulat descresctor, dat de suma frecven elor valorilor care apar de la valoarea xi respectiv, inclusiv.

Exemplu:

frecven a absolut

copil adolescent adult vrstnic TOTAL

f 144 336 516 204 1200

frecven a absolut cumulat cresctor f.cc 144 480 996 1200

frecven a absolut cumulat descresctor f.cd 1200 1056 720 204

frecven a relativ

fr [%] 12 28 43 17 100

frecven a relativ cumulat cresctor fr.cc [%] 12 40 83 100

frecven a relativ cumulat descresctor fr.cd [%] 100 88 60 17

3.2. GRUPAREA (SISTEMATIZAREA) DATELOR Gruparea statistic reprezint o opera ie de sistematizare a popula iei pe pr i statistic omogene n func ie de varia ia unei variabile (sau a mai multora). Importan a acestei opera ii ini iale deriv din erorile ce pot fi induse fie n cazul stabilirii unui numr foarte mare de grupe (clase) situa ie n care se ajunge la frmi area colectivit ii , fie n situa ia alegerii unui numr prea mic de grupe, cu intervale foarte mari n cadrul lor situa ie n care nu vom surprinde tipurile calitative existente. Tipuri de grupri ntlnite n practica statistic: 1) grupri pe variante utilizate n cazul variabilelor de tip discret, cnd ele pot lua doar valori ntregi (exemple: numrul membrilor unei familii, notele colare). 2) grupri pe intervale utilizate n cazul variabilelor de tip continuu, cnd ele pot lua orice valoare ntr-un interval finit sau infinit (exemple: vrsta, mediile colare anuale). Men ionm faptul c i variabilele de tip discret pot fi supuse gruprilor pe intervale (exemplu: note ntre 2 i 4; 57; 810 etc.). n ambele situa ii mrimea intervalului (K) se ob ine cu ajutorul formulei lui Sturges:
K= x max x min 1 + 3,222 lg n

(2)

unde, n reprezint numrul total de variante. n situa ia n care numrul de grupe este ales de cercettor (bazndu-se pe experien i intui ie), mrimea intervalului (K) rezult astfel: - n cazul variabilelor de tip continuu, prin raportarea amplitudinii varia iei (A = xmax xmin) la numrul de grupe:

K=
-

x max x min nr. grupelor

(3)

n cazul variabilelor de tip discret, prin raportarea numrului valorilor diferite ale variabilei (Nx = xmax - xmin +1 = A + 1) la numrul de grupe:

23

K=

x max x min + 1 nr. grupelor

(4)

O aten ie deosebit trebuie acordat precizrii limitelor sau capetelor intervalelor. n cazul caracteristicilor discrete limitele intervalelor ies foarte bine n eviden , ele fiind diferite (exemplu: intervalele 24; 57; 810 etc.). Mai delicat este n cazul caracteristicilor continui, cnd trebuie precizat care dintre intervale include limita (exemplu: intervalele 24; 46; 68 etc.). Pentru evitarea confuziilor se procedeaz din start la departajarea limitelor, astfel: 24; 4,016; 6,018 etc.

Aplica ie: Vrstele a 20 de subiec i inclui ntr-un eantion sunt urmtoarele: 14 16 12 18 11 27 24 18 13 19 30 24 26 18 17 26 21 23 20 31 S se grupeze datele: a) n trei grupe; b) ntr-un numr de grupe neprecizat (lg20 1,3). Rezolvare: a) Fiind vorba de vrsta n ani mplini i, avem de-a face cu o caracteristic de tip discret. Lungimea K a intervalului se calculeaz cu formula (4):

K=
Datele grupate pot fi ilustrate astfel: Grupe (ani) Frecven e b) Vom folosi formula lui Sturges (2):

(31 11) + 1 =7 3
18 - 24 7 25 - 31 5

11 - 17 5

K=

31 - 11 20 = = 3,74 4 1 + 3,222 lg 20 5,32

Datele grupate vor fi ilustrate astfel: Grupe (ani) Frecven e 11,00-15 4 15,01-19 6 19,01-23 4 23,01-27 5 27,01-31 2

Exerci iu: La un test de inteligen 30 de subiec i au ob inut urmtoarele punctaje: 64 46 52 48 60 52 54 58 44 68 48 52 58 46 68 70 43 54 56 46 44 64 68 60 46 50 56 62 64 69 S se efectueze gruparea acestora: a) n cinci grupe; n apte grupe; n trei grupe; b) s se men ioneze gruparea pe care o considera i cea mai bun.

3.3. PREZENTAREA DATELOR SUB FORM DE TABELE Prezentarea datelor sub forma unui tabel statistic permite att o bun vizualizare ct i, mai ales, efectuarea diverselor calcule n procesul de prelucrare a datelor. 24

n elaborarea unui tabel pot fi identificate urmtoarele elemente i reguli principale: - titlul tabelului - care trebuie s fie clar, scurt i s defineasc exact fenomenul pe care l reprezint i, dup caz, perioada la care se refer; - macheta tabelului - format din liniile orizontale (rnduri) i liniile verticale (coloane) din ntretierea crora apar rubricile (celulele, csu ele) care con in datele numerice i/sau denumirile textuale; - subiectul tabelului - nscris de obicei la captul rndurilor, este constituit din unit ile popula iei statistice (ex.: grupe de note, grupe de puncte etc); - predicatul tabelului - nscris de obicei la captul coloanelor, cuprinde ansamblul indicatorilor care se nregistreaz la nivelul unit ilor popula iei statistice; - indicarea obligatorie a sursei de date, atunci cnd este cazul (de obicei sub tabel); - se recomand indicarea unit ilor de msur n care se exprim datele (de obicei, ntre titlul i macheta tabelului); - se recomand numerotarea tabelelor - pentru identificarea mai uoar a acestora n textul de analiz. n func ie de scopul ntocmirii, de con inutul lor i de numrul caracteristicilor studiate tabelele pot fi de mai multe tipuri. Astfel: a) Tabele ale unor serii statistice Pot fi ntocmite att pentru seriile de variante ct i pentru cele de intervale. Diferen a este dat de rndurile tabelului care vor constitui variantele seriei, n primul caz, sau clasele de variante (eventual valorile centrale), n cel de-al doilea caz. n ambele situa ii pe coloane vor fi trecute frecven ele, absolute sau relative, cumulate sau descresctoare. (Exemplu: a se vedea tabelul 3.3) b) Tabele centralizatoare Sunt utilizate n toate situa iile n care un numr mare de date trebuie stocate i conservate n vederea prelucrrii lor ulterioare. n lucrrile tiin ifice aceste tabele sunt, de obicei, prezentate sub form de anexe, i con in pe coloane totalitatea variabilelor studiate, iar pe rnduri, totalitatea unit ilor statistice (colectivitatea statistic) investigate. c) Tabele comparative Cuprind fie datele ob inute pe eantioane diferite pentru aceeai caracteristic, fie datele aceluiai eantion pentru caracteristici diferite. d) Tabele cu dubl sau tripl intrare n acest caz, i coloanele i rndurile exprim varia iile uneia sau a dou caracteristicii (variabile). Fiecare celul exprim numrul de unit i statistice caracterizate prin variantele corespunztoare tuturor caracteristicilor de pe orizontal i vertical. Exemple: Tabel cu dubl intrare Situa ia la nv tur a elevilor unei clase la sfritul anului colar Tabelul 3.1 Sexul Masculin Feminin 5-7,99 3 2 Media 8-8,99 7 9 general 9-10 4 4 Sursa: N. Luduan, 1997, pag. 245

25

Tabel cu tripl intrare Situa ia la nv tur a elevilor unei clase la sfritul anului colar Tabelul 3.2 Mediul de provenien Urban Rural 5-7,99 1 1 M 8-8,99 4 5 9-10 3 2 Sex 5-7,99 2 1 F 8-8,99 3 4 9-10 1 2 Sursa: N. Luduan, 1997, pag. 245 Media general 12 11 16 14 10 14 16

Aplica ie: La un test de aptitudini tehnice cei 35 de elevi ai unei clase ob in urmtoarele rezultate (pe o scal de la 0 la 20): F.B. L.M. D.C. S.M. D.D. B.A. P.C. 17 12 18 15 14 8 13 R.C. A.S. V.A. R.H. T.N. B.D. A.D. T.D. .L. S.C. N.P. M.E. S.L. H.T. 19 12 15 13 16 11 17 .V. P.I. C.M. D.E. P.D. E.G. I.I. 20 14 15 10 13 9 12 C.E. V.V. U.L. I.A. N.C. V.F. B.B. 16 6 14 17 18 15 11

S se grupeze datele i s prezinte sub form de tabel, calculndu-se toate frecven ele posibile: Rezolvare: O prim sarcin ce i revine cercettorului este de a ordona i grupa ansamblul de date (seria statistic simpl prezentat n enun ul problemei). n acest scop, trebuie, de la nceput, stabilite: - colectivitatea statistic (sau popula ia) [n exemplul nostru, o clas de elevi] - mrimea colectivit ii statistice (popula iei): n = fi [ex.: n = 35] - unitatea statistic: [n exemplul nostru, elevul] - caracteristica (variabila) statistic [ex.: puncte (note) la testul de aptitudini tehnice, exprimate n numere ntregi; avem deci o variabil discret] - valorile (variantele) pe care le ia variabila respectiv: xi [ex.: cifre de la 0 la 20] - amplitudinea (diferen a dintre valoarea maxim i cea minim): A = xmax - xmin [ex.: A = 20 6 = 14] - numrul de valori diferite: Nx = (xmax - xmin ) + 1 = A + 1[ex.: Nx = 14 + 1 = 15] Pentru a realiza gruparea colec iei de date se impune stabilirea numrului de clase n care dorim s facem gruparea, dup care se calculeaz mrimea intervalului de grupare (K). S presupunem c dorim gruparea n 5 clase (numrul de clase l stabilim dup ce am analizat Nx, n cazul nostru egal cu 15). Considernd c avem de-a face cu o variabil discret, mrimea intervalului se va calcula dup formula (4):

26

K=

( 20 6) + 1 15 = =3 5 5

Vom grupa succesiv cte 3 valori, iar n locul valorilor individuale vom opera cu valorile centrale (notate, de asemenea, cu xi) ob inute cu ajutorul formulei (1). n final vom determina: - frecven ele absolute (numrul de subiec i la care se nregistreaz aceeai valoare): fi - frecven ele absolute cumulate cresctor: f.cci - frecven ele absolute cumulate descresctor: f.cdi - frecven ele relative (sau ponderile): fri - frecven ele relative cumulate cresctor: fr.cci - frecven ele relative cumulate cresctor: fr.cdi Tabelul cu toate aceste date va arta astfel: Tabel al unei serii statistice de intervale Rezultatele ob inute de ctre elevi unei clase la un test de aptitudini tehnice Tabelul 3.3: Serie statistic de intervale Frecven Nr. Valoarea Frecven a a crt. Intervalu central absolut xi fi f.cci f.cdi relativ fr.cci fr.cdi i l fri 1 6-8 7 2 2 35 5,71 5,71 100 2 9 - 11 10 6 8 33 17,14 22,85 94,29 3 12 - 14 13 12 20 27 34,29 57,14 77,15 4 15 - 17 16 11 31 15 31,43 88,57 42,86 5 18 - 20 19 4 35 4 11,43 100 11,43 n = fi = 35 100 %

3.4. REPREZENTAREA GRAFIC A DATELOR STATISTICE Cu ajutorul reprezentrilor grafice sunt vizualizate informa iile statistice, facilitndu-se perceperea pe ansamblu a datelor, sesizarea unor aspecte privind varia ia valorilor observate, reparti ia lor, legturile existente ntre ele .a. Graficul trebuie s cuprind: titlul - care poate fi plasat fie sub, fie deasupra graficului i trebuie s precizeze limpede fenomenul pe care l reprezint; legenda - necesar definirii mai clare a unor simboluri utilizate n reprezentarea grafic sau men ionrii anumitor conven ii utilizate; sistemul axelor rectangulare (dac este cazul) - n care linia orizontal (abscis) cuprinde valorile variabile x, iar cea vertical (ordonat) cuprinznd frecven ele f; se recomand numerotarea graficelor - pentru identificarea mai uoar a acestora.

Graficele cel mai des utilizate sunt histogramele, poligoanele de frecven e, i curbele de distribu ie, pe abscis notndu-se intervalele de varia ie (sau variantele), iar pe ordonat frecven ele corespunztoare acestor intervale (sau variante). Aceste reprezentri grafice se ob in prin unirea intersec iilor perpendicularelor ridicate din punctele perechi de pe cele dou axe. n cazul seriilor de intervale perpendiculara pentru desemnarea valorii frecven ei se ridic din mijlocul intervalului, respectiv din punctul corespunztor valorii centrale a clasei. 27

Pentru a eviden ia i/sau compara structurile se utilizeaz diagramele de structur, construite cu ajutorul suprafe elor (cercuri, ptrate, dreptunghiuri), diagramele de compara ie i reprezentrile prin figuri simbolice .a.. n multe cazuri, sunt studiate mai multe caracteristicii folosindu-se reprezentri grafice complexe precum: piramide ale vrstelor, grafice comparative, grafice combinate.

Aplica ie: La un examen de statistic s-au ob inut urmtoarele rezultate: Note Frecven e 4 6 5 14 6 18 7 20 8 36 9 24 10 12

S se reprezinte grafic situa ia prezentat: Rezolvare: Pentru construirea histogramei se nscriu pe orizontal, la intervale egale, notele, n timp ce pe vertical se nregistreaz frecven ele. Se construiesc apoi coloane care au nl imi propor ionale cu frecven ele respective. Pentru construirea poligonului de frecven se unesc prin linii drepte punctele centrale ale vrfurilor coloanelor existente, avnd grij ca punctele extreme s fie unite cu valorile extreme ale seriei - printr-o linie ntrerupt - pentru a forma un poligon. Este necesar de re inut faptul c poligonul de frecven e se poate realiza i fr ajutorul histogramei, ridicnd din centrele intervalelor cuprinse pe orizontal perpendiculare cu nl imi corespunztoare frecven elor i unind apoi aceste puncte.

Poligonul frecven elor


40

Frecven e absolute

30 20 10 0 4 5 6 7 8 9 10

Note

Exerci iu: (1) Cunoscnd frecven ele corespunztoare grupelor de vrst din componen a unui eantion: 28

Grupe de vrst Frecven e

21-30 12

31-40 20

41-50 24

51-60 48

61-70 20

71-80 16

81-90 10

S se reprezinte grafic seria statistic utilizndu-se histograma:

Exerci iu: (2) Reprezenta i grafic, utiliznd poligonul de frecven e, urmtoa-rea serie de date: Note Frecven e 3 10 4 14 5 18 6 20 7 48 8 32 9 16 10 12

n ce privete diagramele sub forma figurilor geometrice (cerc, ptrat, dreptunghi) utilizate att pentru prezentarea structurilor ct i/sau pentru compararea n timp a evolu iei fenomenelor se procedeaz astfel: - se construiesc cele dou figuri n aa fel, nct raportul dintre raze (sau laturi) s fie propor ional cu nivelurile fenomenului studiat n cele dou perioade diferite de timp (n dou localit i etc.); - n cadrul fiecrei figuri geometrice se reprezint structura corespunztoare anului (spa iului geografic) respectiv.

Aplica ie: Grupnd datele de la exerci iul anterior n trei clase, s se reprezinte grafic structura seriei de date: Rezolvare: Rezultatul gruprii este urmtorul: Tabel al unei serii statistice de intervale Tabelul 3.4: Serie statistic de intervale Valoarea Frecven a Frecven a Note (grupate pe central absolut relativ xi intervale) fi fri 2-4 3 24 14,1 5-7 6 86 50,6 8 - 10 9 60 35,3 170 100,0 %

Nr. crt. i 1 2 3

Reamintim c frecven ele relative (ponderile) se calculeaz raportnd fiecare frecven absolut la totalul acestora (ex.: 24/170100= 14.1% ). Se ob in apoi arce de cerc propor ionale cu frecven ele relative.

29

Structura eantionului dup notele la examen


2-4 14%

8 - 10 35%

2-4 5-7 8 - 10

5-7 51%

Exerci iu: Cunoscnd c la un test de cunotin e s-au ob inut urmtoarele rezultate s se reprezinte grafic structura acestora. Note Numr studen i Sub 5 12 5-6 26 7-8 34 Peste 8 17

Exerci iu: Presupunnd c n doi ani colari - 1980/81 i 1992/93 - numrul studen ilor i repartizarea lor pe profile sunt cele prezentate, s se reprezinte grafic att evolu ia ct i structurile corespunztoare celor doi ani de nv mnt. Nr. studen i (mii) 1980/1981 1992/1993 120 150 20 30 30 80 20 40 200 300

Tehnic Economic Universitar Altele

Exerci iu: Presupunnd c n prezent numrul elevilor ce absolv liceul este de 1.5 ori mai mare dect n anul 1985, iar ponderea actual a absolven ilor liceelor teoretice este 60%, adic de 5 ori mai mare dect cea din 1985, s se reprezinte grafic evolu ia i structurile corespunztoare.

3.5. UTILIZAREA SPSS


TABELE

PENTRU GRUPAREA I PREZENTAREA DATELOR SUB FORM DE

GRUPAREA PE INTERVALE I CONSTRUIREA SERIEI STATISTICE DE INTERVALE CU AJUTORUL SPSS Se parcurge, n bara de meniuri, traseul: Transform Recode Into Different Variables 30

Va fi afiat urmtoarea fereastr de dialog:

Figura 3.1. Fereastr de dialog pentru recodificarea variabilelor Primul pas este specificarea variabilei supuse transformrii prin selectarea ei din fereastra din stnga. n partea dreapt (Output Variable) se specific numele i eticheta noii variabile dup care se apas butonul Change. Aceast transformare va fi vizualizat n fereastra din mijloc (Numeric Variable > Output). n cazul n care, anterior, s-a optat pentru Into Same Variables acest ultim pas nu mai este necesar, transformarea nlocuind n aceeai variabil vechile valori cu cele noi. Urmeaz activarea unei noi ferestre de dialog prin apsarea butonului Old and New Values (figura 3.2). Se completeaz cel pu in un cmp pentru Old Value i unul pentru New Value dup care se apas butonul Add. Transformrile vor fi vizualizate n fereastra din stnga, putnd fi modificate (Change) sau chiar eliminate (Remove). n final se apas Continue i apoi OK, n baza de date aprnd o nou variabil cu noul nume specificat i cu valorile precizate n ultima fereastr de dialog.

Figura 3.2. Fereastr de dialog pentru recodificarea variabilelor

REPREZENTAREA GRAFIC A DATELOR STATISTICE CU AJUTORUL SPSS Pentru calcularea frecven elor absolute i/sau relative ale unei serii statistice simple sau de variante, precum i pentru reprezentarea grafic a distribu iei de frecven e, se parcurge, n bara de meniuri, traseul: Analyze Descriptive Statistics Frequencies 31

Vom fi ntmpina i de fereastra urmtoare, n care, n partea stng sunt afiate toate variabilele din baza de date (n ordine alfabetic sau n ordinea definirii lor).

Figura 3.3. Fereastra de ntmpinare (de dialog) pentru calculul frecven elor Selectm, mutnd din partea stng n partea dreapt n fereastra numit Variable(s), variabila sau variabilele dorite; activm csu a numit Display frequency tables; dup acestea putem apsa butonul OK. Putem opta (accesnd n fereastra de ntmpinare butonul Statistics) pentru calcularea unor indicatori de centralitate i de dispersie, la care vom reveni n capitolele urmtoare. Iat cum arat fereastra acestor op iuni:

Figura 3.4. Fereastr de op iuni pentru calculul unor indicatori statistici

Aplica ie: S se deschid fiierul de date Baza totala BOP 20015. Acest fiier con ine 2080 de cazuri i 444 de variabile. S se ob in tabelul de frecven e i histograma care con ine frecven ele absolute pentru variabila p1, variabil care exprim rspunsurile celor 2080 de subiec i la ntrebarea Ct de des citi i ziarele. Rezolvare: Dup selectarea variabilei i activarea csu ei numit Display frequency tables (vezi figura 3.3.) se apas butonul OK, n fereastra de rezultate (Output1 SPSS Viewer) se ob ine.

Fiierul Baza totala BOP 2001 este oferit gratuit de Funda ia pentru o Societate Deschis i reprezint rezultatul unui sondaj realizat n noiembrie 2001. De fapt, aceast cercetare se desfoar bianual sub egida programului ini iat n urm cu ase ani de institu ia amintit, program cunoscut cu denumirea de Barometrul de Opinie Public - BOP. Informa ii suplimentare i alte fiiere de date pot fi ob inute accesnd www.osf.ro.

32

Dup titlul Frequencies este afiat un tabel, intitulat Statistics, cu datele generale despre variabila analizat. n exemplul nostru, ne sunt prezentate; - eticheta (Label) variabilei: Ct de des citi i ziarele?, - numrul de cazuri valide: 2080 i - numrul de cazuri omise: 0. Urmeaz tabelul distribu iei de frecven e care con ine urmtoarele coloane: - etichetele variantelor (valorilor) valide sau omise; - Frequency, frecven ele absolute; - Percent, frecven ele relative sau procentele; - Valid percent, frecven ele relative (procentele) valide; - Cumulative percent, frecven ele relative (procentele) valide cumulate; * Pentru a ob ine o reprezentare grafic aferent seriei statistice respective, revenim la fereastra de ntmpinare pentru calculul frecven elor (figura 3.3) i apsm butonul Charts.

Figura 3.5. Fereastr de op iuni pentru reprezentarea grafic a seriilor de frecven e Va aprea o nou fereastr n care, nainte de a apsa butonul Continue, vom opta pentru una din urmtoarele situa ii (Chart Type): - None, cnd nu se dorete reprezentarea grafic a variabilei; - Bar charts, reprezentare grafic sub form de histogram folosit pentru serii statistice calitative sau pentru seriile de frecven e (de variante sau de intervale) n care variabila 33

este discontinu; aici putem opta pentru afiarea valorilor pe grafic (Chart Value) sub forma frecven elor absolute (Frequencies) sau a celor relative (Percentages); Pie charts, reprezentare grafic sub forma diagramei de structur prin arce de cerc folosit pentru serii statistice calitative sau pentru seriile de frecven e (de variante sau de intervale) cu numr redus de variante; avem posibilitatea acelorai op iuni de mai sus; Histograms, reprezentare grafic sub form de histogram folosit pentru serii statistice cantitative simple sau de variante, n care variabila este de tip continuu; aici se poate opta pentru trasarea curbei distribu iei normale prin activarea csu ei With normal curve.

Revenind la fereastra de dialog pentru calculul frecven elor (figura 3.3) putem ob ine reprezentarea grafic prin apsarea butonului OK sau putem accesa alte op iuni apsnd butonul Format (vezi figura 3.6).

Figura 3.6. Fereastr de op iuni pentru calculul i reprezentarea grafic a n noua fereastr se poate opta pentru ordinea variantelor n tabelul de frecven e i, implicit, n cadrul reprezentrii grafice (Order by) i/sau pentru modul de prezentare al variabilelor, atunci cnd sunt analizate mai multe, n fereastra de rezultate (Multiple Variables). Ordinea variantelor (Order by) poate fi: - Ascending values / Descending values, cnd dorim ordonarea ascendent/descendent a valorilor; - Ascending counts / Descending counts, cnd dorim ordonarea ascendent/descendent a frecven elor; Modul de prezentare al variabilelor (Multiple Variables) n fereastra de gestionare a rezultatelor va depinde de urmtoarele op iuni: - Compare variables, situa ie n care n primul tabel, intitulat Statistics, vor fi prezentate, pe coloane, toate variabilele analizate; dup care se afizeaz tabelul de frecven e al tuturor variabilelor; iar n final, sunt reprezentate graficele pentru toate variabilele selectate. - Organyze output by variables, cnd fiecare variabil este prezentat separat, n ordinea din fereastra Variable(s).

Aplica ie: S se deschid fiierul de date Baza totala BOP 2001. S se ob in histograma frecven ele absolute pentru variabila p1, variabil care exprim rspunsurile celor 2080 de subiec i la ntrebarea Ct de des citi i ziarele. Rezolvare: Dup selectarea variabilei (vezi figura 3.3.) se opteaz n fereastra de ntmpinare apsnd butonul Charts (vezi figura 3.5.). Aici se selecteaz op iunea Bar charts, dup care se apas OK. n fereastra de rezultate (Output1 SPSS Viewer) se ob ine reprezentarea grafic sub

34

form de histograme a frecven elor celor apte variante ce au putut fi alese de cei 2080 de subiec i.

Men ionm c prin dublu-clik cu butonul-stnga al mouse-ului pe grafic se poate deschide editorul de grafice din SPSS, n care se pot face modificri substan iale a reprezentrii grafice, inclusiv transformarea n alt tip de grafic. De asemenea, atragem aten ia asupra existen ei i a altor solu ii pentru reprezentarea grafic a distribu iilor de frecven e. De exemplu, n bara de meniuri se poate deschide submeniul Graphs, apoi Bar Define, se selecteaz variabila dorit la rubrica Category Axis i se apas OK. Rezultatul va fi acelai.

Exerci iu: Pentru aceeai variabil p1 din fiierul de date Baza totala BOP 2001 s se ob in histograma frecven elor relative, ordonate cresctor/descresctor n func ie de variante i de frecven e (n total patru grafice).

EXERCI

II I PROBLEME

1. S se creeze n SPSS un fiier de date cu urmtoarele variabile: a) numele i prenumele, b) sexul, c) vrsta, d) starea civil, e) venitul lunar, f) rspunsul dat pe o scal tip Likert cu 5 trepte la ntrebarea n ce msur sunte i satisfcut de rela iile cu colegii? g) coeficientul de inteligen . S se introduc date pentru 30 de subiec i (cazuri). S se calculeze cu ajutorul SPSS frecven ele pentru variabilele b), d), e), f) i g). Pentru aceleai variabile s se construiasc, n func ie de tipul variabilei, grafice sub form de histograme, poligoane de frecven e, curbe de frecven e i diagrame de structur.

2. n fiierul de date bd BOP Oct 2004 s calculeze frecven ele i s se reprezinte grafic variabilele 359 i 360 cu numele p0_sex i p0_age. Aceleai grafice s se realizeze prin dou ci diferite.

35

S se grupeze variabila 360 cu numele p0_age n 7 grupe. S se creeze o nou variabil cu numele varsta (se va parcurge traseul: Transform Recode Into Different Variables). S se calculeze frecven ele pentru aceast nou variabil.

3. Construi i n SPSS un fiier de date cu variabile preluate dintr-o cercetare recent desfurat de dumneavoastr (lucrarea de licen , dac e cazul). Acolo unde este cazul, s se grupeze datele, s se calculeze frecven ele i s se reprezinte grafic, n SPPSS, distribu iile respective.

36

4. INDICATORI AI TENDIN EI CENTRALE


4.1. 4.2. 4.3. 4.4. 4.5. 4.6. Mediile Quantilele: mediana, quartilele, decilele i centilele Modul Rela ia dintre indicatorii tendin ei centrale Reprezentri de tip Boxplots Utilizarea SPSS pentru calcularea i reprezentarea indicatorilor de pozi ie

n cele mai multe investiga ii psihosociale sau educa ionale prezentarea rezultatelor sub form tabelar sau prin reprezentri grafice nu este suficient. Prin intermediul unor indicatori statistici putem realiza o prelucrare mult mai riguroas a datelor, putem cunoate mult mai temeinic fenomenele studiate. Termenul de indicator se refer la acele valori ataate variabilelor statistice cantitative prin intermediul crora se ncearc exprimarea, de o manier sintetic a informa iei con inut n distribu ia de frecven e respectiv (Rotariu et. al., 1999, p. 42). n func ie de natura informa iei oferit de indicatorii statisticii, acetia se clasific n trei mari categorii: - indicatori ai tendin ei centrale (de pozi ie sau de nivel), - indicatori ai varia iei (de dispersie sau de mprtiere), - indicatori ai formei distribu iei. * Pentru a determina modul n care datele statistice tind s graviteze n jurul unor valori centrale se folosesc indicatorii tendin elor centrale. Dintre acetia vom prezenta: media, quantilele (mediana, quartilele, decilele i centilele) i modul.

4.1. MEDIILE Mrimile medii sunt considerate a fi principalele instrumente de cunoatere a fenomenelor de mas, ca urmare a faptului c ele exprim ceea ce este comun i general n forma de manifestare a acestor fenomene Pentru a ne fi de folos, ns, calculul mrimilor medii trebuie s ndeplineasc anumite condi ii: - s se bazeze pe un numr suficient de mare de cazuri individuale; - valorile individuale ale caracteristicii s nu difere prea mult de la o unitate statistic la alta, adic s avem o colectivitate omogen; - mrimea medie aleas pentru calcul s corespund cel mai bine formei de varia ie a caracteristicii studiate i s valorifice cel mai bine materialul cifric de care dispunem (Novak, 1995).

MEDIA ARITMETIC Media aritmetic ( x ), reprezint, n cazul datelor negrupate (serii simple), raportul dintre suma valorilor variabilei respective i numrul lor. Media aritmetic simpl:
x= x i n

(1)

Dac datele sunt grupate (serii de frecven e), media - numit, n acest caz, media aritmetic ponderat - va fi: Media aritmetic ponderat:

x i f i (2) f i n cazul seriilor de intervale xi va reprezenta valoarea central a intervalului, calculele fcndu-se identic cu cel de la seriile de variante. x=

Aplica ie: S se determine media aritmetic a urmtoarelor note ob inute de un grup de 9 studen i la un examen: 5 8 8,5 7 9 6,5 8 8 7,5 Rezolvare: Fiind vorba de o serie statistic simpl (nici mcar ordonat!) sa va folosi formula (1), calculndu-se xi = 67,5. n final vom ob ine: 67,5 x= = 7,5 9 Aplica ie: Cunoscnd notele ob inute de cei 80 de studen i testa i la statistic i grupndui dup notele primite, a rezultat urmtoarea serie pe variante:

Note (xi) Numr studen i Frecven e (fi)

4 2

5 6

6 11

7 14

8 25

9 14

10 8

S determine media (ponderat) a seriei de mai sus.

Rezolvare: Se nmul ete xi cu fi dup care se face suma. Tabelul centralizator va arta astfel: Tabel al unei serii statistice de variante Tabelul 4.1: Serie statistic de variante Frecven a absolut xi fi fi
2 6 11 14 25 14 8 n = fi = 80 8 30 66 98 200 126 80 xi fi = 608

Nr. crt. i 1 2 3 4 5 6 7

Note (grupate pe variante) xi 4 5 6 7 8 9 10

38

Raportnd totalul ob inut pe coloana xi fi ( xi fi = 608) la totalul frecven elor (n = fi = 80), se ob ine media aritmetic ponderat: x = 608/80 = 7,6.

MEDIA PTRATIC Media ptratic ( x p), se aplic atunci cnd se dorete acordarea unei importan e deosebite nivelurilor mai mari ale seriei. Aceasta se ob ine dup aceleai formule, dar prin ridicarea la ptrat a tuturor valorilor seriei. n aceast situa ie, media ptratic va fi ntotdeauna mai mare dect media aritmetic.
x i2 n

Media ptratic simpl:

xp =

(3)

Media ptratic ponderat:

xp =

x 2 f i i f i

(4)

MEDIA GEOMETRIC Media geometric ( x g), Se aplic atunci cnd se acord o importan mai mare valorilor mai mici din serie sau n cazul n care ntre termenii seriei exist o rela ie de produs. Formulele ini iale de calcul pot fi transformate prin logaritmare n egalit i mai uor de utilizat n practica curent. Media geometric simpl:
Aceasta, prin logaritmare devine:

xg = n

(5) (5)

log x g =

log( xi ) n

Media geometric ponderat:


Aceasta, prin logaritmare devine:

x g = f i i xi

(6) (6)

log x g =

f i log( xi ) f i

Ultimele dou tipuri de medii sunt mai pu in ntlnite n activitatea curent, motiv pentru care, de cele mai multe ori, termenul de medie sau valoare medie se refer exclusiv la media aritmetic.

4.2. QUANTILE6 O alt categorie de indicatori ai tendin elor centrale o reprezint quantilele. Acestea sunt indicatori de pozi ie i au rolul de a mpr ii seria de date ntr-un anumit numr de pr i. Dintre quantilele cele mai des calculate amintim: Mediana (M sau Me), este valoarea care mparte seria ordonat de date n dou pr i egale. Jumtate din valori (50%) se gsesc n partea stng a medianei iar cealalt jumtate n partea

n SPSS, se numesc percentiles.

39

dreapt. Pentru calculul medianei este absolut necesar ordonarea seriei statistice, fie cresctor, fie descresctor (aspect fr importan n cazul calculului valorilor medii!). Pentru a afla al ctelea element al unei serii cu numr impar de termeni este mediana se calculeaz cota medianei dup formula; Cota M = (n+1)/2 (7) De exemplu, presupunnd c notele, ordonate cresctor, ob inute de un lot de nou subiec i sunt: 4 5 6 7 7 8 8 8 9 cota medianei va fi (9+1)/2 = 5, astfel nct mediana va corespunde celui de-al cincilea termen din serie, adic 7. Se observ c i n stnga i n dreapta acestei valori se afl un numr egal de termeni. Pentru seriile formate dintr-un numr par de valori formula (7) rmne valabil, numai c rezultatul nu va mai fi un numr ntreg. Vom vorbi de doi termeni centrali, pozi ia medianei fiind ntre termenul n/2 i n/2+1. n acest caz, mediana se calculeaz fcnd media celor dou valori, putnd s coincid (dac valorile corespunztoare termenilor n/2 i n/2+1 sunt egale), sau nu (n caz contrar), cu una din valorile seriei. Dac n exemplu anterior mai apare un subiect cu nota 9 vom avea o serie cu zece termeni: 4 5 6 7 7 8 8 8 9 9 mediana va fi dat de media valorilor corespunztoare termenilor cinci i ase, adic 7,5. Lucrurile devin mult mai complicate dac ne referim la distribu ii de frecven e. Quartilele (Q) reprezint alte tipuri de quantile, ele mpr ind seria de date n patru pr i egale, astfel: quartila 1 (Q1) mparte valorile n 25% (un sfert) i, respectiv, 75% (trei sferturi); quartila 2 (Q2 = M) mparte seria de date n dou jumt i egale, ea fiind, de fapt, mediana; quartila 3 (Q3) mparte seria ordonat n 75% i, respectiv, 25%. Analog, se definesc i celelalte quantile: decilele (mpart o serie ordonat n zece pr i egale) i centilele (mpart o serie ordonat ntr-o sut de pr i egale).

4.3. MODUL (VALOAREA MODAL) Modul sau valoarea modal (Mo), reprezint valoarea caracteristicii care prezint frecven a cea mai mare, care apare de cele mai multe ori n seria de date. De exemplu, n cazul unei serii simple de date de forma: 4 5 5 6 7 7 8 8 8 9 modul va fi 8, aceast valoare aprnd de cele mai multe ori n cadrul seriei. Pentru o serie de variante, modul este egal cu varianta care are cea mai mare frecven , iar pentru o serie de intervale, fie se calculeaz media intervalului cu cea mai mare frecven , fie rmnem doar la no iunea de interval modal.
Pentru to i aceti indici ai tendin ei centrale formulele de calcul sunt mai complexe atunci cnd datele sunt grupate. Tratatele de statistic aplicat prezint n amnunt toate aceste formule.

4.4. RELA IA DINTRE MEDIE, MEDIAN I MODUL n func ie de nf iarea (grafic) unei serii statistice cele trei valori medii pot s coincid, sau nu. n prima situa ie vom vorbi de o distribu ie normal (gaussian) sau vom afirma c popula ia din eantionul studiat este distribuit normal omogen n raport cu variabil respectiv. n cellalt caz, nu toate cele trei valori sunt reprezentative, motiv pentru care se recomand adoptarea unuia dintre indicatori n func ie de tipul de reparti ie, astfel: - pentru seriile cu reparti ii simetrice, sunt recomandate media i mediana; - cnd distribu ia este asimetric, se prefer valoarea modal.
40

ntre aceste trei caracteristici medii de baz exist o rela ie aproximativ, stabilit de G.U. Yule i M. G. Kendall, valabil pentru distribu ii moderat asimetrice: (8) M o = M e 3( x M e )

4.5. REPREZENTRI TIP BOXPLOT O modalitate specific de a reprezenta tendin a cazurilor unei serii statistice de a se grupa n jurul unor valori centrale o reprezint diagramele de tip Boxplot. Acestea marcheaz printr-un dreptunghi (o cutie) cele trei quartile Q1, Q2, i Q3 ale oricrei serii statistice i prin dou linii distincte cea mai mic, respectiv cea mai mare valoare a seriei. Din acest motiv, despre aceast reprezentare se mai spune c reprezint o rezumare prin cinci valori. ntre cele dou quartile Q1 i Q3 (n interiorul dreptunghiului) se regsesc 50% din cazuri. Mai mult, sunt reprezentate, atunci cnd este cazul, valorile extreme7 (mai mici/mari de 1.5, respectiv 3 lungimi de cutie8 simbolizate prin cerc, respectiv asterisc).
Reprezentare grafic de tip Boxplot a variabilei Vrsta subiec ilor
50
8

40
21

30

20

10
N= 32

varsta subiectilor

4.6. UTILIZAREA SPSS PENTRU CALCULAREA I REPREZENTAREA INDICATORILOR DE


POZI IE

Cu ajutorul programului SPSS valorile tendin ei centrale se ob in cu mare uurin , existnd mai multe posibilit i. Una dintre posibilit i este amintit n capitolul anterior, presupunnd traseul:

Analyze Descriptive Statistics Frequencies


Dup ce, n fereastra de dialog pentru calculul frecven elor (vezi figura 2.1.), selectm variabila sau variabilele dorite, apsm butonul Statistics i vom ptrunde ntr-o nou fereastr de op iuni (figura 4.1).

7 8

n englez, outliers. Lungimea (nl imea) cutiei reprezint abaterea interquartil: I = Q3 Q1 - vezi cap. 4.

41

Figura 4.1. Fereastr de op iuni pentru calculul unor indicatori statistici


La rubrica Percentile Values putem opta pentru calculul quartilelor sau a oricror altor quantile (Percentiles) care s mpart seria n intervale egale (equal groups), sau inegale. La rubrica Central Tendency se opteaz pentru calcularea mediei aritmetice (Mean), medianei (Median), Modului (Mode) sau sumei valorilor (Sum).

Aplica ie: S se deschid fiierul de date Baza totala BOP 2001. Acest fiier con ine 2080 de cazuri i 444 de variabile. S se calculeze indicatorii tendin ei centrale pentru variabila per0vars, variabil care exprim vrstele celor 2080 de subiec i. Rezolvare: Dup selectarea variabilei se dezactiveaz csu a numit Display frequency tables (vezi figura 2.1.), apoi se deschide fereastra Frequencies: Statistics (vezi figura 4.1.) prin apsarea butonului Statistics. Dup ce selectm indicatori dori i se apas Continue, apoi OK; n fereastra de rezultate (Output1 SPSS Viewer) se va ob ine:

Dup titlul Frequencies este afiat un tabel, intitulat Statistics, cu datele generale despre variabila analizat. n exemplul nostru, ne sunt prezentate; - eticheta (Label) variabilei: Varsta subiect, - numrul de cazuri valide: 2074, - numrul de cazuri omise: 6, - Media: 47,98, - Mediana: 47,00, - Modul: 47. * O alt modalitate de a calcula indicatorii tendin ei centrale are n vedere traseul:

Analyze Custom Tables Basic Tables


42

Figura 4.2. Fereastr de dialog pentru construirea unui tabel simplu


Prin aceast comand putem ob ine tabele complexe cu valorile centrale ale unor subgrupuri (Subgroups) alese de cercettor. Vom selecta variabila la rubrica Summaries: i/sau variabila(ele) dup care dorim s mpr im eantionul n subgrupuri (n cele trei ferestre de la rubrica Subgroups, astfel: Down: dac dorim ca valorile variabilei selectate s fie prezentate n acelai tabel, una sub cealalt; Across: dac dorim ca valorile variabilei selectate s fie prezentate n acelai tabel, una lng cealalt; Separate Tables dac dorim ca valorile variabilei selectate s fie prezentate n tabele separate). Nu trebuie uitat accesarea butonului Statistics, ptrunznd astfel ntr-o nou fereastr de op iuni (figura 4.3) n care adugm n fereastra din dreapta acele calcule statistice dorite.

Figura 4.3. Fereastr de op iuni pentru calculul unor indicatori statistici


La rubrica Sorting by Cell Count se poate opta pentru prezentarea datelor ntr-o ordine descendent sau ascendent pe vertical n func ie de frecven ele absolute ale valorilor variabilei de separare n subgrupuri.

Aplica ie: S se deschid fiierul de date Baza totala BOP 2001. Acest fiier con ine 2080 de cazuri i 444 de variabile. S se calculeze indicatorii tendin ei centrale pentru variabila ven, variabil care exprim rspunsurile celor 2080 de subiec i la ntrebarea n luna trecut, suma total de bani ob inut de to i membrii gosp. dvs.... a fost cam de...?, n func ie de variabila per0sex, care reflect sexul responden ilor.
43

Rezolvare: Se parcurge traseul Analyze Custom Tables Basic Tables dup care se selecteaz variabila ven n rubrica Sumaries i variabila per0sex n rubrica Subgroups-Down (vezi figura 4.2.). Apoi se deschide fereastra Basic Tables: Statistics (vezi figura 4.3.) prin apsarea butonului Statistics. Dup ce selectm indicatori dori i (de exemplu, minimum, maximul, media, mediana i modul) se apas Continue, apoi OK; n fereastra de rezultate (Output1 SPSS Viewer) se va ob ine:

Dup titlul Tables este afiat un tabel cu valorile centrale ale variabilei ven n func ie de apartenen a subiec ilor la una dintre cele dou categorii de sex

EXERCI

II I PROBLEME

1. S se creeze n SPSS un fiier de date cu cotele ob inute de 35 subiec i la un test de inteligen (maxim 160) i la examenul de statistic (maxim 10). S se calculeze indicatorii tendin ei centrale pentru cele dou variabile.

2. n fiierul de date Baza totala BOP 2001 s calculeze indicatorii tendin ei centrale pentru variabilele 387 i 395 cu numele sep4 i chel. Aceleai valori s se ob in prin dou ci diferite. S se calculeze valorile centrale n func ie de sexul subiec ilor (variabila 383 cu numele per0sex) i de na ionalitatea lor (variabila 400 cu numele etn1).

3. Construi i n SPSS un fiier de date cu variabile preluate dintr-o cercetare recent desfurat de dumneavoastr (lucrarea de licen , dac e cazul). Acolo unde este cazul, s se calculeze indicatorii tendin ei centrale.

44

5. INDICATORI AI VARIA IEI I INDICATORI AI FORMEI


5.1. Indicatori simpli ai varia iei 5.2. Indicatori sintetici ai varia iei 5.3. Indicatori ai formei distribu iei 5.4. Utilizarea SPSS pentru calcularea indicatorilor varia iei i ai formei

Utilizarea mediei pentru caracterizarea a ceea ce este comun i tipic n colectivit ile statistice trebuie s fie nso it de verificarea reprezentativit ii acesteia pentru ntreaga serie de valori individuale. Vom analiza cu ajutorul unei alte categorii de indicatori, numi i indicatori ai varia iei (sau de dispersie, sau de mprtiere), msura n care valorile individuale variaz n jurul mediei sau, altfel spus, gradul de mprtiere (de dispersie) a indivizilor n cadrul seriei de valori pe care acetia le iau. Putem avea serii statistice cu aceeai medie, ns cu o distribu ie a valorilor diferit, adic eantioane diferite din punct de vedere al variabilit ii i omogenit ii (vezi figura 5.1.). La rndul lor, indicatorii varia iei se mpart n indicatori simpli i indicatori sintetici.

Figura 5.1. Serii statistice cu aceleai valori centrale, dar cu grade diferite de variabilitate

5.1. INDICATORI SIMPLI AI VARIA IEI Se ob in prin compararea a doi termeni din serie sau prin compararea oricrui termen al seriei cu o valoare fix din cadrul seriei. Indicatorii simpli sunt amplitudinea, abaterea interquartil i abaterile individuale. To i indicatori pot fi exprima i n mrimi absolute (adic n unitatea de msur a caracteristicii analizate) sau n mrimi relative, calculate n raport cu media sau mediana. AMPLITUDINEA Amplitudinea (A),9 se ob ine prin diferen a dintre valoarea cea mai mare i cea mai mic a caracteristicii respective. Amplitudinea absolut:
A = x max x min

(1)

n englez: Range.

Amplitudinea relativ:

Ar =

x max x min x

(1)

Acest indicator este cel mai simplu de calculat dar i cel mai dezavantajos, deoarece ine seama doar de dou valori, cele extreme, fr a oferii informa ii despre termenii din interiorul seriei. Iat dou serii statistice (de exemplu: notele ob inute de elevi unei clase la dou discipline diferite) care au aceeai amplitudine: prima serie: a doua serie: 2 3 4 4 4 5 5 6 6 6 6 7 7 8 8 8 9 9 10 2 5 5 5 5 5 6 6 6 6 6 6 6 6 7 7 7 7 10

n ambele cazuri amplitudinea va fi 8 (A = xmax xmin = 10 2 = 8), ns prima serie prezint o varia ie real a notelor, pe cnd n cea de-a doua valorile extreme pot fi considerate excep ii (atipice), nivelul redus al varia ie nefiind reflectat deloc n valoarea amplitudinii. Din aceste motive, utilizarea amplitudinii n vederea caracterizrii omogenit ii/eterogenit ii unei serii statistice trebuie fcut cu rezerve, doar atunci cnd valorile extreme nu se abat foarte mult de la ceilal i termeni ai seriei.

ABATEREA INTERQUARTIL Abaterea interquartil (I) sau abaterea quartil, se ob ine prin diferen a dintre quartila cea mai mare i cea mai mic a caracteristicii respective10. Dup cum am aflat n capitolul anterior, quartilele sunt n numr de trei (notate Q1, Q2, Q3); ele mpart seria statistic n patru pr i egale. Reamintim c Q2 este de fapt mediana seriei. Abaterea interquartil absolut: Abaterea interquartil relativ:

I = Q3 Q1 Ir = Q3 Q1 Q2

(2) (2)

Prin utilizarea acestui indicator sunt eliminate valorile extreme, mai precis, valorile situate n primul sfert (ntre xmin i Q1) i ultimul sfert (ntre Q3 i xmax) al seriei, reducndu-se astfel influen a acestora. Abaterea interquartil este preferat n locul amplitudinii atunci cnd valorile extreme din cadrul seriei sunt atipice, adic se abat prea mult de la ceilal i termeni ai seriei. Acest indicator este reprezentat grafic cu ajutorul diagramelor de tip Boxlot. Relund exemplul de mai sus, pentru a doua serie statistic abaterea interquartil este I = Q3 Q1 = 7 5 = 2, ceea ce reflect mult mai bine lipsa de varia ie a valorilor seriei. 2 5 5 5 5 5 6 6 6 6 6 6 6 6 7 7 7 7 10 xmin Q1 Q2 = Me Q3 xmax Cu toate acestea, nici n acest caz nu avem informa ii despre ce se ntmpl ntre cele dou quartile extreme, mai mult, apare dezavantajul eliminrii a jumtate din termenii seriei (din acest motiv, uneori calculm abaterea interdecil, care elimin o cincime dintre valori, sau chiar abaterea intercentil, aceasta eliminnd doar a cincizecia parte dintre valori). Toate aceste dezavantaje induse de amplitudine i de abaterea interquartil pot fi eliminate dac se calculeaz abaterile (diferen ele) nu doar dintre dou valori, ci ntre toate valorile seriei respective. Se ob ine astfel un indicator cunoscut sub numele de indicele lui

10

Similar pot fi definite abaterile interdecile sau intercentile.

46

Gini11, mai pu in folosit de ctre psihologi, sociologi sau pedagogi. Mai cunoscute sunt acele abateri calculate pentru toate valorile caracteristicii prin raportare la o valoare fix, de obicei media sau mediana.

ABATERILE INDIVIDUALE Abaterile individuale ( d i ), mai precis abaterile individuale de la medie12, se ob in prin diferen a dintre fiecare valoare i media aritmetic a caracteristicii respective. La fel pot fi calculate abaterile individuale de la median sau de la oricare alt valoare din cadrul seriei. Abaterile individuale absolute:

d i = xi x d ri = xi x x

(3)

Abaterile individuale relative:

(3)

Abaterile individuale ne ofer informa ii doar despre pozi ia unuia sau altuia dintre subiec i n raport cu media seriei, fr ns a surprinde n mod sintetic gradul de varia ie al caracteristicii. Pentru aceasta trebuie considerate toate abaterile individuale ale valorilor caracteristicii de la media lor, lucru posibil de realizat doar cu ajutorul indicatorilor sintetici ai varia iei.

Aplica ie: Notele ob inute de 19 studen i la un examen sunt urmtoarele: 2 3 4 4 4 5 5 6 6 6 6 7 7 8 8 8 9 9 10 S se calculeze indicatorii simpli ai varia iei, n mrimi absolute i relative. Rezolvare:
Mai nti se calculeaz media: x =

xi 117 = = 6,16 . n 19

Celelalte repere importante sunt: 2 3 4 4 4 5 5 6 6 6 6 7 7 8 8 8 9 9 10 xmin Q1 Q2 = Me Q3 xmax Amplitudinile vor fi:

A = x max x min = 10 2 = 8 x x min 10 2 Ar = max = = 1,30 6,16 x Abaterile interquartilice se calculeaz astfel: I = Q3 Q1 = 8 4 = 4 Ir =

Q3 Q1 8 4 = = 0,66 Q2 6 Abaterile individuale absolute vor fi n numr de nousprezece, astfel:

11

Indicele lui Gini (dup numele statisticianului italian Corado Gini) este definit ca: media aritmetic a diferen elor dintre toate perechile de valorii, diferen e luate n valoare absolut/n modul (pentru formule vezi Rotariu et. al., 1999, p. 52). 12 n practica statistic cele mai dese abateri individuale sunt calculate n raport cu media aritmetic, din acest motiv de cele mai multe ori, pentru a simplifica, vom folosi termenul de abatere individual n locul celui de abatere individual de la medie.

47

d 1 = x1 x = 2 6,16 = 4,16 ; d 2 = x 2 x = 3 6,16 = 3,16 ;

d 3 = d 4 = d 5 = x3 x = 4 6,16 = 2,16 ; d 6 = d 7 = 5 6,16 = 1,16 ;


d 8 = d 9 = d 10 = d 11 = 6 6,16 = 0,16 ; d 12 = d 13 = 7 6,16 = 0,84 ;
d 14 = d 15 = d 16 = 8 6,16 = 1,84 ; d 17 = d 18 = 9 6,16 = 2,84 ;

d 19 = 10 6,16 = 3,84 . Prin raportare la medie vom ob ine i valorile abaterilor individuale relative: Iat cteva dintre ele: x x 2 6,16 x x 3 6,16 d r1 = 1 = = 0,67 ; d r 2 = 2 = = 0,51 ; 6,16 6,16 x x d r 3 = d r 4 = d r 5 = 0,35 d r17 = d r18 = 0,46 ; d r19 = 0,62 .

5.2. INDICATORI SINTETICI AI VARIA IEI Aceti indicatori au la baz calcularea valorii medii a tuturor abaterilor individuale ale variantelor de la media lor (se poate lua ca reper i mediana seriei sau oricare alt valoare a seriei!). Se realizeaz astfel o sintetizare a varia iei unei caracteristici printr-o singur expresie numeric. Indicatorii sintetici sunt abaterea medie liniar, dispersia, abaterea medie ptratic i coeficientul de varia ie. Vom prezenta formulele pentru seriile simple i pentru seriile (distribu iile) de frecven e.

ABATEREA MEDIE LINIAR Abaterea medie liniar ( d ) sau pur i simplu abaterea medie,13 se calculeaz ca o media aritmetic (simpl sau ponderat) a tuturor abaterilor individuale, luate n valoare absolut (fr a lua n considerare semnul sau +).

Abaterea medie n cazul seriilor simple:

d=

x
(4)

Abaterea medie n cazul seriilor de frecven e:

d=

x x f f
i i

(4)

Abaterea medie ne arat cu ct se abate n medie fiecare valoare de la nivelul mediu i se exprim n unitatea de msur a caracteristicii studiate. Dezavantajul acestui indicator const n faptul c el acord aceeai importan tuturor abaterilor individuale, fr s in seama de abaterile individuale mai mari care, n valoare absolut, influen eaz n mai mare msur gradul de varia ie.

DISPERSIA Dispersia ( 2 ) sau varian a,14 se calculeaz ca o media aritmetic (simpl sau ponderat) a ptratelor abaterilor individuale ale tuturor valorilor fa de media lor.

13

i de data aceasta, pentru simplificare, atunci cnd folosim termenul de abatere medie ne referim la abaterea medie de la medie. Se poate calcula abaterea medie de la median sau de la oricare alt valoare a seriei. 14 n englez: variance.

48

Dispersia n cazul seriilor simple:

(x =

n
2

(5)

Dispersia n cazul seriilor de frecven e:

(x x ) = f
i i

fi

(5)

Simbolul acestui indicator este litera greceasc sigma (2) ridicat la ptrat. Sunt autori care sus in c termenul de dispersie ar trebui evitat deoarece el este unul generic, fiind utilizat pentru to i indicatorii din categoria celor care reflect mprtierea valorilor (Rotariu et. al., 1999, p. 42). Pe de alt parte, varian a reprezint indicatorul sintetic de baz al dispersiei(Luduan et. al., 1997, p. 277), indicatorul statistic cel mai utilizat pentru aprecierea mprtierii datelor(Clocotici & Stan, 2000, p. 68). Dincolo de aceste opinii divergente, suntem de prere c el nu trebuie neglijat, oferindune date despre gradul de omogenitate/eterogenitate al caracteristicii vizate; utilitatea lui o vom vedea la calculul urmtorului indicator.

ABATEREA MEDIE PTRATIC Abaterea medie ptratic ( ), numit i abaterea standard15 sau abaterea tip,16 reprezint rdcina ptrat a dispersiei. Abatere medie ptratic n cazul seriilor simple:

= =

(x

(6)

Abaterea medie ptratic n cazul seriilor de frecven e:

= =

(x x ) f
i i

fi

(6)

Remarcm, n acord cu T. Rotariu (1999), dou propriet i simple ale abaterii standard: dac toate valorile seriei statistice se nmul esc cu o constant c, atunci i abaterea standard se va multiplica cu aceeai valoare c. Altfel spus: dac , atunci  EMBED Equation.3  . dac la toate valorile seriei statistice se adaug (scade) o constant c, atunci abaterea standard nu se modific. Altfel spus: dac  EMBED Equation.3  sau  EMBED Equation.3 , atunci  EMBED Equation.3  . Mult mai des folosit n analiza seriilor statistice, abaterea medie ptratic are acelai avantaj ca i abaterea medie liniar, i anume, se exprim n aceeai unitate de msur a caracteristicii studiate. Ca i la dispersie, o valoarea sczut a abaterii standard reflect o serie statistic omogen; n caz contrar vorbim de eterogenitatea seriei. Mai mult, pe graficul distribu iei acest indice marcheaz punctele de inflexiune ale curbei. Totui, atunci cnd dorim s comparm serii statistice cu unit i de msur diferite, ultimii doi indicatori nu ne mai sunt de folos. Vom folosi un alt indicator: coeficientul de varia ie.
15

n englez: standard deviation. Abaterea standard se refer doar la abaterea medie ptratic fa de medie. Putem calcula i abaterea medie ptratic fa de median, prin nlocuirea n cele dou formule a mediei cu mediana. 16 n francez: cart type.

49

Coeficientul de varia ie Coeficientul de varia ie (V) reprezint raportul dintre abaterea medie ptratic i media colectivit ii studiate. Se folosete atunci cnd dorim s comparm gradul de mprtiere al unor serii statistice exprimate n unit i de msur diferite (de exemplu: nl imile a dou eantioane de subiec i, exprimate n centimetrii, respectiv n inch). De asemenea, utilizm acest indicator i cnd seriile statistice au aceeai unitate de msur, dar nivelul general al valorilor caracteristicii studiate este total diferit (de exemplu: nl imile unor copii de la grdini i cele ale unor elevi de liceu, exprimate n centimetri).

Coeficientul de varia ie:


V =

100

(7)

Acest indicator se exprim n procente (se poate elimina nmul irea cu 100; vom ob ine valori ntre 0 i 1) i ne arat gradul de omogenitate/eterogenitate al colectivit ii statistice studiate, astfel: cu ct valoarea coeficientului de varia ie este mai aproape de zero, cu att varia ia este mai mic, deci colectivitatea este mai omogen. Limita maxim admis pentru ca un eantion s fie considerat omogen iar media s fie reprezentativ pentru colectivitatea respectiv este de 35% (Novak, 1995). Nici acest ultim indicator nu este lipsit de contraindica ii! Cel pu in dou aten ionri trebuie fcute: - formula coeficientului de varia ie este aplicabil doar n cazul variabilelor msurate pe scale de rapoarte, cu origine zero natural; - nu oricare dou caracteristici pot fi comparate cu ajutorul coeficientului de varia ie (de exemplu: este inutil s comparm un eantion dup salariul membrilor cu alt eantion n care avem n vedere numrul de la pantofi! dup Rotariu et.al., 1999, p. 59).

Aplica ie: Dou grupe de elevi ob in la o tez urmtoarele note: Grupul A: 6 6 6 7 7 7 8 8 8 Grupul B: 6 6 7 7 7 8 8 8 9 9 S se calculeze media, dispersia, abaterea standard i coeficientul de varia ie pentru fiecare serie n parte. S se compare indicatorii celor dou serii statistice. Rezolvare: Se observ c avem dou serie statistice simple, ordonate cresctor. ntr-o prim variant, putem face calculele aplicnd formulele (4), (5), (6) i (7). Vom folosi acest procedeu pentru grupul A. Pentru grupul B vom alege o a doua variant de lucru: vom transforma seriile statistice simple n distribu ii de frecven e, i vom folosi formulele (4), (5), (6) i (7).

50

Pentru grupul A: Note xi x xi 6 6 6 7 7 7 8 8 8 n=9 xi = 63 -1 -1 -1 0 0 0 1 1 1 |xi x | 1 1 1 0 0 0 1 1 1 |xi x | = 6 (xi x )2 1 1 1 0 0 0 1 1 1 (xi x )2 = 6

x=

xi 63 = =7 n 9

d=
=
6 0.67 9

6 0.67 9

2 =
V=

(x

n 100 =

= 2 = 0.67 0.82

0.82 100 = 11.71 7

Pentru grupul B: Note (grupa Frecven te pe a xi fi (xi x )2 fi xi x |xi x | fi (xi x )2 varian absolut fi te) xi 6 2 12 - 1.5 3 2.25 4.50 7 3 21 - 0.5 1.5 0.25 0.75 8 3 24 0.5 1.5 0.25 0.75 9 2 18 1.5 3 2.25 4.50 n= xi fi = |xi x | fi (xi x )2 fi = fi=10 75 =9 10.50

x=

xi f i 75 = = 7.5 f i 10

d=

x x f f
i i

9 = 0. 9 10

2 =


(x x ) f
i i

fi

10.50 = 1.05 10

= 2 = 1.05 1.03

51

Dei diferen ele dintre valorile indicatorilor de dispersie sunt mici putem observa c prima serie este mai omogen, to i indicatori de mprtiere avnd valori mai mici dect cei ai grupului B.

5.3. Indicatori ai formei distribu iei Gradul de mprtiere a valorilor unor serii statistice determin i forme diferite ale reprezentrilor grafice ataate acestor distribu ii statistice. Pentru a reflecta forma unei distribu ii, mai ales pentru a face compara ii ntre dou sau mai multe serii, ne folosim de o alt categorie de indicatori, numi i indicatori ai formei. Cei doi indicatori folosi i n statistica social sunt: oblicitatea i boltirea. Indicatorul oblicit ii (de asimetrie) Oblicitatea a fost propus de ctre Pearson pentru aprecierea gradului de simterie/asimetrie a unei serii statistice. Se calculeaz cu una din formulele: Oblicitatea:  EMBED Equation.3  sau  EMBED Equation.3  sau (8) (8) (8)

O=

(x

x) 3

n 3

Prin ridicarea abaterilor individuale la puterea a treia (formula 8) se acord o mai mare importan valorilor extreme. Putem analiza astfel gradul de asimetrie al distribu iei, altfel spus, tendin a valorilor de a se grupa spre una din cele dou extreme. n cazul distribu iilor simetrice, deoarece media i modul sunt identice, oblicitatea va fi 0. n cazul curbelor de distribu ie asimetrice, alungite spre dreapta sau spre stnga, oblicitatea va fi o valoarea pozitiv, respectiv negativ.

INDICATORUL BOLTIRII (DE EXCES, DE APLATIZARE) Boltirea18 exprim nl imea cocoaei curbei de distribu ie, comparativ cu cea normal. Ne arat msura n care o distribu ie este mai plat sau mai boltit. Boltirea:

(x B=

x) 4

n 4

(9)

Pentru valori pozitive ale acestui indicator spunem c avem o distribu ie leptocurtic (cu cocoa nalt). n cellalt sens, distribu ia va fi platicurtic (cu cocoa aplatizat) vezi figura 5.1.

17 18

n englez: skewness. n englez: kurtosis (=cocoa).

52

5.4. UTILIZAREA SPSS PENTRU CALCULAREA INDICATORILOR VARA

IEI I AI FORMEI

i de aceast dat dispunem de mai multe posibilit i pentru a calcula indicatorii varia iei sau pe cei ai formei unei serii statistice. Ca i n capitolele anteriore, prezentm pentru nceput solu ia parcurgerii urmtoarelor comenzi:

Analyze Descriptive Statistics Frequencies


Dup ce, n fereastra de dialog pentru calculul frecven elor (vezi figura 2.1.), selectm variabila sau variabilele dorite, apsm butonul Statistics i vom ptrunde ntr-o nou fereastr de op iuni (figura 5.1).

Figura 5.1. Fereastr de op iuni pentru calculul unor indicatori statistici


La rubrica Dispersion putem opta pentru calculul abaterii standard (Std. deviation), a varian ei, a amplitudinii (Range), a valorilor minime i maxime i a erorii standard a mediei (S.E. mean). La rubrica Distribution se opteaz pentru calcularea oblicit ii (Skewness) sau boltirii (Kurtosis).

Aplica ie: S se deschid fiierul de date Baza totala BOP 2001. Acest fiier con ine 2080 de cazuri i 444 de variabile. S se calculeze indicatorii varia iei i ai formei pentru variabila per0vars, variabil care exprim vrstele celor 2080 de subiec i. Rezolvare: Dup selectarea variabilei se dezactiveaz csu a numit Display frequency tables (vezi figura 2.1.), apoi se deschide fereastra Frequencies: Statistics (vezi figura 5.1.) prin apsarea butonului Statistics. Dup ce selectm indicatori dori i se apas Continue, apoi OK; n fereastra de rezultate (Output1 SPSS Viewer) se va ob ine:

53

Dup titlul Frequencies este afiat un tabel, intitulat Statistics, cu indicatorii solicita i despre variabila analizat. n exemplul nostru, ne sunt prezentate; - eticheta (Label) variabilei: Varsta subiect, - numrul de cazuri valide: 2074, - numrul de cazuri omise: 6, - Eroarea standard a mediei: 0.379, - Abaterea standard: 17.275, - Varia ia (Dispersia): 298.419, - Oblicitatea: 0,152, mpreun cu eroarea se medie: 0.054, - Boltirea: -0.970, mpreun cu eroarea se medie: 0.107, - Amplitudinea: 76, - Valoarea minim: 18, - Valoarea maxim: 94. * Aceiai indicatori ai varia iei i ai formei i ob inem selectnd urmtoarele submeniuri:

Analyze Descriptive Statistics Descriptives


Va aprea o fereastr n care selectm variabila sau variabilele dorite (vezi figura 5.2.), dup care prin accesarea butonului Options vom intra ntr-o nou fereastr n care bifm indicatorii ce dorim a fi calcula i (vezi figura 5.3.).

Figura 5.2. Fereastr de dialog pentru selectarea variabilelor supuse unei analize statistice descriptive
Ceea ce aduce nou aceast op iune este posibilitatea alegerii ordinii de afiare, n cazul n care facem calcule pentru mai multe variabile. La rubrica Display Order putem opta pentru: - afiarea variabilelor n ordinea din fiier (se bifeaz Variable list); - afiarea variabilelor n ordine alfabetic (se bifeaz Alphabetic); - afiarea variabilelor n ordine cresctoare/descresctoare amediei (se bifeaz Ascending/Descending means). 54

Figura 5.3. Fereastr de op iuni pentru calculul unor indicatori ai varia iei i ai formei
Pe acelai traseu (se apas Continue, apoi OK) vom ob ine n fereastra de rezultate (Output1 SPSS Viewer) valorile indicatorilor solicita i. * O alt modalitate de a calcula o parte din indicatorii varia iei i/sau ai formei are n vedere traseul:

Analyze Custom Tables Basic Tables

Figura 5.4. Fereastr de dialog pentru construirea unui tabel simplu


Prin aceast comand putem ob ine tabele complexe cu indicatorii unor subgrupuri (Subgroups) alese de cercettor. Vom selecta variabila(ele) la rubrica Summaries: i/sau variabila(ele) dup care dorim s mpr im eantionul n subgrupuri (n cele trei ferestre de la rubrica Subgroups), astfel: Down: dac dorim ca valorile variabilei selectate s fie prezentate n acelai tabel, una sub cealalt; Across: dac dorim ca valorile variabilei selectate s fie prezentate n acelai tabel, una lng cealalt; Separate Tables dac dorim ca valorile variabilei selectate s fie prezentate n tabele separate). Nu trebuie uitat accesarea butonului Statistics, ptrunznd astfel ntr-o nou fereastr de op iuni (figura 5.5) n care adugm n fereastra din dreapta acele calcule statistice dorite.

55

Figura 5.5. Fereastr de op iuni pentru calculul unor indicatori statistici


La rubrica Sorting by Cell Count se poate opta pentru prezentarea datelor ntr-o ordine descendent sau ascendent pe vertical n func ie de frecven ele absolute ale valorilor variabilei de separare n subgrupuri.

Aplica ie: S se deschid fiierul de date Baza totala BOP 2001. Acest fiier con ine 2080 de cazuri i 444 de variabile. S se calculeze indicatorii varia iei i ai formei pentru variabila ven, variabil care exprim rspunsurile celor 2080 de subiec i la ntrebarea n luna trecut, suma total de bani ob inut de to i membrii gosp. dvs.... a fost cam de...?, n func ie de variabila per0sex, care reflect sexul responden ilor. Rezolvare: Se parcurge traseul Analyze Custom Tables Basic Tables dup care se selecteaz variabila ven n rubrica Sumaries i variabila per0sex n rubrica Subgroups-Down (vezi figura 5.4.). Apoi se deschide fereastra Basic Tables: Statistics (vezi figura 5.5.) prin apsarea butonului Statistics. Dup ce selectm indicatori dori i (de exemplu, abaterea standard i dispersia) se apas Continue, apoi OK; n fereastra de rezultate (Output1 SPSS Viewer) se va ob ine:

Dup titlul Tables este afiat un tabel cu indicatorii de dispersie ai variabilei ven n func ie de apartenen a subiec ilor la una dintre cele dou categorii de sex

56

EXERCI

II I PROBLEME

1. S se creeze n SPSS un fiier de date cu cotele ob inute de 35 subiec i la un test de inteligen (maxim 160) i la examenul de statistic (maxim 10). S se calculeze indicatorii varia iei i ai formei pentru cele dou variabile.

2. n fiierul de date Baza totala BOP 2001 s calculeze indicatorii varia iei i ai formei pentru variabilele 387 i 395 cu numele sep4 i chel. Aceleai valori s se ob in prin dou ci diferite. S se calculeze abaterea standard i varian a n func ie de sexul subiec ilor (variabil 383 cu numele pr0sex) i de na ionalitatea lor (variabil 400 cu numele etn1).

3. ntr-un experiment, aceeai problem a fost dat spre rezolvare la dou grupe de elevi: o echip de 10 elevi olimpici i alta format din 16 elevi ne-olimpici. Iat timpii (n minute) necesari elevilor pentru rezolvarea problemei: olimpici: 70 55 15 10 5 5 5 3 3 2 ne-olimpici: 95 95 95 90 90 90 90 90 90 80 80 75 75 60 50 45 S se calculeze indicatorii tendin ei centrale, ai varia iei i ai formei pentru cele dou serii de date. S se compare valorile ob inute.

4. Distribu ia popula iei unei localit i rurale n func ie de vrst este urmtoarea: 1-10 10-20 20ani ani 30 ani Frecven a 12 9 14 Vrsta 3040 ani 24 4050 ani 33 5060 ani 35 6070 ani 42 7080 ani 21 8090 ani 16 90- Total 100 ani 4 210

S se calculeze: - media, mediana i modul; - dispersia, abaterea medie ptratic i coeficientul de varia ie; - prezenta i grafic distribu ia (histogram i poligonul frecven elor).

5. Construi i n SPSS un fiier de date cu variabile preluate dintr-o cercetare recent desfurat de dumneavoastr (lucrarea de licen , dac e cazul). Acolo unde este cazul, s se calculeze indicatorii varia iei i ai formei.

57

BIBLIOGRAFIE

Bdi , Maria i Cristache, Silvia Elena - Statistic aplica ii practice. Bucureti, Editura Mondan, 1998. Biji, Mircea i Biji, Elena - Statistic teoretic. Bucureti, Editura Didactic i Pedagogic, 1979. Blezu, Dorin Statistica. Sibiu, Editura Alma Mater, 2002. Boudon, Raymond Les mathematiques en sociologie. Paris, PUF, 1971. Clocotici, Valentin i Stan, Aurel Statistic aplicat n psihologie. Iai, Polirom, 2000. Cramer, Duncan Introducing Statistics for Social Research. London, Routledge, 1994. Culic, Irina Metode avansate n cercetarea social Analiza multivariat de interdependen . Iai, Polirom, 2004. Dragoman, Drago Metode de analiz aplicate n tiin ele politice. Sibiu, Continent, 2003. Gheorghiu, Dumitru Statistic aplicat n psihologie. Sibiu, Continent, 2003. Giulvezan, C., Zaporojan, G. i Grindeanu, S. Introducere n informatica social. Timoara, Editura de Vest, 2000. Gravetter, F.J. i Wallnau, L.B. Statistics for the Behavioral Sciences (3rd ed.). St. Paul, West Publishing Company, 1992. Hartley, Alick Bazele statisticii. Bucureti, Editura Niculescu SRL, 1999. Jaba, Elisabeta i Grama, Ana Analiza statistic cu SPSS sub Windows. Iai, Polirom, 2004. Luduan, Nicolae i Voiculescu, Florea - Msurarea i analiza statistic n tiin ele educa iei. Sibiu, Editura IMAGO, 1997. Novak, Andrei - Statistic social aplicat. Bucureti, Editura Hyperion, 1995. Popescu, Angela - Statistic. Bucureti, Editura Funda iei Romnia de Mine, 2000. Porojan, Dumitru - Statistica i teoria sondajului. Bucureti, Casa de editur i pres ansa S.R.L., 1993. Radu I. (coord.) Metodologia psihologic i analiza datelor, Cluj-Napoca, Editura Sincron, 1993 Rateau, Patrick Metodele i statisticele experimentale n tiin ele umane. Iai, Polirom, 2004. Rotariu, Traian (coord.) Metode statistice aplicate n tiin ele sociale. Iai, Polirom, 1999. Sandu, Dumitru Statistica n tiin ele sociale, Universitatea din Bucureti, 1992. Sava, Florin Analiza datelor n cercetarea psihologic. Cluj-Napoca, Editura A.S.C.R., 2004. Simion, Doina Maria Bazele statisticii. Sibiu, Editura Alma Mater, 2002. * * * SPSS 7.5 for Windows - Brief Guide. Chicago, Prentice-Hall Inc., 1997. Yule, G.U. i Kendall, M.G. Introducere n teoria statisticii. Bucureti, Editura tiin ific, 1969. http://www.spss.ro http://www.statsoftinc.com/ http://statisticasociala.tripod.com

S-ar putea să vă placă și