Sunteți pe pagina 1din 7

STATISTICA N CERCETAREA PSIHOLOGIC Note de curs

Tema 4. Ordonarea, gruparea i prezentarea datelor statistice


4.1. Serii (distribuii) statistice 4.2. Gruparea (sistematizarea) datelor 4.3. Prezentarea datelor sub form de tabele 4.4. Reprezentarea grafic a datelor statistice 4.1. Serii (distribuii) statistice n cazul unui numr foarte mare de date este imposibil (i inutil) analiza fiecrei valori n parte. n aceast situaie, naintea prelucrrii i analizei datelor se utilizeaz ordonarea, gruparea i organizarea lor. Rezultatul ordonrii i gruprii datelor statistice l constituie seriile (distribuiile) statistice de frecvene. Acestea sunt formate din dou iruri paralele de date din care unul reprezint variantele/valorile variabilei (sau grupele de variante), iar cellalt numrul de uniti statistice corespunztoare fiecrei valori sau variante (frecvenele absolute sau relative). Fiecare frecven asociat valorii/variantei respective a caracteristicii studiate reprezint un termen al seriei statistice.

n funcie de modul de prezentare al variantelor, seriile statistice, se mpart n: o serii simple obinute prin simpla niruire a valorilor individuale. Acestea sunt ulterior supuse operaiilor de ordonare i grupare (dac numrul lor este suficient de mare), obinndu-se astfel unul din urmtoarele dou tipuri de serii. serii de (pe) variante cnd fiecrei variante i revine un anumit numr de uniti. serii de (pe) intervale cnd fiecrui interval, mrginit de o limit inferioar i de una superioar, i revine un anumit numr de uniti. Ultimele dou tipuri se mai numesc i serii (repartiii) de frecvene i formeaz ceea ce se numete distribuie statistic. n funcie de natura i modul de manifestare ale variabilei studiate se disting dou tipuri principale de serii statistice: serii statistice cantitative sau calitative. La acestea pot fi adugate alte dou tipuri de distribuii statistice, la care criteriul dup care se face diferenierea este spaiul sau timpul: serii statistice spaiale i cronologice. Aceste criterii nu numai c realizeaz o clasificare a seriilor statistice, dar determin limitele i specificul prelucrrilor statistice complexe. Atunci cnd variabilele sunt cantitative se utilizeaz tehnici statistice parametrice; n cellalt caz, al caracteristicilor calitative, - tehnici statistice non-parametrice.

STATISTICA N CERCETAREA PSIHOLOGIC Note de curs n concluzie, seria statistic de frecvene este rezultatul operaiilor de ordonare i grupare. Prezentarea seriilor statistice se face sub forma niruirii, pe orizontal sau pe vertical, a unor perechi de numere sau expresii, n care primul element reprezint caracteristica (ce poate fi cantitativ sau calitativ, spaial sau cronologic), iar al doilea frecvena, ntotdeauna numeric, a variantelor sau grupelor de variante ce delimiteaz caracteristica respectiv. n rapoartele de cercetare aceste distribuii statistice, unele reflectnd mai multe caracteristici concomitent, sunt ilustrate cu ajutorul tabelelor i al graficelor. Reamintim urmtotaii cu care operm n prezentarea i prelucrarea distribuiilor statistice: - variantele sau grupele (clasele) de variante, xi: x1, x2, xk, - frecvena variantei xi (numrul de apariii), i: 1, 2, k, - numrul total de variante (total frecvene) n: n = i i = 1, 2, k, n cazul seriilor statistice de intervale se presupune c toate valorile din interiorul fiecrei grupe (clase) se concentreaz n valoarea central a clasei, notat tot cu xi. Aceast valoare va nlocui n seria statistic intervalul respectiv i se calculeaz ca medie aritmetic a valorilor extreme ale intervalului: (4.1) Trebuie de menionat c distribuia statistic poate reda pe lng frecvenele absolute ( sau a) i pe cele relative (r). Acestea sunt absolut necesare cnd se dorete compararea unor eantioane cu numrul total de variante (n) diferit (de exemplu: n cazul a dou clase cu numr total de elevi diferit). Mai mult, atunci cnd prelucrrile statistici ulterioare o impun, putem determina i alte frecvene: - frecvena (absolut sau relativ) cumulat cresctor, dat de suma frecvenelor valorilor care apar pn la valoarea xi respectiv, inclusiv; - frecvena (absolut sau relativ) cumulat descresctor, dat de suma frecvenelor valorilor care apar de la valoarea xi respectiv, inclusiv. 4.2. Gruparea (sistemaizarea) datelor Gruparea statistic reprezint o operaie de sistematizare a populaiei pe pri statistic omogene n funcie de variaia unei variabile (sau a mai multora). Importana acestei operaii iniiale deriv din erorile ce pot fi induse fie n cazul stabilirii unui numr foarte mare de grupe (clase) situaie n care se ajunge la frmiarea colectivitii , fie n situaia alegerii unui numr prea mic de grupe, cu intervale foarte mari n cadrul lor. n cazul variabilelor numerice (cantitative) pot fi: 1) grupri pe variante utilizate n cazul variabilelor de tip discret, cnd ele pot lua doar valori ntregi (exemple: numrul membrilor unei familii, notele colare). 2) grupri pe intervale utilizate n cazul variabilelor de tip continuu, cnd ele pot lua orice valoare ntr-un interval finit sau infinit (exemple: timpul de reacie, mediile colare anuale, nlimea). Trbuie de menionat faptul c i variabilele de tip discret pot fi supuse gruprilor pe intervale (exemplu: note

STATISTICA N CERCETAREA PSIHOLOGIC Note de curs ntre 2 i 4; 57; 810 etc.). n ambele situaii mrimea intervalului (K) se obine cu ajutorul formulei lui H.A. Sturges:

(4.2) unde, n reprezint numrul total de varian te. n situaia n care numrul de grupe este ales de cercettor (bazndu-se pe experien i intuiie), mrimea intervalului (K) rezult astfel: - n cazul variabilelor de tip continuu, prin raportarea amplitudinii variaiei (A = xmax - xmin) la numrul de grupe: (4.3) - n cazul variabilelor de tip discret, prin raportarea numrului valorilor diferite ale variabilei (Nx = xmax - xmin +1 = A + 1) la numrul de grupe:

(4. 4) O atenie deosebit trebuie acordat precizrii limitelor sau capetelor in tervalelor. n cazul caracteristicilor discrete limitele intervalelor ies foarte bine n eviden, ele fiind diferite (exemplu: intervalele 24; 57; 810). Mai delicat este cazul caracteristicilor continui, cnd trebuie precizat care dintre intervale include limita sau, altfel spus, care capt al intervalului este deschis/nchis (exemplu: intervalele (24]; (4 6]; (68] etc. sunt deschise n partea stng). Pentru evitarea confuziilor se procedeaz din start la departajarea limitelor, astfel: 2,014; 4,016; 6,018 etc. 4.3. Prezentarea datelor sub form de tabel Prezentarea datelor sub forma unui tabel statistic permite att o bun vizualizare ct i, mai ales, efectuarea diverselor calcule n procesul de prelucrare a datelor. n elaborarea unui tabel pot fi identificate urmtoarele elemente i reguli principale: titlul tabelului - care trebuie s fie clar, scurt i s defineasc exact fenomenul pe care l reprezint i, dup caz, perioada la care se refer; macheta tabelului - format din liniile orizontale (rnduri) i liniile verticale (coloane) din ntretierea crora apar rubricile (celulele, csuele) care conin datele numerice i/sau denumirile textuale; subiectul tabelului - nscris de obicei la captul rndurilor, este constituit din unitile populaiei statistice (ex.: grupe de note, grupe de puncte etc); predicatul tabelului - nscris de obicei la captul coloanelor, cuprinde ansamblul indicatorilor care se nregistreaz la nivelul unitilor populaiei statistice;

STATISTICA N CERCETAREA PSIHOLOGIC Note de curs indicarea obligatorie a sursei de date, atunci cnd este cazul (de obicei sub tabel); se recomand indicarea unitilor de msur n care se exprim datele (de obicei, ntre titlul i macheta tabelului); se recomand numerotarea tabelelor - pentru identificarea mai uoar a acestora n textul de analiz.

n funcie de scopul ntocmirii, de coninutul lor i de numrul caracteristicilor studiate tabelele pot fi de mai multe tipuri. Astfel: a) Tabele ale unor serii statistice pot fi ntocmite att pentru seriile de variante ct i pentru cele de intervale. Diferena este dat de rndur ile tabelului care vor constitui variantele seriei, n primul caz, sau clasele de variante (eventual valorile centrale), n cel de-al doilea caz. n ambele situaii pe coloane vor fi trecute frecvenele, absolute sau relative, cumulate sau descresctoare. b) Tabele centralizatoare sunt utilizate n toate situaiile n care un numr mare de date trebuie stocate i conservate n vederea prelucrrii lor ulterioare. n lucrrile tiinifice aceste tabele sunt, de obicei, prezentate sub form de anexe, i conin pe coloane totalitatea variabilelor studiate, iar pe rnduri, totalitatea unitilor statistice (colectivitatea statistic) investigate. c) Tabele comparative cuprind fie datele obinute pe eantioane diferite pentru aceeai caracteristic, fie datele aceluiai eantion pentru caracteristici diferite. d) Tabele cu dubl sau tripl intrare. n acest caz, i coloanele i rndurile exprim variaiile uneia sau a dou caracteristicii (variabile). Fiecare celul exprim numrul de uniti statistice caracterizate prin variantele corespunztoare tuturor caracteristicilor de pe orizontal i vertical. 4.4. Prezentare agrafic a datelor statistice Cu ajutorul reprezentrilor grafice sunt vizualizate informaiile statistice, facilitndu-se perceperea pe ansamblu a datelor, sesizarea unor aspecte privind variaia valorilor observate, repartiia lor, legturile existente ntre ele .a. Graficul trebuie s cuprind: - titlul - care poate fi plasat fie sub, fie deasupra graficului i trebuie s precizeze limpede fenomenul pe care l reprezint; - legenda utilizat pentru specificarea anumitor simboluri sau convenii utilizate; - sistemul axelor rectangulare (dac este cazul) - n care linia orizontal (abscis) cuprinde valorile variabile x, iar cea vertical (ordonat) cuprinznd frecvenele f; - se recomand numerotarea graficelor - pentru identificarea mai uoar a acestora. Graficele cel mai des utilizate sunt graficele de tip bar, histogramele, poligoanele de frecvene, i curbele de distribuie, pe abscis notndu-se intervalele de variaie (sau variantele), iar pe ordonat frecvenele corespunztoare acestor intervale (sau variante). Aceste reprezentri grafice se obin prin unirea interseciilor perpendicularelor ridicate din punctele perechi de pe cele dou axe. n cazul seriilor de intervale perpendiculare pentru desemnarea valorii frecvenei se ridic din mijlocul intervalului, respectiv din punctul corespunztor valorii centrale a clasei.

STATISTICA N CERCETAREA PSIHOLOGIC Note de curs Graficele de tip bar se folosesc cnd este necesar reprezentarea a variabilelor cantitative discrete sau variabile categoriale (msurate prin scale nominale sau ordinale). Caracteristic acestui tip de grafic este faptul c barele verticale sunt delimitate de un spaiu, iar ordinea barelor poate fi schimbat. Histogramele i poligoanele de frecvene sunt reprezentrile grafice utilizabile n cazul seriilor statistice cantitative, ns numai atunci cnd variabilele sunt continue. De exemplu, situaia absolvenilor de liceu dup examenul de admitere la facultate (exprimat prin dou variante: admis, respins) va fi reprezentat printr-un grafic de tip bar (deoarece sunt prezente variabile calitative, msurate printr-o scal nominal), iar mediile la bacalaureat ale acelorai absolveni printr-o histogram sau printr-un poligon de frecvene (deoarece este prezent o variabil cantitativ continu sau, altfel spus, o variabil msurat printr-o scal numeric). Pentru a evidenia i/sau compara structurile se utilizeaz diagramele de structur, construite cu ajutorul suprafeelor (cercuri, ptrate, dreptunghiuri), diagramele de comparaie i reprezentrile prin figuri simbolice .a. n multe cazuri, sunt studiate mai multe caracteristici folosindu-se reprezentri grafice complexe precum: piramide ale vrstelor, grafice comparative, grafice combinate.

STATISTICA N CERCETAREA PSIHOLOGIC Note de curs n ce privete diagramele sub forma figurilor geometrice (cerc, ptrat, dreptunghi) utilizate att pentru prezentarea structurilor ct i/sau pentru compararea n timp a evoluiei fenomenelor se procedeaz astfel: - se construiesc cele dou figuri n aa fel, nct raportul dintre raze (sau laturi) s fie proporional cu nivelurile fenomenului studiat n cele dou perioade diferite de timp (n dou localiti etc.); - n cadrul fiecrei figuri geometrice se reprezint structura corespunztoare anului (spaiului geografic) respectiv.

ntrebri de verificare: 1. Care sunt operaiunile de prelucrare a datelor statistice? 2. Care este necesitatea formrii seriilor statistice? 3. Ce reprezint seriile statistice? 4. Ce tipuri de serii statistice cunoatei? 5. n ce forme pot fi prezentate datele statistice?

STATISTICA N CERCETAREA PSIHOLOGIC Note de curs

Note

S-ar putea să vă placă și