Sunteți pe pagina 1din 246

ELEMENTE DE

STATISTIC
APLICAT

1 Univ. drd. MIHAELA SANDU


Lect.

PARTEA NTI
- ELEMENTE DE STATISTIC -

Cuvnt nainte
Statistica a devenit elementul sine qua non al cunoaterii n condiii de
manifestare probabilistic a fenomenelor. Utilizarea statisticii permite att
descrierea fenomenelor i modelarea lor, ct i aplicarea practic a acestora,
accentul punndu-se att pe prezentarea raionamentului statistic ct i a
tehnicilor fundamentale de analiz a datelor experimentale.
Lucrarea de fa constituie o introducere concis i clar n statistica
aplicat n tiinele de factur social i economic, ca produs al faptului social.
Tehnicile statistice prezentate sunt vzute ca instrumente folosite pentru a
rspunde unor probleme de cercetare specifice. Cu alte cuvinte, acest material
nu se adreseaz statisticianului profesionist, ci psihologului, economistului, i
mai larg, oricrui debutant n studiul tiinelor omului, precum i altor persoane
ale cror profesii sunt legate ntr-un fel sau altul de aceste tiine.
Acest carte conine elemente practice. Fiecare capitol i propune
obiective precise i abund de exemple i exerciii. n definitiv, este important s
se stpneasc practica statisticii, s fie utilizat n activitatea de zi cu zi i nu s
se fac doar speculaii teoretice pe aceast tem.
Cartea este dedicat studenilor, n special celor din anul I (i nu numai) i
are ca scop iniierea acestora n demersul statistic i formarea gndirii statistice
necesare nelegerii fenomenelor de mas.
Prima parte conine pe VIII capitole, fiecare capitol divizndu-se n 4
seciuni. Prima seciune const n prezentarea coninutului tematic. A doua
seciune Alegei rspunsul corect permite s se verifice nsuirea corect a
subiectelor tratate i aprofundarea elementelor particular dificile. Seciunea a
treia Probleme permite deprinderea tehnicilor de calcul statistic i a modului
de interpretare statistic a fenomenelor.
3

A patra seciune Rspunsuri corecte permite autoevaluarea, prezentnd


rspunsurile pentru testele prezentate n seciunea a doua.
Partea a doua este structurat pe XVII capitole, oferind astfel
posibilitatea parcurgerii pas cu pas a informaiilor prezentate dar i o privire de
ansamblu asupra procedurilor de calcul din SPSS (Statistical Package for the
Social Sciences).
Carte prezint un mod de abordare a analizei statistice folosind SPSS for
Windows i este destinat studenilor care doresc s analizeze date din
psihologie, sociologie, criminologie, sau date similare i se dorete a fi un
ndrumtor pentru analiza datelor, fiind o carte complet, de sine stttoare care
satisface nevoile studenilor la toate nivelele.
Ca obiective i propune s faciliteze:
Asimilarea noiunilor eseniale ale acestei discipline tiinifice i
descrierea ntr-un mod clar i concis a unei colectiviti, folosind informaia
din datele obinute prin observri statistice asupra fenomenelor studiate;
Familiarizarea studenilor cu limbajul i cerinele cercetrii
tiinifice, din cadrul tiinelor politice, psihologiei, pedagogiei, sociologiei,
precum i cu procedeele informaionale de studiu i cercetare folosind
Internetul.
Se urmrete nelegerea ideilor care stau la baza statisticii, a
principiilor de organizare i analiz a datelor, precum i de evaluare statistic.
S-a urmrit folosirea ct mai multor exemple practice astfel nct, la
finalul fiecrui capitol, sunt prezentate un set de ntrebri i probleme care s v
ajute s nelegei mult mai bine materialul prezentat. Informaiile prezentate aici
nu sunt originale, ci ele se bazeaz pe afirmaiile unor specialiti n domeniu.
n sperana c lucrarea va fi util, mulumim celor care vor veni cu
sugestii i observaii att de necesare mbuntirii oricrui lucru supus
perfecionrii.

I.

NOIUNI INTRODUCTIVE

_________________________________________________________________________________________________________________

Psihologia a fost acceptat ca tiin de sine stttoare abia n sec. al


XIX-lea, o dat cu accentuarea laturii ei experimentale. Astfel, s-a recurs la
acumularea de observaii i date, care, comparate cu celelalte tiine (care aveau
un statut epistemologic clar delimitat i acceptat de comunitatea tiinific), apar
deficitare sub aspectul interpretrii lor.
Cuvntul statistic are semnificaii multiple. Astfel poate s ne duc cu
gndul la indicele preurilor de consum, la cifra medie de afaceri a unor firme, la
rata omajului, la datele publicate ntr-o revist sau ntr-un buletin oficial etc.
ncercnd s definim statistica, putem spune c este un corp de metode pentru
a colecta, a descrie i a analiza date numerice din observaii sau investigaii
tiinifice. (Clocotici, Stan, 2000, p.13)
Obiectul de studiu al statisticii l constituie variaia curent-continu, n
timp i spaiu i din punct de vedere calitativ, al fenomenelor de tip stochastic
din orice domeniu al vieii economico-sociale sau naturale. (Jaba, 2002, p. 1316)
Statistica a fost folosit pentru rezolvarea unor nevoi practice ale vieii
sociale din cele mai vechi timpuri i pn astzi, o regsim att n primele forme
de eviden a populaiei i bunurilor materiale ct i n rezolvarea celor mai
variate i complexe probleme de conducere.
Statistica se refer la msurare i probabiliti. Cuvntul statistic,
provine din latinescul statista i desemna, pe vremuri, persoanele care se
ocupau cu afacerile statului, care numrau populaia sau alte aspecte ce ajutau
statul s gestioneze mai bine politica de taxe i costurile rzboaielor. n perioada
medieval, prin statistic, armatorii i calculau costurile echiprii corbiilor,

incluznd n calculele lor i probabilitatea ca acestea s fie atacate de pirai sau


de a naufragia. (Opariuc, 2009, apud Lungu 2001).
Forma cea mai veche a statisticii moderne este statistica practic
folosit n scopuri demografice, administrative i fiscale. nc din mileniile IV i
III en chinezii dispuneau de date cu privire la numrul populaiei, structura
terenurilor i chiar utilizau tabele statistice pentru unele aspecte ale activitii
agricole. Recensmintele populaiei efectuate, ncepnd cu anul 550 en, de
romani, greci i egipteni sunt, de asemenea, exemple pentru rdcinile istorice
ale statisticii practice (etapa prestatistic).
Dezvoltarea statelor feudale a dus la evoluia i perfecionarea
evidenelor privind situaia geografic, economic i politic. Se elaboreaz
lucrri n care se prezint detaliat situaia social-economic folosind date
statistice. Apare, astfel, statistica descriptiv care se ocup de culegerea datelor
despre un fenomen i cu nregistrarea acestor date.
Fondatorul colii descriptive i autorul primului Curs de Statistic, n
1660, a fost Herman Conring (1606-1681) profesor la Universitatea din
Helmstedt. Relund ideile lui Conring, un secol mai trziu, Gottfried Achenwall
(1719-1772), profesor la Universitatea din Gttingen, definete statistica drept o
tiin descriptiv folosit pentru prezentarea particularitilor unui stat,
introducnd pentru prima oar termenul de statistic (statistik). (Benea,
Munteanu, 2007, p. 11.)
Bazele statisticii descriptive au fost puse de ctre Dimitrie Cantemir
prin monografia, de talie european, Descriptio Moldavie, aprut n 1716. O
alt lucrare de referin poate fi considerat i Expunere statistic asupra
Moldovei ntocmit n 1782 de ctre un nalt funcionar al Curii de la Viena,
Wenzel von Brognard.
Statistica s-a dezvoltat i s-a perfecionat odat cu dezvoltarea
societii romneti i n deplin concordan cu alte tiine cu care se afl n
permanent legtur (Psihologia, Contabilitatea, Finanele, Econometria,
Informatica, etc.)
6

I.1.

NOIUNI I CONCEPTE DE BAZ UTILIZATE N


STATISTIC

Pentru a putea ilustra principalii termeni utilizai n statistic, ncercm s


lum n considerare situaia unui cercettor psihosocial care investigheaz o
colectivitate uman urmnd criteriile:
Mediul de provenien a persoanelor;
Statutul socio-economic;
Genul biologic;
Vrsta.
Aceast colectivitate poate fi numit populaie statistic.
1. Prin populaie (colectivitate) statistic se nelege totalitatea
persoanelor, faptelor, etc, care constituie obiectul de interes al cercetrii.
(Clocotici,

Stan,

2001, p. 13). Ea reprezint totalitatea manifestrilor sau

totalitatea fenomenelor de aceeai natur (de aceeai esen calitativ, ale unui
fenomen sau proces economic), care au trsturi esenial comune i care sunt
supuse unui studiu statistic.
Exemple de populaii statistice:
1. Colectivitatea studenilor din primul an de facultate, din Centrul
universitar Constana;
2. Colectivitatea persoanelor cu vrst egal sau mai mare de 45 de ani,
din Romnia;
Colectivitatea statistic specific vieii economico-sociale are un caracter
obiectiv, concret i finit strict determinat n timp i spaiu.
Statistica abordeaz colectivitile fie static, fie dinamic. Colectivitile
statice exprim o stare i au o anumit ntindere n spaiu la un momonet dat, iar
7

colectivitile dinamice caracterizeaz un proces, o devenire n timp


(nregistrarea elementelor componente fcndu-se pe un interval de timp).
Exemplu: 1. Persoanele care au starea civil cstorit la sfritul anului
curent reprezint o colectivitate static;
2. Colectivitatea evenimentelor de cstorie din anul curent
reprezint o colectivitate dinamic.
2. Unitatea statistic reprezint elementul constitutiv al unei
colectiviti statistice i este purttorul unui nivel al fiecrei trsturi supuse
observrii i cercetrii statistice. (Benea, Munteanu, 2007, p. 20)
Unitile statistice pot fi:
- statice = unitile compun efectivul masei de fenomene existente la
un moment dat. (un copil nscut viu n luna mai n
Constana unitate static.
- dinamice = unitile aparin aceleiai structuri organizatorice, au
acelai coninut, dar se produc n condiii diferite de timp
(trebuie nregistrate pe perioade de timp).
- simple = elemente constitutive ale colectivitii (persoana,
muncitorul).
-complexe = sunt rezultatul organizrii sociale i economice ale
colectivitii (familia, echipa, anul de studiu).
3. Inferena statistic reprezint o decizie, o estimare, o predicie sau o
generalizare privitoare la o colectivitate general, bazat pe informaiile
statistice obinute pe un eantion. Astfel, procesul de cercetare statistic va
cuprinde dou etape. O prim etap descriptiv, n care se vor colecta i prelucra
date privitoare la eantion, obinndu-se indicatori statistici. n a doua etap,
etapa de inferen statistic, rezultatele se vor extinde la colectivitatea general.

Discutnd despre sensul termenului de a msura, acceptm definiia


dat de S. S. Stevens (1959), prin care, n sensul su larg, msurarea
nseamn atribuirea de numere obiectelor sau evenimentelor, potrivit unor
reguli. Astfel, msurarea este o funcie, prin care unui obiect i corespunde un
numr i numai unul, la o anumit msurare. Aceast funcie de atribuire a unui
obiect unui numr va trebui s fie suficient de clar, pentru a permite ca unui
obiect s i se atribuie un numr i numai unul i s permit s decidem concret i
corect, ce numr va fi atribuit fiecrui obiect, dar i suficient de simpl pentru a
putea fi aplicat. (Vasilescu, Puiu, 1992.)

4. Variabile statistice.
Definiie: Caracteristica (variabila) statistic reprezint trstura, proprietea,
nsuirea comun tuturor unitilor unei colectiviti i care variaz ca nivel,
variant sau valoarea de la o unitate a colectivitii la alta. (Vasilescu, Puiu,
1992.)
Variabilitatea se refer la proprietatea obiectului de studiu de a lua
valori diferite (Popa, 2008, p. 23).
Fiecare dintre criteriile de difereniere este o variabil, adic o entitate
care ia valori diferite pentru componenii colectivitii i este comun tuturor
elementelor colectivitii.
Exemplul 1. mediul de provenien este o variabil care poate lua trei
valori: urban, rural variabil categorial;
Exemplul 2. Variabila gen biologic poate lua 2 valori: feminin i
masculin. variabil categorial;
Exemplul 3: Vrsta poate lua valori de la 0 ani la peste 100 de ani.
variabil numeric;
Variabila Vrsta poate fi i variabil categorial i lua diferite valori
in funcie de categoriile stabilite. (se stabilesc categorii de vrste).
Exemplu: 1. 10-20 ani
9

2. 21-30 ani
3. 31-40 ani.

O variabil, reprezint un concept cheie n statistic i nu este altceva


dect un nume pentru un element a crui proprietate principal este aceea
c variaz, i modific parametrii. (Opariuc, 2009) Mulimea valorilor
nregistrate pentru o caracteristic particular constituie distribuia variabilei
respective.
Modalitatea de realizare a unei variabile (modul n care i sunt atribuite
valorile) constituie un eveniment ntmpltor (probabilistic), de aceea variabila
se mai numete i variabil aleatoare.
Definiie: Varianta/valoarea reprezint nivelul concret pe care l poate
lua o variabil la nivelul unei uniti sau grup de uniti statistice. (Benea,
Munteanu, 2007, p. 22).
Exemplu: nlimea elevilor dintr-o clas poate lua aleatoriu diferite valori pe
care le pot avea elevii la aceast caracteristic.
valorile pe care le poate lua variabila, se grupeaz ntr-un anumit interval de
valori.
O variabil aleatoare poate fi discret sau continu, dup cum mulimea
de definiie a valorilor sale poate fi numrabil (discontinu) sau nenumrabil
(continu).
a. Variabile discrete.
Variabilele discrete sunt cele care sunt exprimate prin numere ntregi
(numr finit de valori pe care le poate lua). (Popa, 2008).
Exemplu:
numrul de copii pe care i are o familie;
numrul de orae dintr-un jude;
genul biologic;
10

Gradul didactic;
n cazul variabilelor discrete, mulimea de definiie a valorilor sale este o
mulime discontinu iar ntre dou valori nu poate fi interpus o valoare
intermediar.
Variabilele discrete pot fi categoriale sau de rang.

b. Variabile continue
Sunt variabile de tip numeric (cantitativ, de tip interval/raport) care au
un numr teoretic infinit de niveluri de msurare...poate lua orice valoarea
(exprimabil i prin numere fracionate), permind utilizarea zecimalelor
(Popa, 2008, p. 25).
Exemplu:
greutatea ntre un subiect de 76 kg i un subiect de 78 kg putem gsi
oricnd un subiect de 77,5 kg;
cifra de afaceri a unei firme;
nlimea subiecilor.
n cazul acestor variabile, mulimea de definiie a valorilor sale este una
continu, ne-numrabil. Aceste variabile se mai numesc i variabile scalare
(de interval sau de raport).
Deoarece cercetarea unei colectiviti numeroase poate implica valori
mari, putem extrage din colectivitatea iniial o subcolectivitate (sau mai multe)
al crui studiu este mai simplu. n acest caz vorbim despre eantion
reprezint un subset de elemente selectate dintr-o colectivitate statistic.
Eantionul reprezint unitile de informaie selecionate pentru a fi efectiv
studiate (Popa, 2008, p. 38).
Calitatea unui eantion de a permite extinderea concluziilor la
ntreaga populaie din care a fost extras se numeste reprezentativitate (Popa,
2008, p. 39).

11

Dup Rotariu (2006), reprezentativitatea este capacitatea eantionului


de a reproduce ct mai fidel structurile i caracteristicile populaiei din care a
fost extras.
Gradul de reprezentativitate al unui esantion depinde de:
- caracteristicile populaiei;
- mrimea eantionului;
procedura de eantionare folosit.
Definiie: Frecvena de apariie a unei variante/valori reprezint numrul
de apariii ale acestei variante/valori n colectivitate. (Benea, Munteanu, 2007,
p. 23)
Exemplu:
Nivelul individual al salariului de 700 RON, nregistrat pentru un
angajat al societii X, reprezint valoarea conneacret a variabilei salariu. Dac
15 salariai primesc acest salariu rezult c frecvena de apariie a valorii 700
RON este 15.

I.2. Alegei rspunsul corect

1. De peste 6 milenii, statistica este atestat ca*:


a. tiin a descrierii statului cu ajutorul cifrelor;
b. activitate de strngere a datelor;
c. tiin a gestionrii resurselor umane i materiale;
d. metod de estimare a speranei medii de via.
2. n etapa prestatistic, statistica este cunoscut sub form de:
a. numrtoare a populaiei i eviden a bunurilor materiale;
b. instituie a statului;
c. tiin.
3. Ca disciplin tiinific, statistica are*:
a) un pronunat caracter metodologic
12

b) un pronunat caracter teoretic


c) o sfer de cunoatere limitat la nivelul individului
d) o sfer de investigare a fenomenelor repetabile
4. Obiectul de studiu al statisticii l constituie*:
a. micrile curente continue ale fenomenelor i proceselor ce i au
existena sub form de colectiviti;
b. latura cantitativ a colectivitilor statistice;
c. latura calitativ a colectivitilor statistice;
d. aspectul stochastic al populaiei.

5. Colectivitile statistice sunt*:


a) asociaii finite de elemente unite ntre ele prin omogenitate
b) asociaii infinite de elemente unite ntre ele prin omogenitate
c) elemente eterogene dintr-un spaiu dat
d) grupuri de elemente difereniate ntre ele dup o carateristic statistic
6. Variabilele statistice reprezint*:
a) trsturi eseniale purtate la toate elementele unei colectiviti
b) valoarea nregistrat la nivelul unei uniti statistice
c) varianta de apariie a unei uniti statistice
d) probabilitatea de apariie a unei valori posibile xi
7. Elementele fizice pot fi*:
a. direct msurabile cantitativ;
b. msurabile cu aproximaie;
c. nemsurabile.
8. Opinia unei persoane poate fi*:
a. direct msurabil cantitativ;
b. msurabil cu aproximaie;
c. nemsurabil.
9. Crearea cuvntului statistic este atribuit lui:
a. Gottfried Achenwall;
b. Dionisie Pop Marian;
c. John Graunt;
d. John Halley.
10. O unitate statistic poate fi*:
13

a. o persoan interogat ntr-o anchet;


b. salariul unei persoane angajate ntr-o firm;
c. ansamblul salariailor unei firme din localitatea X la un moment
dat.
11. O colectivitate poate fi*:
a) ansamblul persoanelor nregistrate pe teritoriul Romniei la 18
martie 2002;
b) opiniile electoratului nregistrate n noiembrie 2004;
c) ansamblul cererilor de angajare depuse la firma B, n anul 2004.

12. Sunt variabile calitative atributive (nominale) *:


a) talia, greutatea, salariul;
b) sexul persoanelor, starea civil, domiciliul;
c) sperana de via, numr de locuitori ai unei ri.
13. Sunt variabile discrete:
a) sperana de via;
b) numrul de copii pe familie, numrul de camere ale unui
apartement, numrul de piese defecte dintr-un lot de rulmeni;
c) sexul persoanelor, starea civil, domiciliul.
14. Sunt variabile continue*:
a) talia, greutatea, salariul;
b) numrul de copii pe familie, numrul de camere ale unui
apartament, numrul de piese defecte dintr-un lot de rulmeni;
c) ansamblul persoanelor interogate ntr-o anchet.
15. Pentru urmtorul exemplu, precizai unitatea statistic, identificai
variabile statistic studiat i tipul de variabil:
Exemplu: absenteismul angajailor exprimat n zile;
16. Un om de afaceri observ c, n ultimele 3 luni, concurentul su
acord cte un interviu unui ziar de specialitate n fiecare zi de joi. El
trage concluzia c n paginile ziarului de joia viitoare va aprea un
nou articol al concurentului su. Eantionul pe baza cruia se face
aceast inferen este*:
a) numrul ziarului de joia viitoare;
b) numrul ziarului de joia trecut;
14

c) numerele ziarelor din toate zilele de joi;


d) numerele ziarelor din toate zilele de joi deja aprute;
e) numerele ziarelor din zilele de joi din ultimele 3 luni.
Precizai unitatea statistic, identificai variabila statistic studiat i tipul
de variabil. Precizai dac variabila este cantitativ sau calitativ, dac ea
este continu sau discret.

17. Care din urmtoarele variante reprezint un eantion i nu o


colectivitate total pentru ncasrile zilnice din anul trecut ale unui
magazin*:
a. lista ncasrilor zilnice din anul trecut;
b. lista ncasrilor zilnice cu doi ani n urm;
c. lista ncasrilor previzionate pentru anul trecut;
d. lista ncasrilor din fiecare zi de mari a anului trecut;
18. Pentru caracterizarea unei grupe de studeni din anul I al
Facultii de tiine Economice, n funcie de media la admitere,
unitatea de observare este*:
a) grupa;
b) studentul;
c) media la admitere;
d) facultatea;
e) anul de studiu

19. O companie de asigurri dorete s determine proporia


medicilor care au fost implicai n ultimul an n una sau mai multe
aciuni judiciare de rele practici. Compania selecteaz ntmpltor
500 de medici care au practicat n ultimul an i determin proporia .
Identificai populaia de interes i eantionul.

ntrebrile i problemele cu asterix (*) sunt preluate din Jaba E, Pintilescu C, (2005).

15

I.3. Rspunsuri
corecte
I.2. Rspunsuri corecte.
1. b - activitate de strngere a datelor;
2. a - numrtoare a populaiei i eviden a bunurilor materiale;
3. a - un pronunat caracter metodologic;
4. a - micrile curente continue ale fenomenelor i proceselor ce i au
existena sub form de colectiviti;
5. a - asociaii finite de elemente unite ntre ele prin omogenitate;
6. a - trsturi eseniale purtate la toate elementele unei colectiviti;
7. a - direct msurabile cantitativ;
8. b - msurabil cu aproximaie;
9. a - Gottfried Achenwall;
10.a - o persoan interogat ntr-o anchet;
11.a - ansamblul persoanelor nregistrate pe teritoriul Romniei la 18 martie
2002;
12.b - sexul persoanelor, starea civil, domiciliul;
13.b - numrul de copii pe familie, numrul de camere ale unui apartement,
numrul de piese defecte dintr-un lot de rulmeni;
14.a - talia, greutatea, salariul;
15.

- unitatea = angajatul;
- variabila = nr de zile=cantitativ discret
16

16. e - numerele ziarelor din zilele de joi din ultimele 3 luni;


17.

- unitatea= ntreprinderea;
- variabila= nr personalului =cantitativ, discret;

18. d - lista ncasrilor din fiecare zi de mari a anului trecut;


19. b studentul;
20. - Populaia = medicii care au practicat n ultimul an;
- Eantionul = cei 500 de medici care au practicat n ultimul an;

II. OBSERVAREA DATELOR STATISTICE


_________________________________________________________________________________________________________________
________

Definiie: Culegerea datelor i valorificarea informaiilor obinute din


acestea prin mulimea operaiilor de prelucrare i analiz se numete cercetare
statistic (Benea, Munteanu, 2007, p. 26)
Cercetarea statistic se desfoar n trei faze: observarea statistic;
prelucrarea datelor primare i obinerea indicatorilor statistici; analiza i
interpretarea rezultatelor prelucrrii. De modul n care se realizeaz observarea
depinde n continuare calitatea celorlalte etape.
Definiie: Observarea statistic reprezint aciunea de culegere de la
unitile statistice a informaiilor referitoare la caracteristicile urmrite, dup
criterii riguros stabilite. (ibdem).
Ca etap a cercetrii, observarea statistic este condiionat de scopul
cercetrii, de particularitile obiectului studiat i de tehnica de calcul folosit n
procesul de prelucrare ulterioar a datelor observrii.

II.1. METODE DE OBSERVARE STATISTIC.

17

Metodele statistice utilizate cu predilecie n practic sunt:


recensmntul, sondajul statistic, ancheta de opinie, panelul, monografia
statistic.
Recensmntul - este o metod de observare (total), cu caracter
periodic, care surprinde un fenomen n mod static. Este una din cele mai
vechi metode de observare, ntlnit nc din antichitate (la romani).
Recensmntul asigur o surprindee a unui fenomen ntr-un anumit
moment de timp (moment critic). Momentul critic este ales, uzual, n timpul
iernii, evitndu-se vacanele colare, astfel ca populaia s fie surprins n
momentele ei cele mai stabile.
Definiie: n mod oficial, recensmntul populaiei este un proces de
culegere, prelucrare i publicare a datelor demografice,
economice i sociale, la un timp specificat i valabile pentru
toate persoanele din ara respectiv sau de pe un teritoriu
delimitat. (Benea, Munteanu, 2007, p. 34)
Recensmntul este reglementat de ctre stat, prin acte legislative i
respect principiile universalitii, simultaneitii i comparabilitii.
Din domeniul populaiei, recensmntul s-a extins i asupra altor
domenii: exist recensmnt al locuinelor, al animalelor, al unitilor de
industrie, transport, agricultur etc. (recensmnt economic).
2. Sondajul statistic (selecia statistic) - este o metod parial de
observare statistic. Sondajul se folosete pentru a nlocui o observare total,
de mare amploare, mai dificil de realizat, care presupune angajarea unor
cheltuieli ridicate de resurse materiale, financiare i umane.
Sondajul poate asigura o informare operativ, prin prelucrarea rapid
a informaiilor i cu costuri mai sczute.
n cazul sondajului se vor culege date de la o subcolectivitate, numit
eantion, care trebuie s ndeplineasc condiia de reprezentativitate fa de
18

colectivitatea general pentru ca rezultatele sondajului s reflecte realitatea.


Eantionul trebuie s reproduc aceleai trsturi eseniale pe care le are i
colectivitatea general. Formarea eantionului nu trebuie s fie subiectiv, ci
s se efectueze dup procedee probabilistice aleatoare, care s asigure,
fiecrei uniti, anse egale de a ptrunde n eantion

(procedeele de

eantionare sunt prezentate n capitolul V).


Culegerea datelor statistice de la uniti se poate face prin
documentare, observaie, chestionare trimise prin pot, interviu direct sau
prin telefon.
3. Ancheta statistic este o metod parial de observare, fr ca
eantionul pe baza cruia se realizeaz ancheta, s fie obligatoriu
reprezentativ fa de colectivitatea general (se poate forma i nealeator
prin alegere raional). Ancheta de opinie are drept scop cunoaterea prerilor
persoanelor asupra diferitelor probleme (Exemplu: anchete sociologice,
demografice, psihosociale, de marketing, etc).
4. Panelul este o metod de observare parial, bazat pe un eantion
fix, stabil, format dintr-un numr de persoane de la care se obin date prin
chestionare la diferite momente de timp.
5. Monografia statistic este o metod de observare parial, special
organizat, avnd ca obiectiv cunoaterea multilateral i n profunzime a unei
singure uniti complexe (Jaba, Pintilescu, 2005, p. 36) Ea are, de regul, un
caracter multidisciplinar (monografia unei localiti, jude, firm).
Monografia este realizat de ctre o echip complex de specialiti,
echip care efectueaz toate etapele cercetrii.

19

II.2. EROAREA STATISTIC.

CONTROLUL DATELOR STATISTICE.


Definiie: Prin eroare statistic se nelege diferena dintre nivelul real

al unui indicator i cel rezultat din investigaia statistic. (Benea, Munteanu,


2007, p. 36).
Erorile statistice pot apare n toate etapele cercetrii statistice i pot fi:
erori de observare (nregistrare):
- se ntlnesc n procesul de culegere a datelor statistice.
Pot fi de dou feluri:
- erori ntmpltoare (aleatorii) au caracter nepremeditat i se pot datora
neateniei sau unor cauze accidentale i pot afecta valorile n orice sens.
-

erori sistematice sunt produse cu bun tiin i au o influen negativ


asupra rezultatelor prelucrrii; pot influena valorile ntr-un anumit sens
(mai mare sau mai mic) fa de scorul adevrat.
Exemplu: n nregistrrile demografice populaia are tendina de a declara,
n loc de vrsta real exact, o vrst rotunjit terminat cu 0 sau 5.
Erorile de observare pot fi nlturate prin control statistic.
erori de reprezentativitate:

- Sunt specifice sondajului i nu pot fi eliminate total, ci doar diminuate i


inute sub control.
20

erori de modelare:
- Se produc atunci cnd se alege n mod nejustificat un mod de calcul, fapt
ce determin obinerea unor indicatori fr coninut real.

II.2. Alegei rspunsul corect

1. Reprezentativitatea este urmarit n mod deosebit n cazul culegerii


datelor prin:
a) Recensmnt;
b) sondaje statistice;
c) anchete statistice;
d) monografia statistic.
2. Panelul, ca metod de observare parial urmrete:
a) aplicarea unui chestionar mai multor persoane n acelai timp;
b) aplicarea unor chestionare diferite la momente diferite de timp;
c) aplicarea aceluiai chestionar unui singur lot de subieci la
momente diferite de timp.
3.Recensmntul ca metod de observare statistic:
a. nu presupune culegerea datelor de la toate unitile populaiei
statistice bine determinate;
b. are exclusiv un caracter demografic;
c. se ncadreaz n sfera observrilor cu caracter permanent;
d. se organizeaz cu o anumit periodicitate.
4. Ancheta statistic:
a) este o metod de observare total;
b) este o metod de observare parial care numai ntmpltor poate
s ndeplineasc condiia de reprezentativitate;
c) este o metod de observare parial, care, n mod obligatoriu,
trebuie s ndeplineasc condiia de reprezentativitate;

21

d) este o metod de observare parial, care se bazeaz pe


obligativitatea
completrii chestionarelor;
e) mai este denumit i sondaj statistic.

5. Lucrri statistice prin sondaj sunt:


a. anchetele prin sondaj;
b. recensmntul;
c. rapoartele statistice.
6. Atunci cnd se nregistreaz la un moment critic populaia unei ri se
efectueaz:
a. un recensmnt;
b. o nregistrare curent continu;
c. o anchet de opinie.
7. nregistrarea opiniei electoratului se nregistreaz prin:
a. recensmnt;
b. nregistrare curent-continu;
c. sondaj statistic.
8. Se observ populaia unei ri la 10 momente de recensmnt.
Colectivitatea studiat este:
a. momentele de recensmnt;
b. populaia rii;
c. ara.
9. Se observ populaia unei ri la 10 momente de recensmnt.
Variabila studiat este:
a. momentele de recensmnt;
b. populaia rii;
c. ara.

22

II.3. Rspunsuri corecte

1. b - sondaje statistice;
2. c - aplicarea aceluiai chestionar unui singur lot de subieci la momente
diferite de timp.
3. d - se organizeaz cu o anumit periodicitate.
4. c - este o metod de observare parial care numai ntmpltor poate s
ndeplineasc condiia de reprezentativitate;
5. a - anchetele prin sondaj;
6. a - un recensmnt;
7. c - sondaj statistic.
8. b - populaia rii;
9. a - momentele de recensmnt;

23

III. SCALE

DE MSURARE

_________________________________________________________________________________________________________________
________

Gruparea statistic reprezint prima sistematizare a unor date individuale


care au fost obinute n urma unei observri. Sistematizarea datelor se face n
scopul identificrii fenomenelor de care aparin aceleiai esene socialeconomice i prezint o serie de proprieti comune.
Prin prelucrarea statistic se nelege etapa cercetrii statistice n care se
trece de la datele individuale obinute n etapa observrii pentru fiecare unitate a
colectivitii, la indicatori care caracterizeaz colectivitatea n ntregul ei.
Nivelul nominal de msurare (clasificare) i nivelul ordinal (de rang sau
ierarhic) se grupeaz n scala neparametric de msurare.
Nivelul de interval (intervale egale) i nivelul de raport (proporii)
formeaz scala parametric de msurare.

Raport
Parametric
Cuantificare

Interval

Ordinal

Nominal

Neparametri
c

Reprezentarea schematic a nivelurilor de


msurare
Figura Nr. 1

24

Reprezentarea schematic a nivelurilor de msurare (Figura 1).(dup Opariuc, 2009).

III.1. SCALE NEPARAMETRICE


III.1.1. SCALA NOMINAL (DE CLASIFICARE)

Reprezint primul nivel de msurare i const n clasificarea obiectelor n


funcie de existena sau inexistena unei caracteristici. Aceast clasificare
presupune existena unor categorii disjuncte, astfel nct fiecare obiect s-i
gseasc locul ntr-o categorie i numai n una. (Opariuc, 2009 apud Vasilescu,
1992).
Scala nominal este cunoscut i sub numele de scal calitativ,
categorial sau de clasificare, este cel mai simplu tip de scal i presupune doar
diferenierea calitativ a fenomenelor i a obiectelor msurate. Scala nominal
const n categorii care permit clasificarea (sortarea) obiectelor sau fenomenelor
dup o caracteristic sau un atribut.
O msurare pe scal nominal nseamn plasarea obiectelor n difeite
clase (categorii), situaie n care, o valoarea nu este cu nimic mai mare sau mai
mic dect o alt valoarea (Popa, 2008, p. 29).
Exemplu: Categoria profesional, sexul, tipul bio-constituional etc.
Pentru ca scala s aib sens, trebuie s existe cel puin dou categorii.
O variabil nominal cu dou categorii poart numele de dihotomie sau
clasificare dihotomic.
Exemplu: mprirea subiecilor n brbai i femei.
Dac exist mai multe categorii, vorbim despre polihotomii sau
clasificri multiple (polihotomice).
Exemplu: mprirea n funcie de profesie, culoarea ochilor sau a prului,
grupa sanguin, etc.
25

Observaie: Variabilele care sunt msurate pe scale de tip nominal, pun n


eviden diferenele calitative ntre valori!
Proprietile scalei nominale:
Transformrile permise la nivelul acestei scale sunt (Vasilescu, 1992):
o Redenumirea

atribuirea

unor

noi

nume

(n

loc

de

masculin/feminin putem spune brbat/femeie);


o Permutarea schimbarea ordinii elementelor, deoarece nu se
poate stabili o ierarhe ntre valorile unei variabile pe aceast scal.
Aceast proprietate este caracteristic doar scalei nominale.
Operaii statistice permise n principal operaiile de baz, derivate
din numrare, astfel (Opariuc, 2009 , p. 24).
o Frecvena absolut i relativ (procentul), cte observaii au fost
incuse n fiecare categorie (de exemplu 50 de brbai i 50 de
femei sau 50% brbai i 50% femei);
o Valoarea modal (modul), categoria cu frecvena cea mai mare (de
exemplu din 100 de subieci, 80 au ochi albatri, aceasta fiind
categoria cu frecvena cea mai mare modul);
Exemplu: Alegem cele 4 tipuri de temperament pe care le codificm
astfel:
Coleric

Sangvinic

Melancolic

Flegmatic

26

Observaie: ntre toate categoriile (gradaiile) unei scale nominale nu


exist relaie de ierarhie, ordinea prezentrii lor fiind indiferent, lipsit de
importan din punctul de vedere al consistenei scalei (utilizarea codificrii
poate crea iluzia unei ierarhii (1 este mai mic dect 2 etc.), dar aceasta este
doar o iluzie, utilizat uneori n scopuri de manipulare).
Ne propunem s caracterizm 150 de indivizi dup apartenena la un
tip de temperament. Dup investigaie, rezult 32 de colerici, 48 de sangvinici,
37 melancolici, 33 de flegmatici. Potrivit codificrii date pot fi prezentate astfel:
TIP TEMPERAMENTAL
1
2
3
4

NUMR DE INDIVIZI
32
48
37
33

Ansamblul numerelor din coloana a II-a se numete distribuie de


frecvene a tipurilor temperamentale n grupul studiat. Fiecare numr constituie
frecvena absolut a diviziunii respective a scalei notat ni.
Definiie: Frecvena absolut indic numrul total de uniti
statistice.
Definiie: Frecvena relativ indic proporia din numrul total de
uniti care se ncadreaz n grup.
ni
*

ni=

n
i 1

100

27

ni
100
n

III.1.2. SCALA ORDINAL (DE RANG SAU TOPOLOGIC)

Reprezint al doilea nivel de msurare i const n ierarhizarea n funcie


de mrimea unei caracteristici, fr ns a se putea preciza cu ct un nivel
ierarhic este superior sau inferior altuia i nici de cte ori. (Opariuc, 2009, p. 35)
Scala ordinal este cunoscut i sub numele de scal de ordine, de rang,
scal ierarhic. O scal ordinal permite ordonarea observaiilor, persoanelor,
situaiilor de la mic la mare, de la simplu la complex, atunci cnd n empiricul
relativ se introduc, pe lng relaiile de echivalen i relaiile de ordine.
Spre deosebire de scala nominal (ale crei proprieti le include), scala
ordinal permite stabilirea unei relaii de ordine ntre date.
Observaie: n cazul scalelor ordinale se poate stabili ierarhia a n gradaii
ale variabilei, dar nu se poate preciza valoarea diferenei dintre dou gradaii.
Valorile de tip ordinal, ne spun dac o valoare este mai mare sau mai mic
dect alta, dar este limitat la raportul de msime, adic, nu ne poate preciza
care este diferena de cantitate a caracteristicii msurate.
Crearea unei scale ordinale presupune, cu prioritate, stabilirea unei relaii
de ordine ntre valorile posibile ale variabilei studiate.

Proprietile scalei:
Proprietile specifice scalei ordinale le includ pe cele ale scalei nominale,
dar se adaug (Vasilescu, 1992):
Operaii statistice permise:
o Frecvena sumelor n valori cumulate i procentuale;
o Coeficieni de corelaie de rang: Spearman, sau Kendall.

28

Ordinea este de la simplu la complex. Prin aceast scal putem caracteriza


manifestrile unei persoane n funcie de gradul de saturare motivaional.
Observaie: Dac se neglijeaz ordinea dintre categorii, datele obinute n urma
utilizrii unei scale de msur ordinale sunt identice, din punct de vedere
formal, cu datele nominale.
Pentru a realiza ordonarea datelor prezentate sub form de tabel
calculm i frecvenele cumulate.
Definiie: Frecvena cumulat pentru o categorie este suma tuturor frecvenelor
anterioare plus frecvena curent.
Cuvntul anterior se refer la sensul de parcurgere a categoriilor
scalei ordinale. Dac parcurgerea se face de la categoriile mici spre cele mari,
se formeaz frecvene cumulate ascendent (cresctor). Dac parcurgerea se
face de la categoriile mari spre cele mici se formeaz frecvene cumulate
descendent (descresctor).
Observaie: Se pot prezenta sub form de frecvene cumulate att frecvenele
absolute ct i cele relative.
Fci = frecvene absolute cumulate
F*ci = frecvene relative cumulate
i

Fci =

nk
k 1

F*ci =

(3)

n
k 1

*
k

(4)

Exemplu: S presupunem c analiznd produsele creative dintr-o anumit


zon geografic, pe o anumit perioad de timp, s-a obinut urmtoarea
distribuie de valori pe scara Taylor.

29

Scara Taylor privind clasificarea creativitii dup criteriul efectivitii


comunicrii:
1. creativitate expresiv;
2. creativitate productiv;
3. creativitate inventiv;
4. creativitate inovatoare;

Frecvena absolut

Nivel creativ

Frecvena relativ (%)

5. creativitate emergent.
Frecvena
absolut
cumulat
ascendent

Frecvena
absolut
cumulat
descendent

Frecvena
relativ
cumulat
ascendent

Frecvena
relativ
cumulat
descendent

1 75

47,8

75

157

47,8

100

2 52

33,1

127

82

80,9

52,2

3 20

12,7

147

30

93,6

19,1

3,8

153

10

97,1

6,4

2,6

157

100

2,6

157

100

Reprezentrile grafice ale datelor ordinale

trebuie s reflecte

proprietatea de ordonare specific scalei, s denote faptul c scala de msur


este discret i se sugereaz ct mai puin luarea n considerare a distanei dintre
categoriile scalei.
Din aceste considerente utilizm diagramele sub form de bare verticale.
Vizualizrile pot s aib drept obiect att frecvenele absolute ct i cele relative.

30

III.2.

SCALE PARAMETRICE

III.2.1. SCALA DE INTERVAL (INTERVALE EGALE)

Reprezint a treilea nivel de msurare i deriv din scala ordinal, la care


se adaug proprietatea c, intervalele dintre un nivel de valori i altul sunt egale.
Este un tip de msurare n care distanele dintre treptele scrii sunt distane egale
sub aspectul cantitii caracteristicii de msurat. (Opariuc, 2009, p. 37)
Scala de interval are proprietile scalei ordinale, dar intervalul dintre
dou variante este exprimat n termenii unei uniti de msur fixe. Prin aceasta
operaia de msurare a observaiilor pe o scal de intervale determin cantitatea
exact de caracteristic existent n observaii.
Exemplu: temperatura msurat pe o scal Celsius: dac ntr-o zi se msoar 10
grade, iar a doua zi se msor 20 de grade, se poate spune cu precizie c a doua
zi a fost cu 10 grade mai cald.
O caracteristic a valorilor msurate pe scala de interval este absena
unei valori zero absolute (Popa, 2008). Din acest motiv, nu se poate spune c
temperatura de 20 de grade este de dou ori mai mare dect temperatura de 10
grade.
O variabil msurat pe o scal de interval ofer informaii att la ordinea
de mrime ct i la marimea exact a caracteristicii msurate (Popa, 2008).
Realizarea unei scale de interval presupune parcurgerea mai multor etape:
1. Se calculeaz amplitudinea variaiei caracteristicii
Numim amplitudine de variaie (Range) diferena dintre valoarea
maxim i valoarea minim a distribuiei de date. (A = Max Min).
def

A xmax - xmin (5)


2. Se stabilete numrul de grupe r n care vor fi sistematizate datele
Observaie : Se recomand utilizarea unui numr moderat de grupe (ntre 4
i 10).
31

3. Se calculeaz mrimea aproximativ a intervalelor de grupare:


h

A
r

xmax xmin
r

(6)

4. Se stabilesc intervalele de grupare pornind de la xmin (sau de la o


valoare mai mic).
xmin+h; xmin+2h; ;

xmin+rh

Fie c desfurm o evaluare psihologic, un experiment sau o cercetare


experimental, fie c iniiem un proces de colectare a datelor prin observaie,
rezultatul const ntr-o colecie de date brute. La acest nivel nu avem nici o
modalitate prin care putem trage concluzii asupra semnificaiei datelor pe care le
avem la dispoziie. (Opariuc, 2009).
De aceea, prima etap n iniierea unei proceduri statistice de analiz a
datelor const n clasificarea, ordonarea, condensarea acestora n vederea
conturrii unei imagini ct mai precise. (idem)
Valorile msurate trebuie aezate ntr-o anumit ordine (cresctoare sau
descresctoare) care s permit i o eventual reprezentare grafic a acestora.
Exemplu: Urmtoarele date reprezint cheltuielile pentru cumprarea
unbui produs (ron), cheltuieli efectuate de 25 de familii ntr-o sptmn: 222,
284, 321, 248, 235, 265, 254, 312, 321, 298, 274, 286, 312, 288, 286, 245, 222,
234, 238 ,254, 265, 231, 254, 233, 265.
Xmin = 221
Xmax = 321.
A = Xmax- Xmin = 321 221 = 100
r=4
h=

A 100

25
r
4

32

Intervale

Frecven

221 - 246

246 - 271

271 - 296

296 - 321

Proprietile scalei (Vasilescu, 1992):


Operaii statistice permise:
o Calculul mediei aritmetice, abaterii standard, boltirii i simetriei
(indicatorii statistici sunt prezentai la capitolul IV);
o Statistici parametrice: testul t Student, F Fisher, analiza de
varian;
o Toate tipurile de corelaii: r-Pearson, raport de corelaie (R),
coeficientul de regresie (b)

III.2.2. SCALA DE RAPORT (PROPORII)

Ultimul nivel de msurare i este reprezentat de scala de raport care are


toate caracteristicile unei scale de interval la care se adaug existena unui zero
absolut. Aceast scal permite s rspundem la ntrebarea de cte ori, deoarece
existena unui zero absolut face posibil compararea proporiilor.(Opariuc, 2009,
p. 38)
Scala de raport are proprietile scalei de interval, iar raportul dintre
dou puncte ale scalei dup care unitile sunt clasificate are semnificaie,
indiferent de unitatea de msur utilizat n stabilirea scalei.
33

Pe scala de raport numerele ofer nu numai informaii asupra ordinii


de rang a obiectelor (i a mrimii relative a diferenelor) ci i despre relaiile
rapoartelor.
Exemplu : dac un subiect are greutatea de 80 de kilograme iar un altul
are greutatea de 160 kilograme, putem spune c al doilea subiect este cu 80 de
kilograme mai greu dect primul, dar i c al doilea subiect este de dou ori mai
greu dect primul, ambele afirmaii avnd sens.
Exemplu:

- Rata lunar a omajului;


- cursul valutar zilnic al leului n raport cu euro.

Proprieti ale scalei:


Sunt permise toate operaiile statistice, inclusiv calculul mediei
geometrice i al coeficientului de variaie.

III.3. Alegei rspunsul corect


1. Scala nominal:
a. nu permite redenumirea unor noi nume;
b. permite schimbarea ordinii elementelor;
c. este cunoscut i sub numele de scal cantitativ.
2. Scala nominal are ca proprietate:
a. identitatea categoriilor unei variabile;
b. ordinea categoriilor unei variabile;
c. diferenele ntre numere au un sens;
d. raportul dintre dou puncte de scal este acelai.
3. Operaiile statistice permise n cadrul scalei nominale sunt:
a. frecvenele absolute i relative;
b. modul, mediana, media;
c. frecvenele cumulate.

34

4. n cazul scalei nominale:


a. ntre coduri exist un raport de echivalen i ordinea codurilor
numerelor sau simbolurilor atribuite categoriilor este oarecare;
b. diferenele ntre 2 valori ale unei variabile nu au sens;
c. ntre categoriile variabilelor atributive exist un raport de preferin.
5. Proprietatea de identitate, specific scalei nominale, presupune:
a. un interval ntre numere, care s permit compararea diferenelor dintre
numere;
b. un raport de preferin, desemnat prin >, care permite msurarea cu
ranguri;
c. apartenena elementelor la o categorie.
6. Scala ordinal:
a. permite ordonarea observaiilor, persoanelor sau situaiilor de la
complex la simplu;
b. permite ordonarea observaiilor, persoanelor sau situaiilor de la mic la
mare;
c. poate precuza valoarea diferenei dintre dou gradaii;
d. nu presupune stabilirea unei relaii de ordine ntre valorile posibile ale
variabilei studiate.
7. n cazul scalei ordinale:
a. se poate preciza valoarea dintre dou gradaii;
b. se poate stabili o relaie de ordine ntre valorile posibile ale variabilelor
studiate;
c. este cunoscut i sub numele de scal calitativ.
8. Frecvena cumulat ascendent se calculeaz ca fiind:
a. numrul total de uniti statistice;
b. numrul total de uniti care se ncadreaz n grup;
c. suma frecvenelor anterioare minus frecvena curent,
d. suma frecvenelor anterioare plus frecvena curent.
9. Scala de interval:
a. presupune stabilirea unei relaii de ordine ntre valorile studiate;
b. presupune ca intervalul dintre dou variante s fie exprimat n termenii
unei uniti de msur fixe;
c. nu poate determina cantitatea exact de caracteristic existent n
observaii;
d. nu are ca extensie scala de interval.

35

10. Scala de interval este folosit n cazul:


a. variabilelor atributive
b. variabilelor nenumerice
c. variabilelor cantitative
11. Scala de interval
a. are toate caracteristicile scalelor ordinale i de raport;
b. are toate caracteristicile scalei ordinale i, n plus, distana sau diferena
dintre dou numere ale scalei are semnificaie concret;
c. este o scal numeric i, n plus, raportul dintre dou puncte ale scalei
este independent de unitatea de msur;
d. prezint multe dintre caracteristicile scalei ordinale;
e. mai este numit i scal de raport sau scal discret.
12. Ordinea n care sosesc alergtorii dintr-o curs reprezint o
variabil statistic ale crei valori pot fi msurate pe o scal:
a. nominal;
b. proporional;
c. de interval;
d. ordinal;
e. cardinal.
13. Temperatura la sol msurat n 10 zile consecutive n Bucureti,
ca variabil statistic, are valori ce pot fi msurate pe o scal*:
a. de raport;
b. de interval;
c. ordinal;
d. pe nici una din scalele menionate
14. Identificai 3 tipuri diferite de date statistice ce pot fi colectate
pentru a reflecta popularitatea a cinci publicaii periodice similare.
Precizai scala de msurare a fiecrui tip de date*.
a. numr de abonamente;
b. numr de exemplare vndute;
c. tiraj.

36

15. Precizai care dintre urmtoarele asocieri ntre variabilele


statistice i scala de msurare nu este adevrat:
a. marca de calculator cumprat cel mai curnd de 20 de oameni de
afaceri scal nominal;
b. salariul mediu pe ramuri ale economiei naionale scal de raport;
c. punctajul obinut de ctre 10 concureni la un concurs de cultur
general scal nominal;
d. afilierea la un partid politic a 50 de directori executivi selectai
aleatoriu scal nominal.

III.4. Probleme
1. Ne propunem s studiem 200 de persoane pentru a vedea care este profesia
lor. Dup investigaie au rezultat:
32 avocai
50 economiti
66 juriti
21 contabili
31 psihologi
Cerine:
a. Identificai frecvena absolut;
b. Calculai frecvena relativ
2. n urma controlului de calitate, ntr-un lot de 500 de piese, se gsesc n i=30
piese rebut.
S se calculeze procentul mediu al pieselor de rebut din lot.
3. Populaia ocupat (mii persoane) pe sectoare de activitate n Romnia, n anii
1993 i 2001, se prezint astfel:

Sectorul de activitate
1993
Indistrie
3030
Construcii
574
Agricultur i
3614
silvicultur
Alte ramuri
2844
Total
10062
S se calculeze ponderea populaiei ocupate n
n anul 2001.

2001
2017
340
3498
2708
8563
sectorul de construcii,

ntrebrile i problemele cu asterix (*) sunt preluate din Jaba E, Pintilescu C, (2005).

37

4. Populaia ocupat (mii persoane) pe sectoare de activitate n romnia, n anii


1993 i 2001, se prezint astfel:
Sectorul de activitate
Indistrie
Construcii
Agricultur
i
silvicultur
Alte ramuri
Total

1993

2001

3030
574
3614

2017
340
3498

2844
10062

2708
8563

S se afle cu ct s-a modificat structura populaiei ocupate n industrie, n


anul
2001 fa de 1993.
5. Distribuia a n familii dintr-un bloc, dup numrul de copii (x), la un
moment dat, se prezint astfel:
Xi
ni
Fci

0
6
6

1
18
24

2
23
47

3
20
67

4
14
81

5
6
87

6
2
89

7
1
96

S se calculeze numrul de familii care au cel mult 4 copii.


6. Urmtoarele date reprezint cheltuielile (mii lei) efectuate de 50 de copii ntro sptmn:
50, 82, 84, 56, 114, 115, 118, 58, 64, 86, 89, 66, 69, 144, 135, 78, 98, 94, 76, 80,
134, 128, 126, 79, 96, 100, 112, 113, 84, 87, 96, 99, 146, 155, 159, 157, 166,
178, 174, 176, 169, 178, 158, 155, 156, 174, 84, 94, 110, 112.

Calculai:
a) Amplitudinea;
b) Marimea intervalului avnd r = 4 (numrul de intervale);
c) Frecvena absolut;

ntrebrile i problemele cu asterix (*) sunt preluate din Jaba E, Pintilescu C, (2005).

38

7. Distribuia pe grupe de vrst a unui eantion de 100 de persoane dintr-un


cartier de locuine, la un moment dat, este:
Grupa de
vrst
Efectivul

- 20

20-30

30-60

60-80

80-100

17

61

22

15

18

S se calculeze limita inferioar a primului interval de variaie.


8. Directorul unui post de radio comand o cercetare statisitic n scopul
determinrii audienei de care se bucur postul su. Cercettorul culege date
privind numrul de ore audiate pe un eantion i afl c 10% din persoane
ascult postul de radio mai puin de 2 ore, 25% ntre 2 i 4 ore, 40% ntre 4 i 6
ore, 20% ntre 6 i 8 ore, iar restul peste 8 ore. El urmrete s determine
numrul mediu de ore de audiie pe o persoan.

III.5. Rspunsuri corecte

III.3. Rspunsuri corecte.


1.
2.
3.
4.

b - permite schimbarea ordinii elementelor;


a - identitatea categoriilor unei variabile;
a - frecvenele absolute i relative;
a - ntre coduri exist un raport de echivalen i ordinea codurilor
numerelor sau simbolurilor atribuite categoriilor este oarecare;
5. c - apartenena elementelor la o categorie;
6. b - permite ordonarea observaiilor, persoanelor sau situaiilor de la
mic la
mare;
7. b - se poate stabili o relaie de ordine ntre valorile posibile ale
variabilelor
studiate;
8. d - suma frecvenelor anterioare plus frecvena curent;
39

9. b - presupune ca intervalul dintre dou variante s fie exprimat n


termenii unei uniti de msur fixe;
10. c - variabilelor cantitative;
11. b - are toate caracteristicile scalei ordinale i, n plus, distana sau ;
12. d - ordinal;
13. b - de interval;
14. a. numr de abonamente scal de raport;
b. numr de exemplare vndute scal de raport;
c. tiraj scal de raport.
15. c. punctajul obinut de ctre 10 concureni la un concurs de cultur
general scal nominal;

III.4. Rspunsuri corecte.


1. Rspuns.
Ni

Ni*

Avocai

32

16

Contabili

21

25

Economiti

50

33

Psihologi

31

10,5

Juriti

66

15,5

Profesii

2. Rspuns: Nivelul mediu n cazul unei variabile alternative se calculeaz


dup relaia:
p

ni
* 100
n

30
* 100 6 0 0
500

Interpretare: Rezultatul obinut arat c n medie, la fiecare 100 de


piese observate, 6 piese sunt rebut.

40

3. Rspuns. Se calculeaz frecvena relativ.


Ni*=

ni
n
340
i
*100 3,97%
ni n 8563

Interpretare: Ponderea populaiei ocupate n sectorul de construcii, n anul


2001, este de 3,97%
4. Rspuns. ni*=

ni
* 100
ni

3030
* 100 30,11%
10062
( ) ni1 ni 0 23,55 30,11 6,56%

Ni0*=

Ni1*=

2017
*100 23,55%
8563

Interpretare: Structura populaiei ocupate n industrie a sczut, n anul 2001


fa de 1993, cu 6,56%.
5. Rspuns. Aflarea numrului de familii care au cel mult 4
copii presupune calcularea frecvenei absolute cumulate. Ne
vom opri la 81 deoarece problema, cere numrul de familii care
au cel mult 4 copii. Astfel, un numr de 81 de familii din
colectivitatea considerat au cel mult 4 copii.
7.

Rspuns: Exemplul dat prezint o distribuie pe intervale inegale de


variaie. n acest caz, limita inferioar a primului interval de variaie se
nchide, i vom lua n consideratie mrimea intervalului urmtor.
h= xi-xi-1= limsup - limin f = 30-20 =10
Prin urmare, primul interval are ca limit inferioar 10, adic (10-20)

8. Rspuns. Se va utiliza media aritmetic ponderat, calculat pe baza


frecvenelor relative.
Intervale de variaie a
numrului de ore de audiie

Numr de persoane (%)


41

Sub 2

10

2-4

25

4-6

40

6-8

20

8 i peste

total

x n % 10 75 200 140 45 470 4,7ore


i

100

100

100

Astfel n medie o persoan din eantionul studiat audiaz 4,7 ore de


program la postul de radio respectiv.

IV. INDICATORI

STATISTICI

________________________________________________________________________________________________________________

Noiunea de indicator i funciile indicatorilor

42

Cercetarea statistic a fenomenelor i proceselor socio-economice are ca


obiectiv principal analiza aspectelor cantitative nemijlocit sesizabile pentru a
afla i caracteriza esena i calitatea acestora.
Definiie: Indicatorul statistic reprezint expresia numeric a unor
fenomene i procese social-economice, definite n timp, spaiu i structur
organizatoric.17
Indicatorii statistici pot fi primari sau derivai.
Indicatorii primari exprim direct nivelul real de dezvoltare a
caracteristicii cercetate, caracteriznd fenomenul/procesul la modul cel mai
general din punct de vedere cantitativ. Ei rezult n urma observrii i
centralizrii statistice a datelor individuale de mas, fie prin nregistrarea
curent, fie prin nsumare parial sau total a datelor individuale de acelai fel.
Indicatorii derivai se obin prin prelucrarea mrimilor absolute ale
indicatorilor primari. Prelucrarea se face prin comparare, abstractizare,
generalizare i alte procedee de calcul statistic.
Compararea se face prin diferen sau prin raport. Prin diferen se
compar numai indicatorii absolui cu acelai coninut i exprimai n aceeai
unitate de msur. Prin raport se pot compara indicatorii cu acelai coninut sau
coninut diferit, dar aflai n relaie de interdependen.

IV.1.

INDICATORI AI TENDINEI CENTRALE

Indicatorii tendinei centrale sunt indicatori sintetici cu ajutorul crora


se exprim ntr-o singur msur ceea ce este tipic, esenial, stabil, obiectiv i
caracteristic ntr-o serie de date numerice.
17

Benea, M, Munteanu, G , 2007 Elemente de statistic economic i social, Ed. Andrei aguna,
Constana,p. 59

43

Un indicator al tendinei centrale trebuie s ndeplineasc urmtoarele


condiii:
s fie definit n mod precis i obiectiv, eliminnd aprecierea
subiectiv a cercettorului;
s fie expresia tuturor observaiilor fcute;
s nu aib caracter matematic prea abstract i s posede proprieti
simple i evidente;
s poat fi calculat cu uurin;
s fie ct mai puin afectat de fluctuaiile de selecie (la extragerea
mai multor eantioane dintr-o colectivitate general, mediile s nu fie sensibil
diferite).
Indicatorii fundamentali ai tendinei centrale sunt: media aritmetic,
modul i mediana.

IV.1.1. MEDIA ARITMETIC ( x )

Considerm c termenul de medie este cel mai uor de neles din


ntreaga statistic.
Au fost nenumrate situaiile n care am ntlnit media: media la fizic pe
trimestru sau semestru s vedem dac am rmas corigeni sau am luat premiu,
media
de la bacalaureat care ne ridic sau ne coboar ansele de admitere la facultate,
la fel ca i media anilor de studiu sau media cheltuielilor zilnice care ne ajut s
ne planificm mai bine bugetul. (Opariuc, 2009)
Deci ce este media? Media aritmetic este indicatorul care se utilizeaz
cel mai frecvent pentru caracterizarea tendinei centrale.
Media reprezint valoarea care nlocuind toi termenii unei serii nu
modific nivelul totalizator i se calculeaz ca suma valorilor unei variabile
44

raportat la numrul msurtorilor. Aceasta este media aritmetic (Opariuc,


2009, p. 75), deoarece n statistic mai discutm i de media geometric, media
caracteristicilor alternative, media ptratic, media rangurilor etc. Aceste
concepte le ntlnim ns mai rar n domeniul tiinelor socio-umane i prin
urmare nu vom face dect s le amintim. Media este un model ipotetic , un
model statisatic care reprezint tendina, direcia spre care connverg datele
(ibidem).
n

x
i 1

(1) - pentru serie simpl

Exemplu: Vrsta a 7 studeni de la facultatea de psihologie este de 25, 26, 32,


33, 40, 22, 26, 24. Vrsta medie este :

25 26 32 33 40 22 26 24 228

28,5ani
8
8

n cazul n care datele au fost sistematizate ntr-o serie de distribuie de


frecvene n care valorile/centrele intervalelor de variaie apar cu frecvenele n i,
atunci media aritmetic, numit i medie aritmetic ponderat este:
r

xn
i 1
r

i i

n
i 1

(2) pentru o serie cu distribuie de frecvene.

45

Exemplu : Salariile date angajailor (mil. lei) de ctre 70 de firme n anul


2005 a avut urmtoarea distribuie:
Interval

ni

20 - 40

10

40 - 60

15

60 - 80

10

80 - 100

S se calculeze media.
Rspuns : Fiind o serie cu distribuie de frecvene vom aplica urmtoarea
formul:
r

xn
i 1
r

i i

unde:

n
i 1

Xi = centrul de interval
Ni =frecvena absolut
Observm c n formul avem i necunoscute, adic X i (centrul de interval) i va
trebui s-l calculm.
Interval

ni

Xi

20 40

10

30

40 - 60

15

50

60 - 80

10

70

80 - 100

90

Xi =
Xi =

lim inf lim sup


2
20 40 60

30
2
2

46

Xi =

40 60 100

50
2
2

.
Xi =

80 100 180

90
2
2

Avnd toate datele problemei, putem nlocui n formul, astfel :

30 *10 50 *15 70 * 10 90 * 5

10 15 10 5

300 750 700 450 2200

55 Salariul mediu oferit este de 55 mil lei.


40
40

x
x

Not: Pentru o serie de distribuie de frecvene, media calculat pe


baza frecvenelor relative este egal cu media aritmetic determinat pe baza
frecvenelor absolute.
Proprietile mediei aritmetice (Popa, 2008, p. 59):
- adugarea / scderea unei constante la fiecare valoare a distribuiei
mrete / scade media cu acea valoare;
- mulirea / mprirea fiecrei valori a distribuiei cu o constant multiplic
/ divide media cu acea constant;
- suma abaterii valorilor de la medie este ntotdeauna egal cu zero;

IV.1.2. MODUL (M0 )

Modul este categoria cu frecvena cea mai mare, el reprezint valoarea


cel mai des ntlnit ntr-o serie statistic sau cea care are cea mai mare
47

frecven de apariie. Modul se mai numete i dominanta seriei sau valoarea


modal.
Grafic, ntr-o histogram ori poligon al frecvenelor el reprezint valoarea
de pe abscis corespunztoare vrfului reprezentrii.
n cazul datelor cantitative, n determinarea modului se ine cont de felul
n care
acestea au fost sistematizate.
Pentru o serie statistic simpl de forma 30,32,40,32,35,30,32 valoarea
modal, M0 = 32.
Pentru o serie de distribuie de frecvene alctuit dup o variabil
cantitantiv discret, determinarea modului se face prin identificarea valorii
creia i corespunde frecvena maxim.
n cazul seriilor de distribuie de frecvene pe intervale de variaie,
determinarea modului presupune mai nti identificarea intervalului cu frecven
maxim:

d1
hM 0
M 0 xinf M 0
d1 d 2

unde:
xinf M 0

reprezint limita inferioar a intervalului modal;

hM o reprezint mrimea intervalului modal;

d1 = diferena dintre frecvena intervalului modal i a celui precedent;


d1= nM nM
0

d2 = diferena din frecvena intervalului modal i a celui urmtor;


d2 = nM nM
o

Dac d1 = d2 atunci modul va fi egal cu centrul intervalului modal.

48

O serie de date statistice poate s aib una sau mai multe valori modale.
O distribuie cu un singur mod se numete unimodal, dac are dou valori
dominante se numete bimodal, iar dac are mai mult de dou moduri se
numete multimodal.

Exemplu : Salariile date angajailor de ctre 70 de firme n anul 2005 a avut


urmtoarea distribuie:
Intervale
10-20
20-30
30-40
40-50
50-60
60-70

ni
20
10
10
15
25
10
M0 =

xinf M o hM 0

d1
d1 d 2

Intmod = 50-60 (intervalul a crui frecven absolut este cea mai mare)
xinf M 0

= 50

d1 = nM nM
0

nM 0
nM 0 1

= frecvena intervalului modal

= frecvena intervalului anterior celui modal


d1 = 25 15 = 10
d2 = nM nM
0

nM 0

= frecvena intervalului modal

nM 0 1 = frecvena intervalului urmtor celui modal

d2 = 25 - 10 = 15

49

M 0 50 20

10
10
50 20
50 8 58
10 15
25

Mo =58

IV.1.3. MEDIANA (ME)

Mediana este o alt msur a tendinei centrale i reprezint valoarea


care mparte irul de msurtori n dou pri egale; jumtate din irul de
date vor avea valori mai mici dect mediana n timp ce cealalt jumtate
vor avea valori mai mari dect mediana (Opariuc, 2009, p. 79).
Mediana prezint valoarea/varianta din mijlocul unei serii de date, serie
n care observaiile au fost ordonate cresctor (sau descresctor). Mediana este
situat n centrul (mijlocul) seriei.
Mediana poate fi folosit n caracterizarea tendinei centrale pentru o
serie de date msurate pe o scal ordinal. Mediana ia n considerare doar
poziia observaiilor n serie, nu i magnitudinea lor efectiv.
Pentru a determina mediana introducem noiunea de ranguri, adic,
numere de ordine asociate observaiilor (cea mai mic rang 1; cea mai mare
rang n).
Locul medianei (LocMe) va fi rangul unitii din mijlocul distribuiei.
LocMe =

n 1
2

Pentru seriile simple la determinarea valorii din mijloc trebuie s lum


n consideraie situaiile:
a)

Dac n este un numr impar

pentru date cantitative mediana este exact valoarea din mijlocul

seriei

50

Exemplu: n cazul unui ir impar, mediana este valoarea de la mijlocul unui


ir. Dac relum exemplul anterior, i mai adugm un scor, obinem:
20, 17, 14, 9, 18, 15, 19
irul are 7 valori. Ordonnd cresctor irul de mai sus, obinem:
9, 14, 15, 17, 18, 19, 20

De data aceasta, la mijlocul acestui ir gsim valoarea 17, valoarea


medianei.
Observm c n = 7.
LocMe =

n 1
2

7 1 8
4
2
2

LocMe =4 a 4-a valoarea din irul de numere ordonate crector sau


descresctor reprezint mediana Me =17
Ordonnd un ir, putem preciza poziia fiecrui element n cadrul acelui
ir.
Altfel spus, mediana nu este altceva dect poziia rangului din mijloc n
irul ordonat de date. ntr-o serie de la 1 la 7, poziia din mijlocul irului este
evident, poziia 4. Acesta este de altfel i locul n care gsim mediana.

Scoruri:

9, 14, 15, 17, 18, 19, 20

Poziia:
b)

1, 2,

3, 4,

5,

6,

Dac n este un numr par, exist dou valori situate n

mijlocul seriei.
51

- dac datele sunt cantitative, mediana este media celor dou valori
din mijloc
Exemplu: Se consider urmtorul ir de date:
20, 10, 15, 18, 21, 22
Pentru a calcula mediana, primul pas este acela de a ordona cresctor sau
descresctor aceste date. Ordonnd cresctor irul de mai sus, obinem:
10, 15, 18, 20, 21, 22
S se calculeze mediana.
Se ordoneaz datele cresctor, astfel : 10, 15, 18, 20, 21, 22.
LocMe =

n 1
2

6 1 7
3,5
2
2

mediana se situeaz ntre a treia i a

patra valoare din serie.


Me =

18 20 38

19
2
2

Dup definiia medianei, n cazul nostru avem 6 valori. Prin urmare,


mediana va fi valoarea care mparte acest ir ordonat n dou pri egale. Fiind 6
valori, mediana este situat la limita primelor 3 valori.
Deoarece irul este un ir par, mediana se situeaz, n cazul nostru, ntre
valoarea 18 i valoarea 20, mai precis la valoarea 19.
c. Pentru o serie de distribuie de frecvene variate determinarea
medianei presupune calcularea mai nti a frecvenelor cumulate. Prima
frecven cumulat mai mare dect (n+1)/2 (locul medianei) ne indic varianta
median.
Exemplul 1: Pentru 80 de familii dintr-un bloc s-au sistematizat date privind
numrul membrilor de familie, rezultnd distribuia:
52

Numrul membrilor
de familie

Numrul de familii
ni

Frecvene cumulate
Fci

12
23
30
8
7
80

12
35
65
73
80

1
2
3
4
5

LocMe =

80 1
40,5
2

adic, ntre a 40-a i a 41-a familie prima frecven

cumulat mai mare dect 40,5 este 65 varianta trei membrii de familie
reprezint varianta median situat n mijlocul distribuiei.
Pentru o serie de repartiie de frecvene pe intervale de variaie, mediana
se va ncadra n intervalul median, primul interval cu frecvena cumulat mai
mare dect LocMe.

Exemplul 2: Se d distribuia:
Intervale
10-20
20-30
30-40
40-50
50-60
60-70

ni
20
10
10
15
25
10

53

Fci
20
30
40
55
80
90

LocMe =

n 1 90 1 91

45,5 ;
2
2
2

Me = xinf Me hMe

n = 90

LocMe Fc ( Me 1)
nMe

unde:
xinf Me

- limita inferioar a intervalului median

hMe mrimea intervalului median


Fc(Me-1) - frecvena cumulat a intervalului anterior celui median
nMe frecvena absolut a intervalului median
Me =

40 10

45,5 40
15

= 43,66

Me = 43,66

Mediana prezint unele avantaje fa de medie:


este mai puin afectat de valorile extreme, lund n considerare doar
poziia valorilor nu i magnitudinea lor efectiv;
poate fi folosit ntr-o distribuie pe intervale chiar i n cazul n care
primul sau ultimul interval sunt deschise;
este un indicator ce poate fi folosit i pentru date ordinale;
Dezavantajele medianei:
mediana nu poate fi supus la fel de uor calculelor algebrice;
media este preferabil n procesul de inferen statistic.

54

IV.2. INDICATORI SINTETICI AI MPRTIERII


IV.2.1. AMPLITUDINEA ABSOLUT (A)

Cuvntul amplitudine provine de la termenul englezesc range i se


calculeaz ca diferena ntre nivelul maxim i nivelul minim al caracteristicii.
A = xmax - xmin
Amplitudinea absolut are dezavantajul c poate fi influenat de o singur
valoare
aflat la extremitatea distribuiei (Popa, 2008).

IV.2.2. AMPLITUDINEA RELATIV A VARIAIEI (A %)

Se exprim n procente i se calculeaz ca raport ntre amplitudinea absolut a


variaiei i nivelul mediu al caracteristicii.
A% =

A
100
x

Amplitudinea se folosete la controlul calitii produselor prezentnd


importan i din punct de vedere metodologic, fiind folosit n prima faz a
prelucrrii statistice la stabilirea numrului de grupe i a mrimii intervalului de
grupare.
55

IV.2.3. QUARTIELE

Quartilele (Q) sunt percentile care mpart distribuia n patru segmente


egale, ele delimitnd cele 25% din observaii. Quartilele sunt n numr de trei:
Q1 (percentila 25), Q2 (percentila 50 sau mediana), Q3 (percentila 75).
Q1 este cuartila inferioar;
Q2 este egal ntotdeauna cu mediana;
Q3 este cuartila superioar;
Abaterea quartil este dat de diferena dintre valoarea corespunztoare
quaertilei 3 i valoarea corespunztoare quartilei 1 (Popa, 2008).
Determinarea valorilor quartilelor se face adoptnd formulele medianei:
Q1 = xinf Q1 hQ1

LocQ1 Fc ( Q1 1)
nQ1

unde:
x inf Q1
hQ1

= limita inferioar a intervalului quartilic;

= mrimea intervalului quartilic;

LocQ1 =

n 1
4

LocQ1 = locul quartilei, primele 25% valori;

Fc ( Q1 1) = frecvena cumulat a intervalului anterior celui quartilic;


nQ1 = frecvena absolut a intervalului quartilic;

Q3 xinf Q3 hQ3

LocQ3

LocQ3 Fc ( Q3 1)
nQ3

3( n 1)
;
4

56

LocQ3 = locul quartilei, ultimele 25% din valori;

Exemplul 1: Salariile date angajailor de ctre 70 de firme n anul 2005 a


avut urmtoarea distribuie:
Intervale
10-20
20-30
30-40
40-50
50-60
60-70

ni
20
10
10
15
25
10

Q1 = xinf Q hQ
1

LocQ1

Fci
20
30
40
55
80
90

LocQ1 Fc (Q1 1)

nQ1

n 1 91

22,75
4
4

Intervalul 20;30 primul interval care are frecvena cumulat mai mare
dect locul quartilei Q1
hQ1 30 20 10
xinf Q1 20
Fc (Q1 1) 20
nQ1 10
Q1 20 10

22,75 20
20 10 * 0,27 22,75
10

Q3 = primele 25% din firmele care ofer cele mai mari salarii.
Q3 xinf Q3 hQ3
LocQ3

LocQ3 Fc (Q3 1)
nQ3

3( n 1) 3 91

68,25
4
4

Intervalul quartilei Q3 = 1,4;1,8

57

xinf Q3 50
hQ3 60 50 10
Fc ( Q3 1) 55
nQ3 25
Q3 150 10

68,25 55
150 5,3 155,3
25

Q3= 155,3 primele 25% din firmele care ofer cele mai mici salarii.

IV.2.4. ABATEREA MEDIE LINIAR ( d x )

Se mai numete variaie medie, deviaie medie, abatere absolut medie


sau abatere liniar medie i se poate calcula atunci cnd media este un bun
indicator al tendinei centrale. Acest indicator informeaz asupra modului n care
se abat, n valori absolute, rezultatele de la medie, acordnd aceeai pondere
tuturor variabilelor. Abaterea medie se poate calcula pe date grupate sau pe date
discrete. (Opariuc, 2009, p. 123).
Se calculeaz ca medie aritmetic simpl sau ponderat a abaterilor
termenilor seriei de la media lor, luat n valoare absolut.

Pentru o serie simpl:


n

dx

x x
i 1

1 n
xi x
n i 1

Pentru o serie de distribuie de frecvene absolute:

58

dx

x x n
i

i 1

n
i 1

Pentru o serie cu frecvene relative, exprimate n procente:


k

dx

x x n %
i 1

*
i

100

Exemplu:
Pentru 200 de persoane s-au sistematizat datele culese cu privire la timpul
zilnic petrecut n faa televizorului rezultnd:
Timp (min)

Numr de
persoane ni

xi

xi*ni

xi - X

0-30

47

15

705

-57,75

57,75 2714,25

30-60

51

45

2295

-27,75

27,75 1415,25

60-90

76

75

5700

2,25

2,25

90-120

24

105

2520

32,25

32,25 774

120 -150

135

270

62,25

62,25 124,5

XI X

XI X

(Pn la 30)

171

T=5260,2
S se calculeze abaterea medie liniar.
n

x n
i 1

47 * 15 51 * 45 24 *105 2 *135 705 2295 5700 5520 270

200
200

n
11490

57,45
200
dx

x ni

n
i 1

5260,2
26,30
200

59

*ni

IV.2.5. DISPERSIA (VARIANA) UNEI CARACTERISTICI ( x )


2

Atunci cnd putem utiliza media, un indicator frecvent este indicatorul


dispersiei sau indicatorul varianei (atenie, nu variaie ci varian) notat cu
sigma ptrat pentru populaie sau s2 n cazul unui eantion.
Se calculeaz ca medie aritmetic simpl sau ponderat a ptratelor
abaterilor termenilor seriei fa de media lor.
Formula de calcul a dispersiei este urmtoarea, n care xi reprezint
valoarea msurat, x barat media iar N numrul de msurtori.
- pentru o serie simpl
n

x2

( x x)

i 1

- pentru o serie cu frecvene absolute


k


2
x

( x x)

i 1

ni

n
i 1

- pentru o serie cu frecvene relative, exprimate n procente

( x x)
i

x2

100

60

ni* %

Exemplu: Pentru 200 de persoane s-au sistematizat datele culese cu privire


la timpul zilnic petrecut n faa televizorului rezultnd:

Timp
(min)

Numr de
persoane ni

0-30

xi

xi*ni

xi -

(xi- x )2

(xi- x )2*ni

47

15

705

-42,45

1802

84694

30-60

51

45

2295

-12,45

155

7905

60-90

76

75

5700

17,55

308

23408

90-120

24

105

2520

47,55

2261

54264

120 i peste

135

270

77,55

6014

12028

(Pn la 30)

T=11490
T=182299
S se calculeze dispersia.
k

x2

( x x)
i 1

n
i 1

x2

ni

182299
911,49
200

61

xn

i i

i 1

=57,45

IV.2.6. ABATEREA MEDIE PTRATIC (ABATEREA TIP SAU


ABATEREA STANDARD)

Se noteaz cu s n cazul unui eantion sau cu sigma n cazul unei


populaii i o putem ntlni sub numele de abatere etalon, abatere tip, abatere
ptratic medie. Acest indicator este cel mai precis i inteligibil pentru msura
gradului de mprtiere
a rezultatelor n jurul tendinei centrale i contribuie la definirea distribuiei
normale. Poate fi calculat i dobndete semnificaie numai atunci cnd poate fi
calculat media.
Abaterea patratic medie este radacina patrat din media aritmetic a
ptratelor abaterilor valorilor observate n raport cu media lor aritmetic

22

Ea msoar modul n care rezultatele se mprtie n jurul mediei, valorile mari


indicnd un grad mare de mprtiere. Cu alte cuvinte, abaterea standard este un
indicator care ne arat n ce msur modelul statistic se potrivete cu modelul
real (Opariuc, 2009, p. 129).

Relaiile de calcul ale abaterii mediei ptratice sunt:


n

- pentru o serie simpl

22

( x x)
i 1

Petru, Al., 2005 Introducere n statstica social, Editura Paralela 45, Piteti, p. 52

62

Dac privim cu atenie aceast formul, constatm c expresia de sub


radical nu este altceva dect variana. Prin urmare, dup ce calculm variana,
putem afla uor abaterea standard extrgnd radicalul de ordin doi din varian.
2

- pentru o serie de frecvene absolute x

( x x)
i 1

ni

n
i 1

- pentru o serie de frecvene relative, exprimate n procente

( x x)

ni*%

100

Exemplu:
x x2

911,49 30.19

minute

Abaterile mici, indic faptul c valorile sunt uor distanate de medie, n timp ce
abaterile mari, arat c datele sunt distanate, mprtiate n jurul mediei, care,
nu mai este reprezentativ. Abaterea standard se exprim n aceleai uniti de
msur ca i media
Proprietile abaterii standard (Popa, 2008, p. 70):
- dac se adaug /scade o constnt la fiecare valoare a unei distribuii,
abaterea standard nu este afectat;
- dac se multiplic/divide fiecare valoarea a unei distribuii cu o
constant, abaterea stabdard se multiplic/divide cu acea constant.

63

IV.2.7. COEFICIENTUL DE VARIAIE ( v x )

Prezint, mai intuitiv dect abaterea standard, gradul de mprtiere al


rezultatelor n jurul mediei, deoarece este o expresie procentual a mpririi
abaterii standard la medie (Opariuc, 2009, p. 130).
Se calculeaz ca raport ntre abaterea medie ptratic i nivelul mediu al
seriei, deoarece abaterea standard se folosete frecvent pentru msurarea abaterii
medii.
Formula de calcul este:
vx

x
100
x

sau

vx

25,99
dx
100 0,045 )
100 (dac s-a calculat abaterea medie liniar
57,45
x

Valoarea coeficientului de variaie exprim un raport procentual dintre


abaterea standard i medie. Cu ct este mai mare, cu att se poate spune c
media este mai puin reprezentativ pentru distribuia respectiv. (Popa,
2008).
Dup

Popa (2006), sunt propuse anumite limite de interpretare a

coeficientului de variaie:
- dac

vx

15%, mprtierea este mic, deci media este

reprezentativ;
- dac

vx

este cuprins ntre 15 i 30%, mprtierea este mijlocie i

media este sufucient de reprezentativ;

64

- dac

vx

30%, mprtierea este mare, iar media are o

reprezentativitate redus.
Cu ct nivelul lui

vx

este mai apropiat de zero cu att variaia este mai

redus, colectivitatea este mai omogen, media avnd un grad mai ridicat de
reprezentativitate; cu ct valoarea sa este mai departe de zero, cu att variaia
este mai intens, colectivitatea mai eterogen, iar media are un nivel de
semnificaie mai sczut.
Alegerea indicatorului mprtierii (Popa, 2008, p. 72):
- abaterea standard este cea mai utilizat pentru scalele de msurare
interval /raport, deoarece realizeaz cea mai bun combinaie ntre
calitatea estimrii i posibilitatea de a fundamenta inferene
statistice;
- amplitudinea - este un indicator nesigur, care nu poate fi calculat n
cazul scalelor nominale;

IV.4. INDICATORI AI FORMEI DISTRIBUIEI


n cazul variablelor continue ce pot fi sistematizate n distribuii de
frecvene cu ajutorul intervalelor de grupare pe lng determinarea indicatorilor
tendinei centrale i variabilitii se pune problema s studiem i modul n care
valorile individuale sunt deplasate i centralizate comparativ cu tendina
central.
Forma unei distribuii de frecvene se analizeaz comparativ cu
distribuia ideal, normal prin indicatori asimetrici (oblicitii) i indicatori ai
boltirii (excesului).

IV.4.1. INDICATORI AI ASIMETRIEI (OBLICITII)

65

Asimetria se observ prin reprezentarea grafic prin histogram sau


poligonul frecvenelor, dar poate s fie msurat prin indicatori specifici.
Poziia indicatorilor tendinei centrale n funcie de forma distribuiei
(Popa, 2008, p. 72):
- perfect simetrice:

x Me M0

(fig. 1);

- cu asimetrie pozitiv: (fig. 2);


- cu asimetrie negativ: (fig.3).

Mo me

Fig.1

medie

fig.2

x Me M0

Medie Me mo

Fig.3
n cazul distribuiilor perfect simetrice, modul, mediana i media se
plaseaz n aceeai poziie. Dac distribuiile sunt asimetrice, atunci cei trei
indicatori au poziii diferite: mediana se plaseaz ntotdeauna ntre mod i
66

medie, motiv pentru care, ea este cea mai reprezentativ valoare pentru
distribuiile simetrice.
Media este afectat de valorile extreme i din aceast cauz, ea nu est un
indicator veridic al tendinei centrale atunci cnd este vorba de distribuii
puternic asimetrice. (Popa, 2008).
Asimetria n valoarea absolut se poate msura cu indicatorii:
As x M 0
sau

As1 3 x M e

Dar o distribuie este caracterizat i prin variabilitatea datelor. O serie


care are variabilitatea mai mic va fi mai pronunat oblic, iar ntr-o serie mai
mprtiat oblicitatea se va atenua. Pentru aceasta vom calcula coeficientul de
asimetrie Pearson:
Cas

x M0
x

coeficientul care ia valori pozitive n cazul curbelor

alungite spre dreapta (asimetrie pozitiv) i valori negative n cazul curbelor


alungite spre stnga (asimetrie negativ).
Coeficientul de asimetrie este nul pentru o distribuie simetric. El mai poate fi
exprimat:

Cas1

3 x Me
,
x

deoarece

x M 0 3 x M e .

Exemplu:
Presupunem c pentru 200 de persoane s-au sistematizat datele culese
cu privire la timpul zilnic petrecut n faa televizorului, rezultnd:
Timp (min)
0-30
(Pn la 30)
30-60
60-90
90-120
120 i peste

Numr de
persoane ni
47
51
76
24
2

67

xi

xi*ni

15

705

45
75
105
135
T=11490

2295
5700
2520
270

* ni

Mo =xinfMo-hMo

11490
57,45
200
d1
d1 d 2

25

Mo=60+30 25 52 60 30 * 0,32 69,74


Cas

x M0
57,45 69,74

0,407
x
30,19

3 x Me
57,45 61
Cas1

0,118
x
30,19

ceea ce semnific o asimetrie

negativ moderat (coada mai lung a distribuiei tinde spre valori mici).

IV.4.2. COEFICIENTUL YULE

Coeficientul msoar gradul de asimetrie prin raportul dintre diferena i


suma abaterilor quartile i se calculeaz dup formula alturat. Observm c,
pentru a calcula acest coeficient, este necesar s calculm pur i simplu cele trei
quartile, dup metoda prezentat ntr-unul dintre capitolele anterioare.
Casq

q2 q1
q2 q1 unde

Q1= Me-Q1
Q2=Q3-Me

Casq

Q3 M e M e Q1 Q3 Q1 2M e
Q3 M e M e Q1
Q3 Q1

Coeficientul poate lua, n general, valori de la -1 la +1 i indic mrimea


asimetriei negative sau pozitive. Cu ct valorile sunt mai apropiate de 0, cu att
distribuia este mai simetric. Cu ct se apropie de -1 sau de +1, ea devine tot
mai asimetric spre stnga sau spre dreapta.

68

Acest coeficient este foarte uor de calculat, ns ine cont doar de cteva
valori valorile quartile i nu de toate valorile din distribuie, fapt care i
limiteaz precizia i se consider c este doar un coeficient elementar al
simetriei.
Exemplu:
Pentru o distribuie s-au stabilit urmtoarele rezultate:
Q1= 150
Me= 130
Q3=140.
S se calculeze valoarea coeficientului de asimetrie Yule.
Rspuns. Coeficientul de asimetrie yule se calculeaz dup relaia:
(q 2 q1 )

(Q3 M e ) ( M e Q1 )

Casq= (q q ) = (Q M ) ( M Q ) =
2
1
3
e
e
1

Q3 Q1 2 Me 10 20
=
Q3 Q1
10 20

= -3

Q1= Me-Q1=130-150= -20


Q2=Q3-Me= 140-130= 10
Interpretare: Valoarea obinut, Casq= -3<0 arat c distribuia considerat este
asimetric la stnga.
Analiza oblicitii (asimetriei)se poate face i pe baza momentelor
centrate de ordinul
3:

x x
n

m3

i 1

n
utiliznd frecvente

x x m x x n %
r

m3

Dac
seriile

de

i 1

n
i 1

i 1

*
i

100

distribuie cu asimetrie negativ sunt mai numeroase, valorile x i mai mici dect
media, atunci abaterile

( xi x)

sunt negative.

Dac seriile de distribuie au asimetrie pozitiv sunt mai numeroase


valorile xi mai mari dect media, atunci abaterile

69

( xi x)

sunt pozitive.

Dac seriile de distribuie sunt perfect simetrice, abaterile

( xi x)

pozitive sunt tot att de numeroase ca i cele negative.


O mrime relativ a asimetriei se obine prin raportarea la abaterea
medie ptratic ridicat la cub.

IV.4.3. COEFICIENTUL DE ASIMETRIE FISHER

Coeficientul de asimetrie Fisher, nu se bazeaz pe cteva elemente,


precum coeficientul Yule, ci pe toate valorile din distribuie i se calculeaz
folosindu-se momentele centrate.
Coeficientul de asimetrie (Fisher): 1

m3
m32

.
x3
m22

2 2 3

Sau

Coeficientul 1 va avea valoare mai mare dect zero n cazul asimetriei


pozitive, valoare mai mic dect zero n cazul asimetriei negative i va fi egal cu
zero n cazul seriei perfect simetrice.
Atunci cnd discutm de asimetrie, trebuie s precizm o serie de relaii
care apar ntre indicatorii tendinei centrale, media, mediana i modulul.

ntr-o distribuie simetric, media, mediana i modul au exact aceleai


valori.
Caracteristica acestei distribuii o
reprezint coincidena absolut a celor
trei indicatori ai tendinei centrale. Dup
cum putei observa n figura de mai sus,
70

att media, ct i mediana i modul, se afl n acelai punct, la mijlocul


distribuiei. (Opariuc, 2009, p. 140).

ntr-o

distribuie

asimetric

la

dreapta (distribuie skewness pozitiv, vezi


figura alturat), predomin scorurile mici.
n acest caz, modulul este valoarea situat
cel mai la stnga n irul de date, iar
mediana este mai mare dect media.
Evident, mediana fiind valoarea care mparte irul ordonat de date n dou pri
egale, iar dac n distribuie predomin scorurile mici, atunci scorurile mari
sunt considerate ca scoruri extreme. tim, de la analiza preciziei indicatorilor
tendinei centrale, c ntr-o serie de date n care ntlnim scoruri extreme mari,
media tinde s le pun n valoare. Iat c acest fapt este ilustrat grafic n figura
de mai sus. Observai relaia existent ntr-o asemenea distribuie: Mo<Me<m.
Aceast relaie este relaia caracteristic a unei distribuii asimetrice pozitiv
(ibidem).

ntr-o distribuie asimetric la stnga (distribuie skewness

negativ, vezi figura alturat), predomin scorurile mari. n acest caz, modul este
valoarea situat cel mai la dreapta n irul de date, iar mediana este mai mare
dect media. Evident, mediana fiind valoarea care mparte irul ordonat de date
n dou pri egale, iar dac n distribuie predomin scorurile mari, atunci
scorurile mici sunt considerate ca scoruri extreme.
tim, de la analiza preciziei indicatorilor tendinei centrale, c ntr-o serie
de date n care ntlnim scoruri extreme
mici, media tinde s le pun n valoare.
Iat c acest fapt este ilustrat grafic n
figura de mai sus n care se observ
relaia existent.
71

ntr-o asemenea distribuie: Mo>Me>m. Aceast relaie este relaia


caracteristic a unei distribuii asimetrice negativ. (ibidem).

IV.4.4. BOLTIREA

Boltirea msoar nlimea, adic alungirea sau aplatizarea curbei,


comparativ cu cea normal.
Asimetria

pe

orizontal,

presupune, dup cum am vzut, o


deplasare a tendinei centrale spre
stnga sau spre dreapta, ctre scoruri
mici sau ctre scoruri mari. Aceasta este
singura asimetrie posibil? Ei bine,
nu. Exist i un fel de asimetrie
vertical sau boltire.

Ilustrarea tipurilor de aplatizare (dup Opariuc, 2009).

Termenul folosit generic pentru acest concept este termenul de kurtosis


(din limba greac, kurtos = cocoat) i indic gradul de extindere pe vertical
a curbelor de distribuie (Popa, 2008, p. 73). Practic, boltirea se refer la
aspectul cocoaei distribuiei rezultatelor.
Cocoaa poate fi ascuit i atunci vorbim de o distribuie ascuit sau
leptocurtic, poate fi turtit, distribuia turtit, plat sau platicurtic sau
normal, distribuie mezocurtic. O distribuie normal este ntotdeauna o
distribuie mezokurtic.
72

n figura de mai sus, distribuia C indicele de apltizare pozitiv indic o


curb nalt,

leptocurtic. n distribuia B, indicele de apltizare negativ

indic o curb aplatizat, platicurtic, iar distribuia A este o distribuie


normal sub aspectul boltirii, sau mezocurtic.
distribuie leptocurtic, ascuit, arat c datele sunt foarte grupate
i apropiate de medie, lotul de subieci avnd un mare grad de
omogenitate a scorurilor
O distribuie platicurtic, plat, este o distribuie n care rezultatele
sunt foarte mprtiate fa de medie i indic un grad ridicat de
eterogenitate a scorurilor.
Ai observat deja c boltirea nu este altceva dect simetria pe axa vertical
(OY), spre deosebire de simetria propriu zis, deplasarea valorilor pe axa
orizontal (OX).
La fel ca n cazul indicelui de asimetrie (skewness), cu ct acesta este mai
ndeprtat de valorile +1/-1m cu ctt avem de-a face cu distribuii cu o abatere
mai accentuat de la aplatizarea normal.
2

m4 m4

, unde m4 este momentul centrat de ordin 4


m22 4

x
n

m4

i 1

n
pe baza frecventelor

x
r

m4

i 1

n
i 1

x
r

x ni

i 1

x ni* %
100

Pentru curba normal (serie simetric) 2 = 3. Dac 2 > 3, curba este


mai ascuit dect cea normal (distribuie leptocurtic). Dac 2 < 3, curba este
mai turtit dect cea normal (dispoziie platicurtic).

73

Boltirea se mai poate msura i cu indicatorul:

x x
n

2 2 3

i 1

, care va avea valoarea zero dac distribuia este

normal, valoare pozitiv pentru distribuie leptocurtic i valoare negativ


pentru distribuie platicurtic.
Exemplu: Distribuia a 380 de firme dup numrul de zile de ateptare pn la
realizarea fuzionrii este:
Interval de variaie a numrului de zile
40-80
80-120
120-160
160-200
200-240
240-280

Numr de firme
50
70
90
100
50
20
380

x 149,47
M 0 166,67
M e 151,33
Q1 105,86
Q3 190,3

2 3068,14
55,39

S se calculeze oblicitatea i excesul repartiiei.


Rezolvare:
a. Coeficientul Yule
Casq

Q3 M e M e Q1
Q3 M e M e Q1

Casq

190,3 105,86 2 151.33 6,5

0,08
190,3 105,86
84,44

Q3 M e M e Q1
Q3 Q1

Asimetria este negativ moderat.


(Oblicitatea cu ajutorul momentelor centrate de ordinul 3 )
b. Boltirea

74

2
m4

m4
m22

x x

n
i

ni

7,93306 109
20876491
380

20876491
2,218
9413483
2 2 3 2,218 3 0,78

Curba este slab platicurtic (aplatizat) deoarece

2 3, 2 0

Momentele de ordin r sunt valori ale caractersiticii urmrite care mpart


distribuai observaiilor n r pri egale i au acelai efectiv 1/r din numrul
unitilor .
Exemplu: mediana = quartila 2 = moment de ordin 2
quartila = quartila de ordin 4

IV.5. Alegei rspunsul corect


1. Media aritmetic, ca indicator fundamental al tendinei centrale*:
a) reprezint valoarea care modific nivelul totalizator al seriei;
b) se folosete cel mai frecvent i reprezint suma valorilor raportat la
numrul lor;
c) se calculeaz adunnd valorile existente;
d) nu poate determina numrul de uniti din colectivitate.
2. Media aritmetic reprezint*:
a) valoarea pe care ar purta-o fiecare unitate statistic dac distribuia ar
fi eterogen;
b) valoarea pe care ar purta-o fiecare unitate statistic dac distribuia ar
fi omogen;
c) valoarea pe care ar purta-o fiecare variabil statistic dac distribuia
ar fi omogen.
3. Media aritmetic a unei sume dintre dou variabile este egal cu suma
mediilor celor dou variabile, cnd*:
a) cele dou variabile se afl ntr-o relaie de interdependen;
b) cele dou variabile se afl ntr-o relaie de invers proporionalitate;
c) cele dou variabile se refer la aceeai colectivitate;
d) cele dou variabile sunt independente;
e) cele dou variabile sunt direct proporionale.
75

4. Care dintre urmtoarele afirmaii privind media aritmetic este


adevrat*:
a) suma ptratelor tuturor abaterilor individuale ale termenilor seriei de la
media lor aritmetic este zero;
b) mrimea mediei aritmetice este cuprins ntre x min i xmax doar dac seria
prezint o tendin clar de asimetrie;
c) pentru o serie de distribuie de frecvene, media aritmetic, calculat pe
baza frecvenelor reduse de c ori, este mai mic dect media seriei iniiale de
c ori;
d) media produsului a dou variabile aleatoare este egal cu produsul
mediilor celor dou variabile;
e) pentru o serie de distribuie de frecvene, media calculat pe baza
frecvenelor relative este egal cu media aritmetic determinat pe baza
frecvenelor absolute.

5. Mediana, ca indicator statistic:


a) prezint valoarea din mijlocul unei serii de date n care observaiile au
fost ordonate cresctor sau descresctor;
b) nu poate fi folosit n caracterizarea tendinei centrale pentru o serie de
date msurate pe o scal ordinal;
c) nu are nici o legatur cu noiunea de rang.
6. 25% din salariatii unei inteprinderii au un salariu de cel mult 4 milioane
lei. Aceasta valoare reprezint:
a) quartila unu;
b) mediana;
c) quartila trei.
7. 75% din salariatii unei intreprinderii au un salariu de cel mult 7
milioane lei. Aceasta valoare reprezint:
a) quartila unu;
b) mediana;
c) quartila trei.
8. 50% din salariatii unei ntreprinderii au un salariu de cel mult 5
milioane lei. Aceasta valoare reprezint:
a) quartila unu;
b) mediana;
c) quartila trei.

76

9. ntr-o repartiie normal valoarea fa de care 25% din valorile


individuale sunt mai mici iar 25% din valorile individuale sunt mai mari
este:
a. quartila a doua;
b. quartila a treia;
c. quartila nti;
d. valoarea modal.
10. Media este o mrime generalizat, adic, nlocuind fiecare nivel
individual al caracteristicii de distribuie cu nivel mediu*:
a. suma termenilor seriei rmne aceeai;
b. suma termenilor seriei se modific;
c. suma termenilor seriei este nul.
11. Variana (dispersia) de grup msoar*:
a) variaia sub influena factorilor aleatori (variaia rezidual)
b) variaia sub influena factorilor eseniali
c) variaia sub influena factorilor aleatori i eseniali
12. Dac dorim s obinem un indicator al tendinei centrale pentru date
msurate pe orice scal, vom determina:
a) media aritmetic;
b) modul;
c) media geometric;
d) media ponderat.
13. Modul se afla dup relatia:
d1

a) Mo = xi - hMo * d d ;
1
2
d1

b) Mo = xi + hMo * d d ;
1
2
( n mo n mo 1 )

c) Mo = xi-1 + hMo (n n ) (n n )
mo
mo 1
mo
mo 1
14. Care dintre urmtoarele variante nu reprezint un indicator al tendinei
centrale?
a) mod;
b) distribuie de frecvene;
c) median;
d) medie;
e) medie ponderat.
15. Dac dorim s obinem un indicator al tendinei centrale care s nu fie
afectat de valorile extreme, s poat fi calculat pentru date msurate pe

77

orice scal (cu excepia celei nominale) i s aib o singur valoare, vom
calcula*:
a) media aritmetic
b) modul;
c) media geometric;
d) mediana;
e) media ponderat.
16. Modul se utilizeaz pentru caracterizarea:
a. tendinei generale i gradului de asimetrie;
b. gradului de boltire;
c. gradului de concentrare.
17. Quartilele sunt mrimi de poziie care mpart colectivitatea n:
a. n-1 pri egale;
b. 4 pri egale;
c. 5 pri egale;
18. n distribuia de mai jos:
Interval
ni

0-5
3

5 - 10
7

10 - 15
15

15 - 20
20

Intervalul (15 20) reprezint:


a. intervalul median;
b. intervalul modal;
c. intervalul quartilic.
19. Rolul indicatorilor tendintei centrale ai unei distributii statistice este de a*:
a) sintetiza datele
b) calcula marimile relative
c) aprecia gradul de dispersie al colectivitatii.
20. Asimetria se calculeaz dup relaia:
a) As= x +Mo
b) As= 3( x -Me)
c) As= 2( x -Mo)
21. Coeficientul de asimetrie Yule, se calculeaz dup relaia:
(q 2 q1 )

a) Casq= (q q )
2
1

; unde: Q1= Me-Q1


Q2=Q3-Me
78

(q 2 q1 )

b) Casq= (q q )
2
1
(q3 q1 )

c) Casq= (q q )
3
1
22. Coeficientul de boltire se calculeaz dup relaia:
m4

a) 2= m2
b) 2=

m3
3
c) 2=

m3
m2

23. O distribuie este mezocurtic atunci cnd:


a) 2 = 3, 2 = 0
b) 2 > 3, 2 >0
c) 2 < 3, 2 < 0
24. O distribuie este leptocurtic atunci cnd:
a) 2 = 3, 2 = 0
b) 2 > 3, 2 > 0
c) 2 < 3, 2 < 0
25. O distribuie este platicurtic atunci cnd:
a) 2 = 3, 2 = 0
b) 2 > 3, 2 >0
c) 2 < 3, 2 < 0
26. Abatarea medie liniar se calculeaz dup relaia:
( x x)
xi x
a) d i
c)
x

b)

dx

dx

x ni
n

27. Coeficientul 2
a)
b)
c)
d)
e)

m4
m2

se utilizeaz pentru analiza statistic a:

asimetriei;
variaiei;
boltirii;
tendinei centrale;
indicatorilor medii de poziie.

28. ntr-o serie de repartiie pe intervale format dup o anumit variabil,


valoarea sa modal este influenat de:
a) limitele inferioare i superioare ale intervalelor extreme;
ntrebrile i problemele cu asterix (*) sunt preluate din Jaba E, Pintilescu C, (2005).

79

b) de frecvenele de apariie ale intervalelor egale sau inegale;


c) de mrimea egal sau inegal a intervalelor de variaie;
d) de limita inferioar a intervalului modal;
e) de limita inferioar, de frecvenele intervalului modal, premodal i
postmodal;

IV.6. Probleme

1. Valoarea vnzrilor nregistrate de firma A pe parcursul a apte (7)


zile, se prezint astfel (n milioane lei) : 200, 250, 750, 1001, 1520, 1800,
2300.
S se calculeze valoarea medie zilnic a vnzrilor realizate de firma A.
2. Distribuia dup volumul vnzrilor zilnice (milioane lei) a unitilor
comerciale dintr-un jude n luna Ianuarie 2004, se prezint astfel:
Volumul
vnzrilor

Numrul
unitilor
comerciale

0 - 10
50

10 - 20
20

20 - 30
10

S se calculeze nivelul mediu al vnzrilor zilnice.


3. Se d urmtoarea distribuie:
Interval
10-15
15-20
20-25
25-30
30-35
35-40

ni
5
10
12
6
8
4
80

30 - 40
5

S se calculeze modul.

4. O firm nregistreaz, ntr-o perioada de 5 zile, urmtoarele date privind


volumul vnzrilor (milioane lei) : 5, 7, 20, 14, 9.
- s se afle valoarea medianei (locul medianei)
5. O firma nregistreaz, ntr-o perioad de 6 zile, urmtoarele date privind
volumul vnzrilor (milioane lei) : 10, 40, 20, 15, 22, 35.
- s se afle valoarea medianei .
6. Distribuia familiilor dintr-un bloc dup numrul de copii se prezint astfel:
Numr copii
Numr familii (ni)
0
4
1
8
2
15
3
4
4
2
5
1
Total
34
S se calculeze valoarea medianei.
7. . Distribuia muncitorilor unei firme dup timpul consumat pentru
realizarea produsului A, se prezint astfel:
Timp
- 30
30-60 60-90
necesar
Numr
25
50
60
muncitori
S se calculeze valoarea medianei.

90-120

120-15

150 -

45

15

8. Distribuia muncitorilor unei firme dup timpul consumat, pentru realizarea


produsului A se prezint astfel:
81

Sa se calculeze valoarea quartelei unu.


Timpul necesar
(minute)
x (i-1) ; x (i)
0-30
30-60
60-90
90-120
120-150
150-180
total

Numr muncitori
Ni
25
50
60
45
15
5
200

Xi

F(ci)

15
45
75
105
135
165

25
75
135
180
195
200

9. Distribuia muncitorilor firmei A dup timpul consumat pentru realizarea


produsuluiX se prezint astfel:
Timp
- 30
30-60 60-90 90necesar
120
Numr
25
50
60
45
muncitori
S se calculeze valoarea quartilei trei

12015
15

150 5

10. Distribuia unui eantion de firme dup cifra de afaceri lunar, X, n mil
lei, n anul 2004, este prezentat astfel*:
Xi-1; Xi
176-178
178-180
180-182
182-184
184-186
186-188
Total

ni
20
25
40
35
30
10
160

S se calculeze abaterea medie liniar.

11. Dac: Q1= 128,13 mil. lei


Me= 137,86 mil. lei
Q3= 147,92 mil. lei
Atunci, coeficientul de asimetrie Yule este egal cu:
a)
141 i arat o distribuie simetric
b)
0, 016 i arat o distribuie moderat asimetric
c)
0,016 i arat o distribuie puternic asimetric.
ntrebrile i problemele cu asterix (*) sunt preluate din Jaba E, Pintilescu C, (2005).

82

12. Pentru o distribuie s-au stabilit urmtoarele rezultate:


Q1= 150
Me= 130
Q3=140.
S se calculeze valoarea coeficientului de asimetrie Yule.
13. Pentru o distribuie s-au obinut urmtoarele rezultate:
m4 = 40.000 ; m2 = 100.
S se calculeze valoarea coeficientului de boltire.

14. Dac: m4 = 54059,44


m2 = 162,6
atunci coeficientul de boltire i interpretarea sa corect sunt:
a) = 2,045 arat o distribuie uor platicurtic;
b) = 2,045 arat o distribuie uor leptocurtic;
c) = 2,045 arat o distribuie uor mezocurtic.
15. Pentru o distribuie s-au obinut urmtoarele rezultate*:
Mo = 125 minute
x = 130 minute
= 12 minute.
S se calculeze valoarea coeficientului empiric de asimetrie.
16. Distribuia unui eantion de firme dup cifra de afaceri lunar X, n milioane
lei, n anul 2004, este:
Interval

176-178

178-180

180-182

182-184

184-186

186-188

ni

20

25

40

35

30

10

S se calculeze variaia (dispersia).

83

17. Pentru o distribuie statistic s-a obinut o valoare a coeficientului de boltire


egal cu 2,5.
S se calculeze coeficientul Fisher.
2 2 3

18. Distribuia unui eantion de firme dup cifra de afaceri lunar, X, n mil. lei,
n anul 2006, este:
Interval 176-178 178-180 180-182 182-184
ni
20
25
40
35
S se calculeze valoarea coeficientului de variaie.

184-186
30

186-188
10

IV.7. Rspunsuri corecte

IV.5. Rspunsuri corecte.


1. b - se folosete cel mai frecvent i reprezint suma valorilor raportat la
numrul lor;
2. b - valoarea pe care ar purta-o fiecare unitate statistic dac distribuia ar fi
omogen;

3. c - cele dou variabile se refer la aceeai colectivitate;

ntrebrile i problemele cu asterix (*) sunt preluate din Jaba E, Pintilescu C, (2005).

84

4. e - pentru o serie de distribuie de frecvene, media calculat pe baza


frecvenelor relative este egal cu media aritmetic determinat pe baza
frecvenelor absolute;
5. a - prezint valoarea din mijlocul unei serii de date n care observaiile au fost
ordonate cresctor sau descresctor;
6. a - quartila unu;
7. c - quartila trei;
8. b - mediana;
9. a - quartila doi;
10. a suma termenilor seriei rmne aceeai;
11. a - variaia sub influena factorilor aleatori (variaia rezidual);
12. b - modul;
13. c -

( n mo n mo 1 )

Mo = xi-1 - hMo (n n ) (n n )
mo
mo 1
mo
mo 1

14. b - distribuie de frecvene;


15. d - mediana;
16. a tendinei centrale i gradului de asimetrie;
17. b patru pri egale;
18. b intervalul modal;
19. a - sintetiza datele;
20. b - As= 3( x -Me);
(q 2 q1 )

21.a - Casq= (q q )
2
1

; unde: Q1= Me-Q1


Q2=Q3-Me

m4

22. a - 2= m2

23. a - 2 = 3, = 0;
85

24. b - 2 > 3, >0;


25. c - 2 < 3, < 0;
26. b -

dx

* ni ;

27. c. boltirii.
28. a - limitele inferioare i superioare ale intervalelor extreme;

IV.6. RSPUNSURI CORECTE.


1. Rspuns. Se folosete formula mediei aritmetice pentru o serie simpl.
x

x =
i

200 250 750 1001 1520 1800 2300


=
7

1117,28 milioane lei.

INTERPRETARE: VALOAREA MEDIE A VOLUMULUI VNZRILOR


ZILNICE ESTE DE 1117,28 MILIOANE LEI.
2. * Elementele de calcul sunt prezentate n tabelul urmtor:
Volumul
vanzarilor
x (i-1) ; xi
0-10

ni

xi

Xi . n

50

250

10-20

20

15

300

20-30

10

25

250

30-40

35

175

total

85

Xi= liminf +

h
2

sau

975

xi =
86

xi 1 xi
2

lim inf lim sup


2

Rsp. Nivelul mediu al vnzrilor zilnice se afl calculnd media aritmetic


care n cazul unei serii grupate pe intervale de variaie se calculeaz dup
relaia:
x

x *n =
n
i

5 * 50 15 * 20 25 *10 35 * 5
250 300 250 175 975

=
85
85
85

= 11,47

milioane lei.

= 11,47 mil lei valoarea medie a volumului vnzrilor este de 11,47 mil
lei.
x

1
3. Rspuns: Mo= xinf mo hmo d d 20 5 2 6 21,25
1
2
D1=nmo-nmo-1=12-10=2 ;
D2=nmo-nmo+1 =12-6=6

4. Rspuns. Pentru o serie simpl cu numr impar de termeni, ordonai n sens


cresctor, mediana se afl depistnd termenul central al seriei, n dreptul locului
medianei.
Locme=

n 1
2

(5 1)
2

=3 Me = 9 milioane lei.

Locul medianei este al 3-lea termen al irului (5,7,9,14,20), deci Me=9 milioane.
5. Rspuns. Pentru o serie simpl cu numr par de termini, ordonai n sens
cresctor, mediana const n calcului mediei aritmetice simple a celor 2 termeni
centrali ai seriei.
irul de date ordonate cresctor este: 10,15, 20, 22, 35, 40.
Me =

20 22
=
2

21 milioane lei.

6. Rspuns. Locme=

n 1 34 1 35

17,5
2
2
2

Prima frecven cumulat mai mare dect locul medianei ne indic


valoarea medianei. n cazul nostru, prima frecven cumulat mai mare dect
17,5 este 27, iar intervalul mdian va fi 2.
(ni=27) (Locme = 17,5)
7. Rspuns. Se calculeaz locul medianei.
Locme=

n 1 200 1 201

100,5
2
2
2

87

Loc me Fc me 1

Me= xinfme+hme

la

Timp
necesar
-30
30-60
60-90
90-120
120-150
150-

n me

Me=60+30

Numr
Fci
muncitori
25
50
60
45
15
5

100,5 75
60 12,75 72,75 min
60

Interpretare: Jumtate din numrul


total al muncitorilor au consumat
pentru realizarea produsului A pn
72,75 minute, iar jumtate au
consumat peste 72,75 minute

25
75
135
180
195
200

8. Rspuns: Q1=liminfQ1+hq1*

Loc q1 Fc( q11)

nq1
n 1 200 1 201
LocQ1= 4 = 4 4 =50,25

Se calculeaz frecvena absolut cumulat cresctor. Prima frecven mai mare


ca valoare decct locul cuartilei 1 ne indic intervalul quartilic 1.
Liminf=30, deoarece intervalul Q1 este 30,60
hQ1=60 30 = 30
Fc(Q1-1) = 25
nQ1= 50
Q1= 30+30*

50,25 25
=30+30*0,50
50

=30+15= 45

Interpretare: 25% din numrul total al muncitorilor consum cel mult


45 de minute pentru realizarea unei piese.
9. Rspuns. Locq3=

3 n 1 3 * 201

150,75
4
4
LocQ 3 Fc Q 31

nQ 3
Q3= xinfQ3+hQ3
Se calculeaz frecvena absolut cumulat cresctor. Prima frecven mai mare
ca valoarea decct locul quartilei 3 ne indic intervalul quartilic 3.

88

Q3 90 30

150,75 135
100,75
45

Interpretare: 75% din numrul total al muncitorilor consum cel mult 100,75
minute pentru realizarea unei piese.
10. Rspuns. Media = 181,75
Abaterea medie liniara = 2,42 mil lei pe ansamblul firmelor se
realizeaz o cifr de afaceri lunar care variaz n medie fa de nivelul mediu,
cu 2,42 mil lei, n sens pozitiv sau negativ.
1.
se calculeaz centrul de interval
2.
se calculeaz media
x

* ni

3. se calculeaz abaterea medie liniar. d x

x xn
n
i

(q 2 q1 ) (Q3 M e ) ( M e Q1 )
=
=
(q 2 q1 ) (Q3 M e ) ( M e Q1 )

11. RSPUNS. Casq=

(147,29 137,86) (137,86 128,13)


= 0,016
(147,92 137,86) (137,86 128,13)

12. Rspuns. Coeficientul de asimetrie Yule se calculeaz dup relaia:


(q 2 q1 )

10 20

Casq= (q q ) = 10 20 = -3
2
1
Q1= Me-Q1=130-150= -20
Q2=Q3-Me= 140-130= 10
Interpretare: Valoarea obinut, Casq= -3<0 arat c distribuia considerat este
asimetric la stnga.
13. Rspuns. Coeficientul de boltire se calculeaz dup relaia:
m4

2= m2

40.000
10.000

=4

m4= 40.000
m22 = (100)2 = 10.000
m4
2

54059,44
54059,44
2
(162,6) = 26438,76 =

14. Rspuns. 2= m2 =
2,045 i arat o distribuie uor
platicurtic deoarece
2 < 3 ( curba este mai turtit dect cea normal).
89

Dac 2 = 3 simetrie simetric, iar dac 2 > 3 atunci aveam o distribuie


leptocurtic deoarece curba era mai ascuit dect cea normal.
15. Rspuns. Coeficientul empiric de asimetrie Pearson se determin dup
relaia:
x Mo

Cas=

130 125
= 0, 417.
12

Interpretare: Valoarea obinut, Cas = 0,417 >0, arat c distribuia considerat


este puternic asimetric la dreapta.( curbele sunt alungite spre dreapta).
16. . Rspuns:

x x

n
i

ni

1. Se calculeaz centrul de interval.


Interval ni
xi
xini
176-178 20
177
354
178-180 25
179
4475
180-182 40
181
7240
182-184 35
183
6405
184-186 30
185
5550
186-188 10
187
1870
2. Se calculeaz media.

x n
n
i

177 * 20 179 * 25 181 * 40 183 * 35 185 * 30 187 * 10

160

29080
181,75mil.lei
160

x x

n
i

ni

(177 181,75) 2 * 20 (179 181,75) 2 * 25 (181 181,75) 2 * 40 (183 181,75) 2 * 35


(185 181,75) 2 * 30 (187 181,75) 2 * 10
160
1310
8,18
=
160

17. Rspuns: 2 2,5 (coeficientul de boltire)


2 2 3
2 2,5 3 0,5

Interpretare: Pentru

2 0,5 <

0, distribuia considerat este platicurtic.

90

V. CERCETAREA STATISTIC PRIN SONDAJ


(METOD DE BAZ N STUDIUL FENOMENELOR
SOCIALE I ECONOMICE)
________________________________________________________
__________________

Pentru caracterizarea statistic a fenomenelor i proceselor socialeconomice de mas, cu scopul evidenierii legitilor specifice acestora se
folosesc date individuale obinute prin metode de nregistrare total sau parial.
n condiiile economico-socialesocio-economice actuale, din nevoia de
informaii rapide, complexe, metoda principal de obinere a informaiilor
statistice este aceea a sondajului statistic.
Procesul cuprinde dou etape:
- etapa descriptiv n care se culeg date i se calculeaz indicatorii
ce caracterizeaz subcolectivitatea analizat;
- etapa inferenial n care rezultatele obinute pentru aceast
subcolectivitate,

se

extind,

termeni

probabilistici,

la

colectivitatea general.
Avantajele cercetrii prin sondaj:
- reducerea costurilor materiale i de munc;
- erorile de nregistrare sunt mai puin numeroase i mai uor de
nlturat n faza de verificare a datelor;
- programul observrilor prin sondaj cuprinde un numr mai mare de
caracteristici dect programul observrii totale, ceea ce permite
caracterizarea mai aprofundat a fenomenelor studiate prin metode
statistice;
- sondajul poate fi utilizat cu bune rezultate la verificarea
programului unei observri totale, ct i la verificarea unor ipoteze
statistice
91

Definiie: Selecia statistic reprezint operaia de extragere a unei


pri dintr-o colectivitate statistic, a unei subcolectiviti
numit i eantion, mostr, colectivitate parial sau
colectivitate de selecie.
Volumul eantionului este ntotdeauna mai mic dect cel al
colectivitii generale. Un volum mic poate duce la un eantion nereprezentativ,
iar un volum mare poate determina foarte multe cheltuieli.
Notm: volumul colectivitii generale cu N i volumul colectivitii
de selecie cu n, atunci 1 n N 1 .
n cazul n care datele au fost sistematizate n r grupe, dup variaia
unei caracteristici de grupare, avem:
r

N Ni

n ni

i 1

i 1

Atunci cnd toate elementele unei colectiviti sunt msurate, orice


indicator statistic ce caracterizeaz repartiia statistic se numete parametru.
Pentru datele provenite dintr-un eantion, indicatorul statistic calculat se
numete estimator.
Indicatorii tendinei centrale i cei ai variaiei vor avea notaii diferite,
dup cum ei sunt obinui dintr-o cercetare statistic total sau parial. Astfel,
media aritmetic va fi notat cu n cazul unei colectiviti totale i cu

cazul n care este un indicator obinut printr-o cercetare statistic prin sondaj.

Parametrul colectivitii generale se calculeaz astfel:


r

x
i 1

sau

x N
i 1
r

N
i 1

92

unde

i 1, r

Estimatorul parametrului obinut pentru eantion:


r

i 1

sau

xn
i 1
r

i i

i 1

Dispersia se va nota cu 2 dac este parametru obinut n


colectivitatea general i cu s2 dac este estimatorul parametrului, obinut
pe un eantion.
r

(x
i 1

sau

(x
i 1

)2 Ni
r

i 1

Dispersia eantionului:
r

s2

( x x)
i 1

sau

s
2

n 1

( x x)

i 1

ni

n 1
i 1

Observaie:
Rezolvarea problemelor cuprinse n planul de sondaj are drept scop asigurarea
reprezentativitii eantionului, de aceasta depinznd n totalitate valoarea rezultatelor
obinute n urma cercetrii.

V.1. PROCEDEE DE EANTIONARE


Metoda seleciei aleatoare st la baza oricrei eantionri, n vederea
obinerii unei inferene statistice. Procedeele de eantionare se aplic pentru a
reduce erorile de selecie.
n selecia aleatoare se disting urmtoarele tipuri de sondaj:
- sondaj simplu aleator;
- sondaj tipic (stratificat);
93

- sondaj pe serii (cuiburi);


- sondaj pe mai multe trepte;
- sondaj secvenial.
Sondajele pot fi repetate sau nerepetate, dup cum exist posibilitatea
revenirii unei aceleiai uniti n cadrul aceluiai eantion, astfel, n eantionul
repetat, sau, cu revenire, fiecare unitate statistic extras din colectivitatea
general este reintrodus n baza de sondaj dup ce a fost citit i caracteristicile
au fost nregistrate. n varianta sondajului nerepetat (fr revenire) unitile sunt
extrase din colectivitatea general, iar dup nregistrarea lor ele nu mai sunt
reintroduse n colectivitatea de baz; selecia se face dup modelul urnei din care
se fac extrageri succesive, fr a pune napoi bila extras, iar o unitate nu poate
s apar dect o singur dat.

V.1.1. Procedeul tabelului cu numere ntmpltoare


Const n prelevarea din cadrul populaiei a unitilor ale cror numere
de ordine stabilite printr-o numrtoare prealabil au fost citite dup un anumit
criteriu din tabelul numerelor aleatoare. Tabelul este o list de numere n care
fiecare cifr, de la 0 la 9, apare cu o probabilitate de 1/10 independent una de
alta.
Elementul colectivitii generale se numeroteaz de la 1 la N, astfel
nct s nu rmn nici un element nenumerotat i s nu se repete acelai numr.
Se selecteaz apoi un loc de unde ncepe citirea numerelor din tabelul cu numere
ntmpltoare. Se organizeaz numerele citite n grupuri de cifre a cror mrime
este numrul de cifre coninut de numrul N. Numerele astfel formate identific
unitile statistice care sunt selectate n eantion dac sunt cuprinse ntre 1 i N.
94

Dac un numr este zero sau mai mare de N, el este eliminat, deoarece nu exist
o unitate corespunztoare n colectivitatea general care s fie selectat. Citirea
continu pn cnd se selecteaz n uniti statistice.
Exemplu:
S alegem un eantion aleator de n = 7 uniti dintr-o colectivitate de
38 uniti, ncepnd cu rndul 10, coloana 2 din tabelul cu numere aleatoare.
Numerele citite din tabel vor fi:
7730, 8330, 5928, 7333, 4707, 6007, 4538,
8210, 7319, 4119, 7062, 4346, 0613, 2238.
Cum N = 38 are dou cifre, se rearanjeaz secvena citit n grupuri de cte
dou cifre astfel:
77, 30, 83, 30, 59, 28, 73, 33, 47, 7, 60, 7, 45, 38,
82, 10, 73, 19, 41, 19, 70, 62, 43, 46, 6, 13, 22, 38.
Se elimin numerele mai mari de 38:
30, 30, 28, 33, 7, 7, 38, 38, 10, 19, 19, 6, 13, 22.
Dac selecia este fr revenire se elimin numerele care reapar n list:
30, 7, 38, 19.

V.1.2. METODA BULGRELUIDE ZPAD


Este o metod care se folosete foarte frecvent n tiinele spcio-umane.
Cercetrile care au la baz aceast metod, fixeaz de obicei o dat limit pn
la care se pot primi rspunsurile subiecilor. Prin aceast metod, subiecii nu
sunt alei aleator ci, o persoan care rspunde recomand o alt persoan care
va rspunde (prieten, rud, cunotin, etc) i aa mai departe.

V.1.3. EANTIONAREA SIMPL ALEATOARE


Prin folosirea acestei metode are reprezint clasicul procedeu al
loteriei sau al tragerii la sori, fiecare individ dintr-o populaie are ansa de a fi
95

inclus n eantion. poate fi realizat n varianta cu revenire sau n varianta fr


revenire. Colectivitatea general este numerotat de la 1 la N. Numerele sunt
notate pe bile (cartonae) i sunt amestecate atent. n varianta cu revenire bila
(cartonaul) este reintrodus n urn, se repet amestecarea, extragerea se repet
pn la obinerea eantionului de volum n. Probabilitatea ca o unitate s fie
extras este 1/N, iar dup ultima extragere din urn rmn (N-1) bile. Numrul
eantioanelor distincte de volum n ce pot fi extrase n sondajul cu revenire este
Nn. n varianta fr revenire, dup extragerea primei bile n urn rmn (N-1)
bile, dup a doua extragere (N-2) bile, astfel nct, dup ultima extragere, n
urn rmn (N-n) bile, unde n este volumul eantionului. Probabilitatea unei bile
de a fi aleas n eantion crete, astfel la extragerea cu numrul i, 1 i n ,
probabilitatea unei uniti de a fi selectat este

1
N (i 1)

. Numrul de

eantioane distincte, de volum n, ce pot fi extrase este C Nn .


Limitele acestei metode constau n imposibilitatea obinerii listei cu
numele, prenumele, adresa persoanelor pe care vrem sa le selectm pentru
eantion.

V.1.4. EANTIONAREA STRATIFICAT

Este foarte eficient atunci cnd, la nivelul populaiei int exist mai
multe straturi, astfel putndu-se reproduce ponderea fiecrui strat n eantonul
final.
Exemplu: Dac dorim s studiem consumul mediu de alcool din
judeul X, a crui populaie este de 100.000 de persoane, atunci ne intereseaz o
stratificare n funcie de variabilele gen i mediu de provenien.

V.1.5. EANTIONAREA PE COTE


Este asemnoare metodei de eantionare pe straturi, avnd acelai
principiu: se identific straturile la nivelul populaiei i se ncearc reproducerea
acestora n eantion, fr a se folosi tehnici aleatorii.
96

Un avantaj al acestei metode l constituie rapiditatea obinerii eantionului


i lipsa bazei de eantionare.

V.2. Alegei rspunsul corect


1. ntr-o cercetare prin sondaj, valoarea medie la nivelul unei populaii
reprezint:
a. un parametru;
b. o valoare tipic de sondaj;
c. un estimator;
d. o estimaie.
2. Formarea eantionului n cazul unui sondaj aleatoriu simplu presupune
ca:
a. fiecrui individ din populaie s i se asocieze o probabilitate egal sau
inegal, de a intra n eantion;
b. eantionul s se formeze prin extragerea unui numr de grupe;
c. eantionul s se formeze prin extragerea aleatoare a unitilor la nivelul
fiecrei grupe.
3. n cazul sondajului stratificat (tipic) simplu, eantionul se formeaz
extrgnd din fiecare grup omogen a colectivitii generale:
a. acelai numr de uniti, indiferent de ponderea fiecrei grupe n
colectivitate;
b. un numr de uniti proporional cu ponderea grupelor n colectivitatea
general;
c. un numr de uniti proporional cu ponderea grupelor n colectivitatea
general i gradul de dispersie din grupe.
4. Erorile de reprezentativitate reprezint diferene ntre:
a. valoarea estimat i valoarea adevrat a unui parametru;
b. valorile reale i valorile nregistrate;
c. populaia real i eantionul observat.
5. Selecia statistic reprezint:
a. extragerea unei colectiviti dintr-un eantion;
b. Extragerea unei pri dintr-o colectivitate general;
c. compararea datelor a dou colectiviti.
6. Volumul unui eantion trebuie s fie:
a. ntotdeauna mai mic dect colectivitatea general;
b. ntotdeauna mai mare dect colectivitatea general;
97

c. egal cu colectivitatea general.

V.3. Probleme

1. Cunoatem urmtoarele date la nivelul unei populaii*:


N = 200 persoane, 2 100 .
Admitem o precizie x 2 i un risc 0,05 , pentru care z = 1,96.
Se cere s se calculeze volumul eantionului corepunztor unui sondaj
aleator simplu repetat, interpretai rezultatul.
2. Dispunem de urmtoarele date la nivelul unei populaii*:
N = 400 persoane, 2 100 .
Admitem o precizie x 2 i u risc 0,05 , pentru care z = 1,96.
Se cere s se calculeze volumul eantionului corespunztor unui sondaj
aleator simplu nerepetat. Interpretai rezultatul.
3. Pentru un sondaj aleator simplu nerepetat, realizat asupra unui eantion de
volum n= 100, extras dintr-o populaie de volum N = 1000, s-au obinut x = 40
ani, s= 22 ani. (s= dispersia eantionului)*.
Pentr un 0,05 (nivel de semnificaie), valoare erorii medii de selecie
este:
a) 2,2
b) 2,0856
c) 4,312
4. Se extrage un eantion aleatoriu simplu repetat de volum n= 900 persoane, sau obinut urmtoarele rezultate*:
x = 5 milionane lei.
s = 3 milioane lei.
Considernd un risc de 5 %, s se afle limitele intervalului de ncredere
pentru media populaiei din care s-a extras eantionul:
a)(4,732; 5,653)
b) (4,653; 5,789)
c)(4,904; 5196)
d)
5. Pentru un sondaj aleator simplu repetat, realizat asupra unui eantion de
volum n= 100, valoarea mediei eantionului i valoarea abaterii medii ptratice
(s) sunt*:
x = 30 ani
98

s = 3 ani
Pentru un = 0,05, valoarea erorii limit de selecie este:
a) 0,3
b) 0,588
c) 30
6. Pentru un sondaj aleator simplu nerepetat, realizat asupra unui eantion de
volum n=25, extras dintr-o populaie de volum N=1000, s-au obinut:
x

= 40 ani;

s=22 ani;

Pentru un =0,05, valoarea erorii medii de selecie este:


a. 2,2
b. 2,0856;
c. 4,312

V.4. Rspunsuri corecte

V.2. Rspunsuri corecte.


1. a. un parametru;
2 a. fiecrui individ din populaie s i se asocieze o probabilitate egal sau
inegal, de a intra n eantion;
3. a. acelai numr de uniti, indiferent de ponderea fiecrei grupe n
colectivitate;
4. a. valoarea estimat i valoarea adevrat a unui parametru;
5. b. Extragerea unei pri dintr-o colectivitate general;

6. a. Intotdeauna mai mic dect colectivitatea general;

ntrebrile i problemele cu asterix (*) sunt preluate din Jaba E, Pintilescu C, (2005).

99

V.3. Rspunsuri corecte.


1. Rspuns. Volumul eantionului corespunztor unui sondaj aleator simplu
repetat se calculeaz dup relaia:
2
z 2
n 2 2
x
n=

1,96 2 * 21
20,17 persoane
22

Interpretare: numrul persoanelor care ar trebui extrase aleatoriu simplu repetat


din populaia de volum N 0 200 este de 20,17 20 persoane.
2. Rspuns. Volumul entionului corespunztor unui sondaj aleator simplu
nerepetat, se calculeaz dup relaia:
2
z s 2 N
2
n
2
N x z s 2
2

1,96 2 * 100 * 400

n=

400 * 2

1,96

* 100

384 * 400
400 * 4 386

153600
1984

77,45 persoane.

Interpretare: numrul persoanelor care ar trebui extrase aleatoriu simplu i


nerepetat din populaia de volum N =400 este de 77,45 77 persoane.
3. Rspuns. b) Eroarea medie de selecie (reprezentativitate) se calculeaz
dup formula:
sx
sx

s
n
22
100

N n
N
1000 100
2,0856
1000

4. Rspuns: c) Considernd un risc de 5%, limitele intervalului de


ncredere pentru media populaiei din care s-a extras eantionul sunt:

x z

s
2

3
5 1,96
4,804;5,196
n
900

100

5. Rspuns: b) Pentru un sondaj aleator simplu repetat, valoarea erorii


limit de selecie , pentru un nivel de semnificaie 0,05 este:
x z s x
2

x z

s
2

6. Rspuns b) =

1,96
s
n

3
100

0,588

N n

22
100

1000 100
2,0856
1000

101

VI. TESTAREA IPOTEZELOR STATISTICE


____________________________________________________________________________________________________________

VI. 1. DEMERSUL TESTRII UNEI IPOTEZE STATISTICE.


Demersul testarii unei ipoteze presupune parcurgerea unor etape i rezolvarea
problemelor pe care le implic, i anume (Jaba, 2004, p. 331-336):
Se formuleaz ipotezele, n funcie de problema pus;
Se alege un test statistic n funcie de distribuia de selecie a statisticii
considerate;
Se alege un prag de semnificaie pentru test;
Se stabilesc regulile de decizie, definind regiunile de acceptare i de
respingere a ipotezei H0;
Se calculeaz valoarea statisticii test, folosind datele nregistrate prin
sondaj;
Se compar valoarea calculat a statisticii test cu valoarea teoretic;
Se ia decizia de a nu respinge sau de a respinge ipoteza admis.
n urma extragerii unui eantion dintr-o populaie statistic prin
prelucrarea datelor provenite din sondaj se obine un estimator al parametrului
urmrit n populaia de origine. Problema care se pune este n ce msur
parametrul estimat pe baza rezultatelor sondajului asigur credibilitatea
aprecierilor fcute asupra ntregii colectiviti.
Estimatorul este, o presupunere a parametrului, adic, o ipotez
statistic.

102

Definiie: O ipotez reprezint o prezumie clar, explicit i


verificabil, referitoare la reliile sau diferenele existente ntre dou sau mai
multe variabile. (Opariuc, 2009, p. 197).
Ipotezele se folosesc att n cazul studiilor care urmresc stabilirea unor
relaii dintre variabile (studii corelaionale) ct i pentru cercetrile care vizeaz
existena unor diferene dintre variabile (studii factoriale).
n toate domeniile tiinelor aplicate este necesar s se recurg la
experimentarea unor noi metode, tehnologii, produse, fcndu-se presupuneri
asupra superioritii lor fa de procedeele curent folosite n vederea lurii unei
anumite decizii. Totodat este necesar s verificm dac n timp s-au produs
modificri n ceea ce privete parametrii populaiei sau exist diferene
semnificative ntre diferite grupuri ale aceleiai populaii. Toate aceste
presupuneri constituie nite ipoteze a cror valabilitate trebuie verificat i
deoarece aceast verificare se face statistic (operndu-se cu date obinute n
urma unei selecii statistice dintr-o populaie) ele se denumesc ipoteze statistice.
Verificarea concordanei rezultatelor experienei cu una dintre ipoteze se
face pe baza unui criteriu statistic furnizat de un ansamblu de reguli de
prelucrare a datelor numit test statistic. Cu ajutorul lui se ajunge la decizia de a
respinge o ipotez i a accepta alta. Luarea unei decizii cu privire la o ipotez
statistic se numete testarea ipotezei.
O ipotez se numete simpl dac ea determin n mod univoc repartiia
specificat a variabilei aleatoare i compus dac este format dintr-un numr
finit de ipoteze simple.
Testele statistice furnizeaz criterii pe baza crora se accept sau se
respinge o ipotez cu privire la o populaie statistic pe baza observaiilor fcute
ntr-un eantion aleator extras din ea.
Alegerea testului nu depinde de eantion, de aceea procedeul de testare a
ipotezei i ipoteza se pot specifica nainte de selecie.
Trebuie subliniat faptul c printr-un test statistic nu se stabilete adevrul
ci doar dac rezultatele seleciei sprijin ipoteza formulat i cu ce probabilitate.
103

VI.2. ERORI N TESTAREA IPOTEZELOR STATISTICE


n statistic, ipotezele apar ntotdeauna n perechi: ipoteza nul i ipoteza
alternativ.
Ipoteza statistic ce urmeaz a fi testat se numete ipoteza nul i se
noteaz H0.
Ea const ntotdeauna n admiterea caracterului ntmpltor al
deosebirilor, adic n presupunerea c nu exist deosebiri eseniale.
Respingerea ipotezei nule implic acceptarea unei alte ipoteze numit
alternativ, notat cu H1.
Definiie: Procedeul de verificare a unei ipoteze statistice se numete test sau
criteriu de semnificaie.
Verificarea ipotezei nule se face pe baza unui eantion de volum n,
extras din populaia X. Dac punctul definit de vectorul de sondaj x1, x2, ... , xn
cade n regiunea critic Rc, ipoteza H0 se respinge, iar dac cade n afara regiunii
critice Rc, ipoteza H0 se accept.
Eroarea pe care o facem eliminnd o ipotez nul, dei este adevrat se
numete eroare de genul nti.(Popa, 2008).
Probabilitatea comiterii unei astfel de erori reprezint riscul de genul nti
() i se numete nivel sau prag de semnificaie.
Nivelul de ncredere al unui test statistic este (1- ), iar (1- )100
reprezint probabilitatea de garantare a rezultatelor.
Eroarea pe care o facem acceptnd o ipotez nul, dei este fals se
numete eroare de genul al doilea, iar probabilitatea (riscul) comiterii unei
astfel de erori se noteaz cu . Puterea testului statistic este (1- ).
104

Erorile de tip I pot fi micorate de cercettor fixnd nivelul de


semnificaie ct mai mic. Erorile de tip II pot fi micorate prin creterea
volumului eantionului. Dac variaia seleciei este mai mic se reduc ambele
erori.
Deoarece evitarea unui tip de eroare sporete ansa celeilalte devine important
de tiut care tip de eroare trebuie mai atent evitat.

VI.3. TESTE DE CONCORDAN


Acest subcapitol se refer la concordana, potrivirea dintre valorile
calculate n eantion i valorile parametrilor din colectivitatea general.
Testele de concordan se mai numesc teste de ajustare, care exprim
potrivirea unei distribuii empirice la o distribuie ateptat sau teoretic.
Fie populaia de interes, notat cu P1. pentru orice eantion se poate
considera o populaie de baz, P2, din care eantionul va fi extras.
Problema este dac se poate considera c P2 concord cu P1. ipoteza nul
va afirma c P1 i P2 concord. Respingerea ipotezei nule va avea n practic
dou consecine:
se va considera c eantionul nu este reprezentativ pentru populaia de
interes, populaie considerat stabil i se va extrage un alt eantion
se va considera c populaia P1 s-a schimbat, noua populaie de referin
este P2.

VI.3.1. EROAREA STANDARD ESTIMAT A MEDIEI

n testul erorii standard al mediei, se presupune c sunt ndeplinite


condiiile care asigur mediei de sondaj o repartiie normal (eantion n 30)
105

sau aproape normal. De aceea variabila aleatoare z urmeaz o distribuie


normal standard (z este variabila normal normat).
Eroarea standard:
Este un indice pentru variabilitatea mediilor n cazul mai multor
eantioane extrase din populaie; ea este media msurii cu care media
eantioanelor difer fa de media populaiei din care au fost extrase;
Este folosit n cea mai mare parte ca un pas intermediar n alte tehnici
statistice (cum ar fi testul t);
La fel ca i abaterea standard i variaia poate fi folosit ca un indice
pentru variabilitatea scorurilor unei variabile;

VI. 3.2. COMPARAREA A DOU EANTIOANE DE SCORURI


CORELATE/RELAIONATE. (TESTUL T)

Testul este publicat n 1908 de W.S. Gosset sub pseudonimul


Student. Principala diferen ntre distribuiile de eantionare ale statisticilor
z i t este aceea c distribuia t are o cantitate de variabilitate mai mare dect
z.
Testul t:
Este folosit pentru evaluarea semnificaiei statistice a diferenei
dintre mediile pentru dou seturi de scoruri; ele ajut la elucidarea ntrebrilor
comune ale cercettorilor dac valoarea medie pentru un set de scoruri difer de
valoarea medie pentru alt set de scoruri;
Deoarece, n cercetare, n mod invariabil, se lucreaz cu eantioane de
oameni extrase din populaia latent, trebie s estimm dac orice diferen pe
care o obinem ntre cele dou seturi de valori este semnificativ statistic.
Exist dou variante ale testului t:
106

1. Pentru eantioane perechi


- folosit cnd cele dou seturi de scoruri ce trebuie comparate provin
dintr-un singur eantion;
- cnd coeficientul de corelaie ntre cele dou seturi este mare.
Uneori ne lovim de situaii n care eantioanele din care provin mediile ce
trebuie comparate sunt dependente (procedeul de selecie al unui eantion este
legat de procedeul de selecie al celuilalt).
Cnd elementele celor dou eantioane sunt asociate ntr-un anumit mod
dou cte dou (de exemplu: rezultatele nregistrate nainte i dup aciunea unui
factor experimental), procedeul cel mai simplu const n a raiona asupra
diferenelorpe care le prezint fiecare pereche de date asociate, corelate.
2. Pentru eantioane independente
- se folosete cnd cele dou seturi de valori provin din grupuri
diferite de participani, pentru a calcula dac mediile acestora sunt diferite
semnificativ una fa de cealalt.
n cazul eantioanelor independente, probele de semnificaie difer n
funcie de dou situaii:
Cnd numrul de msurtori (N) n fiecare eantion este destul de mate
(mai mare ca 30);
Cnd numrul de msurtori sau volumul eantionului este mai mic dect
30.

VI.3.3. TESTUL CHI-SQUARE


(DIFERENE NTRE FRECVENELE EANTIOANELOR)

n general, testul chi-square este folosit pentru evaluarea existenei unei


diferene semnificative ntre dou sau mai multe eantioane care sunt formate
din date de frecven (date nominale). Altfel spus, este testul statistic uzual care
107

analizeaz tabelele de asociere sau contingen pe baza a dou variabile


categoriale nominale.
De asemenea, poate fi folosit i pentru testarea faptului c un singur
eantion este semnificativ diferit fa de o populaie cunoscut.
Observaie: Aceast aplicaie este cea mai puin comun, deoarece
caracteristicile unei populaii snt rareori cunoscute n cercetare.
Observaie: Trebuie avut n vedere faptul c o analiz chi-square trebuie
s includ datele fiecrui individ o singur dat. Frecvenele totale trebuie s
fie egale cu numrul de persoane folosite n analiz
.
VI.3.4. TESTUL Z PENTRU EANTIOANE INDEPENDENTE,
DISPERSII CUNOSCUTE

Cnd am discutat de abaterea standard, am vzut c


aceasta reprezint um mijloc de raportare a modului n care
rezultatele se mprtie n jurul ei. De asemenea, am spus c,
dac cunoatem media i abaterea standard, putem foarte uor
s precizm probabilitatea ca un scor par se situeze ntr-o
anumit poziie. Pentru disciplinele socio-umane, acest lucru
este vital, deoarece atunci cnd msurm, practic precizm
poziia pe care o are un subiect n raport cu o populaie de
referin.
Este ideal ca aceast poziie s poat fi prezentat ntr-o
manier standardizat. Acest lucru poate fi uor de ndeplinit
dac avem n vedere conceptual de note standardizate.
La baza acestui concept stau notele z. Notele z
reprezint diferena dintre scorul observat i medie, n
termeni de abatere standard, cu alte cuvinte, notele z nu
108

sunt altceva dect distanele la care se situeaz scorurile


particulare n raport cu media grupului iar aceast distan este
exprimat standardizat.
Teoretic, notele z sunt note
obinute pe o curb cu media 0 i
abaterea standard 1. n acest caz, o
distribuie normal are practic notele
z cuprinse ntre -3 i +3, ntre
aceste note regsindu-se peste 99%
din populaie, dup cum observai n
figura de alturi. (Opariuc, 2009, p.
164).

Multe cazuri de analiz statistic implic o comparaie ntre mediile a dou


colectiviti generale.
Exemplu: Un patron al unui restaurant dorete s vad dac exist
diferene ntre vnzrile realizate nainte i dup o campanie de publicitate;
Exemplu: Un grup de consumatori dorete s vad dac exist o
diferen semnificativ ntre consumul electric pentru dou tipuri de cuptoare cu
microunde.
Notele z au i ele o serie de proprieti cu aplicabilitate
practic de-osebit, dintre care:
Media unei distribuii z este egal cu zero, afirmaie ce
rezult din proprietatea acestui indicator de a se diminua atunci
cnd scdem o constant din fiecare scor particular. Deoarece
din formul rezult aceast diferen (se scade fiecare scor
particular din medie), n final media va ajunge la valoarea zero;

109

Abaterea standard a unei distribuii z este ntotdeauna


1.

aceast

afirmaie

rezult

din

proprietile

abaterii

standard. tim c dac mprim abaterea standard la o


constant, valoarea acesteia se divide corespunztor. Din
formul, observm c acea constant la care mprim este
chiar abaterea standard iar mprirea a dou numere egale are
ca rezultat 1.
Notele z sunt note direct calculabile, utilizndu-se media
i abaterea standard i reprezint temelia oricrui proces de
standardizare.

110

VI.4. Alegei rspunsul corect

1. Un estimator statistic reprezint*:


a. o funcie de variabile aleatoare de selecie, independente i identic
distribuite;
b. o valoarea tipic de sondaj;
c. o estimaie a parametrului populaiei.
2. Valoarea medie calculat la nivelul unei populaii reprezint*:
a. un parametru;
b. o valoare tipic de sondaj;
c. un estimator;
d. o estimaie.
3. Eroarea limit este folosit la stabilirea:
a. preciziei unei estimaii;
b. unei variabile independente;
c. intervalului de variaie a mediei de selecie fa de media general.
4. ntr-un proces de testare a ipotezelor statistice, eroarea de genul nti
este:
a) eroarea pe care o facem acceptnd ipoteza nul cnd ea este adevrat;
b) eroarea pe acre o facem acceptnd ipoteza nul atunci cnd ea este fals;
c) eroarea pe care o facem acceptnd ipoteza alternativ cnd ea este adevrat;
d) eroarea pe care o facem eliminnd ipoteza nul atunci cnd ea este adevrat;
e) eroarea pe care o facem eliminnd ipoteza alternativ atunci cnd ea este
adevrat.
5. ntr-un proces de testare a ipotezelor statistice, eroarea de genul al doilea
este
a) eroarea pe care o facem acceptnd ipoteza nul cnd ea este adevrat;
b) eroarea pe care o facem acceptnd ipoteza alternativ cnd ea este fals;
c) eroarea pe care o facem acceptnd ipoteza nul cnd ea este fals;
d) eroarea pe care o facem eliminnd ipoteza nul cnd ea este adevrat;
e) eroarea pe care o facem eliminnd ipoteza alternativ atunci cnd ea este
fals.

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

6. Mrimea intervalului de ncredere al unui parametru crete o dat cu


scderea*:
a. volumului eantionului;
b. coeficientului de ncredere ;
c. varianei populaiei.
7. Testul t este folosit pentru:
a. evaluarea semnificaiei statistice a diferenei dintre mediile pentru dou
seturi de scoruri;
b. evaluarea existenei unei diferene semnificative ntre dou sau mai
multe eantioane
c. testarea faptului c un singur eantion este semnificativ diferit fa de o
populaie cunoscut.
8. Testul chi square este folosit pentru:
a. evaluarea semnificaiei statistice a diferenei dintre mediile pentru dou
seturi de scoruri;
b. evaluarea existenei unei diferene semnificative ntre dou sau mai
multe eantioane
c. testarea eantioanelor independente.
9. Testul t se poate folosi pentru:
a. testarea ipotezelor statistice cu privire la parametrii unui model;
b. testarea normalitii unei distribuii;
c. testarea inegalitii a dou medii.
10. Testarea mediei unei distribuii se poate realiza folosind:
a. testul chi.square;
b. testul t student;
c. histograma.
11. Pentru testarea egalitii a dou medii se folosete:
a. testul t student;
b. Testul chi-square;
c. testul fisher.

112

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

VI.5. Rspunsuri corecte


1. a. o funcie de variabile aleatoare de selecie, independente i identic
distribuite;
2. a. un parametru;
3. c. intervalului de variaie a mediei de selecie fa de media general;
4. d. eroarea pe care o facem eliminnd ipoteza nul atunci cnd ea este
adevrat;
5. c. eroarea pe care o facem acceptnd ipoteza nul cnd ea este fals;
6. a. volumului eantionului;
7. a. evaluarea semnificaiei statistice a diferenei dintre mediile pentru
dou seturi de scoruri;
8. b. evaluarea existenei unei diferene semnificative ntre dou sau mai
multe
eantioane
9. a. testarea ipotezelor statistice cu privire la parametrii unui model;
10. b. testul t student;
11. a. testul t student;

113

Mihaela Rus

VII.

Elemente de statistic aplicat

Mihaela Sandu

ELEMENTE DE ANALIZ DISPERSIONAL

Studierea fenomenelor i proceselor sociale i economice prin


metode statistice presupune folosirea unor indicatori cu coninut de valori
sintetice, care s prezinte proprietatea de a fi reprezentative pentru cel mai
mare numr de valori individuale din care s-au calculat.
Statistica dispune de procedee care permit s se verifice n ce msur
aceste valori calculate, de regul sub form de mrimi medii sau ecuaii de
tendin au caracter de valori tipice pentru grupa sau colectivitatea de fenomene
la care se refer.

VII.1. ANALIZA DE VARIAN (ANOVA)


Analiza de varian indic msura n care cteva (dou sau mai multe
grupuri) au medii foarte diferite. Aceast analiz resupune c fiecare dintre
grupurile de scoruri provine de la indivizi diferii.
Cu ajutorul testului parametric de analiz dispersional ANOVA se pot
examina dou sau mai multe eantioane independente pentru a determina dac
mediile populaiilor din care provin ar putea fi egale, putndu-se pune astfel n
eviden influena factorului considerat sau a tratamentului efectuat.
Exist mai multe tipuri de ANOVA, dar dou dintre acestea sunt cele mai
frcevent folosite (Popa, 2008, p. 129):
- ANOVA unifactorial se aplic atunci cnd avem o variabil
depedent msurat pe o scal de interval/raport msurat pentru
trei sau mai multe valori ale unei variabile independente
categoriale.

114

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Exemplu: scorul obinut la testul de cunotine statistice ale


studenilor de la psihologie n funcie de tipul de liceu absolvit
(real, umanist, etc).
- ANOVA multifactorial se aplic atunci cnd avem o singur
variabil dependent i dou sau mai multe variabile independente,
fiecare avnd dou sau mai multe valori murate pe o scal
categorial (nominal sau ordinal).
Exemplu: scorul obinut la testul de cunotine statistice ale
studenilor de la psihologie n funcie de tipul de liceu absolvit
(real, umanist, etc) i de gen (masculin, feminin).
Observaie: Nu este o condiie esenial s avem scoruri egale n fiecare set.
Grupurile diferite aparin variabilei independente; valorile numerice
corespund variabilei dependente.
Practic, analiza de varian calculeaz variaia dintre scoruri i pe cea
dintre nivelul pe eantioane.
Dac dou valori estimative sunt foarte diferite, nseamn c variaia
datorat variabilei independente este mai mare dect ne-am putea atepta pe
baza variaiei dintre scoruri. Dac aceast disparitate este suficient de mare,
diferena de la nivelul variabilitii este semnificativ din punct de vedere
statistic. Acest lucru nseamn c variabila independent are efect asupra
scorurilor.
Analiza de varian poate fi dificil de interpretat atunci cnd se folosesc
dou sau mai mult de dou grupuri.
Cu ajutorul acestui tip de varian se studiaz mrimea i frecvena cu
care valorile reale ale unei caracteristici statistice se abat de la valorile teoretice
calculate, precum i msura n care
independente de factorul de grupare.

115

aceste variaii sunt dependente sau

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Exemplu: variaia salariilor primite de muncitori n funcie de gradul lor


de calificare (se verific n ce msur gradul de variaie a calificrii muncitorilor
determin variaia salariilor).
Analiza dispersional se aplic n special cnd datele provin dintr-o
cercetare selectiv, iar din cercetrile anterioare se dispune de informaii cu
privire la gradul i forma de distribuie a caracteristicilor n colectivitatea
general.
Pentru a efectua analiza dispersional trebuie s se nregistreze variaia
unei caracteristici statistice, condiionat de unul sau mai muli factori de
grupare. n acest sens, caracteristica a crei variaie se studiaz se consider ca
variabil rezultativ i se noteaz cu y, iar caracteristicile dup care se face
gruparea datelor se consider variabile independente sau factoriale i se noteaz
x1, x2, ... , xn.

VII.2. REGRESIA I CORELAIA SIMPL LINIAR.


VII.2.1. REGRESIA

Metoda regresiei presupune explicarea unei variabile rezultative y pe


baza uneia sau mai multor variabile factoriale, utiliznd un model (o funcie de
regresie).
ntr-un astfel de model este folosit noiunea de cauzalitate adic
schimbrile n variabila independent determin sau cauzeaz schimbri n
variabila dependent.
Relaii exacte ntre fenomene i procese social-economice nu pot fi ns
descrise orict de multe caracteristici factoriale am lua n consideraie, datorit
fenomenelor aleatoare care nu pot fi modelate sau explicate.
n cazul n care se ia n considerare o singur variabil cauzal, regresia
se numete simpl, iar unul dintre modelele clasice cele mai utilizate pentru a
116

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

explica comportamentul unei variabile efect n funcie de o singur variabil


independent este linia dreapt.
Regresia mai poate fi:
1. Regresie multipl stepwise.
Este o modalitate de alegere a predictorilor unei anumite variabile
dependente pe baza criteriilor satistice.
Practic, procedura hotrte care variabil independent reprezint cel
mai bun predictor, al doilea ca valoare, etc.
Se pune accentul pe identificarea celor mai buni predictori pentru
fiecare etap. Cnd predictorii se afl ntr-o relaie strns de corelaie
att ntre ei ct i cu variabila dependent, adeseori, o varibil ajunge
s fie enumerat ca fiind predictor, iar cealalt nu. Acest lucru
nseamn c a doua variabil nu constituie un predictor, ci doar c nu
adaug nicio informaie n plus prediciei fa de cele oferite de primul
predictor.
2. Regresia multipl ierarhic.
Permite cercettorului n ce ordine s foloseasc o list de predictori.
Acest lucru se realizeaz prin asocierea predictorilor sau a grupurilor
de predictori n blocuri de variabile.

VII.2.2. CORELAIA LINIAR (PEARSON)


Coeficientul de corelaie ofer informaii despre modul cum variaz
valorile a dou variabile, una n raport cu cealalt. Coeficientul de corelaie are o
semnificaie cauzal doar dac cele dou variabile au fost msurate ntr-un
context care probeaz cauzalitatea. (acest lucru se poate realiza numai n condiii
de experiment).

117

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Atunci cnd se calculeaz coeficientul de corelaie pentru valorile


msurate pe un eantion, scopul este de a estima gradul n care cele dou
variabile au o variaie comun la nivelul ntregii populaii.
Pentru a putea calcula coeficientul de corelaie Pearson, eantionul trebuie
s fie aleatoriu, iar cele dou variabile (ambele msurate pe scale de
interval/raport) s aib o distribuie care s nu se abat grav de la distribuia
normal. (Popa, 2008, p. 160).
Ca o concluzie, se poate spune c, corficientul de corelaie Pearson,
testeaz intensitatea asocierii dintre dou variabile msurate pe aceeai subieci,
n condiii diferite sau cu instrumente diferite. Acesta, nu este un indicator al
relaiei cauzale, ci al variaiei concomitente a valorilor variabilelor testate.
Acest coeficient este sensibil la valorile extreme: cu ct eantionul este
mai mic, cu att efectul valorilor extreme este mai mare.

118

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

VII.3. Alegei rspunsul corect


1. Regiunea de acceptare a unei ipoteze este intervalul dintr-o distribuie de
probabilitate a unei statistici considerate n care*:
a. se respinge ipoteza nul;
b. se accept ipoteza nul;
c. se accept ipoteza alternativ.
2. Pragul de semnificaie este:
a. pragul pn la care se admite un rezultat aproximativ;
b. o limit a erorii de spea I;
c. o limit a erorii de spea II.
3. Analiza dispersional se aplic atunci cnd*:
a. datele provin dintr-o cercetare selectiv;
b. datele provin din aceeai cercetare;
c. datele provin din cercetri diferite.
4. Regresia multipl stepwise:
a. Este o modalitate de alegere a predictorilor unei anumite variabile
dependente pe baza criteriilor satistice;
b. permite cercettorului n ce ordine s foloseasc o list de predictori;
c. ia n consideraie o singur variabil cauzal.
5. Componentele variaiei sunt*:
a. variaia inter i intragrupe;
b. variia total;
c. variaia parial.
6. Pentru testarea egalitii a 3 sau mai multe medii se folosete:
a. testul F;
b. Testul t;
c. testul Z
7. Variaia intergrupe msoar*:
a. variaia mediilor grupelor fa de media lor;
b. variaia din interiorul fiecrei grupe;
c. variaia total.

119

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

8. Variaia intragrupe msoar:


a. variaia mediilor grupelor fa de media lor;
b. variaia din interiorul fiecrei grupe;
c. variaia total.

VII.4. Rspunsuri corecte

1. b. se accept ipoteza nul;


2. b. o limit a erorii de spea I;
3. a. datele provin dintr-o cercetare selectiv;
4. a. Este o modalitate de alegere a predictorilor unei anumite variabile
dependente pe baza criteriilor satistice.
5. a. variaia inter i intragrupare;
6. a. testul F;
7. a. variaia mediilor grupelor fa de media lor;

8. b. variaia din interiorul fiecrei grupe;

ntrebrile i problemele cu asterix (*) sunt preluate din Jaba E, Pintilescu C, (2005).

120

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

VIII.

ETAPELE CERCETRII N TIINELE


SOCIOUMANE

_________________________________________________________________________________________________________________

Orice demers statistic presupune un proces care trebuie s parcurg mai


multe etape (Popa, 2008):

Prezentarea cadrului general al cercetrii;

Prezentarea metodei i a lotului de subieci;

Prelucrarea datelor;

Discutarea i interpretarea rezultatelor;

Formularea concluziilor.

VIII.1. PREZENTAREA CADRULUI GENERAL AL


CERCETRII.
Dei pare cea mai simpl etap a demersului tiinific, ea nu este deloc
simpl i necesit un volum mare de cunotine.
Se urmrete exprimarea cu claritate a tipului de studiu
statistic care a fost efectuat i a obiectivelor urmrite.
Obiectivele generale vizeaz cercetarea n ansamblul ei.
Un studiu tiinific are unul, maxim dou obiective generale. Nu
ne putem concentra eforturile pe mai multe planuri ori
planurile sunt ghidate exact de modul de formulare al
obiectivelor generale.
Obiectivele generale ale unei cercetri sunt formulate n
urma unui cumul de observaii i, eventual, n urma unui studiu
metaanalitic. n ultima situaie, este necesar prezentarea
121

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

rezultatelor studiului metaanalitic care a ghidat formularea


obiectivului general i prin care se demonstreaz lipsa de
abordare sau abordarea nepertinet a problemei studiate.
Obiectivele specifice reprezint aspecte detaliate ale
investigaiei tiinifice, deriv din obiectivul general i creeaz
baza formulrii ipotezelor de cercetare (alternative). n funcie
de dimensiunile cercetrii i de resursele pe care le are la
dispoziie cercettorul, se pot formula unul, dou, trei
douzeci de obiective specifice, aflate n legtur cu obiectivul
general.
Formularea ipotezelor este cea de-a doua etap a unei cercetri
tiinifice.
Definiie: O ipotez reprezint o prezumie clar, explicit i verificabil,
referitoare la relaiile sau diferenele existente ntre dou sau mai multe
variabile.
Ipotezele sunt formulate att n cazul studiilor care urmresc stabilirea
unor relaii dintre variabile (numite i studii corelaionale) ct i pentru
cercetrile ce vizeaz existena unor diferene dintre variabile (studii factoriale).
Clocotici (2000), face diferena ntre ipotezele unilaterale, care se folosesc
atunci cnd se cunoate sensul, direcia n care evolueaz variabilele, i ipoteze
bilaterale, (care nu impun direcia de evoluie a variabilelor).
Ipotezele unilaterale se utilizeaz n momentul n care
avem o idee de sensul, direcia n care evolueaz variabilele.
Aceste ipoteze sunt mai precise i permit dezvoltarea unor
studii pertinente, existnd anse mai mari s fie susinute de
analiza da-telor. O ipotez unilateral se recunoate dup
modul de formulare, deoarece n enunul acesteia regsim
direcia de evoluie a variabilelor. De exemplu, dac desfurm
o cercetare care are ca scop analiza legturii dintre anxietate i
122

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

depresie, am putea formula o ipotez unidirecional de tipul


exist o legtur pozitiv ntre nivelul anxietii i nivelul
depresiei. n aceast situaie, ipoteza va fi susinut numai n
cazul n care legtura dintre anxietate i depresie este pozitiv,
adic n situ-aia n care subiecii cu anxietate care manifest i
puternice simptome depresive sau subiecii cu anxietate mic
nu prezint simptome depresive. Ipoteza nu se susine dac, de
exemplu, subiecii cu anxietate mic manifest puternice
simptome de-presive (cazul unei corelaii negative). Dei mult
mai precis, exist n permanen riscul s nu putem susine
ipoteza n condiiile n care sensul formulat nu este reprezentat
de datele cer-cetrii, chiar dac n urma analizei pot rezulta i
alte sensuri specifice;

Ipotezele bilaterale nu impun direcia de evoluie a

variabilelor. Dei mai puin precise n comparaie cu cele


unilaterale, ipotezele bilaterale ofer o mai mare libertate
cercettorului. O formulare de genul exist o legtur ntre
nivelul de anxieta-te i predominana simptomelor depresive
poate fi susinut att n cazul n care corelaia este pozitiv ct
i n situaia unei corelaii negative. Ipoteza nu este susinut
doar

condiiile

care,

cu

mare

probabilitate,

se

demonstreaz inexistena unei asemenea relaii.

Ipoteza nul i ipoteza alternativ.


Este foarte important s se cunoasc noiunea de ipotez nul i ipotez
alternativ.
Astfel, relund exemplul de mai sus, ipoteza alternativ (specific), se
noteaz cu Hs, poate fi enunat astfel:
123

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

H1: se presupune c exist o legtur ntre prezena la


ore i performana academic.
Din punct de vedere statistic, nu putem verifica direct
aceast ipotez. Singura modalitate prin care putem sprijini
ipoteza alternativ este s enunm i apoi s testm ipoteza
nul. De obicei, ipoteza nul notat cu H0 este o negare
logic a ipotezei alternative i poate fi formulat astfel:
H0: Un exist nicio legtur ntre prezena la ore i
performana academic.

Observaie: ntr-o cercetare statistic exist o singur ipotez nul i una


sau mai multe ipoteze specifice.
Observaie: Att ipoteza nul (H0) ct i ipoteza alternativ (Hs) se
refer la populaie, nu la eantioane ca atare.
Semnificaie i eroare n testarea ipotezelor.
Putem respinge ipoteza nul dac probabilitatea s fie adevrat este
foarte mic. Dar aici poate apare ntrebarea Ct de mic?, Care este pragul la
care se pote respinge ipoteza nul?
ntr-o cercetare tinific se lucreaz cu dou praguri de cercetare:

Primul prag reprezint probabilitatea de 0,05 (5% sau 1 caz

din 20 de cazuri);

Al doilea prag reprezint probabilitatea de 0,01 (1% sau 1

caz din 100 de cazuri).

n liteartra de specialitate, pragul de semnificaie se noteaz

cu p sau
Observaie: Pragul de semnificaie permite respingerea ipotezei nule
atunci cnd exist valori mai mici dect p (p < 0,05).

124

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Aa cum am precizat n capitolul anterior, cele mai multe cercetri


risc apariia unei erori de tip I (care este cea mai grav eroare), avnd
tendina de a neglija apariia erorii de tip II.
Eroarea de tip I corespunde pragului de semnificaie de de 0,05 (5%),
adic, sunt anse de 5% s se resping ipoteza nul n condiiile n care s-ar
dovedi adevrat.
Eroarea de tip II corespunde pragului de semnificaie de (0,1%), ceea ce
nseamn c putem respinge ipoteza nul dac s-ar dovedi adevrat, i mai
multe anse s nu o respingem atunci cnd ea ar trebui respins.
Populaia de interes trebuie definit cu claritate, aceasta
fiind privit ca o colecie de date care descriu o anumit
caracteristic a respectivelor obiecte.
Se descrie modul de constituire a eantionului, se insist
pe criteriile de includere sau excludere a unor indivizi (sau
valori). Dac eantionul este stratificat atunci se vor descrie
criteriile de stratificare i volumul de subieci pentru fiecare
grup.
Concluzionnd, prezentarea cadrului general al cercetrii
reprezint prima etap a demersului tiinific. Ea este nsoit
de un studiu al cercetrilor n domeniu i de prezentarea clar i
precis, n termeni cuantificabili, a obiectivelor generale,
specifice i a eantionului.
VIII.2. PREZENTAREA METODEI I A LOTULUI DE
SUBIECI
Variabilele analizate trebuie s fie descrise explicit, se indic denumirea i
semnificaia fiecreia precum i modul n care au fost msurate.
Instrumentele de msurare folosite trebuie s fie descrise, s li se prezinte
caracteristicile psihometrice (validitate).
125

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Nu n ultimul rnd, n aceast etap, se va prezenta modul n care a decurs


procedura de investigare, descrierea condiiilor, a duratei, a locului i a
personalului care a contrinuit la aceasta.

VIII.3. PRELUCRAREA DATELOR;


Pentru a putea proiecta o cercetare, trebuie s dm rspunsul la o serie de
ntrebri, cum ar fi:
Ce condiii vor fi aplicate subiecilor n vederea testrii ipotezelor;
Care sunt varibilele cercetrii i cum vor fi tratate acestea;
La ce nivel de precizie vor fi efectuate msurtorile;
Care va fi lotul de subieci pe care se va desfura cercetarea.
n ceea ce privete prelucrarea datelor, se ncepe cu eventualele
complicaii care au aprut pe parcursul studiului (se includ valorile lips,
dificultile de organizare care au influenat calitatea informaiilor recoltate, etc.
Analiza statistic va ncepe ntotdeauna cu o inspecie a valorilor obinute
(se va face analiza sub aspectul formei, indicatorilor tendinei centrale, valorilor
excesive, etc). Aceast analiz are ca scop obinerea unei imagini de ansamblu a
variabilelor de interes (frecvene, tendina central, mprtierea, grafice).
Momentul cel mai important n aceast etap l constituie verificarea
ipotezelor statistice. Rezultatele obinute depind de calitatea cu care au fost
parcurse etapele menionate anterior.
Tabelele sunt cele mai utilizate pentru includerea n textul rapoartelor de
cercetare a rezultatelor obinute, deoarece ele indic cu exactitate valorile i
susin cu precizie, concluziile. Figurile, prezint informaia ntr-o form intuitiv
i acceisbil. Este recomandat ca fiecare grafic s prezinte o singur idee.

VIII.4. DISCUTAREA I INTERPRETAREA REZULTATELOR;


126

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Dac rezultatele sunt recoltate i nregistrate corect, atunci, prelucrarea


acestora se face foarte uor cu ajutorul programelor computerizate (cum ar fi
SPSS). O interpretare consistent are la baz suportul teoretic, claritatea i
consistena ipotezelor cercetrii.
Un aspect foarte important l constituie i interpretarea semificaiei
statistice (atingerea pragului de semnificaie). Aa cum meniona Opariuc
(2009), prin metode statistice se stabilete doar la ce nivel de ncredere se poate
respinge ipoteza nul.

VIII.5. FORMULAREA CONCLUZIILOR.


Formularea concluziilor reprezint etapa final a unei cercetri tiinifice
i rezum ntregul demers tiinific. Dac pragul de semnificaie este mai mare
dect pragul acceptat, atunci probabil ipoteza nul este adevrat i va trebui
acceptat. n caz contrar putem respinge ipoteza nul.
Observaie: Ipoteza specific nu poate fi respins sau acceptat. Singura
decizie pe care o putem lua se refer la ipoteza nul.

127

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

VIII.7. Alegei rspunsul


corect

1. Orice demers statistic presupune un proces care trebuie s parcurg mai


multe etape: 1. Enunarea problemei; 2. Proiectarea cercetrii; 3.
Interpretarea

datelor;

4.

Efectuarea

observaiilor;

5.

Formularea

concluziilor; 6.Formularea ipotezelor. Ordinea lor corect este:


a. 1, 6, 2, 4, 3, 5.
b. 1, 5, 6, 3, 4, 2.
c. 5, 6, 4, 1, 2, 3
2. Obiectivele generale:
a. sunt formulate n urma unui cumul de observaii i n urma unui
studiu metaanalitic;
b. pun n eviden aspecte detaliate ale cercetrii tiinifice;
c. ajut la formarea ipotezelor de cercetare.
3. Pragul de semnificaie permite:
128

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

a. respingerea ipotezei nule atunci cnd exist valori mai mici dect p;
b. respingerea ipotezei nule atunci cnd exist valori mai mari dect p;
c. acceptarea ipotezei nule.
4. Eroarea de tip I corespunde:
a. pragului de semnificaie 0,05;
b. pragului de semnificaie 0,01;
c. niciunuia dintre ele.
5. Eroare de tip II corespunde:
a. pragului de semnificaie 0,05;
b. pragului de semnificaie 0,01;
c. niciunuia dintre ele.

VIII.8. Rspunsuri corecte

1. a. 1, 6, 2, 4, 3, 5.
2. a. sunt formulate n urma unui cumul de observaii i n urma unui
studiu metaanalitic;
3. a. respingerea ipotezei nule atunci cnd exist valori mai mici dect
p;
4. a. pragului de semnificaie 0,05;
5. b. pragului de semnificaie 0,01;

129

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

PARTEA A DOUA
- ASPECTE TEORETICE I PRACTICE ALE
PROGRAMULUI STATISTIC SPSS -

130

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

INTRODUCERE
_________________________________________________________________________________________________________________

Aplicaia SPSS (Statistical Package for the Social Sciences pachet


de programe statistice aplicate tiinelor sociale) a fost elaborat n anul 1965
de ctre Universitatea Stanford din California.
Programul SPSS (Statistical Package for the Social Sciences) este
unul dintre cele mai utilizate n analiza statistic a datelor i a evoluat pn la
versiunea 16, aria de aplicabilitate extinzndu-se de la versiune la versiune,
odat cu modul de operare i cu facilitile oferite. Programul este utilizat n
foarte multe domenii: n marketing, cercetare experimental, educaie, sntate
etc. n afar de analizele statistice posibile, programul are componente puternice
pentru managementul datelor (selectare, reconfigurare, creare de date noi) i
pentru documentarea datelor (exist un dicionar metadata, care reine

131

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

caracteristici ale datelor). Se mai poate aduga flexibilitatea privind tipurile de


date acceptate ca i modul de construire a rapoartelor.
Aceast carte prezint un mod de abordare a analizei statistice folosind
SPSS for Windows i este destinat studenilor care doresc s analizeze date din
psihologie, sociologie, criminologie, sau date similare. Cartea se dorete a fi un
ndrumtor pentru analiza datelor, fiind o carte complet, de sine stttoare care
satisface nevoile studenilor la toate nivelele.
Manualul este structurat pe XVII capitole, oferind astfel posibilitatea
parcurgerii pas cu pas a informaiilor prezentate dar i o privire de ansamblu
asupra procedurilor de calcul din SPSS.
Persoanele familiarizate cu fundamentele teoretice ale statisticii, pot
parcurge independent acest manual, deoarece, fiecare tem este nsoit de
indicarea referinei teoretice precum i devteme de control care vor putea fi
efectuate cu programul SPSS.

I.

Noiuni de baz despre introducerea


i analiza statistic folosind SPSS

_________________________________________________________________________________________________________________

I.1. Accesarea SPSS-ului.


SPSS-ul for Windows este accesat n general prin folosirea butoanelor i
meniurilor folosind pentru aceasta clicuri ale mouse-ului. Astfel, cea mai rapid
modalitate de nvare este de a urma paii prezentai i capturile de ecran.
Pasul 1:
Se d dublu clic pe imagine
dac imaginea nu apare pe
ecran atunci accesai Start
ProgrameIBM SPSS Statistic 19.

132

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Pasul 2:
Aceast fereastr va aprea
dup cteva momente i se
pot alege oricare dintre
opiunile din fereastr.
(Fereastra se numete Data Editor.
Fereastra de editare (Data Editor) se deschide
implicit la lansarea SPSS i este folosit
pentru introducerea, modificarea sau tergerea
datelor n format spreadsheet. ntr-o fereastr
de editare poate fi prezentat coninutul unui
fiier de date care a fost selectat dintr-o
list de fiiere creat anterior (n SPSS, Excel,
Statistica etc.) sau poate fi creat o nou foaie
de lucru. Aceast fereastr recunoate fiierele de date care au extensia implicit .sav.
n fereastra Data Editor sunt afiate datele de lucru. Acestea sunt aranjate n format tabel
(spreadsheet), care conine coloane i linii. La intersecia acestora sunt celulele (casetele,
csuele) n care se introduc datele. La un moment dat este activ (curent) o singur celul,
cea n care este plasat cursorul. Celula curent este scoas n eviden printr-un chenar
ngroat. Trecerea de la o celul la alta se realizeaz prin clic de mouse n noua celul sau de
la tastatur cu ajutorul tastelor de control (taste sgei, Page Up, Page Down).

I.2. Introducerea datelor.


Pasul 3:
Aceasta este fereastra Data Editor a SPSS-ului i este un spaiu de lucru
cu linii i coloane n care pot fi introduse datele.
Coloanele sunt folosite pentru a
desemna diferite variabile.
Liniile sunt cazurile sau indivizii
despre care se dein date.

Pasul 4:
Pentru a introduce date in SPSS
133

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

se selecteaz una dintre celule i se d


clic pe celula respectiv.
* n SPSS exist ntotdeauna o singur celul
selectat.

Pasul 5:
Se introduce un numr folosind tastatura
calculatorului. La apsarea tastei Enter
sau la selectarea cu mouse-ul a unei alte
celule numrul va fi introdus n foaia de
lucru la fel cum este artat n figur.
Valoarea 5 este nregistrarea pentru primul
rnd (primul caz) al variabilei VAR00001.
Se observ c aceast variabil a primit automat un nume standard. Pentru
a efectua schimbarea se d clic pe numele variabilei.

134

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Pasul 6:
Corectarea erorilor se face folosind mouse-ul:
se selecteaz celula unde este eroarea i se
introduce valoarea corect.
Atunci cnd este apsat tasta Enter
sau se deplaseaz cursorul pe o alt celul,
valoarea corectat va fi introdus.
I.3. Salvarea datelor.
Pasul 7:
Selectnd File Save As datele se vor
salva sub forma unui fiier. Fiierul salvat
va primi automat de la SPSS extensia .sav.
* Se recomand folosirea unor nume
de fiiere distincte (ex. date1) pentru
a face coninutul lor ct mai clar. Salvarea
datelor este recomandat s se fac ntr-un fiier
diferit de cel al SPSS-ului.

Pasul 8:
Pentru a alege locaia unde va fi salvat
fiierul de date, se alege calea n mediul
Save In (se folosete sgeata pentru a
ajunge la locaia dorit).
O baz de date aflat n lucru nu are un
corespondent ntr-un fiier dect dup ce se execut
o salvare a acesteia, deoarece, programul nu are
o funcie de salvare automat dup un interval de
timp prestabilit (Popa, 2008, p. 250).
Salvarea unui fiier se realizeaz prin pictograma
Save din bara de instrumente Standard sau cu
ajutorul comenzilor Save sau Save As i meniul
File. Aceste comenzi deschid fereastra Save Data As n care se pot stabili: numele fiierului
(File name); tipul fiierului (Save as type); locaia n care s aib loc salvarea (Save In).

135

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

I.4. Folosirea Variabilei View pentru crearea i


etichetarea variabilelor
Pasul 9:
Apsarea meniului Variable
View, situat n josul paginii,
schimb fereastra Data View
(spaiul de lucru pentru introducerea
datelor) n alt fereastr n
care pot fi introduse informaii
despre variabilele create.
Pasul 10:
Acesta este spaiul de lucru Variable View. n acest caz, o variabil este
deja nscris fiind introdus la pasul 8. Variabila poate fi redenumit i pot fi
adugate alte variabile selectnd celula corespunztoare i tastnd numele
variabilei.

Aici se modific
limea coloanei.

Aici se modific
numrul de zecimale.

Pasul 11:
La versiunea SPSS 19 nu exist
limit pentru lungimea numrului
unei variabile.
Se selecteaz o celul din coloana
Name i se scrie un nume diferit
de variabil. Celelalte variabile vor
primi valori care vor fi implicit
schimbate ulterior.
Acesta este numrul de zecimale care va aprea pe ecran.
136

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

*La editarea unei variabile trebuie s se in cont de urmtoarele restricii: numele variabilei
s fie unic, primul caracter s fie o liter, sa nu conin simboluri speciale folosite n SPSS sau
spaii.
Semnificaia coloanelor din figura de la Pasul 10.
Numrul cazlui identific poziia cazului n baza de date;
Name numele variabilelor;
Type tipul variabilelor;
Width numrul total de digii;
Decimals numrul de digii pentur partea zecimal;
Label etichetarea variabilelor;
Values valorile pe care le poate lua variabila;
Missing valorile lips;
Columns limea coloanei din Data editor;
Align alinierea valorilor n coloan.

Pasul 12:
Apare acest buton:
se d clic pe el.

Pasul 13:
Va aprea aceast fereastr. n
continuare se vor urmri paii
care vor arta cum genul biologic
masculin i feminin este introdus
folosind codul 1 (masculin)
respectiv 2 (feminin).
Pasul 14:
Se scrie 1 n dreptul
cmpului value
i masculin n dreptul
cmpului value Label.
Apoi se apas Add

137

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Pasul 15:
Aceasta operaie de adugare
transfer informaia n cmpul
aflat dedesubt.
* La fel se procedeaz i pentru
introducerea celeilalte variabile
(Ex. 2 - feminin).

* Cele mai frecvent utilizate ferestre in SPSS sunt data Editor, Syntax Editor i Output
Viewer, Pivot Table (Pivot Table Editor), Chart Editor.
Fereastra de sintax (Syntax Editor) este folosit pentru a genera programe de comenzi
pe care le vom executa asupra datelor (exemplu: calculul unor noi variabile). Opiunile
selectate n casetele de dialog sunt afiate n fereastra de sintax sub form de comenzi.
Aceste ferestre i sunt specifice fiierele de tip .sps.
Fereastra de rezultate (Output Viewer) devine disponibil automat dup ce a fost
efectuat o comand de analiz a datelor. n aceast fereastr, sunt afiate rezultatele statistice,
tabele i grafice care au asociate ferestre distincte. Fereastra de editare a rezultatelor (Text
Output Editor) este folosit pentru modificarea textului rezultat, care nu a fost afiat n tabele
pivot.
* Fereastra de rezultate (Output Viewer) devine disponibil automat dup ce a fost efectuat o
comand de analiz a datelor. n aceast fereastr, sunt afiate rezultatele statistice, tabele i
grafice care au asociate ferestre distincte. Fereastra de editare a rezultatelor (Text Output
Editor) este folosit pentru modificarea textului rezultat, care nu a fost afiat n tabele pivot.
Toate rezultatele obinute din analizele statistice sunt afiate n fereastra Output Viewer.
Aceast fereastr se aseamn cu fereastra Windows Explorer i se deschide doar dac s-au
lansat comenzi din meniurile Statistics sau Graphs.
Fereastra Output Wiewer este structurat n dou cadre/zone. Cadrul din stnga
(cuprinsul/structura) prezint, sub forma unei schie, obiectele coninute n fereastr.
Elementele din schi se refer la titlu, note i denumirea rezultatelor statistice propriu-zise.
Fereastra Pivot Table (Pivot Table Editor) ofer multiple posibiliti de modificare a
tabelelor pivot: editare text, schimbarea datelor din rnduri i coloane, adugarea de culori,
crearea unor tabele multidimensionale, ascunderea sau afiarea selectiv a rezultatelor.
Fereastra de editare a graficelor (Chart Editor) permite modificarea elementelor unui
grafic (axe, scale, diagram, legend etc.)

I.5.

Exemplu de calcul statistic.

Pasul 16:
Pentru a calcula media de
vrst se urmresc urmtoarele
etape:
-se d clic pe Analyze;
-Se selecteaz Descriptive
statistics;
-Se selecteaz Descriptive
138

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Pasul 17:
Se selecteaz atenie.
Se apas butonul pentru a
muta atentie n csua
Variable(s) cu ajutorul sgeii.
Se d clic pe OK.
Pasul 18:
Fereastra Data Editor este nlocuit de output-ul SPSS-ului. Acest tabel
apare pentru analiza realizat anterior.

Media scorului pentru atenie este ncercuit.


*Ferestrele n SPSS reprezint zone de pe ecran tratate ca elemente de sine stttoare,
cu caracteristici proprii, care determin aciunile ce se pot executa n cadrul lor.
*O baz de date n SPSS este o structur format din linii i coloane, la intersecia
crora se formeaz celule care conin anumite uniti de informaii.

Elementele de statistic sunt foarte simple dar apar probleme la


asamblarea elementelor, abilitile matematice avnd un mic rol n analiza
statistic a datelor.
Conceptele de baz pe care cercettorii trebuie s le neleag nainte de a
trece la analizele SPSS sunt:
Variabila.
Definiie: O variabil este orice concept care poate fi msurat i care
variaz de la un studiu la altul.

139

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Tipurile de variabile.
Variabilele pot fi clasificate ca fiind de dou tipuri:
Scoruri: Vorbim despre scoruri atunci cnd o valoarea numeric este atribuit
unei variabile, pentru fiecare caz n parte din eantion. Aceast valoare indic
cantitatea sau valoarea caracteristicii (variabilei) n cauz.
Exemplul. Vrsta, nlimea, greutatea sunt variabile numerice deoarece
valoarea scor indic o cantitate n cretere a variabilei respective.
Variabile nominale sau categoriale: Sunt variabile care se msoar
clasificnd cazurile n unul sau mai multe categorii.
Exemplul 1: Genul biologic are dou categorii: masculin i feminin
*Este foarte important s se hotrasc pentru fiecare variabil n parte dac este
variabil nominal (categorial) sau variabil cantitativ.
Definirea atributelor unei variabile este prima operaie din procesul de pregtire a
setului de date. Definirea presupune precizarea atributelor unei variabile: numele variabilei,
tipul, lungimea (numrul de caractere), numrul de zecimale (pentru cele numerice), eticheta,
valorile etichetei, valorile lips, alinierea i modalitile de msurare a variabilei. Variabilele
se definesc n coloanele foii Variabile View din fereastra Data Editor.
Tipul variabilei variabilele pot fi de mai multe tipuri: numerice (Numeric, Coma, Dot,
Scientific notation), alfanumerice (String), date calendaristice, simbol monetar.
*O sesiune de lucru n SPSS presupune, obligatoriu, existena unei baze de date
(ncepnd cu versiunea 14, SPSS poate deschide simultan mai multe baze de date).

140

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

I.7. Alegei rspunsul corect

1. Fereastra de editare (Data Editor):


a. se deschide implicit la lansarea SPSS;
b. este folosit pentru introducerea, modificarea sau tergerea datelor n
format spreadsheet;
c. este folosit pentru a genera programe de comenzi pe care le vom
executa asupra datelor;
d. este folosit pentru modificarea textului rezultat, care nu a fost afiat n
tabele pivot;
2. Fereastra de rezultate (Output Viewer):
a. afieaz rezultatele statistice, tabele i grafice care au asociate ferestre
distincte;
b. permite modificarea elementelor unui grafic (axe, scale, diagram,
legend etc.);
c. este folosit pentru a genera programe de comenzi pe care le vom
executa asupra datelor.
3. Ferestrele n SPSS reprezint:
a. zone de pe ecran tratate ca elemente de sine stttoare, cu caracteristici
proprii, care determin aciunile ce se pot executa n cadrul lor;
b. elemente constitutive ale programului SPSS;
c. elemente prin care i se confer utilizatorului posibilitatea selectrii unei
anumite opiuni.
4. Care sunt cele mai frecvent utilizate ferestre n SPSS
a. data editor;
b. output editor;
c. syntax editor;
d. syntax viewer;
e. output viewer.
5. n SPSS fereastra SPSS Output Viewer este utilizat pentru:
a. afiarea rezultatelor;
b. editarea de date;
c. editarea de date i tabele;

141

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

6. La editarea unei variabile trebuie s se in cont de urmtoarele


restricii:
a. s conin spaii sau simboluri folosite n SPSS;
b. s conin numai litere;
c. s aib cel puin 8 caractere;
d. primul caracter trebuie s fie o cifr;
e. s fie unic.
7. Numele variabilei trebuie s in cont de cteva restricii:
a. s aib cel mult 6 caractere;
b. se poate repeta;
c. primul caracter s fie liter;
d. poate s conin simboluri speciale folosite n SPSS sau spaii.
8. Pentru a introduce date n SPSS se selecteaz:
a. o celul dnd clic pe celula respectiv;
b. meniul data, split file;
c. meniul transform, compute.
9. Prin apsarea butonului Variable View:
a. se schimb fereastra Data View;
b. apare fereastra output;
c. se poate introduce o variabil diferit.
10. Care dintre urmtoarele afirmaii este adevrat?
a. indicatorul medie reprezint media aritmetic a unui scor i se obine
prin nsumarea valorilor i nmulirea cu numrul de valori;
b. modul este valoarea cu cea mai mare frecven si este frecvena cu care
apare cel mai frecvent scor;
c. mediana este valoarea din centrul distribuiei, dac variabilele numerice
sunt ordonate dup mrime, de la cea mai mic la cea mai mare.
11. Pentru a calcula media aritmetic alegem
a. SE Mean;
b. Median;
c. Mean;
d. Rouge.

142

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

I.8. Rspunsuri corecte

1. a. se deschide implicit la lansarea SPSS;


2. a. afieaz rezultatele statistice, tabele i grafice care au asociate
ferestre distincte;
3. a. zone de pe ecran tratate ca elemente de sine stttoare, cu
caracteristici proprii, care determin aciunile ce se pot executa n
cadrul lor ;
4. a. data editor;
c. syntax editor;
e. output viewer;
5. a. afiarea rezultatelor;
6. e. s fie unic;
7. c. primul caracter s fie liter;
8. a. o celul dnd clic pe celula respectiv;
9. a. se schimb fereastra Data View;
10. c. mediana este valoarea din centrul distribuiei, dac variabilele
numerice sunt ordonate dup mrime, de la cea mai mic la cea mai
mare;
11. c. mean.

143

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

II. Descrierea variabilelor.


Tabele i diagrame.
________________________________________________________
II.1. Frecvena procentual.
Pentru realizarea unui tabel de frecven este necesar o coloan creia i
se va da un nume.
Pasul 1:
Se definete variabila.
Se eticheteaz valorile variabilei.
Valorile pentru specializare se definesc
aa cum este descris n paii 13-15 din
capitolul I.

Pasul 2:
Se selecteaz:
Analize,
Descriptive Statistics
Frequencies

144

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Pasul 3:
Se selecteaz specializare i se mut
n partea dreapt a tabelului
(procedeul a fost descris la pasul 17
din capitolul I).
Se apas OK
Pasul 4:
1. Prima coloan a tabelului conine eticheta celor 4 categorii de specializri.

2. A doua i a treia coloan afieaz


Frecvena absolut i relativ pentru
fiecare categorie.
Exemplu: 3 (jurnalism) reprezint
procentajul 30% din totalul de
10 specializri.

3. A patra coloan afieaz


frecvena excluznd valorile lips
* Deoarece nu sunt valori lips,
este acelai ca n coloana a treia.

4. A cincea coloan adun procentele n josul tabelului.


(reprezint frecvena relativ cumulat ascendent).

n ceea ce privete raportarea rezultatelor se prezint numai etichetele categoriale,


frecvenele i frecvenele procentuale.

II.2. Diagrama circular pentru date categoriale.

Pasul 1:
Se selecteaz:
Graphs
Legacy dialogs
Pie.
145

Mihaela Rus

Elemente de statistic aplicat

Pasul 2:
Se selecteaz Define.

Pasul 3:
Se selecteaz specializarea
i se transfer prin apsarea
butonului () n rubrica
define slices by.
Se apas OK.
Diagrama Pie este un cerc divizat
n sectoare. Fiecare sector de cerc
reprezint o categorie, aria
acestuia fiind proporional cu
numrul de cazuri din aceast
categorie a variabilei nominale.

Pasul 4:
Acesta este felul n care apare o diagram
circular folosind opiunile din SPSS.
Sectoarele din cerc sunt codate cu diferite culori.
* Caracteristicile din aceast diagram pot fi modificate
cu Chart Editor.

146

Mihaela Sandu

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

II.3. Adugarea etichetelor unei diagrame circulare


Pasul 1:
Se d dublu clic oriunde n dreptunghiul
care conine diagrama, pentru a selecta
Chart Editor.
Se selecteaz:
Elements
Show Data Labels.
* Diagrama de structur pie este folosit
pentru reprezentarea frecvenelor absolute
(numere) i/sau relative (procente) pe
categorii/grupe.

Pasul 2:
Se selecteaz Count i
X-ul rou pentru a nu afia.
Se selecteaz specializare i sgeata
Verde curbat n sus pentru a afia
denumirile specializrilor.
Se procedeaz asemntor pentru
Procent pentru a afia procentajul
fiecrei specializri n parte.
Se selecteaz Apply i Close.

147

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Pasul 3:
Pentru a nltura legenda,
se selecteaz Options
i Hide Legend.

Diagrama circular cu sectoarele


denumite i frecven procentual afiat.

II.4. Diagrama cu bare pentru date categoriale.


Pasul 1:

Se selecteaz:
Graphs
Legacy dialogs
Bar.

148

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Pasul 2:
Selectai Define.
Simple este preselectat.
*Selectare unei alte variante se face prin
clic cu mouse-ul pe varianta respectiv.

Pasul 3:
Se selecteaz ocupaia i se apas
butonul de lng Category
Axis pentru a introduce acolo
specializarea.
Se selecteaz % of cases.
Se apas OK

Diagrama cu bare.

149

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

* Diagrama cu bare este folosit pentru a reprezenta grafic mediile diferitelor grupe dintr-o
colectivitate (Summaries for groups of cases) sau valorile medii ale diferitelor variabile pentru
aceeai colectivitate (Summaries of separate variables).
Diagrama Bar este folosit pentru a ilustra categoriile unei distribuii n form convenabil.
Diagrama prezint attea bare cte categorii are o variabil. Barele au aceeai baz, egal cu
unitatea, iar nlimea proporional cu frecvena categoriei astfel nct aria fiecrei bare
reprezint numrul cazurilor categoriei considerate.
Pentru a fi interpretat un grafic trebuie s conin urmtoarele elementele:
- titlul graficului ofer informaii asupra fenomenului reprezentat (Titlul graficului
coincide cu titlul tabelului de date);
axele de coordonate sunt folosite pentru a reprezenta variabilele. Pe abscis se
nscrie variabila de distribuie, iar pe ordonat frecvena.
legenda este folosit pentru a explica elementele din diagram;
sursa precizeaz originea datelor reprezentate.

II.5. Histograme.
Pentru a ilustra procesul de realizare a unei histograme vom folosi datele
obinute din rspunsurile subiecilor la ntrebarea V place statistica?.
(rspunsuri: a. foarte mult; b. mult; c. puin d. foarte puin; e. deloc).
Pasul 1:
Se introduc datele n Data Editor
(aa cum a fost prezentat la
nceputul capitolului).
Se selecteaz:
Graphs
Legacy Dialog
Hitogram
Pasul 2:
Se selecteaz ntrebarea V place
statistica? i se apas butonul de
lng Variable pentru a duce ntrebarea
n csua din dreapta.
Se apas OK.

Histograma
150

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

* Pentru a schimba denumirile axelor se d clic pe ele i se editeaz.


* Histograma este folosit pentru a arta forma unei distribuii dup o variabil
nregistrat asupra unei colectiviti (frecvena de apariie pentru diferite clase de valori
ale variabilei observate).
Alte tipuri de grafice:
Line diagrama liniar este folosit pentru a reprezenta de regul valori medii.
Boxplot diagrama cutia cu musti este folosit pentru a prezenta amplitudinea, intervalul
intercuartilic i mediana unei distribuii.
Error Bar diagrama bara erorilor este folosit pentru a arta media i intervalul de
variabile.
Scatter diagrama norul de puncte este folosit pentru a reprezenta relaiile dintre ncredere
de 95% pentru media respectiv.

151

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

II.6. Exerciii

1. La o cercetare percepia social asupra consumului de droguri particip


10 persoane dintre care: 4 studeni, 2 profesori i 4 elevi. Acetia au vrste
cuprinse ntre 15 i 35 de ani astfel: cei 4 studeni au 21, 22, 25, 26 ani,
elevii au 15, 16, 17, 17 ani i profesorii au 34 de ani i 35 de ani. (a se
vedea figura 1).
Se cere:
1. s se realizeze un tabel de frecvene
pentru variabila subieci;
2. s se realizeze tabel de frecvene
pentru variabila vrst;
3. s se realizeze diagrama de structur
pentru variabila subieci;
4. s se adauge etichete diagramei;
5. s se realizeze diagrama de bare i
histograma pentru variabila vrst.
6. s se calculeze media pentru variabila vrst i s se interpreteze.
7. s se salveze fiierul creat pe Desktop cu denumirea cercetare;

152

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

II.7. Alegei rspunsul corect

1. Care sunt graficele folosite pentru o distribuie dup o variabil


calitativ?
a. diagrama Bar si diagrama Pie
b. diagrama Boxplot
c. Scatter sau Line
2. Diagrama de bare este folosit pentru:
a. a reprezenta valori medii;
b. a reprezenta frecvene absolute (numere) i/sau relative (procente);
c. a reprezenta relaiile dintre variabile;
d. a reprezenta grafic mediile diferitelor grupe dintr-o colectivitate.
3. Diagrama de structur este folosit pentru:
a. a reprezenta frecvenele absolute (numere) i/sau relative (procente);
b. a arta forma unei distribuii dup variabila nregistrat asupra unei
colectiviti;
c. a prezenta amplitudinea i mediana unei distribuii;
d. a reprezenta relaia dintre variabile.
4. Histograma este folosit pentru:
a. a reprezenta grafic valorile medii ale diferitelor variabile pentru aceeai
colectivitate;
b. a arta forma unei distribuii dup o variabil nregistrat asupra unei
colectiviti;
c. a reprezenta relaia dintre variabile;
d. a reprezenta intervalul intercuartilic.
5. Pentru o distribuie dup o variabil cantitativ se folosesc
urmtoarele grafice:
a. scatter (norul de puncte) i histograma;
b. pie (diagrama de structut) i line (diagrama liniar);
c. histograma i curba frecvenelor;
d. bar (diagrama de bare) i curba frecvenelor.

153

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

6. Media aritmetic se calculeaz pentru:


a. variabile categoriale
b. variabile categoriale i cantitative
c. variabile cantitative.
7. Prima coloan a tabelului de frecvene conine:
a. etichetele categoriilor introduse;
b. procentul de frecven pentru fiecare categorie;
c. valorile lips.
8. Pentru a realiza o diagram circular se selecteaz:
a. analize/ descriptive statistics/descriptives;
b. graphs/ pie;
c. graphs/ area.
9. Indicatorii tendinei centrale sunt:
a. modul, mediana, abaterea standard
b. medie, mod, median
c. dispersie, abaterea standard
10. Care dintre urmtoarele afirmaii este adevrat?
a. indicatorul medie reprezint media aritmetic a unui scor i se obine
prin nsumarea valorilor i nmulirea cu numrul de valori;
b. modul este valoarea cu cea mai mare frecven si este frecvena cu care
apare cel mai frecvent scor;
c. mediana este valoarea din centrul distribuiei, dac variabilele numerice
sunt ordonate dup mrime, de la cea mai mic la cea mai mare.

154

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

II.8. Rspunsuri corecte

1. a. diagrama Bar i diagrama Pie


2. d. a reprezenta grafic mediile diferitelor grupe dintr-o colectivitate.
3. a. a reprezenta frecvenele absolute (numere) i/sau relative (procente);
4. b. a arta forma unei distribuii dup o variabil nregistrat asupra unei
colectiviti;
5. c. histograma i curba frecvenelor;
6. c. variabile cantitative.
7. a. etichetele categoriilor introduse;
8. b. graphs/ pie;
9. b. medie, mod, median

10. c. mediana este valoarea din centrul distribuiei, dac variabilele


numerice sunt ordonate dup mrime, de la cea mai mic la cea mai mare.

155

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

III. Descrierea numeric a variabilelor


- Medie, variaie i dispersie
_________________________________________________________________________________________________________________

III.1. Introducerea datelor i efectuarea analizei


Pentru realizarea acestui exemplu am selectat un numr de 0 subieci cu vrste
cuprinse ntre 15-35 ani.
Pasul 1:
n Variable View din Data Editor se denumete prima coloan Vrst.
* Se ndeprteaz cele 2 zecimale i se scrie 0.

Pasul 2:

Pasul 3:

n Data View
din Data Editor
se introduc vrstele
n prima coloan.

Se selecteaz Analize
Descriptives statistics i
Frequencies...

156

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Pasul 4:
Se selecteaz vrsta
i butonul pentru a
introduce n lista de
variabile.
Se deselecteaz
butonul Display frequencys tables
i se ignor mesajul de avertizare.
Se d clic pe Statistics
Pasul 5:
Se selecteaz
Mean;
Median;
Mode.
Se d clic pe Continue.
Se apas OK din ecranul anterior,
care reapare.

III.2. Interpretarea output-ului.


Statistics

Exist 10 cazuri cu date valide pe care


se
N
Valid
10
bazeaz analiza.
Missing
0
Nu sunt date lips (0).
Mean
26,90
Media de vrst, media aritmetic
Median
28,50
=26,9 ani.
Mode
34
Mediana de vrst (vrsta persoanei
aflate la mijlocul liniei de vrste de la cea
mai mic la cea mai mare) este de 28.5 ani.
Valoarea mod de vrst este 34.
varsta

157

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

III.3. Alte caracteristici.


n csuele de dialog de la pasul 5 se pot observa mai multe valori
statistice adiionale care pot fi calculate:
1. centilele indic punctele de separaie pentru procentajele scorurilor.
Exemplu: Al 90-lea centil este valoarea numeric care separ cele 90%
de valori de dedesubt, din punct de vedere al mrimii.
2. Cvartilele sunt valorile distribuiei care indic punctele de separare
pentru cele ai mici 20%, cele mai mici 50% i cele mai mici 75% dintre scoruri.
3. Suma indic totalul scorurilor pentru o variabil.
4. Skewness Este un indicator de asimetrie sau nclinare a distribuiei
scorurilor pentru o variabil. Valoarea este pozitiv dac valorile sunt asimetrice
spre stnga, sau negativ dac valorile sunt asimetrice spre dreapta.
5. Kurtosis este un index care arat ct de ascuit sau turtit este
distribuia scorurilor pentru o variabil, comparativ cu distribuia normal. Va fi
cu semnul + pentru curbe de frecvene ascuite i cu semnul - pentru curbe
de frecvene turtite.
6. Abaterea standard (estimat) este o evaluare a msurii n care
scorurile difer n medie fa de media scorurilor pentru o variabil particular.
7. Variaia (estimat) este o evaluare a msurii n care scorurile
variaz n medie fa de media scorurilor pentru variabila respectiv.
8. Rang diferena dintre cel mai mare i cel mai mic scor obinut
pentru o variabil.
9. Minim (scor) valoarea celui mai mic scor al datelor pentru o
variabil particular.
10. Maxim (scor) valoarea celui mai mare scor al datelor pentru o
variabil particular.
11. Eroarea standard (ES medie) valoarea medie cu care mediile
eantioanelor extrase dintr-o populaie, difer fa de media populaiei.

158

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

III.4. Alegei rspunsul corect

1. Cum putem calcula mediana?


a. alegnd din meniul Transform / Compute;
b. statistics / summarize / case summaries / statistics;
c. statistics / Compare Means / Means;
2. Pentru a calcula eroarea medie de selecie alegem:
a. Mean;
b. Std Deviation;
c. S.E. mean;
d. Range;
3. Pentru a calcula asimetria alegem una din opiunile:
a. Range;
b. Std Deviation;
c. Skewness;
d. Kurtosis;
e. Variance;
4. ntr-un calcul statistic, media reprezint:
a. valoarea cu cea mai mare frecven;
b. valoarea din centrul distribuiei;
c. media aritmetic a unui set de scoruri, care se obine prin nsumarea valorilor
i mprirea rezultatului la numrul de valori;
d. media aritmetic a unui set de scoruri, care se obine prin diferena valorilor
i mprirea rezultatului la numrul de valori.
5. ntr-un calcul statistic, abaterea standard este:
a. valoarea a msurii n care scorurile difer n medie fa de media scorurilor
pentru o variabil particular;
b. diferena numeric ntre cel mai mare i cel mai mic scor obinut pentru o
variabil;
c. valoarea cu frecvena cea mai mare

159

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

6. Kurtosis, ca indicator al formei distribuiei, indic:


a. ct de ascuit sau turtit este distribuia scorurilor pentru o variabil,
comparativ cu distribuia normal;
b. simetria sau asimetria unei distribuii de frecvene fa de medie;
c. distribuia scorurilor pentru 2 variabile comparative;
7. Eroarea standard este:
a. diferena numeric ntre cel mai mare i cel mai mic scor obinut pentru o
variabil;
b. valoarea medie cu care mediile eantioanelor extrase dintr-o populaie, difer
fa de media populaiei;
c. diferena scorurilor a 2 variabile.
8. Pentru a calcula boltirea alegem:
a. Range;
b.Variance;
c. Skewness;
d. Kurtoses.

III.5. Rspunsuri corecte

1. c. statistics / Compare Means / Means;


2. c. S.E. mean;
3. c. Skewness;
4. c. media aritmetic a unui set de scoruri, care se obine prin nsumarea
valorilor i mprirea rezultatului la numrul de valori;
5. a. valoarea a msurii n care scorurile difer n medie fa de media
scorurilor pentru o variabil particular;
6. a. ct de ascuit sau turtit este distribuia scorurilor pentru o variabil,
comparativ cu distribuia normal;
7. b. valoarea medie cu care mediile eantioanelor extrase dintr-o
populaie, difer fa de media populaiei;
8. d. Kurtoses.
160

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

IV. Forme ale distribuiei scorurilor

_________________________________________________________________________________________________________________

Este foarte important de studiat forma distribuiilor scorurilor pentru o


variabil. Este bine ca o distribuie s fie simetric i cu o form normal (form
de clopot).
Distribuia normal, a fost descris prima dat de Ch. Fr. Gauss (17771855) i de aceea distribuia normal se mai numete i distribuie gaussian.
Deoarece la demonstrarea acestui concept a participat i P.S. Laplace (17491827), n literatura de specialitate se va ntlni i termenul de distribuie GaussLaplace.
Pentru ca o distribuie s fie considerat normal, trebuiesc ndeplinite
simultan urmtoarele condiii:

S fie unimodal adic s existe un singur modul, o singur categorie


cu frecven maxim;

S fie simetric fa de medie adic s nu fie deplasat spre stnga


sau spre dreapta;

S fie normal boltit adic s nu fie nici ascuit i nici turtit;


Toi aceti termeni se refer la acelai lucru, distribuia normal.
De asemenea, limitele din stnga i din dreapta ale unei distribuii

normale tind spre valoarea zero, pe care ns nu o ntlnesc niciodat. O


distribuie perfect normal are aceeai valoare pentru toi cei trei indicatori ai
tendinei centrale (media, mediana i modulul), adic media = mediana =
modulul. n practic, acest lucru se ntlnete extrem de rar i, de aceea, ne
punem problema ntre ce limite putem considera o distribuie ca fiind normal.
n exemplul urmtor este elaborat un tabel de frecven i o histogram cu
scorurile obinute la evaluarea coeficientului de inteligen pentru 20 de juriti.

161

Mihaela Rus

Elemente de statistic aplicat

IV.1. Introducerea datelor.


Pasul 1:
n Variable View din
Data Editor se denumete
prima coloan Atenie.
Se nltur cele dou zecimale.
*Datele se salveaz ca fiier
deoarece vor fi folosite i la
capitolul 9.

Pasul 2:
n Data View
din Data Editor
se introduc
scorurile obinute
la Atenie n
prima coloan.
Pasul 3:
Se selecteaz
Analyze,
Descriptives
Statistics i
Frequencies
Pasul 4:
Se selecteaz
atenie i apoi
se apas butonul
pentru a
introduce n lista
de variabile.
Se apas OK.

162

Mihaela Sandu

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

IV.2. Interpretarea Output-ului


Prima coloan arat
scorurile obinute la
testul de atenie.
A doua coloan arat
frecvena acestor
valori.
Exemplu: este 1 caz
n care scorul obinut
are valoarea 56.

Cumulative

atentie
Frequency
Valid

Percent

Valid Percent

Percent

56

10,0

10,0

10,0

57

10,0

10,0

20,0

58

20,0

20,0

40,0

64

10,0

10,0

50,0

65

20,0

20,0

70,0

66

10,0

10,0

80,0

A treia coloan
69
2
20,0
20,0
100,0
exprim aceste
Total
10
100,0
100,0
frecvene ca
un procent al numrului total A patra coloan
A cincea coloan
incluznd i datele care
exprim aceste frecvene
cumuleaz aceste
lipsesc.
ca un procent al numrului procentaje n josul
Exemplu: Din totalul cazurilor, total excluznd datele lips. tabelului.
10% au obinut scorul 56.

IV.3. Histograme.
Histograma este un grafic, folosit n statistica descriptiv i arat o distribuie de
frecven. Distribuia de frecven se refer la numrul de evenimente statistice pe clase
(grupe) de evenimente. Pentru o serie de date statistice cu o distribuie de frecven dup o
variabil numeric continu (sau continu pe poriuni), reprezentrile grafice care ne permit s
vizualizm distribuia de frecvene sunt histograma i poligonul frecvenelor.

Se reiau paii de la capitolul II.5.

163

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

IV.4. Interpretarea output-ului


Axa vertical arat frecvena
cazurilor de la 0 la 3.
nlimea barelor arat ct de
frecvent apare fiecare scor la atenie.
Axa orizontal arat scorurile
diferite ale Ateniei.
*Media scorului la atenie este 62,7.
*Abaterea standard este 4,99.
*Numrul cazurilor este 10.

IV.5. Modalitatea.
O distribuie normal (figura 1)
Frecvena de apariie

este o distribuie unimodal, adic exist


doar o singur categorie cu frecvena
maxim. Prezena a dou sau mai multe
valori

mod

bimodale,

determin

trimodale,

distribuii
n

general

polimodale, distribuii ce nu pot fi


considerate ca fiind distribuii normale.
Figura nr. 1.

O
nlimea subiecilor.

distribuie similar distribuiei din


figura 1, este o distribuie bimodal
(figura

2),

deoarece

observm

existena a dou categorii cu frecvena


egal i maxim.

164

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Figura nr. 2.

Normalitatea distribuiei, sub aspectul modaliti, se verific prin


calcularea valorii modul. Dac exist o singur valoare cu frecvena maxim,
atunci distribuia poate fi considerat normal sub acest aspect. n condiiile n
care sunt dou sau mai multe valori cu frecvena maxim i, evident, egal,
distribuia este polimodal (multimodal) i nu poate fi considerat ca fiind
normal.

IV.6. Simetria.
O

distribuie

este

simetric, dac valorile sunt


egal (simetric) rspndite n
jurul tendinei centrale. Atunci
cnd rezultatele tind ctre valori
mici, sunt aglomerate n partea
stng a distribuiei, avem de a
face cu o distribuie asimetric

Figura nr. 3

spre dreapta (sau distribuie skewness pozitiv). Cnd rezultatele tind ctre valori
mari, se aglomereaz n partea dreapt a distribuiei, vorbim despre o distribuie
asimetric la stnga (skewness negativ). Iat c, asimetria este dat de panta
distribuiei i nu de vrful acesteia, aa cum trateaz i consider unii.
n figura nr. 3, distribuia B este o distribuie simetric. Distribuia A
este o distribuie asimetric la dreapta (skewness pozitiv) unde predomin
scorurile sczute (mici), n timp ce distribuia C este o distribuie asimetric la
stnga (skewness negativ) n care predomin scorurile mari.
Nu ne putem limita la o apreciere pur vizual a simetriei; acest lucru necesit
demonstrarea statistic a simetriei sau asimetriei distribuiei. n acest scop, exist mai muli
coeficieni care pot fi calculai.
165

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Atunci cnd discutm de asimetrie, trebuie s precizm o serie de relaii


care apar ntre indicatorii tendinei centrale, media, mediana i modul.
ntr-o distribuie simetric, media, mediana i modul au exact aceleai
valori. Caracteristica acestei distribuii o reprezint coincidena absolut a celor
trei indicatori ai tendinei centrale.
Dup cum putei observa n figura
de mai sus, att media, ct i
mediana i modulul, se afl n
acelai

punct,

la

mijlocul

distribuiei. Grupa subiecilor cu


scoruri

Figura nr. 4

mai mici dect media este perfect simetric cu grupa subiecilor cu scoruri mai
mari dect media. Acest aspect este menionat din raiuni teoretice. n practic
nu vom ntlni o distribuie perfect normal, ci o distribuie care poate fi
acceptat ca fiind normal.
ntr-o distribuie asimetric la dreapta (distribuie skewness pozitiv,
vezi figura alturat), predomin
scorurile mici.

n acest caz,

modulul este valoarea situat cel


mai la stnga n irul de date, iar
mediana este mai mic dect
media. Evident, mediana fiind
valoarea

care

mparte

irul

ordonat de date n dou pri egale,

Figura nr. 5

iar dac n distribuie predomin scorurile mici, atunci scorurile mari sunt
considerate ca scoruri extreme. tim de la analiza preciziei indicatorilor
tendinei centrale, c ntr-o serie de date n care ntlnim scoruri extreme mari,
media tinde s le pun n valoare. Iat c acest fapt este ilustrat grafic n figura

166

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

de mai sus. Observai relaia existent ntr-o asemenea distribuie: Mo<Me<m.


Aceast relaie este relaia caracteristic a unei distribuii asimetrice pozitiv.
ntr-o distribuie asimetric la stnga (distribuie skewness negativ,
vezi figura alturat), predomin
scorurile mari. n acest caz,
modulul este valoarea situat cel
mai la dreapta n irul de date, iar
mediana este mai mare dect
media. Evident, mediana fiind
valoarea

care

mparte

irul

ordonat de date n dou pri egale,

Figura nr. 6

iar dac n distribuie predomin scorurile mari, atunci scorurile mici sunt
considerate ca scoruri extreme. tim, de la analiza preciziei indicatorilor
tendinei centrale, c ntr-o serie de date n care ntlnim scoruri extreme mici,
media tinde s le pun n valoare. Iat c acest fapt este ilustrat grafic n figura
de mai sus. Observai relaia existent ntr-o asemenea distribuie: Mo>Me>m.
Aceast relaie este relaia caracteristic a unei distribuii asimetrice negativ.

IV.7. Boltirea (excesul).


Asimetria pe orizontal, presupune, dup cum am vzut, o deplasare a
tendinei centrale spre stnga sau spre dreapta, ctre scoruri mici sau ctre
scoruri mari. Dar, aceasta nu este singura asimetrie posibil. Exist i un fel de
asimetrie vertical sau boltire. Termenul folosit generic pentru acest concept
este termenul de kurtosis (din limba greac, kurtos = cocoat).
Practic, boltirea se refer la aspectul cocoaei distribuiei rezultatelor.
Cocoaa poate fi ascuit i atunci vorbim de o distribuie ascuit sau
leptocurtic, poate fi turtit, distribuia turtit, plat sau platicurtic sau

167

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

normal, distribuie mezocurtic. O distribuie normal este ntotdeauna o


distribuie mezocurtic.
n figura alturat,
distribuia C este o distribuie
leptocurtic, ascuit. Distribuia
B este o distribuie platicurtic,
turtit, iar distribuia A este o
distribuie normal sub aspectul
boltirii, sau mezocurtic.
Figura nr. 7

Se observ c boltirea nu este altceva dect simetria pe axa vertical (O Y),


spre deosebire de simetria propriu zis, deplasarea valorilor pe axa orizontal
(OX). Dac la simetrie se vorbete de frecvene (care sunt cele mai frecvente
scoruri obinute, unde se concentreaz acestea? n eantionul sunt mai degrab
subieci scunzi sau subieci nali? Ori poate exist un echilibru ntre subiecii
scunzi i cei nali), la boltire se discut de valori, de modul n care aceste valori
se grupeaz n jurul tendinei centrale (sunt mai grupate valorile n jurul mediei
sau, din contra, foarte mprtiate.)
La fel ca i simetria, boltirea nu poate fi apreciat pur ochiometric ci
avem nevoie i aici de anumii coeficieni de boltire. Pearson a discutat despre
boltire n termeni de momente, la fel ca i simetria, rezultnd astfel coeficientul
de boltire sau coeficientul kurtosis.
O distribuie leptocurtic, ascuit, arat c datele sunt foarte grupate i
apropiate de medie, lotul de subieci avnd un mare grad de omogenitate a
scorurilor. Aceast distribuie nu ridic nici un fel de probleme atunci cnd
trebuie s difereniem subiecii care obin scoruri mici sau mari. Avem ns
dificulti atunci cnd trebuie s difereniem subiecii din zona medie a
distribuiei.

168

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

De exemplu, dac ntr-o clas de 30 de elevi, 27 obin medii anuale ntre


7,9 i 8,1. Iat c, doar dou zecimi difereniaz ntre aproape ntreg efectivul de
elevi. Nu avem nici o problem cu repartizarea celorlali trei elevi. Pe aceia i
vom considera ori foarte buni, ori foarte slabi, n funcie de media obinut sub
7,9 sau peste 8,1. Ce putem face ns cu cei 27 de subieci? Suntem, iat, n
imposibilitatea de ai-i ierarhiza n vreun fel. Dac presupunem c cei trei
subieci au note mai mici de 7,9, atunci cine va lua, dintre cei 27 de elevi,
premiul I, cine va lua premiul II i cine va lua premiul III. Decizia ar fi, dup
cum se poate vedea, extrem de dificil, dac nu chiar imposibil. Singura
variant n acest caz, ar putea fi creterea preciziei. Nu calculm media cu o
singur zecimal, ci cu 2, 3 sau 4 zecimale. Totui, sunt situaii n care un
asemenea nivel de precizie este ridicol. O evaluare n care distribuia rezultatelor
este leptocurtic, este o evaluare ce nu poate diferenia ntre subiecii de nivel
mediu, iar o curb leptokurtic nu este o distribuie normal;
O distribuie platicurtic, plat, este o distribuie n care rezultatele sunt
foarte mprtiate fa de medie i indic un grad ridicat de eterogenitate a
scorurilor. Problema general a acestei distribuii, n opoziie cu distribuia
leptokurtic, este aceea c difereniaz greu la extreme i destul de bine n zona
mediei. Va fi greu, utiliznd o asemenea distribuie, s facem diferenieri ntre
elevii slabi i ntre elevii buni, dei putem diferenia relativ uor elevii medii.
Datorit acestui fapt, o distribuie platicurtic nu este nici ea o distribuie
normal.
O distribuie normal este o distribuie mezocurtic.
Analiza unei distribuii sub aspectul normalitii este primul pas pe care l
facem n orice prelucrare de date. Deoarece, n funcie de rezultatul acestei
analize, vom putea alege tehnicile i procedeele statistice pe care le putem
folosi, aceast etap o ntlnim, de obicei, la nceputul oricrui raport de
cercetare, imediat dup descrierea eantionului.

169

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

IV.8. Alegei rspunsul corect

1.
a.
b.
c.

Histograma:
este un grafic folosit n statistica descriptiv;
arat o distribuie de frecven;
se folosete pentru date calitative.

2. Valid procent:
a. exprim aceste frecvene ca un procent al numrului total excluznd
datele lips.
b. frecvene ca un procent al numrului total lipsesc incluznd i datele care
lipsesc.
c. frecvena valorilor.
3.
a.
b.
c.

Pentru a obine un tabel de frecvene accesm:


analyze/ descriptive statistics/frequences;
analyze/ descriptive statistics/descriptives;
analyze/ descriptive statistics/frequences/descriptives.

4.
a.
b.
c.

Pentru a crea o histogram accesm:


graphs/histogram;
graphs/interactve;
graphs/control.

5.
a.
b.
c.

O distribuie poate fi:


unimodal;
bimodal;
trimodal.

6.
a.
b.
c.

ntr-o distribuie simetic:


media < mdiana< modul;
media = mediana = modul;
media >mediana>modul.

7. ntr-o distribuie asimetric la dreapta:


a. modul <mediana<media;
b. modul>mediana>modul;
c. modul=mediana=modul.

170

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

8. ntr-o distribuie asimetric la dreapta:


a. modul=mediana=media;
b. modul <mediana>modul;
c. modul>mediana>modul.
9. O distribuie poate fi:
a. leptocurtic;
b. platicurtic;
c. asimetric pozitiv;
d. asimetric negativ;
e. mezocurtic.
f. toate variantele de mai sus.
10. O distribuie leptocurtic arat c:
a. datele sunt foarte grupate i apropiate de median iar lotul de subieci are
un grad mare de omogenitate;
b. datele sunt foarte mprtiate de median iar lotul de subieci are un grad
mare de eterogenitate;
c. distribuia este normal.
8. O distribuie platicurtic arat c:
d. datele sunt foarte grupate i apropiate de median iar lotul de subieci are
un grad mare de omogenitate;
e. datele sunt foarte mprtiate de median iar lotul de subieci are un grad
mare de eterogenitate;
f. distribuia este normal.

IV.9. Rspunsuri corecte

1. a. este un grafic folosit n statistica descriptiv;


b. arat o distribuie de frecven;
2. a. analyze/ descriptive statistics/frequences;
3. a. analyze/ descriptive statistics/frequences;
4. a. graphs/histogram;
171

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

5. a. unimodal;
b. bimodal;
c. trimodal.
6. b. media = mediana = modul;
7. b. modul <mediana<media;
8. c. modul>mediana>modul.
9. f. toate variantele de mai sus.
10. a. datele sunt foarte grupate i apropiate de median iar lotul de subieci
are un grad mare de omogenitate;
11. b. datele sunt foarte mprtiate de median iar lotul de subieci are un
grad mare de eterogenitate;

172

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

V. Abaterea standard.
________________________________________________________________________________________________________________

Abaterea standard este un indice care arat ct de mult deviaz (difer)


unele scoruri n medie fa de media setului de scoruri din care acestea fac
parte.
Abaterea standard poate fi folosit i pentru a transforma scoruri pentru
variabile foarte diferite n scoruri Z (sau standard), care sunt uor de comparat i
nsumat.
Calcularea abaterii standard i a scorurilor Z este prezentat n exemplul
urmtor:
Vrst 20

22

25

26

35

V.1. Introducerea datelor.


Pasul 1:
n Variable View din
Data Editor se denumete
prima coloan Vrsta.
Se nltur cele dou zecimale.

Pasul 2:
n Data View din Data Editor
se introduc vrstele n prima
coloan.

Pasul 3:
Se selecteaz:
Analyze
Descriptive Statistics
Descriptives
173

38

28

24

23

24

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Pasul 4:
Se selecteaz vrsta i apoi se
apasnbutonul pentru a o i
ntroduce n lista de variabile.
Se selecteaz Options

Pasul 5:
Se deselecteaz Mean,
Minimum, Maximum.
Se selecteaz Continue.
Se selecteaz OK din
ecranul precedent care
reapare.

V. 2. Interpretarea output-ului.

Numrul 10 reprezint numrul de cazuri.


Abaterea standard pentru vrst este de 5,740.
Descriptive Statistics
N

V.3. Scorurile Z
Pasul 1:
La pasul 4 selectai Save
standardized values as variables.
174

Std. Deviation

varsta

10

Valid N (listwise)

10

5,740

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Se apas OK.

Pasul 2:
Scorurile Z sau standard
sunt n a doua coloan din
Data View n Data Editor
i sunt numite ZVrst.

V.4. Raportarea output-ului.


Abaterea standard pentru o variabil este uor de menionat n textul
raportului: A fost determinat abaterea standard a vrstei ca fiind 5,74 ani (N=
10).
*Este posibil ca abaterea standard s fie nregistrat mpreun cu alte statistici, cum ar
fi media, rangul, etc.

Notele z reprezint diferena dintre scorul observat i medie, n


termeni de abatere standard. Cu alte cuvinte, notele z nu sunt altceva dect
distanele la care se situeaz scorurile particulare n raport cu media grupului iar
aceast distan este exprimat standardizat.
Teoretic, notele z sunt note obinute pe o curb cu media 0 i abaterea
standard 1. n acest caz, o distribuie normal are practic notele z cuprinse
ntre -3 i +3, ntre aceste note regsindu-se peste 99% din populaie, dup cum
observai n figura de mai jos.
Notele z au i ele o serie de proprieti cu aplicabilitate practic
deosebit, dintre care menionm (Popa, 2006):
Media unei distribuii z este egal cu zero, afirmaie ce rezult din
proprietatea acestui indicator de a se diminua atunci cnd scdem o
175

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

constant din fiecare scor particular. Deoarece din formul rezult aceast
diferen (se scade fiecare scor particular din medie), n final media va
ajunge la valoarea zero
Abaterea standard a unei distribuii z este ntotdeauna 1. i aceast
afirmaie rezult din proprietile abaterii standard. tim c dac mprim
abaterea standard cu o constant, valoarea acesteia se divide corespunztor.
Din formul, observm c acea constant cu la care mprim este chiar
abaterea standard iar mprirea a dou numere egale are ca rezultat 1
Notele z sunt note direct calculabile, utilizndu-se media i abaterea
standard i reprezint temelia oricrui proces de standardizare. Totui,
principalul dezavantaj al notelor z este acela c sunt puin intuitive. Trebuie s
tim bine ce nseamn distribuia normal pentru a nelege corect semnificaia
acestor note. n plus, au valori pozitive i negative, ceea ce le face, iari, greu
de utilizat.

V.5. Alte caracteristici.


n meniul Descriptives Statistics sunt coninute mai multe calcule
statistice care pot fi selectate:
Mean (media);
Sum (suma);
Standard deviation (estimate) (abaterea standard);
Range (amplitudinea);
Minimim;
Maximum;
Kurtosis;
Skewness.
* Aceste concepte sunt explicate pe scurt la sfritul capitolului 3.

V.6. Alegei rspunsul corect


176

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

1. Abaterea standard:
a. este un indice care arat ct de mult deviaz (difer) unele scoruri n
medie fa de media setului de scoruri din care acestea fac parte.
b. este un indice care arat ct de simetric sau asimetric este o
distribuie;
c. este un indice care arat ct de turtit sau boltit este o distribuie.
2. Media este o mrime generalizat , adic, nlocuind fiecare nivel
individual al caracteristicii de distribuie cu nivelul mediu:
a) suma seriei rmne aceeai
b) suma termenilor seriei se modific
c) suma termenilor seriei este nul.
3. Media aritmetic reprezint:
a) valoarea pe care ar purta-o fiecare unitate statistic dac distribuia ar
fi eterogen
b) valoarea pe care ar purta-o fiecare unitate statistic dac distribuia ar
fi omogen
c) valoarea pe care ar purta-o fiecare variabil statistic dac distribuia
ar fi omogen.
4. Media aritmetic, ca indicator fundamental al tendinei centrale:
e) reprezint valoarea care modific nivelul totalizator;
f) se folosete cel mai frecvent i reprezint suma valorilor raportat la
numrul lor;
g) se calculeaz adunnd valorile existente;
h) nu poate determina numrul de uniti din colectivitate.

177

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

V.7. Rspunsuri corecte

1. a. este un indice care arat ct de mult deviaz (difer) unele scoruri n


medie fa de media setului de scoruri din care acestea fac parte.
2. a) suma seriei rmne aceeai
3. b) valoarea pe care ar purta-o fiecare unitate statistic dac distribuia ar
fi omogen
4. b. se folosete cel mai frecvent i reprezint suma valorilor raportat la
numrul lor;

178

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

VI. Relaiile dintre dou sau mai multe variabile.


Diagrame i tabele.
________________________________________________________________________________________________________________

n foarte multe cercetri se studiaz relaiile dintre dou sau mai multe
variabile. Procedurile statistice univariate (cu o singura variabil) care au fost
descrise pn acum pot fi utilizate pentru analiza oricror date. Dar, cercetarea
poate necesita ca relaiile i corelaiile dintre diferitele variabile s fie studiate.
La fel ca statistica univariat, statistica bivariat a datelor necesit
studierea tendinelor fundamentale ale datelor utiliznd tabele i diagrame.
Modelele de prezentare a relaiilor bivariate includ crearea tabelelor scatter.
O condiie esenial o constituie etichetarea tabelelor i diagramelor i
denumirea acestora.
n continuare se va ilustra elaborarea unui tabel de asociere i a unei
diagrame cu bare.

VI.1. Introducerea datelor.


n studiu sunt introdui 11 copii instituionalizai i 9 copii
neinstituionalizai. Dintre acetia 9 au fost fete i 11 au fost biei.
Pasul 1:
n Variable View din Data Editor se denumete:
- prima coloan Instituionalizare
- a doua coloan Genul biologic;
- A treia coloan Frecvena.

Se nltur cele dou zecimale.

179

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Pasul 2:
Se eticheteaz cele dou valori
ale instituionalizrii:
1 - instituionalizat;
2 - neinstituionalizat.
i genul biologic:
1. Feminin;
2. Masculin
*Paii acestei proceduri au fost explicai n capitolul 1.

Pasul 3:
Se introduc aceste numere n Data
View din Data Editor.
Primul rnd se refer la fetele care
au fost instituionalizate: sunt n numr
de 5.
Al doilea rnd se refer la bieii
care au fost instituionalizai:
sunt n numr de 6.
Al treilea rnd se refer la fetele neinstituionalizate: sunt n numr de 4.
Al patrulea rnd se refer la bieii
neinstituionalizai: sunt n numr de 5.

VI.2. Ponderea datelor


Pasul 4:
Pentru a pondera datele cu scopul
ca cele patru celule s conin
numrul de cazuri corespunztor,
se selecteaz:
Data
Weight Cases
Pasul 5:

180

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Se selecteaz Frecvena, Weight cases by i apoi se


apas butonul pentru transfer n csua
variabileiFrequency Variable.Se apas OK
VI.3. Crearea tabelelor de asociere (Crosstabs).
Pasul 6:
Se selecteaz:
Analize
Descriptivesc statistics
Crosstabs.
Pasul 7:
Pentru a pune instituionalizare
pe rndurile tabelului, se selecteaz
i apoi se apas butonul de lng
eticheta Row(s).
Pentru a pune genul biologic pe
coloanele tabelului, se selecteaz
i apoi se apas butonul de lng
eticheta Column(s).
Se apas OK.
Pasul 8:
n tabel sunt
prezentate valorile
celor dou variabile.
Se observ c sunt 5
fete i 6 biei
instituionalizai (n total 11) i 4 fete i 5 biei neinstituionalizai (n total 9).
(N=20).
Tabelul de asociere este folosit pentru prezentarea relaiilor dintre dou variabile categoriale.
n fiecare celul a tabelului este prezentat frecvena parial (adic efectivul care poart
simultan o valoare a fiecrei variabile).
Observaie:
1. Dac ntr-un crosstabs numrul categoriilor unei variabile este mai mare dect al
alteia, atunci categoriile acelei variabile se plaseaz pe rnduri.
2. O celul din crosstabs ofer informaia despre intersecia celor dou variabile. Pentru
aceasta alegem din fereastra Crosstabs butonul de comand Cell ce are ca efect
afiarea ferestrei Crosstabs Cell Display.

181

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

VII. Coeficieni de corelaie.


Coeficieni de corelaie Pearson i
Spearman.
_________________________________________________________________________________________________________________

Corelaia este o metod statistic utilizat pentru a determina relaiile


dintre dou sau mai multe variabile. Exist mai multe tipuri de corelaii att
parametrice ct i neparametrice.
Coeficientul de corelaie este o valoare cantitativ ce descrie relaia
dintre dou sau mai multe variabile. El variaz ntre (-1 si +1), unde valorile
extreme presupun o relaie perfect ntre variabile n timp ce 0 nseamn o lipsa
totala de relaie liniar. O interpretare mai adecvat a valorilor obinute se face
prin compararea rezultatului obinut cu anumite valori prestabilite n tabele de
corelaii n funcie de numrul de subieci, tipul de legtur i pragul de
semnificaie dorit.
Cel mai comun i cel mai folositor este coeficientul de corelaie Pearson
i coeficientul de corelaie Spearman.
CorelaiaPearson(r)evalueazgraduldeasocieredintredouvariabile
msuratepescaldeinterval/raport.Aceastasereferlaintensitateaisensulde
variaieconcomitentavaloriloruneivariabilenraportcucealalt,dupun
model de tip liniar. Dac valorile unei variabile urmeaz, n sens direct,
cresctor,sauinvers,descresctor,valorileceleilaltevariabile,atunciceledou
variabilecoreleazntreele.Domeniuldevariaieacoeficientuluidecorelaie
Pearson(r)estentrer=1(corelaieperfectnegativ:ceeacenseamncn
timp ce scorurile unei variabile cresc, scorurile pentru cealalt variabil
descresc)ir=+1(corelaieperfectpozitiv:ceeacenseamncscorurile
unei variabile se mresc odat cu creterea scorurilor celeilalte variabile).
Absenaoricreilegturi(corelaii)dintrevariabilesetraduceprinr=0.

182

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Ocorelaiede1,00indicoasociereperfectntreceledouvariabile.
Cu alte cuvinte, o diagram scatter a celor dou variabile va arta c toate
punctelesuntconinutedeosingurdreapt.Ovaloarede0,00indicfaptulc
toate punctele din diagrama scatter sunt dispersate aleatoriu n jurul oricrei
dreptedesenatepeaceastdiagramadatelorsausuntaranjatentromanier
curbilinie.
Coeficieni de corelaie neparametrici
- Se utilizeaz atunci cnd una dintre variabilele folosite nu ndeplinete condiiile unei
distribuii normale. Dup Opariuc (2011), datele care se afl la un nivel de interval sau
de raport, pot fi convertite uor n ranguri sau n frecvene (la nivel ordinal sau
nominal) dar aceast situaie nu este posibil i n sens invers.
n cazul corelaiei exist trei elemente eseniale n interpretarea unui coeficient de
corelaie: sensul, valoarea i semnificaia. (Opariuc, 2011, p. 102). O corelaie pozitiv
semnific faptul c, cele dou variabile evolueaz n aceai direcie n timp ce o corelaie
negativ indic faptul c, n timp ce o variabil crete, cealalt variabil scade.

ncontinuarevomilustracalcululcorelaieiPearson,odiagramscatter
icoeficientuldecorelaieSpearman,folosindpentruaceastadateledintabelul
urmtor,carereprezintscorurialeabilitilormuzicaleimatematicepentru10
copii.
muzica
3
matematic 7

7
5

8
4

9
4

9
5

6
8

4
9

3
9

4
7

7
6

VII.1. Introducerea datelor.


Pasul1:
nVariableViewdinData
Editorsedenumeteprimul
rndmuzic
ialdoilearndmatematic.*Senlturceledouzecimale.

Pasul2:
nDataViewdinDataeditor
seintroducdatelepentru:
183

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

- muzicnprimacoloan;
- matematicnadouacoloan.

VII.2. Corelaia Pearson.


Pasul1:
Seselecteaz:
Analyze,
Corelate,
Bivariate

Pasul2:
SeselecteazMuzici
Matematiciapoiseapas
butonulpentrualeintroduce
nlistadevariabileaacumeste
artatnfiguradindreapta.
SeapasOK.

VII.3. Interpretarea output-ului.


Corelaiadintre
matematicimuzic
este0,845Launtestde
semnificaie,twotailedla
niveluldeprobabilitate0,01
saumaimic,corelaiaeste
statisticsemnificativ.
Numrulcazurilorpecareestebazatcorelaiaeste10.Informaiaaparein
aceastcelul.
*Onetaileddacdistribuiaesteunidirecional.
Twotaileddacdistribuiaestebidirecional.
184

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

VII.4. Raportarea output-ului.


Corelaiadintreabilitilemuzicaleicelematematiceeste0,845.

Nivelul de semnificaie exact, cu trei zecimale, este 0,002. nseamn c


niveluldesemnificaieestemaimicdect0,01.
Interpretareapsihologicvafi:Existorelaienegativsemnificativntre
abilitilemuzicalei celematematice,ceea ce nseamn c,copiicunivel
ridicatalabilitilormuzicaleauunnivelsczutalabilitiimatematice.
Un coeficient de corelatie poate fi calculat corect numai cnd datele ambelor variabile
se refera la esantioane si fiecare este ales independent.
Coeficientul de corelaie Pearson evalueaz asocierea dintre dou variabile cantitative
iar domeniul de variaie al acestuia este cuprins ntre -1 (corelaie puternic negativ) i +1
(corelaie puternic pozitiv).
Un coeficient de corelatie poate fi apropiat de 1, deci ne va indica o corelatie
puternica, dar ea poate fi nesemnificativa din cauza volumului mic a esantionului studiat.
Corelatia nu trebuie identificata cu cauzalitatea, in sensul ca observatiile a 2 variabile se
pot corela foarte bine fara sa avem motive logice si stiintifice ca una dintre variabile poate fi
cauza celeilalte.
Semnul (+/-) indic sesnul asocierii dintre cele dou variabile. O valoarea pozitiv
arat c, pe msur ce valorile unei variabile cresc, valorile celeilalte variabile cresc i ele. O
valorea negativ arat c, pe msur ce valorile unei variabile cred, valorile ceilalte variabile
scad (Popa, 2008, p. 309).
Testul de corelaie Pearson implic dou msuri pentru aceeai subieci. Acest model
se ntlnete i atunci cnd se aplic Testul t pentru eantioane perechi, iar utilizarea uneia
dintre cele dou teste este dat de problema cercetrii:
- Dac se testeaz diferena dintre mediile variabilelor, msurate n dou moment
diferite, se utlizeaz testul t;
- Dac se testeaz asocierea dintre variabile diferite, msurate pe aceeai subieci, atunci
se folosete testul de corelaie.
Condiia principal pentru calcularea coeficientului de corelaie liniar Pearson este ca
variabilele implicate s fie msurate pe scal interval/raport, iar distribuia s nu se abat de la
curba normal.

185

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

VII.5. Coeficientul de corelaie Spearman.

Pasul1:
Identic corelaiei Pearson se
selecteaz Analyze, Correlate,
Bivariate i variabilele care se
doresc pentru corelaie.
Se selecteaz Spearman i se
deselecteaz Pearson (dac nu se
dorete ca i corelaie).
Se apas OK.

*Testul de corelaie a rangurilor, Spearman, este echivalentul pentru date ordinale al testului
de corelaie Pearson.

VII.6. Interpretarea output-ului.


Coeficientul de corelaie Spearman
ntre muzic i matematic este 0,842.
Nivelul de semnificaie este 0,001 sau
mai mic, deci corelaia este statistic
semnificativ.

186

Numrul cazurilor este 10.

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

VII.7. Raportarea output-ului.


Corelaia raportat cu dou zecimale este 0,84.
Interpretarea psihologic va fi: Exist o corelaie negativ semnificativ
ntre abilitile muzicale i cele matematice, ceea ce semnific faptul c, cei cu
un nivel ridicat al abilitii muzicale au abiliti matematice sczute i
viceversa.

Coeficientul de corelatie al rangurilor (Spearman) testeaza gradul de corelare intre 2


variabile calitative; este alternativa neparametrica a coeficientului de corelatie Pearson.
Acest coeficient variaza intre -1 si +1. O valoare apropiata de +1, inseamna ca suma
patratelor diferentelor este aproape nula, deci avem clasamente identice.
O valoare apropiata de 0, inseamna necorelarea variabilelor, iar valoarea apropiata de -1
pune in evidenta discordanta maxima a variabilelor.

VII.8. Diagrama scatter.


Pasul 1:
Se selecteaz:
Graphs
Legacy Dialogs
Scatter Dot
Pasul 2:
Se selecteaz define
din moment ce simple
este deja selectat.

Pasul 3:
187

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Pentru a avea variabila muzic ca ax vertical, se selecteaz i apoi se apas


butonul de lng csua Y Axis
Pentru a avea variabila matematic ca ax orizontal, se selecteaz apoi se
apas butonul de lng csua X Axis.
Se apas OK.

VII.9. Interpretarea outputului.


n diagrama scatter, rspndirea punctelor
este relativ ngust, ceea ce indic o
corelaie mare.
Forma mprtierii rezultatelor este relativ
n linie dreapt, indicnd mai degrab o
relaie n linie dreapt dect o relaie
curbilinie.
Linia este de la colul stnga sus pn n
dreapta jos, ceea ce indic o corelaie
negativ.
*Dac relaia este curbilinie atunci corelaiile Pearson i Spearman pot fi neltoare.

VII.10. Raportarea output-ului.


Despre diagrama scatter s-ar putea scrie urmtoarele afirmaii: A fost
examinat o diagram scatter pentru relaia dintre abilitile muzicale i
matematice. Nu exist nicio dovad privind o relaie curbilinie sau asupra
influenei avute de rezultatele atipice.
Coeficientul de corelaie pentru date ordinale (Spearman) se utiliuzeaz atunci cnd
(Popa, 2008):
- Ambele variabile sunt de tip ordinal;
- Una dintre variabile este de tip ordinal i cealalt este de tip interval/raport;
- Ambele variabile sunt de tip interval/raport, dar una sau ambele prezint valori
extreme.
- Variabilele sunt msurate pe scale de interval sau de raport, dar distribuia uneia sau a
ambelor se ndeprteaz grav de la forma normal.

188

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Spearman este un coeficient care se bazeaz pe ranguri i reprezentativitatea mediei nu


are influen asupra lui. Coeficientul se utilizeaz de regul atunci cnd lotul de cercetare este
sub 30 de cazuri. Acest coeficient transform scorurile originale n ranguri i analizeaz
relaia dintre acestea.
Coeficientul de corelaie a rangurilor Spearman este un coeficient de corelaie
direcional i poate avea valori cuprinse ntre -1 i -1 (Opariuc, 2011, p. 24-25).
Dac se obin valori apropiate de +1 atunci nseamn c exist o asociere pozitiv ntre
cele dou variabile. Dac se obin valori apropiate de -1 atunci exist o asociere negativ. n
situaiile n care valoarea coeficientului de corelaie se apropie mai mult de zero, varibilele nu
se coreleaz, adic, nu au nicio legtur ntre ele.

VII.11. Alegei rspunsul corect

1. Corelaia:
a. msoar variaia concomitent a doi factori
b. msoar parametria distribuiei ntre dou eantioane
c. msoar rangul unei distribuii trihotomice
2.CorelaiaPearson(r):
a. evalueazgraduldeasocieredintredouvariabilemsuratepescalde
interval/raport.
b. evalueaz gradul de asociere dintre dou variabile msurate pe scal
nominal;
c. evalueaz gradul de asociere dintre dou variabile msurate pe scal
ordinal.
3. Ocorelaiede1,00indic:
a. oasociereperfectntreceledouvariabile;
b. faptulctoatepuncteledindiagramascattersuntdispersatealeatoriun
juruloricreidreptedesenatepeaceastdiagramadatelor;
c. absenaoricreilegturi(corelaii)dintrevariabile.
4.
a.
b.
c.

Pearsonesteunindicatordecorelaie:
parametric;
neparametric;
ambelevariantedemaisus.

5. Spearman este un indice de corelaie:


a.parametric;
189

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

b.neparametric;
c.ambelevariantedemaisus.
6. O corelaienegativsemnificfaptulc:

a. ntimpcescorurileuneivariabilecresc,scorurilepentrucealaltvariabil
descresc;
b. c scorurile unei variabile se mresc odat cu creterea scorurilor
celeilaltevariabile).
c. nuexistniciolegturntrevariabile.
O corelaiepozitivsemnificfaptulc:
a.
ntimpcescorurileuneivariabilecresc,scorurilepentrucealalt
variabildescresc;
b.
cscorurileuneivariabilesemrescodatcucretereascorurilor
celeilaltevariabile).
c.
nuexistniciolegturntrevariabile.
7.

8. Norul de puncte este folosit pentru:


a. a reprezenta relaia dintre variabile;
b. a arta frecvena de apariie pentru diferite clase de valori ale variabilei
observate;
c. a arta intzervalul de ncredere de 95% pentru media respectiv.
9. Pentru a realiza un tabel de asociere selectm:
a. Analyze/Descrisptiv statistics/crosstabs;
b. Analyze/Descrisptiv statistics/Explore;
c. Statistics / Corelate / Crosstabs
d. Statistics / Custom tables / Crosstabs
10. Tabelul de asociere este folosit pentru:
a. selectarea unor subieci
b. prezentarea relaiilor dintre dou variante categoriale
c. recodificarea variabilelor
d. modificarea unui tabel

190

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

VII.12. Rspunsuri corecte

1. a. msoar variaia concomitent a doi factori


2. a. evalueazgraduldeasocieredintredouvariabilemsuratepescalde
interval/raport.
3.a.oasociereperfectntreceledouvariabile;
4.b.neparametric;
5.b.neparametric;
6. a. n timp ce scorurile unei variabile cresc, scorurile pentru cealalt
variabildescresc;
7. e. c scorurile unei variabile se mresc odat cu creterea scorurilor
celeilaltevariabile).
8.a. a reprezenta relaia dintre variabile;
9.a. Analyze/Descrisptiv statistics/crosstabs;
10.b. prezentarea relaiilor dintre dou variante categoriale

191

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

VIII. Regresia.
Predicia cu precizie.
_________________________________________________________________________________________________________________

Dac exist o relaie ntre dou variabile atunci sunt posibile estimarea
sau predicia scorului unei persoane la o variabil pornind de la scorul obinut la
cealalt variabil. Cu ct este mai puternic corelaia cu att este mai bun
predicia. Variabila independent este variabila folosit pentru a realiza predicia,
aceasta fiind cunoscut i ca variabil predictor sau variabila X.
*Este foarte important a nu se confunda variabila independent cu cea dependent. Cel
mai bun mod de a evita aceste probleme este de a examina scatterplot-ul sau diagrama scatter
a relaiei dintre cele dou variabile. Axa orizontal X este variabila independent i axa
verticala Y este variabila dependent. Se poate investiga i punctul de tiere, acesta fiind
punctul n care panta se intersecteaz cu axa vertical.

Regresia devine o tehnic mult mai important atunci cnd sunt folosite
mai multe variabile pentru predicia valorilor unei alte variabile.
n continuare este ilustrat procesarea unei regresii simple i a unei
diagrame de regresie folosind datele din tabelul urmtor.
Scormuzica
Scor
matematic

3
7

7
5

8
4

9
4

9
5

6
8

4
9

3
9

4
7

7
6

Unul din principalele capitole ale statisticii are n vedere posibilitatea de a face
predictii. Desi nu se gasesc relatii perfecte n lumea reala, prin intermediul regresiei se pot
face predictii ale unei variabile, n functie de valoarea alteia. Predictia este procesul de
estimare a valorii unei variabile cunoscnd valoarea unei alte variabile.
Regresia se leaga foarte mult de conceptul de corelatie. O asociere puternica ntre
doua elemente conduce la cresterea preciziei predictiei unei variabile pe seama alteia. Daca
am avea o corelatie perfecta (+1 sau 1) estimarea ar fi extrem de precisa

VIII.1. Introducerea datelor.


Pasul1:
nVariableViewdinData
Editorsedenumeteprimul
rndmuzic

192

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

ialdoilearndmatematic.*Senlturceledouzecimale.
Pasul2:
nDataViewdinDataeditorse
introducdatelepentru:
- muzicnprimacoloan;
- matematicnadouacoloan.

VIII.2. Regresia simpl.


Pasul 1:
Se selecteaz:
Analyze
Regression
Linear

Pasul 2:
Se selecteaz Muzic i apoi
se apas butonul de lng
eticheta Dependent, pentru a
introduce aceast variabil n
csua variabilei dependente.
Se selecteaz matematica
i apoi se apas butonul de
lng eticheta Independent(s)
pentru a introduce aceast
variabil n csua variabilei
(lor) independente.
Se selecteaz Statistics
Pasul 3:
Se selecteaz Confidence Intervals.
Se selecteaz Continue.
Se apas OK din ecranul precedent
care reapare.
193

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

VIII.3. Interpretarea output-ului.


Acest tabel conine datele eseniale pentru analiza regresiei.
Constanta este 12,716. Acesta este punctul n care linia de regresie
intersecteaz axa vertical.

Coeficientul nestandardizat
Coeficientul standardizat
Intervalul de
al regresiei este 1,049.
al regresiei este 0,845.
ncredere ia valori
Acesta semnific faptul c,
Acesta este mai mult sau de la -1,591 la -0,507.
pentru fiecare cretere cu 1
mai puin coeficientul de
a variabilei matematic
corelaie Pearson dintre
valoarea variabilei muzic abilitile muzicale i
descrete cu 1,049.
cele matematice.
n acest tabel, B este panta liniei de regresie (n SPSS fiind denumit
coeficient de regresie nestandardizat).
Intervalul de ncredere de 95% pentru aceti coeficieni este de la -1,59 la
-0,50. Intervalul de ncredere de 95% arat intervalul pantelor de regresie n care
putem fi siguri ntr-o proporie de 95% c panta pentru populaie se va gsi.
Cota denumit Beta are valoarea -0,845. Aceasta este de fapt corelaia
Pearson ntre cele dou variabile.
Regresia simpl - o variabila dependenta si una independent

VIII.4. Scatterplot-ul de regresie.


Atunci cnd se realizeaz o regresie este recomandabil cercetarea
diagramei scatter pentru cele dou variabile.
Pasul 1:
Se selecteaz:
Graphs
Legacy Dialog
Scatter/Dot
Pasul 2:

194

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Se selecteaz define; simple este deja selectat.


Pasul 3:
Pentru a avea variabila
muzic ca ax vertical, se
selecteaz i apoi se apas
butonul de lng csua Y
Axis
Pentru a avea variabila
matematic ca ax
orizontal, se selecteaz apoi
se apas butonul de lng
csua X Axis.
Se apas OK
Pasul 4:
Pentru a ncadra o linie de
regresie n scatterplot, se d
dublu clic oriunde n interior i
se va deschide Chart Editor.
Se selecteaz Elements i
Fit Line at Total.

VIII.5. Interpretarea output-ului.


Punctele de pe scatterplot sunt apropiate de linia de regresie. n plus,
punctele par s formeze o linie dreapt (relaia nu este curbilinie).
n regresie, axa vertical este
variabila-criteriu sau
dependent (n cazul nostru =
muzica).

195

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Linia de regresie are o pant negativ n acest caz; de exemplu: de la stnga sus
spre dreapta jos. n consecin B are valoare negativ.
n regresie axa orizontal este variabila predictor sau independent (n
cazul nostru matematic).
* Linia de regresie oblic, de la stnga sus spre dreapta jos, indic o relaie negativ ntre cele
dou variabile.

Punctele par relativ apropiate de line, ceea ce sugereaz c beta (corelaia)


ar trebui sa fie un numr mare (negativ) i c intervalul de ncredere este relativ
mic.
Regresia liniar - relatia dintre cele doua variabile poate fi descrisa printr-o dreapta n cadrul
norului de puncte.

VIIII.6. Raportarea output-ului.


Interpretarea diagramei se poate realiza n felul urmtor:
Diagrama scatterplot a relaiei dintre abilitile matematice i muzicale
sugereaz o relaie liniar negativ ntre cele dou variabile. Este posibil
predicia cu acuratee a abilitii muzicale a unei persoane cunoscnd abilitatea
sa matematic.

196

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

IX. Eroarea standard


_________________________________________________________________________________________________________________

Eroarea standard este un indice pentru variabilitatea mediilor mai multor


eantioane extrase din populaie; cu alte cuvinte este media msurii cu care
media eantioanelor difer fa de media populaiei din care au fost extrase.
Eroarea standard poate fi folosit ca un pas intermediar n alte tehnici
statistice, cum ar fi Testul t i este un concept important pentru calculul
intervalelor de ncredere.
Calcularea erorii standard estimate pentru medie este ilustrat cu un set
de ase scoruri ale stimei de sine, prezentate n tabelul urmtor.
Stima de sine

IX. 1. Introducerea datelor.


Pasul 1:
Se introduc datele n Data Editor.
Se eticheteaz variabila Stima.

IX. 2. Eroarea standard estimat a mediei.


Pasul 1:
Se selecteaz:
Analyze
Descriptive Statistics
Descriptive

197

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Pasul 2:
Se selecteaz stima de sine i apoi
se apas butonul pentru a
introduce variabila Stima de sine
n variable(s).
Se selecteaz Options
Pasul 3:
Se selecteaz S-E mean.
Se selecteaz continue.
Se apas OK din ecranul anterior care reapare.

IX. 3. Interpretarea output-ului.


Eroarea standard (estimat) pentru medie a acestui eantion este 0,577.
este o indicaie a mediei cu care mediile eantioanelor difer de media populaiei
din care au fost extrase.

testul ofer valoarea erorii standard a mediilor eantioanelor ca fiind 0,58


(suma este rotunjit la dou zecimale) aceasta fiind valoarea medie cu care
mediile eantioanelor (N=6) difer fa de media populaiei.
tabelul include i alte informaii cum ar fi media (5,00), abaterea standard
estimat a populaiei bazat pe acest eantion, valorile minime i maxime ale
datelor.
ultima coloan ofer abaterea standard (estimat) a celor ase scopuri, care
este 1,41.
198

Mihaela Rus

X.

Elemente de statistic aplicat

Mihaela Sandu

Testul t.
Compararea a dou eantioane
de scopuri corelate/relaionate.

_________________________________________________________________________________________________________________

Testul t este folosit pentru evaluarea semnificaiei statistice a diferenei


dintre mediile pentru dou seturi de scoruri. Cu ajutorul testului t se pune n
eviden dac valoarea medie pentru un set de scoruri difer n medie de
valoarea medie pentru alt set de scoruri.
Testul t are dou variante:
1. prima variant este folosit atunci cnd cele dou seturi de scoruri
ce trebuie comparate provin dintr-un singur eantion sau cnd
coeficientul de corelaie ntre cele dou seturi este mare testul t
pentru eantioane perechi;
2. a doua variant a testului t este utilizat n momentul n care dou
seturi diferite de valori provin din grupe diferite de participani.
testul t pentru eantioane independente.
* Testul t pentru eantioane perechi este optim dac distribuia diferenelor dintre cele
dou seturi de valori se prezint (aproximativ) sub form de clopot (atunci cnd distribuia
este normal). Dac distribuia este foarte diferit de forma de clopot ar trebui luat n
considerare utilizarea unei tehnici statistice relaionate nonparametric pentru eantioane
perechi, cum ar fi testul de perechi Wilcoxon.

Procesarea unui Test t este ilustrat cu datele din tabelul urmtor unde
sunt prezentate numrul de cuvinte pe care aceeai copii le-au verbalizat cu
mamele lor la 18 luni i la 24 luni.
Numrul de cuvinte verbalizate ntr-un minut la vrste diferite.

199

Mihaela Rus
18 luni
24 luni

Elemente de statistic aplicat


Alina
3
5

Cristina Raluca Carmen Simona Radu


2
4
5
2
3
4
7
8
3
4

200

Mihaela Sandu
Cristi
2
4

Dan
4
6

Mihaela Rus

Elemente de statistic aplicat

X.1. Introducerea datelor.


Pasul 1:
n Variable View din Data
Editor se eticheteaz primul rnd cu
optsprezece i al doilea rnd cu
douzeci i patru.
* Se nltur cele dou zecimale.

Pasul 2:
n Data View din Data Editor
se introduc datele n primele dou
coloane.

X.2. Testul t pentru eantioane


perechi
Pasul 1:
Se selecteaz:
Analyze
Compare Means
Paired-Samples T Test
Pasul 2:
Se selecteaz optsprezece
i se pune aceast variabil
lng eticheta Variable1
sub Curent Selections.
Se selecteaz douzeci i
patru i se pune aceast
variabil lng eticheta
Variable2 sub Curent
Selections.
Se apas butonul pentru a
pune aceste dou variabile
n lista variabilelor relaionale.
Se apas OK.

201

Mihaela Sandu

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

X.3. Interpretarea output-ului.

Primul tabel arat media, numrul de cazuri i abaterea standard


pentru cele dou grupuri. Media pentru optsprezece este 3,13 i abaterea
standard este 1,126.

Al doilea tabel arat gradul n care cele dou seturi de valori sunt corelate.
Corelaia dintre ele 0,94. Aceasta este o corelaie mare, nivelul de semnificaie
fiind de 0,00.
Primele trei coloane care conin cifre sunt componentele fundamentale ale
calcului unui Test t relaionat. Media de -2,000 este de fapt diferena dintre
mediile pe 18 i 24 luni, deci n realitate este media diferenei. Valoarea lui t
este bazat pe aceast medie a diferenei (-2,00), divizat cu eroarea standard a
mediei (0,267). Calculul ofer valoarea lui t (-7,483).

X.4. Raportarea output-ului.


Rezultatele obinute ar putea fi prezentate astfel: Media numrului de
cuvinte verbalizate la 18 luni difer semnificativ de media cuvintelor verbalizate
la 24 de luni.

202

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

XI. Testul t.
Compararea a dou eantioane de
scoruri necorelate/nerelaionate.
_________________________________________________________________________________________________________________

Atunci cnd o investigaie de tip statistic se efectueaz pe un eantion,


orice rezultat obinut are o valoare relativ, n sensul c datele respective nu
numai c nu coincid cu cele referitoare la populaie, dar nici mcar nu se poate
ti cu certitudine care este diferena dintre cele dou genuri de date, de vreme ce
starea populaiei este, de regul, necunoscut. Teoria matematic a
probabilitilor ofer ns proceduri pentru evaluarea rezultatelor studiilor
selective, permind o estimare, n termeni de probabilitate, a marjei maxime de
eroare ce se poate comite prin utilizarea mrimilor din eantion n locul celor
care caracterizeaz populaia.
Testul t este nesenoprocedurdetestareasemnificaieidiferenei
dintredoumedii.
Ca urmare, el este potrivit atunci cnd variabila dependent este
msuratpescalcantitativ(intervalraport).Distribuiateoreticdereferin
(distribuiadenul)esteceanormal,pentrueantioanemaimaride30desubiec
i,idistribuiat(Student),pentrueantioanemaimicide30desubieci.Chiar
dacformuleledecalculsuntdiferite,formadeprezentarearezultatelorira
ionamentuldecizionalsuntsimilarepentruambelesituaii.
Testul t pentru eantioane independente este utilizat pentru a calcula
dac mediile pentru dou seturi de variabile sunt diferite semnificativ una fa de
cealalt.
* Testul t pentru eantioane independente este cel mai des folosit.

Testul t pentru eantioane independente este utilizat atunci cnd cele


dou seturi de variabile provin din dou eantioane diferite de oameni.
Procesarea unui Test t pentru eantioane independente este ilustrat cu
datele din tabelul urmtorcare arat valorile la un test de emotivitate pentru 10
copii care provin din familii biparentale i 10 copii care provin din familii
203

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

monoparentale. Scopul analizei este de a aprecia dac valorile emotivitii sunt


diferite la copii care provin din familii cu doi prini fa de copii care provin
din familii monoparentale.
Familii
biparentale
monoparentale

12

18

14

10

19

15

11

10

13

13

14

12

11

XI.1. Introducerea datelor


Pasul 1:
n Variable View din Data Editor, se eticheteaz pe rnd Familii.
Aceasta va defini cele dou tipuri de familii.
Se eticheteaz al doilea rnd
Emotivitate (aici vor fi introduse
rezultatele la testul de emotivitate).
Se nltur cele dou zecimale.
Pasul 2:
n Data View din
Data Editor se introduc
valorile pentru cele dou
variabile n primele dou
coloane.
* Se observ c sunt dou coloane
de date: A doua coloan conine
cele 20 de valori ale testului de
emotivitate de la ambele grupe de
copii. Datele nu sunt pstrate
separat pentru cele dou grupe;
valorile 1 din prima coloan indic copii provenii din familiile biparentale i valorile 2 indic
copii provenii din familiile monoparentale. Astfel, este utilizat o singura variabil
dependent (n cazul nostru emotivitatea) i alt coloan pentru variabila independent
(familia). Cu alte cuvinte, fiecare rnd n parte reprezint un anumit copil i variabilele sale
dependente i independente sunt introduse separat n Data Editor.

204

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

XI.2. Efectuarea Testului t pentru eantioane


independente.
Pasul 1:
Se selecteaz:
Analyze
Compare Means
Independent Samples T test
Pasul 2:
Se selecteaz Emotivitate i
apoi se apas butonul pentru
a introduce aceast variabil n
lista variabilelor de test.
Se selecteaz Familie i apoi
se apas butonul pentru a
introduce aceast variabil n
csua Grouping Variable.
Se selecteaz Define Groups pentru a defini cele dou grupuri.
Pasul 3:
Se introduce:
- valoarea 1 (codul pentru familiile
- biparentale) lturi de eticheta
- Group 1
- valoarea 2 (codul pentru familiile
- monoparentale) alturi de eticheta
- Group 2.
Se selecteaz Continue
Se apas OK din ecranul precedent, care reapare.

205

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

XI.3. Interpretarea output-ului.

Primul tabel arat , pentru fiecare grup n parte, numrul de cazuri, media
i abaterea standard. Media pentru familiile biparentale este 13,00. Dup cum se
observ exist o diferen ntre cele dou tipuri de familii, dar, ntrebarea este
dac mediile difer semnificativ.
Valoarea lui t este media diferenei (3,500) divizat cu eroarea standard a
diferenei (1,493), diviziune ce produce valoarea 2,345.

Dac valoarea semnificaiei pentru


Testul Levene este mai mare de 0,05,
lucru care se ntmpl aici (0,642)
se folosete informaia de pe acest
prim rnd.
Dac valoarea semnificaiei pentru
Testul Levene este mai mic de 0,05,
se folosete informaia de pe al doilea
rnd (al doilea rnd ofer cifrele pentru
cazul n care varianele sunt diferite
semnificativ).

206

Pentru variane egale, t este 2,345,


care la 18 grade de libertate este
semnificativ la 0,031 pentru nivelul
two-tailed.

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

XI.4. Raportarea output-ului.


Rezultatele obinute se pot raporta astfel: Media pentru valorile testelor
de emotivitate ale copiilor ce provin din familii cu doi prini este semnificativ
mai mare dect cea a copiilor provenii din familiile cu un singur printe.
Dac se prefer folosirea intervalelor de ncredere , se poate scrie:
Diferena dintre valorile testelor de emotivitate ale copiilor ce provin din
familii cu doi prini (M=13,00, SD=3,55) i cei provenii din familii cu un
singur printe (M=9,50, SD=3,10) este de 3,50. Intervalul de ncredere de 95%
pentru aceast diferen este de la 0,36 la 6,63.Deoarece intervalul nu conine
punctul 0,00 diferena este statistic semnificativ la nivelul de semnificaie twotailed de 5%.

XI.5. Alegei rspunsul corect

1. Independent Samples T Test se aplic n cazul:


a. aceluiai eantion
b. eantioanelor independente
c. eantioanelor dependente
2. Independent Samples T Test testeaz:
a. dac mediile a dou grupe sunt egale;
b. dac mediile a dou grupe difer;
c. dac se compar mediile pentru un singur grup observat la momente
diferite;
3. Testul t se folosete pentru:
a. compararea a dou seturi de date pentru identificarea diferenelor;
b. identificarea predictorilor pentru o variabil numeric;
c. compararea datelor de frecven.

207

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

4. One sample T Test este un procedeu prin care:


a. se compar mediile pentru un singur grup observat n momente diferite
b. se testeaz dac mediile a dou grupe sunt egale
c. se testeaz dac media unei variabile este egal cu o constant
specificat
b. se testeaz dac mediile a dou grupe difer
5. Paired Samples T test:
a. testeaz dac mediile a dou grupe sunt egale
b. testeaz dac media unei variabile este egal cu o constant specificat
c. compar mediile pentru un singur grup observat n momente diferite
d. compar mediile pentru mai multe medii observate n momente diferite
6. Testul t pentru eantioane independente este utilizat atunci cnd:
a. cele dou seturi de scoruri ce trebuie comparate provin dintr-un singur
eantion
b. coeficientul de corelaie ntre cele dou seturi este mare
c. cele dou seturi de variabile provin din dou eantioane diferite de
oameni.
7. Testul t pentru eantioane perechi este utilizat atunci cnd:
a. cele dou seturi de scoruri ce trebuie comparate provin dintr-un singur
eantion
b. coeficientul de corelaie ntre cele dou seturi este mare
c. cele dou seturi de variabile provin din dou eantioane diferite de
oameni.
8. Testul t:
a. este folosit pentru evaluarea semnificaiei statistice a diferenei dintre
mediile pentru dou seturi de scoruri;
b.estepotrivitatuncicndvariabiladependentestemsuratpescal
cantitativ(intervalraport).
c. este utilizat pentru a calcula dac mediile pentru dou seturi de variabile
sunt diferite semnificativ una fa de cealalt.

208

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

XI.6. Rspunsuri corecte

1. b. eantioanelor independente;
2. a. dac mediile a dou grupe sunt egale;
3. a. compararea a dou seturi de date pentru identificarea diferenelor;
4. c. se testeaz dac media unei variabile este egal cu o constant
specificat;
5. c. compar mediile pentru un singur grup observat n momente
diferite
6. c. cele dou seturi de variabile provin din dou eantioane diferite de
oameni.
7. a. cele dou seturi de scoruri ce trebuie comparate provin dintr-un
singur eantion
b. coeficientul de corelaie ntre cele dou seturi este mare
8. a. este folosit pentru evaluarea semnificaiei statistice a diferenei
dintre mediile pentru dou seturi de scoruri;
b. este potrivit atunci cnd variabila dependent este msurat pe
scalcantitativ(intervalraport).
c. este utilizat pentru a calcula dac mediile pentru dou seturi de
variabile sunt diferite semnificativ una fa de cealalt.

209

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

XII. Testul Chi-Square.


Diferene ntre frecvenele eantioanelor.
_________________________________________________________________________________________________________________

n general Testul chi-square este folosit pentru evaluarea existenei unei


diferene semnificative ntre dou eantioane formate din date de frecven (date
nominale). Acesta, analizeaz tabelele de asociere sau contingen pe baza a
dou variabile categoriale nominale.
*Testul chi-square analizeaz frecvene. Niciodat acestea nu trebuie s fie
transformate n procente pentru a fi introduse n SPSS, deoarece vor da rezultate eronate
atunci cnd se vor calcula valoarea i semnificaia chi-square.
* O analiz chi-square trebuie s includ datele fiecrui individ o singur dat, astfel
nct frecvenele totale s fie egale cu numrul persoanelor folosite n analiz.
Tabel 1. Relaia dintre site-urile accesate i genul biologic.

Respondeni
Feminin
Masculin

Site-uri
matrimoniale
27
17

anunuri muzic
14
33

19
9

XII.1. Introducerea datelor din tabelul anterior


folosind procedura Weighing cases.
Procesarea Testului chi-square folosind dou sau mai multe eantioane
este exemplificat cu datele din tabelul anterior, care arat care dintre cele trei
tipuri de site-uri este preferat de ctre un eantion de 119 adolesceni de ambele
sexe.
Pasul 1:

n meniul Variable View


Se ndeprteaz cele Se eticheteaz valorile
din Data Editor se eticheteaz dou zecimale.
gen i program.
primele trei coloane cu gen
biologic, Site i Frecven.
210

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Pasul 2:
Se introduc valorile adecvate n meniul
Data View din meniul Data Editor.
Fiecare rnd reprezint una dintre cele ase
celule din tabelul prezentat anterior.
Paul 3:
Pentru a pondera aceste celule
se selecteaz:
Data
Weight Cases

Pasul 4:
Se selecteaz Frecvena, Weight
cases by i apoi se apas butonul
.
Se apas OK.

XII.2. Introducerea datelor din tabelul 1 caz cu caz.


Se introduc valorile pentru
cele dou variabile n fiecare
dintre cele 119 cazuri.

XII.3. Efectuarea Testului chi-square pe baza tabelului


1.
Pasul 1:
Se selecteaz:
Analyze
descriptives statistics
Crosstabs(tabele de asociere)

211

Mihaela Rus

Elemente de statistic aplicat

Pasul 2:
Se selecteaz Gen i se
apas butonul pentru
Row(s): pentru a-l
introduce n caseta respectiv.
Se selecteaz Site i se apas
butonul pentru Column(s):
pentru a-l introduce n caseta
respectiv.
Se selecteaz Statistics
Pasul 3:
Se selecteaz Chi-square.
Se selecteaz Continue.
Pasul 4:
Se selecteaz Cells..
Pasul 5:
n seciunea Counts se selecteaz
Expected. Se selecteaz
Unstandardized n seciunea
Residuals. Se selecteaze Continue,
apoi se apas OK n ecranul anterior
care reapare.
* Termenul rezidual se refer la diferene.

212

Mihaela Sandu

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

XII.4. Interpretarea output-ului pentru Testul chisquare.


Acest al doilea tabel din output indic frecvena (Count), frecvena
ateptat (Expected Count i diferena (Residual) dintre cele dou pentru
fiecare dintre cele ase celule ale tabelului.

De exemplu: Frecvena sau numrul de


fete care spun c prefer site-rile de
matrimoniale este de 17, iar numrul
anticipat de probabilitate este 21,8,
diferena dintre cele dou valori fiind de
4,8.
Al treilea tabel, i ultimul
indic valoarea
coeficientului (Pearson)
chi-square (13,518),
gradele de libertate (2) i
semnificaia two-tailed
(0,001). Din moment ce
aceast valoare este mai
mic de 0,05, coeficientul
chi-square este
semnificativ.
Al doilea tabel indic frecvenele observate i cele ateptate ale cazurilor i
diferena (valoarea rezidual) dintre acestea pentru fiecare celul. Frecvena
observat

(numit Count) este prezentat prima, apoi frecvena ateptat

(numit Expected Count. Frecvenele observate sunt ntotdeauna numere


ntregi, astfel nct s fie uor de localizat.
213

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Coloana final din tabel etichetat Total conine numrul de cazuri din
respectivul rnd, urmat de numrul ateptat de cazuri din tabel.
Astfel primul rnd are 60 de cazuri, urmat de numrul ateptat de cazuri
din tabel. Astfel, primul rnd are 60 de cazuri, numr care va fi identic
numrului de cazuri ateptate (adic 60).
n mod similar, rndul final din acest tabel (etichetat Total) prezint mai
nti numrul de cazuri din respectiva coloan urmat de numrul ateptat de
cazuri din tabel pentru coloana respectiv. Astfel, prima coloan are 44 de
cazuri, numr care ca fi ntotdeauna egal cu numrul ateptat de cazuri (adic
44,0).
Valoarea chi-square, gradul su de liberate i nivelul su de semnificaie sunt
afiate n al treilea tabel care ncepe cu Pearson (cel care a elaborat acest test).
Valoarea chi-square este de 13,518, care, rotunjit la un numr cu dou
zecimale, devine 13,52. Gradul su de libertate este 2, iar probabilitatea twotailed exact este 0,001.
Sub acest tabel se mai poate vedea i mrimea minimum expected count a
oricrei celule din tabel, care este 13,88 pentru ultima celul (fetele care prefer
site-urile cu muzic). Dac diferena minim ateptat este mai mic dect 5.0,
atunci trebuie s se acorde foarte mult atenie Testului chi-square.
* Dac se folosete un tabel 2x2 de tip chi-square i apar frecvene anticipate reduse, este
recomandat s se foloseasc testul Fisher, pe care aplicaia SPSS l include n output n astfel
de situaii.

XII.5. Raportarea output-ului pentru Testul chi-square.


Exist dou modaliti de descriere a rezultatelor.
* Pentru o persoan neexperimentat aceste dou posibiliti de interpretare pot prea
foarte diferite, dar, practic, ele nseamn acelai lucru.

214

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Rezultatele se pot descrie astfel: A existat o diferen semnificativ


ntre frecvenele observate i cele ateptate n cazul adolescenilor biei i fete
n ceea ce privete preferina lor pentru cele trei tipuri de site-uri ( 2 =
13,51. DF = 2, p = 0,001).
O alt posibilitate de interpretare a rezultatelor obinute ar putea fi:
Exist o asociere semnificativ ntre genul biologic i tipul de site
preferat ( 2 = 13,51. DF = 2, p = 0,001).
Raportarea i direcia rezultatelor se poate face astfel: Fetele tind mai
mult dect bieii s prefere site-urile cu anunuri (de toate genurile) i prefer
mai puin site-urile despre matrimoniale sau pe cele cu muzic.

215

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

XIII. Recodificarea variabilelor.


Aplicaia SPSS poate recodifica valori n mod rapid i cu uurin, ceea ce
i ofer cercettorului o mare libertate de recodificare a datelor.
*Nu se modific variabilele dect n cazul n care este absolut sigur c se dorete
modificarea permanent a datelor originare.

Scorurile abilitilor muzicale i matematice


obinute de ctre un numr de 10 copii
Scor muzic
3
7
8
9
9
6
4
3
4
7

Scor matematic
7
5
4
4
5
8
9
9
7
6

Gen biologic
1
1
2
1
2
2
2
1
2
1

Vrst
10
9
12
8
11
13
7
10
9
11

* Scorurile abilitilor muzicale i matematice sunt aceleai care au fost prezentate


anterior n capitolul VIII.1.

Dorim s se realizeze corelaia dintre valorile abilitilor muzicale i a


celor matematice, n cazul copiilor mici i a celor mari. Pentru a realiza aceast
corelaie este important s se stabileasc numrul de grupe de vrst dorite. n
acest caz se vor alege dou grupe de vrst: copii mai mici de 10 ani i copii mai
mari de 10 ani.

XIII.1. Recodificarea rezultatelor.


Pasul 1:
Se introduc datele aa cum este
prezentat n tabelul alturat.
(Paii de introducere a datelor
sunt prezentai n capitolele
anterioare).

216

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Pasul 2:
Se selecteaz Transform,
recode
i Into Different Variables

Pasul 3:
Se selectea Vrst i se
apas butonul pentru a
introduce Vrsta n
caseta Numeric Variable
Output variable.
Se introduce numele noii
variabile.
Se selecteaz Change
pentru a aduga acest nume
nou n caseta Numeric variable
Output Variable.

Se selecteaz Old and New values.

Pasul 4:
Se selecteaz Lowest
through i se scrie 9 n
caseta alturat.
Se selecteaz Value
din meniul new value
i se scrie 1 n csua
alturat.
Se selecteaz Add i
se introduce lowest
throught 91 n caseta
OldNew.

217

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Pasul 5:
Se selecteaz
Range: through
highest i se scrie
10 n caseta de
lng el.
Se selecteaz
value i se scrie
2 n caseta
alturat.
Se selecteaz
Add i se
introduce 10
through
Highest2 n
caseta OldNew. Se apas OK n ecranul care va reaprea.
Pasul 6:
Noua variabil i valorile sale sunt
afiate n meniul Data View.
1 semnific copii cu vrste mai mici de 10
ani
2 semnific copii cu vrste mai mari de
10
ani.
Pentru o astfel de recodificare se
deschide fereastra Recode into Different
Variables (din meniul Transform comanda Recode) n care:
- se selecteaz variabila pe care dorim s o recodificm din lista variabilelor din
partea stng i se mut n lista variabileor de recodat;
- se scrie numele noii variabile n caseta Name din zona Output Variable;
- se scrie n caseta Label eticheta noii variabile;
- se acioneaz butonul de comand Change pentru a se realiza modificarea.
Pentru a defini categoriile variabilei numerice acionm butonul de comand Old and
New Values ce are ca efect deschiderea unei ferestre de dialog n care pentru a schimba o
valoare particular ntr-o valoare nou se introduce valoarea veche n caseta Old Value i
valoarea nou n caseta New Value i se acioneaz butonul Add.
De regul se schimb o valoare real cu alt valoare real. n acest scop selectm
butonul de opiuni Range. Casetele de editare sunt folosite pentru a stabili limita inferioar i
respectiv limita superioar a intervalului dorit. Apoi se selecteaz butonul de opiuni Value din
zona New Value n care se introduce noua valoare i acionm butonul Add.

218

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Prin clic pe butonul de comand Continue se revine n fereastra Record into Different
Variables n care acionm OK pentru recodificarea variabilei.

XIII.2. Alegei rspunsul corect

1. Comanda RECODE permite:


a. recodificarea ntr-o variabil diferit sau n aceeai variabil;
b. tranformarea unei variabile prin divizarea valorilor acesteia ntr-un numr
mai mare de categorii;
c. combinarea valorilor acestei variabile cu scopul crerii unei alte serii;
2. Comanda RECODE se gsete n meniul:
a. transform/recode/into different variables;
b. transform/recode/into same variables;
c. ambele variante de mai sus.
3. Chi Square
a. testeaz egalitatea a dou sau mai multe proporii
b. testeaz egalitatea unei proporii cu o valoare specificat
c. testeaz egalitatea mediilor a dou eantioane independente
d. testeaz egalitatea mediilor a dou eantioane perechi
4. Pentru recodificarea n aceeai variabil se selecteaz:
a. transform/recode/into different variables;
b. transform/recode/into same variables;
c. nicio variant de mai sus.
5. Pentru recodificarea ntr-o variabil diferit se selecteaz:
a. transform/recode/into different variables;
b. transform/recode/into same variables;
c. nicio variant de mai sus.

219

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

XIII.3. Rspunsuri corecte

1. a. recodificarea ntr-o variabil diferit sau n aceeai variabil;


2. c. ambele variante de mai sus.
3. a. testeaz egalitatea a dou sau mai multe proporii
4. b. transform/recode/into same variables;
5. a. transform/recode/into different variables;

220

Mihaela Rus

XIV.

Elemente de statistic aplicat

Mihaela Sandu

Calculul variabilelor noi.

_________________________________________________________________________________________________________________

Calculul variabilelor noi permite adunarea, scderea, etc. a valorilor


ctorva variabile pentru a obine o nou variabil.
Exemplu: Se dorete s se adune cteva ntrebri dintr-un chestionar, pentru a
obine un indice general al ceea ce msoar chestionarul.
Atunci cnd sunt msurate variabilele psihologice, se folosesc mai multe
ntrebri pentru a msura mai mult sau mai puin acelai lucru.
De exemplu, urmtoarele afirmaii pot fi folosite pentru evaluarea satisfaciei
profesional:
d. n general m bucur profesia mea.
e. Uneori stresul de la serviciu devine insuportabil.
f. Unii colegi sunt enervani cteodat.
g. Viitorul pare promitor la locul de munc.
Participanilor li se cere s afirme n ce msur sunt de acord cu fiecare
dintre aceste afirmaii, pe urmtoarea scal de la 1 la 4:
1. ntru totul de acord;

2. de acord;

3. dezacord;

4. total dezacord.

Aceti itemi se pot folosi pentru a determina nivelul de satisfacie


profesional a angajailor, prin adunarea rspunsurilor date tuturor celor patru
afirmaii.
ntru totul De acord
de acord

dezacord

Total dezacord

Respondent 1
Respondent 2
Respondent 3
Deoarece este nevoie de scoruri mari pentru a indica satisfacia
profesional, se va inversa evaluarea, astfel:
4. total de acord;

3. de acord;
221

Mihaela Rus

Elemente de statistic aplicat

2. dezacord;

1. total dezacord.

XIV.1. Procedura unei variabile noi.


Pasul 1:
Se scrie un nume
pentru noua
variabil n caseta
de sub Target
Variable (ex. scor
total.
Se scrie sau se
selecteaz termenii
expresiei i se
introduc n caseta
Numeric
Expression.
Se apas OK.
Se selecteaz
Paste pentru a
salva aceast
procedur sub form
de sintax.

Pasul 4:
Pentru a salva aceast
procedur sub form de fiier
de sintax, se selecteaz
Paste n caseta principal.
Aceast comand de sintax
va aprea n fereastra
Syntax.

222

Mihaela Sandu

Mihaela Rus

XV.

Elemente de statistic aplicat

Mihaela Sandu

Testele rangurilor.
Statistici nonparametrice.

_________________________________________________________________________________________________________________

Testele nonparametrice sunt folosite atunci cnd nu este ndeplinit


condiia ca scorurile fiecrei variabile s fie ct de ct normal distribuite (n
form de clopot). Aceste teste fac mai puine presupuneri referitoare la
caracteristicile populaiei de la care provin datele, trstur

care nu este

caracteristic testelor parametrice (cum ar fi Testul t). Metodele statistice


nonparametrice nu testeaz diferenele dintre medii, deoarece acestea folosesc
scoruri transformate n ranguri. De obicei, prin aceste metode se verific dac
rangurile dintr-un grup sunt mai mari sau mai mici dect rangurile din cellalt
grup.
n acest capitol vom vorbi despre Testul semnului i Testul Wilcoxon
pentru date corelate (eantioane perechi). Cu alte cuvinte, aceste teste sunt
echivalentele nonparametrice ale Testului t pentru eantioane perechi.
Testul U Mann-Witney se folosete pentru date nerelaionate, acesta fiind
echivalentul nonparametric al Testului pentru eantioane independente.
Procesarea a dou teste nonparametrice pentru scoruri relaionate este
exemplificat folosind datele din tabelul urmtor, care a fost folosit i n
capitolul X i care indic numrul de cuvinte pe care aceeai copii le-au
verbalizat cu mamele lor la 18 luni i la 24 luni.
Numrul de cuvinte verbalizate ntr-un minut la vrste diferite.
18 luni
24 luni

Alina
3
5

Cristina Raluca Carmen Simona Radu


2
4
5
2
3
4
7
8
3
4

223

Cristi
2
4

Dan
4
6

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

XV.1. Scoruri relaionate: testul


semnului.
Pasul 1:
n Data View din Data Editor
se introduc datele n primele dou
coloane.

Pasul 2:
Se selecteaz:
Analyze
Nonparametric Tests
Legacy dialog
2 Related Samples
Pasul 3:
Se selecteaz Optsprezece
i douzecisipatru i se
apas butonul pentru a
introduce aceste dou
variabile n caseta Test Pair
(s) List.
Se deselecteaz Wilcoxon.
Se selecteaz Sign.
Se apas OK.

XV.2. Interpretarea output-ului pentru testul


semnului.
Se poate ignora primul dintre cele
dou tabele care indic numrul de
diferene negative (0), pozitive (8)
224

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

i inexistente (0) n ceea ce privete numrul de cuvinte verbalizate la cele dou


vrste.

Al doilea tabel indic nivelul de


semnificaie al acestui test. Probabilitatea
two-tailed este de 0,008 ceea ce este
semnificativ la nivelul de 5%.

XV.3. Raportarea output-ului pentru testul


semnului.
Rezultatele obinute pot fi raportate astfel: Exist o schimbare
semnificativ la nivelul numrului de cuvinte verbalizate de la 18 luni la 24 de
luni (Testul semnului: N=0,008).
*Testul semnului este utilizat pentru a testa diferena dintre valori. Dac nu ar exista
nicio diferen ntre valorile pereche, atunci numrul diferenelor pozitive ar trebui sp fie egal
cu numrul diferenelor negative. Cu ct numrul diferenelor de un anumit semn este mai
mare, comparativ cu cel al diferenelor de semn opus, cu att crete probabilitatea ca diferena
dintre variabile s fie semnificativ. (Popa, 2008, p. 323).

XV.4. Scoruri relaionate: testul Wilcoxon.


Testul Wilcoxon reprezint opiunea predefinit n caseta de dialog a
testelor cu dou eantioane perechi. Dac s-a deselectat anterior, se selecteaz
din nou. Se apas OK pentru a obine output-ul Testului Wilcoxon.
XV.5. Interpretarea output-ului pentru Testul
Wilcoxon.

225

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Se poate ignora primul dintre cele dou tabele de output. Acestea indic
numrul de diferene negative (0), pozitive (8) i inexistente (0) n ceea ce
privete datele ordonate dup cele dou vrste, i media i suma catalogate
negative i pozitive. Valorile pentru dou zeci i patru de luni sunt mai mari
dect cele pentru optsprezece luni.
Al doilea tabel indic nivelul de
semnificaie al acestui test. n loc s
foloseasc

tabelul

valorilor

critice,

computerul utilizeaz o formul care


stabilete o conexiune cu distribuia Z.
Scorul Z este de 2,558, care are o
probabilitate two-tailed de 0,011. Aceasta nseamn c diferenele dintre cele
dou variabile sunt semnificative din punct de vedere statistic la un nivel de 5%.

XV.6. Raportarea output-ului pentru Testul


Wilcoxon.
Rezultatele obinute pot fi raportate astfel: Exist o diferen
semnificativ ntre numrul de cuvinte verbalizate de copii ntre 18 i 24 de luni
(Wilcoxon: N=8, z =2,56, two-tailed p = 0,011).
Tesul Wilcoxon se folosete atunci cnd subiecii sunt evaluai de dou ori pe o scal
de interval, iar variabilele nu ntrunesc condiiile pentru utilizarea testului t al diferenelor
pentru eantioane independente. Testul utilizeaz proceduri de tip neparametric i apeleaz la
diferenele dintre valorile-pereche i la ordonarea lor.

226

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

XV.7. Scoruri nerelaionate: Testul U Mann-Whitney.


Pentru procesarea unui test nonparametric pentru scoruri necorelate, vom
folosi datele din tabelul urmtor, care indic scoruri ale emotivitii obinute de
10 copii care provin din familii biparentale i 10 copii care provin din familii
monoparentale.
Familii
biparentale
monoparentale

12

18

14

10

19

15

11

10

13

13

14

12

11

Pasul 1:
- este acelai ca i cel prezenta la capitolul XI.

Pasul 2:
Se selecteaz:
Analyze
Nonparametric tests
Legacy dialog
2 Independent Samples
Pasul 3:
Se selecteaz Emotivitate i
se apas butonul
pentru a introduce parametrul
Emotivitate n caseta Test
Variable List.
Se selecteaz Familie i se
apas butonul pentru a
introduce Familie n caseta
227

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Grouping Variables.
Se selecteaz Define Groups

Pasul 4:
Se scrie 1 (pentru un singur printe) n c
aseta de lng Group 1.
Se scrie 2 (pentru 2 prini) n caseta de
lng Group 2.
Se selecteaz Continue.
Se apas OK din ecranul anterior care va
reaprea.
*Testul Mann-Whitney este utilizat pentru testarea diferenelor dintre grupuri independente
pentru care variabila dependent este exprimat n valori ordinale (de rang) sau atunci cnd nu
suport un test parametric (testul t). (Popa, 2008, p. 333).

XV.8. Interpretarea output-ului pentru testul U MannWhitney.

Se poate ignora primul dintre cele dou tabele de output. Acest tabel
indic faptul c rangul mediu dat parametrului Emotivitate pentru primul grup
(adic valoarea 2) este 13,15, iar rangul mediu pentru al doilea grup (adic
valoarea 1) este de 7,85. Aceasta nseamn c valorile din grupul 2 (biparentale)
au tendina s fie mai mari dect cele din grupul 1 (monoparentale).

228

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Al doilea tabel indic statistica de baz mann-Whitney, valoarea U fiind de


23,500, ceea ce este semnificativ din punct de vedere statistic la un nivel de
0,043.
Computerul a listat i un scor Z de -2,011, care este semnificativ la nivel de
0,044.
Aceasta este valoarea Testului Mann-Whitney atunci cnd se aplic o corecie
pentru ranguri nrudite. Dup cum se poate vedea, aceasta a modificat nivelul
de semnificaie doar marginal, de la 0,44 la 0,44.

XV.9 Raportarea output-ului pentru Testul U MannWhitney.


Rezultatele obinute n urma acestei analize se pot raporta astfel: Testul
U Mann-Whitney a concluzionat c scorurile emotivitii la copii din fa,iliile cu
doi prini sunt semnificativ mai mari dect la cei din familiile cu un singur
printe (U=23,5, N1,2=10, p two-tailed p= 0,044).
Testul Man-Whitney se aplic ragurilor pe care le au datele i este sensibil la numrul
de cazuri.
Este un test statistic pentru date ordinale i se utilizeaz atunci cnd (Popa, 2008):
- Variabila dependent este exprimat pe scal de tip ordinal;
- Variabila dependent este msurat pe scal de interval/raport aici are loc o
transformare de rang, adic, se nlocuiete fiecare valoare a distribuiei cu poziia pe
care o are n cadrul distribuiei, sub aspectul ordinii de mrime.

229

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

XVI.

Analiza de varian (ANOVA).


Introducere n metoda one-way ANOVA
cu scoruri nerelaionate sau necorelate.

_________________________________________________________________________________________________________________

Analiza de varian cu scoruri nerelaionate/necorelate indic msura n


care cteva (dou sau mai multe) grupuri au medii foarte diferite.
*Grupurile diferite aparin variabilei independente iar valorile numerice corespund
variabilei dependente.

Analiza de varian calculeaz variaia dintre scoruri i pe cea dintre


mediile eantioanelor.
One way ANOVA este folosit pentru testare pentru diferenele ntre
dou sau mai multe grupe independente. ANOVA este utilizat pentru a testa
diferene ntre cel puin trei grupuri, deoarece cele dou grupuri de caz pot fi
acoperite de u un T-test.
De fapt, testul t independent este un tip special de ANOVA simpla n care
sunt implicate doar doua grupe. ANOVA simpla permite evaluarea ipotezei nule
ntre mediile a doua sau mai multe serii de date cu restricia ca acestea sa fie
trepte ale aceleiai variabile independente.

230

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

ANOVA simpla permite compararea simultana a trei sau mai multe


grupe meninnd nivelul la valoarea dorita, de maxim 0,05.
Procesarea analizei one-way de varian cu scoruri nerelaionate este
exemplificat folosind datele din tabelul urmtor, care indic rezultatele obinute
de ctre diferii participani n condiii diferite. Este vorba despre un studiu
asupra efectului unor tratamente hormonale i placebo asupra depresiei.
Astfel, medicamentul este variabila independent i depresia este
variabila dependent.

Date studiu
Grup 1
Grup 2
Tratament hormonal Tratament hormonal
8
4
11
2
8
4

Grup 3
Placebo
4
6
4

XVI.1. Metoda one-way ANOVA pentru eantioane


independente.
Pasul 1:
Se introduc datele.
Se codific cele trei
condiii cu valorile 1, 2, 3.
Se eticheteaz Hormon 1,
Hormon 2 i Placebo.
Pasul 2:
Se selecteaz:
Analyze
Comparea Means
231

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

One-Way ANOVA.

Pasul 3:
Se selecteaz depresie i se
apas butonul de lng caseta
Dependent List pentru a
introduce parametrul n caset.
Se selecteaz Condiie i se
apas butonul de lng caseta
Factor pentru a introduce
parametrul acolo.
Se selecteaz Options

Pasul 4:
Se selecteaz metodele statistice descriptive
i Homogenity of variance test.
Se selecteaz Continue.
Se apas OK din ecranul anterior, care va
reaprea.

XVI.2. Interpretarea output-ului.

Primul tabel ofer diferite statistici descriptive, cum ar fi numrul de


cazuri, media i abaterea standard n cele trei condiii i pe eantionul total.

232

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Al doilea tabel ofer rezultatele Testului Levene al similaritii varianelor. Acest


test nu este semnificativ deoarece are o semnificaie de 0,441.

Al treilea tabel indic rezultatele analizei de varian. Raportul F este


semnificativ la nivel de 0,00, acesta fiind mai mic dect 0,05.
Raportul F se calculeaz prin mprirea sum of square (suma
ptratelor abaterilor de la medie) dintre grupe, este mprit suma ptratelor de
la media din interiorul grupelor (sum of squares groups)m ceea ce d un Raport
F de 13,941 (20,333/0,889 = 13,941).
Aceasta nseamn c exist o diferen semnificativ ntre cele trei
grupuri.

XVI.3. Raportarea ouput-ului.


Rezultatele obinute pot fi raportate astfel: Per total, efectul tratamentului
cu medicamente a fost semnificativ (F2,6 = 13,94, p= 0,00). n schimb, nu a
existat nicio diferen semnificativ ntre media controlului placebo i media
tratamentului hormonal 2.

233

Mihaela Rus

XVII.

Elemente de statistic aplicat

Mihaela Sandu

Analiza de varian bifactorial pentru


scoruri nerelaionate/necorelate.

_________________________________________________________________________________________________________________

Analiza two-way de varian permite compararea mediilor unei variabile


dependente atunci cnd exist dou variabile independente.
Dac exist mai mult de o variabil dependent, atunci analiza se
realizeaz separat pentru fiecare variabil.
Realizarea unei analize two-way pentru scoruri nerelaionate de varian
este exemplificat n tabelul urmtor, care indic scorurile obinute de ctre
diferii participani n ase condiii, reflectnd cei doi factori ai privrii de somn
i alcool. Scopul acestei analize este acela de a aprecia dac diferitele combinaii
de cafea i deprivare de somn afecteaz difereniat numrul mediu de greeli
fcute.
Datele pentru un experiment referitor la privarea de somn:
Numrul de erori n cazul unui test video.

Consum alcool

Fr alcool

3 ore
14
10
15
9
9
12

privare de somn
6 ore
16
14
23
11
8
234
11

9 ore
20
22
30
10
14
12

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

XVII.1. Metoda two-way ANOVA pentru scoruri


nerelaionate.
Pasul 1:
Se introduc datele. Cele ou coduri pentru
Alcool (1=alcool; 2= fr alcool) n prima
coloan.
Cele trei coduri pentru Privare de somn se
regsesc n a doua coloan (1= 3 ore, 2= 6 ore,
3= 9 ore).
Greelile sunt prezentate n a treia coloan.
Se elimin cele dou zecimale din mediul
Variable View.
Pasul 2:
Se selecteaz:
Analyze
General Linear Model
Univariate

Pasul 3:
Se selecteaz Erori i se apas butonul
de lng caseta Dependent Variable
pentru a introduce parametrul acolo.
Se selecteaz Alcool i Privare de
somn fie mpreun, fie separat, i se
apas butonul Fixed factor(s) pentru
a le introduce n caset.
Se selecteaz Options

235

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Pasul 4:
Se selecteaz Descriptives
statistics i Homogeneity test.
Se selecteaz Continue.
n ecranul anterior, care va
reaprea, se selecteaz Plots.
Pasul 5:
Se selecteaz Alcool i se apas
butonul de lng caseta
Horizontal axis pentru a
introduce parametrul acolo.
Se selecteaz Privare de somn i
se apas butonul de lng caseta
Separate Lines - pentru a
introduce opiunea n caset.
Se selecteaz Add
.
Se selecteaz Continue.

Se apas OK din ecranul anterior


care va reaprea-

XVII.2. Interpretarea output-ului.


Acest tabel conine
mediile , abaterile
standard i numrul

236

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

(N) de cazuri pentru cele dou variabile Alcool i Privare de somn. Luate
separat sau mpreun.
Media pentru condiia Alcool este comparat cu Totalul pentru
Privare de somn (adic 18,22). Media pentru privare de 3 ore de somn este
comparat cu Total pentru Alcool (adic 11,50).
Al treilea tabel de ofer
informaii referitoare la Testul
Levene, care verific
similaritatea varianelor. Din
moment ce semnificaia acestui
test este 0,085 (valoarea care este
mai mare dect 0,05), varianele
sunt similare
Al patrulea
tabel indic
nivelele de
semnificaie
pentru cele dou
variabile
Alcool i
Privare de
somn, i
interaciunea
dintre acestea.
n tabelul de analiz a varianei, raportul F pentru cele dou efecte principale
(Alcool i Privare de somn) este prezentat primul.
Pentru prima variabil, cea a alcoolului, Raportul F este 22,891, ceea ce este
semnificativ la nivelul 0,000. Deoarece sunt numai dou condiii pentru ca acest
efect s se produc, se poate conhide c scorul mediu al uneia dintre condiii
este mult mai mare dect pentru cealalt.
Pentru a doua variabil a privrii de somn, aceasta este egal cu 5,797,
valoare care are un nivel exact de semnificaie de 0,017. Astfel, Raportul f este
semnificativ din punct de vedere statistic la un nivel de 0,05, ceea ce nseamn
c mediile celor trei condiii legate de somn nu sunt similare.

237

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Mediile care difer de celelalte pot fi determinate ulterior prin folosirea


testelor de comparaii multiple, cum este Testul t pentru eantioane
independente.
raportul F pentru interaciunile dintre cele dou variabile (Alcool i Privare

E
s
t
i
m
a
e
d
M
a
r
g
i
n
a
l
M
e
a
n
s
o
f
e
r
o
i
p
r
i
v
a
e
d
s
o
m
n
3
r
e
,2
2
5
0
6
9
o
0
,

de somn) este de 2,708 nivelul de semnificaie al acestui raport este de


0,107 nu este nicio interaciune semnificativ.

Acest grafic este realizat pentru mediile celor ase condiii. El a fost editat
cu ajutorul comenzii Chart Editor.

,1
1
7
5
0
,1
5
0
,1
2
5
0
0
,a
lco fa
rlco
XVII.3. Raportarea output-ului.

Rezultatele din output se pot raporta astfel: O analiz de varian two-way


ANOVA demonstreaz obinerea unor efecte semnificative n cazul alcoolului (F
= 22,981, p< 0,001) i al privrii de somn (F=5,80, p = 0,017), dar nu i n cazul
interaciunii celor dou variabile (F =2,70, p= 0,107).

238

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

XVIII. Comparaii multiple cu ANOVA.


_________________________________________________________________________________________________________________

Acest capitol extinde aria de acoperire a Testelor t multiple prezentate n


capitolele anterioare i explic modul n care se decide care perechi de medii
sunt diferite n mod semnificativ ntre ele, n cazul analizei de varian.
Aceast tehnic se folosete atunci cnd sunt mai mult de dou medii.
Pentru a prezenta aceast procedur vor fi folosite informaiile prezentate
la capitolul XV.
Date studiu
Grup 1
Grup 2
Tratament hormonal Tratament hormonal
8
4
11
2
8
4

Pasul 1:
Se introduc datele.
Se codific cele trei
condiii cu valorile 1, 2, 3.
Se eticheteaz Hormon 1,
Hormon 2 i Placebo.
Pasul 2:
Se selecteaz:
Analyze
Comparea Means
One-Way ANOVA.

239

Grup 3
Placebo
4
6
4

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Pasul 3:
Se selecteaz depresie i se
apas butonul de lng caseta
Dependent List pentru a
introduce parametrul n caset.
Se selecteaz Condiie i se
apas butonul de lng caseta
Factor pentru a introduce
parametrul acolo.
Se selecteaz Post Hoc
Pasul 4:
Se selecteaz:
Tukey
Duncan
Scheffe.
Se apas
Continue.
Se selecteaz OK n
ecranul care va aprea
din nou.

XVIII.1. Interpretarea output-ului.

Primul tabel reprezint rezultatele analizei de varian. Raportul F pentru


efectul dintre grupuri (adic efectul hormonilor) este 13,941, care are un nivel

240

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

exact de semnificaie de 0,006. Acest lucru nseamn c efectul dintre grupuri


este semnificativ; per total, mediile pentru cele trei grupuri difer.
Al doilea tabel i ultimul ofer rezultatele celor trei teste de comparaii
multiple.

Dac se folosete Testul Tukey al diferenei semnificative oneste


(HSD), media de la grupul hormonului 1 este semnificativ diferit de media de
la grupul hormonului 2 (semnificaia=0,06) i semnificaia de la media grupului
Controlului placebo (semnificaia=0,020).
Subgrupele omogene.
Grupul hormonului 2 i al
controlului Placebo
aparin aceleiai
subgrupe, ceea ce
nseamn c nu sunt
semnificativ diferite.
Grupul hormonului 1 este
singurul din aceast a
doua subgrup, motiv
pentru care aceasta este
semnificativ diferit de
mediile celorlalte dou
grupe.
* Sunt reprezentate mediile grupelor din subgrupele omogene.
a. Folosete Media armonic a dimensiunilor eantioanelor
=3,000.
241

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

Tabelul final, numit Subgrupele omogene, enumer grupurile de medii care


nu sunt semnificativ diferite ntre ele.
Dac se ia n calcul aceste dou rnduri pentru a se folosi n Testul Tukey HSD,
n acest caz exist dou subgrupe de medii. Subgrupa 1 indic faptul c mediile
grupelor hormonului 2 i ale controlului placebo cu valorile 3,33 i 4,67 nu
difer semnificativ. Subgrupa 2 conine doar media grupei hormonului 1, n
valoare de 9,00. Astfel, media grupului hormonului 1 este semnificativ diferit
att de media grupei hormonului 2, ct i de cea a gupelor de control placebo.
Toate cele trei teste prin comparaii multiple sugereaz acelai lucru: faptul c
exist diferene semnificative ntre grupele hormonului 1 i hormonului 2 i ntre
grupele hormonului 1 i cele ale controlului placebo. Alte diferene nu mai
exist.

XVIII.2. Raportarea output-ului.


Rezultatele output-ului pot fi raportate astfel: O analiz de varian
unifactorial pentru scoruri necorelate

a demonstrat producerea unui efect

general semnificativ pe tip de tratament medicamentos (F=13,94, p= 0,06). Prin


Metoda Scheffe de analiz a intervalului s-a descoperit c grupul hormonului 1
era diferit de grupul hormonului 2 (p= 0,07) i de grupul controlului placebo
(p=0,24), dar nu s-au mai gsit alte diferene semnificative.

242

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

XIII.2. Alegei rspunsul corect

1.
a.
b.
c.

Calculul variabilelor noi:


adunarea i scderea;
nmulirea i mprirea;
ambele variante de mai sus.

2. Analiza de varian (ANOVA):


a. indic msura n care dou sau mai multe grupuri au medii foarte
diferite;
b. calculeaz variaia dintre dou scoruri;
c. calculeaz variaia dintre mediile eantionului.
3.
a.
b.
c.

ANOVA este utilizat pentru:


a testa diferena ntre cel puin 2 grupuri;
a testa diferena ntre cel puin 3 grupuri;
a testa diferena ntre cel puin 4 grupuri;

4. Analiza two-way de varian permite:

a. compararea mediilor unor variabile independente;


b. compararea mediilor dintre dou grupuri;
c. compararea mediilor unei variabile dependente atunci cnd exist
dou variabile independente.
5. Comparaiile multiple cu ANOVA:
a. explic modul n care se decise care perechi de medii sunt diferite
n mod semnificativ ntre ele;
b. se folosete atunci cnd sunt mai mult de dou medii;
c. indic scorurile obinute de respondeni.

243

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

XIII.3. Rspunsuri corecte

1. c. ambele variante de mai sus.


2. a. indic msura n care dou sau mai multe grupuri au medii foarte
diferite;
3. b. testa diferena ntre cel puin 3 grupuri;
4. c. compararea mediilor unei variabile dependente atunci cnd exist
dou variabile independente.
5. a. explic modul n care se decise care perechi de medii sunt diferite
n mod semnificativ ntre ele;
b. se folosete atunci cnd sunt mai mult de dou medii;

244

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

BIBLIOGRAFIE

1. Andrei, T; Stancu, S; 1995 Statistic. Teorie i aplicaii,

Ed. All,

Bucureti;
2. Benea, M, Munteanu, G , 2007 Elemente de statistic economic i
social, Ed. Andrei aguna, Constana;
3. Clocotici V., Stan A., 2001 Statistica aplicat n psihologie, Ed.
Polirom, Iai;
4. Dennis H., Duncan C., 2006 Introducere n SPSS pentru psihologie, Ed.
Polirom, Iai;
5. Howell, D, (2002), Statistical Methods for Psychology, Ediia a v-a,
Duxbury Press Boston;
6. Jaba E., Gramma A., (2004) Analiza statistic cu SPSS sub Windows,
Ed. Polirom, Iai;
7. Jaba E., Pintilescu C., 2005 Statistica teste gril i probleme, Ed.
Sedcom Libris, Iai;
8. Opariuc-Dan, Cristian, 2009 - "Statistica aplicata in stiintele socioumane. Notiuni de baza - Statistici univariate" Editura ASCR, ClujNapoca;
9. Radu I. i coord., 1993 Metodologie psihologic i analiza datelor, Ed.
Sincrom, Cluj Napoca;
10.Rotariu T. i coord., 2006 Metode statistice aplicate n tiinele sociale,
Ed. Polirom, Iai;
11.Sava, F. A. 2004. Analiza datelor n cercetarea psihologic. Metode
statistice complementare. Cluj-Napoca : ASCR;
12. ian, E, Ghi, S,, Tranda, C, 2003 Bazele statisticii, Ediia a 2-a, Ed.
Meteor Press, Bucureti;
245

Mihaela Rus

Elemente de statistic aplicat

Mihaela Sandu

13. Vasilescu, Ilie P., 1992 Statistic informatizat pentru tiinele despre
om, Ed. Militar, Bucureti;
14.Voineagu, V; Mitru, C; Isaic-Maniu, Al, .a, 2004 Statistica, Ed.
Universitar, Bucureti;
15.Voineagu, V; Mitru, C; Isaic-Maniu, Al, .a, 1998 Statistic teoretic i
economic. Lucrri practice, teste i studii de caz,

Ed. Economic,

Bucureti;
16.Voineagu, V; ian, E, 2004 Sondaje i anchete, vol. 1 i II, Ed.
Fundaiei Andrei aguna, Constana.

246

S-ar putea să vă placă și