Sunteți pe pagina 1din 131

1

UNIVERSITATEA ALEXANDRU IOAN CUZA IAI


FACULTATEA DE ECONOMIE I ADMINISTRAREA
AFACERILOR


CARMEN PINTILESCU
DNU JEMNA
DANIELAVIORIC
VIORICA CHIRIL



BAZELE STATISTICII



Suport de curs I.D.







- 2013 2014 -

3
CUPRINS

Introducere ...................................................................................................... ... 2

Partea nti Metode de analiz statistic descriptiv
US1 Noiuni Fundamentale ............................................................................ ... 4
1.1 Date statistice 5
1.2 Variabile statistice 5
1.3 Uniti statistice 8
1.4 Distribuii statistice 8

US2 Analiza unei serii statistice discrete .................................. ..................... ... 15
2.1 Analiza grafic 16
2.2 Analiza numeric. Indicatori ai statisticii descriptive 25
2.3 Aplicaie n SPSS 62

US3 Analiza unei serii statistice continue ..................................................... ... 67
3.1 Analiza grafic 68
3.2 Analiza numeric. Indicatori ai statisticii descriptive 71
3.3 Aplicaie n SPSS 82

US4 Analiza unei serii statistice calitative .................................................... ... 87
4.1 Analiza grafic 88
4.2 Analiza numeric 88
4.3 Aplicaie n SPSS 91

Partea a doua Metode de analiz statistic inferenial
US5 Noiuni fundamentale ............................................................................. ... 93
5.1 Probabiliti. Variabile aleatoare. Distribuii probabiliste 94
5.2 Selecie. Eantion. Variabile aleatoare de selecie 100
5.2 Parametri,estimatori, estimaii. Distribuii de selecie ............. 101
5.3 Statistici frecvent utilizate n cercetrile prin sondaj 102

US6 Estimarea parametrilor unei populaii ................................................. ... 107
6.1 Estimarea punctual 108
6.2 Estimarea prin interval de ncredere 109

US7 Testarea ipotezelor statistice .................................................................. ... 117
7.1 Etapele procesului testrii statistice 118
7.2 Testarea ipotezelor privind un parametru 119

Anexe ............................................................................................................... ... 133

Bibliografie ..................................................................................................... ... 135


4
PARTEA NTI METODE DE ANALIZ STATISTIC DESCRIPTIV


US 1. NOIUNI FUNDAMENTALE



Cuprins
1.1 Date statistice
1.2 Variabile statistice
1.3 Uniti statistice
1.4 Distribuii statistice


Obiective
- definirea conceptelor fundamentale specifice statisticii;
- prezentarea de exemple pentru fiecare concept;
- familiarizarea studenilor cu sursele de date statistice oficiale.


Competene
- nsuirea noiunilor fundamentale necesare utilizrii metodelor statistice de prelucrare a datelor;
- nelegerea diferenei dintre metodele descriptive i cele infereniale;
- dobndirea competenelor practice de accesare i interogare a bazelor de date statistice oficiale.


Termen mediu: 2 h


Bibliografie

1. Andrei, T. i Stancu, S., Statistic - teorie i aplicaii , Editura All, Bucureti, 1995
2. Jaba, E., Statistica, Ediia a treia, Editura Economica, Bucureti, 2002
3. McNabb, D., Research methods in public administration and nonprofit management:
quantitative and qualitative approaches, Armonk, M.E. Sharpe, 2002
4. Mcneill, P., Research methods, London, Routledge, 2005
5. Rosental, C. and C. Frmontier-Murphy, Introduction aux mthodes quantitatives en sciences
humaines et sociales, Paris, Dunod, 2001
6. Wonnacott, T.H., Wonnacott, R.J., Statistique, Economica, Paris, 1991.

5

Cursul de Bazele statisticii impune studiul unor noiuni fundamentale, cum ar fi: datele
statistice, variabilele statistice, distribuiile statistice.

1.1. Date statistice. Metode statistice

n sensul cel mai larg, datele statistice reprezint rezultatul activitii desfurate de
instituia de statistic, cercettori sau de firme specializate care i public rezultatele n rapoarte
sau lucrri de cercetare, care apoi sunt diseminate publicuui interesat. Asemenea rezultate apar n
tabele sau sub form grafic, pot lua o form numeric sau nenumeric. n sens restrns, datele
statistice se refer strict la procesul de msurare a realitii economice i sociale. Procesul de
sintetizare, prelucrare i analiz se traduce apoi n rezultate sintetice, n informaii care au deja un
coninut cognitiv datorat interpretrii i corelrii rezultatelor.
Specificul datelor statistice este acela c ele se refer la populaii statistice, adic la
colectiviti reale de uniti bine delimitate formate din obiecte, persoane, fapte, evenimente,
procese din lumea real. Acestea se obin ca urmare a unui proces de observare direct, adic se
obin prin msurarea realitii acolo unde ea se manifest. n general, populaiile statistice respect
o condiie de volum adic sunt suficient de numeroase, pentru a respecta o serie de legi ale
statisticii, astfel nct rezultatele s fie consistente.
Pentru explorarea tipurilor de date statistice oferite de sursele oficiale, studenii vor
parcurge paginile Institutului Naional de Statistic (www.insse.ro) i ale EUROSTAT
(www.ec.europa.eu/eurostat).
Metodele statistice de prelucrare a datelor sunt metode de cercetare care au la baz datele
statistice. Este vorba despre un set de instrumente care permit exploatarea datelor statistice
pentru a obine o informaie sub forma indicatorilor statistici sau a unor rezultate mai elaborate
cum ar fi estimaiile sau modelele care explic dependena dintre fenomene.
La nivelul acestui curs, studenii sunt introdui n cunoaterea i aplicarea a dou categorii
de metode statistice de baz: metode statistice descriptive i infereniale.
Metodele descriptive se refer la obinerea informaiei cantitative cu ajutorul unor
indicatori statistici care sintetizeaz informaia de la nivelul tuturor unitilor statistice analizate.
Aceast informaie se refer la ntreaga populaie sau colectivitate analizat i se prezint sub
form grafic, tabelar i a indicatorilor descriptivi.
Metodele infereniale au la baz ideea culegerii datelor, a prelucrrii i analizei acestora de
la nivelul unui eantion reprezentativ extras din populaiie dup un procedeu tiinific
corespunztor. Rezultatele obinute la nivelul eantionului sunt apoi extrapolate la nivelul
populaiei totale, n condiii de calitate specificate. Obiectivul principal al accestor metode este
estimarea unor parametri i testarea unor ipoteze care privesc realitatea analizat.

1.2. Variabile statistice

1.2.1. Definiie i notaii
Variabila statistic este o caracteristic, o nsuire a unor uniti statistice, care
nregistreaz o anumit valoare, pentru fiecare unitate statistic observat.

Exemple
- dac se consider ansamblul firmelor din judeul Iai care desfoar activitate de
producie, variabilele statistice care pot reprezenta un interes pentru cercetarea statistic sunt:
valoarea vnzrilor, numrul de salariai, cifra de afaceri, mrimea firmei etc.
6
- dac se consider ansamblul studenilor unei serii, variabilele statistice care pot fi supuse
analizei statistice sunt: vrsta studenilor, sexul persoanei, nota obinut la un examen, etc.

O variabil statistic este notat cu X. Valorile sau variantele variabilei X se noteaz cu x
i
.
Din punct de vedere formal, avem: m , 1 i cu ), x ( : X
i
= .

1.2.2. Clasificarea variabilelor statistice
Variabilele statistice pot fi clasificate dup mai multe criterii:
1. Dup modul de exprimare, distingem:
- variabile cantitative sau numerice sunt acele variabile pentru care valorile sunt
exprimate numeric.
Exemple: vrsta persoanelor, ctigul salarial, nlimea etc.

- variabile calitative, nenumerice sau categoriale sunt acele variabile pentru care
valorile sunt exprimate prin cuvinte.
Exemple: sexul persoanei (masculin i feminin), starea civil (celibatar, cstorit, vduv,
divorat), mediul de reziden (urban, rural) etc.
Pentru analiza statistic, valorilor variabilei categoriale li se atribuie un cod numeric.
Variabilele calitative pot fi nominale sau ordinale.
Variabilele nominale sunt acele variabile pentru care ordinea acordrii codurilor nu are un
sens.
Exemple: pentru variabila X: Sexul persoanei, se pot acorda codurile 1 pentru varianta
Masculin i 2 pentru varianta Feminin, fr s se poat stabili o relaie de ordine ntre aceste dou
valori.
Un caz particular al variabilelor nominale este reprezentat de variabilele alternative sau
dummy. n acest caz, valorile acordate categoriilor acestor variabile sunt, de regul, 1 (pentru
unitile care posed o anumit caracteristic) i 0 (pentru celelalte uniti statistice).
De exemplu, ntr-un studiu cu privire la nivelul de dezvoltare economic a rilor Uniunii
Europene (UE), apreciat prin PIB/locuitor, se poatre crea o variabil dummy cu dou valori: 1-
pentru rile UE care erau nainte de extinderea Uniunii n Europa Central i de Est, i 0 pentru
celelalte ri. Analiza statistic poate, n acest caz, evidenia diferenele de dezvoltare economic
existente ntre aceste dou grupe de ri.

Variabilele ordinale sunt acele variabile n care exist o relaie de ordine ntre unitile din
categoriile variabilei. Ordinea acordrii codurilor diferitelor categorii ale variabilei X are, n acest
caz, un sens.
Exemple: pentru variabila X: Preferina pentru un produs, cu variantele Foarte bun, Bun,
Nici bun-nici ru, Foarte ru, Ru, ordinea acordrii codurilor are un sens. Valorile variabilei X
sunt 1- Foarte bun, 2- Bun, 3- Nici bun-nici ru, 4 - Foarte ru, 5-Ru.

2. Dup modul de manifestare a variaiei lor, distingem:
- variabile discrete sunt acele variabile care nu pot lua dect valori finite din domeniul
de valori al variabilei.
Exemple: variabilele Numrul de angajai, Numrul de omeri, Numrul de copii pe
familie etc.

- variabile continue sunt acele variabile care pot lua o infinitate de valori din domeniul
de valori al variabilei.
7
Exemple: variabilele nlimea, Greutatea, Viteza etc.

1.2.3. Scale de msur
n vederea msurrii unei variabile pentru o unitate statistic, valorilor unei variabile li se
atribuie coduri sau numere. Scala este reprezentat de aceste coduri sau numere atribuite valorilor
variabilei X.
n statistic se folosesc patru tipuri de scale:
a) scale pentru msurarea variabilelor calitative: scala nominal i scala ordinal;
b) scale pentru msurarea variabilelor cantitative: scala interval i scala raport.

a) Scale pentru msurarea variabilelor calitative

Scala nominal este o scal care presupune atribuirea de coduri variantelor unei variabile
calitative nominale. Aceste coduri nu au dect rolul de a realiza o separare a unitilor statistice pe
clase sau grupe. Ordinea acordrii acestor coduri nu are un sens. Pe aceast scal de msurare, nu
este posibil realizarea operaiilor de adunare, scdere etc.

Exemplu
- pentru variabila Sexul persoanei, codurile care se atribuie valorilor acestei variabile
sunt, de exemplu, 1 - pentru unitile statistice de sex masculin, 2- pentru unitile
statistice de sex feminin. Ordinea acordrii acestor coduri nu are un sens, ceea ce
nseamn c se poate atribui codul 1 - pentru unitile statistice de sex feminin i codul
2- pentru unitile statistice de sex masculin. Pentru aceast variabil statistic,
singurele operaii care pot fi realizate privesc doar frecvenele sau numrul de uniti
statistice. De exemplu, poate fi identificat categoria care are frecvena cea mai mare,
ns nu poate fi calculat media aritmetic, deoarece valorile codurilor sunt arbitrare.

Scala ordinal este o scal care presupune atribuirea de coduri variantelor unei variabile
calitative ordinale. Scala ordinal introduce relaia de ordine ntre valorile acestor coduri. Pe
aceast scal de msurare, este posibil realizarea operaiilor specifice variabilelor nominale, dar
i a operaiilor care au la baz relaia de ordine.

Exemplu
- pentru variabila Nivelul de educaie cu variantele Studii primare, Studii gimnaziale,
Studii liceale, Studii superioare, codurile care se atribuie valorilor acestei variabile
sunt, de exemplu, 1 - Studii primare, 2 - Studii gimnaziale, 3 - Studii liceale, 4 - Studii
superioare. Ordinea acordrii acestor coduri are, n acest caz, un sens. Pentru aceast
variabil statistic, poate fi identificat categoria care are frecvena cea mai mare, dar
i numrul de uniti care au studii primare, gimnaziale i liceale.

b) Scale pentru msurarea variabilelor cantitative

Scala interval este o scal care se folosete pentru o variabil cantitativ. Diferena dintre
dou valori are, n acest caz, un sens. Scala interval se caracterizeaz printr-o valoare zero, fixat,
ns, arbitrar: valoarea zero nu arat absena unui fenomen, ci doar trecerea de la o stare la alte.
De aceea, raportul dintre dou valori nu are sens n cazul scalei interval.

Exemplu
8
Dac se consider temperatura exprimat n grade Celsius, diferena dintre valorile 20
0
i
10
0
are aceeai semnificaie ca diferena dintre valorile 30
0
i 20
0
. Temperatura de 20
0
de grade,
de exemplu, nu arat ns faptul c aceasta este o temperatur de dou ori mai mare dect
temperatura de 10
0
. De aceea, raportul dintre dou valori n cazul scalei interval nu are sens.

Scala raport este folosit pentru variabilele numerice i are ca proprietate faptul c
posed un zero absolut. Valoarea zero arat, n acest caz, absena unui fenomen. n cazul acestei
scale sunt posibile toate operaiile aritmetice.

Exemplu
Dac se consider greutatea unor persoane, diferena i raportul dintre dou valori au un
sens. O greutate de 50 kg este de dou ori mai mare dect greutatea de 25 de kg. Valoarea zero
arat absena greutii pentru unitatea respectiv.

1.3. Uniti statistice
Unitile statistice sunt elementele componente ale unei populaii statistice sau ale unui
eantion. Suma unitilor statistice formeaz volumul populaiei, notat cu N, sau a eantionului,
notat cu n.

1.4. Distribuii statistice
Plecnd de la un ir de valori ale unei variabile X nregistrate pentru un ansamblu format
din n uniti, se poate realiza o grupare a acestor valori, prin construirea unei distribuii de
frecven.
O distribuie sau o serie statistic presupune ordonarea valorilor variabilei X i
determinarea frecvenei de apariie, a numrului de uniti pentru fiecare valoare x
i
a variabilei.
Frecvena de apariie este notat cu n
i
.

1.4.1. Distribuii statistice pentru variabile cantitative discrete
Distribuia statistic pentru o variabil discret presupune realizarea unei grupri a
valorilor variabilei X pe variante de variaie i determinarea frecvenei de apariie a fiecrei
variante x
i
. Forma de prezentare a unei distribuii statistice pentru o variabil discret este
prezentat n tabelul de mai jos:

Tabelul 1.1. Forma general a unei distribuii
pentru o variabil discret
x
i
n
i

x
1
n
1

x
2
n
2


x
i
n
i


x
m
n
m

TOTAL

=
i
i
n n

Exemplu
Pentru cele 42 judee ale Romniei (inclusiv municipiul Bucureti), rata omajului este
prezentat n tabelul de mai jos. Se cere s se formeze distribuia de frecven.

9
Tabelul 1.2. Rata omajului n judeele Romniei, n anul 2010
Judeul Rata omajului
(%)
Judeul Rata omajului
(%)
Judeul Rata omajului
(%)
Alba 10,0 Constana 5,8 Mure 8,0
Arad 5,2 Covasna 10,0 Neam 7,7
Arge 7,6 Dmbovia 8,5 Olt 8,2
Bacu 7,8 Dolj 9,8 Prahova 8,6
Bihor 5,9 Galai 10,4 Satu-Mare 6,1
Bistria-Nsud 6,4 Giurgiu 8,4 Slaj 8,4
Botoani 6,4 Gorj 10,1 Sibiu 5,8
Braov 7,2 Harghita 8,8 Suceava 7,3
Brila 8,7 Hunedoara 8,5 Teleorman 10,9
Municipiul
Bucureti
2,3 Ialomia 9,9 Timi 3,7
Buzu 9,7 Iai 7,0 Tulcea 8,1
Cara-Severin 9,0 Ilfov 2,7 Vlcea 7,7
Clrai 8,8 Maramure 6,0 Vaslui 11,8
Cluj 4,9 Mehedini 10,5 Vrancea 7,4
Sursa: Anuarul Statistic al Romniei, anul 2011, www.insse.ro, accesat pe 1 noiembrie 2012.

Rezolvare
Variabila statistic X este reprezentat de Rata omajului, iar variantele variabilei X sunt
valorile x
i
prezentate n tabelul 1.2.
Pentru formarea distribuiei de frecven, se ordoneaz valorile variabilei X n sens
cresctor i se determin frecvena de apariie (numrul de judee care nregistreaz aceeai
valoare a ratei omajului), n
i
, a fiecrei variante x
i
. Rezultatele sunt prezentate n tabelul de mai
jos:
10

Tabelul 1.3. Distribuia judeelor Romniei dup rata omajului n anul 2010
Rata omajului
x
i

Frecvena de apariie
n
i

2,3 1
2,7 1
3,7 1
4,9 1
5,2 1
5,8 2
5,9 1
6,0 1
6,1 1
6,4 2
7,0 1
7,2 1
7,3 1
7,4 1
7,6 1
7,7 2
7,8 1
8,0 1
8,1 1
8,2 1
8,4 2
8,5 2
8,6 1
8,7 1
8,8 2
9,0 1
9,7 1
9,8 1
9,9 1
10,0 2
10,1 1
10,4 1
10,5 1
10,9 1
11,8 1
TOTAL 42

1.4.2. Distribuii statistice pentru variabile cantitative continue
Pentru construirea unei distribuii statistice dup o variabil continu, de regul, se
definesc intervale de variaie (x
i-1
, x
i
). Considernd cazul intervalelor egale de variaie, pentru
formarea distribuiei de frecven se parcurg urmtoarele etape:
- se calculeaz mrimea intervalelor de grupare, dup relaia:
11
k
x x
k
A
l
min max

= = , unde:
A este amplitudinea de variaie a variabilei X, adic diferena dintre nivelul maxim i
nivelul minim al variabilei: A=x
max
-x
min
;
k este numrul de grupe n care se grupeaz datele.
Dac se obine un numr zecimal, mrimea intervalului de grupare se rotunjete
ntotdeauna n plus.
- se formeaz intervalele de grupare;
- se determin frecvena de apariie, n
i
, corespunztoare fiecrui interval de variaie.

Forma de prezentare a unei distribuii statistice pentru o variabil continu este realizat n
tabelul de mai jos:

Tabelul 1.4. Forma general a unei distribuii
pentru o variabil continu
x
i-1
-x
i
n
i

x
o
-x
1
n
1

x
1
-x
2
n
2


x
i-1
-x
i
n
i


x
m-1
-x
m
n
m

TOTAL

=
i
i
n n

Observaie
n cazul variabilelor discrete care prezint un numr mare de valori, pentru o prezentare
sintetic a distribuiei unitilor statistice, se realizeaz, de regul, gruparea acestora pe intervale
de variaie.

Exemplu
n tabelul 1.2. este prezentat distribuia de frecven a judeelor Romniei dup rata
omajului nregistrat n anul 2010. Se cere s se formeze distribuia de frecven pe intervale de
variaie egale, considernd 5 intervale de grupare.

Rezolvare
Variabila statistic X este reprezentat de Rata omajului.
Pentru formarea distribuiei de frecven pe intervale de variaie egale, se parcurg
urmtoarele etape:
- se calculeaz mrimea intervalelor de grupare, dup relaia:
118 2 3
1 9
5
max min
x x A , ,
l ,
k k

= = = = . Mrimea intervalelor de variaie este 1 9 2 l , . = ~
- se formeaz intervalele de grupare. Primul interval de variaie este intervalul (2-4), al
doilea interval este (4-6), etc.
- se determin frecvena de apariie corespunztoare fiecrui interval de variaie.

Rezultatele centralizrii datelor sunt prezentate n tabelul de mai jos:

12
Tabelul 1.5. Distribuia judeelor Romniei
dup rata omajului ( %), n anul 2010
x
i-1
-x
i
(%)
n
i

2-4 3
4-6 6
6-8 12
8-10 16
10-12 5
TOTAL 42
*Not: Limita superioar a fiecrui interval este inclus n intervalul respectiv.

Observaie
Pentru gruparea datelor pe intervale de variaie, exist mai multe variante posibile. Dac
limita superioar a unui interval coincide cu limita inferioar a altui interval, se precizeaz printr-
o not unde a fost inclus acea valoare. n exemplul de mai sus, judeele cu rata omajului egal
cu 4, 6, 8,10 i 12 au fost incluse n intervalele n care aceste valori sunt limite superioare.

1.4.3. Distribuii statistice pentru variabile calitative
Distribuia statistic pentru o variabil calitativ presupune prezentarea categoriilor
variabilei X i determinarea frecvenei de apariie a fiecrei variante.
Forma de prezentare a unei distribuii statistice pentru o variabil calitativ este prezentat
n tabelul de mai jos:

Tabelul 1.6. Forma general a unei distribuii
pentru o variabil categorial
x
i
n
i

x
1
n
1

x
2
n
2


x
m
n
m

TOTAL

=
i
i
n n

Exemplu
Pentru ansamblul judeelor Romniei se nregistreaz regiunea de dezvoltare (Nord-Vest,
Centru, Nord-Est, Sud-Est, Sud, Bucureti-Ilfov, Sud-Vest, Vest) i se obin rezultatele din tabelul
de mai jos. Se cere s se formeze distribuia de frecven.
13
Tabelul 1.7. Distribuia judeelor din Romnia dup regiunea de dezvoltare
Judeul Regiunea de
dezvoltare
Judeul Regiunea de
dezvoltare
Judeul Regiunea de
dezvoltare
Alba Centru Constana Sud- Est Mure Centru
Arad Vest Covasna Centru Neam Nord - Est
Arge Sud Dmbovia Sud Olt Sud-Vest
Bacu Nord - Est Dolj Sud-Vest Prahova Sud
Bihor Nord - Vest Galai Sud- Est Satu-Mare Nord - Vest
Bistria-Nsud Nord - Vest Giurgiu Sud Slaj Nord - Vest
Botoani Nord - Est Gorj Sud-Vest Sibiu Centru
Braov Centru Harghita Centru Suceava Nord - Est
Brila Sud- Est Hunedoara Vest Teleorman Sud
Municipiul
Bucureti
Bucureti-Ilfov Ialomia Sud Timi Vest
Buzu Sud- Est Iai Nord - Est Tulcea Sud- Est
Cara-Severin Vest Ilfov Bucureti-Ilfov Vlcea Sud-Vest
Clrai Sud Maramure Nord - Vest Vaslui Nord - Est
Cluj Nord - Vest Mehedini Sud-Vest Vrancea Sud- Est
Sursa: Anuarul Statistic al Romniei, anul 2011, www.insse.ro, accesat pe 1 noiembrie 2012

Rezolvare
Variabila statistic X este reprezentat de Regiunea de dezvoltare, variabil calitativ
nominal, iar variantele variabilei X sunt x
i
: Nord-Vest, Centru, Nord-Est, Sud-Est, Sud,
Bucureti-Ilfov, Sud-Vest, Vest.
Rezultatele gruprii datelor sunt prezentate n tabelul de mai jos:

Tabelul 1.8. Distribuia judeelor Romniei pe regiuni de dezvoltare
x
i
n
i

Nord-Vest 6
Centru 6
Nord-Est 6
Sud-Est 6
Sud 7
Bucureti-Ilfov 2
Sud-Vest 5
Vest 4
TOTAL 42

14
Teste
1


1) Variabila alternativ:
a) admite alternative n procesul de msurare
b) ia doar dou valori posibile
c) poate fi numeric i categorial

2) Un exemplu de variabil continu este:
a) vrsta
b) numrul de copaci ntr-un parc
c) genul persoanei

3) Distribuia din tabelul de mai jos se refer la o variabil:
x
i-1
-x
i
n
i

5-9 20
9-13 3
13-17 2
17-21 3
21-25 2
TOTAL 30
a) discret
b) continu
c) numeric
d) alternativ

4) Se cunoate c ntr-o coal sunt 210 elevi de gen masculin i 300 de gen feminin. Au loc
rspunsurile:
a) valoarea 210 este o frecven relativ pentru cei de gen masculin
b) informaiile disponibile permit construirea unei distribuii dup o variabil alternativ
c) variabila analizat este calitativ

5) Pentru distribuia din tabelul de mai jos sunt valabile enunurile:
x
i
n
i

2 20
4 30
6 20
8 10
TOTAL 80
a) variabila distribuit este discret
b) populaia are 30 de uniti
c) valoarea 10 este o frecven absolut
d) variabila are patru valori distincte


1
Rspunsuri: 1 b,c; 2 a; 3 b,c; 4 b,c; 5 a,c,d.
15

US 2. ANALIZA UNEI SERII STATISTICE DISCRETE


Cuprins
2.1 Analiza grafic
2.2 Analiza numeric. Indicatori ai statisticii descriptive
2.3 Aplicaie n SPSS


Obiective
- prezentarea tipurilor de frecvene utilizate n analiza uunei serii discrete
- prezentarea tipurilor de grafice specifice unei serii discrete
- definirea indicatorilor descriptivi, a proprietilor, a modului de calcul i a interpretrii acestora
- realizarea de exemple cu date reale
- prezentarea modului de analiz gafic i numeric a unei serii discrete n SPSS


Competene
- nsuirea principalelor metode de analiz grafic i numeric a unei serii discrete
- dezvoltarea abilitilor practice de prelucrare i interpretare a datelor statistice sistematizate ntr-
o serie discret
- dezvoltarea capacitii de utilizare a softului statistic pentru prelucrarea automat a datelor
- capacitatea de a realiza o sintez a informaiei statistice, avnd la dispoziie rezultatele analizei
grafice i numerice

Termen mediu: 4 h


Bibliografie

1. Andrei, T. i Stancu, S., Statistic - teorie i aplicaii , Editura All, Bucureti, 1995
2. Jaba, E., Statistica, Ediia a treia, Editura Economica, Bucureti, 2002
3. Jaba, E., Pintilescu, C., Statistic. Teste gril i probleme, Editura Sedcom Libris, Iai, 2005.
4. Jaba, E., Grama, A., Analiza statistic cu SPSS sub Windows, Ed. Polirom, Iai, 2004
5. Lecaillon, J.; Labrousse, C., Statistique descriptive, Editura Cujas, Paris, 1988
6. Mills, Fr.G., Statistical Methods, 3
rd
ed., Henry Holt, New York, 1955.
7. McNabb, D., Research methods in public administration and nonprofit management :
quantitative and qualitative approaches, Armonk, M.E. Sharpe, 2002
8. Rosental, C. and C. Frmontier-Murphy, Introduction aux mthodes quantitatives en sciences
humaines et sociales, Paris, Dunod, 2001
9. Yule, U.G.; Kendall, M.C. - Introducere n teoria statisticii, Editura tiinific, Bucureti, 1969.
10. Wonnacott, T.H., Wonnacott, R.J., Statistique, Economica, Paris, 1991.

16
Analiza unei serii statistice discrete se realizeaz cu ajutorul metodelor grafice i
numerice. n continuare prezentm cteva coordonate ale acestor tipuri de analiz.

2.1 Analiza grafic
Pentru reprezentarea grafic a unei serii dup o variabil discret se folosesc urmtoarele
diagrame: poligonul frecvenelor, curba frecvenelor sau curba frecvenelor cumulate. Indicatorii
numerici prin care poate fi caracterizat o serie statistic dup o variabil discret pot fi grupai n
indicatori ai tendinei centrale (mrimi medii), indicatori ai dispersiei, indicatori ai asimetriei i
boltirii.

2.1.1. Frecvene absolute cumulate cresctor (Ni ) sau descresctor (Ni )
Frecvenele absolute cumulate cresctor (N
i
) sau descresctor (N
i
) exprim numrul de
uniti statistice cumulate pn la sau peste un anumit nivel al variabilei, adic valori x
i
,
respectiv x
i
.
Relaiile de calcul sunt:

= + + +=
i
1 h
h i 1 i i
n n N N , respectiv

=
+
= + | |=
m
i h
h i 1 i i
n n N N .

2.1.2. Frecvene relative cumulate cresctor (Fi) sau descresctor (Fi)
Frecvenele relative cumulate cresctor (F
i
) sau descresctor (F
i
) exprim ponderea
unitilor statistice cumulate pn la sau peste un anumit nivel al caracteristicii, adic valori
x
i
, respectiv x
i
.
Relaiile de calcul sunt:

= + + +=
i
1 h
h i 1 i i
f f F F , respectiv

=
+
= + | |=
m
i h
h i 1 i i
f f F F , unde f
i
reprezint frecvenele relative.

Frecvenele relative, f
i
, exprim ponderea unitilor n
i
n volumul total al unitilor
observate, n, i se calculeaz dup relaiile:
-
n
n
n
n
f
i
i
i
i
i
= =

, atunci cnd frecvenele sunt exprimate sub form de coeficient. n acest


caz, . 1 f
i
i
=


- 100
n
n
100
n
n
f
i
i
i
i
i
= =

, atunci cnd frecvenele sunt exprimate sub form de procente


(%). n acest caz, %. 100 f
i
i
=



Exemplu
Distribuia judeelor din Romnia care au pensiuni turistice la 31 iulie 2010 (exclusiv
judeul Braov i judeul Prahova) se prezint astfel:

17

Tabelul 2.1. Distribuia judeelor din Romnia
dup numrul de pensiuni turistice la 31 iulie 2010
Pensiuni
turistice
Nr. judee
1 1
2 2
3 1
4 7
5 3
6 2
9 1
10 1
14 2
18 1
22 2
23 1
29 3
40 1
42 1
46 3
47 1
49 1
61 1
62 1
TOTAL 36
Sursa: Anuarul Statistic al Romniei, anul 2011, www.insse.ro, accesat pe 1 noiembrie 2012.

Se cere s se calculeze frecvenele absolute i relative cumulate cresctor sau descresctor.

Rezolvare
Frecvene absolute cumulate cresctor( N
i
)
Frecvenele absolute cumulate cresctor se calculeaz dup relaia:

= + + +=
i
1 h
h i 1 i i
n n N N .
Pentru exemplul dat, avem:
1 1
1 N n += = ;
2 1 2
1 2 3 N N n ; += ++ = + =
3 2 3
3 1 4 N N n += ++ = + = etc.
Celelalte rezultate sunt prezentate n tabelul de mai jos:
18

Tabelul 2.2. Frecvenele absolute cumulate cresctor
Pensiuni
turistice
Nr. judee
+
i
N
1 1 1
2 2 3
3 1 4
4 7 11
5 3 14
6 2 16
9 1 17
10 1 18
14 2 20
18 1 21
22 2 23
23 1 24
29 3 27
40 1 28
42 1 29
46 3 32
47 1 33
49 1 34
61 1 35
62 1 36
TOTAL 36 -


Interpretare
Numrul judeelor din Romnia care au o pensiune turistic este egal cu unu. Numrul
judeelor care au cel mult dou pensiuni turistice este egal cu 3. Numrul judeelor care au cel
mult 3 pensiuni turistice este egal cu 4. n mod similar, se interpreteaz celelalte rezultate.

Observaie
n calculul frecvenelor absolute cumulate cresctor, ultima valoare N
i
este ntotdeauna
egal cu volumul total al eantionului observat. n exemplul dat, avem N
20
=n=36.

Frecvene absolute cumulate descresctor ( |
i
N )
Frecvenele absolute cumulate descresctor se calculeaz dup relaia:

=
+
= + | |=
m
i h
h i 1 i i
n n N N .
Pentru exemplul dat, avem:
2
19 20 19
= + | |= n N N ;
; 3 1 2
18 19 18
= + = + | |= n N N
Celelalte rezultate sunt prezentate n tabelul de mai jos:




19
Tabelul 2.3. Frecvenele absolute cumulate descresctor
Pensiuni
turistice
Nr. judee
|
i
N
1 1 36
2 2 35
3 1 33
4 7 32
5 3 25
6 2 22
9 1 20
10 1 19
14 2 18
18 1 16
22 2 15
23 1 13
29 3 12
40 1 9
42 1 8
46 3 7
47 1 4
49 1 3
61 1 2
62 1 1
TOTAL 36 -


Interpretare
Numrul judeelor din Romnia care au 62 pensiuni turistice este egal cu unu. Numrul
judeelor care au peste 61 pensiuni turistice este egal cu 2. Numrul judeelor care au peste 49
pensiuni turistice este egal cu 3. n mod similar, se interpreteaz celelalte rezultate.

Frecvene relative (f
i
)
Frecvenele relative se calculeaz dup relaia:
100
n
n
100
n
n
f
i
i
i
i
i
= =

.
Pentru exemplul dat, avem:
% 76 , 4 100
210
10
100
n
n
f
i
i
1
1
= = =

; % 90 , 11 100
210
25
100
n
n
f
i
i
2
2
= = =

etc.

Celelalte rezultate sunt prezentate n tabelul de mai jos:
20

Tabelul 2.4. Frecvenele relative
Pensiuni
turistice
Nr. judee f
i
(%)
1 1 2,78
2 2 5,55
3 1 2,78
4 7 19,44
5 3 8,33
6 2 5,55
9 1 2,78
10 1 2,78
14 2 5,56
18 1 2,78
22 2 5,55
23 1 2,78
29 3 8,33
40 1 2,78
42 1 2,78
46 3 8,33
47 1 2,78
49 1 2,78
61 1 2,78
62 1 2,78
TOTAL 36 100

Interpretare
Ponderea judeelor din Romnia care au o pensiune turistic este de 2,78% din numrul
total de judee care au pensiuni turistice. Ponderea judeelor care au 2 pensiuni turistice este de
5,55%, iar ponderea judeelor care au 3 pensiuni turistice este de 2,78%. n mod similar, se
interpreteaz celelalte rezultate.

Frecvene relative cumulate cresctor ( +
i
F )
Frecvenele relative cumulate cresctor se calculeaz dup relaia:

= + + +=
i
1 h
h i 1 i i
f f F F .
Pentru exemplul dat, avem:
1 1
2 78 F f , % += = ;
2 1 2
2 78 5 55 8 33 F F f , , , %; += ++ = + =
% 11 , 11 78 , 2 33 , 8
2 2 3
= + = + + += f F F , etc.
Celelalte rezultate sunt prezentate n tabelul de mai jos:
21

Tabelul 2.5. Frecvenele relative cumulate cresctor
Pensiuni
turistice
Nr. judee f
i
(%)
+
i
F (%)
1 1 2,78 2,78
2 2 5,55 8,33
3 1 2,78 11,11
4 7 19,44 30,55
5 3 8,33 38,88
6 2 5,55 44,43
9 1 2,78 47,21
10 1 2,78 49,99
14 2 5,56 55,55
18 1 2,78 58,33
22 2 5,55 63,88
23 1 2,78 66,66
29 3 8,33 74,99
40 1 2,78 77,77
42 1 2,78 80,55
46 3 8,33 88,88
47 1 2,78 91,66
49 1 2,78 94,44
61 1 2,78 97,22
62 1 2,78 100
TOTAL 36 100 -


Interpretare
Ponderea judeelor din Romnia care au o pensiune turistic este de 2,78%. Ponderea
judeelor care au cel mult 2 pensiuni turistice este de 8,33%. Ponderea judeelor care au cel mult 3
pensiuni turistice este de 11,11%. n mod similar, se interpreteaz celelalte rezultate.

Frecvene relative cumulate descresctor ( |
i
F )
Frecvenele relative cumulate descresctor se calculeaz dup relaiile:

=
+
= + | |=
m
i h
h i 1 i i
f f F F .
Pentru exemplul dat, avem:
20 21 20
2 78 F F f , %; |= |+ = ;
19 20 19
2 78 2 78 5 56 F F f , , , %; |= |+ = + =
18 19 18
5 56 2 78 8 34 F F f , , , % |= |+ = + = etc.

Celelalte rezultate sunt prezentate n tabelul de mai jos:
22

Tabelul 2.6. Frecvenele relative cumulate cresctor
Pensiuni
turistice
Nr. judee f
i
(%)
|
i
F (%)
1 1 2,78 100
2 2 5,55 97,22
3 1 2,78 91,67
4 7 19,44 88,89
5 3 8,33 69,45
6 2 5,55 61,12
9 1 2,78 55,57
10 1 2,78 52,79
14 2 5,56 50,01
18 1 2,78 44,45
22 2 5,55 41,67
23 1 2,78 36,12
29 3 8,33 33,34
40 1 2,78 25,01
42 1 2,78 22,23
46 3 8,33 19,45
47 1 2,78 11,12
49 1 2,78 8,34
61 1 2,78 5,56
62 1 2,78 2,78
TOTAL 36 100 -

Interpretare
Ponderea judeelor din Romnia care au 62 pensiuni turistice este de 2,78%. Ponderea
judeelor care au peste 61 pensiuni turistice este de 5,56%. Ponderea judeelor care au peste 49
pensiuni turistice este de 8,34%. n mod similar, se interpreteaz celelalte rezultate.

2.1.3. Tipuri de grafice
O distribuie statistic dup o variabil numeric discret poate fi reprezentat grafic
folosind poligonul frecvenelor, curba frecvenelor i curba frecvenelor cumulate.

Poligonul frecvenelor
Construirea poligonului frecvenelor presupune gsirea locului geometric al punctelor A
i

de coordonate (x
i
, n
i
) sau (x
i
, f
i
) i unirea acestora prin segmente de dreapt. Poligonul
frecvenelor aproximeaz forma unei distribuii.
Alura poligonului frecvenelor este reprezentat n figura de mai jos:
23

Figura 1. Poligonul frecvenelor

Curba frecvenelor
Construirea curbei frecvenelor presupune ajustarea printr-o linie curb, continu a
poligonului frecvenelor. Curba frecvenelor aproximeaz mai bine forma de distribuie a
colectivitii dup variabila considerat.
Alura curbei frecvenelor este reprezentat n figura de mai jos:

Figura 2. Curba frecvenelor

Curba frecvenelor pentru distribuia dat se compar cu forma curbei frecvenelor pentru
o distribuie normal, cunoscut sub denumirea de Clopotul lui Gauss. Aceast curb este o curb
simetric fa de nivelul mediu: jumtate din uniti au valori mai mici dect nivelul mediu, iar
jumtate au valori mai mari.
n urma prelucrrii datelor la nivelul unui eantion, pot fi obinute urmtoarele forme ale
distribuiei unitilor:
24

Figura 3. Curb asimetric la dreapta

Figura 4. Curb asimetric la stnga

n exemplele prezentate n Figura 3 i Figura 4 se observ o concentrare a frecvenelor n
i
spre valorile mici (Figura 3), respectiv spre valorile mari ale variabilei X (Figura 4).

Curba frecvenelor cumulate
Construirea curbei frecvenelor cumulate presupune reprezentarea grafic a funciei de
repartiie a frecvenelor unei variabile: F(Xsx
i
).
Alura curbei frecvenelor cumulate cresctor este reprezentat n figura de mai jos:

Figura 5. Curba frecvenelor cumulate cresctor
25

Alura curbei frecvenelor cumulate desccresctor este reprezentat n figura de mai jos:

Figura 6. Curba frecvenelor cumulate descresctor


2.2. Analiza numeric. Indicatori ai statisticii descriptive
Cei mai importani indicatori ai statisticii descriptive pot fi grupai n indicatori ai tendinei
centrale, indicatori ai dispersiei, indicatori ai asimetriei i boltirii.

2.2.1. Indicatori ai tendinei centrale (mrimi medii)
Indicatorii tendinei centrale sunt indicatori prin care pot fi caracterizate n mod sintetic
unitile statistice observate dup o variabil X. Principalele mrimi medii folosite n
caracterizarea unei serii statistice sunt media aritmetic, modul i mediana.

a. Media aritmetic ) x (
Media aritmetic pentru o serie statistic dup o variabil discret se calculeaz dup
relaiile:
n
x
x
i
i
= , pentru o serie simpl de valori;


=
i
i
i
i i
n
n x
x , pentru o serie cu frecvene n
i
.

Principalele proprieti ale mediei aritmetice sunt:
1. Media aritmetic se nscrie n intervalul de variaie al variabilei X:

max min
x x x s s .

2. Pentru o serie cu frecvene, media aritmetic este plasat ntre valorile extreme, oscilnd n
jurul valorii cu frecvena dominant.
Media este considerat n statistic un punct de echilibru, similar centrului de greutate n
fizic. Dac o serie nu prezint o asimetrie pronunat, atunci media va fi n apropierea valorii cu
frecvena cea mai mare.

26
3. Media este o mrime normal, adic suma abaterilor valorilor individuale ale unei variabile X
de la media lor este egal cu zero:
0 ) x x (
i
i
=

, pentru o serie simpl de valori;


0 n ) x x (
i
i
i
=

, pentru o serie cu frecvene.



Exemple
1. Vnzrile unei firme (mil. Lei) nregistrate timp de cinci zile sunt: 10, 9, 8 7, 7. Se cere
s se calculeze media aritmetic.

Rezolvare
Media aritmetic pentru o serie simpl de valori se calculeaz dup relaia:
n
x
x
i
i
= .
Pentru exemplul dat, obinem:
2 , 8
5
7 7 8 9 10
n
x
x
i
i
=
+ + + +
= =

mil. Lei.

Interpretare
Nivelul mediu al vnzrilor zilnice ale firmei este de 8,2 mil. Lei.

2. Distribuia judeelor din Romnia care au pensiuni turistice la 31 iulie 2010 (exclusiv
judeul Braov i judeul Prahova) se prezint astfel:
27

Tabelul 2.7. Distribuia judeelor din Romnia
dup numrul de pensiuni turistice la 31 iulie 2010
Pensiuni
turistice
Nr. judee
1 1
2 2
3 1
4 7
5 3
6 2
9 1
10 1
14 2
18 1
22 2
23 1
29 3
40 1
42 1
46 3
47 1
49 1
61 1
62 1
TOTAL 36

Se cere s se calculeze media aritmetic.

Rezolvare
Media aritmetic pentru o serie statistic cu frecvene se calculeaz dup relaia


=
i
i
i
i i
n
n x
x .
Elementele pentru calculul mediei aritmetice sunt prezentate n tabelul de mai jos:
28

Tabelul 2.8. Elemente pentru calculul mediei aritmetice
Pensiuni
turistice
Nr. judee
i i
n x
1 1 1
2 2 4
3 1 3
4 7 28
5 3 15
6 2 12
9 1 9
10 1 10
14 2 28
18 1 18
22 2 44
23 1 23
29 3 87
40 1 40
42 1 42
46 3 138
47 1 47
49 1 49
61 1 61
62 1 62
TOTAL

=
i
i
n 36

=
i
i i
n x 721

nlocuind n relaia de mai sus, se obine :
721
20 03
36
i i
i
i
i
x n
x ,
n

= = =

.
Interpretare
Numrul mediu de pensiuni turistice este de 20,03~20 pensiuni/jude.


b. Modul (Mo)
Modul este valoarea variabilei cea mai frecvent observat ntr-o distribuie, adic valoarea
x
i
care corespunde frecvenei maxime (n
imax
).
Aflarea modului presupune identificarea valorii x
i
corespunztoare frecvenei maxime
(n
imax
).

Exemple
1. Vnzrile unei firme A (mil. Lei) nregistrate timp de cinci zile sunt: 10, 9, 8 7, 7. Se
cere s se afle modul.

Rezolvare
Pentru aflarea modului, trebuie identificat valoarea x
i
corespunztoare frecvenei maxime
(n
imax
). Frecvena maxim este n
imax
=2, iar valoarea x
i
corespunztoare este x
i
=7. Pentru seria
dat, modul este: Mo=7 mil. Lei.
29

Interpretare
Valoarea vnzrilor cea mai frecvent nregistrat de firma A este de 7 mil. Lei pe zi.

2. Vnzrile unei firme A (mil. Lei) nregistrate timp de cinci zile sunt: 10, 8, 8 7, 7. Se
cere s se afle valoarea modului.

Rezolvare
Pentru aflarea modului, trebuie identificat valoarea x
i
corespunztoare frecvenei maxime
(n
imax
). Frecvena maxim este n
imax
=2, iar valorile x
i
corespunztoare sunt x
i
=7 i x
i
=8. Seria dat
este o serie bimodal, valorile modului fiind de 7 mil. Lei i de 8 mil. Lei.

Interpretare
Valorile vnzrilor cele mai frecvente sunt de 7 mil. Lei i de 8 mil. Lei pe zi .

3. Distribuia judeelor din Romnia care au pensiuni turistice la 31 iulie 2010 (exclusiv
judeul Braov i judeul Prahova) se prezint astfel:

Tabelul 2.9. Distribuia judeelor din Romnia
dup numrul de pensiuni turistice la 31 iulie 2010
Pensiuni
turistice
Nr. judee
1 1
2 2
3 1
Mo=4 7
5 3
6 2
9 1
10 1
14 2
18 1
22 2
23 1
29 3
40 1
42 1
46 3
47 1
49 1
61 1
62 1
TOTAL 36

Se cere s se calculeze modul.

Rezolvare
Pentru aflarea modului, se afl frecvena maxim: n
imax
=7. Valoarea x
i
care corespunde
acestei frecvene maxime este x
i
=4. Pentru seria dat, modul este: Mo=4.

30
Interpretare
Cele mai multe judee din Romnia au avut la 31 iulie 2010 un numr de 4 pensiuni
turistice.


c. Mediana (Me)
Mediana reprezint acea valoare a variabilei care mparte seria ordonat cresctor n dou
pri egale: jumtate din uniti au valori mai mici dect mediana, iar jumtate au valori mai mari
dect mediana.
Aflarea medianei se realizeaz diferit n funcie de tipul seriei:

1. Pentru o serie simpl:
- cu numr par de termeni, mediana este reprezentat de media aritmetic simpl a celor doi
termeni centrali ai seriei ordonate cresctor.

Exemplu
Se consider seria reprezentat de valorile 10, 9, 11, 6, 7, 8. Pentru aflarea medianei, irul
valorilor se ordoneaz n sens cresctor: 6, 7, 8, 9, 10, 11. Mediana este reprezentat de media
aritmetic simpl a celor doi termeni centrali ai seriei ordonate cresctor, respectiv
5 , 8
2
9 8
Me =
+
= .

- cu numr impar de termeni, mediana este reprezentat de termenul central al seriei
ordonate cresctor.

Exemplu
Se consider seria reprezentat de valorile 10, 9, 11, 6, 7. Pentru aflarea medianei, irul
valorilor se ordoneaz n sens cresctor: 6, 7, 9, 10, 11. Mediana este reprezentat de termenul
central al seriei ordonate cresctor, respectiv 9 Me = .

2. Pentru o serie cu frecvene dup o variabil discret
Aflarea medianei presupune parcurgerea urmtoarelor etape:
- se calculeaz unitatea median:
2
1 n
U
i
i
Me
+
=

.
- se calculeaz frecvenele absolute cumulate cresctor, Ni;
- se afl prima valoare NiU
Me
;
- valoarea x
i
corespunztoare acestei frecvene NiU
Me
este mediana.

Exemplu
Distribuia judeelor din Romnia care au pensiuni turistice la 31 iulie 2010 (exclusiv
judeul Braov i judeul Prahova) se prezint astfel:
31

Tabelul 2.10. Distribuia judeelor din Romnia
dup numrul de pensiuni turistice la 31 iulie 2010
Pensiuni
turistice
Nr. judee
1 1
2 2
3 1
4 7
5 3
6 2
9 1
10 1
14 2
18 1
22 2
23 1
29 3
40 1
42 1
46 3
47 1
49 1
61 1
62 1
TOTAL 36

Se cere s se calculeze mediana.

Rezolvare
Etape pentru aflarea medianei:
- se calculeaz unitatea median:
1
37
18 5
2 2
i
Me i
n
U ,
+
= = =

;
- se calculeaz frecvenele absolute cumulate cresctor, Ni. Acestea sunt prezentate n
tabelul de mai jos:
32

Tabelul 2.11. Frecvenele absolute cumulate cresctor
Pensiuni
turistice
Nr. judee
+
i
N
1 1 1
2 2 3
3 1 4
4 7 11
5 3 14
6 2 16
9 1 17
10 1 18
Me=14 2 20
18 1 21
22 2 23
23 1 24
29 3 27
40 1 28
42 1 29
46 3 32
47 1 33
49 1 34
61 1 35
62 1 36
TOTAL 36 -

- se afl prima valoare NiU
Me
. Pentru exemplul dat, 20 18 5
Me
i
N U , . += > =
- valoarea x
i
corespunztoare primei frecvene NiU
Me
este mediana. Pentru exemplul dat,
Me=14.

Interpretare
Jumtate din numrul total al judeelor din Romnia au pn la 14 pensiuni turistice,
inclusiv, iar jumtate au peste 14 pensiuni turistice, inclusiv.

Observaie
Locul medianei ntr-o distribuie depinde de forma acesteia. Doar n cazul unei distribuii
simetrice mediana este termenul central al seriei.

Exemplu
Se consider distribuiile a dou serii, prezentate n tabelele de mai jos:

Seria I
x
i
n
i

1 20
2 40
3 20
4 15
5 5
TOTAL 100
33

Seria II
x
i
n
i

1 10
2 20
3 40
4 20
5 10
TOTAL 100

S se afle i s se compare valorile medianei pentru cele dou distribuii.

Rezolvare
Pentru seria I, aflarea medianei presupune parcurgerea urmtoarelor etape:
- se calculeaz unitatea median: 5 , 50
2
101
2
1
= =
+
=

i
i
Me
n
U ;
- se calculeaz frecvenele absolute cumulate cresctor, Ni. Acestea sunt prezentate n
tabelul de mai jos:

Tabelul 2.12. Frecvenele absolute cumulate cresctor
pentru seria I
x
i
n
i

+
i
N
1 20 20
Me=2 40 60
3 20 80
4 15 95
5 5 100
TOTAL 100 -

- prima valoare NiU
Me
este . 50 U 60 N
Me
i
= > +=
- valoarea x
i
corespunztoare frecvenei NiU
Me
este Me=2.

Pentru seria II se obin urmtoarele rezultate:


Tabelul 2.13. Frecvenele absolute cumulate cresctor
pentru seria II
x
i
n
i

+
i
N
1 10 10
2 20 30
Me=3 40 70
4 20 90
5 10 100
TOTAL 100 -

n acest caz, valoarea medianei este Me=3.
34

Se observ c poziia medianei pentru cele dou distribuii difer, dei volumul
colectivitii este acelai, n=100. Seria I este o serie asimetric, spre deosebire de seria II care este
o distribuie simetric. n acest ultim caz, mediana este reprezentat de termenul central al seriei.

d. Relaii ntre cele trei mrimi medii fundamentale
Relaia dintre cele trei mrimi medii fundamentale evideniaz forma unei distribuii:

- atunci cnd Me Mo x = = , distribuia este simetric;

Figura 7. Distribuie simetric

- atunci cnd Mo Me x > > , distribuia este asimetric la dreapta;

Figura 8. Distribuie asimetric la dreapta

- atunci cnd Mo Me x < < , distribuia este asimetric la stnga.
35

Figura 9. Distribuie asimetric la stnga

e. Comparaii ntre cele trei mrimi medii fundamentale
Interpretarea valorilor obinute pentru cele trei mrimi medii fundamentale poate releva
aspecte importante privind unitile statistice din distribuia analizat.
De exemplu, s considerm c n urma prelucrrii datelor privind salariul lunar (lei)
obinut de ctre salariaii unei firme, s-au obinut urmtoarele rezultate:
lei 800 Me ; lei 700 Mo ; lei 1500 x = = = .
Aceste valori arat c salariul mediu obinut de salariaii firmei este de 1500 lei/lun, ns
cei mai muli salariai ctig 700 lei/lun, iar jumtate din numrul total al salariailor ctig
pn la 800 lei/lun, iar jumtate ctig peste 800 lei/lun. Distribuia salariailor firmei
observate este o distribuie puternic asimetric la dreapta.
Aceste rezultate pot fi explicate prin diferene mari nregistrate ntre valorile salariului
obinut de salariaii din firma considerat. Media aritmetic este o mrime influenat de valorile
extreme, aberante. De aceea, este deosebit de util i interpretarea celorlalte mrimi medii
fundamentale.

f. Generalizarea medianei: quantilele
Quantilele sunt valori ale caracteristicii care mpart volumul unei colectiviti n r pri
egale. Cele mai folosite quantile sunt:

1. Quartilele
Quartilele sunt valori ale caracteristicii care mpart volumul unei colectiviti n 4 pri
egale.
Poziia celor trei quartile ntr-o distribuie simetric este prezentat n figura de mai jos:

Figura 10. Poziia quartilelor ntr-o distribuie
36

Quartila unu ( Q
1
)
Aflarea quartilei unu presupune parcurgerea urmtoarelor etape:
- se calculeaz unitatea quartilic unu:
4
1
1
+
=

i
i
Q
n
U ;
- se calculeaz frecvenele absolute cumulate cresctor, Ni;
- se afl prima valoare NiU
Q
1
;
- valoarea x
i
corespunztoare frecvenei NiU
Q
1
este quartila unu.

Quartila doi ( Q
2
)
Aflarea quartilei doi presupune parcurgerea urmtoarelor etape:
- se calculeaz unitatea quartilic doi:
Me i
i
i
i
Q
U
n n
U =
+
=
+
=

2
1
4
) 1 ( 2
2
. Quartila doi
este, deci, mediana.

Quartila trei ( Q
3
)
Aflarea quartilei trei presupune parcurgerea urmtoarelor etape:
- se calculeaz unitatea quartilic trei:
4
) 1 ( 3
3
+
=

i
i
Q
n
U ;
- se calculeaz frecvenele absolute cumulate cresctor, Ni;
- se afl prima valoare NiU
Q
3
;
- valoarea x
i
corespunztoare frecvenei NiU
Q
3
este quartila trei.

Exemplu
Distribuia judeelor din Romnia care au pensiuni turistice la 31 iulie 2010 (exclusiv
judeul Braov i judeul Prahova) se prezint astfel:
37

Tabelul 2.14. Distribuia judeelor din Romnia
dup numrul de pensiuni turistice la 31 iulie 2010
Pensiuni
turistice
Nr. judee
1 1
2 2
3 1
4 7
5 3
6 2
9 1
10 1
14 2
18 1
22 2
23 1
29 3
40 1
42 1
46 3
47 1
49 1
61 1
62 1
TOTAL 36

Se cere s se calculeze quartila unu i quartila trei.

Rezolvare
Quartila unu
- se calculeaz unitatea quartilic unu:
1
1
36 1
9 25
4 4
i
Q i
n
U ,
+
+
= = =

;
- se calculeaz frecvenele absolute cumulate cresctor, Ni. Acestea sunt prezentate n
tabelul de mai jos:
38

Tabelul 2.15. Frecvenele absolute cumulate cresctor
Pensiuni
turistice
Nr. judee
+
i
N
1 1 1
2 2 3
3 1 4
Q
1
=4 7 11
5 3 14
6 2 16
9 1 17
10 1 18
14 2 20
18 1 21
22 2 23
23 1 24
29 3 27
40 1 28
42 1 29
46 3 32
47 1 33
49 1 34
61 1 35
62 1 36
TOTAL 36 -

- se afl prima valoare N
i
U
Q
1
. Pentru exemplul dat,
1
11 9 25
Q
i
N U , += > = ;
- valoarea x
i
corespunztoare primei frecvene NiU
Me
este quartila unu. Pentru exemplul
dat, Q
1
=4.

Interpretare
25% din numrul total de judee ale Romniei au cel mult 4 pensiuni turistice, inclusiv, iar
75% au peste 4 pensiuni turistice, inclusiv.

Quartila trei
- se calculeaz unitatea quartilic trei:
3
3 1
3 37
27 75
4 4
i
Q i
n
U ,
| |
+
|

\ .
= = =

;
- se calculeaz frecvenele absolute cumulate cresctor, Ni. Acestea sunt prezentate n
tabelul de mai jos:
39

Tabelul 2.16. Frecvenele absolute cumulate cresctor
Pensiuni
turistice
Nr. judee
+
i
N
1 1 1
2 2 3
3 1 4
4 7 11
5 3 14
6 2 16
9 1 17
10 1 18
14 2 20
18 1 21
22 2 23
23 1 24
29 3 27
Q
3
=40 1 28
42 1 29
46 3 32
47 1 33
49 1 34
61 1 35
62 1 36
TOTAL 36 -


- se afl prima valoare N
i
U
Q
3
. Pentru exemplul dat,
3
28 27 75
Q
i
N U , . += > =
- valoarea x
i
corespunztoare primei frecvene NiU
Q
3
este quartila trei. Pentru exemplul
dat, Q
3
=40.

Interpretare
75% din numrul total al judeelor din Romnia au pn la 40 de pensiuni turistice, iar
25% au peste 40 pensiuni turistice.

2. Decilele
Decilele sunt valori ale caracteristicii care mpart volumul unei colectiviti n 10 pri
egale. Cele mai importante decile sunt decila unu i decila nou.

Decila unu ( D
1
)
Aflarea decilei unu presupune parcurgerea urmtoarelor etape:
- se calculeaz unitatea decilic unu:
10
1
1
+
=

i
i
D
n
U ;
- se calculeaz frecvenele absolute cumulate cresctor, Ni;
- se afl prima valoare NiU
D
1
;
- valoarea x
i
corespunztoare frecvenei NiU
D
1
este decila unu.

Decila nou (D
9
)
40
Aflarea decilei nou presupune parcurgerea urmtoarelor etape:
- se calculeaz unitatea decilic nou:
10
) 1 ( 9
9

+
=
i
i
D
n
U ;
- se calculeaz frecvenele absolute cumulate cresctor, Ni;
- se afl prima valoare NiU
D
9
;
- valoarea x
i
corespunztoare ifrecvenei NiU
D
9
este decila nou.

Exemplu
Distribuia judeelor din Romnia care au pensiuni turistice la 31 iulie 2010 (exclusiv
judeul Braov i judeul Prahova) se prezint astfel:

Tabelul 2.17. Distribuia judeelor din Romnia
dup numrul de pensiuni turistice la 31 iulie 2010
Pensiuni
turistice
Nr. judee
1 1
2 2
3 1
4 7
5 3
6 2
9 1
10 1
14 2
18 1
22 2
23 1
29 3
40 1
42 1
46 3
47 1
49 1
61 1
62 1
TOTAL 36

Se cere s se calculeze decila unu i decila nou.

Rezolvare
Decila unu
- se calculeaz unitatea decilic unu: 7 , 3
10
37
10
1
1
= =
+
=

i
i
D
n
U ;
- se calculeaz frecvenele absolute cumulate cresctor, Ni. Acestea sunt prezentate n
tabelul de mai jos:



41
Tabelul 2.18. Frecvenele absolute cumulate cresctor
Pensiuni
turistice
Nr. judee
+
i
N
1 1 1
2 2 3
D
1
=3 1 4
4 7 11
5 3 14
6 2 16
9 1 17
10 1 18
14 2 20
18 1 21
22 2 23
23 1 24
29 3 27
40 1 28
42 1 29
46 3 32
47 1 33
49 1 34
61 1 35
62 1 36
TOTAL 36 -


- se afl prima valoare NiU
D
1
. Pentru exemplul dat,
1
4 3 6
D
i
N U , . += > =
- valoarea x
i
corespunztoare primei frecvene NiU
D
1
este decila unu. Pentru exemplul
dat, D
1
=3.

Interpretare
10% din judeele Romniei au la 31 iulie 2010 numrul de pensiuni turistice de pn la 3,
inclusiv, iar 90% au peste 3 pensiuni turistice, inclusiv.

Decila nou
- se calculeaz unitatea decilic nou:
9
9 1
9 37
33 3
10 10
i
D i
n
U ,
| |
+
|

\ .
= = =

;
- se calculeaz frecvenele absolute cumulate cresctor, Ni. Acestea sunt prezentate n
tabelul de mai jos:
42

Tabelul 2.19. Frecvenele absolute cumulate cresctor
Pensiuni
turistice
Nr. judee
+
i
N
1 1 1
2 2 3
3 1 4
4 7 11
5 3 14
6 2 16
9 1 17
10 1 18
14 2 20
18 1 21
22 2 23
23 1 24
29 3 27
40 1 28
42 1 29
46 3 32
47 1 33
D
9
=49 1 34
61 1 35
62 1 36
TOTAL 36 -

- se afl prima valoare NiU
D
9
. Pentru exemplul dat,
9
34 33 3
D
i
N U , . += > =
- valoarea x
i
corespunztoare primei frecvene NiU
D
9
este decila nou. Pentru exemplul
dat, D
9
=49.

Interpretare
90% din judeele Romniei au la 31 iulie 2010 pn la 49 pensiuni turistice, iar 10% au
peste 49 pensiuni turistice.

g. Reprezentarea diagramei box-and-whiskers sau box-plot
Construirea diagramei box-and-whiskers presupune reprezentarea urmtoarelor valori
ale tendinei centrale: quartila unu, mediana, quartila trei, decila unu i decila nou. Forma
general a diagramei box-and-whiskers este prezentat n figura de mai jos:

43
1

10,00 9,00 8,00 7,00 6,00 5,00 4,00

D
1
Q
1
Q
2
Q
3
D
9


Figura 11. Diagrama box-and-whiskers

Diagrama box-and-whiskers este util n cercetarea statistic deoarece ofer informaii
cu privire la indicatorii tendinei centrale, la forma unei distribuii, dar i cu privire la gradul de
dispersie al distribuiei (fenomen prezentat n capitolul urmtor). ntr-o distribuie perfect
simetric, valorile decilei unu i nou, respectiv ale quartilei unu i trei, sunt reprezentate la
aceeai distan fa de median. Aceast situaie este reprezentat n Figura 11.

2.2.2. Indicatori ai dispersiei
Pentru caracterizarea unitilor unei distribuii nu este suficient doar folosirea
indicatorilor tendinei centrale. Pentru o caracterizare corect a unei distribuii trebuie s se ia n
considerare gradul de variaie a valorilor variabilei X fa de nivelul mediu. O colectivitate
caracterizat printr-o dispersie mare a valorilor x
i
ale unei variabile fa de nivelul mediu este o
colectivitate eterogen iar media nu este reprezentativ pentru distribuie.

a. Definirea fenomenului de dispersie
Aprecierea variabilitii valorilor unei variabile fa de nivelul mediu se poate realiza prin
aprecierea fenomenului de dispersie. Dispersia exprim gradul de mprtiere a valorilor
individuale ale unei variabile fa de nivelul mediu. Aprecierea fenomenului de dispersie al unei
distribuii permite identificarea gradului de reprezentativitate a mediei unei distribuii.

b. Indicatorii dispersiei
Principalii indicatori ai dispersiei sunt:
1. Amplitudinea de variaie
Amplitudinea de variaie msoar distana dintre nivelul maxim i nivelul minim al unei
variabile. Se calculeaz pe baza relaiei:
min max
x x A = .
Acest indicator permite aprecierea ntinderii domeniului de variaie al variabilei X.
Dezavantajul acestui indicator const n faptul c nu ptrunde n interiorul distribuiei, respectiv
ntre cele dou valori extreme ale variabilei.

2. Variana
Variana este media ptratelor abaterilor valorilor x
i
de la nivelul mediu i poate fi
calculat pe baza relaiei:
44
n
) x x (
s
2
i
i
2

= , pentru o serie simpl;


=
i
i
i
2
i
i
2
n
n ) x x (
s , pentru o serie cu frecvene.
Variana nu are unitate de msur i nu se interpreteaz.

3. Abaterea medie ptratic (abaterea standard)
Abaterea medie ptratic sau abaterea standard este rdcina mediei ptratelor abaterilor
valorilor x
i
de la nivelul mediu i poate fi calculat pe baza relaiei:
n
) x x (
s s
2
i
i
2

= = , pentru o serie simpl;


= =
i
i
i
2
i
i
2
n
n ) x x (
s s , pentru o serie cu frecvene.
Abaterea standard se exprim n aceeai unitate de msur cu cea a variabilei X. Arat cu
ct variaz, n medie, valorile variabilei X de la nivelul mediu, n sens negativ i pozitiv.

4. Coeficientul de variaie
ntruct abaterea standard i media se exprim n aceeai unitate de msur cu cea a
variabilei X, aceti indicatori nu pot fi folosii pentru a compara dou serii de date care sunt
exprimate n uniti de msur diferite. Pentru a nltura acest inconvenient, se calculeaz
coeficientul de variaie, dup relaia:
100
x
s
v = .
Prin evaluarea acestui coeficient se poate aprecia gradul de reprezentativitate a mediei
unei distribuii. n general, o valoare a coeficientului de variaie mai mic de 50% arat c media
este reprezentativ.

Exemplu
Distribuia judeelor din Romnia care au pensiuni turistice la 31 iulie 2010 (exclusiv
judeul Braov i judeul Prahova) se prezint astfel:
45

Tabelul 2.20. Distribuia judeelor din Romnia
dup numrul de pensiuni turistice la 31 iulie 2010
Pensiuni
turistice
Nr. judee
1 1
2 2
3 1
4 7
5 3
6 2
9 1
10 1
14 2
18 1
22 2
23 1
29 3
40 1
42 1
46 3
47 1
49 1
61 1
62 1
TOTAL 36

Se cere s se calculeze indicatorii dispersiei.

Rezolvare
Cei mai importani indicatori ai dispersiei sunt: amplitudinea de variaie, variana, abaterea
standard i coeficientul de variaie.

Amplitudinea de variaie
Amplitudinea de variaie se calculeaz pe baza relaiei:
62 1 61
max min
A x x = = = .
Interpretare
Diferena dintre nivelul maxim i nivelul minim al variabilei X este egal cu 61.

Variana
Variana se calculeaz pe baza relaiei:


=
i
i
i
2
i
i
2
n
n ) x x (
s . Pentru aceast distribuie, media este 20 03 x , = .
Elementele de calcul ale varianei sunt prezentate n tabelul de mai jos:
46

Tabelul 2.21. Elemente de calcul ale varianei
Pensiuni
turistice
Nr. judee
x x
i

2
i
) x x (
i
2
i
n ) x x (
1 1 -19,03 362,1409 362,1409
2 2 -18,03 325,0809 650,1618
3 1 -17,03 290,0209 290,0209
4 7 -16,03 256,9609 1798,726
5 3 -15,03 225,9009 677,7027
6 2 -14,03 196,8409 393,6818
9 1 -11,03 121,6609 121,6609
10 1 -10,03 100,6009 100,6009
14 2 -6,03 36,3609 72,7218
18 1 -2,03 4,1209 4,1209
22 2 1,97 3,8809 7,7618
23 1 2,97 8,8209 8,8209
29 3 8,97 80,4609 241,3827
40 1 19,97 398,8009 398,8009
42 1 21,97 482,6809 482,6809
46 3 25,97 674,4409 2023,323
47 1 26,97 727,3809 727,3809
49 1 28,97 839,2609 839,2609
61 1 40,97 1678,5409 1678,541
62 1 41,97 1761,4809 1761,481
TOTAL 36 - - 12640,97

nlocuind n relaia de mai sus, se obine:
2
2
12640 97
351138
36
i i
i
i
i
( x x ) n
,
s ,
n

= = =

.

Abaterea standard
Abaterea standard se calculeaz pe baza relaiei:
2
351138 18 74 s s , , = = = .
Interpretare
Numrul de pensiuni din judeele Romniei variaz, n medie, fa de nivelul mediu cu
18,74~19 pensiuni, n sens pozitiv i negativ.

Coeficientul de variaie
Coeficientul de variaie se calculeaz dup relaia:
18 74
100 100 93 56
20 03
s ,
v , %
x ,
= = = .
Interpretare
Valoarea coeficientului de variaie arat c distribuia judeelor dup numrul de pensiuni
turistice la 31 iulie 2010 nu este o distribuie omogen, este caracterizat printr-o dispersie mare
(v>50%). Media nu este reprezentativ pentru aceast distribuie.


47
c. Compararea fenomenului de dispersie pentru mai multe distribuii
Pentru dou colectiviti se nregistreaz vrsta persoanelor i se obin urmtoarele
rezultate:
ani 2 s , ani 15 x
1 1
= = ;
ani 2 s , ani 50 x
2 2
= = .
Aceste rezultate arat c ambele colectiviti se caracterizeaz printr-o dispersie mic a
vrstei persoanelor fa de vrsta medie. Vrsta medie pentru unitile din prima colectivitate este,
ns, mult mai mic dect vrsta medie pentru unitile din cea de-a doua colectivitate. Aceasta
arat c prima colectivitate este format din persoane foarte tinere, spre deosebire de persoanele
din cea de-a doua colectivitate.
Reprezentarea grafic a dou distribuii caracterizate prin medii diferite i aceeai
dispersie este realizat n figura de mai jos:

Figura 12. Curba frecvenelor pentru dou distribuii

Reprezentarea grafic a dou distribuii caracterizate prin aceeai medie i dispersii
diferite este realizat n figura de mai jos:

Figura 13. Curba frecvenelor pentru dou distribuii

d. Abaterea standard i distribuia normal
Cunoscnd nivelul mediu i abaterea standard pentru o distribuie, putem afla care este
proporia unitilor care nregistreaz valori mai mari, de exemplu, dect ( s x + ).
Pentru aceasta, se calculeaz valori ale unei variabile standardizat Z, cunoscut i sub
denumirea de scor Z
i
, dup relaia:
48
s
x x
z
i
i

= . Aceast mrime arat poziia unei uniti fa de nivelul mediu ( x ), folosind


ca unitate de msur abaterea standard. Variabila Z este o variabil de medie 0 i varian egal
cu 1.
De exemplu, pentru o distribuie caracterizat printr-o medie de 100 x = i o abatere
standard de 20 s = , pentru x
i
=140 putem afla valoarea z
i
, astfel: 2
20
100 140
=

=
i
z . Aceasta
arat c unitatea care nregistreaz valoarea x
i
=140 se gsete la o distan fa de nivelul mediu
egal cu de dou ori abaterea standard.

Odat calculat valoarea z, putem afla proporia unitilor care nregistreaz valori mai
mari dect 140, de exemplu. Aceste valori sunt calculate pentru o distribuie normal i sunt
tabelate (Anexa 1).
Tabelul care prezint aceste rezultate este de forma:

0 0.01 0.05
0
0.1
0.2


1 0,341
1.1 0,375



Pe prima coloan sunt valorile lui z, ntregul i prima zecimal, iar valorile din
urmtoarele coloane reprezint a doua zecimal a valorii z
i
. Valorile din interiorul tabelul arat
proporia unitilor care nregistreaz valori cuprinse ntre nivelul mediu i scorul z corespunztor.

De exemplu, pentru o valoare z
i
=1,15, se citete 0,375. Aceast valoare arat c
aproximativ 37,5% din unitile distribuiei nregistreaz valori cuprinse ntre nivelul mediu i
valoarea z
i
=1,15.
n Tabelul Z nu sunt valori negative pentru z
i
, ns distribuia normal este o distribuie
simetric, deci aria suprafeei cuprinse ntre nivelul mediu i valoarea pozitiv sau negativ a lui Z
este aceeai.

Exemple
49
1. Pentru o distribuie normal de medie, x , i abatere standard, s, s se afle proporia
unitilor care nregistreaz valori cuprinse n intervalele ( s x ), ( s 2 x ) i ( s 3 x ).

Rezolvare
Pentru a afla proporia unitilor care nregistreaz valori cuprinse n intervalul
) s x ; s x ( + , se calculeaz scorul Z, astfel:
1
s
x s x
s
x x
z
1
1
=

=

=
1
s
x s x
s
x x
z
2
2
+ =
+
=

= .

Din tabelul Z se citete valoarea care corespunde unui nivel z
i
=1, i anume 0,341.

0 0.01 0.05
0
0.1
0.2


1 0,341
1.1 0,375



Aceast valoare, 0,341, reprezint aria suprafeei cuprinse ntre nivelul mediu i z
i
=1.
Proporia unitilor care nregistreaz valori cuprinse n intervalul ) s x ; s x ( + este:
682 , 0 341 , 0 2 = sau 68,2%.

n mod similar, se obin valorile z
i
=2, pentru limitele intervalului ( s 2 x ).
50

Din tabelul Z, se citete valoarea care corespunde unui nivel z
i
=2, de 0,477.

0 0.05
0
0.1
0.2


2 0,477



Proporia unitilor care nregistreaz valori cuprinse n intervalul ) s 2 x ; s 2 x ( + este:
954 , 0 477 , 0 2 = sau 95,4%.

Pentru intervalul ( s 3 x ), se obin valorile z
i
=3:

Pentru z
i
=3, se citete valoarea corespunztoare 0,499.

0 0.05
0
51
0.1
0.2


3 0,499

Proporia unitilor care nregistreaz valori cuprinse n intervalul ) s 3 x ; s 3 x ( + este:
998 , 0 499 , 0 2 = sau 99,8%.


Interpretare
ntr-o distribuie normal, n intervalul ( s x ) sunt cuprinse 68,2% din uniti, n
intervalul ( s 2 x ) sunt cuprinse 95,4% din uniti i n intervalul ( s 3 x ) sunt cuprinse
99,8% din uniti.

2. Distribuia unor studeni dup nota obinut la un test urmeaz o lege normal i se
caracterizeaz prin urmtoarele rezultate: 7 x = i s=2. Se cere s se afle proporia studenilor
care au luat note mai mici dect 6.

Rezolvare
Valoarea Z
i
care corespunde unei valori x
i
=6 se calculeaz astfel:
5 0
2
7 6
,
s
x x
z
i
i
=

=
Din tabelul Z se citete valoarea care corespunde unui nivel z
i
=0,5, egal cu 0,191.

0 0.01 0.05
0
0.1
0.2


0,5 0,191



Proporia studenilor care au luat note mai mici dect 6 este f=0,5-0,191=0,309 sau 30,9%.
52

Observaie
Aria suprafeei reprezentate n figura de mai sus este egal cu unu (dup cum am precizat
anterior, suma proporiilor este egal cu 1 sau 100%). Distribuia normal este o distribuie
simetric, deci proporia unitilor care au valori mai mari dect nivelul mediu este de 0,5.

3. Distribuia unor persoane dup vrst urmeaz o lege normal i se caracterizeaz prin
urmtoarele rezultate: 30 x = ani i s=4 ani. Se cere s se afle proporia persoanelor care au o
vrst cuprins ntre 27 ani i 35 ani.

Rezolvare
Valorile lui Z corespunztoare lui x
1
=27 i x
2
=35 sunt:
75 , 0
4
30 27
s
x x
z
1
1
=

=
25 , 1
4
30 35
s
x x
z
2
2
+ =

= .
Din tabelul Z se citesc valorile corespunztoare lui z
1
=-0,75 i z
2
=+1,25, astfel:

0 0.05
0
0.1
0.2


0,7 0,273




1,2 0,394




Proporia persoanelor care au o vrst cuprins ntre 27 ani i 35 ani este:
f=0,273+0,394=0,667 sau 66,7%.
53

4. Pentru o distribuie normal de medie x , i abatere standard s, s se afle limitele
intervalului care include 95% din unitile statistice observate.

Rezolvare
Aceast problem poate fi prezentat grafic astfel:

Demersul urmat pentru rezolvarea acestei probleme este invers celui prezentat anterior: se
cunoate proporia (95%) i trebuie s aflm valoarea z
i
care corespunde acestei proporii.
Pentru a afla valoarea z
i
, se calculeaz aria suprafeei cuprins ntre nivelul mediu i z, care
este egal cu % 5 , 47
2
% 95
= sau 0,475.


Pentru aceast proporie egal cu 0,475, se citete valoarea z
i
corespunztoare, de 1,96.

54
0 0.06
0
0.1
0.2


1,9 0,475





Prin urmare, ntr-o distribuie normal, 95% din uniti au valori cuprinse n intervalul
| | s 96 , 1 x ; s 96 , 1 x + .

Observaie
n estimarea parametrilor unei populaii, problematic prezentat n partea a doua,
obiectivul urmrit este de a afla limitele unui interval care acoper media unei populaii, n 95%
din cazuri, de exemplu.


2.2.4. Indicatori ai formei unei distribuii

a. Asimetria
O distribuie este simetric dac valorile frecvenelor sunt egal dispersate fa de valoarea
central a seriei. Distribuia normal este exemplul clasic al unei repartiii simetrice. Graficul
densitii de repartiie n cazul unei distribuii normale are forma unui clopot simetric, cu axa de
simetrie reprezentat de media seriei. O deviere de la forma simetric a unei distribuii evideniaz
fenomenul de asimetrie.

Asimetria poate fi apreciat pe cale grafic prin reprezentarea poligonului i curbei
frecvenelor, i prin reprezentarea diagramei box-and-whiskers.

Alura curbei frecvenelor n cazul unei distribuii simetrice, a unei distribuii asimetrice la
dreapta sau la stnga este reprezentat grafic n figurile de mai jos:
55
10,00 8,00 6,00 4,00
Nota
50
40
30
20
10
0
F
r
e
q
u
e
n
c
y
Mean = 7,00
Std. Dev. =
1,54303
N = 190

Figura 14. Distribuie simetric
10,00 8,00 6,00 4,00
Nota
60
50
40
30
20
10
0
F
r
e
q
u
e
n
c
y
Mean = 6,4737
Std. Dev. =
1,43163
N = 190

Figura 15. Distribuie asimetric la dreapta
10,00 8,00 6,00 4,00
Nota
60
50
40
30
20
10
0
F
r
e
q
u
e
n
c
y
Mean = 7,5263
Std. Dev. =
1,43163
N = 190


Figura 16. Distribuie asimetric la stnga

Alura diagramei box-and-whiskers n cazul unei distribuii simetrice, a unei distribuii
asimetrice la dreapta sau la stnga este reprezentat grafic n figurile de mai jos:
56
1

10,00 9,00 8,00 7,00 6,00 5,00 4,00

Figura 17. Distribuie simetric

Nota
10,00 9,00 8,00 7,00 6,00 5,00 4,00

Figura 18. Distribuie asimetric la dreapta

Nota
10,00 9,00 8,00 7,00 6,00 5,00 4,00

Figura 19. Distribuie asimetric la stnga

Cei mai importani indicatori ai asimetriei sunt:
57
1. Coeficientul de asimetrie Pearson
Coeficientul de asimetrie Pearson se calculeaz pe baza relaiei:
3
2
2
3
1

| = , unde:


=
i
i
i
3
i
i
3
n
n ) x x (
reprezint momentul centrat de ordinul 3;
2
i
i
i
2
i
i
2
s
n
n ) x x (
=

=

reprezint momentul centrat de ordinul 2, adic variana.


Acest indicator este ntotdeauna pozitiv. Sensul asimetriei este dat de semnul lui
3
.
Atunci cnd
3
>0, distribuia este asimetric la dreapta. Atunci cnd
3
<0, distribuia este
asimetric la stnga.

2. Coeficientul de asimetrie Fisher
Coeficientul de asimetrie Fisher se calculeaz pe baza relaiei:
3
3
1
s

= .
Interpretarea valorii acestui coeficient este similar coeficientului de asimetrie Pearson.

Exemplu
Distribuia judeelor din Romnia care au pensiuni turistice la 31 iulie 2010 (exclusiv
judeul Braov i judeul Prahova) se prezint astfel:

Tabelul 2.22. Distribuia judeelor din Romnia
dup numrul de pensiuni turistice la 31 iulie 2010
Pensiuni
turistice
Nr. judee
1 1
2 2
3 1
4 7
5 3
6 2
9 1
10 1
14 2
18 1
22 2
23 1
29 3
40 1
42 1
46 3
47 1
49 1
61 1
62 1
TOTAL 36
58

Se cere s se calculeze indicatorii asimetriei.

Rezolvare
Indicatorii asimetriei sunt:
1. Coeficientul de asimetrie Pearson
Coeficientul de asimetrie Pearson se calculeaz pe baza relaiei:
3
2
2
3
1

| = .
Elementele de calcul sunt prezentate n tabelul de mai jos:

Tabelul 2.23. Elemente de calcul
Pensiuni
turistice
Nr. judee
x x
i

2
i
) x x (
i
2
i
n ) x x (
3
i
) x x (
i
3
i
n ) x x (
1 1 -19,03 362,1409 362,1409 -6891,54 -6891,54
2 2 -18,03 325,0809 650,1618 -5861,21 -11722,4
3 1 -17,03 290,0209 290,0209 -4939,06 -4939,06
4 7 -16,03 256,9609 1798,726 -4119,08 -28833,6
5 3 -15,03 225,9009 677,7027 -3395,29 -10185,9
6 2 -14,03 196,8409 393,6818 -2761,68 -5523,36
9 1 -11,03 121,6609 121,6609 -1341,92 -1341,92
10 1 -10,03 100,6009 100,6009 -1009,03 -1009,03
14 2 -6,03 36,3609 72,7218 -219,26 -438,52
18 1 -2,03 4,1209 4,1209 -8,37 -8,37
22 2 1,97 3,8809 7,7618 7,65 15,3
23 1 2,97 8,8209 8,8209 26,2 26,2
29 3 8,97 80,4609 241,3827 721,73 2165,19
40 1 19,97 398,8009 398,8009 7964,05 7964,05
42 1 21,97 482,6809 482,6809 10604,5 10604,5
46 3 25,97 674,4409 2023,323 17515,23 52545,69
47 1 26,97 727,3809 727,3809 19617,46 19617,46
49 1 28,97 839,2609 839,2609 24313,39 24313,39
61 1 40,97 1678,5409 1678,541 68769,82 68769,82
62 1 41,97 1761,4809 1761,481 73929,35 73929,35
TOTAL 36 - - 12640,97 189057,3

Momentele centrate de ordinul doi i trei sunt:
2
2
12640 97
351138
36
i i
i
i
i
( x x ) n
,
,
n


= = =


3
3
189057 3
5251 59
36
i i
i
i
i
( x x ) n
,
,
n


= = =


nlocuind n relaia de mai sus, se obine:
2 2
3
1 3 3
2
5251 592
0 637
351138
( , )
,
,

= = = .

59

Interpretare
Valoarea coeficientului de asimetrie Pearson arat c distribuia dat se caracterizeaz
printr-o asimetrie ( 0
1
= | ) la dreapta (
3
>0).

2. Coeficientul de asimetrie Fisher
Coeficientul de asimetrie Fisher se calculeaz pe baza relaiei:
( )
3
1 3 3 3
5251 59 5251 59
0 798
18 74
351138
, ,
,
s ,
,

= = = = .

b. Boltirea
Boltirea este definit prin compararea distribuiei statistice cu distribuia normal din
punctul de vedere al variaiei variabilei X i a frecvenei n
i
.
Boltirea poate fi apreciat pe cale grafic prin reprezentarea curbei frecvenelor. Alura
curbei frecvenelor n cazul unei distribuii normale (mezocurtice) sau care prezint un accentuat
fenomen de boltire este reprezentat n figura de mai jos:

Figura 20. Boltirea unei distribuii

n cazul unei distribuii leptocurtice, se nregistreaz o variaie mic a valorilor variabilei
X i o variaie mare a frecvenelor absolute, n
i
. n cazul unei distribuii platicurtice, se
nregistreaz o variaie mare a variabilei X i o variaie mic a frecvenelor absolute, n
i
.

Boltirea poate fi apreciat pe cale numeric prin calculul indicatorilor boltirii:
1. Coeficientul de boltire Pearson
Coeficientul de boltire Pearson se calculeaz pe baza relaiei:
4
4
2
2
4
2
s

| = = , unde:


=
i
i
i
4
i
i
4
n
n ) x x (
reprezint momentul centrat de ordinul 4.
60
O valoare a coeficientului de boltire Pearson 3
2
= | arat o distribuie mezocurtic. O
valoare 3
2
> | arat o distribuie leptocurtic iar o valoare 3
2
< | arat o distribuie platicurtic.

2. Coeficientul de boltire Fisher
Coeficientul de boltire Fisher se calculeaz pe baza relaiei:
3
2 2
= | .
O valoare a coeficientului de boltire Fisher 0
2
= arat o distribuie mezocurtic. O
valoare 0
2
> arat o distribuie leptocurtic iar o valoare 0
2
< arat o distribuie platicurtic.

Exemplu
Distribuia judeelor din Romnia care au pensiuni turistice la 31 iulie 2010 (exclusiv
judeul Braov i judeul Prahova) se prezint astfel:

Tabelul 2.24. Distribuia judeelor din Romnia
dup numrul de pensiuni turistice la 31 iulie 2010
Pensiuni
turistice
Nr. judee
1 1
2 2
3 1
4 7
5 3
6 2
9 1
10 1
14 2
18 1
22 2
23 1
29 3
40 1
42 1
46 3
47 1
49 1
61 1
62 1
TOTAL 36

Se cere s se calculeze indicatorii boltirii.

Rezolvare
Indicatorii boltirii sunt:
Coeficientul de boltire Pearson se calculeaz pe baza relaiei:
4
4
2
2
4
2
s

| = = , unde:
61


=
i
i
i
4
i
i
4
n
n ) x x (
reprezint momentul centrat de ordinul 4.
Elementele de calcul sunt prezentate n tabelul de mai jos:

Tabelul 2.25. Elemente de calcul
Pensiuni
turistice
Nr. judee
x x
i

4
i
) x x (
i
4
i
n ) x x (
1 1 -19,03 131146,03 131146,03
2 2 -18,03 105677,59 211355,18
3 1 -17,03 84112,12 84112,12
4 7 -16,03 66028,9 462202,3
5 3 -15,03 51031,22 153093,66
6 2 -14,03 38746,34 77492,68
9 1 -11,03 14801,37 14801,37
10 1 -10,03 10120,54 10120,54
14 2 -6,03 1322,12 2644,24
18 1 -2,03 16,98 16,98
22 2 1,97 15,06 30,12
23 1 2,97 77,81 77,81
29 3 8,97 6473,96 19421,88
40 1 19,97 159042,16 159042,16
42 1 21,97 232980,85 232980,85
46 3 25,97 454870,53 1364611,59
47 1 26,97 529082,97 529082,97
49 1 28,97 704358,86 704358,86
61 1 40,97 2817499,55 2817499,55
62 1 41,97 3102814,96 3102814,96
TOTAL 36 - - 10076905,85

Momentul centrat de ordinul patru este:
4
4
10076905 85
279914 05
36
i i
i
i
i
( x x ) n
,
,
n


= = =


nlocuind n relaia de mai sus, se obine:
4
2 2 2
2
279914 05
2 27
351138
,
,
,

= = = .

Interpretare
Valoarea coeficientului de boltire Pearson arat c distribuia judeelor dup numrul de
pensiuni turistice din 31 iulie 2010 este o distribuie platicurtic ( 3
2
< | ) .

Coeficientul de boltire Fisher se calculeaz pe baza relaiei:
2 2
3 2 27 3 0 73 , , | = = = .

Interpretare
62
Valoarea coeficientului de boltire Fisher arat c distribuia judeelor dup numrul de
pensiuni turistice din 31 iulie 2010 este o distribuie platicurtic ( 0
2
< ).

2.3. Aplicaie n SPSS
Se consider distribuia judeelor Romniei dup numrul de terenuri de sport, n anul
2010, prezentat n tabelul 2.26.

Folosind programul informatic SPSS (Statistical Package for Social Sciences), se cere s
se determine i s se interpreteze mrimile medii, quartila 1 i quartila 3, decila 1 i decila 9,
indicatorii dispersiei i indicatorii formei unei distribuii.

Rezolvare
Valorile indicatorilor descriptivi sunt prezentate n tabelul 2.27.

Tabelul 2.26. Indicatorii statisticii descriptive, obinui cu ajutorul programului SPSS









63



Tabelul 2.27. Distribuia judeelor Romniei dup numrul de terenuri de sport, n anul 2010


Valorile indicatorilor sunt:
- media aritmetic (Mean) este 107.7073 terenuri;
- mediana (Median) este 98 terenuri;
- modul (Mode) este 59 terenuri;
- abaterea standard (Std. Deviation) este 44.55626 terenuri;
- variana (Variance) este 1985.262;
- coeficientul de asimetrie Fisher (Skewness) este 0.991;
- coeficientul de boltire Fisher (Kurtosis) este 0.450;
- amplitudinea variaiei (Range) este 175 terenuri;
- decila 1 (Percentile 10) este 59.4 tereuri;
- quartila 1 (Percentile 25) este 69.5 terenuri;
64
- quartila 3 (Percentile 75) este 133 terenuri;
- decila 9 (Percentile 90) este 187.2 terenuri.

Interpretare
Media aritmetic arat c, n medie, un jude are aproximativ 108 terenuri de sport.
Mediana arat c 50% dintre judee au mai puin de 98 terenuri de sport inclusiv, iar 50%
dintre judee au mai mult de 98 terenuri de sport, inclusiv.
Modul arat c cel mai frecvent, judeele au 59 de terenuri de sport.
Abaterea standard arat c, n medie, numrul de terenuri de sport al unui jude se abate de
la numrul mediu de terenuri/jude cu aproximativ 45 terenuri de sport.
Coeficientul de asimetrie Fisher arat c distribuia este asimetric la dreapta.
Coeficientul de boltire Fisher arat c distribuia este leptocurtic.
Amplitudinea variaiei arat c diferena maxim dintre numrul de terenuri de sport a
oricror dou judee este de 175 terenuri.
Decila 1 arat c 10% dintre judee au mai puin de 59 terenuri inclusiv, iar 90% dintre
judee au mai mult de 59 terenuri, inclusiv.
Quartila 1 arat c 25% dintre judee au mai puin de 70 terenuri inclusiv, iar 75% dintre
judee au mai mult de 70 terenuri, inclusiv.
Quartila 3 arat c 75% dintre judee au mai puin de 133 terenuri inclusiv, iar 25% dintre
judee au mai mult de 133 terenuri, inclusiv.
Decila 9 arat c 90% dintre judee au mai puin de 187 terenuri inclusiv, iar 10% dintre
judee au mai mult de 187 terenuri, inclusiv.
65

Teste
1


1) Sunt discrete urmtoarele variabile:
a) sexul persoanelor, starea civil, domiciliul
b) numrul de membri ai unei gospodrii, numrul de angajai ai unei firme
c) salariul lunar, sperana de via, vrsta

2) Cu ajutorul coeficientului de variaie se caracterizeaz:
a) dispersia unei distribuii
b) normalitatea unei distribuii
c) reprezentativitatea mediei unei distribuii

3) Distribuia unei serii de studeni dup nota a examen este prezentat n tabelul de mai jos:
Nota Nr. studeni
4 15
5 10
7 25
9 10
10 10
TOTAL 70
Au loc rspunsurile:
a) 10 studeni au luat pn n cinci la examen
b) 20 de studeni auu luat peste nou
c) majoritatea au luat sub apte, inclusiv

4) Repartiia unui eantion de 100 studeni dup nota la un examen este prezentat mai jos.
|
|
.
|

\
|
5 25 40 20 10
10 8 6 5 4
: X
. Pentru aceast repartiie, 80% dintre studeni au obinut o not mai
mic de:

a) 5
b) 10
c) 8

5) Pentru o serie statistic se cunosc rezultatele: Q
3
= 4, Q
1
= 1, Q
2
= 1. n aceste condiii, seria
este:
a) asimetric la stnga
b) asimetric la dreapta
c) simetric

6) Pentru o colectivitate de firme, repartizate dup nivelul investiiilor, se cunosc urmtoarele
rezultate: 1000 n x
i
i
2
i
=

, 300 n x
i
i i
=

mld. lei, 100 n


i
i
=

. Se poate considera c populaia


firmelor este:
a) strict omogen

1
Rspunsuri: 1 b; 2 a,c; 3 b,c; 4 c; 5 b; 6 b; 7 a,b,c; 8 a,b.
66
b) omogen
c) neomogen

7) Pentru un eantion de angajai repartizai dup variabila salariul anual ($) s-au obinut
rezultatele din tabelul de mai jos.
Statistics
Current Salary
474
0
$34,000.00
$28,000.00
$30,500
$17,000.000
$24,000.00
$28,000.00
$37,000.00
Valid
Missing
N
Mean
Median
Mode
Std. Deviation
25
50
75
Percentiles

Sunt valabile interpretrile:

a) n medie, un angajat ctig anual 28000$
b) alariul cel mai frecvent este 30500$
c) un sfert dintre angajai au salariul ntre 24000 i 28000$

8) Pentru un eantion de angajai repartizai dup variabila salariul anual ($) s-au obinut
rezultatele din tabelul de mai jos.
Statistics
Current Salary
474
0
$34,000.00
$28,000.00
$30,500
$17,000.000
$24,000.00
$28,000.00
$37,000.00
Valid
Missing
N
Mean
Median
Mode
Std. Deviation
25
50
75
Percentiles

Sunt valabile interpretrile:

a) media nu este reprezentativ
b) populaia nu este omogen dup salariu
c) majoritatea ctig 30500 dolari



67


US 3. ANALIZA STATISTIC A UNEI SERII CONTINUE


Cuprins
3.1 Analiza grafic
3.2 Analiza numeric. Indicatori ai statisticii descriptive
3.3 Aplicaie n SPSS


Obiective
- prezentarea tipurilor de frecvene utilizate n analiza unei serii continue
- prezentarea tipurilor de grafice specifice unei serii continue
- definirea indicatorilor descriptivi, a proprietilor, a modului de calcul i a interpretrii acestora
- realizarea de exemple cu date reale
- prezentarea modului de analiz gafic i numeric a unei serii continue n SPSS


Competene
- nsuirea principalelor metode de analiz grafic i numeric a unei serii continue
- dezvoltarea abilitilor practice de prelucrare i interpretare a datelor statistice sistematizate ntr-
o serie continu
- dezvoltarea capacitii de utilizare a softului statistic pentru prelucrarea automat a datelor
- capacitatea de a realiza o sintez a informaiei statistice, avnd la dispoziie rezultatele analizei
grafice i numerice

Termen mediu: 4 h


Bibliografie

1. Andrei, T. i Stancu, S., Statistic - teorie i aplicaii , Editura All, Bucureti, 1995
2. Jaba, E., Statistica, Ediia a treia, Editura Economica, Bucureti, 2002
3. Jaba, E., Pintilescu, C., Statistic. Teste gril i probleme, Editura Sedcom Libris, Iai, 2005.
4. Lecaillon, J.; Labrousse, C., Statistique descriptive, Editura Cujas, Paris, 1988
5. Mills, Fr.G., Statistical Methods, 3
rd
ed., Henry Holt, New York, 1955.
6. McNabb, D., Research methods in public administration and nonprofit management :
quantitative and qualitative approaches, Armonk, M.E. Sharpe, 2002
7. Tvissi, L.; Isaic-Maniu, Al., Statistica, A.S.E., Bucureti, 1984.
8. Yule, U.G.; Kendall, M.C. - Introducere n teoria statisticii, Editura tiinific, Bucureti, 1969.
9. Wonnacott, T.H., Wonnacott, R.J., Statistique, Economica, Paris, 1991.



68

Caracterizarea unitilor statistice observate dup o variabil continu se realizeaz
folosind metode grafice sau numerice.

3.1 Analiza grafic
Reprezentarea grafic a unei serii dup o variabil continu presupune folosirea
urmtoarelor diagrame: histograma, poligonul frecvenelor, curba frecvenelor sau curba
frecvenelor cumulate. Indicatorii numerici prin care poate fi caracterizat o serie statistic dup o
variabil continu pot fi grupai, ca i n cazul variabilelor discrete, n indicatori ai tendinei
centrale (mrimi medii), indicatori ai dispersiei, indicatori ai asimetriei i boltirii.

3.1.1. Frecvene absolute i relative cumulate cresctor sau descresctor
Frecvenele absolute i relative cumulate cresctor sau descresctor se calculeaz n mod
similar modului de calcul prezentat n cazul variabilelor discrete.
naintea prelucrrii unei serii dup o variabil continu prezentat pe intervale de variaie,
dac limitele intervalelor nu sunt precizate, acestea trebuie nchise:
- n cazul intervalelor egale de variaie, primul i ultimul interval se nchid lund n
considerare aceeai mrime a intervalelor;
- n cazul intervalelor inegale de variaie, primul interval se nchide lund n considerare
mrimea intervalului urmtor, iar ultimul interval se nchide lund n considerare
mrimea intervalului anterior.

Exemplu
Distribuia celor 27 ri membre ale Uniunii Europene dup indicele preurilor de consum
armonizat (IPCA) nregistrat n anul 2011 (%) este prezentat n tabelul de mai jos:

Tabelul 3.1. Distribuia rilor membre ale Uniunii Europene dup indicele preurilor de
consum armonizat (%) din anul 2011
IPCA
(%)
Numr ri
pn la 110 1
110-120 18
120-130 2
130-140 3
peste 140 3
TOTAL 27
Sursa: Date prelucrate dup Baza de date Eurostat, accesat pe 1 noiembrie 2012
http://epp.eurostat.ec.europa.eu/portal/page/portal/statistics/search_database

Se cere s se calculeze frecvenele absolute i relative cumulate cresctor sau descresctor.

Rezolvare
nchiderea intervalelor de variaie
Mrimea intervalelor de variaie este l=10. Limita inferioar a primului interval de variaie
se nchide lund n considerare aceeai mrime, deci: 110-10=100. Limita superioar a ultimului
interval de variaie este: 140+10=150.

Frecvene absolute cumulate cresctor i descresctor
Frecvenele absolute cumulate cresctor i descresctor se calculeaz dup relaiile:
69

= + + +=
i
1 h
h i 1 i i
n n N N , respectiv

=
+
= + | |=
m
i h
h i 1 i i
n n N N .
Valorile frecvenelor absolute cumulate cresctor i descresctor pentru exemplul dat sunt
prezentate n tabelul de mai jos:

Tabelul 3.2. Frecvene absolute cumulate cresctor i descresctor
x
i-1
-x
i
n
i

+
i
N |
i
N
100-110 1 1 27
110-120 18 19 26
120-130 2 21 8
130-140 3 24 6
140-150 3 27 3
TOTAL 27 - -

Interpretare
Un numr de 19 ri au indicele preurilor de consum de pn la 120 % inclusiv ( +
1
N ).
Un numr de 21 ri au un indice al preurilor de consum de pn la 130 % inclusiv ( +
2
N ). n
mod similar se interpreteaz celelalte valori din tabelul de mai sus.
Din numrul total de ri, 3 ri au indicele preurilor de consum de peste 140 %, inclusiv.
Un numr de 6 ri au indicele preurilor de consum de peste 130 %, inclusiv. n mod similar se
interpreteaz celelalte valori din tabelul de mai sus.

Observaie
n interpretarea frecvenelor absolute cumulate cresctor se consider limita superioar a
intervalului de variaie, iar n interpretarea frecvenelor absolute cumulate descresctor se
consider limita inferioar a intervalului de variaie.

Frecvene relative cumulate cresctor i descresctor
Frecvenele relative cumulate cresctor i descresctor se calculeaz dup relaiile:

= + + +=
i
1 h
h i 1 i i
f f F F , respectiv

=
+
= + | |=
m
i h
h i 1 i i
f f F F .
Pentru datele din tabelul 3.1, valorile calculate ale frecvenelor relative cumulate cresctor
i descresctor sunt prezentate n tabelul de mai jos:

Tabelul 3.3. Frecvene relative cumulate cresctor i descresctor
x
i-1
-x
i
n
i
f
i
(%)
+
i
F |
i
F
100-110 1 3,7 3,7 100,00
110-120 18 66,7 70,4 96,3
120-130 2 7,4 77,8 29,6
130-140 3 11,1 88,9 22,2
140-150 3 11,1 100,00 11,1
TOTAL 27 100,00 - -

Interpretare
70
Ponderea rilor care au indicele preurilor de consum de pn la 120 % ( +
1
F ) este de
70,4%. Ponderea rilor care au indicele preurilor de consum de pn la 130 % ( +
2
F ) este de
77,8%. n mod similar se interpreteaz celelalte valori din Tabelul 3.3.
Ponderea rilor care au indicele preurilor de consum de peste 110 % este de 96,3%.
29,6% din numrul total de ri au indicele preurilor de consum de peste 120%. n mod similar se
interpreteaz celelalte valori din Tabelul 3.3.

3.1.2. Tipuri de grafice
O distribuie statistic dup o variabil numeric continu poate fi reprezentat grafic
folosind histograma, poligonul frecvenelor, curba frecvenelor i curba frecvenelor cumulate.

Histograma
Construirea histogramei presupune ridicarea unor dreptunghiuri alturate, cu baza egal, n
cazul intervalelor egale de variaie, sau inegal, n cazul intervalelor inegale, de nlime n
i
. Alura
histogramei, considernd intervale egale de variaie, este reprezentat n figura de mai jos:
10,00 8,00 6,00 4,00
5
4
3
2
1
0
F
r
e
q
u
e
n
c
y
Histogram

Figura 21. Histograma

Poligonul frecvenelor
Construirea poligonului frecvenelor presupune gsirea locului geometric al punctelor A
i

de coordonate (
i
'
i
n , x ) sau (
i
'
i
n , x ) i unirea acestora prin segmente de dreapt. Valorile
'
i
x
reprezint mijlocul sau centrul intervalelor de variaie, calculat ca medie aritmetic simpl a
limitelor intervalelor de variaie:
2
x x
x
i 1 i '
i
+
=

.

Curba frecvenelor
Construirea curbei frecvenelor presupune ajustarea printr-o linie curb, continu a
poligonului frecvenelor. Curba frecvenelor pentru o distribuie normal este reprezentat n
figura de mai jos:

71
10,00 8,00 6,00 4,00
Nota
6
5
4
3
2
1
0
F
r
e
q
u
e
n
c
y

Figura 22. Curba frecvenelor

Curba frecvenelor cumulate
Construirea curbei frecvenelor cumulate presupune reprezentarea grafic a funciei de
repartiie a frecvenelor unei variabile: F(X<x
i
). Alura curbei frecvenelor cumulate cresctor este
reprezentat n figura de mai jos:
5 6 7 8 9
nota
0%
25%
50%
75%
100%
P
e
r
c
e
n
t

Figura 23. Curba frecvenelor cumulate cresctor


3.2 Analiza numeric. Indicatori ai statisticii descriptive

Analiza numeric presupune calculul i interpretarea indicatorilor statisticii descriptive: ai
tendinei centrale, ai dispersiei i ai formei distribuiei.

3.2.1. Indicatori ai tendinei centrale (mrimi medii)

a. Media aritmetic
Media aritmetic pentru o serie statistic dup o variabil continu se calculeaz dup
relaia:


=
i
i
i
i
'
i
n
n x
x , unde
2
x x
x
i 1 i '
i
+
=

.

72
Exemplu
Distribuia judeelor Romniei dup rata omajului (%) nregsitrat n anul 2010, este
prezentat n tabelul de mai jos:

Tabelul 3.4. Distribuia judeelor Romniei dup rata omajului ( %),
n anul 2010
x
i-1
-x
i
(%)
n
i

2-4 3
4-6 6
6-8 12
8-10 16
10-12 5
TOTAL 42
Sursa: Date prelucrate dup Anuarul Statistic al Romniei, 2011.

Se cere s se calculeze media aritmetic.

Rezolvare
Media aritmetic se calculeaz dup relaia

=
i
i
i
i
'
i
n
n x
x , unde
2
x x
x
i 1 i '
i
+
=

.
Centrul intervalelor de variaie se calculeaz astfel:
0 1
1
2 4
3
2 2
'
x x
x
+ +
= = = ;
1 2
2
4 6
5
2 2
'
x x
x
+ +
= = = etc.
Elementele pentru calculul mediei aritmetice sunt prezentate n tabelul de mai jos:

Tabelul 3.5. Elemente pentru calculul mediei aritmetice
x
i-1
-x
i

(%)
n
i

'
i
x
i
'
i
n x
2-4 3 3 9
4-6 6 5 30
6-8 12 7 84
8-10 16 9 144
10-12 5 11 55
TOTAL 42 - 322

nlocuind n relaia de mai sus se obine:
322
7 67
42
'
i i
i
i
i
x n
x , %
n

= = =



Interpretare
Rata medie a omajului n judeele din Romnia n anul 2010 este de 7,67%.


73

b. Modul (Mo)
Pentru aflarea modului n cazul unei variabile continue, trebuie parcurse urmtoarele
etape:
- se afl frecvena maxim, n
imax
;
- n dreptul acestei frecvene maxime, se citete intervalul modal (x
i-1
, x
i
);
- n acest interval, modul se afl prin interpolare, dup relaia:
2 1
1
1 i
d x Mo
A A
A
+
+ =

, unde:
x
i-1
, reprezint limita inferioar a intervalului modal;
d este mrimea intervalului modal, d= x
i
- x
i-1
;
1
A este diferena dintre frecvena intervalului modal i frecvena intervalului anterior:
1 i max i 1
n n

= A ;
2
A este diferena dintre frecvena intervalului modal i frecvena intervalului urmtor:
1 i max i 1
n n
+
= A .

Exemplu
Distribuia judeelor Romniei dup rata omajului (%) nregistrat n anul 2010, este
prezentat n tabelul de mai jos:

Tabelul 3.6. Distribuia judeelor Romniei dup rata omajului ( %)
din anul 2010
x
i-1
-x
i
(%)
n
i

2-4 3
4-6 6
6-8 12
8-10 16
10-12 5
TOTAL 42

Se cere s se calculeze valoarea modului.

Rezolvare
Etapele aflrii modului sunt:
- se afl frecvena maxim, n
imax
=16;
- n dreptul acestei frecvene maxime se citete intervalul modal (8-10);
- n acest interval, modul se afl prin interpolare, dup relaia:
2 1
1
1 i
d x Mo
A A
A
+
+ =

, unde:
x
i-1
=8;
d= x
i
- x
i-1
=10-8=2 ;
1 1
16 12 4
i max i
n n

A = = = ;
1 1
16 5 11
i max i
n n
+
A = = = .
nlocuind n relaia de mai sus, se obine:
74
16 12
8 2 8 53
16 12 16 5
( )
Mo ,
( ) ( )

= + =
+
%

Interpretare
Cele mai multe judee din Romnia au avut, n anul 2010, o rat a omajului de 8,53%.

c. Mediana (Me)
Aflarea medianei presupune parcurgerea urmtoarelor etape:
- se calculeaz unitatea median:
1
2
i
Me i
n
U
+
=

;
- se calculeaz frecvenele absolute cumulate cresctor, Ni;
- se afl prima valoare NiU
Me
;
- n dreptul primei valori NiU
Me
, se citete intervalul median: (x
i-1
, x
i
);
- n acest interval, mediana se afl prin interpolare dup relaia:
i
1 i
Me
1 i
n
N U
d x Me
+
+ =

, unde:
x
i-1
, reprezint limita inferioar a intervalului median;
d este mrimea intervalului median, d= x
i
- x
i-1
;
+
1 i
N este frecvena absolut cumulat corespunztoare intervalului anterior intervalului median;
n
i
este frecvena absolut corespunztoare intervalului median.

Exemplu
Distribuia judeelor Romniei dup rata omajului (%) nregistrat n anul 2010, este
prezentat n tabelul de mai jos:

Tabelul 3.7. Distribuia judeelor Romniei dup rata omajului ( %)
din anul 2010
x
i-1
-x
i
(%)
n
i

2-4 3
4-6 6
6-8 12
8-10 16
10-12 5
TOTAL 42

Se cere s se calculeze mediana.

Rezolvare
Etape pentru aflarea medianei:
- se calculeaz unitatea median:
42 1
21 5
2 2
i
Me i
n
U ,
+
= = =

;
- se calculeaz frecvenele absolute cumulate cresctor, Ni. Acestea sunt prezentate n
tabelul de mai jos:

75

Tabelul 3.8. Frecvenele absolute cumulate cresctor
x
i-1
-x
i
n
i

+
i
N
2-4 3 3
4-6 6 9
6-8 12 21
8-10 16 37
10-12 5 42
TOTAL 42 -

- prima valoare Ni=37 > U
Me
=21,5;
- n dreptul acestei valori, se citete intervalul median: (8-10);
- n acest interval, mediana se afl prin interpolare dup relaia:
i
1 i
Me
1 i
n
N U
d x Me
+
+ =

, unde:
x
i-1
=8;
d= x
i
- x
i-1
=10-8=2;
1
21
i
N

+= ;
n
i
= 16.
nlocuind n relaia de mai sus, se obine:
21 5 21
8 2 8 125
16
,
Me ,

= + = %.
Interpretare
Jumtate din judeele Romniei au nregistrat n anul 2010 o rat a omajului de pn la
8,125% i jumtate din judeele Romniei au nregistrat o rat a omajului de peste 8,125%.

d. Generalizarea medianei: quantilele

1. Quartilele
Quartila unu (Q
1
)
Aflarea quartilei unu presupune parcurgerea urmtoarelor etape:
- se calculeaz unitatea quartilic unu:
4
n
U
i
i
Q
1

= ;
- se calculeaz frecvenele absolute cumulate cresctor, Ni;
- se afl prima valoare NiU
Q
1
;
- n dreptul primei valori NiU
Q
1
, se citete intervalul quartilic unu: (x
i-1
, x
i
);
- n acest interval, quartila unu se afl prin interpolare dup relaia:
1
1
Q
1 i
Q
1 i 1
n
N U
d x Q
+
+ =

, unde:
x
i-1
, reprezint limita inferioar a intervalului quartilic unu;
d este mrimea intervalului quartilic unu, d= x
i
- x
i-1
;
+
1 i
N este frecvena absolut cumulat corespunztoare intervalului anterior intervalului
quartilic unu;
n
Q1
este frecvena absolut corespunztoare intervalului quartilic unu.

Quartila doi (Q
2
)
76
Dup cum am artat n cazul variabilelor discrete, quartila doi este egal cu mediana,
Q
2
=Me.

Quartila trei (Q
3)

Aflarea quartilei trei presupune parcurgerea urmtoarelor etape:
- se calculeaz unitatea quartilic trei:
3
3 1
4
i
Q i
n
U
| |
+
|
\ .
=

;
- se calculeaz frecvenele absolute cumulate cresctor, Ni;
- se afl prima valoare NiU
Q
3
;
- n dreptul primei valori NiU
Q
1
se citete intervalul quartilic trei: (x
i-1
, x
i
);
- n acest interval, quartila trei se afl prin interpolare dup relaia:
3
3
Q
1 i
Q
1 i 3
n
N U
d x Q
+
+ =

, unde:
x
i-1
, reprezint limita inferioar a intervalului quartilic trei;
d este mrimea intervalului quartilic trei, d= x
i
- x
i-1
;
+
1 i
N este frecvena absolut cumulat corespunztoare intervalului anterior intervalului
quartilic trei;
n
Q3
este frecvena absolut corespunztoare intervalului quartilic trei.


Exemplu
Distribuia judeelor Romniei dup rata omajului (%) nregistrat n anul 2010, este
prezentat n tabelul de mai jos:

Tabelul 3.9. Distribuia judeelor Romniei dup rata omajului ( %)
din anul 2010
x
i-1
-x
i
(%)
n
i

2-4 3
4-6 6
6-8 12
8-10 16
10-12 5
TOTAL 42

Se cere s se calculeze quartila unu i quartila trei.

Rezolvare
Quartila unu
Etape pentru aflarea quartilei unu:
- se calculeaz unitatea quartilic unu:
1
1
43
10 75
4 4
i
Q i
n
U ,
+
= = =

;
- se calculeaz frecvenele absolute cumulate cresctor, Ni. Acestea sunt prezentate n
tabelul de mai jos:

77


Tabelul 3.10. Distribuia judeelor Romniei dup rata omajului (%) din anul 2010
x
i-1
-x
i
n
i

+
i
N
2-4 3 3
4-6 6 9
6-8 12 21
8-10 16 37
10-12 5 42
TOTAL 42 -

- prima valoare Ni=21 U
Q
1
=10,75;
- n dreptul acestei valori se citete intervalul quartilic unu: (6-8);
- n acest interval, quartila unu se afl prin interpolare dup relaia:
1
1
Q
1 i
Q
1 i 1
n
N U
d x Q
+
+ =

, unde:
x
i-1
=6;
d= x
i
- x
i-1
=8-6=2;
1
9
i
N

+= ;
n
i
= 12.
nlocuind n relaia de mai sus, se obine:
1
10 75 9
6 2 6 29
12
,
Q ,

= + = %
Interpretare
25% din judeele Romniei au avut n anul 2010 o rat a omajului de pn la 6,29%, iar
75% au avut o rat a omajului de peste 6,29 %.

Quartila trei
- se calculeaz unitatea quartilic trei:
3
3 1
3 43
32 25
4 4
i
Q i
n
U ,
| |
+
|

\ .
= = =

;
- prima valoare Ni=37 U
Q
1
=32,25;
- n dreptul acestei valori se citete intervalul quartilic trei: (8-10);
- n acest interval, quartila trei se afl prin interpolare dup relaia:
3
3
Q
1 i
Q
1 i 3
n
N U
d x Q
+
+ =

, unde:
x
i-1
=8;
d= x
i
- x
i-1
=10-8=2;
1
21
i
N

+= ;
n
i
= 16.
nlocuind n relaia de mai sus, se obine:
3
32 25 21
8 2 9 41
16
,
Q ,

= + = %.

Interpretare
75% din judeele Romniei au valori ale ratei omajului de pn la 9,41%, iar 25% din
judee au valori ale ratei omajului de peste 9,41%.
78


3.2.2. Indicatori ai dispersiei
Principalii indicatori ai dispersiei sunt:
1. Amplitudinea de variaie
Amplitudinea de variaie msoar distana dintre nivelul maxim i nivelul minim al unei
variabile. Se calculeaz pe baza relaiei:
min max
x x A = .

2. Variana
Variana se calculeaz pe baza relaiei:


=
i
i
i
2
i
'
i
2
n
n ) x x (
s . Variana nu are unitate de msur i nu se interpreteaz.

3. Abaterea medie ptratic (abaterea standard)
Abaterea medie ptratic se calculeaz pe baza relaiei:


= =
i
i
i
2
i
'
i
2
n
n ) x x (
s s . Abaterea medie ptratic reprezint variaia medie a
valorilor individuale ale variabilei X de la nivelul mediu, n sens pozitiv i negativ.

4. Coeficientul de variaie
Coeficientul de variaie se calculeaz dup relaia:
100
x
s
v = .

Exemplu
Distribuia judeelor Romniei dup rata omajului (%) din anul 2010, este prezentat n
tabelul de mai jos:

Tabelul 3.11. Distribuia judeelor Romniei dup rata omajului ( %)
din anul 2010
x
i-1
-x
i
(%)
n
i

2-4 3
4-6 6
6-8 12
8-10 16
10-12 5
TOTAL 42

Se cere s se calculeze abaterea standard i coeficientul de variaie.

Rezolvare
Abaterea standard
79
Abaterea standard se calculeaz pe baza relaiei:


= =
i
i
i
2
i
'
i
2
n
n ) x x (
s s .
Pentru aceast distribuie, media aritmetic este 7 67 x , = %.
Elementele de calcul ale abaterii standard sunt prezentate n tabelul de mai jos:

Tabelul 3.12. Elemente de calcul ale abaterii standard
x
i-1
-x
i
n
i

'
i
x x x
'
i

2 '
i
) x x (
i
2 '
i
n ) x x (
2-4 3 3 -4,67 21,81 65,43
4-6 6 5 -2,67 7,13 42,78
6-8 12 7 -0,67 0,45 5,4
8-10 16 9 1,33 1,77 28,32
10-12 5 11 3,33 11,09 55,45
TOTAL 42 - - - 197,38

nlocuind n relaia de mai sus se obine:
2
2
197 38
2 17
42
'
i i
i
i
i
( x x ) n
,
s s ,
n

= = = =

%.

Interpretare
Ratele omajului ale judeelor Romniei din anul 2010, variaz, n medie, de la nivelul
mediu al ratelor omajului cu 2,17%

Coeficientul de variaie
Coeficientul de variaie se calculeaz dup relaia:
2 17
100 100 28 29
7 67
s ,
v , %
x ,
= = = .

Interpretare
Valoarea coeficientului de variaie arat c distribuia judeelor Romniei dup rata
omajului din anul 2010 este o distribuie relativ omogen, caracterizat printr-o dispersie relativ
mic (v<50%). Media este reprezentativ pentru aceast distribuie.


3.2.3. Indicatori ai formei unei distribuii

Asimetria
Indicatorii asimetriei se calculeaz, n cazul unei variabile continue, astfel:
1. Coeficientul de asimetrie Pearson
Coeficientul de asimetrie Pearson se calculeaz pe baza relaiei:
3
2
2
3
1

| = , unde:
80


=
i
i
i
3
i
'
i
3
n
n ) x x (
reprezint momentul centrat de ordinul 3, unde:
2
x x
x
i 1 i '
i
+
=

;
2
i
i
i
2
i
'
i
2
s
n
n ) x x (
=

=

reprezint momentul centrat de ordinul 2, adic variana.


Acest indicator este ntotdeauna pozitiv. Sensul asimetriei este dat de semnul lui
3
.
Atunci cnd
3
>0, distribuia este asimetric la dreapta. Atunci cnd
3
<0, distribuia este
asimetric la stnga.

2. Coeficientul de asimetrie Fisher
Coeficientul de asimetrie Fisher se calculeaz pe baza relaiei:
3
3
1
s

= .
Interpretarea valorii acestui coeficient este similar coeficientului de asimetrie Pearson.

Boltirea
Indicatorii boltirii se calculeaz dup relaiile
1. Coeficientul de boltire Pearson
Coeficientul de boltire Pearson se calculeaz pe baza relaiei:
4
4
2
2
4
2
s

| = = , unde:


=
i
i
i
4
i
'
i
4
n
n ) x x (
reprezint momentul centrat de ordinul 4.
O valoare a coeficientului de boltire Pearson 3
2
= | arat o distribuie mezocurtic. O
valoare 3
2
> | arat o distribuie leptocurtic iar o valoare 3
2
< | arat o distribuie platicurtic.

2. Coeficientul de boltire Fisher
Coeficientul de boltire Fisher se calculeaz pe baza relaiei:
3
2 2
= | .
O valoare a coeficientului de boltire Fisher 0
2
= arat o distribuie mezocurtic. O
valoare 0
2
> arat o distribuie leptocurtic iar o valoare 0
2
< arat o distribuie platicurtic.

Exemplu
Distribuia judeelor Romniei dup rata omajului (%), este prezentat n tabelul de mai
jos:




Tabelul 3.13. Distribuia judeelor Romniei dup rata omajului ( %)
din anul 2010
81
x
i-1
-x
i
(%)
n
i

2-4 3
4-6 6
6-8 12
8-10 16
10-12 5
TOTAL 42

Se cere s se calculeze coeficientul de asimetrie Pearson i coeficientul de boltire Pearson.

Rezolvare
Coeficientul de asimetrie Pearson se calculeaz pe baza relaiei:
3
2
2
3
1

| = , unde:


=
i
i
i
3
i
'
i
3
n
n ) x x (
;
2
i
i
i
2
i
'
i
2
s
n
n ) x x (
=

=

.
Elementele de calcul ale momentelor centrate de ordinul doi i trei sunt prezentate n
tabelul de mai jos:

Tabelul 3.14. Elemente de calcul ale momentelor centrate de ordinul doi i trei
x
i-1
-x
i
n
i

'
i
x x x
'
i

2 '
i
) x x (
i
2 '
i
n ) x x (
3 '
i
) x x (
i
3 '
i
n ) x x (
2-4 3 3 -4,67 21,81 65,43 -101,85 -305,55
4-6 6 5 -2,67 7,13 42,78 -19,03 -114,18
6-8 12 7 -0,67 0,45 5,4 -0,3 -3,6
8-10 16 9 1,33 1,77 28,32 2,35 37,6
10-12 5 11 3,33 11,09 55,45 36,93 184,65
TOTAL 42 - - - 197,38 - -201,08

nlocuind n relaiile de mai sus, se obine:
3
201 08
4 788
42
,
,

= = ;
2
197 38
4 699
42
,
, = = .
Coeficientul de asimetrie Pearson este:
( )
2
1 3
4 788
0 22
4 699
,
22,924
,
, 103,757
|

= = = .

Interpretare
Valoarea coeficientului de asimetrie Pearson arat c distribuia dat prezint o asimetrie
( 0
1
= | ) la stnga (
3
<0).

Coeficientul de asimetrie Fisher este:
( )
3
1 3 3 3
4 788 4 788
0 46
2 168
4 699
, ,
,
s ,
,


= = = = .
82
Valoarea coeficientului de asimetrie Fisher arat, de asemenea, c distribuia dat prezint
o asimetrie la stnga.

Coeficientul de boltire Pearson
4
4
2
2
4
2
s

| = = , unde:


=
i
i
i
4
i
'
i
4
n
n ) x x (
.
Elementele de calcul ale momentului centrat de ordinul patru sunt prezentate n tabelul de
mai jos:

Tabelul 3.15. Elemente de calcul ale momentului centrat de ordinul patru
x
i-1
-x
i
n
i

'
i
x x x
'
i

4 '
i
) x x (
i
4 '
i
n ) x x (
2-4 3 3 -4,67 475,63 1426,89
4-6 6 5 -2,67 50,82 304,92
6-8 12 7 -0,67 0,2 2,4
8-10 16 9 1,33 3,13 50,08
10-12 5 11 3,33 122,96 614,8
TOTAL 42 - - - 2399,09

nlocuind n relaiile de mai sus, se obine:
4
2399 09
42
,
57,12 = = .
Coeficientul de boltire Pearson este:
2 2
57 12
2 59
4 699
,
,
,
| = = .

Interpretare
Valoarea coeficientului de boltire Pearson arat c distribuia dat este o distribuie
platicurtic ( 3
2
< | ).

3.3 Aplicaie n SPSS
Se consider distribuia judeelor Romniei dup rata omajului (%), n anul 2010,
prezentat n tabelul 3.16.

Folosind programul informatic SPSS (Statistical Package for Social Sciences), se cere s
se determine i s se interpreteze mrimile medii, quartila 1 i quartila 3, decila 1 i decila 9,
indicatorii dispersiei i indicatorii formei unei distribuii.

83
Tabelul 3.16. Distribuia judeelor Romniei dup rata omajului, n anul 2010

Rezolvare
Valorile indicatorilor descriptivi sunt prezentate n tabelul 3.17.


Tabelul 3.17. Indicatorii statisticii descriptive, obinui cu ajutorul programului SPSS

84
Valorile indicatorilor sunt:
- media aritmetic (Mean) este 7.8927%;
- mediana (Median) este 8.1%;
- modul (Mode) este 5.8%;
- abaterea standard (Std. Deviation) este 1.96652%;
- variana (Variance) este 3.867;
- coeficientul de asimetrie Fisher (Skewness) este -0.459;
- coeficientul de boltire Fisher (Kurtosis) este 0.196;
- amplitudinea variaiei (Range) este 9.1%;
- decila 1 (Percentile 10) este 5.32%;
- quartila 1 (Percentile 25) este 6.4%;
- quartila 3 (Percentile 75) este 9.35%;
- decila 9 (Percentile 90) este 10.34%.

Interpretare
Media aritmetic arat c, n medie, un jude are o rat a omajului de 7.8927%.
Mediana arat c 50% dintre judee au o rat a omajului mai mic de 8.1%, inclusiv, iar
50% dintre judee au rata omajului mai mare de 8.1%, inclusiv.
Modul arat c cel mai frecvent, judeele au o rat a omajului de 5.8%.
Abaterea standard arat c, n medie, rata omajului unui jude se abate de la rata medie a
omajului cu 1.96652%.
Coeficientul de asimetrie Fisher arat c distribuia este asimetric la stnga.
Coeficientul de boltire Fisher arat c distribuia este leptocurtic.
Amplitudinea variaiei arat c diferena maxim dintre ratele omajului a dou judee este
de 9.1%.
Decila 1 arat c 10% dintre judee au rata omajului mai mic de 5.32% inclusiv, iar 90%
dintre judee au rata omajului mai mare de 5.32%, inclusiv.
Quartila 1 arat c 25% dintre judee au au rata omajului mai mic de 6.4% inclusiv, iar
75% dintre judee au rata omajului mai mare de 6.4%, inclusiv.
Quartila 3 arat c 75% dintre judee au rata omajului mai mic de 9.35% inclusiv, iar
25% dintre judee au rata omajului mai mare de 9.35%, inclusiv.
Decila 9 arat c 90% dintre judee au rata omajului mai mic de 10.34% inclusiv, iar
10% dintre judee au rata omajului mai mare de 10.34%, inclusiv

85
Teste
1


1) Histograma este:
a) specific seriilor continue
b) o medie special
c) o suprafa

2) Pentru rezultatele din tabelul de mai jos sunt valabile rspunsurile:
Statistics
Rata somajului
N Valid 41
Mean 7.8927
Median 8.1000
Mode 5.80
Std. Deviation 1.96652
Variance 3.867
Skewness -.459
Kurtosis .196
Range 9.10
Percentiles 10 5.3200
25 6.4000
75 9.3500
90 10.3400
a) distribuia este asimetric la stnga
b) media este reprezentativ
c) jumtate dintre uniti au valoarea sub 6,4

3) Pentru un eantion de angajai repartizai dup variabila salariul anual ($) s-au obinut
rezultatele din tabelul de mai jos.
Statistics
Current Salary
474
0
$34,000.00
$28,000.00
$30,500
$17,000.000
$24,000.00
$28,000.00
$37,000.00
Valid
Missing
N
Mean
Median
Mode
Std. Deviation
25
50
75
Percentiles

Sunt valabile interpretrile :
a) repartiia angajailor nregistreaz o asimetrie la dreapta
b) repartiia angajailor nregistreaz o asimetrie la stnga
c) epartiia angajailor este simetric

1
Rspunsuri: 1- a,c; 2 a,b; 3 - a; 4 b; 5 c.
86

4) Pentru repartiia de mai jos, quartila 1 are valoarea:
x
i-1
-x
i
n
i

0- 10 20
10-20 40
20-30 35
30-40 15
40-50 10
TOTAL 120
a) 10
b) 12,5
c) 25

5) Pentru repartiia de mai jos, modul are valoarea:
x
i-1
-x
i
n
i

0- 10 5
10-20 10
20-30 20
30-40 15
40-50 10
TOTAL 60
a) 20,5
b) 30
c) 36,67



87

US 4. ANALIZA STATISTIC A UNEI SERII CALITATIVE


Cuprins
4.1 Analiza grafic
4.2 Analiza numeric
4.3 Aplicaie n SPSS

Obiective
- prezentarea tipurilor de grafice specifice unei serii calitative
- definirea indicatorilor descriptivi, a proprietilor, a modului de calcul i a interpretrii acestora
- realizarea de exemple cu date reale
- prezentarea modului de analiz gafic i numeric a unei serii categoriale n SPSS


Competene
- nsuirea principalelor metode de analiz grafic i numeric a unei serii calitative
- dezvoltarea abilitilor practice de prelucrare i interpretare a datelor statistice sistematizate ntr-
o serie calitative
- dezvoltarea capacitii de utilizare a softului statistic pentru prelucrarea automat a datelor
- capacitatea de a realiza o sintez a informaiei statistice, avnd la dispoziie rezultatele analizei
grafice i numerice

Termen mediu: 4 h


Bibliografie

1. Andrei, T. i Stancu, S., Statistic - teorie i aplicaii , Editura All, Bucureti, 1995
2. Isaic-Maniu, Al.; Grdinaru, A.; Voineagu, V.; Mitru, C. - Statistic teoretic i economic,
Editura Tehnic, Chiinu, 1994.
3. Jaba, E., Statistica, Ediia a treia, Editura Economica, Bucureti, 2002
4. Jaba, E., Pintilescu, C., Statistic. Teste gril i probleme, Editura Sedcom Libris, Iai, 2005.
5. Lecaillon, J.; Labrousse, C., Statistique descriptive, Editura Cujas, Paris, 1988
6. Mills, Fr.G., Statistical Methods, 3
rd
ed., Henry Holt, New York, 1955.
7. McNabb, D., Research methods in public administration and nonprofit management :
quantitative and qualitative approaches, Armonk, M.E. Sharpe, 2002
8. Yule, U.G.; Kendall, M.C. - Introducere n teoria statisticii, Editura tiinific, Bucureti, 1969.
9. Wonnacott, T.H., Wonnacott, R.J., Statistique, Economica, Paris, 1991.

88

4.1. Analiza grafic
O distribuie statistic dup o variabil categorial nominal sau ordinal poate fi
reprezentat grafic folosind diagrame de structur: cercul de structur, dreptunghiul de structur
etc.
Alura acestor grafice este prezentat n figurile de mai jos:
65,0%
35,0%
Feminin
Masculin
Sexul_persoanei


Figura 24. Cercul de structur

Feminin Masculin
Sexul_persoanei
70,0%
60,0%
50,0%
40,0%
30,0%
20,0%
10,0%
0,0%
P
e
r
c
e
n
t
65,0%
35,0%

Figura 25. Dreptunghiul de structur


4.2. Analiza numeric

4.2.1. Mrimi relative

Pentru o distribuie dup o variabil categorial nominal se pot calcula frecvenele
relative, respectiv ponderea unitilor din fiecare categorie n volumul total al colectivitii, dup
relaia:
100
n
n
100
n
n
f
i
i
i
i
i
= =

.
89

Exemplu
Distribuia studenilor dintr-o grup pe sexe, la 1 ianuarie 2009, se prezint astfel:

Tabelul 4.1 Distribuia studenilor dintr-o grup
pe sexe, la 1 ianuarie 2009
Sexul persoanei Nr. studeni
Masculin 7
Feminin 13
TOTAL 20

Se cere s se calculeze frecvenele relative.

Rezolvare
Frecvenele relative se calculeaz dup relaia:
100
n
n
100
n
n
f
i
i
i
i
i
= =

.
Pentru exemplul dat, avem:
% 35 100
20
7
100
n
n
f
i
i
1
1
= = =

; % 65 100
20
13
100
n
n
f
i
i
2
2
= = =

.
Interpretare
Ponderea persoanelor de sex masculin este de 35%, iar ponderea persoanelor de sex
feminin este de 65%.

4.2.2 Mrimi medii
n cazul unei distribuii dup o variabil categorial nominal singura mrime medie care
poate fi calculat este modul. Modul arat categoria variabilei X cea mai frecvent observat,
respectiv cea care corespunde frecvenei maxime.
n cazul unei distribuii dup o variabil categorial ordinal, mrimile medii care pot fi
calculate sunt modul i mediana.

Exemple
Distribuia salariailor dintr-o regiune pe sexe, la 1 ianuarie 2009 se prezint astfel:

Tabelul 4.2 Distribuia salariailor dintr-o regiune
pe sexe, la 1 ianuarie 2009
Sexul persoanei Nr. studeni
1-Masculin 700
2-Feminin 130
TOTAL 830

Se cere s se afle valoarea modului.

Rezolvare
Pentru aflarea modului, se observ c n
imax
=700. Categoria care corespunde acestei
frecvene maxime este x
i
=1-Masculin.

90
Interpretare
Cele mai multe persoane din colectivitatea observat sunt de sex masculin.

2. Distribuia salariailor unei firme dup nivelul de studii (Primar, Gimnazial, Liceal,
Superior) se prezint astfel:


Tabelul 4.3 Distribuia salariailor unei firme
dup nivelul de studii
Nivel de studii Nr. persoane
Primar 10
Gimnazial 25
Liceal 15
Superior 50
TOTAL 100

Se cere s se calculeze valorile modului i medianei.

Rezolvare
Modul
Pentru identificarea modului, se afl n
imax
=50. Categoria care corespunde acestei frecvene
maxime este x
i
=Superior.

Interpretare
Cele mai multe persoane din colectivitatea observat au studii superioare.

Mediana
Pentru aflarea medianei, se afl 50
2
100
2
n
U
i
i
Me
= = =

. Se calculeaz frecvenele
absolute cumulate cresctor, prezentate n tabelul de mai jos:

Tabelul 4.4 Frecvenele absolute cumulate cresctor
Nivel de studii Nr. persoane Ni
Primar 10 10
Gimnazial 25 35
Liceal 15 50
Superior 50 100
TOTAL 100 -

Prima valoare Ni=50 U
Me
=50. Mediana este reprezentat de categoria Liceal.

Interpretare
Jumtate din numrul total al persoanelor sunt cu studii primare, gimnaziale i liceale, iar
jumtate sunt cu studii superioare.




91
4.3. Aplicaie n SPSS
Se consider distribuia medaliilor obinute de Romnia la Jocurile Olimpice dup
categoria medaliei, n perioada 1924-2012.
Cu ajutorul programului SPSS, se cere s se determine i s se interpreteze frecvenele
relative, modul i mediana.

Rezolvare
Distribuia medaliilor olimpice i frecvenele relative sunt prezentate n tabelul 4.6, iar
indicatorii medii sunt prezentai n tabelul 4.7.

Tabelul 4.5. Distribuia medaliilor olimpice ale Romniei dup categoria medaliei,
pentru perioada 1924-2012


Interpretare
Frecvenele relative (coloana Percent i Valid Percent) arat c 29% dintre medaliile
olimpice obinute de Romnia sunt de aur, 31,4% sunt de argint, iar 39.9% sunt de bronz.

Pentru a permite programului SPSS s calculeze mrimile medii, fiecrei categorii i s-a
atribuit cte un cod, astfel:
- pentru aur s-a atribuit codul 1;
- pentru argint s-a atribuit codul 2;
- pentru bronz s-a atribuit codul 3.
Rezultatul este prezentat n tabelul 4.7.

Tabelul 4.6. Mrimile medii, obinute cu ajutorul programului SPSS


Interpretare
Mediana este categoria cu codul 2, adic argint. 50% dintre medalii sunt cel mult de
argint, inclusiv, iar 50% din medaliile obinute sunt cel puin de argint, inclusiv.
Modul este categoria cu codul 3, adic bronz. Cele mai multe medalii olimpice sunt de
bronz.


92
Teste
1


1) Sunt nominale urmtoarele variabile:
a) genul persoanelor, starea civil, domiciliul
b) numrul de membri ai unei gospodrii, numrul de angajai ai unei firme
c) salariul lunar, sperana de via, vrsta

2) Pentru un eantion de persoane repartizate dup variabila X (opiunea de vot pentru un candidat
la funcia de preedinte), s-au obinut rezultatele din tabelul de mai jos.

opiunea
i
n

Da 350
Nu 150
Total 500

Este corect rezultatul:
a) n medie, 75% din alegtori voteaz pentru candidatul considerat
b) n medie, la 100 de alegtori 70 voteaz pentru candidatul considerat
c) n medie, 25% dintre alegtori voteaz mpotriva candidatului considerat

3) Dac pentru un candidat au votat 10% pentru i 90% mpotriv, atunci:
a) populaia este omogen
b) abaterea standard este de 9,4%
c) populaia este asimetric la dreapta

4) Dac ntr-o clas sunt 10 studeni de la real, 15 de la uman i 5 de la vocaional, atunci se poate
spune c
a) putem construi o repartiie dup o variabil nominal
b) n medie, dintr-o sut de studeni, 30% sunt de la real
c) valoarea dominant este uman
d) valoarea medie este real



1
Rspunsuri: 1 a; 2 b; 3 a,b; 4 a,b,c
93

PARTEA A DOUA STATISTIC INFERENIAL


US 5. NOIUNI FUNDAMENTALE
Cuprins
5.1. Probabiliti. Variabile aleatoare. Distribuii probabiliste
5.2. Selecie. Eantion. Variabile aleatoare de selecie
5.3. Parametri, estimatori, estimaii. Distribuii de selecie
5.4. Statistici frecvent utilizate n cercetrile prin sondaj


Obiective
- definirea conceptelor fundamentale specifice statisticii infereniale
- prezentarea proprietilor instrumentelor utilizate
- prezentarea de exemple i exerciii pentru aprofundarea


Competene
- nsuirea noiunilor fundamentale ale statisticii infereniale
- nelegerea diferenelor ntre parametri, estimatori i estimaii
- capacitatea de a distinge ntre metodele descriptive i cele infereniale


Termen mediu: 2 h


Bibliografie

1. Andrei, T. i Stancu, S., Statistic - teorie i aplicaii , Editura All, Bucureti, 1995
2. Biji, M.; Biji, El., Statistica teoretic, Editura Didactic i Pedagogic, Bucureti, 1979
3. Jaba, E., Statistica, Ediia a treia, Editura Economica, Bucureti, 2002
4. Jemna, D.V., Econometrie, Editura Sedcom Libris, Iai, 2009
5. Mills, Fr.G., Statistical Methods, 3
rd
ed., Henry Holt, New York, 1955.
6. Yule, U.G.; Kendall, M.C. - Introducere n teoria statisticii, Editura tiinific, Bucureti, 1969.
7. Wonnacott, T.H., Wonnacott, R.J., Statistique, Economica, Paris, 1991.



94

Inferena statistic are ca obiectiv cunoaterea unei populaii n mod indirect, prin
prelucrarea datelor la nivelul unui eantion reprezentativ extras din aceasta, dup o metod care
asigur proprietatea de reprezentativitate (aa cum este metoda extragerii aleatoare). Inferena
statistic presupune estimarea parametrilor unei populaii i testarea ipotezelor statistice.


5.1. Probabiliti. Variabile aleatoare. Distribuii probabiliste

A. Probabiliti
Pentru definirea conceptului de probabilitate este important s se prezinte noiunile de
experien aleatoare, eveniment elementar, mulimea evenimentelor posibile, eveniment aleator.
Experiena aleatoare - o aciune sau un proces care conduce la un ansamblu de rezultate
posibile, fiecare rezultat fiind supus ntmplrii, adic neputnd fi anticipat.
Evenimentul elementar - rezultatul posibil al experienei aleatoare, este notat cu e.
Mulimea evenimentelor elementare este notat cu O i se mai numete mulimea
evenimentelor posibile.

Exemplu
Un exemplu clasic de experien aleatoare este aruncarea unui zar. Evenimentul elementar
este apariia unei fee, n total, existnd ase evenimente elementare, } 6 , 5 , 4 , 3 , 2 , 1 { = .
Evenimentul aleator - un eveniment definit printr-o proprietate, care poate fi ndeplinit
sau nu n urma realizrii experienei aleatoare.

Exemplu
n cazul aruncrii zarului, un eveniment aleator l constituie apariia unei fee cu numr
par. Submulimea care corespunde acestei proprieti este A = {2, 4, 6}.
Evenimentele favorabile - evenimentele care compun submulimea evenimentelor
elementare care ndeplinesc proprietatea de definire a evenimentului aleator. Mulimea acestor
evenimente se numete mulimea evenimentelor favorabile.

Definiii ale probabilitii

a. Definiia clasic a probabilitii (Bernoulli i Laplace)
Probabilitatea ca un eveniment s se realizeze reprezint raportul dintre numrul de
evenimente elementare favorabile realizrii evenimentului i numrul evenimentelor egal posibile.
n
m
card
A card
p =
O
=
) (
) (

unde m este numrul cazurilor favorabile i n este numrul cazurilor posibile, unde
n m 0 s s , ceea ce implic 1 p 0 s s .
Valoarea p=0 corespunde imposibilitii realizrii evenimentului sau evenimentul
imposibil, iar valoarea p=1 corespunde evenimentului cert sau sigur.

Exemplu
n cazul aruncrii zarului, probabilitatea de apariie a unei fee cu numr par este:
5 , 0
6
3
) (
) (
= =
O
=
card
A card
p .

95

b. Definiia probabilitii bazat pe frecven
Probabilitatea este definit ca un caz limit al frecvenei, atunci cnd numrul de
experiene tinde la infinit.
n
m
p
n
= lim , unde m este numrul efectiv de realizri ale unui eveniment dintr-un numr n
de experiene realizate, adic este frecvena relativ de apariie a unui eveniment.

Exemplu
S presupunem c am aruncat un zar de 10 ori, iar faa cu numrul 6 a aprut de 3 ori.
Deci frecvena relativ este 0,3. Dac mrim numrul de aruncri foarte mult (teoretic la infinit),
atunci frecvena de apariie tinde ctre valoarea 1/6, care este tocmai probabilitatea de apariie a
feei cu numrul 6 la aruncarea unui zar.

Definiia axiomatic
Consider c probabilitatea este o aplicaie, o funcie care asociaz fiecrui eveniment
aleator un numr real care msoar posibilitatea ca evenimentul s apar prin realizarea
experienei aleatoare.
Axiome:
- 0 > A) ) A, P( (
- 1 ) P( =
- P(B) P(A) B) P(A , atunci B ) A,B, A ( + = = sau

=
=
= = = =
n
i
i i
n
i
j i i
) P(A ) A P( j, atunci i , pentru A }, A ,n ,i ) {A (
1
1
1
C = B A - A i B sunt incompatibile (exemplu, la aruncarea unui zar, o fa par i o
fa impar)

Proprieti
- -P(A) ) A ) A, P( (
c
1 =
- 0 ) P( =
- 1 0 s s P(A) ) A, (
- B) P(B)-P(A P(A) B) P(A ) A, B, ( + =

Exemplu
A este evenimentul s apar o fa cu numr par, iar B s apar o fa cu numr mai mare
dect 3. S se verifice proprietile.

B. Variabile aleatoare
O experien aleatoare este descris prin mulimea evenimentelor elementare
,...} ,... , {
2 1 n
e e e = O .
Variabila aleatoare este o aplicaie sau o funcie care asociaz fiecrui eveniment
elementar o msur, un numr real: R : X O , R x X
i i i
e = ) (e e , adic
X este o funcie definit pe O, cu valori n mulimea numerelor reale R.

Exemplu
96
Un exemplu de variabil aleatoare este cea asociat experienei aleatoare a aruncrii pe o
mas a dou zaruri. n acest caz, } 6 , 1 j , i ), j , i {( = = O , iar funcia care se poate asocia
experienei este aceea a atribuirii unui numr real fiecrui eveniment elementar egal cu suma
punctelor obinute la fiecare aruncare. Deci,
6 , 1 i,j j, pentru i ) ( r X (i,j), ia = + = = e .
Mulimea valorilor variabilei aleatoare este:
R x x cu }, x ,... x , x { ) ( X
j i n 2 1
e = = O
Se poate vorbi despre probabilitatea ca variabila aleatoare X s ia o anumit valoare,
adic:
} n , 1 i , x ) ( X , { P ) x X P( ) A ( P p
i i i i
= = e = = = = e O e .

Tipuri de variabile aleatoare discrete i continue
n general, o variabil aleatoare discret ia valori distincte pe o mulime a valorilor sale I,
care este o mulime cel mult numrabil.
Variabila aleatoare discret este definit prin:
I i
i
i
p
x
X
e
|
|
.
|

\
|
: .
Variabilele aleatoare continue sunt acele variabile ale cror mulime a valorilor este un
interval mrginit sau nemrginit. Aceste variabile sunt definite cu ajutorul unei funcii f(x), care se
numete funcie densitate de repartiie.
Funcia densitate de repartiie are urmtoarele proprieti:
- 0 ) ( , ) ( > e x f R x
-
}
+

= 1 ) ( dx x f ;

Distribuia unei variabile aleatoare. Funcia de repartiie
Distribuia sau legea de probabilitate a unei variabile aleatoare este dat prin funcia sa de
probabilitate care poate lua diferite forme, n funcie de tipul variabilei.
Pe baza funciei de probabilitate a unei variabile aleatoare, se determin funcia sa de
repartiie. n general, funcia de repartiie este definit prin relaia:
R x x X P x F e < = ) ( ), ( ) ( .
Funcia de repartiie are urmtoarele proprieti:
- 1 ) ( 0 , ) ( s s e x F R x ;
- F(b) b, F(a) R, a ) a,b ( s < e ;
-
+
=
x
x F 1 ) ( lim ;
-

=
x
x F 0 ) ( lim ;
) x ( F ) 0 x ( F , R x ) ( = e .
Dac a < b, se poate demonstra urmtorul rezultat:
R x a F b F b X a P e = < s ) ( ), ( ) ( ) ( .
Pentru variabila discret, funcia de repartiie este

<
=
} x x {
i
i
p ) x ( F .
Pentru cea continu,
}

e =
x
R x dt t f x F ) ( , ) ( ) ( .

97
Caracteristici numerice ale unei variabile aleatoare
Media unei variabile aleatoare
Notam ) X ( M = .
Dac variabila X este discret, atunci:
i
I i
i
p x X M =

e
) ( ,
iar dac variabila X este o variabil continu, dx x f x X M
R
=
}
) ( ) ( .


Dispersia sau variana unei variabile aleatoare
Prin definiie, dispersia unei variabile aleatoare este dat de relaia:
) X ( M ) X ( M )] X ( M X [ M ) X ( V
2 2 2
= = ,
unde M(X
2
) reprezint media variabilei X X X =
2
.
Notam V(X) =
2
o .

Abaterea medie ptratic a unei variabile aleatoare
Numit i abatere standard, abaterea medie ptratic se obine prin relaia: ) X ( V = o ,
adic reprezint rdcina ptrat a dispersiei.

C. Distribuii probabiliste utilizate n statistic

1. Distribuii discrete

a. Distribuia Bernoulli - X ~ B(p).
Este dat printr-un tablou de forma:
|
|
.
|

\
|
p q
1 0
: X , unde ) 1 X ( P p = = , ) 0 X ( P q = = ;
p+q=1.
Parametrii acestei repartiii sunt:
M(X) = p;
V(X) = pq.

b. Distribuia binomial X~ B(n, p)
Repartiia binomial se obine prin generalizarea repartiiei Bernoulli. Prin nsumarea unui
numr de n variabile aleatoare Bernoulli identic repartizate, se obine o variabil binomial.
Repartiia binomial, simbolizat este dat printr-un tablou de forma:
n , 0 k
k n k k
n
q p C
k
: X
=
|
|
.
|

\
|
,
unde p + q = 1, iar k reprezint numrul de realizri ale evenimentului favorabil, n
condiiile repetrii de n ori a experienei Bernoulli.
Parametrii repartiiei binomiale se determin uor, dac se consider c o variabil
binomial este suma a n variabile Bernoulli, X
i
~ B(p).
Variabila binomial se obine astfel:

=
=
n
1 i
i
X X . Pentru aceast variabil, au loc relaiile:
M(X) = np;
V(X) = npq.

98
2. Distribuii continue
a. Distribuia normal generalizat
Repartiia normal generalizat se simbolizeaz ) , ( N
2
o , unde i o
2
sunt parametrii
acestei repartiii: ) X ( M = , respectiv ) X ( V
2
= o .
Funcia densitate de repartiie, n cazul unei repartiii normale generalizate, este dat de
relaia:
2
2
2
) x (
e
2
1
) x ( f
o

t o

= .



b. Distribuia normal standard
Variabila normal standard se obine dintr-o variabil normal generalizat prin procedeul
de standardizare:

o

=
X
Z
O variabil aleatoare repartizat dup o lege normal standard, simbolizat N(0,1), are o
funcie densitate de repartiie dat de relaia:

2
z
2
e
2
1
) z ( f

=
t
, R ze .

Parametrii repartiiei normale standard sunt:
M(Z) = 0;
V(Z) = 1.
Pentru interese practice, de calcul al unor probabiliti, se utilizeaz funcia lui Laplace,
definit pe baza repartiiei normale standard. Funcia lui Laplace este definit de relaia:
dt e
2
1
) z (
z
0
2
t
2
}

= u
t
,
iar valorile acestei funcii se gsesc tabelate.
Funcia de repartiie devine: ) z (
2
1
) z ( F u + =
Pe baza funciei lui Laplace, se poate determina, de exemplu, probabilitatea ca variabila
aleatoare normal standard s ia valori ntr-un interval simetric de tipul (-a; a). Aceast
probabilitate este:

}

= u = u u = = < <
a
a
dt ) t ( f ) a ( 2 ) a ( ) a ( ) a ( F ) a ( F ) a Z a ( P .

Exemplu
P(-1 < Z < 1) = 2 u(1) = 0,682,
P(Z < 1) = F(1) = 1/2 + u(1) = 0,5 + 0,341 = 0,841.

Observaie
Relaia dintre repartiia normal standard i cea generalizat se poate observa uor att prin
relaia dintre cele dou tipuri de variabile, ct i prin relaia existent ntre funciile de repartiie
specifice. Astfel, de exemplu, se poate calcula probabilitatea:
99
)
a
( )
b
( )
a
( F )
b
( F ) b X a ( P
o

o

u

u =

= < < .

Exemplu
Pentru o variabil X ~ N(10,4), s se calculeze probabilitatea P(8 < X < 12) .
P(8 < X < 12) = )
2
10 8
( )
2
10 12
(

u = u(1) - u(-1) = u(1) + u(1) = 2u(1) = 0,682.



b. Distribuia chi-ptrat
O variabil aleatoare repartizat dup o lege chi-ptrat, simbolizat ) , n (
2
o _ .
Dac considerm n variabile aleatoare identic repartizate dup o lege normal standard, X
i
~

N(0,1), n , 1 i = , atunci variabila ) n ( ~ X X
2
n
1 i
2
i
_

=
= .

Exemplu
Pentru o variabil X ~ ) 4 (
2
_ , se poate determina constanta a, astfel nct P (X > a) =
0,05. Din tabela chi-ptrat se citete valoarea a = 9,48.

c. Distribuia Student
O variabil aleatoare repartizat dup o lege Student, simbolizat t(n).
Dac se consider dou variabile aleatoare X~N(0,1) i Y~ ) n (
2
_ , atunci variabila
aleatoare Student se obine prin relaia: ) n ( t ~
n
Y
X
t = , unde n reprezint numrul de grade de
libertate, parametrul acestei distribuii.

Exemplu
Pentru o variabil aleatoare care urmeaz o lege de repartiie Student cu n = 25 grade de
libertate (X ~ t (25)), se cere s se determine valoarea a, astfel nct: P(X > a) = 0,05.
Din tabela Student, pentru o probabilitate de 0,05 i 25 grade de libertate se citete
valoarea a = 1,708.

d. Distribuia Snedecor-Fisher
O variabil aleatoare repartizat dup o lege Snedecor-Fisher, simbolizat ) n , n (
2 1
.
Dac se consider dou variabile aleatoare: X~ ) , n (
1
2
o _ i Y~ ) , n (
2
2
o _ , atunci o
variabil repartizat Fisher se obine prin relaia:
) n , n ( ~
n
Y
n
X
F
2 1
2
1
= , unde n
1
i n
2
reprezint grade de libertate, parametrii repartiiei
Snedecor-Fisher.

Exemplu
Pentru o variabil X ~ F(5, 3), se poate determina constanta a, astfel nct P(X > a) = 0,01.
Din tabela Fisher citete valoarea a = 28,23.
100


5.2. Selecie. Eantion. Variabile aleatoare de selecie

a. Eantionul statistic
n accepiunea cea mai larg, eantionul reprezint o sub-populaie sau un sub-ansamblu
extras din populaia de referin dup o procedur anume. Condiia de baz ca o sub-populaie s
fie un eantion este reprezentativitatea. Notm volumul eantionului cu n.
Un eantion poate fi definit din punct de vedere statistic pe baza observaiilor culese i
nregistrate de la nivelul unei sub-populaii. Un set de n valori statistice ale variabilei X observate
pentru n uniti ale populaiei poart numele de eantion: (
n 2 1
x ,..., x , x ).

b. Selecia de volum n. Variabile aleatoare de selecie. Statistici
Extragerea unui eantion aleator este o experien aleatoare care admite o mulime de
posibiliti. Dintr-o populaie de volum N, se pot extrage k eantioane de volum n. Numrul k de
eantioane posibile depinde de modul de extragere a unitilor:
- dup schema urnei cu revenire:
n
N k = ;
- dup schema urnei fr revenire:
n
N
C k = .

Dac se consider o variabil X, atunci experiena aleatoare a extragerii unui eantion
permite definirea unei structuri matematice care evideniaz toate valorile posibile ale variabilei,
dar organizate sub form de eantioane. Pentru cele k eantioane aleatoare posibil de extras,
rezult structura de tip matrice de mai jos, n care fiecare linie este un eantion posibil de extras:
|
|
|
|
|
.
|

\
|
kn 2 k 1 k
n 2 22 21
n 1 12 11
x .... x x
.......... .......... ..........
x .... x x
x .... x x

Pentru fiecare coloan din matrice se definete o variabil aleatoare (care are ca valori
posibile valorile lui X pentru prima unitate din toate eantioanele posibil de extras), astfel nct
rezult structura de tip vector V: (X
1
, X
2
, , X
n
), care este un vector aleator.
Variabilele X
i
se numesc variabile aleatoare de selecie i se poate demonstra c acestea
sunt identic repartizate cu variabila X (au aceeai lege de probabilitate) i sunt independente
stochastic.
O selecie de volum n este o posibil realizare a experienei aleatoare a extragerii unui
eantion aleator simplu. Considernd variabila X, o selecie este o realizare posibil de forma:
v:(
n 2 1
x ,..., x , x ), adic o valoare posibil a vectorului V.

Statistici
O statistic este o variabil aleatoare obinut ca o combinaie a variabilelor aleatoare de
selecie X
i
.
Dac notm o statistic cu S, aceasta se obine cu ajutorul unei funcii g care compune
elementele vectorului V:
S = goV.
101
De exemplu, dac aplicaia g este o medie, se obine statistica

=
i
X
n
1
S , care este o
variabil aleatoare, ale crei valori posibile sunt mediile tuturor eantioanelor de volum n posibil
de extras din populaia N. O asemenea valoare posibil a statisticii S este media de eantion:

=
i
x
n
1
x .

Distribuia de selecie
Ceea ce este foarte important n cazul unei statistici este repartiia sa probabilistic sau
legea sa de probabilitate. Distribuia unei statistici se numete distribuie de selecie i vizeaz
toate seleciile de volum n posibile n experiena aleatoare a extragerii unui eantion.


5.3. Parametri, estimatori, estimaii. Distribuii de selecie

Teoria inferenei statistice aduce n discuie trei termeni fundamentali: parametrul,
estimatorul i estimaia.

a. Parametri
Parametrul reprezint o valoare fix i necunoscut, numit i valoare real sau adevrat,
a unei populaii studiate dup o anumit variabil. Parametrul este definit de valorile variabilei X
de la nivelul tuturor unitilor populaiei Dac notm cu u parametrul, atunci se poate scrie:
) ,..., , (
2 1 N
x x x f = u . De exemplu, o populaie poate fi descris folosind un indicator al tendinei
centrale, cum ar fi media populaiei ( ), i un indicator al dispersiei, cum ar fi abaterea medie
ptratic (o ).

b. Estimatori
Estimatorul este o statistic, adic o variabil aleatoare care este determinat de totalitatea
eantioanelor posibile de volum dat (n) care se pot extrage din populaia de referin. Estimatorul,
n expresia sa analitic, este definit ca o funcie a variabilelor de selecie X
i
, i=1,n. Dac notm
estimatorul cu u

, atunci ) X ,..., X , X ( g

n 2 1
= u .
Estimatorul este instrumentul principal care permite estimarea (aproximarea cu o valoare
cunoscut, calculat) unui parametru (valoarea necunoscut). Un parametru este estimat prin
intermediul unui estimator, cu ajutorul unei estimaii.

c. Estimaii
Estimaia este o valoare realizat dintre valorile posibile ale estimatorului. O estimaie se
obine la nivelul unui eantion extras, pe baza datelor culese, i este o funcie a valorilor de sondaj
x
i
, i=1,n. Astfel: ) x ,..., x , x ( g

n 2 1
= u .
De regul, exist o diferen ntre estimaie i parametru, care reprezint o eroare de
estimare. Aceast eroare poate fi msurat cu ajutorul proprietilor estimatorilor.

d. Proprietile estimatorilor
Estimarea statistic se realizeaz n baza unor proprieti ale estimatorilor: nedeplasare,
convergen n probabilitate, eficien, convergen n repartiie.
102
Pentru definirea acestor proprieti este important s se porneasc de la o msur a erorii
de estimare a unui estimator, care se numete eroarea medie ptratic:

2 2
] )

( M [ )

( V )

( M u u u u u + = .
n relaia de mai sus, )

( V u este dispersia sau variana estimatorului (o msur a gradului


de mprtiere a valorilor sale posibile fa de media lor sau media estimatorului) i
u u u = )

( M ) ( B , care reprezint deplasarea sau biais-ul estimatorului.


O bun estimare statistic impune ca eroarea de estimare de mai sus s fie minim (ea este
practic zero dac estimaia este identic cu parametrul), adic o dispersie minim i un biais
minim.

Nedeplasarea
Un estimator se numete nedeplasat sau bine centrat (fr biais) dac media sa este egal
cu parametrul: u u = )

( M sau 0 ) ( B = u .

Convergena n probabilitate
Aceast proprietate impune o condiie de volum al eantionului: dac acesta este suficient
de mare, atunci orice valoare posibil a estimatorului (orice estimaie) converge ctre parametru.
Aceast proprietate se poate scrie astfel:
u u
e
p
N n n
)

( sau 1 )

, n n , n , 0 ( P
n
= < > - > c u u c
c c
.
Aceast proprietate este o expresie a legii numerelor mari.

Eficiena
Dintre doi estimatori posibili pentru un parametru, estimatorul cu variana cea mai mic se
numete un estimator mai eficient dect cellalt. Estimatorul cu variana minim este un estimator
eficient.

Convergena n repartiie (teorema limit central)
Aceast proprietate impune o condiie de volum pentru estimatorul transformat prin
operaia de standardizare:
)

( V
)

( M
~

u
u u
u

= . Dac volumul eantionului crete peste o anumit


limit, atunci variabila aleatoare obinut prin standardizarea estimatorului urmeaz o lege de
repartiie normal standard:
) 1 , 0 ( N ~ Z
)

( V
)

( M

rep
N n
n
n n

|
|
.
|

\
|

e
u
u u



5.4. Statistici frecvent utilizate n cercetrile prin sondaj

Considerm o variabil X la nivelul unei populaii de volum N. De asemenea, notm cu
) X ( M = i ) X ( V
2
= o , parametrii populaiei.




103
Media de selecie
Pentru estimarea parametrului medie

=
i
x
N
1
, se utilizeaz estimatorul numit medie
de selecie:

=
i
X
n
1
, obinut ca o medie aritmetic a variabilelor aleatoare de selecie X
i
.
O valoare posibil a estimatorului este media de sondaj

=
i
x
n
1
x .
Utiliznd proprietile mediei, precum i ale variabilelor aleatoare de selecie (au aceeai
parametri ca i variabila X), se poate demonstra c:
= ) ( M , adic estimatorul este nedeplasat;

n
) ( V
2
o
= i c estimatorul este eficient;

e
p
N n n
) ( , adic estimatorul este convergent
Pentru n suficient de mare, se poate aprecia c
) 1 , 0 ( N ~
n

) ( V
) ( M
Z
o

= .

Dispersia de selecie
Pentru estimarea dispersiei,
2
i
2
) x (
N
1
o =

se utilizeaz estimatorul
2
i
2
) X (
n
1
o =

, numit dispersie de selecie.


O valoare posibil a acestui estimator este dispersia de sondaj
2
i
2
) x x (
n
1
s =


Se poate demonstra c pentru acest estimator are loc:
2
2
2 2
n
1 n
n
) ( M o
o
o o

= = .
Cu alte cuvinte, dispersia de selecie este n estimator deplasat.

Dispersia de selecie modificat
Ca o corecie la estimatorul precedent, se construiete dispersia de selecie modificat:
2
i
2
) X (
1 n
1
' o

=

sau
2 2

1 n
n
' o o

= .
O valoare posibil a acestui estimator este dispersia de sondaj modificat
2
i
2
) x x (
1 n
1
' s

.
Se poate uor demonstra c
2 2
) ' ( M o o = , adic este un estimator nedeplasat pentru
dispersie.

Proporia de selecie
La nivelul populaiei totale, pe baza unei proprieti sau condiii A, se poate defini o
variabil alternativ de forma:
|
|
.
|

\
|
t t 1
1 0
: X . Parametrul t reprezint proporia sau ponderea
104
unitilor din populaie care ndeplinesc condiia A:
N
M
= t , unde M este numrul unitilor din
populaie care ndeplinesc condiia A.
Deoarece acest parametru este tocmai media variabilei alternative, estimatorul su este
construit dup acelai tipar cu media de selecie.
Astfel,

=
i
X
n
1
t , unde X
i
au aceeai lege de repartiie cu X. Acest estimator poart
numele de proporie de selecie, iar o valoare posibil a sa este o proporie de eantion:
n
m
w = , unde m este numrul unitilor din eantion care ndeplinesc condiia A.
Proporia de selecie are aceleai proprieti cu media de selecie.
t t = ) ( M , este nedeplasat;

n
) 1 (
) ( V
t t
t

= , este eficient;
t t
e
p
N n n
) ( , este convergent
Pentru n suficient de mare, se poate aprecia c
) 1 , 0 ( N ~
n
) 1 (

Z
t t
t t

= .

Tabel sintetizator
Parametru Estimator Estimaie
Media

=
i
x
N
1

Media de selecie

=
i
X
n
1

Media de eantion

=
i
x
n
1
x
Dispersia
2
i
2
) x (
N
1
o =


Dispersia de selecie modificat
2
i
2
) X (
1 n
1
' o


Dispersia de eantion modificat
2
i
2
) x x (
1 n
1
' s


Abaterea standard
o
' o s
Proporia
N
M
= t
Proporia de selecie

=
i
X
n
1
t
Proporia de eantion
n
m
w =
Diferena dintre dou medii
2 1


2 1


2 1
x x

105
Teste
1


1) O probabilitate se determin clasic ca raport ntre numrul de evenimente favorabile realizrii
unui eveniment i:
a) numrul evenimentelor aleatoare
b) infinit
c) numrul evenimentelor posibile
d) unu

2) Distribuia normal standard se caracterizeaz prin parametrii:
a) medie zero i varian unu
b) medie i varian
2

c) medie p i varian pq

3) ntr-o cercetare prin sondaj, eantionul trebuie s respecte condiia de:
a) omogenitate
b) varian minim
c) reprezentativitate

4) Parametrul reprezint
a) o valoare fix i necunoscut la nivelul unei populaii
b) o statistic
c) o variabil cunoscut f(x)

5) Distribuia Snedecor-Fisher are ca parametri:
a) k grade de libertate
b) dou grade de libertate
c) media zero i variana unu
d) n grade de libertate

6) Estimatorul reprezint
a) o valoare fix i cunoscut la nivelul unei populaii
b) o valoare de forma
) x ,..., x , x ( f

N 2 1
= u

c) o variabil aleatoare

7) Estimatorul admite
a) o medie
b) o lege de distribuie
c) un set de valori posibile
d) o valoare fix cunoscut

8) Sunt discrete distribuiile
a) Student
b) Bernoulli
c) Binomial
d) Chi-ptrat

1
Rspunsuri: 1 c; 2 a; 3 c; 4 a; 5 b; 6 c; 7 a,b,c; 8 b,c; 9 c; 10 c,d.
106

9) Estimaia este
a) o valoare fix i cunoscut la nivelul unei populaii
b) o statistic
c) o valoare calculat pe baza datelor de sondaj
d) o variabil realizat a estimatorului

10) Distribuia binomial se obine
a) prin standardizare
b) ca raport ntre dou variabile Chi-ptrat
c) prin generalizarea distribuiei Bernoulli
d) prin nsumarea a n variabile Bernoulli

107
US 6. ESTIMAREA PARAMETRILOR UNEI POPULAII


Cuprins
6.1 Estimarea punctual
6.2 Estimarea prin interval de ncredere


Obiective
- definirea termenilor
- definirea metodelor de estimare punctual i prin interval de ncredere
- prezentarea demersului estimrii pentru diferii parametri
- realizarea de aplicaii pentru aprofundarea cunotinelor


Competene
- nsuirea noiunilor i a demersului procedeului de estimare statistic
- nelegerea diferenei dintre estimarea punctual i prin interval de ncredere
- dobndirea de abiliti practice de utilizare a metodei estimrii pentru diferite situaii reale
- nsuirea demersului estimrii cu ajutorul softului statistic specializat


Termen mediu: 2 h


Bibliografie

1. Andrei, T. i Stancu, S., Statistic - teorie i aplicaii , Editura All, Bucureti, 1995
2. Biji, M.; Biji, El., Statistica teoretic, Editura Didactic i Pedagogic, Bucureti, 1979
3. Jaba, E., Statistica, Ediia a treia, Editura Economica, Bucureti, 2002
4. Jemna, D.V., Econometrie, Editura Sedcom Libris, Iai, 2009
5. Mills, Fr.G., Statistical Methods, 3
rd
ed., Henry Holt, New York, 1955.
6. Yule, U.G.; Kendall, M.C. - Introducere n teoria statisticii, Editura tiinific, Bucureti, 1969.
7. Wonnacott, T.H., Wonnacott, R.J., Statistique, Economica, Paris, 1991.


108

Estimarea reprezint procedeul de determinare a unui parametru al unei populaii (,
2
, )
prin prelucrarea datelor nregistrate la nivelul unui eantion.
Estimarea se poate realiza:
1. punctual: presupune aflarea unei valori posibile a estimatorului parametrului;
2. prin interval de ncredere (IC): presupune aflarea limitelor de ncredere ale unui interval
care acoper valoarea parametrului cu o anumit probabilitate.


6.1. Estimarea punctual

A estima punctual un parametru u presupune a calcula o estimaie la nivelul unui
eantion, ca o valoare realizat a unui estimator u

convenabil ales, care respect proprietile de


nedeplasare i convergen.
Cele dou proprieti ale estimatorului asigur condiiile de calitate care permit utilizarea
unei valori punctuale calculate (estimaia) pentru a aprecia valoarea necunoscut de la nivelul
populaiei (parametrul).

a. Estimarea punctual a mediei
Estimarea punctual a mediei unei populaii presupune aflarea unei valori posibile a
estimatorului , media de selecie, care este un estimator nedeplasat i convergent pentru
parametrul . Media de sondaj, x , este o valoare realizat dintre valorile posibile ale
estimatorului , adic este o estimaie punctual a mediei populaiei.

Exemplu
Din totalul judeelor Romniei a fost extras aleatoriu un eantion de 10 judee, care au fost
observate dup rata omajului (%) nregistrat n anul 2011. Valorile nregistrate la nivelul
eantionului sunt: 5.9, 8.4, 7.4, 7.1, 6.1, 6.4, 8.8, 8, 7.8, 7. S se estimeze punctual rata medie a
omajului la nivelul Romniei.

Rezolvare
Media calculat la nivelul eantionului este:
29 . 7
10
7 8 . 7 8 8 . 8 4 . 6 1 . 6 1 . 7 4 . 7 4 . 8 9 . 5
x =
+ + + + + + + + +
= %.

Interpretare: La nivelul Romniei, se poate estima c rata medie a omajului este de
7,29%.

b. Estimarea punctual a proporiei
Estimarea punctual a proporiei la nivelul unei populaii presupune aflarea unei valori
posibile a estimatorului t
, proporia de selecie, care este un estimator nedeplasat i convergent
pentru parametrul t . La nivelul eantionului, proporia calculat (w) este o estimaie punctual a
parametrului proporiei.

Exemplu
n urma realizrii unui sondaj la nivelul unui eantion format din 1000 locuitori ai unei
localiti, la ntrebarea Ai vizionat cel puin un spectacol de teatru n ultima lun?, 260 de
109
persoane au rspuns afirmativ. S se estimeze punctual proporia persoanelor care rspuns
afirmativ la ntrebare, la nivelul ntregii populaii.


Rezolvare
Proporia persoanelor care au rspuns afirmativ la ntrebare, calculat la nivelul
eantionului, este: % 26 100
1000
260
n
m
w = = = .

Interpretare: La nivelul ntregii populaii, se poate estima c 26% dintre persoane au
vizionat cel puin un spectacol de teatru n ultima lun.


6.2. Estimarea prin interval de ncredere

A estima prin interval de ncredere un parametru u presupune a identifica dou variabile
aleatoare, L
i
i L
s
care, pentru o anumit probabilitate ) 1 ( o , numit nivel de ncredere, respect
condiia:
) 1 ( ) L L ( P
s i
o u = s s , unde ) 1 , 0 ( e o .
Estimarea prin interval de ncredere se bazeaz pe estimatori nedeplasai i convergeni,
crora li se aplic Teorema limit central.

1. Estimarea prin interval de ncredere a mediei
Exist dou situaii:

a. Se cunoate parametrul o
Se utilizeaz estimatorul

=
i
X
n
1
, cruia i se aplic TLC, adic, pentru un n suficient
de mare, are loc:
) 1 , 0 ( N ~
n

Z
o

=
Pentru o probabilitate cunoscut ) 1 ( o , pentru repartiia normal standard, se poate
identifica o valoare
2 /
z
o
care respect proprietatea:
) z ( 2 ) 1 ( ) z Z z ( P
2 / 2 / 2 / o o o
| o = = s s
Valoarea
2 /
z
o
se citete din tabelul lui Laplace pe baza relaiei
2
) 1 (
) z (
2 /
o
|
o

= .
nlocuind relaia lui Z n cea de mai sus, rezult:
) 1 ( ) z
n

z ( P
2 / 2 /
o
o

o o
= s

s
Dup o serie de calcule elementare, rezult:
) 1 ( )
n
z
n
z ( P
2 / 2 /
o
o

o

o o
= + s s .
110
Ultima relaie respect definiia intervalului de ncredere i ne permite identificarea celor
dou variabile aleatoare care reprezint limitele intervalului de ncredere pentru medie:

n
z L ,
n
z L
2 / s 2 / i
o

o o
+ = =

La nivelul unui eantion extras, se calculeaz un interval estimat pentru parametrul medie,
pe baza estimaie sale punctuale, media de eantion. Rezult intervalul:
)
n
z x ,
n
z x (
2 / 2 /
o o
o o
+

Interpretare
Cu o probabilitate ) 1 ( o , parametru medie este acoperit de intervalul
)
n
z x ,
n
z x (
2 / 2 /
o o
o o
+

Observaie
Dac se modific nivelul de ncredere se modific i mrimea intervalului (se modific
valoarea
2 /
z
o
).

Mrimea intervalului de ncredere depinde de dou componente:
2 /
z
o
, care depinde de
probabilitatea cu care estimm i
n
o
, care este abaterea standard a estimatorului i depinde de
gradul de omogenitate al populaiei i mrimea eantionului.
Aceast mrime a intervalului se numete eroare maxim admisibil:
n
z
2 /
o
A
o
= .

Exemplu
Pentru a estima profitul mediu (milioane lei) obinut de firmele mici i mijlocii dintr-un
jude n anul 2012, s-a extras aleatoriu un eantion de 75 de firme, pentru care s-au nregistrat
profiturile anuale. La nivelul eantionului s-a obinut lei . mil 5 . 7 x = , iar dintr-o cercetare local
anterioar se cunoate c . lei . mil 3 . 1 = o Pentru un risc asumat de 5%, s se estimeze prin
interval de ncredere profitul mediu obinut de firmele mici i mijlocii n 2012.

Rezolvare
Intervalul de ncredere este definit prin:
)
n
z x ,
n
z x (
2 / 2 /
o o
o o
+ .
Pentru un risc de 5% (sau = 0,05), din tabelul Laplace se citete valoarea z
/2
=1,96,
corespunztoare lui 475 . 0
2
05 . 0 1
2
) 1 (
) z (
2 /
=

=
o
|
o
. Prin urmare, limitele intervalului de
ncredere se calculeaz astfel:
)
75
3 . 1
96 . 1 5 . 7 ,
75
3 . 1
96 . 1 5 . 7 ( + = ( ) 79 . 7 , 21 . 7 ) 29 . 0 5 . 7 , 29 . 0 5 . 7 ( = + milioane lei.

111
Interpretare: Cu o ncredere de 95% se poate afirma c profitul mediu obinut de firmele
mici i mijlocii n 2012 este acoperit de intervalul (7.21, 7.79) milioane lei.

b. Nu se cunoate parametrul o
n acest caz, se utilizeaz estimatorul ' o pentru parametrul abatere standard, iar variabila
Z devine o variabil student: ) 1 n ( t ~
n
'

=
o

.
Pentru un nivel de ncredere ) 1 ( o , se utilizeaz proprietile repartiiei Student i se
obine:
) 1 ( ) t t t ( P
2 / 2 /
o
o o
= s s , iar valoarea
2 /
t
o
se citete din tabelul Student pentru
2 / ) t t ( P
2 /
o
o
= > .
Rezult intervalul de ncredere:
n
'
t L ,
n
'
t L
2 / s 2 / i
o

o o
+ = = .
Pentru un eantion extras, se obine intervalul calculat:
)
n
' s
t x ,
n
' s
t x (
2 / 2 / o o
+

Exemplu
Din totalul judeelor Romniei a fost extras aleatoriu un eantion de 10 judee, care au fost
observate dup rata omajului (%)n anul 2011. Valorile nregistrate sunt: 5.9, 8.4, 7.4, 7.1, 6.1,
6.4, 8.8, 8, 7.8, 7. La nivelul eantionului s-au obinut % 29 . 7 x = i % 97 . 0 ' s = . S se estimeze
prin interval de ncredere rata medie a omajului la nivelul Romniei, pentru un risc asumat de
5%.

Rezolvare
Intervalul de ncredere este definit prin:
)
n
' s
t x ,
n
' s
t x (
2 / 2 / o o
+ .
Pentru un risc de 5%, din tabelul Student se citete valoarea t
/2,n-1
= t
0.025,9
=2,262. Prin
urmare, limitele intervalului de ncredere se calculeaz astfel:
)
10
97 . 0
262 . 2 29 . 7 ,
10
97 . 0
262 . 2 29 . 7 ( + = ( ) 98 . 7 , 6 . 6 ) 69 . 0 29 . 7 , 69 . 0 29 . 7 ( = + %.
Folosind programul SPSS se obin, n urma estimrii, rezultatele prezentate n tabelul de
mai jos.

Tabelul 6.1 Estimarea punctual i prin interval de ncredere a mediei populaiei
Descriptives
7.2900 .30820
6.5928
7.9872
Mean
Lower Bound
Upper Bound
95% Confidence
Interval for Mean
Rata somajului
Stati stic Std. Error


Mean reprezint media aritmetic calculat la nivelul eantionului, i este de 7.29%.
112
Cele dou limite ale intervalului de ncredere sunt Lower Bound (Limita inferioar), egal
cu 6.59 ~ 6.6, i Upper Bound (Limita superioar), egal cu 7.98.

Interpretare: Cu o ncredere de 95% se poate afirma c rata medie a omajuluila nivelul
Romniei n 2012 este acoperit de intervalul (6.6, 7.98)%.


2. Estimarea prin interval de ncredere a proporiei
i n acest caz exist 2 situaii.

a. Se cunoate dispersia variabilei alternative
2
t
o
Intervalul este de forma
n
z L ,
n
z L
2 / s 2 / i
t
o
t
o
o
t
o
t + = = , iar intervalul calculat este:

n
z w ,
n
z w
2 / 2 /
t
o
t
o
o o
+

Exemplu
n urma realizrii unui sondaj la nivelul firmelor dintr-un jude s-a nregistrat, pentru un
eantion de 88 de firme, dac acestea au facut sponsorizri n anul trecut. La nivelul eantionului
s-a obinut c proporia firmelor care au facut sponsorizri este de 31%. Dintr-o cercetare
anterioar se cunoate c

= 2.4%. Pentru = 0,05, s se estimeze, prin interval de ncredere,


proporia firmelor care au acordat sponsorizri anul trecut, la nivelul ntregii populaii.

Rezolvare
Intervalul de ncredere este definit prin:
)
n
z w ,
n
z w (
2 / 2 /
t
o
t
o
o o
+ .
Pentru un risc de 5%, din tabelul Laplace se citete valoarea z
/2
=1,96. Prin urmare,
limitele intervalului de ncredere se calculeaz astfel:
)
88
024 . 0
96 . 1 31 . 0 ,
88
024 . 0
96 . 1 31 . 0 ( + = ( ) 313 . 0 , 307 . 0 ) 003 . 0 31 . 0 , 003 . 0 31 . 0 ( = + .
Interpretare: Cu o ncredere de 95% se poate afirma c proporia firmelor care au acordat
sponsorizri anul trecut este acoperit de intervalul (0.307, 0.313) sau (30.7, 31.3)%.

b. Nu se cunoate dispersia variabilei alternative
2
t
o
Intervalul este de forma
n
'
t L ,
n
'
t L
2 / s 2 / i
t
o
t
o
o
t
o
t + = = , unde ) 1 ( ' t t o
t
=
iar intervalul calculat este:
n
s
t w ,
n
s
t w
'
2 /
'
2 /
t
o
t
o
+ , unde ) w 1 ( w ' s =
t


Exemplu
n urma realizrii unui sondaj la nivelul unui eantion format din 1000 locuitori ai unei
localiti, la ntrebarea Ai vizionat cel puin un spectacol de teatru n ultima lun?, 26% dintre
persoane au rspuns afirmativ. Pentru = 0,05, s se estimeze pri interval de ncredere proporia
persoanelor care rspuns afirmativ la ntrebare, la nivelul ntregii populaii.
113

Rezolvare
Intervalul de ncredere este definit prin:
.
n
s
t w ,
n
s
t w
'
2 /
'
2 /
t
o
t
o
+
Pentru un risc de 5%, din tabelul Student se citete valoarea t
/2,n-1
= t
0.025,999
=1,96.
Dispersia corectat, la nivelul eantionului, este:
43 . 0 ) 26 . 0 1 ( 26 . 0 ) w 1 ( w ' s = = =
t

Prin urmare, limitele intervalului de ncredere se calculeaz astfel:
)
1000
43 . 0
96 . 1 26 . 0 ,
1000
43 . 0
96 . 1 26 . 0 ( + = ( ) 28 . 0 , 24 . 0 ) 02 . 0 26 . 0 , 02 . 0 26 . 0 ( = + .
Interpretare: Cu o ncredere de 95% se poate afirma c proporia persoanelor care au
vizionat cel puin un spectacol de teatu luna trecut este acoperit de intervalul (0.24, 0.28) sau
(24, 28)%.


c. Estimarea volumului eantionului
n cazul unui sondaj de opinie electoral, se utilizeaz ca variabil de baz o variabil
alternativ
|
|
.
|

\
|
t t 1
1 0
: X , iar parametrul t este proporia de voturi pentru un candidat.
n practic, de regul se fixeaz probabilitatea sau nivelul de ncredere cu care dorim s
garantm rezultatul (de regul la 0,95) i eroarea maxim admisibil (de exemplu de % 3 ).
Avnd aceste date, se poate estima volumul eantionului care estimeaz parametrul t n
condiiile stabilite.

Se utilizeaz relaia erorii maxim admisibile:
n
z
2 /
t
o t
o
A = . Din aceast relaie se obine
volumul eantionului

2
2 2
2 /
z
n
t
t o
A
o
= .
n relaia de mai sus, se poate afla uor valoarea
2 /
z
o
din tabelul lui Laplace cunoscnd
nivelul de ncredere fixat. Parametrul
2
t
o , care exprim gradul de omogenitate al populaiei, nu se
cunoate, ns se poate utiliza valoarea lui maxim, care este egal cu 0,25.

Exemplu
Pentru o probabilitate de 0,95 i o eroarea maxim admisibil de % 3 , se calculeaz
volumul eantionului. Ce se ntmpl dac se utilizeaz o eroare de % 2 ?

Rezolvare
Pentru o probabilitate de 0.95 se citete, tabelul Laplace, valoarea z
/2
=1,96.
Pentru o eroare maxim admisibil de % 3 , volumul eantionului este:
1067 66 , 1066
0009 . 0
25 . 0 84 . 3
03 . 0
25 . 0 96 . 1 z
n
2
2
2
2 2
2 /
~ =

=
t
t o
A
o
uniti.
Pentru o eroare maxim admisibil de % 2 , volumul eantionului este:
114
2400
0004 . 0
25 . 0 84 . 3
02 . 0
25 . 0 96 . 1 z
n
2
2
2
2 2
2 /
=

=
t
t o
A
o
uniti.
Prin urmare, ntre eroarea maxim admisibil i volumul eantionului exist o legtur
invers. Dac dorim s avem o eroare maxim adminisbil mai mic, trebuie s mrim volumul
eantionului.
115

Teste
1


1) A estima punctual nseamn
a) a calcula o valoare la nivel de eantion pe baza unui estimator
b) a gsi un punct ct mai aproape de parametru
c) a calcula probabilitatea cu care se obine o estimaie

2) Pentru un eantion de angajai repartizai dup variabila salariul anual ($) s-au obinut
rezultatele din tabelul de mai jos.
Statistics
Current Sal ary
474
0
$34,000.00
$785.000
Vali d
Missing
N
Mean
Std. Error of Mean

Intervalul de ncredere pentru media populaiei totale, pentru un nivel de ncredere de 95% este:
a) (30000 ; 38000)
b) (32461,4 ; 35538,6)
c) (25400,5 ; 35600,5)

3) Eroarea de estimare a unei proporii depinde de:
a) gradul de omogenitate a populaiei
b) volumul eantionului
c) nivelul de ncredere stabilit

4) n urma unui test realizat asupra unui eantion de 100 de studeni, a rezultat c 65 dintre
acetia au promovat examenul. Cu un nivel de ncredere de 95% , intervalul de ncredere al
proporiei studenilor promovai la nivelul populaiei totale este:
a) (0,50; 0,75)
b) (0,64; 0,66)
c) (0,56; 0,74)

5) ntr-un sondaj aleator simplu de 400 studeni, pentru variabila nota la un test, s-a obinut o
valoare medie de 8,25 i o abatere standard de eantion modificat egal cu 1,8. Intervalul de
ncredere pentru parametrul medie, cu o probabilitate de 0,95, este
a) (7,5260 - 9,3424)
b) (8,1280 - 9,2020)
c) (8,0736 - 8,4264)

6) Eroarea maxim admisibil este
a) direct proporional cu volumul eantionului
b) invers proporional cu media eantionului
c) egal cu 5%

7) Pentru a asigura condiiile de calitate necesare estimrii punctuale ale unui parametru,
estimatorul parametrului trebuie

1
Rspunsuri: 1 a; 2 b; 3 a,b,c; 4- c; 5 c, 6 a, 7 b.
116
a) s aib media zero
b) s fie nedeplasat i convergent
c) s aib varian maxim
117

US 7. TESTAREA IPOTEZELOR STATISTICE


Cuprins
7.1 Etapele procesului testrii statistice
7.2 Testarea ipotezelor privind un parametru


Obiective
- definirea noiunilor
- prezentarea demersului testrii statistice
- aplicarea demersului testrii pentru parametrii medie, proporie i diferena a dou medii
- realizarea de aplicaii cu date reale


Competene
- nsuirea noiunilor i a demersului procedeului de testare statistic
- nelegerea diferenei dintre estimare i testare
- dobndirea de abiliti practice de utilizare a metodei testrii pentru diferite situaii reale
- nsuirea demersului testrii cu ajutorul softului statistic specializat


Termen mediu: 2 h


Bibliografie

1. Andrei, T. i Stancu, S., Statistic - teorie i aplicaii , Editura All, Bucureti, 1995
2. Biji, M.; Biji, El., Statistica teoretic, Editura Didactic i Pedagogic, Bucureti, 1979
3. Jaba, E., Statistica, Ediia a treia, Editura Economica, Bucureti, 2002
4. Jemna, D.V., Econometrie, Editura Sedcom Libris, Iai, 2009
5. Mills, Fr.G., Statistical Methods, 3
rd
ed., Henry Holt, New York, 1955.
6. Yule, U.G.; Kendall, M.C. - Introducere n teoria statisticii, Editura tiinific, Bucureti,
1969.
7. Wonnacott, T.H., Wonnacott, R.J., Statistique, Economica, Paris, 1991.


118


Testarea ipotezelor statistice este un procedeu prin care se testeaz semnificaia egalitii
dintre valoarea unui parametru i o valoare de referin sau dintre doi parametri (dou medii ale
populaiei sau dou proporii de la nivelul unor populaii).


7.1. Etapele procesului testrii statistice

Etapele procesului testrii unei ipoteze statistice sunt:
1. formularea ipotezelor (ipoteza nul i ipoteza alternativ);
2. alegerea pragului de semnificaie o sau a limitei erorii de spea nti (eroarea de a respinge
ipoteza nul n condiiile n care aceasta este adevrat);
3. alegerea statisticii test adecvate, care, n condiiile acceptrii ipotezei nule, are o lege de
repartiie specificat;
4. determinarea unei valori teoretice a testului, n funcie de legea de repartiie i de pragul de
semnificaie ales;
5. calcularea unei valori a statisticii test pe baza datelor de la nivelul unui eantion;
6. aplicarea regulii de decizie de acceptare sau de respingere a ipotezei nule (care n esen
const n compararea valorii calculate a testului cu cea teoretic).


1. Formularea ipotezelor
O ipotez este o presupunere cu privire la un parametru sau la legea de distribuie a unei
variabile. n procesul testrii, se formuleaz dou ipoteze:
Ipoteza nul, H
0
: se presupune egalitatea unui parametru cu o valoare fix sau se face o
precizare cu privire la legea de repartiie a unei variabile.
Ipoteza alternativ, H
1
: este opusul ipotezei nule.

n funcie de modul de formulare a ipotezelor, se pot construi mai multe tipuri de teste:
Test bilateral:


Test unilateral dreapta:


Test unilateral stnga:


2. Erori de testare i alegerea pragului de semnificaie
Decizia testului se ia cu o anumit probabilitate de eroare, care poate fi:
eroare de tip I (eroare de prim spe - reprezint probabilitatea de a respinge
ipoteza nul atunci cnd aceasta este adevrat)
eroare de tip II (eroare de a doua spe)
Erorile sunt evaluate cu ajutorul a dou funcii de probabilitate.
Pragul de semnificaie reprezint o limit fixat a erorii de tip I. Se noteaz cu o i se
fixeaz de cercettor n procesul de testare.

3. Alegerea testului i a statisticii
0 1
0 0
: H
: H
u u
u u
=
=
0 1
0 0
: H
: H
u u
u u
>
=
0 1
0 0
: H
: H
u u
u u
<
=
119
Exist dou categorii de teste statistice: teste parametrice i teste neparametrice.
Testului statistic se alege n funcie de parametrul testat, de informaiile disponibile,
metoda de sondaj etc. n funcie de testul ales, se precizeaz statistica utilizat, mpreun cu
proprietile acesteia, n special legea de repartiie.

4. Determinarea unei valori teoretice a statisticii test utilizate
, aceast etap a testrii, se accept faptul c ipoteza nul este adevrat. n aceste
condiii, cunoscnd pragul de semnificaie i legea de distribuie a statisticii, se citete o valoare
teoretic corespunztoare din tabelul probabilistic. Pe baza valorii (valorilor) teoretice se stabilesc
regiunile de acceptare i respingere a ipotezei nule.
De exemplu, pentru un test student bilateral, cele dou regiuni sunt la dreapta, respectiv la
stnga valorilor teoretice din tabel, conform figurii de mai jos.

Figura 26. Regiunile de respingere i de acceptare a ipotezei H
0


5. Calcularea unei valori a statisticii test
La nivelul unui eantion, se calculeaz o estimaie a statisticii test, care se numete
valoarea calculat a testului.

6. Regula de decizie
Regula de decizie cu privire la acceptarea sau respingerea ipotezei nule se poate lua n
dou moduri:
- prin compararea valorii calculate a testului cu valoarea teoretic: se verific poziia valorii
calculate a testului n funcie de una din cele dou regiuni stabilite n etapa 4
- prin compararea semnificaiei testului cu pragul de semnificaie.
Probabilitatea calculat a primit numele de semnificaie a testului i este notat cu p-value sau Sig.
De exemplu, pentru un test Student, aceasta este asociat valorii calculate a testului i este dat de
relaia: ) t t ( P t Sig
calc
> = . n acest caz, regula de decizie este urmtoarea:
- dac o > Sigt , se accept ipoteza nul;
- dac o < Sigt , se respinge ipoteza nul, cu probabilitatea (1-o).


7.2. Testarea ipotezelor privind un parametru

Testarea ipotezelor cu privire la un parametru are ca obiectiv testarea egalitii dintre
media unei populaii sau proporia la nivelul unei populaii fa de valori de referin, cunoscute.

0
1 n ;
2
t

o
1 n ;
2
t

o

120
A. Testarea mediei unei populaii
Ca i n cazul estimrii, exist dou cazuri: se cunoate sau nu parametrul dispersie.

a. Se cunoate parametrul o - Testul Z

1. Formularea ipotezelor

0 0
: H =

0 1
: H =

2. Alegerea pragului de semnificaie o
De regul, se ia valoarea 0,05 (n SPSS, aceasta este valoarea implicit, dar poate fi
modificat de utilizator).

3. Alegerea statisticii test
n

Z
o

=

4. Determinarea valorii teoretice a testului
Dac se accept ipoteza nul, statistica test este:

) 1 , 0 ( N ~
n

Z
0
o

=
Pentru o probabilitate cunoscut o , pentru repartiia normal standard, se poate identifica
o valoare
2 /
z
o
care respect proprietatea:
) z ( 2 ) 1 ( ) z Z z ( P
2 / 2 / 2 / o o o
| o = = s s
Valoarea
2 /
z
o
se citete din tabelul lui Lplace pe baza relaiei
2
) 1 (
) z (
2 /
o
|
o

= .

H H
o/2
H
-z
1
o/2
0
1-o
zo/2
1
o/2
Z

Figura 27. Regiunea de respingere i de acceptare a ipotezei H
0

n cazul unui test Z bilateral

Observaie
121
Reprezentarea regiunilor de respingere i de acceptare a ipotezei H
0
pentru un test
unilateral dreapta este realizat n figura de mai jos:


Figura 28. Regiunea de respingere i de acceptare a ipotezei H
0

n cazul unui test Z unilateral la dreapta

5. Determinarea valorii calculate a testului
La nivelul unui eantion se obine o estimaie a statisticii test:
n
x
z
0
calc
o

=

6. Luarea deciziei
Regula de decizie, pe baza valorii calculate a testului, este urmtoarea:
- dac ] z , z [ z
2 2
calc o o
e , se accept ipoteza H
0
;
- dac nu se realizeaz aceast condiie, se respinge ipoteza nul, cu probabilitatea (1-o).

Dac se ine cont de semnificaia testului, regula de decizie este urmtoarea:
- dac o > t Sig , se accept ipoteza nul.
- dac o < t Sig , se respinge H
0
.

Exemplu
Din totalul firmelor mici i mijlocii dintr-un jude n anul 2012, s-a extras aleatoriu un
eantion de 75 de firme, pentru care s-au nregistrat profiturile anuale (milioane lei). La nivelul
eantionului s-a obinut lei . mil 5 . 7 x = , iar dintr-o cercetare local anterioar se cunoate c
. lei . mil 3 . 1 = o Pentru un risc asumat de 5%, s se testeze dac exist diferene semnificative
ntre profitul mediu anual din 2012 i cel din 2011, de 6.2 milioane lei.

Rezolvare
1. Formularea ipotezelor statistice
0 0
: H =

0 1
: H =

2. Alegerea pragului de semnificaie a testului
. 05 , 0 = o
122

3. Alegerea statisticii test
Se folosete statistica test Z:
n

Z
0
o

= .

4. Determinarea valorii teoretice a testului
Se citete din tabelul Laplace pentru un risc 05 , 0 = o : . 96 , 1 z
2 /
=
o


5. Determinarea valorii calculate a testului
Pe baza datelor de la nivelul eantionului, se obine: 66 . 8
75 / 3 . 1
2 . 6 5 . 7
z
calculat
=

= .

6. Luarea deciziei
Regula de decizie, pe baza valorii calculate a testului, este urmtoarea:
- dac ] z , z [ z
2 2
calc o o
e , se accept ipoteza H
0
;
- dac nu se realizeaz aceast condiie, se respinge ipoteza nul, cu probabilitatea (1-o).

7. Interpretare
] 96 . 1 , 96 . 1 [ 66 . 8 z
calculat
e = , se respinge ipoteza Ho. Se poate garanta cu o
probabilitate de 0,95 c exist diferene semnificative ntre profitul mediu anual din 2012 ) ( i
profitul mediu obinut n 2011 ) (
0
.

b. Nu se cunoate parametrul o - Testul t
n acest caz se utilizeaz testul Student, de forma:
n
'

t
o

= .
n condiiile acceptrii ipotezei nule, testul devine
n
'

t
0
o

= i urmeaz o lege Student
cu (n-1) grade de libertate.
Pentru o probabilitate cunoscut o i pentru (n-1) grade de libertate, din tabelul Student
se citete o valoare
2 /
t
o
care respect proprietatea:
) 1 ( ) t t t ( P
2 / 2 /
o
o o
= s s .
Valoarea calculat a testului este:
n
' s
x
t
0
calc

= .
Decizia se ia n mod analog cu situaia testului Z.

Exemplu
Din totalul judeelor Romniei a fost extras aleatoriu un eantion de 10 judee, care au fost
observate dup rata omajului (%) n anul 2011. Valorile nregistrate sunt: 5.9, 8.4, 7.4, 7.1, 6.1,
6.4, 8.8, 8, 7.8, 7. La nivelul eantionului s-au obinut % 29 . 7 x = i % 97 . 0 ' s = . S se testeze dac
123
exist diferene semnificative ntre rata medie a omajului din 2011 i rata medie a omajului din
2010, de 7.4%, pentru un risc asumat de 5%.

Rezolvare
1. Formularea ipotezelor statistice
0 0
: H =
0 1
: H =

2. Alegerea pragului de semnificaie a testului
. 05 , 0 = o

3. Alegerea statisticii test
Se folosete statistica test t:
n
'

t
0
o

= .
4. Determinarea valorii teoretice a testului
Se citete din tabelul Student pentru un risc 05 , 0 = o : . 262 . 2 t t
9 , 025 . 0 1 n , 2 /
= =
o


5. Determinarea valorii calculate a testului
Pe baza datelor obinute la nivelul eantionului, se obine: 35 . 0
10 / 97 . 0
4 . 7 29 . 7
t
calculat
=

= .

6. Luarea deciziei
Regula de decizie, pe baza valorii calculate a testului, este urmtoarea:
- dac ] t , t [ t
2 2
calc o o
e , se accept ipoteza H
0
;
- dac nu se realizeaz aceast condiie, se respinge ipoteza nul, cu probabilitatea (1-o).

7. Interpretare
] 262 . 2 , 262 . 2 [ 35 . 0 t
calculat
e = , se accept ipoteza Ho. Se poate garanta cu o
probabilitate de 0,95 c nu exist diferene semnificative ntre rata medie a omajului din 2011 la
nivelul Romniei ) ( i rata medie a omajului din 2010 ) (
0
.

Rezultatele acestei testri, obinute cu ajutorul programului SPSS, sunt prezentate n
tabelul de mai jos.

Tabelul 7.1 Rezultatele testrii unei medii cu o valoare cunoscut
One-Sample Test
-.357 9 .729 -.11000 -.8072 .5872 Rata somajului
t df Sig. (2-tail ed)
Mean
Di fference Lower Upper
95% Confidence
Interval of the
Di fference
Test Value = 7.4


124
Regula de decizie
SPSS permite luarea deciziei pe baza valorilor Sig. i o , dup urmtoarea regul de
decizie:
- dac o < t Sig , atunci se respinge ipoteza H
0
;
- dac o > t Sig , atunci se accept ipoteza H
0
.

Interpretare
05 . 0 729 . 0 . Sig = > = o , se accept ipoteza Ho. Se poate garanta cu o probabilitate de
95% c rata medie a omajului n anul 2011 la nivelul Romniei nu difer semnificativ de rata
medie a omajului din 2010.



B. Testarea proporiei unei populaii
Demersul testrii este acelai cu al mediei li presupune cele dou cazuri.

a. Se cunoate parametrul
t
o - Testul Z

1. Formularea ipotezelor

0 0
: H t t =

0 1
: H t t =

2. Alegerea pragului de semnificaie o
De regul, se ia valoarea 0,05 (n SPSS, aceasta este valoarea implicit, dar poate fi
modificat de utilizator).

3. Alegerea statisticii test
n

Z
t
o
t t
=

4. Determinarea valorii teoretice a testului
Dac se accept ipoteza nul, statistica test este:

) 1 , 0 ( N ~
n

Z
0
t
o
t t
=
Pentru o probabilitate cunoscut o , pentru repartiia normal standard, se poate identifica
o valoare
2 /
z
o
care respect proprietatea:
) z ( 2 ) 1 ( ) z Z z ( P
2 / 2 / 2 / o o o
| o = = s s

5. Determinarea valorii calculate a testului
La nivelul unui eantion se obine o estimaie a statisticii test:
n
w
z
0
calc
t
o
t
=
125

6. Luarea deciziei
Regula de decizie, pe baza valorii calculate a testului, este urmtoarea:
- dac ] z , z [ z
2 2
calc o o
e , se accept ipoteza H
0
;
- dac nu se realizeaz aceast condiie, se respinge ipoteza nul, cu probabilitatea (1-o).

Dac se ine cont de semnificaia testului, regula de decizie este urmtoarea:
- dac o > t Sig , se accept ipoteza nul.
- dac o < t Sig , se respinge H
0
.

Exemplu
n urma realizrii unui sondaj la nivelul firmelor dintr-un jude s-a nregistrat, pentru un
eantion de 88 de firme, dac acestea au facut sponsorizri n anul 2011. La nivelul eantionului s-
a obinut c proporia firmelor care au facut sponsorizri este de 31%. Dintr-o cercetare anterioar
se cunoate c

= 2.4%. Pentru = 0,05, s se testeze dac exist diferene semnificative ntre


ponderea nregistrat n 2011 i cea din 2010, de 28%.

Rezolvare
1. Formularea ipotezelor statistice
0 0
: H t t =
0 1
: H t t =

2. Alegerea pragului de semnificaie a testului
. 05 , 0 = o

3. Alegerea statisticii test
Se folosete statistica test Z:
n

Z
0
t
o
t t
= .
4. Determinarea valorii teoretice a testului
Se citete din tabelul Laplace pentru un risc 05 , 0 = o : . 96 . 1 z
2 /
=
o


5. Determinarea valorii calculate a testului
Pe baza datelor obinute la nivelul eantionului, se obine: 12
88 / 024 . 0
28 . 0 31 . 0
z
calculat
=

= .

6. Luarea deciziei
- dac ] z , z [ z
2 2
calc o o
e , se accept ipoteza H
0
;
- dac nu se realizeaz aceast condiie, se respinge ipoteza nul, cu probabilitatea (1-o).

7. Interpretare
| | 96 . 1 , 96 . 1 12 z
calculat
e = , se respinge ipoteza Ho. Se poate garanta cu o probabilitate de
0,95 c exist diferene semnificative ntre ponderea firmelor care au acordat sponsorizri n 2011
i cea din 2010.
126

b. Nu se cunoate parametrul
t
o - Testul t
n acest caz se utilizeaz testul Student, de forma:
n
'

t
t
o
t t
= .
n condiiile acceptrii ipotezei nule, testul devine
n
'

t
0
t
o
t t
= i urmeaz o lege Student cu
(n-1) grade de libertate.
Pentru o probabilitate cunoscut o i pentru (n-1) grade de libertate, din tabelul Student
se citete o valoare
2 /
t
o
care respect proprietatea:
) 1 ( ) t t t ( P
2 / 2 /
o
o o
= s s .
Valoarea calculat a testului este:
n
' s
w
t
0
calc
t
t
= , unde ) w 1 ( w ' s =
t
.
Decizia se ia n mod analog cu situaia testului Z.


Exemplu
n urma realizrii unui sondaj la nivelul unui eantion format din 1000 locuitori ai unei
localiti, la ntrebarea Ai vizionat cel puin un spectacol de teatru n ultima lun?, 26% dintre
persoane au rspuns afirmativ. Pentru = 0,05, s se testeze dac exist diferene semnificative
ntre ponderea persoanelor care au rspuns afirmativ la ntrebare i ponderea de 30%, nregistrat
la sfritul stagiunii trecute.

Rezolvare
1. Formularea ipotezelor statistice
0 0
: H t t =
0 1
: H t t =

2. Alegerea pragului de semnificaie a testului
. 05 , 0 = o

3. Alegerea statisticii test
Se folosete statistica test t:
n
'

t
0
t
o
t t
= .
4. Determinarea valorii teoretice a testului
Se citete din tabelul Student pentru un risc 05 , 0 = o : . 96 . 1 t t
999 , 025 . 0 1 n , 2 /
= =
o


5. Determinarea valorii calculate a testului
Pe baza datelor de la nivelul eantionului, se obine:

( )
07 . 3
1000 / 26 . 0 1 26 . 0
30 . 0 26 . 0
t
calculat
=


= .
127

6. Luarea deciziei
Regula de decizie, pe baza valorii calculate a testului, este urmtoarea:
- dac ] t , t [ t
2 2
calc o o
e , se accept ipoteza H
0
;
- dac nu se realizeaz aceast condiie, se respinge ipoteza nul, cu probabilitatea (1-o).

7. Interpretare
] 96 . 1 , 96 . 1 [ 07 . 3 t
calculat
e = , se respinge ipoteza Ho. Se poate garanta cu o
probabilitate de 0,95 c exist diferene semnificative ntre ponderea persoanelor care au rspuns
afirmativ la ntrebare i ponderea nregistrat la sfritul stagiunii trecute.


C. Testarea egalitii a dou medii
Testarea diferenei a dou medii urmeaz aceeai logic cu testarea unei medii, deoarece
diferena a doi parametri poate fi tratat ca un singur parametru.
Ipotezele formulate n acest caz sunt:
2 1 1
2 1 0
: H
: H


=
=
sau
0 : H
0 : H
2 1 1
2 1 0
=
=




n funcie de informaia disponibil cu privire la parametrii
2
1
o i
2
2
o , se pot identifica
patru situaii.

a. Dispersiile sunt diferite i sunt cunoscute
n acest caz, se utilizeaz un test Z de form1a:
2
2
2
1
2
1
2 1 2 1
n n
) ( ) (
Z
o o

+

= .
Valoarea calculat a testului este:
2
2
2
1
2
1
2 1
calc
n n
x x
Z
o o
+

= .

Exemplu
Din totalul studenilor anului II din dou centre universitare, A i B, s-au extras dou eantioane,
de volume n
1
= 80 studeni i n
2
= 100 studeni. Studenii au fost observai dup media anului I de
studii, i s-au obinut rezultatele: 2 . 8 x
1
= puncte i 9 . 7 x
2
= puncte. Se cunoate c 7 . 1
2
1
= o i
2 . 1
2
2
= o . Pentru un risc asumat 05 , 0 = o , s se testeze dac exist diferene semnificative ntre
mediile obinute la nivelul tuturor studenilor din cele dou centre universitare.

Rezolvare
1. Formularea ipotezelor statistice
2 1 1
2 1 0
: H
: H


=
=


2. Alegerea pragului de semnificaie a testului
128
. 05 , 0 = o

3. Alegerea statisticii test
Se folosete statistica test Z:
2
2
2
1
2
1
2 1 2 1
n n
) ( ) (
Z
o o

+

= .
4. Determinarea valorii teoretice a testului
Se citete din tabelul Laplace pentru un risc 05 , 0 = o : . 96 . 1 z
2 /
=
o


5. Determinarea valorii calculate a testului
Pe baza datelor de la nivelul eantionului, se obine: 66 . 1
100
2 . 1
80
7 . 1
9 . 7 2 . 8
z
calculat
=
+

= .

6. Luarea deciziei
- dac
2
calc
z z
o
s , se accept ipoteza H
0
;
- dac
2
calc
z z
o
> , se respinge ipoteza H
0
, cu probabilitatea (1-o).

7. Interpretare
96 . 1 z 66 . 1 z
2 / calc
= < =
o
, se accept ipoteza Ho. Se poate garanta cu o probabilitate de
0,95 c nu exist diferene semnificative ntre mediile anuale ale studenilor din cele dou centre
universitare.

b. Dispersiile sunt diferite i nu se cunosc
n acest caz, se utilizeaz un test Student de forma:
2
2
2
1
2
1
2 1 2 1
n
'
n
'
) ( ) (
t
o o

+

= .
Valoarea calculat a testului este:
2
2
2
1
2
1
2 1
calc
n
' s
n
' s
x x
t
+

= .

Exemplu
Pentru a analiza preurile practicate de un productor de ciment i de principalul su
competitor, din totalul punctelor de vnzare ale celor dou companii au fost extrase dou
eantioane de volume n
1
= 20 puncte de vnzare i n
2
= 17 puncte de vnzare. S-au nregistrat
preurile la ciment (lei) din punctele de vnzare i s-au obinut, la nivelul eantioanelor, 28 x
1
=
lei, 33 x
2
= lei, 3 ' s
2
1
= i 7 ' s
2
2
= . S se testeze dac exist diferene semnificative ntre preurile
medii practicate de cei doi productori, la nivelul tuturor punctelor de vnzare. Se consider
. 05 , 0 = o

Rezolvare
1. Formularea ipotezelor statistice
129
2 1 1
2 1 0
: H
: H


=
=


2. Alegerea pragului de semnificaie a testului
. 05 , 0 = o

3. Alegerea statisticii test
Se folosete statistica test t:
2
2
2
1
2
1
2 1 2 1
n
'
n
'
) ( ) (
t
o o

+

= .
4. Determinarea valorii teoretice a testului
Se citete din tabelul Student pentru un risc 05 , 0 = o : 96 . 1 t t
35 , 025 . 0 2 n n , 2 /
2 1
= =
+ o
.

5. Determinarea valorii calculate a testului
Pe baza datelor de la nivelul eantionului, se obine: 67 . 6
17
7
20
3
33 28
t
calculat
=
+

= .

6. Luarea deciziei
- dac
2
calc
t t
o
s , se accept ipoteza H
0
;
- dac
2
calc
t t
o
> , se respinge ipoteza H
0
, cu probabilitatea (1-o).

7. Interpretare
96 . 1 t 67 . 6 t
2 / calc
= > =
o
, se respinge ipoteza Ho. Se poate garanta cu o probabilitate de
0,95 c exist diferene semnificative ntre preurile medii practicate de cei doi productori de
ciment.

c. Dispersiile sunt egale i se cunosc
n acest caz, se utilizeaz un test Z de forma:
2 1
2 1 2 1
n
1
n
1
) ( ) (
Z
+

=
o


Valoarea calculat a testului este:
2 1
2 1
calc
n
1
n
1
x x
Z
+

=
o
.

d. Dispersiile sunt egale i nu se cunosc

n acest caz, se utilizeaz un test Student de forma:
2 1
2 1 2 1
n
1
n
1
'
) ( ) (
t
+

=
o

, unde
130
2 n n
' ) 1 n ( ' ) 1 n (
'
2 1
2
2 2
2
1 1 2
+
+
=
o o
o .
Valoarea calculat a testului este:
2 1
2 1
calc
n
1
n
1
' s
x x
t
+

= , unde
2 n n
' s ) 1 n ( ' s ) 1 n (
' s
2 1
2
2 2
2
1 1 2
+
+
= .

Exemplu
Pentru a analiza veniturile persoanelor dintr-o regiune pe sexe, din populaia regiunii s-au
extras, din fiecare gen, dou eantioane, de volume n
1
= 850 persoane de sex feminin i n
2
= 750
persoane de sex masculin. S-au nregistrat veniturile anuale ale persoanelor ( mii lei) i s-au
obinut, la nivelul eantioanelor, 18 x
1
= mii lei, 27 x
2
= mii lei. Se cunoate c 7 . 4 ' s ' s
2
2
2
1
= = .
S se testeze dac exist diferene semnificative ntre veniturile persoanelor pe sexe, la nivelul
ntregii regiuni. Se consider . 05 , 0 = o

Rezolvare
1. Formularea ipotezelor statistice
2 1 1
2 1 0
: H
: H


=
=


2. Alegerea pragului de semnificaie a testului
. 05 , 0 = o

3. Alegera statisticii test
Se folosete statistica test t:
2 1
2 1 2 1
n
1
n
1
'
) ( ) (
t
+

=
o

.
4. Determinarea valorii teoretice a testului
Se citete din tabelul Student pentru un risc 05 , 0 = o : 96 . 1 t t
1598 , 025 . 0 2 n n , 2 /
2 1
= =
+ o
.

5. Determinarea valorii calculate a testului
Pe baza datelor de la nivelul eantionului, se obine:
7 . 4
1598
7 . 4 749 7 . 4 849
2 n n
' s ) 1 n ( ' s ) 1 n (
' s
2 1
2
2 2
2
1 1 2
=
+
=
+
+
=
13 . 39
750
1
850
1
7 . 4
27 18
t
calculat
=
+

= .

6. Luarea deciziei
- dac
2
calc
t t
o
s , se accept ipoteza H
0
;
- dac
2
calc
t t
o
> , se respinge ipoteza H
0
, cu probabilitatea (1-o).

131
7. Interpretare
96 . 1 t 13 . 39 t
2 / calc
= > =
o
, se respinge ipoteza Ho. Se poate garanta cu o probabilitate de
0,95 c exist diferene semnificative ntre veniturile persoanelor pe sexe, la nivelul regiunii.

132

Teste
1


1) Pentru un eantion de 100 salariai repartizai dup nivelul venitului lunar, s-au obinut
rezultatele: lei 300 ' s ; lei 1500 x = = . Cu un risc de 5%, se consider c ntre venitul mediu al
salariailor populaiei totale i nivelul mediu de referin lei 1800
0
= :
a) nu exist diferene semnificative
b) exist diferene semnificative
c) nu exist nici o legtur

2) Pentru un eantion de angajai repartizai dup variabila salariul anual ($) s-au obinut
rezultatele din tabelul de mai jos.
Statistics
Current Sal ary
474
0
$34,000.00
$785.000
Vali d
Missing
N
Mean
Std. Error of Mean

Pentru un nivel de ncredere de 95%, valoarea calculat a testului i decizia de a accepta ipoteza
c salariul mediu a unui angajat nu difer semnificativ de 33000$ sunt:
a) t
calc
=1,27 i se accept ipoteza nul
b) t
calc
=1,27 i se respinge ipoteza nul, cu o ncredere de 95%
c) t
calc
=2,27 i se respinge ipoteza nul, cu o ncredere de 95%

3)Decizia de a accepta sau a respinge o ipotez nul se ia prin compararea:
a) valorii calculate a testului cu o valoare teoretic a acestuia
b) estimaiei cu parametrul
c) erorii limit cu pragul de semnificaie

4) ntr-un test statistic se accept ipoteza nul dac:
a) t
calc
= t


b) t
calc
>t

c) t
calc
aparine intervalului (-t
/2
; t
/2
)

5) ntr-un sondaj electoral, un candidat a obinut un procent de voturi estimat egal cu 52%. tiind
c volumul eantionului este de 400 persoane, iar probabilitatea este de 0,95, atunci candidatul
a) ctig
b) pierde
c) nu se poate decide

6) Testarea este un procedeu statistic care presupune
a) verificarea semnificaiei diferenelor dintre parametri
b) aflarea unei valori posibile a unui parametru
c) calcularea erorii maxime admisibile


1
Rspunsuri: 1 b; 2 a; 3 a,b; 4 c; 5 b; 6 a, 7 c.

S-ar putea să vă placă și