Sunteți pe pagina 1din 166

UNIVERSITATEA DE VEST DIN TIMIŞOARA

FACULTATEA DE ECONOMIE ŞI DE ADMINISTRARE A


AFACERILOR
DEPARTAMENTUL DE EDUCAŢIE CONTINUĂ ŞI ÎNVĂŢĂMÂNT DESCHIS LA
DISTANŢĂ

CONSTANTIN CHILĂRESCU
OVIDIU CIORÎCĂ CIPRIAN ŞIPOŞ

STATISTICĂ

MANUAL DIDACTIC

ANUL I

Editura Universităţii de Vest


Timişoara, 2009
ISBN 978–973–125–061–8

© Copyright, 2009, Editura Universitãþii de Vest

Toate drepturile asupra acestei ediþii sunt rezervate.


Reproducerea integralã sau parþialã, pe orice suport,
fãrã acordul scris al editurii, este interzisã.

Editura Universităţii de Vest


300223 — Timişoara, Bd. V. Pârvan nr. 4,
BCUT, 010 B, tel./fax: 0256 592 253

2
CONTRIBUŢIE AUTORI:

Constantin Chilărescu – Coordonator Manual


Ovidiu Ciorîcă – Capitolele 2 şi 3
Ciprian Şipoş – Capitolele 1 , 4 – 8

3
4
CUPRINS

CAPITOLUL 1. INTRODUCERE ÎN STATISTICA 7

CAPITOLUL 2. VARIABILE ALEATOARE 11


2.1. Funcţii de repartiţie 19
2.2. Variabile aleatoare continue 22
2.2.1. Variabile aleatoare independente 24
2.3. Caracteristici numerice asociate variabilelor aleatoare 26
2.3.1. Medii şi momente pentru variabile discrete 26
2.3.2. Medii şi momente pentru variabile continue 28
2.3.3. Varianţa (dispersia) variabilelor aleatoare 29
2.4. Covarianţă şi corelaţie 30
Probleme propuse 33

CAPITOLUL 3. REPARTIŢII DE PROBABILITATE 39


3.1. Repartiţii discrete 39
3.2. Repartiţii continue 43
Probleme propuse 52

CAPITOLUL 4. OBŢINEREA ŞI PRELUCRAREA PRIMARĂ A DATELOR 55


STATISTICE
4.1. Observarea statistică 55
4.2. Prelucrarea primară a datelor statistice 58
Probleme rezolvate şi propuse 63

CAPITOLUL 5. PARAMETRII REPARTIŢIILOR STATISTICE 71


5.1. Parametrii tendinţei centrale 71
5.2. Parametrii variaţiei 76
5.2.1. Parametrii simpli şi sintetici ai variaţiei 76
5.2.2. Parametrii factoriali ai variaţiei 78
5.3. Media şi varianţa caracteristicii alternative 80
5.4. Parametrii asimetriei şi ai boltirii 82
Probleme rezolvate şi propuse 84

5
CAPITOLUL 6. ESTIMAŢII. INTERVALE DE ÎNCREDERE 91
6.1. Noţiuni de teoria estimaţiei 91
6.2. Estimarea parametrilor unei populaţii statistice 96
6.2.1. Estimarea punctuală a mediei şi varianţei 97
6.2.2. Estimarea mediei prin interval de încredere 99
6.2.3. Estimarea varianţei şi a abaterii standard prin interval de încredere 101
Probleme rezolvate şi propuse 102

CAPITOLUL 7. VERIFICAREA IPOTEZELOR STATISTICE 107


7.1. Demersul verificării unei ipoteze statistice 107
7.2. Verificarea ipotezelor referitoare la media unei populaţii statistice 110
7.3. Verificarea ipotezelor referitoare la varianţa unei populaţii statistice 113
7.4. Teste de comparare a mediilor şi a varianţelor a două populaţii statistice 114
Probleme rezolvate şi propuse 118

CAPITOLUL 8. INDICATORI ŞI INDICI STATISTICI 131


8.1. Indicatori ai nivelului şi ai variaţiei unui fenomen în timp 132
8.1.1. Indicatori exprimaţi în mărimi absolute 132
8.1.2. Indicatori exprimaţi în mărimi relative 134
8.1.3. Indicatori medii ai seriilor de timp 137
8.2. Indicatori statistici agregaţi 140
Probleme rezolvate şi propuse 143

BIBLIOGRAFIE 155

ANEXE 157

6
CAPITOLUL 1.

INTRODUCERE ÎN STATISTICĂ

Statistica a apărut din cele mai vechi timpuri ca o necesitate obiectivă


legată de măsurarea, cuantificarea unor fenomene specifice ştiinţelor naturii –
fizică, chimie, biologie etc. – şi ale vieţii sociale şi economice. Primele metode
de cercetare statistică au apărut în studiul populaţiei, practicată sub formă de
numărătoare a populaţiei şi evidenţă a bunurilor materiale. De-a lungul
timpului, metodele de analiză statistică au evoluat, au apărut diverse modele
statistice, unele mai simple, altele mai complexe, orientate către reliefarea a
numeroase aspecte ale activităţii umane din diverse domenii.
Impactul statisticii asupra realizărilor din alte ştiinţe este deja un lucru
bine cunoscut. Cele mai importante contribuţii se întâlnesc, aşa cum s-a arătat,
în fizică, biologie, sociologie şi, mai ales, în economie. Marile realizări obţinute
de ştiinţă, în general, şi de ştiinţa economică, în special, se datorează, în
ultimele decenii, într-o foarte mare măsură, utilizării metodelor cantitative de
analiză, specifice matematicii şi statisticii.
În acest sens, s-a născut o disciplină de sine stătătoare, statistica, al cărei
obiect principal de cercetare îl reprezintă aplicaţiile statisticii în diverse
domenii, dintre care un loc esenţial îl ocupă economia.
Câteva exemple care vin în sprijinul afirmaţiilor de mai sus: Dacă este
necesar să fie efectuat inventarul unui depozit de dimensiuni foarte mari, care
conţine mii sau zeci de mii de articole. În locul unei tentative de numărare şi
evaluare a tuturor articolelor din depozit, care ar presupune costuri ridicate şi un
consum foarte mare de timp, se pot lua în considerare doar o parte din acestea,
iar apoi prin compararea informaţiilor rezultate cu evidenţele din registrele
depozitului să se extindă concluziile asupra întregului depozit.
De asemenea, în activitatea de aprovizionare a unei firme pot exista
situaţii în care materiile prime recepţionate să nu corespundă în întregime
prevederilor din contractele încheiate. În aceste condiţii, se selectează doar o
parte din materiile prime respective şi se supun unui control riguros, control ale
cărui concluzii sunt transpuse apoi asupra întregului lot recepţionat.

7
În activitatea de marketing, în cercetarea pieţelor de desfacere,
producătorul este interesat dacă produsele sale au o piaţă asigurată şi cât de
mare este această piaţă. În scopul obţinerii acestor informaţii vitale, va organiza
o cercetare în rândurile posibililor beneficiari, cărora li se va solicita opinia în
legătură cu produsele în cauză. Din această cercetare efectuată asupra unui
număr limitat de beneficiari, se va putea deduce, cu ajutorul metodelor specifice
statisticii, care este cererea reală pentru produsele respective, ce preţ poate
suporta piaţa acestor produse şi multe altele.
Diversităţii acestor activităţi luate în considerare îi este opusă o trăsătură
comună a lor: ele se referă la un număr foarte mare de date, iar cercetarea se
efectuează doar pe o anumită parte, adică interesul îl prezintă fenomenul
cercetat ca atare, cu toate elementele sale, dar studierea lui se realizează luând
în considerare numai o parte din aceste elemente. Se deduce de aici că statistica
abordează fenomenul în ansamblul său, fără însă a-l cerceta în întregime.
Elementul fundamental al acestei cercetări îl reprezintă, deci, o mulţime
de individualităţi ale căror caracteristici vor fi supuse analizei şi care poartă
numele de populaţie statistică.
Populaţia sau colectivitatea statistică reprezintă totalitatea manifestărilor
sau a elementelor de aceeaşi natură, de aceeaşi esenţă calitativă ce compun un
fenomen ori proces economic bine individualizat. Populaţia statistică specifică
vieţii social – economice are un caracter obiectiv, concret şi finit, strict
determinat în timp şi în spaţiu.1
Populaţia statistică este compusă din ansamblul unităţilor statistice.
Unitatea statistică reprezintă forma individuală de manifestare obiectivă a
fenomenelor şi proceselor supuse cercetării. Definiţia unităţilor statistice trebuie
să conţină cel puţin caracteristicile de identificare referitoare la concretizarea
obiectivă a unităţii (obiect, fenomen etc.), precum şi la localizarea temporală şi
spaţială a acesteia. De exemplu, dacă o unitate statistică se defineşte ca fiind o
persoană care în data de 1 ianuarie 2007 locuieşte în România, atunci înseamnă
că au fost fixate caracteristicile de identificare: concret – persoana, temporal – 1
ianuarie 2007, iar spaţial – România.
Fiecare din unităţile unei populaţii statistice are anumite trăsături, însuşiri
sau proprietăţi, numite caracteristici statistice. În general, unităţile statistice
posedă un număr foarte mare de însuşiri, dar în cadrul analizei statistice se reţin
numai acelea care prezintă interes pentru cercetarea întreprinsă.
După modul de exprimare, caracteristicile statistice pot fi cantitative
(numerice) sau calitative (atributive).

1
T. Baron, C. Anghelache, Emilia Ţiţan, Statistică, Editura Economică, Bucureşti, 1996, pag. 18

8
Caracteristicile cantitative se măsoară (cifra de afaceri, producţia,
consumul etc.), se numără (numărul de muncitori, numărul de utilaje etc.) sau se
calculează.
Caracteristicile calitative se disting prin faptul că li se observă frecvenţa
realizării (starea socială, profesia, calitatea produselor etc.).
Diferenţierea între o caracteristică exprimată cantitativ şi o caracteristică
atributivă este, uneori, convenţională. Unei caracteristici numerice i se pot
atribui, dacă se doreşte, expresii calitative, precum şi caracteristicile calitative
pot fi cuantificate numeric, pe baza unor convenţii.
După numărul valorilor posibile pe care unităţile statistice le pot
înregistra, caracteristicile sunt alternative şi nealternative.
Caracteristicile nealternative pot lua diferite valori diferite pentru
fiecare unitate în parte, în timp ce caracteristicile alternative (binomiale sau
bernoulliene) au caracter dihotomic, pot lua numai două valori (admis – respins,
da – nu etc.).2
Partea din populaţia statistică ce face obiectul cercetării statisticii se
numeşte selecţie sau eşantion şi este o submulţime reprezentativă a populaţiei.
Dacă populaţia statistică este de dimensiuni relativ mici, eşantionul se poate
confunda cu aceasta, dar acest lucru se întâmplă destul de rar în practică.
Eşantionul reprezintă ansamblul unităţilor statistice ale căror caracteristici
sunt înregistrate în planul cercetării statistice, al cărui volum este, de regulă,
considerabil mai mic decât cel al populaţiei studiate. Pentru a înţelege mai exact
noţiunea de eşantion vom da un exemplu: un producător de componente
electronice este interesat în a şti care este ponderea componentelor cu defecte în
totalul producţiei realizate. În acest scop, se va recurge la verificarea doar a unei
părţi mici din producţie, deoarece procesul de testare este distructiv. În cazul
acesta, populaţia statistică este formată din totalitatea componentelor electronice
fabricate, în timp ce eşantionul este format numai din componentele verificate.
Procesul de obţinere a eşantionului poartă numele de selecţie sau sondaj
statistic şi trebuie să îndeplinească o serie de condiţii care să asigure
reprezentativitatea acestuia, adică la o scară mai mică, eşantionul trebuie să
reproducă trăsăturile populaţiei din care provine.
Aplicarea calculelor statistice asupra datelor empirice obţinute prin
observarea statistică a populaţiei supusă cercetării, permite desprinderea
legităţilor statistice care acţionează la nivelul populaţiei respective. Acestea
exprimă numai comportamentul ansamblului de unităţi statistice şi nu a fiecărei
unităţi în parte.

2
Elisabeta Jaba, Statistica, Editura Sedcom Libris, Iaşi, 1996, pag. 19 – 20

9
Prin ordonarea şi gruparea datelor statistice după una sau mai multe
caracteristici, se obţin seriile statistice.
După conţinutul caracteristicii de grupare, seriile statistice sunt de trei
tipuri: serii de repartiţie (de distribuţie sau de frecvenţă), serii de timp (dinamice
sau cronologice) şi serii de spaţiu (teritoriale).
Seria de repartiţie după variaţia unei caracteristici numerice poate fi
discretă (pe variante) sau continuă (pe intervale). Întrucât caracteristica de
grupare ia diferite valori de la o unitate statistică la alta, ea se mai numeşte
variabilă aleatoare. Variabila aleatoare exprimă variaţia unei caracteristici
întâmplătoare pusă în evidenţă de seria statistică de repartiţie sau, pe scurt, de
repartiţia variabilei aleatoare. Cuvântul „aleator‖ semnifică faptul că nu se
poate preciza dinainte valoarea pe care o va lua variabila respectivă. Având în
vedere că fiecare eveniment, elementar sau complex, este caracterizat de o
anumită probabilitate de apariţie, valorile variabilei aleatoare vor fi însoţite de
probabilităţile asociate apariţiei lor.3
Seria de timp, dinamică sau cronologică prezintă variaţia unei
caracteristici în funcţie de timp. După timpul la care se referă datele prezentate,
pot fi serii dinamice de intervale şi serii dinamice de momente.
Seria de spaţiu este aceea în care centralizarea frecvenţelor sau a valorii
individuale ale caracteristicii studiate se face în funcţie de variaţia teritorială.
Cunoaşterea statistică a evoluţiei fenomenelor şi proceselor economice
depinde de existenţa unor informaţii pe baza cărora se face o analiză a situaţiei
reale şi se fundamentează strategiile de urmat de către factorii de decizie.
Culegerea datelor şi valorificarea informaţiilor rezultate din prelucrarea şi
analiza statistică a acestora poartă numele de cercetare statistică şi reprezintă
un proces de cunoaştere a fenomenelor de masă cu ajutorul metodelor şi
tehnicilor statistice.
Procesul de cercetare statistică reprezintă un ansamblu unitar de activităţi,
sintetizate într-un program de cercetare statistică, ce cuprinde principiile şi
problemele care trebuie rezolvate în fiecare etapă în parte.

3
C. Şipoş, C. Preda, Statistică economică, Editura Mirton, Timişoara, 2004, pag. 12 – 13

10
Capitolul 2

VARIABILE ALEATOARE

Noţiunea de variabilă aleatoare este una dintre cele mai importante concepte ale
teoriei probabilităţilor. Primul care a introdus această noţiune a fost Cebâşev
(1821-1884), pe la mijlocul secolului al XIX-lea. El a definit variabila aleatoare
astfel: ‖o variabilă reală care ia diferite valori cu diferite probabilităţi.‖

Această definiţie este destul de aproape de spiritul modern al conceptului, dar


lasă, totuşi, mult de dorit din punctul de vedere al rigorii matematice.

Exemplu. Să considerăm problema determinării probabilităţii ca suma


punctelor obţinute în urma aruncării a două zaruri să fie cel puţin 3 şi cel mult 5.
Notând cu X caracteristica de interes pentru această problemă, adică suma
punctelor obţinute după aruncarea celor două zaruri, se constată că X este de
fapt o funcţie care asociază câte un număr natural (reprezentând suma
punctelor) fiecărui rezultat posibil al experienţei εZ2 .
Prin urmare

X :ΩZ2 →{2, 3,…, 12},


X((i, j)) = i + j, Vi, j =1, …, 6,
unde ΩZ2 = {(i, j)| i, j =1, …, 6} este spaţiul de selecţie sociat experienţei εZ2 .
Notăm evenimentele elementare cu A(I,jj), Vi, j =1,… , 6 şi definim pentru s
=2,… , 12 următoarele evenimente:
{X = s}: evenimentul ca în urma aruncării celor două zaruri, suma punctelor
obţinute să fie s.
Dacă s =3, 4, 5 avem în mod evident următoarele caracterizări:
{X =3} = A(1,2) U A(2,1),
{X =4} = A(1,3) U A(2,2) U A(3,1),
{X =5} = A(1,4) U A(2,3) U A(3,2) U A(4,1).

Având în vedere că pentru această experienţă aleatoare mulţimea de evenimente


asociată este P(ΩZ2 ) şi că ea este probabilizată utilizând definiţia clasică a prob-
abilităţii, rezultă că
1
P (A(i,j))= , Vi, j =1, ··· , 6
36

11
Probabilitatea oricărui eveniment de forma {X = s} se notează cu P (X = s) şi
din reprezentările de mai sus rezultă:

2 3 4
P (X = 3) = ,P (X = 4) = ,P (X = 5) = .
36 36 36

Evenimentul ca X să fie cel puţin 3 şi cel mult 5 se notează cu {3 ≤ X ≤ 5}, iar


probabilitatea sa o vom nota cu P (3 ≤ X ≤ 5). El se poate evident reprezenta sub
forma:
{3 ≤ X ≤ 5} = {X =3}U{X =4}U{X =5}.
Prin urmare, probabilitatea cerută este
P (3 ≤ X ≤ 5) = P (X = 3)+ P (X = 4)+ P (X = 5)
9 1
= =
36 4

deoarece cele trei evenimente din reuniune sunt două câte două incompatibile.
Analog pot fi determinate şi alte probabilităţi de forma P (X = s) sau P (a ≤ X ≤
b), a, b є N. Din cele de mai sus rezultă că X este o funcţie care ia, într-adevăr,
diverse valori cu diverse probabilităţi şi ea constituie un prim exemplu de
variabilă aleatoare.

Fie acum ε o experienţă aleatoare oarecare şi fie Ω spaţiul său de selecţie.


Din punct de vedere intuitiv, o variabilă aleatoare este o funcţie X definită pe
mulţimea Ω a rezultatelor posibile ale experienţei aleatoare ε şi cu valori, în
n
general, în R (sau R ) şi care, în plus, satisface anumite condiţii de compatibil-
itate cu o algebră sau σ-algebră de evenimente K anterior precizată sau dedusă
din contextul concret al fiecărei probleme. Mulţimea K este, în general, probabi-
lizată pe baza uneia dintre definiţiile probabilităţii şi odată precizat acest cadru
de lucru toate noţiunile ulterioare se vor da relativ la elementele lui. Condiţiile
suplimentare pe care trebuie să le satisfacă funcţia X pentru a fi variabilă
aleatoare sunt deci necesare pentru a putea răspunde la întrebări de tipul:
‖Cu ce probabilitate ia X valori în intervalul D?‖,
n
unde D este un interval din R (respectiv R ), a, b є R, a ≤ b. Cu alte cuvinte,
mulţimile de forma
{ω є Ω|X(ω) є D}
trebuie să fie reprezentarea unui eveniment aleator din K pentru a putea fi eval-
uată probabilitatea cerută. Notăm atât acest eveniment, cât şi reprezentarea sa
−1
prin {X є D} sau prin X (D) (ultima variantă denotaţie provine din teoria
mulţimilor unde este binecunoscută sub numele de preimaginea lui D prin inter-

12
mediul funcţiei X).

Observaţie. Notaţiile de mai sus se adaptează în funcţie de cazul concret aflat


în discuţie:
not
{X<x} = {ω є Ω|X(ω) <x}, (V)x є R;
not
{X ≤ x} = {ω є Ω|X(ω) ≤ x}, (V)x є R;
not
{X>x} = {ω є Ω|X(ω) >x}, (V)x є R;
not
{a ≤ X<b} = {ω є Ω|a ≤ X(ω) <b}, (V)a, b є R,a ≤ b;
not
{a ≤ X ≤ b} = {ω є Ω|a ≤ X(ω) ≤ b}, (V)a, b є R,a ≤ b.

Sintetizăm acum câteva din ideile de mai sus în următoarea definiţie generală a
variabilelor aleatoare cu valori în R.

Definiţie. Dacă Ω este spaţiul de selecţie al unei experienţe aleatoare E, iar A


este o algebră de evenimente asociate ei, vom spune că X :Ω → R este o
variabilă aleatoare reală în raport cu A dacă:

{X<x}єA, (V)x є R.

Vom nota cu V(Ω, R) familia acestor variabile aleatoare.


Observaţie. Dacă (Ω, K) este un câmp de evenimente (sau dacă (Ω, K,P ) este
un câmp de probabilitate) asociat lui E, iar X este o variabilă aleatoare în raport
cu K, vom spune adesea că X este o variabilă aleatoare pe câmpul de
evenimente (Ω, K) (respectiv, pe câmpul de probabilitate (Ω, K,P )).

Se observă că noţiunea de variabilă aleatoare este întotdeauna definită relativ la


un spaţiu de evenimente A. Astfel, o funcţie reală de genul celor prezentate mai
sus poate să nu fie variabilă aleatoare în raport cu un spaţiu de evenimente
particular A, dar aceasta nu înseamnă că ea nu poate fi variabilă aleatoare în
raport cu un alt spaţiu de evenimente. Mai mult, pentru orice astfel de funcţie
reală există, desigur, cel puţin o algebră de evenimente A în raport cu care acea
funcţie devine variabilă aleatoare.

Exemplu. Să considerăm o experienţă aleatoare cu spaţiul de selecţie Ω = {1, 2,


3, 4} şi următorul câmp de evenimente:

13
K = {Ω, Ø, {1, 2}, {3, 4}}. (2.8)

Atunci funcţia X :Ω →{1, 2} dată prin:

X(1) = X(2) = 1,X(3) = X(4) = 2


este o variabilă aleatoare în raport cu K.
−1 −1 −1
Într-adevăr, X (x)= ØєK dacă x  {1, 2} şi X (1) = {1, 2}єK, X (2) = {3,
4}єK şi deci, conform punctului b) al observaţiei de mai sus, X este o variabilă
aleatoare discretă.

Exemplu. În acelaşi cadru ca în exemplu anterior, să considerăm aplicaţia Y :Ω


→{1, 2} dată prin:

Y (1) = Y (2) = Y (3) = 1,Y (4) = 0


−1
O astfel de funcţie nu este o variabilă aleatoare în raport cu K, deoarece Y (0)
= {4}  K

Exemplu. Pentru orice eveniment A asociat lui E putem defini funcţia sa


caracteristică:

1 dacă   A

ϕA : Ω → {0, 1}, ϕA(ω) = 0 dacă   A

unde A este reprezentarea lui A.


Ne putem pune atunci întrebarea: în ce condiţii devine ϕA o variabilă
aleatoare?
Este clar că ϕA este o variabilă aleatoare în raport cu algebra A dacă şi numai
dacă A єA.
Definirea variabilelor aleatoare reale am făcut-o utilizând evenimente de forma
{X<x}, însă se putea face foarte bine utilizând şi alte tipuri de evenimente, aşa
după cum rezultă din propoziţia următoare:
Propoziţie. O funcţie X :Ω → R este o variabilă aleatoare pe câmpul de
evenimente (Ω, K) dacă şi numai dacă una din proprietătile de mai jos este
verificată:

1) {X<x}єK, Vx є Q;

14
2) {X ≤ x}єK, Vx є R;
3) {X>x}єK, Vx є R;
4) {a ≤ X<b}єK, Va, b є R, a ≤ b;
5) {a ≤ X ≤ b}єK, Va, b є R, a ≤ b;
6) {X є D}єK, VD єD (mulţimea deschiselor în R);
7) {X є F }єK, VF єF (mulţimea închiselor în R).

Observaţie. Noţiunea de variabilă aleatoare este deci o particularizare a noţiunii


de funcţie măsurabilă din teoria măsurii.

Să considerăm o variabilă aleatoare reală X. Vom nota imaginea lui Ω prin X cu


X(Ω), adică

X(Ω) := {X(ω)|ω є Ω}.

Definiţie. Vom spune că X este o variabilă aleatoare discretă dacă X(Ω) este cel
mult numărabilă. Dacă X ia doar un număr finit de valori o vom numi variabilă
aleatoare simplă.

Descrierea variabilelor aleatoare discrete se face pe baza noţiunilor date în


definiţia următoare.

Definiţie. Dacă X este o variabilă aleatoare reală discretă ale cărei valori
ordonate crescător sunt
x0,x1, … ,xn,…
şi dacă
p0,p1, … ,pn,…

sunt probabilităţile cu care X ia aceste valori (adică P (X = xi)= pi, Vi = 0, 1,...),


atunci vom reprezenta X printr-un tablou de forma:

 x0 x1... xn 
X  
pn 
(2.1)
 p0 p1...

numit tabloul de repartiţie (sau repartiţia) variabilei aleatoare X.


Funcţia f : R → [0, 1] dată prin

15
 pi dacă pi daca x  xi, i  0, 1,...

f(x)= P (X = x) = 
0 daca x  R \ {xi | i  0, 1,...},

(2.2)
se numeşte funcţie de frecvenţe sau funcţie de probabilitate.

Observaţie. Pentru tabloul de repartiţie al unei variabile discrete X care ia


valorile
{xi|i є J} (J  N) vom folosi de multe ori notaţia

 xi 
X   (2.3)
 pi  iJ

Astfel, dacă X este o variabilă simplă care ia valorile (ordonate crescător)


x1,x2,…,xn cu probabilităţile p1,p2, …,pn, atunci tabloul său de repatiţie este

 x1 x 2... xn 
X  
pn 
(2.4)
 p1 p 2...

sau, într-o formă condesată,

 xi 
X  
 pi  iJ n

unde Jn = {1,...,n}.

Propoziţie. Dacă X este o variabilă aleatoare discretă având tabloul de repartiţie


(2.1), atunci

 pn  1
nN

Cu alte cuvinte, suma elementelor de pe linia a doua, din orice tablou de


repartiţie, este 1.

Demonstraţia aceste propoziţii rezultă imediat din faptul că sistemul de


evenimente aleatoare {X = xi}, i =0, 1,... constituie un sistem complet de
evenimente.

16
Exemplu. Să revenim la variabila aleatoare X descrisă în exemplul de mai sus.
Conform definiţiilor anterioare, X este o variabilă aleatoare simplă. După ce
evaluăm într-o manieră similară cu cea dată în exemplul precizat mai sus toate
probabilităţile cu care X ia fiecare din cele 11 valori, se obţine următorul tablou

 2 3 4 5 6 7 8 9 10 11 12 
X 1 2 3 4 5 6 5 4 3 2 1 
 
 36 36 36 36 36 36 36 36 36 36 36 

Se observă şi aici că suma elementelor de pe linia a doua este 1.

Fie acum X o variabilă aleatoare simplă definită pe câmpul de evenimente (Ω,


K) şi fie X(Ω) = {x1,x2, ..., xn}.

Evident, evenimentele Ai = {X = xi}, i =1,...n constituie o partţie a


evenimentului sigur.

Utilizând funcţiile caracteristice asociate acestor evenimente, este clar că putem


scrie variabila aleatoare X sub forma:

n
X=  xiAi
i 1

Această scriere poartă numele de formă standard. Să remarcăm că forma


standard este unic determinată de valorile xi, i =1,...,n şi partiţia Ai,i =1,...,n
corespunzătoare acestora.

Se poate arăta că şi reciproca este adevărată, adică pentru orice sistem de n


valori reale distincte xi, i =1,...,n şi pentru orice sistem de n evenimente
aleatoare Ai, i =1,...,n ce formeză o partţie a evenimentului sigur, relaţia de mai
sus descrie o variabilă aleatoare simplă.
Mai mult, orice combinaţie liniară finită de funcţii caracteristice ale unor eveni-
mente din K este o variabilă aleatoare simplă. Cu alte cuvinte, are loc:

m
Teorema Dacă Y=  yjBj , yj є R şi Bj єK, j=1,...,m, atunci Y este o
j 1

variabilă aleatoare simplă.

17
Operaţiile elementare cu funcţii se transpun în mod natural şi la variabilele
aleatoare.
De exemplu, pentru cazul variabilelor aleatoare simple, avem următoarea
caracterizare:

Propoziţie. Dacă X, Y sunt variabile aleatoare simple, atunci X +Y , X ·Y ,


αX(   R  , X , daca X  0 sunt de asemenea variabile aleatoare
1
X
simple.

Rezultate similare au loc şi în cadrul mulţimii variabilelor discrete, cât şi în


cadrul mulţimii tuturor variabilelor aleatoare reale.

Până acum am discutat doar despre variabile aleatoare reale, insăîntr-o manieră
similară pot fi definite şi variabile aleatoare care iau valori în spaţii mult mai
n
generale, ca de exemplu în R sau într-un spaţiu metric oarecare.
n
Pentru a nu complica prea mult lucrurile, ne vom mărgini doar la cazul lui R (n
є N). Tot de dragul simplităţii, vom construi noile noţiuni pe baza noţiunii de
variabilă aleatoare reală deja introdusă mai sus.
n
Fie (Ω, K,P ) un câmp de probabilitate şi fie X :Ω → R o funcţie. Notăm cu
X1,X2, ..., Xn cele n componente reale ale aplicaţiei X, adică
n
Xi :Ω → R , Vi =1, . . . , n,
şi
X(ω)=(X1(ω),X2(ω), ..., Xn(ω)), (V)ω є Ω.
Vom scrie prescurtat
X =(X1,X2, ..., Xn).
Definiţie. Vom spune că X este un vector aleator n dimensional dacă toate cele
n componente ale sale sunt variabile aleatoare reale.
La fel ca şi în cazul variabilelor aleatoare, vom spune că un vector aleator X :Ω
n
→ R este discret (respectiv simplu) dacă X(Ω) este o mulţime cel mult
n
numărabilă (respectiv finită) din R .

18
2.1 Funcţii de repartiţie

Definiţie. Fie X o variabilă aleatoare reală pe câmpul de probabilitate (Ω, K,P ).


Atunci funcţia F : R → [0, 1] dată prin
not
F (x)= P (X<x) = P (ω є Ω|X(ω) <x) Vx є R

poartă numele de funcţia de repartiţie a variabilei aleatoare X.

Dacă X este o variabilă aleatoare discretă având tabloul de repartiţie (2.1) şi


funcţia de frecvenţe (2.2), atunci pentru funcţia de repartiţie se evaluează cu
formula:

F (x)= 
xi  x
f(xi), Vx є R.

Cu alte cuvinte, funcţia de repartiţie în punctul x a unei variabile aleatoare


discrete este dată de suma probabilităţilor corespunzătoare valorilor pe care X le
ia la stânga lui x.
In cazul în care X este o variabilă aleatoare simplă cu tabloul de repartiţie
 x1 x 2... xn 
X  ,
 p1 p 2... pn 
atunci, cu ajutorul formulei de mai sus, obţinem următoarea explicitare a
funcţiei de repartiţie a lui X:

 0, x  x1
 p1, x  ( x1, x 2]

FX ( x)   p1  p 2, x  ( x 2, x3]
 ....

 1, x  xn

Punem în evidenţă în continuare proprietăţile de bază ale unei funcţii de


repartiţie.

Teorema Funcţia sa de repartiţie F asociată unei variabile aleatoare reale X are

19
următoarele proprietăţi:

(F1). F este monoton crescătoare pe R, adică


x<y => F (x) ≤ F (y), Vx, y є R;

(F2). F este continuă la stânga pe R, adică


Lim F(x)=F(y) Vx, y є R;
(F3). F are limite la ±∞, şi anume:
F (−∞) = lim F (x)=0 şi F (∞) = lim F (x) = 1
De remarcat ar fi faptul că din (F 1)şi (F 2) rezultă că toate funcţiile de repartiţie
au limită la dreapta în orice punct al dreptei reale. Faptul că proprietăţile
descrise în teorema precedenta sunt definitorii pentru funcţiile de repartiţie
rezultă din următorul rezultat:

Teorema Dacă F : R −→ [0, 1] are proprietăţile (F1)-(F4) din teorema


precedenta, atunci există un câmp de probabilitate (Ω, K,P ) şi o variabilă
aleatoare reală X astfel încât F este chiar funcţia de repartiţie a lui X.

Există, desigur, variabile aleatoare diferite care au totuşi aceeaşi funcţie de


repartiţie. Prin urmare, funcţiile de repartiţie pot fi folosite laîmpărţirea
variabilelor aleatoare în clase de echivalenţă (toate variabilele aleatoare care au
aceeaşi funcţie de repartiţie formează o astfel de clasă de echivalenţă).

Definiţie. Vom spune despre două sau mai multe variabile aleatoare că sunt
identic repartizate (sau identic distribuite) dacă ele au aceeaşi funcţie de
repartiţie.

Un caz banal în care avem de-a face cu două variabile X, Y identic distribuite
este acela în care probabilitatea ca X să fie diferit de Y este 0, adică

P (X  Y )= P ({ω|X(ω)= Y (ω)})=0,

sau, echivalent,
P (X = Y )=1.

Vom spune atunci că X coincide (sau este egal) cu Y aproape sigur şi vom nota

X = Y a.s.

In general, însă, avem definiţia următoare:

20
Definiţie. Dacă o anumită proprietate P a unui sistem aleator are loc cu
probabilitatea 1, vom spune că P are loc aproape sigur şi notăm
Pa.s.

Să analizăm acum câteva formule foarte utile de evaluare a probabilităţii ca o


variabilă aleatoare să ia valori într-un interval:

Propoziţie. Dacă F este funcţia de repartiţie a variabilei X, atunci


1 P (a ≤ X<b)= F (b) − F (a), Va, b є R,a ≤ b;
2 P (a ≤ X ≤ b)= F (b) − F (a)+ P (X = b), Va, b є R,a ≤ b;
3 P (a<X<b)= F (b) − F (a) − P (X = a), Va, b є R,a ≤ b;
4 P (a<X ≤ b)= F (b) − F (a) − P (X = a)+ P (X = b), Va, b є R,a ≤ b;
5 P (X = x)= F (x+) − F (x), Vx є R, unde prin F (x+) s-a notat limita lui F
la drepta în x.

Demonstraţie. Din a ≤ b rezultă că {X<a}  {X<b} şi cum


{a ≤ X<b} = {X<b}\{X<a},
rezultă că
P (a ≤ X<b)= P (X<b) − P (X<a)= F (b) − F (a).
Folosind apoi faptul că

{a ≤ X ≤ b} = {a ≤ X<b}U{X = b}
şi că această reuniune este formată din evenimente incompatibile, obţinem
P (a ≤ X ≤ b)= P (a ≤ X<b)+ P (X = b)= F (b) − F (a)+ P (X = b).
Analog se demonstrează şi următoarele două proprietăţi. Pentru ultima
proprietate, folosind faptul că F este monotonă, avem

1
lim F (x + )= F (x+)
n

şi prin urmare

 1
P ({X = x})=P(  x  X  x  n  )
n 1
1 1
=limP( x  X  x  )=lim(Ff( x  )-Ff(x))=
n n
=Ff(x+)-Ff(x)

21
Şi în cazul vectorilor aleatori se poate defini noţiunea de funcţie de repartiţie în
felul următor:
n
Definiţie. Dacă X =(X1,X2, ..., Xn):Ω → R este un vector aleator n-
n
dimensional, atunci funcţia F : R → [0, 1], dată prin
F (x)= P (X1 <x1,X2 <x2,...,Xn <xn)
= P ({X1 <x1}∩{X2 <x2}∩ ... ∩{Xn <xn}),
n
pentru orice x =(x1,x2, ..., xn) є R , poartă numele de funcţia de repartiţie a
vectorului aleator X.
Teorema următoare rezumă principalele proprietăţi ale funcţiilor de repartiţie
asociate vectorilor aleatori:

Teorema Funcţia de repartiţie F a unui vector aleator X are următoarele


proprietăţi:
n
(Fn1) Dacă x, h є R , atunci

1h12h 2 ......nhn F ( x)  0 ,
unde x =(x1,...,xn), h =(h1,...,hn),
nhn F (x) = F (x1,...xn−1,xn + hn) − F (x1,...xn−1,xn)

nhn11 nhn F(x)= nhn11 [F (x1,...xn−1 + hn−1,xn + hn) − F (x1,...xn−1,xn + hn)]


= F (x1,...xn−1 + hn−1,xn + hn) − F (x1,...xn−1,xn + hn)
−F (x1,...xn−1 + hn−1,xn)+ F (x1,...xn−1,xn)
... etc.;

(Fn2) F este continuă la stânga;


(Fn3) Dacă x1 →∞,x2 →∞, ... , xn →∞, atunci F (x1,...,xn) → 1;
(Fn4) Dacă fixăm un indice i є{1,...,n} şi dacă xi → −∞, atunci F (x1,...,xn) →
0.

2.2 Variabile aleatoare continue

Definiţie. Vom spune că X este variabilă aleatoare continuă dacă funcţia sa de


repartiţie F este continuă pe R.
Spre deosebire de variabilele aleatoare discrete care au o mulţime cel mult

22
numărabilă de valori, variabilele continue iau, în general, toate valorile dintr-un
subinterval sau dintr-o reuniune de subintervale ale dreptei reale. Exemple de
astfel de variabile aleatoare: timpul de aşteptare al unui tramvai într-o staţie,
abscisa unui punct ales la întâmplare într-un interval [a, b](a<b) etc.
Ne vom ocupa în continuare mai ales de acele variabile aleatoare continue a
căror funcţie de repartiţie are proprietăţie de regulariate suplimentare care să
permită definirea noţiunii de densitate cât şi a unor caracteristici numerice foarte
utile în practică.

Definiţie. Vom spune că o variabilă aleatoare reală X admite densitate de


probabilitate sau densitate de repartiţie dacă există o funcţie f : R −→ [0, ∞)
integrabilă Riemann, astfel încât funcţia sa de rapartiţie F să se poată reprezenta
astfel:
x
F (x)= 

f(t)dt, Vx є R.

Funcţia f se numeşte în acest caz densitatea de de repartiţie a variabilei X.

Observaţie. Tinând cont că F (∞) = 1, rezultă imediat că pentru orice densitate


de repatiţie f avem



f(t)dt=1

Următoarea formulă de calcul este foarte utilă în multe probleme concrete:

Propoziţie. Dacă variabila aleatoare reală X admite densitatea de repartiţie f şi


dacă a şi b sunt două numere reale cu a<b, atunci:

b
F (b) − F (a)= P (a ≤ X<b)= 
a
f(t)dt

Observaţie. Se poate obtine usor faptul ca pentru cazul unei variabile continue
X avem
P (X = x)= F (x+) − F (x) = 0, Vx є R şi că
P (a ≤ X<b)= P (a<X ≤ b)= P (a<X<b)
= P (a ≤ X ≤ b)= F (b) − F (a), Va, b є R,a ≤ b.

De asemenea, foarte util în multe probleme este şi următorul rezultat:

23
Propoziţie. Dacă variabila aleatoare reală X admite densitatea de repartiţie f,
atunci

F = f a.p.t.

2.2.1 Variabile aleatoare independente

Fie câmpul de probabilitate (Ω, K,P ) şi variabilele aleatoare X, Y .

Definiţie. Vom spune că variabilele aleatoare X şi Y sunt independente dacă


P (X<x,Y <y)= P (X<x) · P (Y <y),
oricare ar fi x, y є R.

Observaţie. Cu alte cuvinte, variabilele aleatoare X, Y sunt independente dacă


FZ (x, y)= FX (x) · FY (y), Vx, y є R,
unde FZ este funcţia de repartiţie a vectorului aleator bidimensional Z =(X, Y ),
iar FX , FY sunt funcţiile de repartiţie ale variabilelor aleatoare X, respectiv Y .

Propoziţie. Următoarele afirmaţii sunt echivalente:

1 variabilele aleatoare X şi Y sunt independente;


2 pentru orice a, b, c, d numere reale avem P (a ≤ X < b,c ≤ Y <d)= P (a ≤
X<b) · P (c ≤ Y <d);
3 pentru orice intervale J1, J2  R avem:
P (X є J1,Y є J2)= P (X є J1) · P (Y є J2).

Fie acum X, Y variabile discrete cu tablourile de repartiţie

 xi   yi 
X  X
 ' respectiv Y  Y  ,
 pi  iJ 1  p j  jJ 2
J1,J2  N.
În acest caz, independenţa acestor variabile se mai poate caracteriza astfel:

Propoziţie. Variabilele aleatoare X, Y sunt independente dacă şi numai dacă


P (X = xi,Y = yj)= P (X = xi) · P (Y = yj)= p · pj , V(i, j) є J1 × J2.

24
Observaţie. Dacă X, Y sunt variabile aleatoare discrete cu tablourile de
repartiţie de mai sus, atunci putem uşor determina tablourile de repartiţie ale
m n
variabilelor X + Y , X · Y , X − Y , X · Y (m, n єN ), αX + βY (α, β є R) etc.
De exemplu, pentru αX + βY şi X · Y vom aplica formulele:

P (αX + βY = t)= 
xi  yi t
P (X = xi,Y = yj)

= 
xi  yi t
P(X=xi)P(Y=yi),

P (X · Y = u)= 
xiyi u
P (X = xi,Y = yj)

= 
xiyi u
P(X=xi)P(Y=yi),

unde însumarea se face după toate perechile de valori (xi,yj) pentru care αxi
+βyj = t, respectiv xi · yj = u.

Exemplu. Fie X, Y două variabile aleatoare independente cu tablourile de


repartiţie

10 1  0 1
X  1 3 1  si Y  3 1 
   
 5 5 5 4 4

Valorile variabilei X + Y sunt {−1, 0, 1, 2}. Pentru aceste valori avem:


13 3
P (X + Y = −1) = P (X = −1,Y = 0) = P (X = −1)P (Y =0)=  ,
5 4 20

P (X + Y = 0) = P ({X = −1,Y =1}U{X =0,Y =0})=

1 1 3 3 10 1
P (X = −1)P (Y = 1)+ P (X = 0)P (Y =0)=    ,
5 4 5 4 20 2

P(X + Y = 1) = P ({X =0,Y =1}U{X =1,Y =0})=,

31 13 6 3
P (X = 0)P (Y = 1)+ P (X = 1)P (Y =0)=    ,
5 4 5 4 20 10

25
11 1
P (X + Y = 2) = P (X =1,Y = 1) = P (X = 1)P (Y =1)=  ,
5 4 20

şi deci tabloul de repartiţie al variabilei X + Y este

 1 0 1 2 
X+Y  3 1 3 1 
 
 20 2 10 20 
In situaţiile mai complicate, faptul că suma probabilităţilor dintr-un tablou de
repartiţie este 1 ne poate ajuta la determinarea mai rapidă a ultimei probabilităţi
de calculat din acel tablou.
În mod analog se poate defini noţiunea de independenţă şi pentru mai multe
variabile aleatoare.

Definiţie. Vom spune că variabilele aleatoare X1, ..., Xn sunt independente


dacă

oricare ar fi x1,...,xn numere reale

P (X1 <x1,X2 <x2,...,Xn <xn)= P (X1 <x1) · P (X2 <x2) ··· P (Xn <xn),

Prezentăm în continuare o serie de caracteristici numerice ce se pot asocia unei


variabile aleatoare în scopul de a sintetiza informaţiile cu privire la ea.

2.3 Caracteristici numerice asociate variabilelor aleatoare

2.3.1 Medii şi momente pentru variabile discrete

Fie X o variabilă aleatore discretă având tabloul de repartiţie

 xi 
X   , J  N
 pi  iJ

Dacă J este o mulţime cu o infinitate de elemente, vom presupune în cele ce

26
urmează că:

 xi p
iJ
i 

Definiţie. Dacă X o variabilă aleatoare discretă ce verifică condiţiile de mai sus,


vom spune că X admite medie (sau că X are medie finită), iar numărul real

M(X)= x p
iJ
i i

îl vom numi media (sau valoarea medie a) variabilei aleatoare X.

Definiţie. Dacă variabila aleatoare discretă X are medie finită, atunci

• momentul de ordin r al variabilei aleatoare X este numărul real


r
µr (X)= M(X )= xir · pi.
iJ

Se mai folosesc notaţiile Mr(X), αr(X).

• momentul absolut de ordin r al variabilei aleatoare X este numărul real



r r
νr(X)= M(|X| )= |xi| · pi.
iJ

Se mai folosesc notaţiile Mr(X), βr(X).

• momentul centrat de ordin r al variabilei aleatoare X este numărul real


r r
µr(X)= M((X − M(X)) )= (xi − M(X)) · pi
iJ

Dăm în continuare proprietăţile fundamentale ale valorii medii pentru variabile


discrete:

Teorema Fie X, Y variabile aleatoare discrete de medii finite. Atunci:

1 pentru orice aє R, M(a · X)= a · M(X);


2 M(X + Y )= M(X)+ M(Y ), adică operatorul de medie este liniar
3 Dacă X≥ Y a.s., atunci M(X)≥ (Y );
4 Dacă X = a a.s., atunci M(X)= a;

27
Observaţie. Primele două proprietăţi din teorema precedentă mai sunt
cunoscute sub denumirea de proprietatea de liniaritate a operatorului de medie,
iar a treia proprietate mai poartă numele de proprietatea de monotonie a opera-
torului de medie.

Independenţa variabilelor aleatoare poate aduce simplificări importante în cal-


culul mediei unui produs de variabile aleatoare sau în calculul dispersiei unei
sume de variabile aleatoare, aşa după cum se poate vedea în propoziţiile
următoare.

Teorema Dacă X şi Y sunt variabile aleatoare discrete, independente şi care au


medie finită, atunci

M(X · Y )= M(X) · M(Y ).

2.3.2 Medii şi momente pentru variabile continue

Dacă X este acum o variabilă aleatore reală continuă având densitatea de


repartiţie f, vom presupune în cele ce urmează că





|x|· f(x)dx < ∞.

Definiţie. Dacă X o variabilă aleatoare continuă ce verifică condiţiile de mai


sus, atunci numărul

M(X)= 

x · f(x)dx

poartă numele de media (sau valoarea medie a) variabilei aleatoare X. Se mai

utilizează notaţiile E(X),  XdP.


Definiţie. Dacă variabila aleatoare continuă X are medie finită, atunci

• momentul de ordin r al variabilei aleatoare X este numărul real


r
µ‘r (X)= M(X )= 

xr · f(x)dx

28
Se mai folosesc notaţiile Mr(X), αr(X).

• momentul absolut de ordin r al variabilei aleatoare X este numărul real


r r
v‘r (X)= M(|X| )= 

|x| · f(x)dx

Se mai folosesc notaţiile Mr(X), βr(X).

• momentul centrat de ordin r al variabilei aleatoare X este numărul real



r r
µr(X)= M((X − M(X)) )= 

(x − M(X)) · f(x)dx

Incheiem această secţiune cu o proprietate foarte simplă, dar utilă a operatorului


de medie.

Propoziţie. Dacă X este o variabilă aleatoare nenegativă de medie zero, atunci


X =0 a.s.

2.3.3 Varianţa (dispersia) variabilelor aleatoare

Fie X o variabilă aleatoare reală definită pe câmpul de probabilitate (Ω, K,P ).

Definiţie. In cazurile in care există momentul centrat de ordin 2 mai


poart˘numele de varianţa (sau dispersia) variabilei aleatoare X şi se notează cu
2
VAR(X) sau D (X) .

Prin urmare,
2
VAR(X)= M[X − M(X)] .

Propoziţie. (Formula de calcul a variantei) Dacă variabila aleatoare X are


dispersie finită, atunci
2 2 2
VAR(X)= M[X − M(X)] = M(X ) − (M(X)) .

Demonstraţie Formula propriu-zisă rezultă astfel:

29
2 2 2 2 2
VAR(X)= M[X − M(X)] = M[X − 2XM(X)+[M(X)] ]= = M(X ) − [M(X)] .

Definiţie. Dacă X este o variabilă aleatoare care are varianta finită atunci
rădăcina pătrată a variantei este numită abaterea medie pătratică (sau ecart tip
sau deviaţie standard) şi este notată cu σ(X).

Dăm în continuare proprietăţile fundamentale ale variantei:

Propoziţie. Fie X, Y două variabile aleatoare de dispersii finite. Atunci:

a) VAR(X)=0 X = const., a.s.


2
b) VAR(aX + b)= a VAR(X), (V)a, b є R;
c) dacă X şi Y sunt independente, atunci
2 2
VAR(aX + bY )= a VAR(X)+ b VAR(Y ), (V)a, b є R;
2
d) VAR(X) ≤ M[(X − a) ], (V)a є R, egalitatea atingându-se dacă şi numai
dacă a = M(X).

Formula c) se poate generaliza pentru cazul în care avem mai multe variabile
aleatoare în felul următor:

Propoziţie. Dacă (Xi)1≤i≤n sunt independente două câte două şi de dispersii


finite, atunci

n
VAR ( aiXi ) =
i 1
 a VAR  X  , (V)ai,...,an є R.
i 1
2
i i

2.4 Covarianţă şi Corelaţie

Foarte importante în studiul gradului de dependenţă dintre două variabile


aleatoare sunt noţiunile de covarianţă şi corelaţie pe care le vom defini mai jos.
Sunt larg utilizate în construirea multor modele statistice, cum ar fi, de exemplu,
cele întâlnite în cadrul regresiilor simple şi multiple sau în modelarea seriilor
cronologice.

30
Fie X, Y două variabile aleatoare reale definite pe câmpul de probabilitate (Ω,
K,P ).
Definiţie. Covarianţa variabilelor X şi Y se defineşte prin relaţia:
Cov(X, Y )= M [(X − M(X)) · (Y − M(Y )) ]

În practică, pentru calculul covarianţei se utilizează în general formula stabilită


de propoziţia următoare:

Propoziţie. (Formula de calcul a covarianţei) Dacă X şi Y sunt variabile


aleatoare cu dispersii finite, atunci

Cov(X, Y )= M(X · Y ) − M(X) · M(Y ).

Demonstraţie. Intr-adevăr, explicitând şi efectuând calculele, rezultă:

Cov(X, Y )= M (X − M(X)) · (Y − M(Y ))


= M XY − M(X) · Y − M(Y ) · X + M(X) · M(Y )
= M(XY ) − M(X) · M(Y ) − M(Y ) · M(X)+ M(X) · M(Y )
= M(X · Y ) − M(X) · M(Y ).

Proprietăţile esenţiale ale covarianţei sunt rezumate în propoziţia următoare:

Propoziţie. Pentru orice X, Y şi Z variabile aleatoare cu dispersii finite şi


pentru orice a, b є R, avem:

Cov(X, X)= VAR(X) ≥ 0,


Cov(X, Y )= Cov(Y, X)
Cov(aX + bY, Z)= a · Cov(X, Z)+ b · Cov(Y, Z)
VAR(X + Y )= VAR(X)+ VAR(Y )+2 · Cov(X, Y )

Propoziţia următoare reconfirmă faptul că între două variabile aleatoare inde-


pendente nu avem nici un fel de dependenţă.

Propoziţie. Dacă X şi Y sunt variabile aleatoare independente şi cu dispersii


finite, atunci

Cov(X, Y )=0.

31
Demonstraţie. Se ştie că pentru variabile independente media produsului este
produsul mediilor, prin urmare, utilizând formula de calcul a covariantei, se
obţine concluzia dorită.

O standardizare a gradului de dependenţă dintre două variabilele aleatoare se


obţine utilizând noţiunea de corelaţie pe care o vom defini mai jos.

Definiţie. Dacă X şi Y sunt variabile aleatoare cu dispersii finite şi nenule,


atunci corelaţia (sau coeficientul de corelaţie a) variabilelor X şi Y se defineşte
prin relaţia:

Cov( X , Y )
 ( X ,Y ) 
VAR ( X )  VAR (Y )

Se mai utilizeză notaţia Cor(X, Y ).

Propoziţie. Dacă X şi Y sunt variabile aleatoare cu dispersii finite şi nenule,


atunci
−1 ≤ ρ(X, Y ) ≤ 1.

Propoziţie. Dacă X este o variabilă aleatoare cu dispersia finită şi nenulă şi


dacă Y = a · X + b (a, b є R, a nenul), atunci
 1 daca a0
ρ(X, Y ) = 
 1 daca a0

Demonstraţie. Se observă că VAR(Y )= a· VAR(X) şi Cov(X, Y )= a ·


VAR(X). Prin urmare,

a  1 daca a0
ρ(X, Y ) = =
a  1 daca a0

Prin urmare, dacă corelaţia a două variabile aleatoare este în modul foarte
aproape de 1, putem spune că între cele două variabile există o dependenţă
foarte puternică, poate chiar de tip liniar, ceea ce se poate constata în practică pe
baza unor estimaţii statistice concrete.
Pentru două variabile independente X, Y corelaţia are sens si evident
ρ(X, Y )=0.

32
Definiţie. Fie X şi Y două variabile aleatoare cu dispersii finite. Vom spune că
X şi Y sunt necorelate dacă Cov(X, Y )=0. In caz contrar, vom spune că ele sunt
corelate.

PROBLEME PROPUSE

1. Fie X o variabilă aleatoare cu repartiţia

  3  2 1 0 1 2 3 
X :  
 0,1 0,2 0,2 0,2 0,1 01 0,1
2 2
Să se determine repartiţiile variabilelor aleatoare Y = X +1 şi Z =(X −1) .

2. Într-o urnă sunt 100 de lozuri, fiecare fiind inscripţionat cu un număr


care reprezintă suma (în euro) pe care o câştigă persoana care îl extrage.
75 de lozuri poartă cifra 0, 20 de lozuri cifra 1, 4 lozuri cifra 5, iar 1 loz
cifra 20. Se face o singură extragere. Notăm cu X variabila aleatoare
care reprezintă suma câştigată în euro. Să se determine tabloul de
repartiţie a lui X şi funcţia sa de repartiţie.
3. Fie X şi Y variabile aleatoare independente, cu repartiţiile:

0 1 0 1
X :  1 1 , Y :1 4
   
2 2 5 5
2
Să se determine repartiţiile variabilelor aleatoare: X + Y ; X − Y ; X · Y ; X −
2
Y .

4. Variabilele independente X, Y au repartiţiile:


 1 0 1 2   0 2 3
X :  , Y :  
 0,2 0,3 0,4 0,1  0,7 0,2 0,1
Să se determine repartiţia lui Z = min(X, Y ), precum şi repartiţia maximului,
corelaţia lui X cu Y , covarianţa lui X cu Y .

5.Fie X1, ..., Xn variabile aleatoare independente identic repartizate cu P (Xi =

33
1
k)= ,
N
k =1, ..., N, i =1, ..., n. Să se afle repartiţia variabilelor aleatoare
a) Zp=max(X1p,….,Xnp), p  1,2
b) Yp=min(X1p,….,Xnp), p  1,2

6. Se aruncă n monezi. Fie X numărul total de steme care apar. Să se calculeze


media şi dispersia lui X.

7. Cu ocazia aniversării a 20 ani de la înfiinţarea unei firme, se organizează un


concurs în urma căruia se vor repartiza în mod aleator n monezi de aur la cei m
angajaţi ai firmei. Astfel, fiecărui angajat i se asociază un număr de la 1 la m,
numerele de la 1 la m sunt trecute fiecare pe câte un bileţel, iar cele m bileţele
astfel rezultate se pun într-o urnă şi se amestecă. Extragerile din urnă se fac cu
revenire, la fiecare extragere se dă câte o monedă angajatului corespunzător
numărului extras. Definim următoarele variabile aleatoare: Ui=variabila
aleatoare care dă numărul de monezi primite de angajatul cu numărul i V
=variabila aleatoare care dă numărul de monezi primite de r angajaţi specificaţi
X=variabila aleatoare care dă numărul de angajaţi care nu primesc nimic Y
=variabila aleatoare care dă numărul de angajaţi care primesc cel puţin 2
monede. Se cer:

(a) Repartiţiile variabilelor aleatoare Ui şi V .


(b) Mediile şi dispersiile variabilelor aleatoare Ui şi V .
(c) Mediile variabilelor aleatoare X şi Y .
(d) În cazul în care m = 3, să se determine explicit tabloul de repartiţie al lui X.

8. Presupunem că variabila aleatoare X are valorile −1, 0, 1 şi că P (X = 1) = p,


iar M(X)= m. Să se determine repartiţia lui X (m ≤ p ≤ 1+ m).

9.Fie X şi Y două variabile aleatoare identic repartizate, având repartiţia


1 0 1 
comună  1 1 1  Să se determine repartiţia variabilei aleatoare X + Y ,
 
 4 2 4
precum şi dispersia ei.

10. Între un magazin şi o fabrică se încheie un contract care prevede ca fabrica


să asigure zilnic un lot de n articole, iar pentru controlul calităţii magazinul să
aibă voie să aleagă un singur articol din fiecare lot sosit; dacă se constată că acel

34
articol e defect, atunci fabrica va plăti magazinului o sumă de bani S. Fie X
variabila aleatoare care dă numărul de zile care au trecut până când fabrica a
plătit pentru prima dată suma S. Ştiind că proporţia de produse defecte din
fiecare lot adus zilnic la magazin este q, q є (0, 1), să se determine:
(a) Repartiţia lui X

(b) Media şi dispersia lui X.

11. Fie X o variabilă aleatoare nenegativă şi de medie finită. Arătaţi că


M ( X )   P( X  n).
n 1

1
12. Se consideră două evenimente A, B pentru care P (A) = , P (B|A) =p, P
4
1
(A|B)= şi variabilele aleatoare X, Y definite prin:
4

1, daca A se realizeaza


X= 
0, in rest
1, daca B se realizeaza
Y= 
0, in rest

a) Să se determine M(X),M(Y ) şi corelaţia dintre X şi Y ;


b) Pentru ce valori ale lui p sunt X, Y independente?

13. Să se determine valoarea medie şi dispersia variabilelor aleatoare


Y= sin X , Z=sin2X, unde X are densitatea de repartiţie f(x)=
1  
cos( x), x  ( , ).
2 2 2

a , 0  x  1
14. Dacă X are densitatea de repartiţie f(x)=  să se determine
0, in rest
constanta pozitivă a şi să se calculeze densităţile de repartiţie ale variabilelor
α
aleatoare cX (c> 0), X (α> 0), ln X, ex.

35
−|x|
15. Să se determine constanta k astfel încât f(x)= ke ,x є R să fie o densitate de
repartiţie.

16. Pentru ce valori ale parametrilor α şi β este funcţia următoare

 
 (e  x  e x , daca x0
f(x)=   
 0, in rest

o densitate densitate de repartiţie?

17. Pentru ce valoare a constantei c este funcţia

cx (1  x), 0  x  1
f(x)= 
 0, in rest
o densitate de repartiţie? Calculaţi valoarea medie şi varianţa acestei repartiţii.

18. Pentru ce valoare a constantei c este funcţia


c
f ( x)  , x  R
  (x   )2
2

cu parametrii α> 0 şi β є R o densitate de repartiţie? Admite această repartiţie


valoarea medie?

19. Considerăm funcţia


ct (2  t ), 0  t  2
f (t )  
 0, in rest

1). Pentru ce valoare a parametrului c este f o densitate de repartiţie?


2). Calculaţi mediile variabilelor aleatoare Y1 = max(X, 1),Y2 =
min(X, 1), dacă repartiţia variabilei aleatoare X are densitatea de repartiţie f de
la punctul 1).

20. Fie X o variabilă aleatoare nenegativă astfel încât X are moment de ordin α
(α ≥ 1) finit. Dacă F este funcţia ei de repartiţie, arătaţi că:

M ( X  )    x  1 (1  F ( x)dx .
0

36
21. Dacă X1,X2,...,Xn sunt i.i.d. astel încât

 1 1 
X  1 1 , i  1
 
 2 2
să se calculeze funcţia caracteristică şi funcţia generatoare de momente a
variabilei aleatoare X1 + ... + Xn.

37
38
Capitolul 3

REPARTIŢII DE PROBABILITATE

In acest capitol vom pune în evidenţă câteva repartiţii clasice de probabilitate


frecvent folosite în statistica matematică.

3.1 Repartiţii discrete

Repartiţia binomială

Definiţie. Spunem că variabila aleatoare X are o repartiţie binominală de


parametri n şi p (n є N, 0 ≤ p ≤ 1), dacă X ia valorile 0, 1, ..., n cu probabilităţile

P (X = k)= Cnkpkqn-k, (V)k є{0, 1, 2, ..., n}

unde q =1 − p. Vom nota în acest caz X ~ Bi(n, p).


Se mai utilizeză denumirea de repartiţie Bernoulli.

Observaţie. Cu alte cuvinte, X ~ Bi(n, p) dacă şi numai dacă X este o variabilă


aleatoare simplă cu tabloul de repartiţie

0 1 ... k ... n 
X  n n 1 k k nk

 q npq ... C n p q ... p n 
Denumirea acestei repartiţii provine, evident, de la schema clasică cu acelaşi
nume, pe baza căreia a fost construită.

Propoziţie. Dacă X1,X2, ..., Xn sunt n variabile aleatoare independente şi


identic distribuite, cu tabloul de repartiţie comun

0 1 
X  ,
q p 
atunci X1 + X2 + ··· + Xn ~ Bi(n, p).

39
Propoziţie. Dacă X ~ Bi(n, p), atunci:
M(X)= np, VAR(X)= npq,
unde q =1 − p.
Demonstraţie. Fiind vorba despre o repartiţie importantă, vom da mai multe
variante de demonstrare.
Varianta 1. X fiind variabilă discretă, avem

n n
k
M ( X )   k  C nk p k q nk  np  C nk p k 1 q n k
k 0 k 0 n
Dar
k k
 C n  C nk11
n
şi deci
n
M ( X )  np C nk 1 p k 1q nk  np( p  q) n1  np
k 0
Analog,
n n
k
M ( X 2 )   k 2 C nk1 p k q n  k  np  k C nk p k 1 q n  k 
k 0 k 0 n
n n
 np  kCnk11 p k 1 q n  k np  (k  1)C nk11 p k 1 q n  k 
k 0 k 0
n
 np  C nk11 p k 1 q n 1  np(n  1 p  np)
k 0

deoarece penultima sumă reprezintă media unei variabile aleatoare repartizată


Bi(n − 1,p) iar ultima sumă este

C
k 0
k
n 1 p k 1q n k  ( p  q) n 1  1

Prin urmare
2
M(X )= np(n − 1)p + np
şi deci
2 2
VAR(X)= M(X ) − M (X)= npq

40
Repartiţia Poisson

Definiţie. Spunem că variabila aleatoare X este repartizată Poisson de


parametru λ, dacă X ia valorile 0, 1, ..., n, . . . , cu probabilităţile

k
P( X  k )  e  , () k  N
k!

Notăm în acest caz X ~ Po(λ)


Observaţie. Cu alte cuvinte, X ~ Po(λ) dacă şi numai dacă X este o variabilă
aleatoare simplă cu tabloul de repartiţie

 0 1 ... n n ...
X   
e e  ... e  ...
 n! 

Caracteristicile numerice de bază ale repartiţiei Poisson sunt stabilite în


propoziţia următoare:

Propoziţie. Dacă X ~ Po(λ), atunci

M(X)= VAR(X)= λ.
Demonstraţie.. Cum X este o variabilă discretă, avem:

 
k 
k 1
M ( x)   k k ! e   e   k  e     ,
k

k 0 k 0 k! k 1 (k  1)!
deoarece

k 1
e  
k 1 (k  1)!
2
Pentru calculul lui M(X ) vom proceda la fel ca în cazul repartiţiei binomiale:
 
k 
k 1
M (X 2 )  k 2 k
k! e

 k e   e    (k  1  1) 
k 0 k 0 (k  1)! k 0 (k  1)!

k  2 
k 1
 2 e    e     2 e  e    e  e   2  
k  2 ( k  2)! k 1 ( k  1)!
Prin urmare,
2 2 2 2
VAR (X)= M(X ) − M (X)= λ + λ − λ = λ.

41
Teorema Dacă X1,X2 sunt variabile aleatoare independente şi dacă X1 ~
Po(λ1) şi
X2 ~ Po(λ2), atunci X1 + X2 ~ Po(λ1 + λ2).

Demonstraţie. Pentru orice k număr natural, avem:

k
P (X1 + X2 = k)= j 0
P (X1 = j, X2 = k − j)

1j 1 2 k  j
k k
e e2
  P( X 1  j ) P( X 2  k  j )   j! (k  j )!
j 0 j 0

e(1  2 ) k j j k  j (1  2 ) k ( 1  2 )



k!
j 0
C k 1 2 
k!
e ,

deci într-adevăr X1 + X2 ~ Po(λ1 + λ2).

Repartiţia geometrică

Definiţie. Spunem că variabila aleatoare X are o repartiţie geometrică de


parametru p (0 ≤ p ≤ 1), dacă X ia valorile 0, 1, ..., cu probabilităţile

P (X = k)= pqk , (V)k =0, 1, 2, ...,

unde q =1 − p. Vom nota în acest caz X ~ Geom(p).


Observaţie. Cu alte cuvinte, X ~ Geom(p) dacă şi numai dacă X este o variabilă
aleatoare discretă cu tabloul de repartiţie

 0 1 ... k ...
X  k

 p pq ... pq ...
Denumirea acestei repartiţii provine din faptul că probabilităţile de pe linia a
doua a tabloului de mai sus formează o progresie geometrică de raţie q.

p
Propoziţie. Dacă X ~ Geom(p) (0 <p< 1), atunci M(X)= ,
q
q
VAR(X)= .
p2

42
3.2 Repartiţii continue

Repartiţia uniformă

Definiţie. Vom spune că X urmează o repartiţie uniformă pe intervalul [a,


b](a<b) dacă densitatea sa de repartiţie este

1
f ( x)  1a ,b  ( x).
ba
Se notează X ~ U(a, b).

Propoziţie. Dacă X ~ U(a, b), atunci


X a
ba ~ U(0,1)
Cu alte cuvinte, se poate face o standardizare a repartiţiilor uniforme, luându-se
drept element de referinţă repartiţia U(0, 1).

Propoziţie. Dacă X ~ U(a, b), atunci funcţia de repartiţie F a variabilei aleatoare


X este

 0, xa
x  a
F(x)=  , x  a, b  .
 b  a
 1, xb

Demonstraţie. Având în vedere formula de legătură dintre F şi f, avem




 0, xa  0, xa
x
 x dt x  a
F(x)=  f (t )dt   , x  a, b] =  , x  a, b]
 a b  a b  a xb
 b dt  1,
 xb
a b  a

Propoziţie. Dacă X ~ U(a, b), atunci


ba (b  a) 2
M(x)= si VAR(x)=
2 12

43
Demonstraţie. Cu definiţiile uzuale avem:

ba
b
tdt
M(x)= ba 
a
2
,

t 2 dt b 2  ab  a 2
b
M(x2)= a b  a  3
,

2 2 (b  a 2 )
de unde VAR(X)= M(X ) − (M(X)) = .
12

Repartiţia Normală

Este una dintre cele mai importante repartiţii, pe ea bazându-se foarte multe
analize statistice

Definiţie. Vom spune că o variabilă aleatoare X are o repartiţie normală (sau


gaussiană) de parametri m şi σ, dacă X are densitatea de repartiţie

( xm)2

1 2 2
f ( x)  e , xR
 2
2
Vom nota X ~ N(m, σ ).

Dacă X ~ N(0, 1), vom spune că X are o repartiţie normală standard şi vom nota
densitatea ei cu φ(x), iar funcţia sa de repartiţie cu Φ(x), adică:

x2

1
 ( x)  xR
2
e ,
 2
u2
x 
1
 ( x)   du, () xR
2
e
  2
Funcţia Φ mai poartă numele de funcţia lui Laplace.

44
2 X m
Propoziţie.Dacă X ~ N(m, σ ), atunci ~N(0,1)

Datorită acestui rol de referinţă a repartiţiei N(0, 1), pentru funcţia sa de
repartiţie Φ s-au întocmit tabele de valori, foarte utile atunci când avem de
calculat probabilităţi concrete ale repartiţiei normale sau când efectuăm testarea
anumitor ipoteze statistice bazate pe legea normală. Aceste tabele statistice cu
valorile lui Φ sunt în general întocmite doar pentru valorile pozitive ale lui x,
deoarece pentru aflarea celorlalte valori se poate utiliza:

Propoziţie.Funcţia lui Laplace verifică:


Φ(x) + Φ(−x)=1, (V)x є R.

Exemplu Să evaluăm cu ajutorul tabelului statistic al valorilor funcţiei Φ


următoarele probabilităţi: P (m − σ ≤ X ≤ m + σ), P (m − 2σ ≤ X ≤ m +2σ) şi P
2
(m − 3σ ≤ X ≤ m +3σ), unde X ~ N(m, σ ). Conform formulelor uzuale care
leagă probabilitatea ca o variabilă aleatoare să ia valori într-un interval şi funcţia
sa de repartiţie, avem:

P (m − σ ≤ X ≤ m + σ)= P (−1 ≤ Y ≤ 1) = Φ(1) − Φ(−1) = 2Φ(1) − 1=


=0, 6826

P (m − 2σ ≤ X ≤ m +2σ)= P (−2 ≤ Y ≤ 2) = Φ(2) − Φ(−2) = 2Φ(2) − 1=


=0, 9544

P (m − 3σ ≤ X ≤ m +3σ)= P (−3 ≤ Y ≤ 3) = Φ(3) − Φ(−3) = 2Φ(3) − 1=


=0, 9974

Prin urmare, în cazul repartiţiei normale, regula celor 3σ funcţioneză cu un


procentaj de 99, 74%.
2
Teorema. Dacă X ~ N(m, σ ) atunci
2
M(X)= m, şi VAR(X)= σ .

Teorema. Dacă X1,X2, ··· ,Xn sunt n variabile aleatoare independente astfel
încât
2
Xi ~ N(mi,σi ), i =1, 2, ··· ,n, atunci

n n n

 ai X i  N ( ai mi , ai  i ),
2 2

i 1 i 1 i 1

45
oricare ar fi a1,a2, ··· ,an numere reale.

Repartiţia Log-Normală

Definiţie. Vom spune că o variabilă aleatoare X are o repartiţie Lognormală de


parametrii a şi σ, dacă X are densitatea de repartiţie

(ln x  a ) 2
1 
f ( x)  e 2 2
,x  0
x 2
2
Vom nota X ~ LogN(a, σ ).
2 2
Propoziţie. Dacă X ~ LogN(a, σ ), atunci ln X ~ N(a, σ ).
2
Propoziţie. Dacă X ~ LogN(a, σ ), atunci
2
a
M ( x)  e 2

VAR ( x)  e 2 a  (e  1)
2 2

Demonstraţie. Rezultă imediat folosind legătura cu repartiţia normală, şi


2 Y
anume, notând Y = ln X ~ N(a, σ ), avem X = e , deci

2
a
M ( x)  Y (1)  e 2

M ( x 2 )  Y (2)  e 2a 2
2

de unde, aplicând formula de calcul a variantei obtinem

VAR ( x)  M ( X 2 )  M 2 ( X )  e 2a  (e  1)
2 2

Repartiţia Gamma

Definiţie. Vom spune că o variabilă aleatoare reală X are repartiţia gamma de


parametri α şi β (α> 0, β> 0) dacă densitatea sa de repartiţie este

x
1 
f ( x)   e  x  1  1R ( x), x  R
 ( )

46

e x  1 dx , Vα> 0 este funcţia lui Euler.


x
unde Γ(α)=
0

Vom nota X ~ γ(α, β).


Folosind integrarea prin părţi, se verifică uşor următoarea proprietate de
recurenţă a funcţiei Γ:

Γ(p)=(p − 1)Γ(p − 1), Vp> 1.


Se deduce imediat de aici că

Γ(n)=(n − 1)!, Vn є N .
Printr-un calcul direct sau făcând apel la proprietăţile densităţii normalei
standard, se deduce uşor şi următoarea valoare importantă a funcţiei Γ:

1
( )  
2
Propoziţie. Dacă X ~ γ(α, β), atunci
M(X)= αβ,
2
VAR(X)= αβ

47
Repartiţia exponenţială

Definiţie. Vom spune că o variabilă aleatoare reală X are repartiţia exponenţială


de parametru a (a> 0), dacă densitatea sa de repartiţie este

 0, x0
f ( x)   ax
ae , x  0
Vom nota X ~ Exp(a).
1
Observaţie. Se observă că repartiţia Exp(a) coincide cu repartiţia γ(1, ), prin
a
urmare proprietăţile de bază ale repartiţiei Exp(a) se pot deduce din cele ale
repartiţiei Gamma.

Propoziţie. Dacă X ~ Exp(a), atunci funcţia de repartiţie F a lui X este

 0, x0
F ( x)    ax
1  ae , x  0

Propoziţie. Dacă X ~ Exp(a), atunci

P ({t<X<s}|{t<X})= P (X<s − t), oricare ar fi 0 < t < s.

Demonstraţie. Din definiţia probabilităţilor condiţionate avem


P(t  X  s t  X )  P(t  X  s)  F (s)  F (t )  F (s  t )
 p(t  X ) 1  F (t )

Propoziţie. Dacă X ~ Exp(a), atunci


1
M ( x)  ,
a
1
VAR ( x)  2 ,
a

Demonstraţie. In acest caz particular al repartiţiei Gamma, se poate face şi un

48
calcul direct pentru determinarea mediei şi variantei. Astfel, integrând prin
părţi, obţinem imediat:

1
M ( x)   xae  ax dx  ,
0
a


  xe  ax dx
M ( X )  a x e
2 2  ax
dx   x e 2  ax
 2 
0
0 0


2 xae  ax dx 2 2
   M (X )  2
a0 a a
Prin urmare,

2 1 1
VAR ( x)  2
 2  2
a a a

2
Repartiţia χ
2
Definiţie. Vom spune că o variabilă aleatoare reală X are repartiţia χ cu n grade
de libertate dacă densitatea sa de repartiţie este

x n
1  1
f(x)= e 2 x 2 1R  ( x), x  R
n
2 n/2
( )
2

2
Vom nota X ~ χ (n).
2
Observaţie. Se observă că repartiţia χ (n) coincide cu repartiţia γ(n\2, 2) şi prin
2
urmare, putem deduce proprietăţile de bază ale repartiţiei χ (n) din cele ale
repartiţiei Gamma. Vom rezuma în continuare aceste proprietăţi.

2
Propoziţie. Dacă X ~ χ (n), atunci
M(X)= n,
VAR(X)=2n,

49
n
 (  r)
M ( X r )  2r 2 , r  N
n
( )
2
Teorema Dacă X şi Y sunt două variabile aleatoare independente, care au
2 2
respectiv repartiţiile χ (n) şi χ (m), atunci variabila aleatoare X + Y este
2
repartizată χ (m + n).
2
Foarte mult utilizată în statistică este următoarea caracterizare a repartiţiei χ (n):

Teorema Dacă X1, ..., Xn sunt n variabile aleatoare independente şi identic


repartizate,
Xi ~ N(0, 1), Vi =1, . . . , n,

Atunci
n

X
i 1
i
2
~ x 2 ( n)

Pornind de la această proprietate ajungem în mod natural la următoarea definiţie


2
pentru Legea χ descentrată:

Definiţie. Dacă X1, ..., Xn sunt n variabile aleatoare independente astfel încât şi
identic repartizate,
Xi ~ N(mi, 1), Vi =1, . . . , n,
2 2
atunci repartiţia variabilei aleatoare X poartă numele de repartiţie χ descentrată
cu n grade de libertate şi parametrul de excentricitate
n
θ= m
i 1
2
i .
2
Notăm această repartiţie χ (n, θ).
In ce priveşte caracteristicile numerice de bază ale acestei repartiţii, avem

2
Propoziţie. Dacă X ~ χ (n, θ), atunci

M(X)= n + θ, VAR (X) = 2(n +2θ).

50
Repartiţia Student

Definiţie. Vom spune că o variabilă aleatoare reală X are repartiţia Student cu n


grade de libertate dacă densitatea sa de repartiţie este

n 1
( ) n 1
2 x2  2
f ( x)  (1  ) , x  R
n 2 (n) n
Vom nota X ~ t(n).
Caracteristicile numerice esenţiale ale acestei repartiţii sunt:

Propoziţie. Dacă X ~ t(n)(n> 2), atunci

M(X)=0 şi
n
VAR(X)= .
n2
Legătura repartiţiei Student cu alte repartiţii continue importante este dată de
teorema următoare.

Teorema Fie X şi Y două variabile aleatoare independente repartizate N(0, 1),


2
respectiv χ (n). Atunci
X
~ t(n).
Y
n
Teorema precedentă dă o caracterizare importantă a repartiţiei Student, ce stă la
baza diferitelor metode de testare a ipotezelor statistice.

Repartiţia Fisher-Snedecor

Definiţie. Vom spune că o variabilă aleatoare reală X are repartiţia Fisher-


Snedecor cu m şi n grade de libertate, dacă densitatea sa de repartiţie este
mn
( ) m m
1
m n
2 m mx  2
f ( x)  ( ) 2  x 2 (1  ) 1R( x ) , x  R
m n n n
 ( )  ( )
2 2
Vom nota X ~ F (m, n).

In ce priveşte media şi dispersia acestei repartiţii, avem:

51
Propoziţie. Dacă X ~ F (m, n), atunci

n
M(X)= (n  2),
n2
2n 2 (n  m  2)
VAR(X)= (n  2),
m(n  4)(n  2) 2
O altă caracterizare a repartiţiei F (m, n), foarte importantă din punct de vedere
statistic, este oferită de teorema următoare:
Teorema. Dacă X şi Y sunt două variabile aleatoare independente, repartizate
2 2
χ (m), respectiv χ (n), atunci
X
m ~ F (m,n)
Y
n
.Având în vedere acest rezultat, putem acum defini uşor repartiţiile F
descentrate:

Definiţia Dacă X şi Y sunt două variabile aleatoare independente, astfel încât X


2 2
~ χ (m, θ) iar Y ~ χ (n), atunci repartţia variabilei aleatoare
X
m
Y
n
poartă numele de repartiţie Fisher-Snedecor descentrată, de parametru de
excentricitate θ, cu m şi n grade de libertate.

PROBLEME PROPUSE

1. 30% din piesele produse de o maşină sunt defecte. Care este probabilitatea
ca dintre 10 produse alese la întâmplare:
(a) unul să fie defect;
(b) cel mult trei să fie defecte?

2. Dacă probabilitatea ca un articol să fie defect este de 0,2, să se calculeze


media şi dispersia numărului de articole defecte din 5 articole controlate.
Notând cu X acest număr de articole defecte, determinaţi funcţia de repartiţie a
lui X.

52
3. Un om iese în stare de ebrietate dintr-un bar. La fiecare pas el se mişcă la
dreapta cu un metru cu probabilitatea p sau la stânga cu probabilitatea 1-p. Fie
n X
X poziţia sa după n paşi. Arătaţi că ~ Bi(n, p). La câţi metri de intrarea
2
în bar ne aşteptăm să fie acest om după n paşi ?

4. Dacă X1 ~ Po(λ1), X2 ~ Po(λ1), cu λ2 >λ1, arătaţi că


P (X1 ≤ k) >P (X2 ≤ k), Vk є N.

5. Fie X ~ Po(λ) şi (Yi)n≥1 un şir de variabile aleatoare i.i.d., cu repartiţia


comună
0 1
 
q p 

X
Să se arate că variabila aleatoare Y
i 1
i are o repartiţie Poisson.

6. Fie X :Ω → N şi Y :Ω → N două variabile aleatoare cu următoarele


proprietăţi:
1. X ~ Po(µ);
2. Pentru n =0, 1, 2, ... are loc

C k p k (1  p) nk pentru k  0,1,.., n


p[Y  k X  n]   n
 0 pentru k  n
unde 0 <p< 1. Determinaţi repartiţia variabilei aleatoare Y.

7. Fie X o variabilă aleatoare a cărei funcţie de repartiţie F este strict


crescătoare. Determinaţi repartiţia variabilei aleatoare Y = F (X).

8. Fie X ~ U(0, 1). Determinaţi densităţile de repartiţie şi mediile variabilelor


2
aleatoare Y = X +1; Z= X  1 ; T= e X 1 ; U=ln(1+X); V  sin X
9. Fie X ~ U(0, 2π) şi fie Y1 = cos X şi Y2 = sin X. Determinaţi cov(Y1,Y2).
Sunt Y1 şi Y2 independente?

10. Fie (Xn)n≥1 un şir de variabile aleatoare discrete astfel încât Xn are tabloul
de repartitie
a  k a  2k ... a  nk 
Xn 1 1 1 
 ... 
 n n n 

53
n 1 n2 1
unde a, k є R. Să se arate că M ( X n )  a  K , 2 ( X n )  k2

2 12
şi să se studieze convergenţa în repartiţie a şirului de variabile
1
alatoare ( X n ) n1 .
n
11. Fie X variabila aleatoare care indică eroarea de măsurare a unui aparat.
Ştiind că X ~ N(0,1/25 ), determinaţi probabilitatea ca din 5 măsurători
independente, cel puţin două să fie din intervalul (−0.2, 0.2).

12. Fie X variabila aleatoare care indică eroarea de măsurare a unui aparat.
2
Ştiind că X ~ N(0,σ ), determinaţi (în funcţie de Φ) probabilitatea ca media
aritmetică a n măsurători independente să aprţină intevalului (−ε,ε ).

13. Presupunând că beneficiul zilnic al unui firme este o variabilă aleatoare X ~


6
N(10 , 100), să se calculeze:
(i) Probabilitatea ca beneficiul să fie mai mic de 750.000
(ii) Probabilitatea ca beneficiul să fie cuprins între 950.500 şi 1.500.000 lei.

14. Fie X ~ Exp(λ). Calculaţi valoarea medie a variabilei aleatoare Y =


1
max ( X , )

15. Durata de viaţă a unui anumit tip de imprimantă produs de o firmă este
o variabilă aleatoare X cu repartiţia Exp(a). Ştiind că media de viaţă a
imprimantelor de acest tip este de 10 ani, determinaţi parametrul a şi calculaţi P
(5 ≤ X< 8).

16. Dacă X1,X2,...,Xn sunt i.i.d. şi dacă Xi ~ Exp(a), Vi =1,...,n, determinaţi


densităţile şi mediile următoarelor variabile aleatoare
1) X1 + X2, X1 − X2, min(X1,X2).
2) X1 + ... + Xn;
3) max(X1,...,Xn).

17. Unui vânzător de îngheţată i se livrează zilnic o cantitate de îngheţată spre


comercializare. El ştie că cererea de îngheţată este o variabilă aleatoare
repartizată exponenţial. Preţul de cumpărare al unei unităţi de îngheţată este de
p1 lei, iar cel de vânzare al aceleiaşi unităţi este de p2 lei. La sfârşitul zilei se
aruncă întreaga cantitate de îngheţată nevândută. Câte unităţi de îngheţată
trebuie să comande vânzătorul în fiecare zi, astfel încât câştigul scontat să fie
maxim?

54
CAPITOLUL 4

OBŢINEREA ŞI PRELUCRAREA PRIMARĂ A


DATELOR STATISTICE

4.1. Observarea statistică

Ansamblul activităţilor de culegere a datelor referitoare la caracteristicile


unei populaţii statistice poartă numele de observare statistică şi reprezintă
prima etapă a demersului metodologic al statisticii aplicate în economie. Datele
culese trebuie să îndeplinească anumite condiţii de volum şi calitate, pentru a
asigura un grad ridicat de relevanţă procesului ulterior de prelucrare a acestora.
În urma prelucrării statistice, datele obţinute prin observare îşi pierd
individualitatea, regăsindu-se doar prin trăsăturile lor esenţiale sintetizate,
transformate prin generalizare şi abstractizare în informaţii statistice.
Principiul de bază al observării statistice îl reprezintă asigurarea
autenticităţii datelor, de a cărui respectare depinde calitatea deciziei ce urmează
a fi luată pe baza informaţiilor rezultate. Acest principiu presupune realizarea
concordanţei dintre datele înregistrate şi dimensiunea reală a fenomenului
observat şi presupune îndeplinirea a două condiţii:
o condiţia de volum, care constă în culegerea datelor de la toate unităţile
populaţiei statistice studiate;
o condiţia de calitate, care impune înregistrarea unor date reale, fără
erori.
Un alt principiu al observării statistice îl constituie eficienţa procesului de
observare, care presupune culegerea doar a acelor date care conduc la obţinerea
informaţiei de care este nevoie în cercetarea populaţiei statistice. Datele care nu
fac obiectul cercetării trebuie selectate şi eliminate, deoarece solicită costuri
umane şi materiale mari, care nu se regăsesc în informaţia finală.
Observarea statistică poate fi clasificată, în funcţie de modul de obţinere a
datelor, în observare permanentă şi observare specială.
Observările permanente se realizează de obicei de către instituţii
specializate în cercetare statistică, de către Comisia Naţională de Statistică, de
instituţii financiar – bancare, inclusiv Banca Naţională a României, de diverse
organisme guvernamentale etc., care colectează şi prelucrează date referitoare la
principalii indicatori economici şi financiari, micro şi macroeconomici, necesari

55
atât pentru nevoile globale ale statului (cunoaşterea nivelului de dezvoltare
general sau pe ramuri, a nivelului de trai etc.), cât şi pentru analize şi previziuni
la nivel de firmă. Rezultatele observărilor permanente se concretizează în
diverse rapoarte sau publicaţii statistice (anuare, reviste, studii de specialitate),
unele de uz restrâns, altele cu caracter general, de informare publică.
Observările speciale se organizează în vederea acoperirii necesităţilor
legate de situaţii specifice, de tipul recensămintelor, anchetelor sau sondajelor
statistice.
După volumul de date obţinute în urma observării statistice, observarea
poate fi totală sau parţială.
Observarea totală presupune culegerea datelor de la toate unităţile
statistice care compun populaţia studiată, adică se înregistrează fiecare unitate
în parte cu nivelul caracteristicilor cuprinse în programul observării şi sunt de
tipul recensămintelor sau a rapoartelor statistice. Pe baza datelor obţinute în
urma observării totale se calculează indicatori statistici referitori la întreaga
populaţie statistică.
Observarea parţială constă în înregistrarea doar a unei părţi din totalul
unităţilor statistice ale populaţiei studiate, numită eşantion sau selecţie. Datorită
desfăşurării ample în timp şi spaţiu a majorităţii fenomenelor şi proceselor
economice, o largă utilizare în statistica economică o are această a doua
categorie de observare. Observarea parţială prezintă numeroase avantaje faţă de
cea totală, dintre care amintim: reducerea cheltuielilor de înregistrare şi de
prelucrare a datelor, reducerea timpului necesar efectuării cercetării statistice,
posibilitatea studierii populaţiilor statistice ale căror unităţi se distrug prin
observare, existenţa unor şanse sporite de cercetare în profunzime a
fenomenului etc. Cu toate acestea, observarea parţială nu poate substitui în
întregime observarea totală, deoarece o serie de indicatori statistici de volum
sau de structură nu pot fi determinaţi decât pe baza unor înregistrări totale.
După momentul efectuării observării, se pot întâlni observări statice sau
dinamice.
În cazul observărilor statice, datele referitoare la fenomenul cercetat se
limitează la un anumit moment al evoluţiei acestuia, în timp ce în cazul
observărilor dinamice, aceeaşi caracteristică a fenomenului este urmărită la
perioade de timp succesive.
În procesul obţinerii datelor statistice pot apare situaţii în care datele
înregistrate nu concordă cu realitatea. Aceste neconcordanţe ale rezultatelor
observării statistice cu datele reale poartă numele de erori de observare
(înregistrare). Ele se clasifică, de regulă, în erori întâmplătoare şi erori
sistematice.

56
Erorile de observare întâmplătoare sunt destul de numeroase şi nu pot fi
evitate. Ele se produc în ambele sensuri şi survin nepremeditat, în majoritatea
cazurilor datorită neatenţiei operatorului. Acest gen de erori afectează în mică
măsură rezultatele observării, deoarece, în cele mai multe cazuri, ele se
compensează. Repartiţia normală a erorilor întâmplătoare a fost pusă în evidenţă
de către K. F. Gauss4, care a dedus, între altele, şi o serie de relaţii de estimare a
preciziei măsurătorilor.
Erorile de observare sistematice produc abateri substanţiale de la
realitatea observată, deoarece se produc repetat şi în acelaşi sens. Ele trebuie
urmărite cu atenţie şi eliminate, pentru a nu denatura concluziile rezultate în
urma procesului de prelucrare şi analiză statistică a datelor culese. În
majoritatea cazurilor, erorile sistematice au la origine neînţelegerea corectă a
procedeelor de culegere a datelor sau aplicarea eronată a acestora.
O categorie aparte o reprezintă erorile premeditate, cauzate fie de către
cei care culeg datele, fie de către cei care le prelucrează şi care au efecte
negative semnificative asupra concluziilor cercetării.
Pe lângă categoriile de erori prezentate, în cazul observărilor parţiale, mai
poate apare şi un alt tip de eroare, şi anume, eroarea de reprezentativitate, care
se produce atunci când eşantionul studiat nu a fost bine ales şi, ca atare, nu este
reprezentativ, fie ca volum, fie ca structură, pentru populaţia statistică din care
provine. În funcţie de datele avute la dispoziţie, pot fi determinate fie ca erori
efective, fie ca erori probabile.
Pentru a evita apariţia tuturor acestor genuri de erori, este necesară
efectuarea unui control riguros în scopul asigurării autenticităţii datelor şi a unor
informaţii cât mai apropiate de realitate. În funcţie de specificul modalităţii de
verificare a informaţiilor rezultate în urma observării statistice, controlul poate
fi cantitativ sau calitativ.
Controlul cantitativ este realizat prin verificarea transmiterii datelor de
către toate unităţile statistice înregistrate sau dacă au fost completate toate
informaţiile cerute de cercetarea statistică.
Controlul calitativ poate fi realizat cu metode logice sau aritmetice, prin
aprecierea realităţii datelor din punct de vedere al concordanţei cu limitele
admisibile ale valorilor înregistrate sau prin compararea cu înregistrări efectuate
5
la unităţi similare ori la aceeaşi unitate în perioadele anterioare.

4
M.L. Berenson, D.M. Levine, T.C. Krehbiel, Basic Business Statistics. Concepts and
Applications, Ninth Edition, Pearson Prentice Hall, 2004, pag. 20–23
5
C. Şipoş, C. Preda, Statistică economică, Editura Mirton, Timişoara, 2004, pag. 17 – 18

57
4.2. Prelucrarea primară a datelor statistice

Faza ulterioară observării statistice, în urma căreia s-au obţinut toate


datele necesare, o reprezintă prelucrarea primară a datelor, care constă în
operaţiuni de centralizare, ordonare, grupare şi reprezentare a datelor sub formă
de serii, tabele sau grafice.
1. Centralizarea datelor constă în totalizarea valorilor individuale pe
întreaga populaţie statistică studiată şi, dacă este necesar, pe subgrupe omogene.
Totalizarea valorilor unei caracteristici se face prin însumarea directă sau prin
intermediul unor coeficienţi de echivalenţă. Pentru a realiza operaţiunea de
centralizare, datele trebuie să fie reale, fără erori de înregistrare şi comparabile,
adică să se refere la aceeaşi caracteristică, observată în condiţii unitare şi
exprimată în aceeaşi unitate de măsură.
2. Gruparea datelor este o metodă fundamentală în prelucrarea primară a
datelor statistice şi constă în separarea unităţilor unei populaţii în subgrupe
omogene în raport cu una sau mai multe caracteristici. Realizarea acestei
operaţiuni este posibilă numai atunci când volumul populaţiei sau eşantionului
studiat este suficient de mare.
Gruparea trebuie realizată astfel încât să nu se denatureze în nici un fel
concluziile rezultate în urma procesului de prelucrare. De regulă, gruparea se
realizează după criterii specifice fiecărui fenomen cercetat, iar dacă acestea
lipsesc sau nu pot fi precizate, se poate recurge la o metodă pur statistică, cu
observaţia că aceasta să îndeplinească toate condiţiile necesare.
În acest mod se determină, de fapt, un şir de intervale de lungimi, de
regulă, egale, care cuprind date omogene şi care sunt despărţite de restul
populaţiei statistice prin cele două limite ale intervalului, inferioară şi
superioară.
În vederea sistematizării datelor prin grupare pe intervale de frecvenţă, în
primul rând se stabileşte amplitudinea variaţiei datelor studiate (A), după relaţia:

A = xmax – xmin (4.1)

în care, xmax reprezintă nivelul maxim al caracteristicii, iar xmin este nivelul
minim al acesteia.
Următoarea etapă o reprezintă stabilirea dimensiunii optime a intervalului
de grupare h. Dacă se cunoaşte numărul de intervale, dimensiunea intervalului

58
de grupare se determină ca raport între amplitudine şi numărul de intervale 6. În
cazul populaţiilor de volum mare, grupate după caracteristici cu tendinţe de
variaţie sistematică şi cu o amplitudine de variaţie mare, dimensiunea optimă a
intervalelor de grupare (h) se poate determina conform formulei lui H. Sturges:

xmax  xmin
h (4.2)
1  3,322  lg n

unde n reprezintă volumul eşantionului studiat.


Dimensiunea optimă a intervalului de grupare se alege în mod
convenabil, rotunjindu-se, de regulă, în sus. În continuare, se formează
intervalele de grupare în funcţie de variaţia caracteristicii (continuă sau
discontinuă).
În cazul în care caracteristica este continuă, formarea intervalelor se
realizează pornind de la valoarea minimă (xmin) sau de la o valoare puţin mai
mică decât cea minimă, la care se adaugă dimensiunea intervalului de grupare.
Limita superioară a intervalului astfel creat devine limită inferioară pentru
următorul interval, la care se adaugă din nou dimensiunea h şi se continuă în
acest mod până când ultimul interval de grupare include valoarea maximă (xmax).
Pentru a se evita includerea unei valori egale cu limita în ambele intervale pe
care aceasta le mărgineşte, se stabileşte o convenţie care precizează care din
limite este inclusă în interval (de exemplu, interval închis la dreapta şi deschis la
stânga, care înseamnă că în intervalul respectiv se include limita inferioară, sau
invers, deschis la dreapta şi închis la stânga, adică se include limita superioară).
Pentru a nu apare distorsiuni, convenţia trebuie păstrată pentru toate intervalele
de grupare formate.
În cazul caracteristicilor discrete, limita inferioară a intervalului următor
nu mai coincide cu limita superioară a intervalului anterior, ci se deplasează cu
o unitate de măsură în sus, modalitatea de formare rămânând, în rest, aceeaşi.
După formarea intervalelor de grupare, se separă unităţile statistice pe
grupe de variaţie, respectiv, se determină frecvenţa de distribuţie. Determinarea
frecvenţei de distribuţie constă, practic, în cuantificarea numărului de unităţi
care se situează în fiecare interval, totalul pe intervale trebuind să fie, în final,
egal cu volumul eşantionului.
3. Prezentarea datelor sub formă de serii se realizează, de regulă, atunci
când este vorba despre observarea dinamică, seria respectivă fiind un şir dublu,
dintre care un şir se referă la variaţia caracteristicii studiate, iar celălalt şir

6
P. Newbold, W.L. Carlson, B. Thorne, Statistics for Business and Economics, Fifth Editon,
Pearson Prentice Hall, 2003, pag. 14–17

59
reprezintă frecvenţa de apariţie corespunzătoare. În acest caz, seria de date
poartă numele de serie de distribuţie. Dacă al doilea şir este constituit de
factorul timp, atunci seria se numeşte dinamică sau cronologică.
Simbolic, o serie de distribuţie se notează astfel:

 x1 , x2 ,..., xi ,..., xk 
X   (4.3)
 n1 , n2 ,..., ni ,..., nk 

Orice nivel xi al caracteristicii de grupare având frecvenţa de apariţie ni,


reprezintă termenul seriei de distribuţie.
Un indicator derivat al frecvenţei absolute ni cu largă utilizare în
prezentarea seriilor de date îl reprezintă frecvenţa relativă (fi), determinată fie
sub formă de coeficient, fie procentual, astfel:

ni ni
fi  , fi   100 (4.4)
n n

Suma frecvenţelor relative este fie 1, dacă sunt exprimate sub formă de
coeficient, fie 100%, dacă se exprimă procentual:

k k

 fi  1 ,
i 1
f
i 1
i  100% (4.5)

Frecvenţa de apariţie poate fi cumulată, atât în formă absolută (Ni), cât şi


în formă relativă (Fi), conform relaţiilor:

i
N i   nm (4.6)
m1

i
Fi   f m (4.7)
m 1

Întotdeauna frecvenţa absolută cumulată a ultimului interval este egală cu


volumul eşantionului, iar frecvenţa relativă cumulată a ultimului interval este 1
sau 100%, dacă este exprimată procentual.

60
4. Prezentarea datelor sub formă de tabele statistice are drept scop
ordonarea datelor în vederea aplicării metodelor de calcul şi de interpretare
statistică şi trebuie să cuprindă următoarele elemente de bază:
 titlul general sau subiectul tabelului, care redă într-o formă concisă
populaţia statistică studiată şi componentele sale şi care, de regulă, se notează
deasupra tabelului;
 titlurile interioare sau predicatul tabelului, care reprezintă titulaturile
coloanelor ce definesc populaţia studiată şi caracteristicile de grupare luate în
considerare;
 unitatea de măsură, care e specificată în titlul general, atunci când
este aceeaşi pentru toate elementele tabelului, sau în titlurile interioare, atunci
când în tabel sunt cuprinse elemente exprimate în unităţi de măsură diferite;
 notele tabelului servesc la interpretarea corectă a datelor din acesta,
sunt indicate, de regulă, prin asterisc şi se înscriu imediat sub tabel;
 sursele datelor, care trebuie riguros citate, deoarece acest lucru
permite verificarea exactităţii şi corectitudinii datelor înregistrate în tabel.
Tabelele statistice sunt extrem de variate şi se folosesc în toate etapele
cercetării statistice. Din punctul de vedere al scopului elaborării lor, tabelele pot
fi descriptive (enumerative) sau de prelucrare (de lucru). În funcţie de numărul
de caracteristici prezentate în tabel, există tabele simple, tabele pe grupe, tabele
cu dublă intrare (de corelaţie sau de asociere) etc.
În general, între modalitatea de grupare a datelor şi tabelul statistic ce
serveşte la prezentarea acestora trebuie să existe o corespondenţă.
5. Reprezentarea grafică a seriilor statistice este o metodă larg întâlnită
de prezentare a datelor unei serii, sub forma unei imagini spaţiale, într-un sistem
de coordonate specificat.
Aceasta permite vizualizarea rapidă a distribuţiei seriei de date în raport
cu una sau mai multe caracteristici fundamentale, cum ar fi ordinea de mărime,
tendinţa de evoluţie în timp, spaţiu sau din punct de vedere calitativ etc.
Elementele de bază ale unei reprezentări grafice sunt:
 titlul graficului, care, similar cu tabelele statistice, indică populaţia
statistică studiată, locul şi perioada cercetării şi care trebuie să fie clar şi concis;
 axele de coordonate, care sunt, de regulă, coordonate rectangulare şi
servesc la reprezentarea punctelor graficului în sisteme bidimensionale (Ox, Oy)
ori tridimensionale (Ox, Oy, Oz);
 scara graficului, care reprezintă diviziunile graficului, şi poate fi
uniformă (aritmetică) sau neuniformă (progresivă, regresivă, logaritmică etc.);
 reţeaua graficului, care este formată din linii paralele, orizontale şi
verticale, ce servesc la determinarea locului unor puncte, simboluri sau figuri,
fără a îngreuna citirea graficului;

61
 legenda, care explică semnificaţia notaţiilor folosite în grafic. Se
amplasează alături sau sub figură şi reproduce la scară redusă elementele
utilizate în reprezentarea grafică;
 notele şi sursele datelor, trebuie, de asemenea specificate, similar cu
cele prezentate în cazul tabelelor statistice.
Cele mai des întâlnite tipuri de grafice în reprezentarea seriilor statistice
sunt diagramele. Acestea pot fi reprezentate prin benzi sau prin coloane.
În cazul diagramelor prin benzi, se utilizează un sistem de axe rectangular
bidimensional. Benzile sunt de fapt dreptunghiuri, ale căror baze se reprezintă
pe axa Oy, în timp ce, pe axa Ox se reprezintă nivelul valoric al caracteristicii
studiate.
Diagramele prin coloane sunt, de asemenea, dreptunghiuri, cu diferenţa
că, de această dată, bazele dreptunghiurilor se reprezintă pe axa Ox, iar nivelul
valoric al caracteristicii studiate se reprezintă pe axa Oy.
În ambele cazuri, dacă bazele dreptunghiurilor sunt egale, atunci
lungimea unei benzi, respectiv, înălţimea unei coloane sunt proporţionale cu
dimensiunea numerică a caracteristicii reprezentate grafic.
Dacă bazele dreptunghiurilor nu sunt egale, atunci suprafaţa benzii,
respectiv, a coloanei trebuie să fie proporţională cu dimensiunea numerică a
caracteristicii.
Pentru reprezentarea grafică a seriilor de distribuţie se utilizează trei
tipuri de grafice:
1. Histograma este o reprezentare grafică sub formă de dreptunghiuri,
similară diagramelor prin coloane, cu deosebirea că bazele reprezentate pe axa
Ox sunt formate din intervalele de grupare, iar înălţimile reprezentate pe axa Oy
sunt formate din frecvenţele absolute sau relative de apariţie. Dacă intervalele
de grupare sunt egale, înălţimea coloanelor histogramei este proporţională cu
frecvenţele de apariţie, iar dacă intervalele nu sunt egale, suprafaţa coloanelor
este proporţională cu frecvenţele.
2. Poligonul frecvenţelor se poate uşor construi după ce a fost realizată
histograma, prin unirea cu segmente de dreaptă, în mod succesiv, a mijloacelor
bazelor superioare ale dreptunghiurilor histogramei.
3. Curba cumulativă a frecvenţelor (poligonul frecvenţelor cumulate) se
trasează reprezentând pe axa Ox intervalele de grupare, similar cu histograma şi
poligonul frecvenţelor, iar pe axa Oy frecvenţele cumulate absolute sau relative.
Toate aceste reprezentări grafice sunt utilizate pentru compararea seriei
de date studiate cu graficul unor repartiţii cunoscute, de regulă, cea normală,
indicându-se cât de aproape sau de departe este fenomenul cercetat faţă de unul
cu repartiţia respectivă. În realizarea acestor comparaţii, trebuie avut în vedere

62
faptul că marea majoritate a fenomenelor economice, cel puţin teoretic, au o
repartiţie normală.

PROBLEME REZOLVATE

Exemplul 4.1.
Pe baza unui eşantion format din 50 de date referitoare la vânzările zilnice
realizate de un magazin, se prezintă modalitatea de grupare a acestora pe
intervale de frecvenţă. Valorile înregistrate sunt:

Tabelul 4.1
165 168 164 185 201
156 180 156 195 181
159 170 189 186 173
167 166 138 201 193
170 180 153 165 164
146 161 180 175 160
140 171 160 187 200
151 169 172 177 142
164 179 142 166 184
158 191 155 165 149

Având în vedere că valoarea maximă este xmax = 201, iar valoarea minimă
este xmin = 138, dimensiunea optimă a intervalului de grupare este următoarea:

201  138
h  9 ,482  10
1  3,322  lg 50

După cum rezultă din relaţia de mai sus, dimensiunea intervalului s-a
aproximat la cea mai apropiată valoare superioară întreagă, astfel încât
variaţia caracteristicii de grupare să poată fi observată uşor.
Variantele de grupare posibile sunt:
a) Dacă se consideră că vânzările sunt exprimate în milioane lei,
caracteristica de grupare este continuă şi vor exista două variante de grupare:

63
Varianta 1 (în interval este Varianta 2 (în interval este
inclusă limita inferioară) inclusă limita superioară)

Tabelul 4.2 Tabelul 4.3


Vânzări ni Vânzări ni
135 – 145 4 135 – 145 4
145 – 155 4 145 – 155 5
155 – 165 11 155 – 165 13
165 – 175 13 165 – 175 11
175 – 185 8 175 – 185 8
185 – 195 6 185 – 195 6
195 – 205 4 195 – 205 3
TOTAL 50 TOTAL 50

unde ni reprezintă frecvenţele absolute de apariţie a unităţilor statistice, iar suma


k
lor este întotdeauna egală cu volumul eşantionului studiat, astfel: n
i 1
i n

b) Dacă se consideră că vânzările sunt exprimate în bucăţi, atunci


caracteristica de grupare este discretă şi vor exista, din nou, cele două variante
de grupare:

Varianta 1 (în interval este Varianta 2 (în interval este


inclusă limita inferioară) inclusă limita superioară)

Tabelul 4.4 Tabelul 4.5


Vânzări ni Vânzări ni
135 – 144 4 136 – 145 4
145 – 154 4 146 – 155 5
155 – 164 11 156 – 165 13
165 – 174 13 166 – 175 11
175 – 184 8 176 – 185 8
185 – 194 6 186 – 195 6
195 – 204 4 196 – 205 3
TOTAL 50 TOTAL 50

64
Exemplul 4.2.
Să se determine frecvenţele relative şi frecvenţele cumulate.
Luând în considerare gruparea pe intervale de frecvenţă a datelor din exemplul
4.1 (punctul a, varianta II), frecvenţele relative şi cele cumulate se determină
astfel:

Tabelul 4.6
Intervale Frecvenţe Frecvenţe Frecvenţe absolute Frecvenţe relative
de vânzări absolute (ni) relative (fi) cumulate (Ni) cumulate (Fi)
135 – 145 4 4/50 = 0,08 4 0,08
145 – 155 5 5/50 = 0,10 4+5=9 0,08 + 0,10 = 0,18
155 – 165 13 13/50 = 0,26 9 + 13 = 22 0,18 + 0,26 = 0,44
165 – 175 11 11/50 = 0,22 22 + 11 = 33 0,44 + 0,22 = 0,66
175 – 185 8 8/50 = 0,16 33 + 8 = 41 0,66 + 0,16 = 0,82
185 – 195 6 6/50 = 0,12 41 + 6 = 47 0,82 + 0,12 = 0,94
195 – 205 3 3/50 = 0,06 47 + 3 = 50 0,94 + 0,06 = 1,00
TOTAL 50 50/50 = 1 – –

Exemplul 4.3.
Se presupune că nivelurile producţiei de-a lungul a 5 ani au fost următoarele:
110; 130; 120; 100; 110 milioane lei.
Diagrama prin benzi se reprezintă în felul următor:

Anii
5
4
3
2
1

0 100 110 120 Producţia


130

65
Exemplul 4.4.
Utilizând datele din exemplul 4.3, diagrama prin coloane se reprezintă astfel:
Producţi
a
130

120

110

100

0 1 2 3 4 5 Anii

Exemplul 4.5.
Dacă se utilizează datele din tabelul 4.6, histograma, poligonul frecvenţelor
absolute şi curba cumulativă a frecvenţelor sunt următoarele:
Frecvenţe
absolute
13

11

30 135 145 155 165 175 185 Vânzări


195 205
Histograma

66
Frecvenţe
absolute
13

11

0
135 145 155 165 175 185 Vânzări
195 205

Poligonul frecvenţelor absolute

Frecvenţe
absolute
cumulate
50
47
41
33

22

9
4
0
135 145 155 165 175 185 Vânzări
195 205

Curba cumulativă a frecvenţelor


( Poligonul frecvenţelor cumulate)

67
PROBLEME PROPUSE

1. Un institut de cercetări doreşte să studieze evoluţia ratei inflaţiei în România.


Pentru aceasta a fost selectat un eşantion format din 36 de valori lunare ale
inflaţiei aferente unei perioade de 3 ani.
Datele, prezentate ca variaţii procentuale ale ratei inflaţiei de la o lună la
alta, sunt următoarele:

An 1 An 2 An 3
4,9 3,0 2,3
7,2 2,9 3,7
3,8 6,4 3,8
2,7 4,8 4,8
2,3 5,3 1,8
1,3 5,1 2,8
1,3 1,7 4,3
0,6 1,2 1,8
2,7 3,2 2,8
3,9 4,2 2,8
1,9 4,0 2,8
2,2 2,9 2,5

Se cere:
a) Să se grupeze datele pe intervale şi să se determine distribuţia de
frecvenţă;
b) Să se traseze histograma şi poligonul frecvenţelor absolute şi
cumulate.

2. Managerul unei firme doreşte să studieze evoluţia costurilor cu salariile în


compania pe care o conduce. Pentru aceasta a fost selectat un eşantion format
din 36 valori lunare ale costurilor cu salariile. Datele sunt următoarele (mii
RON):

68
An 1 An 2 An 3
25 37 33
34 29 37
36 31 39
28 22 25
34 28 21
29 36 29
41 39 30
20 40 28
26 25 24
33 28 26
29 27 28
24 31 34

Se cere: a) Să se grupeze datele pe intervale şi să se determine distribuţia de


frecvenţă;
b) Să se traseze histograma şi poligonul frecvenţelor absolute şi
cumulate.

69
70
CAPITOLUL 5

PARAMETRII REPARTIŢIILOR STATISTICE

Analiza seriilor de distribuţie cu ajutorul frecvenţelor absolute şi relative,


a tabelelor şi a reprezentărilor grafice, specifice etapei de prelucrare primară a
datelor statistice, oferă o imagine sistematizată asupra modului în care se
comportă caracteristicile unui fenomen sau proces economic. Această imagine
nu este, însă, suficientă pentru a formula ipoteze referitoare la tendinţa generală
de evoluţie a fenomenului cercetat sau la cauzele fundamentale ori
întâmplătoare care determină această evoluţie.
În vederea cercetării statistice a tendinţelor şi a regulilor de manifestare,
repartiţia unei variabile economice trebuie generalizată, astfel încât întreaga ei
esenţă să fie concentrată în câţiva parametri sintetici.
După nota dominantă pe care o pun în evidenţă parametrii ce
caracterizează o variabilă aleatoare, aceştia pot fi grupaţi astfel:
 parametrii tendinţei centrale;
 parametrii variaţiei sau ai împrăştierii;
 parametrii asimetriei şi ai boltirii.

5.1. Parametrii tendinţei centrale

În cadrul oricărei repartiţii de date, valorile observate manifestă tendinţa


de grupare în jurul unei valori tipice, numită centru de grupare. Caracterizarea
statistică a centrului de grupare se realizează cu ajutorul unei serii de parametri
sau indicatori medii, cunoscuţi sub numele generic de mărimi medii.7
Mărimile medii exprimă în mod sintetic şi generalizant ceea ce este
tipic, esenţial pentru unităţile unei populaţii statistice distribuite după una sau
mai multe caracteristici. Pentru a servi pe deplin scopului lor, mărimile medii
trebuie să îndeplinească o serie de condiţii, cum ar fi:8
 să fie precis definite, fie printr-o formulă, fie printr-o definiţie,
astfel încât, oricine ar efectua calculele referitoare la aceeaşi distribuţie de date
să ajungă la acelaşi rezultat;
7
I.D. Resa, Şt. Petrescu, M. Precupaş, Al. Câra, Probleme de statistică rezolvate pe calculator,
Editura Facla, Timişoara, 1984, pag. 19
8
Elisabeta Jaba, Statistica, Editura Sedcom Libris, Iaşi, 1996, pag. 98

71
 să fie reprezentative pentru toţi termenii seriei la care se referă, cu
condiţia, desigur, ca populaţia studiată să fie omogenă. Dacă populaţia nu e
omogenă, atunci ea trebuie separată pe grupe omogene şi se determină mărimile
medii pentru fiecare grupă în parte;
 să fie relativ uşor de calculat şi să se preteze la calcule algebrice
ulterioare;
 să fie stabile, puţin influenţate de fluctuaţiile selecţiei, adică,
indiferent de eşantioanele care sunt utilizate pentru cercetarea statistică a
populaţiei respective, mărimile medii să fie aproximativ aceleaşi.
Este de la sine înţeles că toate aceste condiţii nu pot fi îndeplinite
cumulativ de către orice mărime medie, dar este foarte important să se
cunoască, pentru fiecare valoare medie în parte, ce condiţii nu sunt satisfăcute.
Mărimile medii pot fi clasificate după numeroase criterii, dintre care
cele mai importante sunt după rol şi după modul de calcul.
După rolul lor, mărimile medii sunt mărimi utilizate pentru calcul
(media aritmetică, media geometrică, media pătratică etc.) şi mărimi medii de
poziţie (mediana, modul, quantilele, etc.).
În funcţie de modul de calcul, mărimile medii pot fi simple (în cazul
seriilor simple de date) sau ponderate (în cazul seriilor grupate pe intervale de
frecvenţă).
În afară de mărimile de calcul (în special media), prezentate pe larg în
capitolul 2, pentru a studia tendinţa centrală se mai determină şi mărimile de
poziţie, dintre care cele mai cunoscute sunt mediana, modul şi quantilele.
Prin mediana (Me) unei serii de distribuţie se înţelege acea valoare
pentru care probabilitatea ca variabila aleatoare X să ia valori inferioare lui Me
este egală cu probabilitatea ca X să ia valori superioare lui Me, conform relaţiei:

P (X ME) = P (X  ME) (5.1)

Mediana este, deci, valoarea centrală a unei serii ordonate crescător sau
descrescător, care împarte repartiţia în două părţi egale.
A. Pentru date negrupate, mediana se determină în două variante9:
 dacă numărul unităţilor observate este impar, de forma n = 2p + 1,
atunci mediana este egală cu valoarea unităţii situate în mijlocul seriei de date
(de rang p + 1), adică:

ME = XP+1 (5.2)

9
D.M. Levine, D. Stephan, T.C. Krehbiel, M.L. Berenson, Statistics for Managers using
Microsoft Excel, Third Edition, Prentice Hall, 2002, pag. 112–114

72
 dacă numărul unităţilor observate este par, de forma n = 2p, atunci
mediana este egală cu media aritmetică simplă a celor două valori situate în
mijlocul seriei de date (de rang p, respectiv, p + 1), conform relaţiei:

x p  x p1
Me  (5.3)
2

B. Pentru date grupate pe intervale de frecvenţă, calculul medianei


presupune parcurgerea următoarelor etape:
1. Se determină frecvenţele absolute cumulate ale intervalelor de grupare
(Ni);
2. Se stabileşte intervalul median (în interiorul căruia se află mediana),
ca fiind intervalul corespunzător primei frecvenţe absolute cumulate mai mare
sau egală cu locul medianei în serie (n/2);
3. Se calculează mediana, prin interpolare, conform relaţiei:

n
 N e1
Me  le  he  2 (5.4)
ne

unde: le este limita inferioară a intervalului median;


he reprezintă dimensiunea intervalului median;
Ne-1 este frecvenţa absolută cumulată a intervalului anterior celui median;
ne reprezintă frecvenţa intervalului median.
Mediana prezintă avantajul că este mai puţin dependentă de intervalele de
grupare şi de forma de repartiţie în comparaţie media, fiind mai utilă atunci
când datele sunt prezentate într-o formă în care calculul mediei este afectat de
închiderea convenţională a intervalelor deschise.
Pentru o mai bună cunoaştere a structurii unei repartiţii continue de date,
se pot folosi şi alte valori de poziţie, cum sunt quantilele, care se obţin prin
extinderea noţiunii de mediană10.
Quantilele sunt mărimi de poziţie reprezentate de valori ale caracteristicii
care împart seria de date studiată în q grupe de dimensiuni egale. Constanta q
defineşte ordinul quantilelor. Astfel, mediana este quantila de ordinul 2,
deoarece împarte seria de date în două grupe egale. Quantilele de ordinul 4 sunt
cele care împart seria de date în patru grupe egale şi poartă numele de quartile.

10
Andrei T., Stancu S., op. cit., pag. 88–93

73
Quartilele sunt în număr de trei, notate de obicei Q1, Q2 şi Q3. Quartila
mijlocie (Q2) este chiar mediana, iar celelalte două se determină tot prin
interpolare, conform relaţiilor:

n
 N Q1 1
Q1  lQ1  hQ1  4 (5.5)
nQ1
3n
 N Q3 1
Q3  lQ 3  hQ 3  4 (5.6)
nQ 3

În mod asemănător se determină şi celelalte categorii de quantile, şi


anume, decilele, care împart seria de date în zece grupe egale, centilele, care
împart seria în o sută de grupe egale şi promilele, care împart seria în o mie de
părţi egale.
Modul (Mo) sau dominanta unei variabile aleatoare este valoarea
caracteristicii cu frecvenţa maximă de apariţie, adică valoarea cea mai des
întâlnită în repartiţia de date analizate.
În cazul variabilelor discrete, modul se determină, conform definiţiei sale,
11
ca fiind valoarea cu cea mai mare frecvenţă sau probabilitate de apariţie .
În cazul unei repartiţii continue, grupată pe intervale de frecvenţă, modul
este valoarea corespunzătoare vârfului curbei de frecvenţă.
În acest caz, determinarea lui presupune parcurgerea următoarelor etape:
1. Se determină intervalul cu frecvenţa maximă de apariţie, care devine,
astfel, interval modal (intervalul care conţine modul);
2. Se calculează modul, prin interpolare, conform relaţiei:

1
Mo  lo  h0  (5.7)
1  2

unde: lo este limita inferioară a intervalului modal;


ho reprezintă dimensiunea intervalului modal;
Δ1 este diferenţa dintre frecvenţa intervalului modal şi frecvenţa
intervalului anterior acestuia;

11
Berenson M.L., Levine D.M., Krehbiel T.C., Basic Busines Statistics. Concepts and
Applications, Ninth Edition, Pearson Prentice Hall, 2004, pag. 91

74
Δ2 este diferenţa dintre frecvenţa intervalului modal şi frecvenţa
intervalului următor acestuia.
Dacă există mai multe intervale cu frecvenţa maximă de apariţie, atunci
modul nu poate fi determinat ca valoare unică a seriei de date, adică seria
respectivă este plurimodală.
Ca aplicabilitate practică, modul poate înlocui media, atunci când aceasta
nu poate fi calculată, sau determinarea ei nu are sens (de exemplu, determinarea
modelului mediu al automobilelor vândute nu are sens, astfel încât se va lua în
considerare ca valoare centrală modelul cel mai frecvent vândut).
Într-o repartiţie de date perfect simetrică şi unimodală, cei trei parametri
fundamentali ai tendinţei centrale – media, mediana şi modul – au aceeaşi
valoare, între ei existând relaţia de egalitate:

x = ME = MO (5.8)

În cazul repartiţiilor asimetrice, cele trei valori centrale sunt diferite, iar
relaţia dintre ele se poate exprima astfel:

x – MO = 3 ( x – ME) (5.9)

Alegerea celui mai semnificativ parametru central al unei serii de date


diferă de la o situaţie concretă la alta, existând, însă, câteva caracteristici
particulare ale valorilor centrale, în funcţie de care pot fi diferenţiate:
 media aritmetică este influenţată de fiecare valoare a seriei, datorită
faptului că se determină prin calcul, pe baza tuturor termenilor seriei. Din acest
motiv, ea este sensibilă la eventualele valori extreme, aberante, care pot afecta
calitatea interpretărilor. De aceea este indicat ca media aritmetică să fie utilizată
pentru serii relativ omogene sau dacă este posibil, să se separe seriile de date pe
grupe omogene şi apoi să se determine media fiecărei grupe, iar, în final să se
calculeze media mediilor grupelor;
 mediana şi modul, fiind mărimi de poziţie, sunt influenţate mai mult
de numărul de date al seriei şi de concentrarea acestora în anumite zone şi mai
puţin de valorile extreme. Acestea prezintă şi avantajul că sunt uşor de obţinut
(uneori, chiar prin observare directă), chiar şi atunci când limitele seriei nu sunt
cunoscute. Dezavantajele lor constau în aceea că, uneori, sunt valori
aproximative şi, mai ales în faptul că nu pot fi utilizate în calculele algebrice,
ceea ce le limitează drastic aplicabilitatea.12

12
C. Şipoş, C. Preda, Statistică Economică, Editura Mirton, Timişoara, 2004, pag. 46 – 47

75
5.2. Parametrii variaţiei

Necesitatea determinării altor parametri decât cei ai tendinţei centrale a


apărut datorită faptului că aceştia nu dau nici o informaţie referitoare la
dispersarea, împrăştierea valorilor repartiţiei de date, unele faţă de altele sau în
raport cu un centru de grupare. Astfel, valorile centrale pot fi aceleaşi pentru
mai multe repartiţii de date, în timp ce gradul de dispersare al termenilor seriilor
în jurul centrului de grupare să fie diferit.
Din acest motiv, nu este suficientă determinarea valorilor centrale ale unei
repartiţii de date, ci este necesar să se reflecte structura pe grupe omogene a
acesteia şi abaterile termenilor faţă de media lor, datorate acţiunii unor factori
cunoscuţi sau întâmplători.
Importanţa determinării parametrilor variaţiei este, în primul rând, aceea
că permite separarea influenţei cauzelor esenţiale, cuantificabile ale variaţiilor
valorilor unei repartiţii de date de influenţa cauzelor aleatoare, întâmplătoare,
necuantificabile.

5.2.1. Parametrii simpli şi sintetici ai variaţiei

Parametrii simpli ai variaţiei măsoară împrăştierea fiecărei valori faţă de


nivelul mediu sau faţă de o anumită valoare a variabilei studiate. Ei pot fi
determinaţi atât în mărime absolută, cât şi relativă şi sunt următorii:
 amplitudinea variaţiei;
 abaterile individuale.
Amplitudinea variaţiei în mărime absolută (A) se determină ca diferenţă
între valoarea maximă (xmax) şi cea minimă (xmin) a caracteristicii studiate,
conform relaţiei:

A = XMAX – XMIN (5.10)

Pentru date grupate pe intervale de frecvenţă, amplitudinea se calculează


ca diferenţă între limita superioară a ultimului interval şi limita inferioară a
primului interval.
Amplitudinea în mărime absolută, datorită faptului că este calculată
numai pe baza valorilor extreme ale variabilei studiate, reflectă doar întinderea
domeniului de variaţie, nu şi structura internă sau cauzele acesteia. Fiind o
mărime absolută, ea nu permite nici compararea gradului de variaţie a două
populaţii statistice diferite.

76
Amplitudinea variaţiei în mărime relativă (A%) se determină ca raport
procentual între amplitudinea absolută şi media aritmetică a variabilei studiate,
astfel:
A x  xmin
A%   100  max  100 (5.11)
x x

Amplitudinea relativă elimină dezavantajul amplitudinii absolute în ceea


ce priveşte comparabilitatea seriilor de date, dar rămâne la fel de limitată în
reflectarea structurii şi cauzelor variaţiei.
Amplitudinea reprezintă, de fapt, un parametru foarte simplu al variaţiei,
care în sine nu este foarte relevant, dar care serveşte la prelucrarea ulterioară a
informaţiilor în vederea grupării datelor pe intervale de frecvenţă.
Abaterea individuală absolută (di) se determină ca diferenţă între fiecare
valoare a variabilei studiate şi media acesteia, conform relaţiei:

di = xi – x (5.12)

Abaterea individuală relativă (d%i) se calculează ca raport procentual


între abaterea individuală absolută şi media variabilei studiate, astfel:

di x x
d %i   100  i  100 (5.13)
x x

În cazul utilizării mediei aritmetice, conform proprietăţilor acesteia, suma


abaterilor individuale faţă de medie, fie că sunt absolute sau relative, este nulă:

n n
 di   d %i  0 (5.14)
i 1 i 1

Importanţă practică prezintă, de regulă, abaterea individuală minimă şi


abaterea individuală maximă pentru a analiza poziţia valorilor extreme în raport
cu media.
Parametrii simpli ai variaţiei prezintă dezavantajul că nu pot exprima
complet variaţia caracteristicii studiate, fapt pentru care este necesară
determinarea unor parametrii sintetici.
Parametrii sintetici ai variaţiei exprimă dispersia tuturor valorilor
individuale în jurul centrului de grupare, reprezentat, de regulă, de media
aritmetică.

77
Ei pot fi determinaţi ca mărimi medii sau relative (coeficienţi) şi sunt:
abaterea medie liniară; varianţa (dispersia); abaterea standard (abaterea medie
pătratică) şi coeficientul de variaţie. Această categorie de parametri a fost
prezentată în capitolul 2 în cadrul caracteristicilor numerice ale variabilelor
aleatoare.

5.2.2. Parametrii factoriali ai variaţiei

Variabilitatea fenomenelor social–economice este influenţată, în general,


atât de acţiunea factorilor esenţiali, determinanţi, cât şi de acţiunea unor factori
aleatori, întâmplători. Cuantificarea influenţei tuturor acestor factori asupra
variaţiei fenomenului sau procesului economic studiat se realizează cu ajutorul
13
analizei varianţei sau ANOVA (analysis of variance) , care are la bază sistemul
parametrilor factoriali ai variaţiei.
Procedeul constă în descompunerea variaţiei totale a unui ansamblu de
date înregistrate pentru fenomenul economic studiat în componente ale variaţiei,
definite după sursele acesteia, precum şi compararea componentelor respective
pentru a stabili dacă factorii consideraţi cauză au influenţă semnificativă. În
funcţie de cauzele care determină variaţia, componentele acesteia pot fi grupate
în două categorii:
 componenta numită ―explicativă‖ sau ―efect‖, ce reprezintă variaţia
determinată de factorii de influenţă luaţi în considerare;
 componenta numită ―reziduală‖, care nu poate fi pusă pe seama unui
anumit factor de influenţă, fiind efectul cumulat al tuturor factorilor aleatori ce
acţionează asupra fenomenului studiat.
Parametrii factoriali ai variaţiei sunt:
 varianţa de grupă (parţială) j2;
 media varianţelor de grupă  2 ;
 varianţa mediilor de grupă faţă de media generală  2;
 varianţa totală (generală) 02.
Varianţa de grupă sau parţială cuantifică influenţa factorilor aleatori,
neesenţiali, care determină variaţia valorilor studiate în cadrul unei grupe.
Ea se calculează ca medie aritmetică ponderată a pătratelor abaterilor
xj
valorilor caracteristicii (xi) de la media grupei ( ), conform relaţiei:

13
Tehnica ANOVA este prezentată pe larg în: M.L. Berenson, D.M. Levine, T.C. Krehbiel, op.
cit., pag. 387–432; P. Newbold, W.L. Carlson, B. Thorne, op. cit., 579–620; Elisabeta Jaba, op.
cit., pag. 303–320

78
 x  x j  nij  x  x j  nij
m m
2 2
i i
 2j  i 1
m
 i 1
(5.15)
n
nj
ij
i 1

Varianţele de grupă (intragrupă) se vor calcula pentru fiecare grupă în


parte şi vor avea valori mai mari sau mai mici, în funcţie de gradul de
eterogenitate, respectiv, de omogenitate a grupelor populaţiei statistice studiate.
Media varianţelor de grupă se determină ca o medie aritmetică ponderată
a varianţelor de grupă, astfel:


j 1
2
j nj
2  k (5.16)
n j 1
j

Acest parametru factorial al variaţiei cuantifică influenţa factorilor


aleatori pe întreaga populaţie statistică, deci sintetizează variaţia reziduală,
întâmplătoare a caracteristicii studiate.
Varianţa mediilor de grupă faţă de media generală (varianţa intergrupe) se
determină ca o medie aritmetică ponderată a pătratelor abaterilor mediilor de
xj
grupă ( ) faţă de media populaţiei statistice ( x ), conform relaţiei:

 x  x nj
k
2
j
j 1
2  k (5.17)
 nj
j 1

Varianţa intergrupe reflectă variaţia caracteristicii datorată cauzelor


esenţiale pe întreaga populaţie statistică studiată.

79
Varianţa totală (generală) se calculează ca o medie aritmetică ponderată
a pătratelor abaterilor valorilor faţă de media populaţiei statistice, după relaţia:

 x i  x  ni
2

 02  i 1
m (5.18)
 ni
i 1

Varianţa totală cuantifică variaţia datorată acţiunii conjugate a tuturor


cauzelor, esenţiale sau întâmplătoare, care se manifestă la nivelul întregii
populaţii statistice. Dacă populaţia statistică este omogenă, valoarea varianţei
totale este mică, iar dacă populaţia este eterogenă, varianţa totală este mare.
Pentru seriile de date bidimensionale, alături de medii şi varianţe, se
determină şi covarianţa, ca o medie ponderată a produselor abaterilor
variabilelor X şi Y, astfel:

1 m k
Cov x, y    xi  x  yi  y nij (5.19)
n i 1 j 1

Pornind de la parametrii factoriali ai variaţiei, se poate cuantifica gradul


de influenţă a celor două categorii de factori, cu ajutorul a doi coeficienţi:

5.3. Media şi varianţa caracteristicii alternative

Parametrii unei caracteristici alternative se mai numesc şi parametri ai


variabilei aleatoare Bernoulli14. Datorită caracterului dihotomic al
caracteristicii, unităţile statistice nu se pot găsi decât în una din cele două
situaţii posibile: posedă însuşirea analizată (DA = 1) sau nu posedă însuşirea
respectivă (NU = 0). Distribuţia de frecvenţă pentru o caracteristică alternativă
este prezentată în tabelul 5.1:

14
C. Chilărescu, O. Ciorîcă, C. Preda, C. Şipoş, N. Surulescu, op. cit., pag. 99–103

80
Tabelul 5.1
Valori ale Frecvenţele de apariţie
caracteristicii Absolute Relative
N1 n1
p
Da: x1 = 1 n
N – n1 n  n1
q
Nu: x2 = 0 n
Total N P+q=1

Media unei caracteristici alternative ( x ) se determină pornind de la


relaţia de calcul a mediei aritmetice, astfel:

xn i i
1  n1  0  n  n1  n1
x i
  p
n
(5.20)
i n n
i

Se observă, deci, că media caracteristicii alternative este chiar ponderea


unităţilor care posedă însuşirea analizată în totalul unităţilor populaţiei statistice.
Din acest motiv, media caracteristicii alternative poate fi considerată mărime
relativă de structură, pondere sau greutate specifică, precum şi probabilitate de
apariţie a cazurilor favorabile. Aceste interpretări sunt valabile şi pentru
probabilitatea de apariţie a cazurilor nefavorabile (q).
Varianţa caracteristicii alternative (2) se determină ca produs între cele
două frecvenţe relative p şi q, conform relaţiei:

2 = p  q = p (1–p) (5.21)

Abaterea standard () se va determina ca radical din varianţă, astfel:

 p1  p  (5.22)

Parametrii unei caracteristici alternative au o largă utilizare în calculul


erorilor de eşantionare, la controlul calităţii produselor etc.

81
5.4. Parametrii asimetriei şi ai boltirii

În analiza seriilor de distribuţie unidimensionale, un interes aparte îl


prezintă cunoaşterea formei distribuţiei. Forma unei distribuţii statistice poate fi
apreciată cu ajutorul parametrilor asimetriei şi ai boltirii.
Parametrii asimetriei dau informaţii asupra modului de repartizare a
frecvenţelor de o parte şi de alta a valorii centrale a unei serii. Ca valori centrale
în vederea aprecierii asimetriei sunt folosite media aritmetică ( x ), modul (Mo)
şi mediana (Me). Astfel, în practică pot exista distribuţii empirice care se abat
de la curba normală a frecvenţelor şi care sunt fie uşor asimetrice, fie pronunţat
asimetrice, înclinate spre stânga sau spre dreapta.
Pentru cuantificarea asimetriei sunt utilizaţi numeroşi parametri, dar cei
mai cunoscuţi şi mai des utilizaţi sunt parametrii asimetriei propuşi de Pearson:
1. Asimetria în mărime absolută (As), care se determină conform relaţiei:

As  x  Mo (5.23)

Atunci când volumul eşantionului studiat este foarte mare, pe baza


relaţiei dintre valorile centrale, asimetria se poate exprima şi în funcţie de
mediană, după relaţia:

As  3( x  Me ) (5.24)

Dacă media este mai mică decât modul şi mediana, atunci As  0 şi curba
este înclinată spre dreapta, iar dacă media este mai mare decât celelalte valori
centrale, atunci As  0 şi curba este înclinată spre stânga.
2. Coeficientul de asimetrie Pearson (Cas) se determină ca raport între
asimetria absolută şi abaterea standard, astfel:

x  Mo
Cas  (5.25)

Acest coeficient ia valori în intervalul (–1, 1) şi se interpretează astfel:
 dacă cele două valori centrale sunt foarte apropiate, Cas  0 şi atunci
distribuţia studiată este simetrică;
 dacă media este mai mică decât modul, atunci Cas  0 şi distribuţia
este înclinată spre dreapta;
 dacă media este mai mare decât modul, atunci Cas  0 şi distribuţia
este înclinată spre stânga;

82
 dacă Cas   0,3 atunci seria este uşor asimetrică, iar dacă Cas  
0,3 atunci seria este pronunţat asimetrică.
3. Coeficientul de asimetrie se mai poate determina în cazul seriilor uşor
asimetrice cu un volum mare de date conform relaţiei:

3( x  Me )
Cas  (5.26)

Acest coeficient ia valori în intervalul (–3, 3), iar interpretarea sa este
similară cu cea a coeficientului anterior.
Parametrii boltirii arată în ce măsură curba repartiţiei empirice este mai
înaltă sau mai aplatizată în raport cu curba repartiţiei normale. În acest sens, mai
des utilizaţi sunt doi coeficienţi:
1. Coeficientul boltirii Pearson (), care se determină pe baza
momentelor centrate, astfel:

4 4
 
 22  2 2
(5.27)

unde: 4 este momentul centrat de ordinul patru, calculat cu relaţia:

  xi  x  ni
n
4

4  i 1
(5.28)
n

iar 2 este momentul centrat de ordinul doi, adică varianţa (2).


Pentru o distribuţie cu o boltire normală, coeficientul de boltire ia
valoarea 3. Astfel, dacă   3, atunci repartiţia empirică este aplatizată, iar dacă
  3, atunci repartiţia empirică studiată are o curbă mai înaltă decât cea
normală.
2. Coeficientul boltirii Fisher (), care cuantifică excesul faţă de boltirea
unei repartiţii normale. Deoarece pentru o repartiţie normală coeficientul boltirii
Pearson () are valoarea 3, gradul de exces se calculează astfel:

4
=–3= –3 (5.29)
 22

83
Interpretarea lui  este următoarea:
 dacă  = 0, repartiţia empirică are o boltire normală;
 dacă   0, curba repartiţiei empirice este mai plată decât cea normală;
 dacă   0, curba repartiţiei empirice este mai înaltă decât cea
normală;

PROBLEME REZOLVATE

Exemplul 5.1.
Au fost înregistrate vânzările lunare ale unei firme (V) pe o perioadă de 15 luni
(mil. lei):

V 13 18 15 12 16 18 14 11 6 7 13 9 15 14 17

Pentru a se determina mediana, în primul rând este necesară ordonarea


datelor seriei şi stabilirea rangului fiecărui termen al seriei. De regulă,
ordonarea se face crescător, astfel:

V 11 12 13 13 14 14 15 15 16 16 17 17 18 18 19
Rang 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Având în vedere faptul că volumul seriei de date este impar (15 valori),
mediana va fi egală cu valoarea situată pe poziţia din mijloc, adică valoarea de
rang 8:
Me = x8 = 15 mil. lei

Exemplul 5.2.
Au fost înregistrate vânzările lunare ale aceleiaşi firme (V) pe o perioadă de 16
luni (mil. lei):

V 13 18 15 12 16 18 14 11 16 17 13 19 15 14 17 18

Se ordonează crescător datele:

V 11 12 13 13 14 14 15 15 16 16 17 17 18 18 18 19
Rang 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

84
Având în vedere faptul că volumul seriei de date este, de această dată, par
(16 valori), mediana va fi egală cu media aritmetică simplă a valorilor situate pe
poziţiile din mijloc, adică a celor de rang 8, respectiv 9:

x8  x9 15  16
ME =  = 15,5 mil. lei
2 2

Exemplul 5.3.
Se iau în considerare datele grupate pe intervale de frecvenţă din tabelul 5.3.
Pentru calculul medianei se determină frecvenţele cumulate absolute, astfel:

Tabelul 5.3
Vânzări (xi) ni Frecvenţele cumulate
– mil. lei – absolute (Ni )
135 – 145 4 4
145 – 155 4 8
155 – 165 11 19
165 – 175 13 32
175 – 185 8 40
185 – 195 6 46
195 – 205 4 50
TOTAL 50 –

Se observă că primul interval a cărui frecvenţă absolută cumulată este mai


mare decât locul medianei în serie (n/2 = 25) este intervalul de la 165 la 175
(N4 = 32), care devine, astfel, interval median. În aceste condiţii, mediana se
determină conform relaţiei 5.16:

25  19
Me = 165 + 10  = 169,61 mil. lei
13

Exemplul 5.4.
Luând în considerare datele din tabelul 5.4, intervalele quartilice sunt:

85
Tabelul 5.4
Vânzări (xi) ni Frecvenţele cumulate
– mil. lei – absolute (Ni )
135 – 145 4 4
145 – 155 4 8
155 – 165 11 19
165 – 175 13 32
175 – 185 8 40
185 – 195 6 46
195 – 205 4 50
TOTAL 50 –

Se observă că primul interval a cărui frecvenţă absolută cumulată este mai


mare decât locul quartilei 1 în serie (n/4 = 12,5) este intervalul de la 155 la 165
(N3 = 19), intervalul quartilei 2 este cel median, iar intervalul quartilei 3 este de
la 175 la 185, deoarece frecvenţa sa absolută cumulată (N5 = 40) este prima cu
valoare mai mare decât locul quartilei 3 în serie (3n/4 = 37,5). În aceste condiţii,
cele trei quartile sunt:

12 ,5  8
Q1 = 155 + 10  = 159,09 mil. lei
11

Q2 = Me = 169,61 mil. lei

37 ,5  32
Q3 = 175 + 10  = 181,87 mil. lei
8

Exemplul 5.5.
Se iau în considerare datele grupate pe intervale de frecvenţă din tabelul 5.5. În
vederea determinării modului se construieşte un nou tabel, astfel:

86
Tabelul 5.5
Vânzări (xi) ni
135 – 145 4
145 – 155 4
155 – 165 11
165 – 175 13
175 – 185 8
185 – 195 6
195 – 205 4
TOTAL 50

Intervalul modal este cel a cărui frecvenţă de apariţie este maximă, adică
intervalul de la 165 la 175 (n4 = 13), iar modul se va calcula astfel:

13  11
Mo = 165 + 10 
13  11  13  8 
= 167,85 mil. lei

Exemplul 5.6.
Dacă se iau în considerare datele referitoare la vânzările unei firme, prezentate
în tabelul de mai jos, parametrii simpli ai variaţiei se determină astfel:

V 13 8 15 9 16 18 14 11

Luând în considerare datele din tabel, valoarea maximă, cea minimă şi


media aritmetică sunt: xmax = 19; xmin = 11; x = 15,5.
În aceste condiţii, amplitudinea absolută a variaţiei este:

A = 19 – 11 = 8 MIL. LEI
Amplitudinea relativă a variaţiei este:

19  11
A% =  100  51,61%
15 ,5
Abaterile individuale absolute sunt:
d1 = 13 – 15,5 = – 2,5 d5 = 16 – 15,5 = + 0,5
d2 = 18 – 15,5 = + 2,5 d6 = 18 – 15,5 = + 2,5
d3 = 15 – 15,5 = – 0,5 d7 = 14 – 15,5 = – 1,5
d4 = 19 – 15,5 = + 3,5 d8 = 11 – 15,5 = – 4,5

87
Se observă că: d1 + d2 + d3 + d4 + d5 + d6 + d7 + d8 = 0

Abaterile individuale relative sunt:

d%1 = 13 – 15,5 = – 16,12% d%5 = 16 – 15,5 = + 3,22%


d%2 = 18 – 15,5 = + 16,12% d%6 = 18 – 15,5 = + 16,12%
d%3 = 15 – 15,5 = – 3,22% d%7 = 14 – 15,5 = – 9,67%
d%4 = 19 – 15,5 = + 22,58% d%8 = 11 – 15,5 = – 29,03%

Se observă că: d%1 + d%2 + d%3 + d%4 + d%5 + d%6 + d%7 + d%8 = 0

PROBLEME PROPUSE

1. Managerul unei bănci doreşte să studieze evoluţia ratei dobânzilor. În acest


sens, a fost selectat un eşantion format din 36 de valori ale ratei dobânzii anuale
înregistrate lunar timp de 3 ani. Datele sunt următoarele:

An 1 An 2 An 3
3,3 4,5 4,8
4,1 4,5 4,6
4,6 4,1 4,2
3,6 4,9 3,1
3,2 4,8 3,7
3,3 4,1 3,4
3,4 5,1 3,6
3,1 4,7 3,5
3,5 4,1 4,3
3,5 4,9 4,7
4,4 4,7 4,8
4,3 4,3 4,5

Se cere: a) Să se determine parametrii tendinţei centrale atât pe date grupate pe


intervale de frecvenţă şi cât şi pe date negrupate;
b) Să se determine parametrii variaţiei pe date grupate şi negrupate;
c) Să se determine parametrii asimetriei şi ai boltirii.

88
2. Un institut de cercetări doreşte să studieze evoluţia ratei şomajului. Pentru
aceasta a fost selectat un eşantion format din 30 de valori lunare ale ratei
şomajului, astfel:

4,9 7,0 5,3


7,2 6,9 6,7
5,8 6,4 6,8
5,7 4,8 4,8
6,3 5,3 5,8
5,3 5,1 6,8
7,3 6,7 4,3
5,6 5,2 7,8
6,7 7,2 4,8
5,9 4,2 7,8

Se cere: a) Să se determine parametrii tendinţei centrale atât pe date grupate pe


intervale de frecvenţă şi cât şi pe date negrupate;
b) Să se determine parametrii variaţiei pe date grupate şi negrupate;
c) Să se determine parametrii asimetriei şi ai boltirii.

89
90
CAPITOLUL 6

ESTIMAŢII. INTERVALE DE ÎNCREDERE

6.1. Noţiuni de teoria estimaţiei

Caracterizarea statistică a fenomenelor şi proceselor social–economice de


masă se bazează pe interpretarea datelor individuale, obţinute prin metode de
înregistrare totală sau parţială.
Metodele de înregistrare a datelor sunt esenţiale pentru calitatea
procesului decizional, fapt pentru care a apărut dilema alegerii între o valoare
exactă, obţinută prin observare totală, dar afectată de o eroare de mărime
necunoscută şi o valoare inexactă, obţinută prin observare parţială, dar a cărei
incertitudine este cunoscută.
Obţinerea datelor cu ajutorul observaţiei totale face obiectul statisticii
clasice, în timp ce obţinerea informaţiilor pe baza observaţiei parţiale, adică
prin utilizarea unui eşantion din populaţia statistică, este studiată de către
statistica inferenţială.
Teoria estimaţiei vizează cunoaşterea unei populaţii statistice pe baza
observaţiilor făcute asupra unui eşantion reprezentativ prelevat din aceasta şi
constă în estimarea unor caracteristici ale repartiţiei statistice, în verificarea
unor ipoteze privind legăturile între fenomene, în previzionarea evoluţiei
viitoare a acestora etc.
În practica economică, cercetarea prin sondaj, bazată pe extragerea unor
eşantioane reprezentative din populaţia statistică studiată, are o tot mai mare
extindere, datorită multiplelor avantaje pe care le prezintă.
În primul rând, operativitatea şi costul scăzut al cercetării prin sondaj în
raport cu cercetarea totală, partea supusă înregistrării fiind, de regulă, mult mai
mică decât întregul, reprezintă avantaje incontestabile.
Alte avantaje se referă la posibilitatea efectuării unei cercetări mai
aprofundate, luând în considerare mai multe caracteristici ale unităţilor studiate,
precum şi la faptul că, în unele cazuri, cercetarea implică distrugerea
elementelor observate, ceea ce face ca observarea totală să fie imposibilă.
Aria de aplicabilitate în economie a teoriei estimaţiei este extrem de largă
şi cuprinde practic toate ramurile acesteia. Astfel, în industrie, estimarea este
utilizată îndeosebi în controlul calităţii procesului de producţie şi a produselor

91
obţinute, în cercetările de marketing, în determinarea productivităţii muncii şi
salarizarea personalului, în previzionarea evoluţiei preţurilor etc. În agricultură,
sondajul este utilizat pentru estimarea recoltelor în funcţie de condiţiile
existente, în determinarea pierderilor probabile, în verificarea rezultatelor
recensămintelor animalelor etc. În comerţ, cercetarea prin sondaj serveşte la
estimarea cererii de mărfuri în funcţie de variaţia factorilor de influenţă, la
cunoaşterea opţiunilor cumpărătorilor cu privire la produsele comercializate, la
verificarea încadrării loturilor de produse în standardele cerute etc.
În general, cercetarea prin sondaj este utilă în verificarea ipotezelor
ştiinţifice şi evaluarea influenţei diferiţilor factori asupra fenomenelor cercetate
din cele mai diverse domenii – sociologie, politologie, administraţie publică,
15
medicină, fizică, biologie şi altele.
Cercetarea parţială are drept scop estimarea, pe baza rezultatelor
prelucrării datelor obţinute la nivel de eşantion, folosind principiile teoriei
probabilităţilor, a parametrilor caracteristici populaţiei statistice studiate. În
acest sens, se culeg şi se prelucrează datele aferente unităţilor statistice incluse
în eşantionul studiat, obţinându-se diverşi indicatori absoluţi, relativi sau medii
ori indici statistici, care descriu în detaliu respectivul eşantion. Apoi, indicatorii,
respectiv, indicii obţinuţi la nivel de eşantion se extrapolează, cu o anumită
probabilitate, la nivelul întregii populaţii statistice, în scopul caracterizării
acesteia.
Într-o cercetare prin sondaj, deoarece există două categorii studiate, pe de
o parte, populaţia statistică care se doreşte a fi cunoscută, iar pe de altă parte,
eşantionul observat în vederea obţinerii unor estimaţii ale parametrilor
populaţiei, se întâlnesc o serie de noţiuni perechi, care au acelaşi conţinut
metodologic, dar diferă din punct de vedere al informaţiei pe care o cuprind.
Astfel, populaţia statistică sau colectivitatea generală este alcătuită din
totalitatea unităţilor ce compun fenomenul supus cercetării, iar volumul său se
notează, de regulă, cu N, iar în cazul variabilelor alternative, cu M.
Colectivitatea parţială – colectivitatea de selecţie, eşantionul, proba,
mostra, populaţia observată etc. – reprezintă subansamblul de unităţi extrase
din colectivitatea generală în vederea culegerii datelor şi a generalizării la
nivelul întregii populaţii statistice a rezultatelor obţinute din prelucrarea
acestora. Volumul eşantionului se notează cu n, iar pentru variabile alternative,
cu m. Întotdeauna, în cazul cercetării parţiale va fi valabilă relaţia: n  N, iar în
cazul cercetării totale n = N.
Dintr-o anumită populaţie statistică pot fi prelevate mai multe eşantioane,
care să difere între ele ca volum şi structură, fapt pentru care, parametrii

15
C. Şipoş, C. Preda, Statistică Economică, Editura Mirton, Timişoara, 2004, pag. 69 – 71

92
statistici ce caracterizează eşantionul pot fi consideraţi variabile aleatoare de
diverse repartiţii, în timp ce media şi varianţa populaţiei studiate au valori unice
în condiţii date de timp şi spaţiu.
Valorile statistice (de selecţie) reprezintă indicatori ai repartiţiei studiate
calculaţi la nivel de eşantion. Ele se determină prin prelucrarea datelor rezultate
din observarea eşantionului de volum n şi sunt valori calculate la nivelul
acestuia.
Valorile estimate ale parametrilor populaţiei statistice sunt indicatori ai
repartiţiei studiate estimaţi la nivel de populaţie statistică. Ele nu reprezintă
valori calculate, ci se estimează prin inferenţă statistică pe baza valorilor de
selecţie obţinute la nivel de eşantion. Un parametru al populaţiei statistice are o
valoare fixă, adevărată, necunoscută, dar estimabilă şi se notează, în general, cu
.
Valorile de selecţie folosite pentru estimarea parametrilor populaţiei
statistice se numesc estimatori şi sunt notate cu semnul ―  ‖ deasupra
parametrului respectiv. Astfel, pentru un parametru , estimatorul său este notat
cu ̂ .
Media şi varianţa, valori tipice pentru populaţia statistică şi pentru
eşantion, se notează şi se determină diferit, în funcţie de nivelul la care se
referă, conform tabelului 6.1.1:

Tabelul 6.1.1
Denumirea La nivel de La nivel de
indicatorului populaţie statistică eşantion (selecţie)
N n

Media  xi x i
m i 1
x i 1
N n
N n

 x  m  x  x
2 2
i i

Varianţa 2  i 1
s2  i 1
N n

Pentru ca cercetarea prin sondaj să-şi atingă scopul, este necesară


parcurgerea unor etape specifice şi utilizarea unor metode proprii, ce au la bază,
în mare măsură, schemele clasice de probabilitate.
Pe parcursul efectuării cercetării prin sondaj pot apare o serie de erori de
selecţie, definite ca abateri ale valorilor calculate la nivel de eşantion faţă de
valorile care s-ar fi obţinut dacă s-ar fi organizat o observare totală. De regulă,
există două tipuri de erori: erori de înregistrare (de observare), comune tuturor
tipurilor de observări şi erori de reprezentativitate, specifice cercetării prin

93
sondaj. Alături de acestea, mai pot fi întâlnite erori datorate unei baze
incomplete de cercetare sau non-răspunsurilor.
Erorile de înregistrare apar, de obicei, într-un număr mic de cazuri şi pot
fi înlăturate cu uşurinţă printr-un control riguros al activităţii de observare.
Specifice, însă, cercetării prin sondaj sunt erorile de reprezentativitate,
care, după sursa de provenienţă, pot fi sistematice sau întâmplătoare.
Erorile sistematice de reprezentativitate sunt abateri care se produc într-
un singur sens ca urmare a influenţei subiective a celor care efectuează selecţia
şi care nu respectă strict metodologia de eşantionare. Dintre cauzele cele mai
frecvente care duc la apariţia acestor erori putem aminti: selectarea intenţionată
doar a acelor unităţi care deţin caracteristici de natură să conducă la rezultatul
dorit de cercetător; substituirea unor unităţi reprezentative cu altele
asemănătoare din motive de comoditate; cuprinderea incompletă în cercetare a
unităţilor pentru a realiza economie de timp şi cost ş.a.m.d.
Erorile întâmplătoare de reprezentativitate sunt abateri care se produc în
ambele sensuri ca urmare a acţiunii a diverşi factori cu caracter aleator. Ele pot
apare chiar şi în condiţiile în care regulile de eşantionare sunt respectate cu
stricteţe. Din cauza lor, eşantionul nu poate niciodată reproduce identic
populaţia statistică din care face parte şi, drept urmare, nu se poate face o
estimare absolut corectă a parametrilor populaţiei. Erorile întâmplătoare de
reprezentativitate, deşi nu pot fi evitate, pot fi determinate cu o anumită
probabilitate şi, astfel, estimarea parametrilor populaţiei statistice se va putea
face cu o eroare care poate fi încadrată într-un anumit interval probabilistic. În
aceste condiţii, fiecărui parametru al populaţiei i se va ataşa eroarea sa de
reprezentativitate, pentru a putea fi generalizat la nivelul întregului ansamblu
studiat. Problema esenţială a cercetării prin sondaj o constituie, dealtfel, tocmai
stabilirea preciziei estimaţiilor, a limitelor de încredere pentru valorile estimate
ale parametrilor populaţiei statistice.
Măsurarea erorilor de reprezentativitate se realizează, de regulă, cu
ajutorul a trei indicatori: eroarea efectivă, eroarea medie probabilă şi eroarea
limită.
Eroarea efectivă de reprezentativitate (d) – deplasarea sau distorsiunea –
se determină atunci când se cunosc parametrii şi structura populaţiei statistice.
Ea se calculează ca diferenţă între media a unei valori de selecţie, M( ̂ ) şi
valoarea reală a parametrului populaţiei statistice, , conform relaţiei:

d = M( ̂ ) –  (6.1)

Atunci când se extrag mai multe eşantioane, pentru verificarea


reprezentativităţii estimatorului este necesar să se determine mediile tuturor

94
eşantioanelor, exprimate sintetic cu ajutorul mediei mediilor de selecţie ( x ),
precum şi media populaţiei statistice (m). Eroarea efectivă de reprezentativitate
va fi:

x m
dx = x – m, sau d x %    100 (6.2)
m

În practică, se întâmplă destul de rar, însă, ca structura şi valorile


parametrilor populaţiei statistice să fie cunoscute, fapt pentru care erorile
trebuie şi ele estimate.
Astfel, eroarea medie probabilă se determină atunci când nu se cunosc
parametrii populaţiei statistice, ca speranţă matematică a abaterilor pătratice ale
valorilor estimatorului ( ̂ ) faţă de valoarea reală a parametrului corespunzător
(), astfel:

M( – ̂ )2 = VAR( ̂ ) + d2 (6.3)

unde: d reprezintă deplasarea estimatorului (conform relaţiei 6.1);


VAR( ̂ ) este varianţa estimatorului.
Atunci când deplasarea este nulă, estimatorul este nedeplasat şi rezultă că
eroarea medie probabilă este egală cu varianţa estimatorului.
Eroarea limită reprezintă abaterea maximă admisibilă pentru valoarea
unui estimator al unui parametru al populaţiei statistice. Dimensiunea erorii
limită depinde de mărimea erorii de reprezentativitate şi de coeficientul de
încredere z. Acest coeficient de încredere se determină în raport de
probabilitatea cu care se garantează rezultatele şi reprezintă o valoare tabelată,
fiind argumentul funcţiei Gauss-Laplace, cunoscută în statistică sub denumirea
de distribuţie normală.
Distribuţia (repartiţia) normală are o formă simetrică, pentru care cea mai
mare probabilitate de apariţie, în cazul cercetării prin sondaj, o are acea medie
de selecţie care coincide cu media populaţiei statistice, iar eroarea de
reprezentativitate este nulă. În raport de această valoare centrală, celelalte valori
ale mediei de selecţie se repartizează simetric de ambele părţi, cu probabilităţi
egale aferente aceleiaşi abateri absolute în plus sau în minus. Faţă de
probabilitatea maximă, probabilităţile de apariţie a mediilor de selecţie descresc
proporţional şi simetric, pe măsură ce ne apropiem de limitele distribuţiei.
Dacă se notează cu  ˆ eroarea de reprezentativitate, atunci relaţia de
calcul a erorii limită (x) este următoarea:

95
x = z   ˆ (6.4)

Pe baza erorii limită se determină intervalul de încredere, de forma:

ˆ  z   ˆ    ˆ  z   ˆ (6.5)

Eroarea limită este utilizată pentru a stabili intervalul de variaţie


(încredere) a mediei de selecţie faţă de media populaţiei statistice, având în
vedere o anumită probabilitate. Cu ajutorul ei se apreciază precizia estimaţiei
sau se stabileşte anticipat volumul eşantionului ce urmează a fi prelevat din
populaţia statistică studiată.

6.2. Estimarea parametrilor unei populaţii statistice

Estimarea reprezintă procesul prin care se determină cu o anumită


probabilitate – fie sub formă de estimare punctuală (o valoare unică), fie sub
formă de interval de încredere – valorile necunoscute ale parametrilor unei
populaţii statistice, pe baza datelor înregistrate la nivelul unui eşantion extras
din aceasta.
Estimarea punctuală reprezintă procedeul de determinare a unei singure
valori posibile şi probabile a parametrului căutat, pe baza datelor aferente
unităţilor din eşantion.
Estimarea prin interval de încredere presupune determinarea limitelor
unui interval probabil în care se încadrează valoarea reală a parametrului
populaţiei statistice studiat.
Estimatorul reprezintă o funcţie statistică utilizată pentru a estima un
parametru necunoscut al populaţiei statistice. Acesta este rezultatul procesului
de inferenţă sau inducţie statistică şi are asociată o probabilitate ce
caracterizează gradul său de acurateţe (încredere).
Estimaţia reprezintă valoarea obţinută a unui estimator ( ̂ ) al
parametrului , obţinută pe baza unui eşantion. Estimaţia se alege astfel încât,
pentru diferite eşantioane prelevate, valorile estimate să fie cât mai apropiate de
valoarea parametrului necunoscut al populaţiei statistice.
Astfel, calitatea estimatorului şi a estimaţiei se apreciază cu ajutorul a trei
16
proprietăţi: deplasare, convergenţă şi eficienţă.

16
C. Şipoş, C. Preda, op. cit., pag. 76 – 77

96
Se spune că un estimator este nedeplasat sau fără distorsiune atunci când
media sa este egală cu valoarea reală a parametrului corespunzător: M( ̂ ) = .
Valoarea estimatorului este cu atât mai apropiată de valoarea reală a
parametrului populaţiei statistice, cu cât volumul eşantionului este mai mare (n
 N).
Un estimator este deplasat sau cu distorsiune dacă: M( ̂ ) =  + d , unde
d reprezintă deplasarea estimatorului (eroarea de reprezentativitate).
Estimatorul convergent sau consistent reprezintă estimatorul a cărui
varianţă tinde spre zero (VAR( ̂ ) 0), atunci când volumul eşantionului tinde
către volumul populaţiei statistice (n  N). Acest lucru înseamnă că
probabilitatea ca estimatorul să difere de valoarea reală a parametrului scade pe
măsură ce volumul eşantionului creşte, conform relaţiei:

 
lim P ˆ      1
n N
(6.6)

pentru orice   0. Dacă eşantionul conţine toate unităţile populaţiei, valoarea


estimatorului se suprapune peste valoarea reală a parametrului.
Un estimator este absolut corect dacă îndeplineşte concomitent două din
calităţile descrise mai sus: este nedeplasat şi este convergent, adică: M( ̂ ) = 
şi VAR( ̂ ) 0, atunci când n  N.
Un estimator este corect dacă îndeplineşte condiţiile: M( ̂ )  şi
VAR( ̂ ) 0, atunci când n  N.
Un estimator este considerat eficient atunci când are varianţa cea mai
mică în raport cu varianţa oricărui alt estimator calculat pentru acelaşi eşantion
de volum n: VAR( ̂ )= minim.

6.2.1. Estimarea punctuală a mediei şi varianţei

Dacă media necunoscută a populaţiei statistice se notează cu m, iar


estimatorul său, calculat la nivelul unui eşantion de volum n, se notează cu x ,
atunci se poate demonstra că x este un estimator nedeplasat al lui m: M( x )=
m, astfel:

1 n  1  n  1 n 1 n
M x   M   xi   M   xi    M xi    m   n  m  m (6.7)
1
 n i 1  n  i 1  n i 1 n i 1 n

97
Media de selecţie x este un estimator convergent în cazul unei populaţii
infinite, deoarece atunci când n  N şi N  , varianţa mediilor de selecţie
2
VAR( x ) =   2
x va tinde către 0.
n
În concluzie, media de selecţie ( x ) este un estimator absolut corect al
mediei populaţiei statistice (m).
Dacă varianţa necunoscută a populaţiei statistice se notează cu 2, iar
estimatorul său, calculat la nivelul unui eşantion de volum n, se notează cu s2,
atunci se poate demonstra că s2 este un estimator deplasat al lui 2: E(s2) 2.
Pentru aceasta, se porneşte de la faptul că se poate demonstra existenţa
relaţiei17:

n n

 xi  x 2   xi  m2  nx  m2


i 1 i 1
(6.8)

În aceste condiţii:

1 n 2 1 n 2
 
M s 2  M   xi  x    M   xi  m  x  m  
2

 n i1   n i1 
1  2
     
n n
 M  xi  m   M x  m   M xi  m  M x  m 
2 1 2 2

n  i 1  n i 1
2 n 1 2
 VAR xi   VAR x    2    (6.9)
n n

Conform relaţiei 6.9, estimatorul s2 determinat la nivelul eşantionului este


un estimator deplasat al varianţei populaţiei statistice. Deoarece VAR(s2)  0
când n  N şi N  , se poate spune că varianţa de selecţie (s2) este un
estimator corect al varianţei populaţiei statistice (2).
Pentru a obţine un estimator absolut corect al varianţei populaţiei
statistice ( ̂ 2 ), se va împărţi varianţa de selecţie la (n–1)/n, astfel:

2 n  x i  x
2

   xi  x  
s n 1
ˆ 2  
2 i 1
(6.10)
n  1 n  1 n i 1 n 1
n

17
Elisabeta Jaba, Statistica, Editura Sedcom Libris, Iaşi, 1996, pag. 289

98
Estimarea punctuală a parametrilor populaţiei statistice este eficientă
numai pentru eşantioane de volum foarte mare, fapt pentru care, în practica
economică se preferă estimarea parametrilor pe baza unui interval de valori,
numit interval de încredere, care se poate determina şi pe baza unor eşantioane
de volum mai redus.

6.2.2. Estimarea mediei prin interval de încredere

Estimarea prin interval de încredere constă în determinarea, cu o anumită


probabilitate, a unui interval de valori în interiorul căruia se situează parametrul
necunoscut al populaţiei statistice ().
Probabilitatea ca parametrul populaţiei statistice să se situeze în interiorul
intervalului de încredere se notează, de regulă, cu p şi poartă numele de
coeficient sau nivel de încredere. Probabilitatea inversă – ca parametrul
necunoscut al populaţiei statistice să se situeze în afara limitelor intervalului de
încredere – se notează, de obicei, cu  ( = 1 – p) şi se numeşte nivel de
semnificaţie.
Estimarea prin interval de încredere presupune cunoaşterea legii de
repartiţie a estimatorului, respectiv a parametrului populaţiei statistice, şi constă,
de fapt, în determinarea limitelor intervalului, pentru un coeficient de încredere
dat. În general, limitele intervalului de încredere sunt definite ca limită
inferioară (Li) şi limită superioară a acestuia (Ls) şi se calculează conform
relaţiilor:

Li = ̂ – x (6.11)
Ls = ̂ + x (6.12)

Probabilitatea ca parametrul necunoscut al populaţiei statistice () să se


situeze în interiorul intervalului de încredere se defineşte astfel:

P(Li    Ls) = 1 –  (6.13)

Estimarea mediei unei populaţii statistice (m) prin interval de încredere se


realizează în două variante:
Varianta 1: Dacă volumul eşantionului este mai mare de 30 de unităţi (n
 30) şi varianţa la nivelul populaţiei statistice (2) este cunoscută, atunci
intervalul de încredere pentru medie (m) se determină cu ajutorul repartiţiei
normale (Gauss-Laplace) centrate reduse, astfel:

99
   
P x  z   m x  z   1   = 2(z) (6.14)
 n n 

în care: x reprezintă media calculată la nivel de eşantion (media de selecţie);


 este abaterea standard la nivelul populaţiei statistice (    2 ),
considerată a fi cunoscută;
z reprezintă argumentul funcţiei Laplace;
(z) este valoarea funcţiei Laplace. Valorile lui (z) sunt date în anexa
1.
Probabilitatea (coeficientul de încredere) cu care se doreşte a se estima
intervalul de încredere se alege de către analist, ea fiind, de regulă, de 0,95 (sau
95%). În aceste condiţii nivelul de semnificaţie va fi:  = 1 – p = 0,05 (sau
5%).
Varianta 2: Dacă volumul eşantionului este mai mic de 30 de unităţi (n 
30), iar varianţa la nivelul populaţiei statistice (2) este necunoscută (cazul cel
mai frecvent în practica economică), atunci intervalul de încredere pentru medie
se determină cu ajutorul repartiţiei Student cu  = n – 1 grade de libertate,
astfel:

 s s 
P x  t   m x t   1  (6.15)
 n n

în care: x reprezintă media calculată la nivel de eşantion (media de selecţie);


s reprezintă estimatorul abaterii standard la nivel de eşantion;
t este o valoare tabelară, care se ia din tabelele repartiţiei Student în
funcţie de probabilitatea /2 şi  = n – 1 grade de libertate (anexa
2).
În practica economică a prelucrării statistice a datelor, o largă răspândire
a cunoscut o metodă empirică, denumită de metoda celor trei sigma. Conform
acestei metode, abaterile valorilor reale necunoscute ale populaţiei statistice
studiate de la media calculată la nivel de eşantion depăşesc în măsură foarte
18
mică de trei ori abaterea standard. Metoda celor trei sigma propune un
interval de încredere de forma:

x – 3   m  x + 3 (6.16)

18
C. Şipoş, C. Preda, op. cit., pag. 84

100
Dacă se cunoaşte abaterea standard () la nivelul populaţiei statistice,
atunci, conform repartiţiei Laplace: 2(3) = 0,9973 (conform anexei 1). Acest
lucru înseamnă că, indiferent de volumul eşantionului ales, probabilitatea ca
media să se situeze în intervalul de încredere determinat cu această metodă este
p = 99,73%, iar probabilitatea  ca media să nu se regăsească în acest interval
este de numai 0,27%.
Dacă abaterea standard la nivelul populaţiei statistice nu se cunoaşte, dar
se utilizează estimatorul ei, calculat la nivel de eşantion (s), atunci
probabilitatea ca media să se situeze în interiorul intervalului de încredere
variază în funcţie de volumul eşantionului (cu cât acesta este mai mare, cu atât
coeficientul de încredere p este mai mare).

6.2.3. Estimarea varianţei şi a abaterii standard


prin interval de încredere

Estimarea varianţei unei populaţii statistice (2) prin interval de încredere


se realizează cu ajutorul repartiţiei 2, pornind de la variabila:

2 
n  1  s 2
(6.17)
2
unde: 2 reprezintă o valoare tabelară a repartiţiei 2 cu  = n –1 grade de
libertate;
n este volumul eşantionului;
s2 reprezintă estimatorul varianţei, calculat pe baza datelor din eşantion;
2 este varianţa necunoscută a populaţiei statistice.
Dacă se alege un coeficient de încredere p = 1 – , se pot determina două
valori tabelare  2  şi  2 (anexa 3), astfel încât:
1
2 2


P  2  
n  1  s 2   2   1  
  (6.18)
 1 2 2 2 

sau

101
 
 n  1  s 2 n  1   s 2 
P 2    1 (6.19)
  2
  2
 
1
 2 2 

Pentru abaterea standard, limitele intervalului de încredere se determină


prin extragerea rădăcinii pătrate din limitele intervalului de încredere al
varianţei, conform relaţiei:

 
 n  1  s 2 n  1  s 2   1  
P  
  2 2  
(6.20)
1
 2 2 

PROBLEME REZOLVATE

Exemplul 6.1.
Într-o întreprindere industrială, producţiile obţinute se abat în plus sau în minus
faţă de capacitatea nominală, datorită unor factori aleatori. Pentru a controla
producţia obţinută (tone), s-a verificat o linie tehnologică, timp de 60 de zile,
alese aleator, şi s-au obţinut următoarele date:

Tabelul 6.1
22,5 23,4 26,9 28,7 24,6 29,4 27,5 21,6 22,6 22,8
19,9 25,4 27,6 23,6 27,9 21,2 19,8 20,3 23,3 21,7
20,6 24,8 26,1 20,4 28,1 22,5 28,7 24,6 23,1 24,5
22,5 23,3 26,7 28,5 23,6 27,3 25,5 21,6 24,6 24,8
19,7 25,3 25,6 23,6 25,7 21,2 27,8 22,3 23,4 21,5
21,3 23,8 26,1 20,3 28,1 22,5 28,5 23,6 23,7 23,5

Presupunând că, din experienţa anterioară, se cunoaşte varianţa


procesului de producţie, 2 = 15, se cere să se determine, cu un coeficient de
încredere de 95%, un interval de încredere pentru media producţiei.
În primul rând, pentru a determina un interval de încredere al mediei
producţiei, este necesar să se calculeze media eşantionului ( x ) şi abaterea
standard (), astfel:

102
n

x i
1450
x i 1
  24 ,16 tone/zi , iar    2  15  3,87
n 60

Din tabelele repartiţiei Laplace (anexa 1) se determină pentru p = 2(z) =


0,95  (z) = 0,475 o valoare tabelară z = 1,96. În aceste condiţii, limitele
intervalului de încredere, conform relaţiei 6.14, vor fi:

 3,87 3,87 
P 24 ,16  1,96   m  24 ,16  1,96    0 ,95 
 60 60 

 P23,18  m  25,13  0 ,95

Se poate spune, deci, cu o probabilitate de 95%, că media zilnică a


producţiei se încadrează între 23,18 şi 25,13 tone.

Exemplul 6.2.
Într-o întreprindere, calitatea produselor obţinute se abate în plus sau în minus
faţă de normative, datorită influenţei unor factori aleatori. Pentru a controla
calitatea produselor obţinute, s-a verificat un număr de 20 de produse (procesul
este distructiv şi implică mari costuri), alese aleator, obţinându-se următoarele
date (nr. ore funcţionare produs):

Tabelul 6.2
429,3 427,4 421,7 422,4 423,4
427,2 419,8 420,3 423,3 421,7
428,5 427,4 428,9 426,7 425,6
419,4 425,4 427,6 423,6 429,9

Se cere să se determine, cu un coeficient de încredere de 95%, un interval


de încredere pentru media numărului de ore de funcţionare a produselor.
În prima etapă se calculează media ( x ) şi estimatorul abaterii standard
(s) la nivel de eşantion, astfel:

n n

 xi 8499 ,5  x i  x
2

x i 1
  424 ,975 ore , iar s  i 1
 3,347
n 20 n 1

103
Din tabelele repartiţiei Student (anexa 2) se determină pentru
probabilitatea /2 = (1 – 0,95)/2 = 0,025 şi  = n – 1 = 19 grade de libertate o
valoare tabelară t = 2,433. În aceste condiţii, limitele intervalului de încredere,
conform relaţiei 6.15, vor fi:

 3,347 3,347 
P 424 ,975  2 ,433   m  424 ,975  2 ,433    0 ,95 
 20 20 
 P423,15  m  426 ,79   0 ,95

Se poate spune, deci, cu o probabilitate de 95%, că media numărului de


ore de funcţionare a produselor realizate se încadrează între 423,15 şi 426,79.

Exemplul 6.3.
Luând în considerare datele din exemplul 6.2, se cere să se estimeze cu o
probabilitate de 95% câte un interval de încredere pentru varianţa, respectiv,
abaterea standard a numărului de ore de funcţionare a produselor.
Se calculează, în primul rând, estimatorul varianţei:

 x i  x
2

s2  i 1
 11,206
n 1

Apoi, din tabelele repartiţiei 2 (anexa 3), se iau valorile tabelare 2, în
funcţie de  = 0,05 şi  = n –1 = 20 – 1 = 19 grade de libertate, astfel:
02,025;19  32,85 şi  02,975;19  8 ,91
Intervalul de încredere pentru varianţă va fi:

 19  11,206 19  11,206 
P 2    0 ,95 
 32 ,85 8 ,91 


 P 6 ,48    23,89  0 ,95
2

Se poate spune, deci, cu o probabilitate de 95%, că varianţa numărului de
ore de funcţionare a produselor realizate se încadrează între 6,48 şi 23,89.
În aceste condiţii, intervalul de încredere pentru abaterea standard este:

104

P 6 ,48    23,89  0 ,95  P2,54    4,88  0,95
Abaterea standard a numărului de ore de funcţionare (variaţia lor faţă de
medie) se va încadra, cu o probabilitate de 95%, între 2,54 şi 4,88 ore.

PROBLEME PROPUSE

1. Capacitatea nominală de extracţie a unei sonde petroliere este de 100


t/săptămână. Datorită factorilor aleatori care acţionează în procesul de extracţie,
producţiile înregistrate se abat în plus sau în minus faţă de capacitatea nominală.
Pentru a controla producţia obţinută, s-au verificat 30 de sonde, alese aleator, şi
s-au obţinut următoarele date:

106,2 100,3 97,6


99,3 101,6 100,8
98,6 99,4 101,7
104,9 106,1 98,2
101,3 100,2 103,5
99,8 97,9 102,9
109,1 105,4 99,8
107,8 98,5 100,6
95,9 96,8 101,8
102,1 104,2 103,7

Pentru a verifica dacă procesul de extracţie se desfăşoară în condiţii


normale, se cere să se determine un interval de încredere pentru media,
respectiv, varianţa şi abaterea standard a producţiei cu o probabilitate de 99%.

2. Managerul unei întreprinderi doreşte să estimeze necesarul resurse financiare


pentru asigurarea cu materii prime pentru semestrul viitor. Pentru aceasta a
măsurat cheltuielile cu materiile prime timp de 6 săptămâni alese aleator,
rezultând următoarele date (mil. lei):

12 15 18 14 11 13 12 14 10 14 15 11

Se cere ca pe baza acestor date să se determine, cu o probabilitate de


95%, un interval de încredere pentru media, respectiv varianţa cheltuielilor cu
materiile prime.

105
3. O firmă doreşte să estimeze evoluţia vânzărilor. În acest scop au fost
înregistrate vânzările timp de 15 săptămâni, alese aleator, obţinându-se
următoarele date (mii RON):

V
125,8
131,1
129,7
131,3
135,2
138,1
126,9
128,3
130,6
132,5
133,3
136,2
127,7
129,6
133,4

Se cere să se estimeze, cu o probabilitate de 95%, un interval de încredere


pentru media, respectiv varianţa şi abaterea standard a vânzărilor.

106
CAPITOLUL 7

VERIFICAREA IPOTEZELOR STATISTICE

7.1. Demersul verificării unei ipoteze statistice

Verificarea sau testarea ipotezelor statistice este strâns legată de


cercetarea prin sondaj. Testarea unei ipoteze statistice reprezintă procesul de
luare a unei decizii de admitere sau respingere a unei ipoteze referitoare la
distribuţia uneia sau a mai multor variabile ori cu privire la un parametru al unei
distribuţii date, baza unor reguli prestabilite.
Procedeul de verificare a unei ipoteze statistice poartă numele de test sau
criteriu de semnificaţie şi presupune, în general, parcurgerea următoarelor
etape:
Etapa I. Formularea ipotezelor statistice. Ipoteza ce urmează a fi
verificată se numeşte ipoteză nulă şi constă în admiterea faptului că eventualele
deosebiri între două distribuţii sau între doi parametri sunt întâmplătoare. Se
notează, de regulă, cu H0. Ipoteza care se testează în opoziţie cu ipoteza nulă se
numeşte ipoteza alternativă şi se notează cu H1. Ipoteza alternativă se va
accepta atunci când se respinge ipoteza nulă, şi invers.
Dacă verificarea ipotezei se referă la un parametru  care se presupune că
ia o valoare 0, atunci ipoteza nulă se prezintă astfel:

H0:  =0 (7.1)

iar ipoteza alternativă poate lua una din formele:


 test bilateral: H1:   0;
 test unilateral la stânga: H1:   0;
 test unilateral la dreapta: H1:   0;
Verificarea ipotezei nule se face pe baza unui eşantion de volum n, extras
din populaţia statistică studiată. Acceptarea sau respingerea acesteia ridică
problema definirii regiunii de acceptare, respectiv, a regiunii de respingere a
ipotezei, adică a alegerii tipului de test (unilateral sau bilateral) şi a
probabilităţii asociate acestuia.

107
Regiunea de acceptare reprezintă intervalul în care ipoteza nulă H0 este
acceptată ca urmare a efectuării unui test statistic şi are probabilitatea asociată p
= 1 – , numită nivel (prag) de încredere.
Complementar, regiunea de respingere se defineşte ca interval de
respingere a ipotezei nule H0 ca urmare a efectuării testului statistic şi are
probabilitatea asociată , numită nivel (prag) de semnificaţie. De regulă, cea
care se stabileşte în cadrul testului este regiunea de respingere, pentru un nivel
de semnificaţie considerat acceptabil de către analist.
Pentru testul bilateral (H0: =0; H1:  0), regiunea de respingere
corespunde unui interval împărţit în două subintervale, delimitate la un capăt de
câte o valoare critică (tabelată) – una inferioară (Li) şi una superioară (Ls) – iar
la celălalt capăt de , conform figurii 7.1:

Zonă de acceptare H0
(p = 1 – )

Zonă de Zonă de
respinger respinger
e e
H0 H0
(/2) (/2)

Li Media de selecţie Ls

Figura 7.1. Regiunea de acceptare şi regiunea de respingere a H0 în


cazul testului bilateral

Pentru testul unilateral la stânga (H0: =0; H1:  0), regiunea de


respingere corespunde unui singur interval, delimitat la dreapta de o valoare
critică (Lcritic), iar la stânga de –, conform figurii 7.2:

108
Zonă de acceptare H0
(p = 1 – )

Zonă de
respinger
e
H0
()

Lcritic Media de
selecţie
Figura 7.2. Regiunea de acceptare şi regiunea de respingere a h0 în
cazul testului unilateral la stânga

Pentru testul unilateral la dreapta (H0: =0; H1:  0), regiunea de


respingere corespunde tot unui singur interval, delimitat, de data aceasta, la
stânga de o valoare critică (Lcritic), iar la dreapta de +, conform figurii 7.3:

Zonă de acceptare H0
(p = 1 – )

Zonă de
respinger
e
H0
()

Media de selecţie Lcritic

Figura 7.3. Regiunea de acceptare şi regiunea de respingere a h0 în


cazul testului unilateral la dreapta

Pe parcursul verificării ipotezelor statistice pot apare o serie de erori de


testare, concretizate în acceptarea sau respingerea pe nedrept a unei ipoteze.
Erorile au, la rândul lor o anumită repartiţie de probabilitate, fiecărui tip de
eroare fiindu-i caracteristică o anumită probabilitate.

109
Eroarea prin care se respinge o ipoteză adevărată se numeşte eroare de
ordinul întâi, iar probabilitatea asociată acesteia poartă numele de risc de
ordinul întâi şi este notată cu .
Eroarea prin care se acceptă o ipoteză falsă poartă numele de eroare de
ordinul doi, iar probabilitatea asociată acesteia se numeşte risc de ordinul doi şi
este notată cu .
Etapa a II-a. Alegerea nivelului de semnificaţie () al testului. În această
etapă se stabileşte, în funcţie de specific, nivelul de semnificaţie, adică
întinderea regiunii de respingere a testului. În practica economică, în cele mai
multe cazuri, nivelul de semnificaţie se alege ca fiind:  = 0,05 sau  = 5%.
Etapa aIIIi-a. Alegerea testului statistic şi determinarea valorii calculate
aferente acestuia. Testele statistice se aleg în funcţie de ipoteza verificată şi de
repartiţia populaţiei statistice studiate. Cel mai des utilizate în practică sunt
testele (criteriile): Laplace (z), Student (t), Helmert (2) şi Fisher (f). Valorile
calculate aferente acestor teste se determină conform metodologiei specifice
fiecărui test în parte.
Etapa a IV-a. Alegerea valorii critice (tabelare) aferente testului utilizat.
Fiecărui test statistic îi corespunde o repartiţie de valori, prezentate, de regulă,
sub formă tabelară. Din tabelele aferente repartiţiei respective se alege, în
funcţie de anumite criterii, valoarea critică sau tabelară a testului.
Etapa a V-a. Compararea valorii calculate a testului cu cea critică şi
luarea deciziei. Aceasta reprezintă ultima etapă a verificării unei ipoteze
statistice şi constă în compararea valorii calculate cu cea critică, iar în urma
acestei comparaţii, conform regulilor stabilite, se decide dacă ipoteza nulă h0 se
acceptă sau se respinge. Indiferent de decizia luată, aceasta va avea o
probabilitate de eroare egală cu nivelul de semnificaţie al testului,  .

7.2. Verificarea ipotezelor referitoare la media


Unei populaţii statistice

Acest tip de test este utilizat pentru a verifica dacă media populaţiei
statistice studiate, m, are sau nu o anumită valoare, m0, având la dispoziţie
datele aferente unui eşantion de volum n. Verificarea ipotezei presupune
calcularea mediei de selecţie ( x ) pe baza datelor eşantionului, precum şi
deţinerea unor informaţii referitoare la varianţa populaţiei statistice (2). În
funcţie de aceste elemente, există două tipuri de teste referitoare la media
populaţiei statistice:

110
I. Dacă varianţa populaţiei statistice (2) este cunoscută, situaţie
întâlnită în special în cazul controlului proceselor de producţie, având, la rândul
său, două variante:
I-a) dacă volumul eşantionului este mai mare de 30 de unităţi (n  30),
înseamnă că testul are le bază o repartiţie normală centrată redusă (funcţia
laplace), iar verificarea ipotezei referitoare la media populaţiei statistice va
parcurge următoarele etape:
1. Se formulează ipoteza nulă, conform căreia media populaţiei statistice
studiate (m) ia o anumită valoare (m0): H0: m = m0, cu ipoteza alternativă (testul
este, de regulă, bilateral): H1: m  m0;
2. Se stabileşte nivelul de semnificaţie al testului (regiunea de respingere
a ipotezei nule), . De regulă, în prelucrarea statistică a datelor referitoare la
fenomene sau procese economice, valoarea nivelului de semnificaţie se alege ca
fiind  = 0,05 (sau 5%);
3. Se determină valoarea calculată (numerică) a testului Laplace (zc),
după relaţia:

x  m0
zc  n (7.2)

4. Din tabelele statistice aferente funcţiei Laplace (anexa 1) se obţine, în
funcţie de nivelul de semnificaţie,  = 1 – 2(z), valoarea critică (tabelară) a
testului (z);
5. Se compară valoarea calculată a testului cu cea critică şi se ia decizia
de acceptare sau de respingere a ipotezei nule, astfel:
– dacă valoarea calculată este mai mică sau egală cu valoarea critică (zc 
z), atunci ipoteza nulă h0 se acceptă şi se poate spune cu probabilitatea p = 1 –
 că media populaţiei statistice studiate, m, are valoarea m0, eventualele
diferenţe fiind întâmplătoare;
– dacă valoarea calculată este mai mare decât valoarea critică (zc  z),
atunci ipoteza nulă h0 se respinge şi se poate spune cu probabilitatea p = 1 – 
că media populaţiei statistice studiate, m, nu are valoarea m0, diferenţele fiind
semnificative.
I-b) dacă volumul eşantionului este mai mic de 30 de unităţi (n  30),
înseamnă că testul are la bază o repartiţie student cu  = n – 1 grade de libertate,
iar verificarea ipotezei referitoare la media populaţiei statistice va presupune
parcurgerea următoarelor etape:

111
1. Se formulează aceeaşi ipoteză nulă, conform căreia media populaţiei
statistice studiate, m, ia o anumită valoare, m0: H0: m = m0, cu ipoteza
alternativă: H1: m  m0;
2. Se stabileşte nivelul de semnificaţie al testului (regiunea de respingere
a ipotezei nule),  ;
3. Se determină valoarea calculată (numerică) a testului Student (tc), de
această dată, conform relaţiei:

x  m0
tc  n (7.3)

4. Din tabelele statistice aferente repartiţiei Student (anexa 2) se alege, în
funcţie de nivelul de semnificaţie, /2 şi  = n – 1 grade de libertate, valoarea
critică a testului student (t/2;);
5. Se compară valoarea calculată cu cea critică şi se ia decizia de
acceptare sau de respingere a ipotezei nule, astfel:
– dacă valoarea calculată este mai mică sau egală cu valoarea critică (tc 
t/2;), atunci ipoteza nulă H0 se acceptă şi se poate spune cu probabilitatea p = 1
–  că media populaţiei statistice studiate, m, are valoarea m0, eventualele
diferenţe fiind întâmplătoare;
– dacă valoarea calculată este mai mare decât valoarea critică (tc  t/2;),
atunci ipoteza nulă H0 se respinge şi se poate spune cu probabilitatea p = 1 – 
că media populaţiei statistice studiate, m, nu are valoarea m0, diferenţele fiind
semnificative.
II. Dacă varianţa populaţiei statistice (2) nu este cunoscută, situaţia
cel mai des întâlnită în activitatea economică, atunci, în locul abaterii standard
la nivelul populaţiei statistice (), se va utiliza estimatorul acesteia (s),
determinat pe baza datelor eşantionului, conform relaţiei:

x  x
n
2
i
i 1
s (7.4)
n1

Testul are la bază tot o repartiţie student cu  = n – 1 grade de libertate,


iar etapele verificării ipotezei statistice, similare cu cele de la varianta I-b, se
parcurg după cum urmează:

112
1. Se formulează ipoteza nulă, conform căreia media populaţiei statistice
studiate, m, ia valoarea m0: H0: m = m0, cu ipoteza alternativă: H1: m  m0;
2. Se stabileşte nivelul de semnificaţie al testului,  ;
3. Se determină valoarea calculată a testului Student (tc), după relaţia:

x  m0
tc  n (7.5)
s

4. Din tabelele statistice aferente repartiţiei Student (anexa 2) se alege, în


funcţie de nivelul de semnificaţie, /2 şi  = n – 1 grade de libertate, valoarea
critică a testului student (t/2;);
5. Se compară valoarea calculată cu cea critică şi se ia decizia de
acceptare sau de respingere a ipotezei nule, astfel:
– dacă valoarea calculată este mai mică sau egală cu valoarea critică (tc 
t/2;), atunci ipoteza nulă H0 se acceptă şi se poate spune cu probabilitatea p = 1
–  că media populaţiei statistice studiate, m, are valoarea m0, eventualele
diferenţe fiind întâmplătoare;
– dacă valoarea calculată este mai mare decât valoarea critică (tc t/2;),
atunci ipoteza nulă H0 se respinge şi se poate spune cu probabilitatea p = 1 – 
că media populaţiei statistice studiate, m, nu are valoarea m0, diferenţele fiind
semnificative.

7.3. Verificarea ipotezelor referitoare la varianţa


Unei populaţii statistice

Verificarea ipotezelor statistice cu privire la varianţa necunoscută a unei


populaţii statistice (2) constă în a cerceta dacă aceasta ia sau nu o anumită
valoare, 02, având la dispoziţie datele aferente unui eşantion de volum n.
Verificarea ipotezei presupune, în primul rând, calcularea estimatorului
varianţei populaţiei statistice (s2) pe baza datelor eşantionului avut la dispoziţie,
conform relaţiei:

x  x
n
2
i
i 1
s2  (7.6)
n1

113
Testul statistic utilizat în realizarea acestei verificări are la bază repartiţia
 . Etapele care trebuie parcurse în vederea efectuării testului sunt următoarele:
2

1. Se formulează ipoteza nulă, conform căreia varianţa populaţiei


statistice studiate, 2, ia valoarea 02: H0: 2 = 02, cu ipoteza alternativă: H1:
2  02;
2. Se stabileşte nivelul de semnificaţie al testului (regiunea de respingere
a ipotezei nule), . Şi în cazul verificării ipotezelor referitoare la varianţă,
similar cu verificarea ipotezelor referitoare la medie, valoarea nivelului de
semnificaţie se alege, de regulă, ca fiind  = 0,05 (sau 5%);
3. Se determină valoarea calculată a testului (c2), după relaţia:

 n  1  s 2
 
2
(7.7)
c
 02

4. Din tabelele statistice aferente repartiţiei 2 (anexa 3) se aleg, în


funcţie de nivelul de semnificaţie  şi  = n – 1 grade de libertate, două valori
critice, una inferioară şi alta superioară: 21-/2;n-1 şi 2/2;n-1;
5. Se compară valoarea calculată cu cele critice şi se ia decizia de
acceptare sau de respingere a ipotezei nule, astfel:
– dacă valoarea calculată este cuprinsă în intervalul închis, delimitat de
cele două valori critice: c2  [21-/2;n-1; 2/2;n-1], atunci ipoteza nulă H0 se
acceptă şi se poate spune cu probabilitatea p = 1 –  că varianţa populaţiei
statistice studiate, 2, ia valoarea 02, eventualele diferenţe fiind întâmplătoare;
– dacă valoarea calculată se situează în afara intervalului închis, delimitat
de cele două valori critice: c2  [21-/2;n-1; 2/2;n-1], atunci ipoteza nulă H0 se
respinge şi se poate spune cu probabilitatea p = 1 –  că varianţa populaţiei
statistice studiate, 2, nu ia valoarea 02, diferenţele fiind semnificative.

7.4. Teste de comparare a mediilor şi a varianţelor


A două populaţii statistice

În activitatea economică se întâlnesc numeroase situaţii în care apare


necesitatea efectuării unor comparaţii între diverse fenomene sau procese
economice, ori în cadrul aceluiaşi fenomen, la momente diferite de timp.
Analiza comparativă reprezintă o componentă fundamentală a statisticii
economice, atât la nivel microeconomic, cât şi la nivel macroeconomic. Din
punct de vedere al metodelor utilizate, analiza comparativă are la bază testele
statistice de comparare a mediilor sau a varianţelor a două populaţii statistice.

114
Pentru compararea mediilor a două populaţii statistice se utilizează mai
multe tipuri de teste, în funcţie de informaţiile care se deţin despre varianţele
populaţiilor respective şi în raport de dimensiunile eşantioanelor avute al
dispoziţie, astfel:
I. Dacă varianţele celor două populaţii statistice (12, respectiv, 22)
sunt cunoscute şi volumele celor două eşantioane sunt mai mari de câte 30 de
unităţi fiecare (n1  30 şi n2  30), înseamnă că testul are le bază o repartiţie
normală centrată redusă (funcţia Laplace), iar compararea mediilor celor două
populaţii statistice va parcurge următoarele etape:
1. Se formulează ipoteza nulă, conform căreia mediile celor două
populaţii statistice sunt egale: H0: m1 = m2, cu ipoteza alternativă (testul este
bilateral): H1: m1  m2;
2. Se stabileşte nivelul de semnificaţie al testului (regiunea de respingere
a ipotezei nule), . Similar cu testele de verificare a ipotezelor referitoare la
medie sau la varianţă, şi în cazul testelor de comparare a două medii nivelul de
semnificaţie se alege, de regulă, ca fiind  = 0,05 (sau 5%);
3. Se determină valoarea calculată (numerică) a testului Laplace (zc), după
relaţia:

x1  x2
zc  (7.8)
 12  22

n1 n2

4. Din tabelele statistice aferente funcţiei Laplace (anexa 1) se obţine, în


funcţie de nivelul de semnificaţie,  = 1 – 2(z), valoarea critică (tabelară) a
testului (z);
5. Se compară valoarea calculată a testului cu cea critică şi se ia decizia
de acceptare sau de respingere a ipotezei nule, astfel:
– dacă valoarea calculată este mai mică sau egală cu valoarea critică (zc 
z), atunci ipoteza nulă H0 se acceptă şi se poate spune cu probabilitatea p = 1 –
 că mediile celor două populaţii statistice studiate, m1, respectiv, m2 sunt
egale, eventualele diferenţe fiind întâmplătoare;
– dacă valoarea calculată este mai mare decât valoarea critică (zc  z),
atunci ipoteza nulă H0 se respinge şi se poate spune cu probabilitatea p = 1 – 
că mediile celor două populaţii statistice, m1 şi m2, diferă semnificativ una de
cealaltă.
II. Dacă varianţele celor două populaţii statistice (12, respectiv, 22)
nu sunt cunoscute (cazul cel mai frecvent în practica economică), iar volumele

115
celor două eşantioane sunt mai mici de câte 30 de unităţi fiecare (n1  30 şi n2 
30), înseamnă că testarea sa va realiza cu ajutorul repartiţiei student.
Deoarece varianţele nu sunt cunoscute şi nu se ştie dacă ele sunt egale sau
diferite, înainte de a începe testul student de comparare a mediilor, trebuie să se
efectueze un test Fisher (F) de comparare a varianţelor a două populaţii
statistice, care presupune parcurgerea următoarelor etape:
1. Se formulează ipoteza nulă, conform căreia varianţele celor două
populaţii statistice sunt egale: H0: 12 =22, cu ipoteza alternativă: H1: 12  22;
2. Se stabileşte nivelul de semnificaţie al testului  = 1 – p;
3. Se determină valoarea calculată a testului Fisher, ca raport al
estimatorilor varianţelor, calculaţi pe baza eşantioanelor (s12, respectiv, s22),
conform relaţiei:

s12
F 2 (7.9)
s2

Cu specificaţia că, la numărător se găseşte întotdeauna valoarea cea mai


mare dintre cele două, adică f este întotdeauna supraunitar (f 1);
4. Din tabelele aferente repartiţiei Fisher (anexa 4), se alege o valoare
critică (f1;2;) în funcţie de 1 = n1 – 1 şi 2 = n2 – 1 grade de libertate şi de
nivelul de semnificaţie ;
5. Se compară valoarea calculată a testului cu cea critică şi se ia decizia
de acceptare sau de respingere a ipotezei nule, în funcţie de situaţie:
– dacă valoarea calculată este mai mică sau egală cu valoarea critică (f 
f1;2;), atunci ipoteza nulă H0 se acceptă şi se poate spune cu probabilitatea p =
1 –  că varianţele celor două populaţii statistice studiate, 12, respectiv, 22
sunt egale, eventualele diferenţe fiind întâmplătoare;
– dacă valoarea calculată este mai mare decât valoarea critică (f  f1;2;),
atunci ipoteza nulă H0 se respinge şi se poate spune cu probabilitatea p = 1 – 
că varianţele celor două populaţii statistice, 12 şi 22, diferă semnificativ una de
cealaltă.
În urma efectuării testului Fisher de comparare a varianţelor celor două
populaţii statistice, se cunoaşte dacă acestea sunt egale sau diferite, astfel încât
testul de comparare a mediilor poate fi parcurs în una din cele două variante:
II-a) dacă varianţele celor două populaţii statistice sunt egale (12 = 22)
atunci testul student presupune următoarele etape:
1. Se formulează ipoteza nulă, conform căreia mediile celor două
populaţii statistice sunt egale: H0: m1 = m2, cu ipoteza alternativă (testul este
bilateral): H1: m1  m2;

116
2. Se stabileşte nivelul de semnificaţie al testului (regiunea de respingere
a ipotezei nule),  = 1 – p;
3. Se determină valoarea calculată a testului Student (tc), după relaţia:

x1  x2
tc  (7.10)
1 1
s 
n1 n2

n1  1  s12  n2  1  s22


Unde: s  , în care s12 şi s22 sunt estimatorii
n1  n2  2
varianţelor, determinaţi la nivel de eşantion.
4. Din tabelele statistice aferente repartiţiei Student (anexa 2) se obţine, în
funcţie de nivelul de semnificaţie /2 şi de  = n1 + n2 – 2 grade de libertate,
valoarea critică a testului (t/2;);
5. Se compară valoarea calculată a testului cu cea critică şi se ia decizia
de acceptare sau de respingere a ipotezei nule, astfel:
– dacă valoarea calculată este mai mică sau egală cu valoarea critică (tc 
t/2;), atunci ipoteza nulă H0 se acceptă şi se poate spune cu probabilitatea p = 1
–  că mediile celor două populaţii statistice studiate, m1, respectiv, m2 sunt
egale, eventualele diferenţe fiind întâmplătoare;
– dacă valoarea calculată este mai mare decât valoarea critică (tc  t/2;),
atunci ipoteza nulă H0 se respinge şi se poate spune cu probabilitatea p = 1 – 
că mediile celor două populaţii statistice, m1 şi m2, diferă semnificativ una de
cealaltă.
II-b) dacă varianţele celor două populaţii statistice sunt diferite (12 
2 ) atunci testul student de comparare a mediilor va presupune parcurgerea
2

următoarelor etape:
1. Se formulează ipoteza nulă, conform căreia mediile celor două
populaţii statistice sunt egale: H0: m1 = m2, cu ipoteza alternativă: H1: m1  m2;
2. Se stabileşte nivelul de semnificaţie al testului,  = 1 – p;
3. Se determină valoarea calculată a testului student (tc), după relaţia:

x1  x2
tc  (7.11)
s12 s22

n1 n2

117
4. Din tabelele statistice aferente repartiţiei Student (anexa 2) se obţine
valoarea critică a testului (t/2;), în funcţie de nivelul de semnificaţie /2 şi de
 grade de libertate, determinate conform relaţiei:

1
  , (7.12)
c2


1  c  2

n1  1 n2  1

s12 / n1
în care: c 2 (7.13)
s1 / n1  s22 / n2

5. Se compară valoarea calculată a testului cu cea critică şi se ia decizia


de acceptare sau de respingere a ipotezei nule, astfel:
– dacă valoarea calculată este mai mică sau egală cu valoarea critică (tc 
t/2;), atunci ipoteza nulă H0 se acceptă şi se poate spune cu probabilitatea p = 1
–  că mediile celor două populaţii statistice studiate, m1, respectiv, m2 sunt
egale, eventualele diferenţe fiind întâmplătoare;
– dacă valoarea calculată este mai mare decât valoarea critică (tc  t/2;),
atunci ipoteza nulă H0 se respinge şi se poate spune cu probabilitatea p = 1 – 
că mediile celor două populaţii statistice, m1 şi m2, diferă semnificativ una de
cealaltă.

PROBLEME REZOLVATE

Exemplul 7.1.
Capacitatea nominală de producţie a unei linii tehnologice este de 75 tone/zi.
Datorită factorilor aleatori care acţionează de-a lungul procesului de producţie,
valorile reale ale producţiei se abat în plus sau în minus faţă de capacitatea
nominală. Pentru a controla producţia obţinută, s-a verificat linia tehnologică,
timp de 60 de zile, alese aleator, şi s-au obţinut următoarele date:

Tabelul 7.1
77,5 73,4 76,9 78,7 74,6 79,4 77,5 71,6 77,6 77,8
69,9 75,4 77,6 73,6 77,9 71,7 69,8 70,3 73,3 71,7
70,6 74,8 76,1 70,4 78,1 77,5 78,7 74,6 73,1 74,5
77,5 73,3 76,7 78,5 73,6 77,3 75,5 71,6 74,6 74,8
69,7 75,3 75,6 73,6 75,7 71,7 77,8 77,3 73,4 71,5
71,3 73,8 76,1 70,3 78,1 77,5 78,5 73,6 73,7 73,5

118
Presupunând că, din experienţa anterioară, se cunoaşte varianţa procesului
de producţie, 2 = 10, se cere să se verifice, cu o probabilitate de 95%, dacă
media producţiei realizate efectiv (m) respectă capacitatea nominală de
producţie (m0).
Se determină, într-o primă fază, media de selecţie ( x ) şi abaterea
standard a populaţiei statistice (), astfel:

x i
4486
x i 1
  74 ,76 tone/zi , iar    2  10  3,16
n 60

Apoi, se parcurg etapele testului Laplace, după cum urmează:


1. Se formulează ipoteza nulă, conform căreia media producţiei efectiv
realizate este egală cu capacitatea nominală de producţie: H0: m = m0 = 75 tone,
cu ipoteza alternativă: H1: m  75 tone;
2. Se stabileşte nivelul de semnificaţie:  = 1 – p = 0,05;
3. Se determină valoarea calculată a testului Laplace, conform relaţiei 7.2,
astfel:

74 ,76  75
zc  60  0 ,588
3,16

4. Din tabelele statistice aferente funcţiei Laplace (anexa 1), se alege


valoarea critică z , în funcţie de  = 1 – 2(z): z = 1,96;
5. Se compară valoarea calculată cu cea critică şi se observă că zc  z ,
de unde rezultă că se poate spune cu probabilitatea de 95% că media producţiei
efectiv realizate nu diferă semnificativ de capacitatea nominală, eventualele
diferenţe fiind cu totul întâmplătoare. Procesul de producţie se desfăşoară, deci,
în condiţii optime şi nu sunt necesare intervenţii de corectare a acestuia.

Exemplul 7.2.
Diametrul unui reper component al unui utilaj trebuie să fie de 100 milimetri.
Datorită factorilor aleatori care acţionează în procesul de fabricaţie, valorile
reale ale diametrului reperului se abat în plus sau în minus faţă de valoarea
standard. Pentru a controla calitatea reperelor realizate, s-au ales aleator 20
dintre ele şi s-au obţinut următoarele date:

119
Tabelul 7.2
100,7 100,9 99,2 101,3 98,9 100,5 100 99,4 99,1 100,8
98,7 101,1 100 100,4 100,7 99,3 98,8 99,3 100 101,2

Presupunând că, din experienţa anterioară, se cunoaşte varianţa procesului


de producţie, 2 = 0,8 , se cere să se verifice, cu o probabilitate de 95%, dacă
media diametrelor reperelor fabricate (m) respectă diametrul standard cerut
(m0).
Se determină, într-o primă fază, media de selecţie ( x ) şi abaterea
standard a populaţiei statistice ():

x
i 1
i
2000 ,3
x   100 ,015 mm , iar
n 20
   2  0 ,8  0 ,894 mm

Apoi, se parcurg etapele testului student, astfel:


1. Se formulează ipoteza nulă, conform căreia media diametrelor
reperelor realizate este egală cu diametrul standard: H0: m = m0 = 100
milimetri, cu ipoteza alternativă: H1: m  100 milimetri;
2. Se stabileşte nivelul de semnificaţie:  = 1 – p = 0,05;
3. Se determină valoarea calculată a testului student:

100 ,015  100


tc  20  0 ,075
0 ,894

4. Din tabelele statistice aferente repartiţiei Student (anexa 2), se alege


valoarea critică t/2; , în funcţie de /2 = 0,025 şi  = n – 1 = 19. Rezultă
t0,025;19 = 2,093;
5. Se compară valoarea calculată cu cea critică şi se observă că tc  t0,025;19
, de unde rezultă că se poate spune cu probabilitatea de 95% că media
diametrelor reperelor realizate nu diferă semnificativ de dimensiunea standard,
eventualele diferenţe fiind cu totul întâmplătoare.

120
Exemplul 7.3.
Se consideră datele de la exemplul 7.2, cu diferenţa că varianţa populaţiei
statistice nu este cunoscută.
În aceste condiţii, se determină, mai întâi, media de selecţie ( x = 100,
015 milimetri) şi estimatorul abaterii standard a populaţiei statistice (s),
conform relaţiei 7.4, astfel:

14,305
s  0 ,867
19

Apoi, se parcurg etapele testului student:


1. Se formulează ipoteza nulă, conform căreia media diametrelor
reperelor realizate este egală cu diametrul standard: H0: m = m0 = 100
milimetri, cu ipoteza alternativă: H1: m  100 milimetri;
2. Se stabileşte nivelul de semnificaţie:  = 1 – p = 0,05;
3. Se determină valoarea calculată a testului Student, conform relaţiei 7.5:

100 ,015  100


tc  20  0 ,077
0 ,867

4. Din tabelele statistice aferente repartiţiei Student (anexa 2), se alege


valoarea critică t/2; , în funcţie de /2 = 0,025 şi  = n – 1 = 19: t0,025;19 =
2,093;
5. Se compară valoarea calculată cu cea critică şi se observă că tc  t0,025;19
, de unde rezultă că, şi de această dată, se poate spune cu probabilitatea de 95%
că media diametrelor reperelor realizate nu diferă semnificativ de dimensiunea
standard, eventualele diferenţe fiind cu totul întâmplătoare.

Exemplul 7.4.
Se consideră datele de la exemplul 7.2 (varianţa populaţiei statistice nu
este cunoscută) şi se cere să se verifice cu o probabilitate de 95% dacă varianţa
diametrelor reperelor fabricate este de 02 = 2.
Pentru aceasta, se determină, mai întâi, estimatorul varianţei populaţiei
statistice (s2), astfel:

14 ,305
s2   0 ,752
19

121
Apoi, se parcurg etapele testului 2:
1. Se formulează ipoteza nulă, conform căreia varianţa diametrelor
reperelor realizate, 2, ia valoarea presupusă: H0: 2 = 02 = 2, cu ipoteza
alternativă: H1: 2  2;
2. Se stabileşte nivelul de semnificaţie:  = 1 – p = 0,05;
3. Se determină valoarea calculată a testului 2, conform relaţiei 7.7:

20  1  0 ,752
c2   7 ,144
2
4. Din tabelele statistice aferente repartiţiei 2 (anexa 3) se aleg, în funcţie
de nivelul de semnificaţie  şi de  = n – 1 grade de libertate, cele două valori
critice: 20,975;19 = 8,91 şi 20,025;19 = 32,85;
5. Se compară valoarea calculată cu cea critică şi se observă că c2 
[8,91; 32,85], ceea ce înseamnă că ipoteza nulă H0 se respinge şi se poate spune
cu probabilitatea de 95% că varianţa diametrelor reperelor realizate, 2, diferă
semnificativ de 2.

Exemplul 7.5.
O firmă a lansat o campanie promoţională cu ajutorul mijloacelor mass-media şi
doreşte să studieze impactul acesteia asupra vânzărilor obţinute. În acest sens, s-
au înregistrat aleator vânzările în 40 de zile înainte de campanie (x1), respectiv,
în 40 de zile de după aceasta (x2), obţinându-se următoarele date (mil. lei):

Tabelul 7.5
X1 86,7 88,9 84,6 83,1 79,8 80,4 81,2 78,5 85,5 86,2
84,6 81,3 82,9 78,4 81,9 82,9 77,6 80,9 83,7 88,4
80,1 87,4 83,2 81,5 83,3 84,2 81,3 82,6 84,1 85,2
78,5 82,2 79,4 80,4 81,6 79,4 80,5 81,7 81,6 82,4
X2 85,4 87,9 88,4 89,4 91,2 85,3 84,3 88,7 87,9 85,9
86,4 87,8 89,5 83,4 86,4 82,3 83,9 79,7 87,6 86,3
87,3 83,4 87,6 79,4 83,3 81,9 88,4 82,4 85,2 81,4
81,2 84,2 81,7 88,6 84,5 78,7 82,7 83,6 86,4 79,6

Dacă se ştie că varianţa vânzărilor înainte de campania promoţională a


fost 12 = 8, iar după aceasta a fost 22 = 5, se cere să se determine cu
probabilitatea de 95% dacă politica promoţională a firmei a influenţat
semnificativ sau nu vânzările, prin compararea mediilor celor două populaţii
statistice.

122
Trebuie să se determine, în primul rând, mediile celor două eşantioane
( x1 şi x2 ):

3298 ,1 3399 ,2
x1   82 ,45 mil. lei şi x2   84 ,98 mil. lei
40 40

Apoi, se parcurg etapele testului laplace de comparare a mediilor a două


populaţii statistice:
1. Se formulează ipoteza nulă, conform căreia mediile celor două
populaţii statistice sunt egale: H0: m1 = m2, cu ipoteza alternativă (testul este
bilateral): H1: m1  m2. Aceasta înseamnă că se porneşte de la presupunerea că
politica promoţională a firmei nu a influenţat semnificativ vânzările.
2. Se stabileşte nivelul de semnificaţie al testului,  = 1 – p = 0,05;
3. Se determină valoarea calculată a testului Laplace, conform relaţiei 7.8,
astfel:

82 ,45  84 ,98
zc   4 ,433
8 5

40 40

4. Din tabelele statistice aferente funcţiei Laplace (anexa 1), se alege


valoarea critică z , în funcţie de  = 1 – 2(z): z = 1,96;
5. Se compară valoarea calculată a testului cu cea critică şi se observă că
valoarea calculată este mai mare decât valoarea critică (zc  z), rezultă că
ipoteza nulă H0 se respinge şi se poate spune cu probabilitatea de 95% că
mediile celor două populaţii statistice diferă semnificativ. Acest lucru înseamnă
că politica promoţională a firmei a avut efecte importante, înregistrându-se
modificări esenţiale în nivelul vânzărilor realizate.

Exemplul 7.6.
O companie a lansat o nouă linie de produse şi doreşte să studieze impactul
acesteia asupra vânzărilor totale obţinute. În acest sens, s-au înregistrat aleator
vânzările în 20 de zile înainte de lansare (X1), respectiv, în 20 de zile de după
aceasta (X2), obţinându-se următoarele date (mil. lei):

123
Tabelul 7.6
X1 53,7 55,9 54,6 53,1 59,5 50,4 51,2 51,2 55,5 56,2
54,6 51,3 52,9 55,4 51,9 52,9 57,6 55,9 53,7 55,4
X2 55,4 57,9 55,4 59,4 61,2 55,3 54,3 55,7 57,9 55,9
56,4 57,5 59,5 53,4 56,4 52,3 53,9 59,7 57,6 56,3

Se cere să se determine cu probabilitatea de 95% dacă lansarea noii linii


de produse a influenţat semnificativ vânzările totale ale firmei, prin compararea
mediilor şi varianţelor celor două populaţii statistice.
Deoarece varianţele celor două populaţii statistice nu sunt cunoscute, se
începe prin a efectua un test fisher de comparare a varianţelor, astfel:
Se calculează mai întâi mediile de selecţie ( x1 , x2 ) şi estimatorii
varianţelor la nivel de eşantion (s12, s22):

n1 n2

x 1i x 2i
x1  i 1
 54 ,14 mil. lei şi x2  i 1
 56 ,57 mil. lei,
n1 n2

 x1i  x1 2
n

 x  x2 
2
2i

respectiv, s12  i 1
 5 ,55 şi s22  i 1
 5 ,23
n1  1 n2  1

Apoi, se parcurg etapele testului F, după cum urmează:


1. Se formulează ipoteza nulă, conform căreia varianţele celor două
populaţii statistice sunt egale: H0: 12 =22, cu ipoteza alternativă: H1: 12  22;
2. Se stabileşte nivelul de semnificaţie al testului,  = 1 – p = 0,05;
3. Se determină valoarea calculată a testului Fisher, conform relaţiei 7.9,
astfel:

5 ,55
F  1,059
5 ,23

4. Din tabelele aferente repartiţiei fisher (anexa 4), se alege valoarea


critică, în funcţie de 1 = n1 – 1 = 19 şi 2 = n2 – 1 = 19 grade de libertate şi de
nivelul de semnificaţie  = 0,05: F19;19;0,05 = 2,15;

124
5. Se compară valoarea calculată cu cea critică şi se observă că F 
F19;19;0,05, de unde rezultă că ipoteza nulă H0 se acceptă şi se poate spune cu
probabilitatea de 95% că varianţele celor două populaţii statistice studiate, 12,
respectiv, 22 sunt egale, eventualele diferenţe fiind întâmplătoare.
Astfel, în urma efectuării testului fisher de comparare a varianţelor celor
două populaţii statistice, s-a ajuns la concluzia că acestea sunt egale (12 = 22),
ceea ce înseamnă că testul student de comparare a mediilor poate fi parcurs în
varianta II-a):
1. Se formulează ipoteza nulă, conform căreia mediile celor două
populaţii statistice sunt egale: H0: m1 = m2, cu ipoteza alternativă: H1: m1  m2;
2. Se stabileşte nivelul de semnificaţie al testului,  = 1 – p = 0,05;
3. Se determină valoarea calculată a testului Student, conform relaţiei
7.10, astfel:

19  5 ,55  19  5 ,23 204 ,82


s   5 ,68
19  19  2 36

54 ,14  56 ,57 2 ,43


tc    1,31
1 1 1,84
5 ,68  
19 19

4. Din tabelele statistice aferente repartiţiei Student (anexa 2) se obţine, în


funcţie de nivelul de semnificaţie /2 = 0,025 şi de  = n1 + n2 – 2 = 36 grade
de libertate, valoarea critică a testului: t0,025;36 = 2,028;
5. Se compară valoarea calculată a testului cu cea critică şi se observă că
tc  t0,025;36 de unde rezultă că ipoteza nulă H0 se acceptă şi se poate spune cu
probabilitatea de 95% că mediile celor două populaţii statistice studiate, m1,
respectiv, m2 sunt egale, eventualele diferenţe fiind întâmplătoare. Acest lucru
înseamnă că introducerea noii linii de produse nu a determinat efecte
semnificative în vânzările totale, nici în ceea ce priveşte fluctuaţiile (varianţele
sunt egale) şi nici în ceea ce priveşte mediile realizate (şi acestea sunt egale).

Exemplul 7.7. Un institut de cercetări doreşte să studieze dacă nivelurile


veniturilor medii pe familie în două judeţe învecinate (V1, respectiv V2) sunt
egale sau nu. În acest scop, s-au înregistrat veniturile medii (mil. lei) a câte 30
de categorii de familii din fiecare din cele două judeţe, astfel:

125
Tabelul 7.7
V1 7,32 8,56 6,59 10,45 8,79 9,47 7,06 5,48 9,33 10,89
11,50 9,47 15,36 8,56 9,50 7,65 4,32 12,36 10,45 11,57
8,93 9,00 7,82 9,84 15,25 16,57 9,67 11,38 8,64 9,81
V2 8,54 7,63 8,38 12,49 11,38 6,91 8,09 5,92 6,48 7,29
9,52 14,83 15,87 9,25 10,50 17,56 20,21 8,56 12,28 8,80
7,53 12,57 11,28 14,82 13,55 12,96 19,50 6,51 5,54 6,25

Se cere să se determine cu probabilitatea de 95% dacă există diferenţe


semnificative între veniturile medii pe familie ale celor două judeţe, prin
compararea mediilor şi varianţelor populaţiilor statistice.
Deoarece, nici în acest caz, varianţele celor două populaţii statistice nu
sunt cunoscute, se începe prin efectuarea unui test Fisher de comparare a
varianţelor (12 şi 22), astfel:
Se calculează mai întâi mediile de selecţie ( x1 , x2 ) şi estimatorii
varianţelor la nivel de eşantion (s12, s22):

n1 n2

 x1i x 2i
x1  i 1
 9 ,72 mil. Lei şi x2  i 1
 10 ,7 mil. Lei,
n1 n2

 x  x2 
n

 x1i  x1 
2 2
2i

respectiv, s1 
i 1
 7 ,31 şi s2  i 1
 16 ,47
2 2

n1  1 n2  1

Având la dispoziţie aceste date, se parcurg etapele testului F, astfel:


1. Se formulează ipoteza nulă, conform căreia varianţele celor două
populaţii statistice sunt egale: H0:12 = 22, cu ipoteza alternativă: H1: 12  22;
2. Se stabileşte nivelul de semnificaţie al testului,  = 1 – p = 0,05;
3. Se determină valoarea calculată a testului Fisher, conform relaţiei 7.29:

16 ,47
F  2 ,25
7 ,31

4. Din tabelele aferente repartiţiei Fisher (anexa 4), se alege valoarea


critică, în funcţie de 1 = n1 – 1 = 29 şi 2 = n2 – 1 = 29 grade de libertate şi de
nivelul de semnificaţie  = 0,05: F29;29;0,05 = 2,16;

126
5. Se compară valoarea calculată cu cea critică şi se observă că F 
F19;19;0,05 de unde rezultă că ipoteza nulă h0 se respinge şi se poate spune cu
probabilitatea de 95% că varianţele celor două populaţii statistice studiate, 12
şi 22 diferă semnificativ una de cealaltă.
Astfel, în urma efectuării testului Fisher de comparare a varianţelor celor
două populaţii statistice, s-a ajuns la concluzia că acestea sunt diferite (12 
22), ceea ce înseamnă că testul Student de comparare a mediilor trebuie parcurs
în varianta II-b), după cum urmează:
1. Se formulează ipoteza nulă, conform căreia mediile celor două
populaţii statistice sunt egale: H0: m1 = m2, cu ipoteza alternativă: H1: m1  m2;
2. Se stabileşte nivelul de semnificaţie al testului,  = 1 – p = 0,05;
3. Se determină valoarea calculată a testului Student, conform relaţiei
7.11, astfel:

9 ,72  10 ,7 0 ,979
tc    1,081
7 ,31 16 ,47 0 ,905

29 29

4. Se determină, mai întâi, gradele de libertate aferente:

s12 / n1
c  0 ,307 
s12 / n1  s22 / n2

1
   28
c 2


1  c  2

n1  1 n2  1

Apoi, din tabelele statistice aferente repartiţiei Student (anexa 2) se


obţine, în funcţie de nivelul de semnificaţie /2 = 0,025 şi de  = 28 grade de
libertate, valoarea critică a testului: t0,025;28 = 2,048;
5. Se compară valoarea calculată a testului cu cea critică şi se observă că
tc  t0,025;28 de unde rezultă că ipoteza nulă H0 se acceptă şi se poate spune cu
probabilitatea de 95% că mediile celor două populaţii statistice studiate, m1 şi
m2 sunt egale, eventualele diferenţe fiind întâmplătoare. Acest lucru înseamnă
că între cele două judeţe învecinate nu există diferenţe semnificative în ceea ce
priveşte venitul mediu pe familie. Singurele deosebiri se referă la fluctuaţia
(varianţa) venitului mediu, judeţul al doilea înregistrând fluctuaţii mai mari,

127
adică o gamă de venituri mai eterogenă decât primul, aceasta însemnând
diferenţieri mai accentuate între diferitele categorii de familii analizate.

PROBLEME PROPUSE

1. O companie a lansat o nouă linie de produse şi doreşte să studieze impactul


acesteia asupra vânzărilor. În acest scop s-au ales aleator câte 9 săptămâni
înainte (x1), respectiv după lansare (x2), obţinându-se următoarele date (mil.
Lei):

X1 430.2 441.3 428.9 425.6 431.8 433.8 439.1 437.7 440.2


X2 429.4 438.2 448.1 436.7 439.8 429.7 442.5 441.8 437.9

Se cere:
a) să se determine cu o probabilitate de 95% dacă media vânzărilor de după
lansarea noilor produse (x2) este m0 = 440 mil. Lei, şi dacă varianţa acestora
este 02 = 35 utilizând testele z, t şi 2.
b) Să se determine cu aceeaşi probabilitate de 95% dacă lansarea noii linii de
produse a influenţat sau nu vânzările, comparând mediile şi varianţele celor
două populaţii statistice, utilizând testele z, t şi f.

2. O firmă a lansat o campanie promoţională şi doreşte să studieze impactul


acesteia asupra vânzărilor. În acest scop au fost alese aleator 15 săptămâni
înainte de campanie (v1), respectiv după aceasta (v2), obţinându-se următoarele
date (mil. Lei):

128
V1 V2
125,8 131,3
131,1 130,9
129,7 132,5
131,3 133,3
135,2 137,1
138,1 139,8
126,9 130,7
128,3 132,6
130,6 131,3
132,5 137,5
133,3 138,4
136,2 139,1
127,7 138,7
129,6 132,9
133,4 137,3

Se cere să se verifice cu o probabilitate de 95% dacă politica


promoţională a influenţat sau nu vânzările, comparând mediile şi varianţele
celor două populaţii statistice.

129
130
CAPITOLUL 8

INDICATORI ŞI INDICI STATISTICI

Seriile de date pot fi ajustate statistic cu ajutorul unui sistem de indicatori


absoluţi, relativi şi medii, simpli sau compuşi, care împreună permit
caracterizarea evoluţiei fenomenelor sau proceselor economice prin
interpretarea tendinţei obiective de dezvoltare în fiecare etapă analizată.
Determinarea corectă a acestui sistem de indicatori presupune, în
principal, alegerea unei baze de referinţă adecvate, în raport cu care este
studiată evoluţia fenomenului. Pentru seriile de intervale, această bază de
referinţă este constituită dintr-o perioadă de timp (zi, lună, an etc.), în timp ce
pentru seriile de momente, baza de referinţă este un moment dat (de exemplu,
data de 1 ianuarie 2007).
În funcţie de modalitatea de analiză aleasă, baza de referinţă poate fi:
 bază fixă, adică un nivel de referinţă neschimbat de-a lungul întregii
analize. Baza fixă de referinţă este, de regulă, valoarea caracteristicii
studiate înregistrată în prima perioadă de analiză (y1), dar poate fi ales
orice alt moment sau perioadă de pe parcursul seriei de date;
 bază mobilă (în lanţ), care reprezintă un nivel de referinţă mobil ce se
deplasează în timp simultan cu perioada la care se referă indicatorul.
De obicei, baza de comparare în acest caz este nivelul înregistrat în
perioada imediat anterioară (se compară yt cu yt-1).
Sistemul de indicatori statistici ai seriilor de timp constă în:
1. Indicatori simpli ai nivelului şi ai variaţiei unui fenomen în timp:
a) Indicatori exprimaţi în mărimi absolute
b) Indicatori exprimaţi în mărimi relative
c) Indicatori medii ai seriilor de timp
2. Indicatori agregaţi (de grup)

131
8.1. Indicatori ai nivelului şi ai variaţiei unui fenomen în timp

Aceşti indicatori redau starea fenomenului studiat într-o anumită perioadă


de timp sau modificările de nivel (variaţiile) survenite în decursul timpului. Ei
se grupează în două tipuri de indicatori, şi anume, indicatori de nivel, care arată
mărimea, valoarea variabilei studiate în unitatea de timp sau la un moment dat şi
indicatori ai variaţiei, care arată cuantumul modificării în timp a nivelului
caracteristicii studiate.
În cadrul indicatorilor de nivel se pot întâlni fie indicatori absoluţi
(nivelul absolut şi volumul absolut), fie indicatori medii, iar în cadrul
indicatorilor variaţiei se găsesc atât indicatori absoluţi (sporul absolut), cât şi
indicatori relativi şi medii.

8.1.1. Indicatori exprimaţi în mărimi absolute

Această categorie de indicatori ai nivelului şi ai variaţiei unui fenomen


sau proces economic exprimă, în unităţile de măsură ale variabilei studiate,
19
nivelul sau modificările de nivel ale acesteia pe o anumită perioadă de timp.
Indicatorii absoluţi sunt:
a) Nivelurile absolute ale termenilor seriei;
b) Nivelul total al termenilor seriei (volumul absolut);
c) Sporul absolut (modificarea, creşterea sau descreşterea absolută).
a) Nivelul absolut (yi) reprezintă indicatorul de nivel care arată valoarea
absolută a fiecărui termen al seriei în parte (de exemplu, cifra de afaceri a unei
firme pe anul 2003 a fost de 1 miliard lei, adică y2003 = 1 mld. lei). Pentru seriile
de intervale, nivelul absolut se referă la o perioadă de timp, iar pentru seriile de
momente, nivelul absolut se referă la un moment dat.
b) Volumul absolut (V) este indicatorul de nivel care arată suma tuturor
nivelurilor absolute ale seriei de date. Având în vedere faptul că o serie de timp
care redă evoluţia unei variabile economice Y pe o anumită perioadă de timp t1,
t2, …, tn poate fi reprezentată conform relaţiei 6.1, volumul absolut poate fi
determinat astfel:

n
V   yi (8.1)
i 1

19
C. Şipoş, C. Preda, Statistică economică, Editura Mirton, Timişoara, 2004, pag. 182 – 184

132
c) Sporul absolut () reprezintă indicatorul variaţiei care arată cu cât s-
a modificat, în mărimi absolute, fenomenul studiat de la o perioadă la alta. În
statistica economică, sporul absolut poate fi interpretat ca o creştere absolută
sau excedent, ori ca o scădere absolută, care uneori poate avea sensul de deficit,
iar alteori pate însemna economie de resurse. Interpretarea economică a acestui
indicator se realizează în funcţie de conţinutul şi de tendinţa obiectivă de
evoluţie a variabilei studiate.
Determinarea sporului absolut diferă în funcţie de modalitatea de stabilire
a bazei de referinţă, astfel:
– Sporul absolut cu bază fixă (i/1) reprezintă diferenţa dintre un termen
oarecare al seriei (yi) şi nivelul absolut luat ca bază de referinţă, care de obicei
este termenul iniţial al seriei (y1), conform relaţiei:

i/1 = yi – y1 (8.2)

– Sporul absolut cu bază mobilă sau în lanţ (i/i-1) reprezintă diferenţa


dintre un termen oarecare al seriei (yi) şi nivelul absolut al termenului din
perioada imediat anterioară (yi-1), astfel:

i/i-1 = yi – yi-1 (8.3)

Între cele două categorii de sporuri există următoarele relaţii:


1. Suma sporurilor absolute cu bază mobilă este egală cu sporul absolut
cu bază fixă aferent ultimului termen al seriei de timp, după relaţia:

n
 i / i1  n / 1 (8.4)
i 2

2. Diferenţa dintre două sporuri absolute cu bază fixă consecutive este


egală cu sporul absolut cu bază mobilă corespunzător, astfel:

i/1 – i-1/1 = i/i-1 (8.5)

Aceste relaţii au utilitate atunci când nu se cunosc nivelurile absolute ale


termenilor seriei de timp, ci numai sporurile cu bază fixă sau mobilă. De
asemenea, cu ajutorul acestor relaţii se poate verifica exactitatea calculelor
efectuate.

133
8.1.2. Indicatori exprimaţi în mărimi relative

Această a doua categorie de indicatori ai nivelului şi ai variaţiei unui


fenomen sau proces economic în timp exprimă variaţiile de nivel ale variabilei
studiate pe o anumită perioadă de timp, calculate fie procentual, fie sub formă
de coeficienţi.
Indicatorii relativi sunt:
a) Ritmul sau indicele de variaţie;
b) Ritmul sporului (al dinamicii);
a) Ritmul sau indicele de variaţie (Ii) este un indicator de variaţie care
arată de câte ori a crescut sau a scăzut nivelul unui fenomen înregistrat într-o
anumită perioadă sau moment, faţă de nivelul de referinţă.
În funcţie de baza de referinţă aleasă, se disting:
– Indicele de variaţie cu bază fixă (Ii/1), care reprezintă raportul dintre
nivelul absolut al unui termen oarecare al seriei (yi) şi nivelul absolut luat ca
bază de referinţă, de obicei, termenul iniţial al seriei (y1). El poate fi exprimat
fie sub formă de coeficient, fie sub formă procentuală, conform relaţiilor:

yi y
Ii / 1  sau I %i / 1  i  100 (8.6)
y1 y1

– Indicele de variaţie cu bază mobilă sau în lanţ (Ii/i-1), care reprezintă


raportul dintre nivelul absolut al unui termen oarecare al seriei (yi) şi nivelul
absolut al termenului din perioada imediat anterioară (yi-1). Poate fi exprimat, de
asemenea, sub formă de coeficient sau procentual, astfel:

yi y
I i / i 1  sau I %i / i 1  i  100 (8.7)
yi 1 yi 1

Şi în cazul acestor indicatori relativi există anumite relaţii, care permit


trecerea de la o formă de exprimare la alta, după cum urmează:
1. Produsul indicilor de variaţie cu bază în lanţ este egal cu indicele de
variaţie cu bază fixă aferent ultimului termen al seriei, conform relaţiei:

134
n
 I i / i 1  I n / 1 (8.8)
i 2

2. Raportul a doi indici de variaţie cu bază fixă consecutivi este egal cu


indicele de variaţie cu bază mobilă corespunzător, după relaţia:

Ii / 1
 I i / i 1 (8.9)
I i 1 / 1

b) Ritmul sporului sau al dinamicii (Ri) este un indicator de variaţie


care arată cu cât a crescut sau a scăzut nivelul unui fenomen înregistrat într-o
anumită perioadă sau moment, faţă de nivelul de referinţă.
În funcţie de baza de referinţă aleasă, se disting:
– Ritmul sporului cu bază fixă (Ri/1), care reprezintă raportul dintre
sporul absolut cu bază fixă aferent fiecărei perioade a seriei (i/1) şi nivelul
absolut luat ca bază de referinţă (y1). El poate fi exprimat fie sub formă de
coeficient, fie sub formă procentuală, conform relaţiilor:

i / 1 yi  y1 yi
Ri / 1     1  I i / 1  1 sau
y1 y1 y1

i / 1 y  y1 y
R%i / 1   100  i  100  i  100  100  I %i / 1  100 (8.10)
y1 y1 y1

– Ritmul sporului cu bază mobilă sau în lanţ (Ri/i-1), care reprezintă


raportul dintre sporul absolut cu bază mobilă aferent fiecărei perioade a seriei
(i/i-1) şi nivelul absolut al termenului din perioada imediat anterioară (yi-1).
Poate fi exprimat, de asemenea, sub formă de coeficient sau procentual, astfel:

i / i1 yi  yi 1 y
Ri / i 1    i  1  I i / i 1  1 sau
yi 1 yi 1 yi 1

135
i / i1 yi  yi 1 y
R%i / i 1   100   100  i  100  100 
yi 1 yi 1 yi 1

 I %i / i1  100 (8.11)

La utilizarea acestor indicatori în cadrul analizei statistice, trebuie avut în


vedere faptul că, spre deosebire de ritmurile cu bază fixă, care sunt comparabile
între ele, având acelaşi numitor, ritmurile cu bază în lanţ nu pot fi comparate
direct, având numitor diferit. Din acest motiv, este necesar ca, pe baza
sporurilor absolute şi a ritmurilor sporului să se determine valoarea absolută a
20
unui procent de variaţie, astfel :
– Valoarea absolută a unui procent de variaţie cu bază fixă reprezintă
raportul dintre sporul absolut cu bază fixă şi ritmul sporului cu bază fixă
exprimat procentual, conform relaţiei:

i / 1 yi  y1 y
Ai / 1    1 (8.12)
R%i / 1 yi  y1
 100 100
y1

Acest indicator arată câte unităţi fizice revin unui procent de creştere în
perioada ti faţă de nivelul bazei de raportare menţinute constantă. Se observă că,
indiferent de perioada pentru care este calculată, valoarea absolută a unui
procent de variaţie cu bază fixă este aceeaşi, deoarece baza nu se modifică.
– Valoarea absolută a unui procent de variaţie cu bază mobilă (în lanţ)
reprezintă raportul dintre sporul absolut cu bază mobilă şi ritmul sporului cu
bază mobilă exprimat procentual, conform relaţiei:

i / i 1 yi  yi 1 y
Ai / i 1    i 1 (8.13)
R%i / i 1 yi  yi 1
 100 100
yi 1

20
C. Şipoş, C. Preda, op. cit., pag. 186 – 188

136
Acest indicator face legătura între indicatorii absoluţi şi cei relativi,
ajutând la interpretarea corectă a acestora.
Indicatorii absoluţi şi relativi prezentaţi mai sus se determină, în marea
lor majoritate, prin compararea termenilor individuali ai seriei de date, luaţi doi
câte doi. Astfel, aceşti indicatori arată nivelul şi gradul de variabilitate al tuturor
termenilor, influenţate de toate cauzele şi condiţiile ce determină evoluţia
fenomenului studiat. În caracterizarea fenomenelor şi proceselor economice
trebuie, însă, să se analizeze şi tendinţa de evoluţie a întregii serii de timp, care
apare ca rezultat al acţiunii factorilor esenţiali, prin anihilarea efectelor
factorilor întâmplători. Această problemă poate fi rezolvată cu ajutorul
indicatorilor medii.

8.1.3. Indicatori medii ai seriilor de timp

Indicatorii medii cuprind atât indicatori de nivel, cât şi indicatori ai


variaţiei. Indicatorii de nivel sunt nivelul mediu al termenilor seriei şi nivelul
mediu al sporului absolut, iar indicatorii variaţiei sunt indicele (ritmul) mediu al
variaţiei şi ritmul mediu al sporului.
a) Nivelul mediu ( y ) se calculează diferit în funcţie de tipul seriei de
timp studiate.
Astfel, în cazul seriilor de intervale, nivelul mediu se determină ca o
medie aritmetică simplă a termenilor seriei (yi), după relaţia:

n
 yi
y i 1
(8.14)
n

Acest nivel mediu reprezintă o valoare centrală pentru seriile de intervale


care au un trend crescător sau descrescător, respectiv un model tipic pentru
seriile staţionare.
Pentru seriile de momente, nivelul mediu se determină ca o medie
cronologică, simplă sau ponderată.
Media cronologică simplă se calculează atunci când momentele seriei
studiate sunt egal distanţate între ele, conform relaţiei:

137
y1 y
 y2  ...  yn1  n
y 2 2 (8.15)
n 1

Media cronologică ponderată se determină atunci când momentele seriei


studiate sunt inegal distanţate între ele, după relaţiile:

y1  y 2 y  y3 y  yn
t1  2 t 2  ...  n1 t n1
y 2 2 2 (8.16)
n 1
 ti
i 1

t1 t t t t t
y1  y2 1 2  ...  yn1 n2 n1  yn n1
y 2 2 2 2 (8.17)
n 1
 ti
i 1

unde: yi sunt termenii seriei de timp de momente;


ti reprezintă dimensiunea intervalelor dintre două momente consecutive.
b) Nivelul mediu al sporului absolut sau sporul mediu (  ) reflectă
variaţia medie pe unitate de timp înregistrată de variabila analizată într-o
anumită perioadă. Se calculează ca o medie a sporurilor absolute cu baza în lanţ,
conform relaţiei:

n
 i / i 1 y n  y1
  i 2  (8.18)
n 1 n 1

Determinarea sporului mediu poate avea relevanţă economică numai


atunci când sporurile absolute cu bază în lanţ nu diferă prea mult între ele. Dacă
în cadrul aceleiaşi serii de date se întâlnesc valori extreme, cu puncte de maxim
şi minim mult distanţate, atunci seria trebuie divizată în două sau mai multe
părţi, iar sporul mediu se calculează separat pentru fiecare parte.

138
c) Indicele sau ritmul mediu de variaţie ( I ) arată de câte ori s-a
modificat în medie nivelul unui fenomen pe o anumită perioadă de timp. De
obicei, el se calculează ca o medie geometrică a indicilor de variaţie cu bază în
lanţ, astfel:

n yn
I  n1  I i / i 1  n1 I n / 1  n1 (8.19)
i 2 y1

În cadrul acestei relaţii s-a folosit şi proprietatea conform căreia


produsul indicilor de variaţie cu bază în lanţ este egal cu indicele de variaţie cu
bază fixă aferent ultimului termen al seriei.
Valoarea indicelui mediu de variaţie, dacă ar substitui indicii cu bază în
n
lanţ, produsul acestora nu s-ar modifica (  I i / i 1  I
n 1
).
i 2
Metoda mediei geometrice, utilizată în calcului acestui indicator, prezintă
inconvenientul că ţine seama numai de valorile primului şi ultimului termen al
seriei, ignorându-se termenii intermediari. Acest lucru poate duce la rezultate
neconcludente, atunci când în interiorul seriei de timp se înregistrează oscilaţii
semnificative. Din acest motiv, au fost propuse, în literatura de specialitate, o
serie de alte metode, dintre care amintim: metoda mediei parabolice, metoda
trendului exponenţial, metoda autoregresiei.21
d) Ritmul mediu al sporului ( r ) arată, în mărime relativă, cu cât a
variat în medie fenomenul studiat într-o anumită perioadă. El se calculează pe
baza relaţiilor ce există între indicele de variaţie şi ritmul sporului (relaţiile 6.16
şi 6.17), care se păstrează şi în cazul indicatorilor medii, astfel:

r  I  1 sau, procentual r %  I  100  100 (8.20)

În concluzie, indicatorii statistici obţinuţi prin prelucrarea unei serii de


timp pot constitui un sistem unitar, în care fiecare indicator în parte permite
evidenţierea a câte unei trăsături specifice evoluţiei fenomenului sau procesului
economic studiat.

21
Elisabeta Jaba, Statistica, Editura Sedcom Libris, Iaşi, 1996, pag. 375 – 376

139
8.2. Indicatori statistici agregaţi

Indicatorii simpli, aşa cum s-a văzut până aici, studiază evoluţia în timp a
unei singure variabile economice. Uneori, această modalitate de analiză se
dovedeşte a fi insuficientă, datorită deosebitei complexităţi a unor fenomene sau
procese economice. Multe variabile economice sunt compuse dintr-o serie de
alte variabile, fiecare cu o anumită pondere.
În aceste condiţii, indicatorii simpli nu ilustrează suficient de complet
realitatea economică, fapt pentru care se apelează la indicatorii agregaţi sau de
grup.
Atunci când variabilele care compun fenomenul complex studiat se
îmbină în proporţii egale, indicatorul agregat se obţine prin raportarea sumelor
variabilelor, înregistrate în momentul iniţial (yi(0)) şi în momentul final (yi(t)),
conform relaţiei:

n
 yi
(t )

I (t )  i 1
n
 100 (8.21)
y
(0 )
i
i 1

Cel mai cunoscut indicator agregat cu ponderi egale este indicele de preţ
agregat neponderat (Ip(t))22, care se determină pe baza evoluţiei preţurilor unui
coş de produse cu ponderi egale. El se calculează cu formula:

n
 pi
(t )

I (pt )  i 1
n
 100 (8.22)
p
(0 )
i
i 1

22
M.L. Berenson, D.M. Levine, T.C. Krehbiel, Basic Business Statistics. Concepts and
Applications, Ninth Edition, Pearson Prentice Hall, 2004, pag. 679 – 681

140
unde t este perioada de timp studiată;
n reprezintă numărul total de bunuri ce compun coşul de produse analizat;
n
 pi
(t )
e suma preţurilor plătite pentru cele n produse la momentul t;
i 1
n
 pi
(0 )
e suma preţurilor plătite pentru cele n produse la momentul 0;
i 1
Se observă, deci, faptul că indicele de preţ agregat se determină pe baza
evoluţiei preţurilor la toate produsele analizate, nu pe seama unui singur produs,
ca în cazul indicilor simpli.
De cele mai multe ori, însă, variabilele care compun fenomenul complex
studiat se îmbină în proporţii diferite, situaţie în care indicatorul agregat se
obţine prin raportarea sumelor ponderate ale variabilelor, înregistrate în
momentul iniţial şi în momentul final, conform relaţiei:

n
 yi  f
(t ) (t )

I (t )  i 1
n
 100 (8.23)
y
(0 )
i f (0 )

i 1

Cei mai cunoscuţi indicatori agregaţi ponderat sunt indicii de preţ


Laspeyres (IL), respectiv, Paasche (IP), care se determină pe baza evoluţiei
preţurilor unui coş de produse cu ponderi diferite23.
Indicele Laspeyres se calculează cu formula:

n
 pi  qi
(t ) (0 )

IL  i 1
n
 100 (8.24)
p
(0 )
i q (0 )
i
i 1

unde t este perioada de timp studiată;


n reprezintă numărul total de bunuri ce compun coşul de produse;
qi(0) este cantitatea (ponderea) bunurilor i în cadrul coşului analizat la
momentul iniţial 0;

23
M.L. Berenson, D.M. Levine, T.C. Krehbiel, op. cit, pag. 681 – 683

141
Practic, indicele Laspeyres arată evoluţia generală a preţurilor pe baza
modificării preţurilor bunurilor din coşul analizat, în condiţiile păstrării
constante a ponderilor (cantităţilor din fiecare produs i) înregistrate la momentul
iniţial al analizei.
Indicele Paasche se calculează după formula:

n
 pi  qi
(t ) (t )

IP  i 1
n
 100 (8.25)
p
(0 )
i q
(t )
i
i 1

unde t este perioada de timp studiată;


n reprezintă numărul total de bunuri ce compun coşul de produse;
qi(t) este cantitatea (ponderea) bunurilor i în cadrul coşului analizat la
momentul final t;
Se observă că indicele Paasche arată evoluţia generală a preţurilor pe baza
modificării preţurilor bunurilor din coşul analizat, în condiţiile luării în calcul a
cantităţilor din fiecare produs i înregistrate la momentul final al analizei.
În statistica economică sunt utilizaţi diferiţi indicatori agregaţi. Un
indicator foarte cunoscut este indicele preţurilor de consum (CPI), care arată
evoluţia generală a preţurilor bunurilor destinate consumului populaţiei. El este
calculat, de regulă, sub formă de indice Laspeyres şi exprimă, practic, evoluţia
costului vieţii de-a lungul timpului, cu impact direct asupra nivelului de trai al
populaţiei. Este des utilizat ca rată de actualizare (deflator) atunci când se
analizează evoluţia unor indicatori cu caracter social. Calculul ratei inflaţiei, ca
indicator macroeconomic, are la bază determinarea unei medii a indicilor
preţurilor de consum a unei game foarte largi de bunuri.
Un alt indicator agregat important este indicele preţurilor industriale
(PPI), care arată evoluţia generală a preţurilor la producător (preţuri cu ridicata
sau en–gros), utilizat atunci când se analizează evoluţia unor indicatori
economici (profit, cifră de afaceri etc.). Indicele preţurilor industriale este strâns
legat de indicele preţurilor de consum, deoarece, de obicei, o creştere sau
descreştere a preţurilor la producător induce mai devreme sau mai târziu o
24
modificare a preţurilor bunurilor destinate consumului populaţiei.

24
C. Şipoş, C. Preda, op. cit., pag. 203 – 205

142
Alţi indici agregaţi cunoscuţi sunt cei din domeniul financiar din Statele
Unite (Dow Jones Industrial Index, Standard&Poor’s 500, NASDAQ Index etc.)
sau de pe pieţele financiare internaţionale (Nikkei în Japonia, DAX în Germania
etc.).

PROBLEME REZOLVATE

Exemplul 8.1.
Produsul Intern Brut al României a înregistrat următoarele valori în perioada
1990 – 2003:

Tabelul 8.1
Anii P.I.B.
– mld. lei –
1990 859,9
1991 2.203,9
1992 6.029,2
1993 20.035,7
1994 49.773,2
1995 72.135,5
1996 108.919,6
1997 252.925,7
1998 373.798,2
1999 545.730,2
2000 803.773,1
2001 1.167.687,0
2002 1.512.616,8
2003 1.890.778,3

Sursa: Rapoartele lunare şi anuale ale Băncii Naţionale a României

Se cere să se analizeze, cu ajutorul sistemului de indicatori statistici ai


nivelului şi ai variaţiei, evoluţia exporturilor României în perioada 1990 – 2003.

143
Pentru a rezolva această problemă, trebuie să ţinem seama de faptul că
valorile PIB sunt date în preţuri curente (în termeni nominali), adică aşa cum au
fost ele înregistrate în anii respectivi.
Având în vedere ratele înalte ale inflaţiei din România în perioada
analizată, valorile nominale nu pot fi comparate direct una cu cealaltă, deoarece
o astfel de comparaţie ar fi irelevantă.
De aceea, PIB-ul trebuie exprimat în termeni reali (în preţuri comparabile
sau constante) în raport cu un an de referinţă şi cu ajutorul deflatorului PIB (rata
de actualizare a PIB-ului). Valorile deflatorului (di) în perioada 1990 – 2003
sunt prezentate în tabelul 8.2:

Tabelul 8.2
Anii Deflator PIB
% coeficient
1990 – –
1991 295,1 2,951
1992 300,0 3,000
1993 327,4 3,274
1994 239,1 2,391
1995 135,3 1,353
1996 145,3 1,453
1997 247,3 2,473
1998 155,2 1,552
1999 147,8 1,478
2000 144,3 1,443
2001 137,4 1,374
2002 123,4 1,234
2003 119,2 1,192
Sursa: Rapoartele lunare şi anuale ale Băncii Naţionale a României

Anul de referinţă poate fi primul sau ultimul an al seriei de date, mai rar
se alege un an din interiorul seriei. Vom determina PIB-ul în preţuri constante,
atât cu baza de referinţă anul 1990, cât şi cu baza de referinţă anul 2003.
Valorile PIB-ul în preţuri constante 1990 (PIBct’90i) se calculează astfel:
– pentru anul 1990, valoarea în preţuri constante este egală cu valoarea
PIB în preţuri curente, deoarece este anul de referinţă (de bază):

144
PIBct’901990 = PIB1990 = 859,9 mld. lei

– pentru anul 1991, PIB-ul în preţuri constante este egal cu raportul


dintre valoarea PIB în preţuri curente din anul 1991 şi deflatorul aferent anului
1991 (care arată creşterea de preţuri din anul 1991 faţă de 1990):

PIB1991 2.203,9
PIBct '901991    746,83 mld. lei
d 1991 2,951

– pentru anul 1992, PIB-ul în preţuri constante este egal cu raportul


dintre valoarea în preţuri curente din anul 1992 şi produsul dintre deflatorul
aferent anului 1992 şi deflatorul aferent anului 1991 (produs care arată creşterea
de preţuri din anul 1992 faţă de 1990):

PIB1992 6.029,2
PIBct '901992    681,03 mld. lei
d1992  d1991 3,000  2,951

– pentru anul 1993, PIB-ul în preţuri constante este egal cu raportul


dintre valoarea PIB în preţuri curente din anul 1993 şi produsul dintre deflatorii
aferenţi anilor 1993, 1992 şi 1991 (produs care arată creşterea de preţuri din
anul 1993 faţă de 1990):

PIB1993 20.035,7
PIBct '901993    691,25
d1993  d1992  d1991 3,274  3,000  2,951
mld. lei

– se determină conform aceluiaşi raţionament PIB-ul în preţuri


constante (bază anul 1990) pentru toată perioada studiată. Astfel, PIB-ul în
preţuri constante din anul 2003 este egal cu raportul dintre valoarea PIB în
preţuri curente din anul 2003 şi produsul dintre deflatorii aferenţi anilor 1991 –
2003 (produs care arată creşterea de preţuri din anul 2003 faţă de 1990):

145
PIB2003 1.890.778,3
PIBct '902003  2003
  838,87 mld. lei
 di 2.253,96
i 1991

Valorile PIB exprimate în preţuri constante, cu baza de referinţă anul


1990, sunt prezentate în tabelul 8.3:

Tabelul 8.3
Anii P.I.B.ct‘90
– mld. lei –
1990 859,90
1991 746,83
1992 681,03
1993 691,25
1994 718,20
1995 769,31
1996 799,45
1997 750,68
1998 714,84
1999 706,12
2000 720,72
2001 762,03
2002 799,94
2003 838,87

Valorile PIB-ului exprimat în preţuri constante 2003 (PIBct’03i) se


calculează în felul următor (se începe întotdeauna cu anul de bază):
– pentru anul 2003, valoarea PIB în preţuri constante este egală cu
valoarea PIB în preţuri curente, deoarece este anul de referinţă (de bază):

PIBct’032003 = PIB2003 = 1.890.778,3 mld. lei

– pentru anul 2002, PIB-ul în preţuri constante este egal cu produsul


dintre valoarea PIB în preţuri curente din anul 2002 şi deflatorul aferent anului
2003 (care arată creşterea de preţuri din anul 2003 faţă de 2002):

146
PIBct’032002 = PIB2002  d 2003 = 1.512.616,8  1,192 = 1.803.039,2 mld. lei

– pentru anul 2001, PIB-ul în preţuri constante este egal cu valoarea PIB
în preţuri curente din anul 2001 înmulţită cu produsul deflatorilor aferenţi anilor
2003 şi 2002 (produs care arată creşterea de preţuri din anul 2003 faţă de 2001):

2003
PIBct’032001 = PIB2001   d i = 1.167.687,0  1,192 1,234 =
i  2002
= 1.717.583,50 mld. lei

– pentru anul 2000, PIB-ul în preţuri constante este egal cu valoarea PIB
în preţuri curente din anul 2000 înmulţită cu produsul deflatorilor aferenţi anilor
2003, 2002 şi 2001 (produs care arată creşterea de preţuri din anul 2003 faţă de
2000):

2003
PIBct’032000 = PIB2000   d i = 803.773,1  1,192  1,234  1,374 =
i  2001
= 1.624.469,70 mld. lei

– se determină conform aceluiaşi raţionament PIB-ul în preţuri


constante (bază anul 2003) pentru toată perioada studiată. Astfel, pentru anul
1990, PIB-ul în preţuri constante este egal cu valoarea PIB în preţuri curente din
anul 1990 înmulţită cu produsul deflatorilor aferenţi perioadei 1991 – 2003
(produs care arată creşterea de preţuri din anul 2003 faţă de 1990):

2003
PIBct’031990 = PIB1990   d i = 1.938.183,19 mld. lei
i 1991

Valorile PIB exprimate în preţuri constante, cu baza de referinţă anul


2003, sunt prezentate în tabelul 8.4:

147
Tabelul 8.4
Anii P.I.B.ct‘03
– mld. lei –
1990 1.938.183,19
1991 1.683.331,10
1992 1.535.027,28
1993 1.558.053,10
1994 1.618.801,96
1995 1.734.001,25
1996 1.801.941,90
1997 1.692.012,59
1998 1.611.224,73
1999 1.591.557,99
2000 1.624.469,70
2001 1.717.583,50
2002 1.803.039,23
2003 1.890.778,30

Evoluţia în termeni reali a PIB-ului României în perioada 1990 – 2003 va


fi studiată cu ajutorul indicatorilor statistici, grupaţi pe cele trei mari categorii:
absoluţi, relativi şi medii. Deoarece analiza este similară indiferent de baza de
referinţă aleasă (anul 1990, 2003 sau orice alt an din această perioadă), se vor
calcula indicatorii pentru PIB-ul real exprimat în preţurile anului 1990.
1. Indicatori absoluţi:
a) Nivelurile absolute ale PIB-ului în termeni reali sunt valorile
înregistrate în tabelul 6.3.
b) Volumul absolut se determină astfel:

2003
VPIB =  PIBi  10.559,18 mld. lei
i 1990

Din acest calcul rezultă că volumul total al PIB-ului României, exprimat


în preţurile anului 1990, aferent perioadei 1990 – 2003 a fost de 10.559,18 mld.
lei.
c) Sporurile absolute se determină în cele două variante, cu bază fixă
(i/1) şi cu bază mobilă (i/i-1). Baza de referinţă pentru sporul cu bază fixă este
anul 1990.

148
Sporurile absolute sunt prezentate în tabelul 8.5:

Tabelul 8.5
 PIBi/1990  PIBi/i-1
Anii – mld. lei – – mld. lei –
1990 – –
1991 –113,07 –113,07
1992 –178,87 –65,80
1993 –168,65 10,22
1994 –141,70 26,95
1995 –90,59 51,11
1996 –60,45 30,14
1997 –109,22 –48,77
1998 –145,06 –35,84
1999 –153,78 –8,73
2000 –139,18 14,60
2001 –97,87 41,31
2002 –59,96 37,91
2003 –21,03 38,93

Valorile negative ale sporului absolut cu bază fixă arată că, în termeni
reali, toate valorile PIB-ului României din perioada 1991 – 2003 au fost mai
mici decât nivelul anului 1990. Cea mai mică distanţă faţă de anul 1990 s-a
înregistrat în 2003, ceea ce înseamnă că doar după 15 ani se ajunge din nou la
nivelul înregistrat în anul de bază.
Valorile sporului absolut cu bază mobilă (în lanţ) sunt fie pozitive (atunci
când PIB-ul a crescut în mărime absolută de la un an la altul), fie negative
(atunci când PIB-ul a scăzut în mărime absolută de la un an la altul). Suma
acestor sporuri este egală cu sporul cu bază fixă din anul 2003. Valoarea fiind
negativă, rezultă o scădere în termeni reali faţă de anul 1990.
Se observă, pe datele din tabelul 8.5 că se verifică şi relaţia conform
căreia diferenţa dintre două sporuri absolute cu bază fixă consecutive este egală
cu sporul absolut cu bază mobilă corespunzător.

149
2. Indicatori relativi:
a) Indicii de variaţie, cu bază fixă (baza de referinţă este anul 1990) şi în
lanţ, atât procentual, cât şi sub formă de coeficienţi, sunt prezentaţi în tabelul
8.6:

Tabelul 8.6
Anii I PIBi/1990 I PIBi/i-1
coeficient % coeficient %
1990 – – – –
1991 0,87 87 0,87 87
1992 0,79 79 0,91 91
1993 0,80 80 1,02 102
1994 0,84 84 1,04 104
1995 0,89 89 1,07 107
1996 0,93 93 1,04 104
1997 0,87 87 0,94 94
1998 0,83 83 0,95 95
1999 0,82 82 0,99 99
2000 0,84 84 1,02 102
2001 0,89 89 1,06 106
2002 0,93 93 1,05 105
2003 0,98 98 1,05 105

Valorile subunitare (sau sub 100%, în cazul exprimării procentuale) ale


indicilor de variaţie cu bază fixă arată, similar cu sporurile absolute cu bază fixă
că, în termeni reali, toate valorile PIB-ului României din perioada 1991 – 2003
au fost mai mici decât nivelul anului 1990. Cea mai apropiată valoare de 1 (sau
de 100%) s-a înregistrat în anul 2003 (0,98 sau 98%), ceea ce înseamnă că abia
în anul 2003 PIB-ul se apropie de nivelul anului 1990.
De asemenea, valorile indicelui de variaţie cu bază mobilă sunt fie
supraunitare (atunci când PIB-ul a crescut de la un an la altul), fie subunitare
(atunci când PIB-ul a scăzut de la un an la altul). Produsul acestor indici este
egal cu indicele cu bază fixă din anul 2003. Valoarea fiind subunitară, rezultă o
scădere a PIB-ului în termeni reali faţă de anul 1990.
Se poate observa şi faptul că se verifică şi relaţia conform căreia raportul
dintre doi indici de variaţie cu bază fixă consecutivi este egal cu indicele de
variaţie cu bază mobilă corespunzător.

150
b) Ritmurile sporului cu bază fixă (baza este anul 1990) şi cu bază în
lanţ, determinate atât procentual, cât şi sub formă de coeficienţi, sunt prezentate
în tabelul 8.7:
Tabelul 8.7
Anii R PIBi/1990 R PIBi/i-1
coeficient % coeficient %
1990 – – – –
1991 –0,13 –13 –0,13 –13
1992 –0,21 –21 –0,09 –9
1993 –0,20 –20 0,02 2
1994 –0,16 –16 0,04 4
1995 –0,11 –11 0,07 7
1996 –0,07 –7 0,04 4
1997 –0,13 –13 –0,06 –6
1998 –0,17 –17 –0,05 –5
1999 –0,18 –18 –0,01 –1
2000 –0,16 –16 0,02 2
2001 –0,11 –11 0,06 6
2002 –0,07 –7 0,05 5
2003 –0,02 –2 0,05 5

Valorile negative ale ritmului sporului cu bază fixă arată că, în termeni
reali, toate valorile PIB-ului României din perioada 1991 – 2003 au fost mai
mici cu diverse procente decât nivelul anului 1990. Cea mai mică distanţă faţă
de anul 1990 (de – 0,02 sau – 2%) s-a înregistrat în anul 2003, fapt relevat şi de
ceilalţi indicatori.
Se observă că ritmurile sporului cu bază mobilă sunt fie pozitive (atunci
când PIB-ul a crescut procentual de la un an la altul), fie negative (atunci când
PIB-ul a scăzut procentual de la un an la altul).
3. Indicatori medii:
a) Nivelul mediu ( P IB ) se determină ca o medie aritmetică simplă a
termenilor seriei (deoarece este o serie de intervale), astfel:

2003
 PIBi 10.559,18
P IB  i 1990   754,23 mld. lei
n 14

151
Valoarea medie anuală a PIB-ului real al României, exprimat în preţurile
anului 1990, a fost în perioada studiată de 754,23 mld. lei.
b) Sporul mediu ( PIB ) reflectă variaţia medie anuală înregistrată de PIB-
ul României în perioada 1990 – 2003. Se calculează astfel:

PIB2003  PIB1990 838,87  859,90


PIB    1,61 mld. lei/an
n 1 13

Astfel, în medie, valoarea reală a PIB-ului a scăzut în fiecare an cu 1,61


mld. lei.
c) Indicele (ritmul) mediu de variaţie ( I PIB ) arată de câte ori s-a
modificat în medie nivelul PIB-ului în perioada analizată. El se calculează
astfel:

PIB2003 838,87
I PIB  n 1  13  0,9981
PIB1990 859,90

Se observă că acest indicator are valoare subunitară, deoarece tendinţa de


evoluţie a PIB-ului a fost descrescătoare în perioada 1990 – 2003.
d) Ritmul mediu al sporului ( rPIB ) arată, în mărime relativă, cu cât a
variat în medie PIB-ul în perioada 1990 – 2003. El se determină astfel:

rPIB  I PIB  1  0,9981 – 1 = – 0,0019 sau, procentual


r %PIB  I PIB  100  100  99,81  100  0,19%

În medie, în perioada analizată, PIB-ul a scăzut în fiecare an cu 0,19%.


După cum s-a putut vedea, într-adevăr, indicatorii statistici obţinuţi prin
prelucrarea unei serii de timp pot constitui un sistem unitar, în care fiecare
indicator în parte permite evidenţierea evoluţiei fenomenului sau procesului
economic studiat.

152
PROBLEME PROPUSE

1. Un institut de cercetări doreşte să studieze evoluţia câştigului salarial mediu


lunar net. Pentru aceasta au fost înregistrate datele pe 12 ani:

Anii Salariu în Indicele


preţurilor
preţuri curente de consum (bază mobilă)
1. 3.381 -
2. 7.460 322,8
3. 20.140 299,2
4. 59.717 335,5
5. 141.951 161,7
6. 211.373 127,8
7. 321.169 156,9
8. 632.086 251,4
9. 1.073.898 140,6
10. 1.554.737 154,8
11. 2.318.595 140,7
12. 3.053.598 130,3

Se cere:
a) Să se exprime salariile în preţuri comparabile (constante) luând ca
bază anul 1;
b) Să se exprime salariile în preţuri comparabile (constante) luând ca
bază anul 12;
c) Să se analizeze evoluţia salariilor în preţuri constante cu ajutorul
indicatorilor statistici

153
154
BIBLIOGRAFIE

1. Andrei T., Stancu S., Statistica. Teorie şi aplicaţii, Editura ALL, Bucureşti,
1995

2. Anderson D.R., Williams Th.A., Sweeney D.J., Statistics for Business and
Economics, West Publishing Company, 1990

3. Baron T., Anghelache C., Ţiţan E., Statistică, Editura Economică,


Bucureşti, 1996

4. Baron T., Biji E. şi alţii, Statistică teoretică şi economică, Editura Didactică


şi Pedagogică, Bucureşti, 1996

5. Berenson M.L., Levine D.M., Krehbiel T.C., Basic Business Statistics.


Concepts and Applications, 9th Edition, Pearson Prentice Hall,
2004

6. Cenuşă Ghe., coordonator, Matematici pentru economişti, Academia de


Studii Economice Bucureşti, Editura Cison, 2000

7. Chilărescu C., Ciorîcă O., Preda C., Şipoş C., Surulescu N., Bazele
statisticii, Editura Universităţii de Vest, Timişoara, 2002

8. Ciucu G., Craiu V., Teoria estimaţiei şi verificarea ipotezelor statistice,


Editura Didactică şi Pedagogică, Bucureşti, 1968

9. Frees E.W., Data Analysis Using Regression Models, Prentice-Hall


International, Inc., New Jersey, 1996

10. Iman R.L., Conover W.J., Modern Business Statistics, John Wiley & Sons,
Second Edition, 1989

11. Jaba Elisabeta, Statistica, Editura Sedcom Libris, Iaşi, 1996

155
12. Levine D.M., Berenson M.L., Stephan D., Statistics for Managers using
Microsoft Excel, Second Edition, Prentice Hall, 1999

13. Levine D.M., Stephan D., Krehbiel T.C., Berenson M.L., Statistics for
Managers using Microsoft Excel, Third Edition, Prentice Hall,
2002

14. Mihăilă N., Popescu O., Matematici speciale aplicate în economie, Editura
Didactică şi Pedagogică, Bucureşti, 1978

15. Newbold P., Carlson W.L., Thorne B., Statistics for Business and
Economics, Fifth Edition, Pearson Prentice Hall, 2003

16. Popescu O. şi alţii, Matematici aplicate în economie, Editura Didactică şi


Pedagogică, Bucureşti, 1993

17. Purcaru I., Berbec F., Sorin D., Matematici financiare & Decizii în afaceri,
Editura Economică, Bucureşti, 1996
18. Resa I.D., Lighezan V., Probleme de statistică, Tipografia Universităţii din
Timişoara, 1982

19. Resa I.D., Petrescu Şt., Precupaş M., Câra Al., Probleme de statistică
rezolvate pe calculator, Editura Facla, Timişoara, 1984

20. Şipoş C., Modelarea comportamentului cursului de schimb al leului,


Editura Universităţii de Vest, Timişoara, 2003

21. Şipoş C., Preda C., Statistică economică, Editura Mirton, Timişoara, 2004

22. Ţiţan E., Statistică macroeconomică, A.S.E., Bucureşti, 1996

***
23. Anuarul Statistic al României, anii 2000 – 2005

***
24. Rapoartele anuale şi lunare ale Băncii Naţionale a României, anii 2000
– 2007

156
Anexa 1. Distribuţia normală. Funcţia lui Laplace
z (z) z (z) z (z) z (z)
0,00 0,00000 0,40 0,15542 0,80 0,28814 1,20 0,38493
0,01 0,00399 0,41 0,15910 0,81 0,29103 1,21 0,38686
0,02 0,00798 0,42 0,16276 0,82 0,29389 1,22 0,38877
0,03 0,01197 0,43 0,16640 0,83 0,29673 1,23 0,39065
0,04 0,01595 0,44 0,17003 0,84 0,29955 1,24 0,39251
0,05 0,01994 0,45 0,17364 0,85 0,30234 1,25 0,39435
0,06 0,02392 0,46 0,17724 0,86 0,30511 1,26 0,39617
0,07 0,02790 0,47 0,18082 0,87 0,30785 1,27 0,39796
0,08 0,03188 0,48 0,18439 0,88 0,31057 1,28 0,39973
0,09 0,03586 0,49 0,18793 0,89 0,31327 1,29 0,40147
0,10 0,03983 0,50 0,19146 0,90 0,31594 1,30 0,40320
0,11 0,04380 0,51 0,19497 0,91 0,31859 1,31 0,40490
0,12 0,04776 0,52 0,19847 0,92 0,32121 1,32 0,40658
0,13 0,05172 0,53 0,20194 0,93 0,32381 1,33 0,40824
0,14 0,05567 0,54 0,20540 0,94 0,32639 1,34 0,40988
0,15 0,05962 0,55 0,20884 0,95 0,32894 1,35 0,41149
0,16 0,06356 0,56 0,21226 0,96 0,33147 1,36 0,41308
0,17 0,06749 0,57 0,21566 0,97 0,33398 1,37 0,41466
0,18 0,07142 0,58 0,21904 0,98 0,33646 1,38 0,41621
0,19 0,07535 0,59 0,22240 0,99 0,33891 1,39 0,41774
0,20 0,07926 0,60 0,22575 1,00 0,34134 1,40 0,41924
0,21 0,08317 0,61 0,22907 1,01 0,34375 1,41 0,42073
0,22 0,08706 0,62 0,23237 1,02 0,34614 1,42 0,42220
0,23 0,09095 0,63 0,23565 1,03 0,34849 1,43 0,42364
0,24 0,09483 0,64 0,23891 1,04 0,35083 1,44 0,42507
0,25 0,09871 0,65 0,24215 1,05 0,35314 1,45 0,42647
0,26 0,10257 0,66 0,24537 1,06 0,35543 1,46 0,42785
0,27 0,10642 0,67 0,24857 1,07 0,35769 1,47 0,42922
0,28 0,11026 0,68 0,25175 1,08 0,35993 1,48 0,43056
0,29 0,11409 0,69 0,25490 1,09 0,36214 1,49 0,43189
0,30 0,11791 0,70 0,25804 1,10 0,36433 1,50 0,43319
0,31 0,12172 0,71 0,26115 1,11 0,36650 1,51 0,43448
0,32 0,12552 0,72 0,26424 1,12 0,36864 1,52 0,43574
0,33 0,12930 0,73 0,26730 1,13 0,37076 1,53 0,43699
0,34 0,13307 0,74 0,27035 1,14 0,37286 1,54 0,43822
0,35 0,13683 0,75 0,27337 1,15 0,37493 1,55 0,43943

157
– continuare Anexa 1 –
z (z) z (z) z (z) z (z)
0,36 0,14058 0,76 0,27637 1,16 0,37698 1,56 0,44062
0,37 0,14431 0,77 0,27935 1,17 0,37900 1,57 0,44179
0,38 0,14803 0,78 0,28230 1,18 0,38100 1,58 0,44295
0,39 0,15173 0,79 0,28524 1,19 0,38298 1,59 0,44408
1,60 0,44520 2,00 0,47725 2,40 0,49180 2,80 0,49744
1,61 0,44630 2,01 0,47778 2,41 0,49202 2,81 0,49752
1,62 0,44738 2,02 0,47831 2,42 0,49224 2,82 0,49760
1,63 0,44845 2,03 0,47882 2,43 0,49245 2,83 0,49767
1,64 0,44950 2,04 0,47932 2,44 0,49266 2,84 0,49774
1,65 0,45053 2,05 0,47982 2,45 0,49286 2,85 0,49781
1,66 0,45154 2,06 0,48030 2,46 0,49305 2,86 0,49788
1,67 0,45254 2,07 0,48077 2,47 0,49324 2,87 0,49795
1,68 0,45352 2,08 0,48124 2,48 0,49343 2,88 0,49801
1,69 0,45449 2,09 0,48169 2,49 0,49361 2,89 0,49807
1,70 0,45543 2,10 0,48214 2,50 0,49379 2,90 0,49813
1,71 0,45637 2,11 0,48257 2,51 0,49396 2,91 0,49819
1,72 0,45728 2,12 0,48300 2,52 0,49413 2,92 0,49825
1,73 0,45818 2,13 0,48341 2,53 0,49430 2,93 0,49831
1,74 0,45907 2,14 0,48382 2,54 0,49446 2,94 0,49836
1,75 0,45994 2,15 0,48422 2,55 0,49461 2,95 0,49841
1,76 0,46080 2,16 0,48461 2,56 0,49477 2,96 0,49846
1,77 0,46164 2,17 0,48500 2,57 0,49492 2,97 0,49851
1,78 0,46246 2,18 0,48537 2,58 0,49506 2,98 0,49856
1,79 0,46327 2,19 0,48574 2,59 0,49520 2,99 0,49861
1,80 0,46407 2,20 0,48610 2,60 0,49534 3,00 0,49865
1,81 0,46485 2,21 0,48645 2,61 0,49547 3,01 0,49869
1,82 0,46562 2,22 0,48679 2,62 0,49560 3,02 0,49874
1,83 0,46638 2,23 0,48713 2,63 0,49573 3,03 0,49878
1,84 0,46712 2,24 0,48745 2,64 0,49585 3,04 0,49882
1,85 0,46784 2,25 0,48778 2,65 0,49598 3,05 0,49886
1,86 0,46856 2,26 0,48809 2,66 0,49609 3,06 0,49889
1,87 0,46926 2,27 0,48840 2,67 0,49621 3,07 0,49893
1,88 0,46995 2,28 0,48870 2,68 0,49632 3,08 0,49896
1,89 0,47062 2,29 0,48899 2,69 0,49643 3,09 0,49900
1,90 0,47128 2,30 0,48928 2,70 0,49653 3,10 0,49903
1,91 0,47193 2,31 0,48956 2,71 0,49664 3,11 0,49906

158
– continuare Anexa 1 –
z (z) z (z) z (z) z (z)
1,92 0,47257 2,32 0,48983 2,72 0,49674 3,12 0,49910
1,93 0,47320 2,33 0,49010 2,73 0,49683 3,13 0,49913
1,94 0,47381 2,34 0,49036 2,74 0,49693 3,14 0,49916
1,95 0,47441 2,35 0,49061 2,75 0,49702 3,15 0,49918
1,96 0,47500 2,36 0,49086 2,76 0,49711 3,16 0,49921
1,97 0,47558 2,37 0,49111 2,77 0,49720 3,17 0,49924
1,98 0,47615 2,38 0,49134 2,78 0,49728 3,18 0,49926
1,99 0,47670 2,39 0,49158 2,79 0,49736 3,19 0,49929
3,20 0,499313 3,56 0,499815 3,92 0,499956 4,28 0,499991
3,21 0,499336 3,57 0,499821 3,93 0,499958 4,29 0,499991
3,22 0,499359 3,58 0,499828 3,94 0,499959 4,30 0,499991
3,23 0,499381 3,59 0,499835 3,95 0,499961 4,31 0,499992
3,24 0,499402 3,60 0,499841 3,96 0,499963 4,32 0,499992
3,25 0,499423 3,61 0,499847 3,97 0,499964 4,33 0,499993
3,26 0,499443 3,62 0,499853 3,98 0,499966 4,34 0,499993
3,27 0,499462 3,63 0,499858 3,99 0,499967 4,35 0,499993
3,28 0,499481 3,64 0,499864 4,00 0,499968 4,36 0,499993
3,29 0,499499 3,65 0,499869 4,01 0,499970 4,37 0,499994
3,30 0,499517 3,66 0,499874 4,02 0,499971 4,38 0,499994
3,31 0,499533 3,67 0,499879 4,03 0,499972 4,39 0,499994
3,32 0,499550 3,68 0,499883 4,04 0,499973 4,40 0,4999946
3,33 0,499566 3,69 0,499888 4,05 0,499974 4,41 0,4999948
3,34 0,499581 3,70 0,499892 4,06 0,499975 4,42 0,4999951
3,35 0,499596 3,71 0,499896 4,07 0,499976 4,43 0,4999953
3,36 0,499610 3,72 0,499900 4,08 0,499977 4,44 0,4999955
3,37 0,499624 3,73 0,499904 4,09 0,499978 4,45 0,4999957
3,38 0,499638 3,74 0,499908 4,10 0,499979 4,46 0,4999959
3,39 0,499650 3,75 0,499912 4,11 0,499980 4,47 0,4999961
3,40 0,499663 3,76 0,499915 4,12 0,499981 4,48 0,4999963
3,41 0,499675 3,77 0,499918 4,13 0,499982 4,49 0,4999964
3,42 0,499687 3,78 0,499922 4,14 0,499983 4,50 0,4999966
3,43 0,499698 3,79 0,499925 4,15 0,499983 4,60 0,4999979
3,44 0,499709 3,80 0,499928 4,16 0,499984 4,70 0,4999987
3,45 0,499720 3,81 0,499930 4,17 0,499985 4,80 0,4999992
3,46 0,499730 3,82 0,499933 4,18 0,499985 4,90 0,4999995
3,47 0,499740 3,83 0,499936 4,19 0,499986 5,00 0,4999997

159
– continuare Anexa 1 –
z (z) z (z) z (z) z (z)
3,48 0,499749 3,84 0,499938 4,20 0,499987
3,49 0,499758 3,85 0,499941 4,21 0,499987
3,50 0,499767 3,86 0,499943 4,22 0,499988
3,51 0,499776 3,87 0,499946 4,23 0,499988
3,52 0,499784 3,88 0,499948 4,24 0,499989
3,53 0,499792 3,89 0,499950 4,25 0,499989
3,54 0,499800 3,90 0,499952 4,26 0,499990
3,55 0,499807 3,91 0,499954 4,27 0,499990

160
Anexa 2. Distribuţia Student. Valorile lui t în funcţie de probabilitatea  şi
numărul de grade de libertate  (test bilateral)

 0,100 0,050 0,025 0,010 0,005



1 6,314 12,706 25,452 63,656 127,321
2 2,920 4,303 6,205 9,925 14,089
3 2,353 3,182 4,177 5,841 7,453
4 2,132 2,776 3,495 4,604 5,598
5 2,015 2,571 3,163 4,032 4,773
6 1,943 2,447 2,969 3,707 4,317
7 1,895 2,365 2,841 3,499 4,029
8 1,860 2,306 2,752 3,355 3,833
9 1,833 2,262 2,685 3,250 3,690
10 1,812 2,228 2,634 3,169 3,581
11 1,796 2,201 2,593 3,106 3,497
12 1,782 2,179 2,560 3,055 3,428
13 1,771 2,160 2,533 3,012 3,372
14 1,761 2,145 2,510 2,977 3,326
15 1,753 2,131 2,490 2,947 3,286
16 1,746 2,120 2,473 2,921 3,252
17 1,740 2,110 2,458 2,898 3,222
18 1,734 2,101 2,445 2,878 3,197
19 1,729 2,093 2,433 2,861 3,174
20 1,725 2,086 2,423 2,845 3,153
21 1,721 2,080 2,414 2,831 3,135
22 1,717 2,074 2,405 2,819 3,119
23 1,714 2,069 2,398 2,807 3,104
24 1,711 2,064 2,391 2,797 3,091
25 1,708 2,060 2,385 2,787 3,078
26 1,706 2,056 2,379 2,779 3,067
27 1,703 2,052 2,373 2,771 3,057
28 1,701 2,048 2,368 2,763 3,047
29 1,699 2,045 2,364 2,756 3,038
30 1,697 2,042 2,360 2,750 3,030
 1,645 1,960 2,241 2,576 2,807

161
Anexa 3. Distribuţia 2. Valorile lui 2 în funcţie de probabilitatea  şi de
numărul de grade de libertate 

α 0,990 0,975 0,950 0,900 0,100 0,050 0,025 0,010



1 0,0002 0,0010 0,0039 0,0158 2,706 3,841 5,024 6,635
2 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210
3 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,345
4 0,297 0,484 0,711 1,064 7,779 9,488 11,143 13,277
5 0,554 0,831 1,145 1,610 9,236 11,070 12,832 15,086
6 0,872 1,237 1,635 2,204 10,645 12,592 14,449 16,812
7 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475
8 1,647 2,180 2,733 3,490 13,362 15,507 17,535 20,090
9 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666
10 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209
11 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725
12 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217
13 4,107 5,009 5,892 7,041 19,812 22,362 24,736 27,688
14 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141
15 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578
16 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000
17 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409
18 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805
19 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191
20 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566
21 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932
22 9,542 10,982 12,338 14,041 30,813 33,924 36,781 40,289
23 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638
24 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980
25 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314
26 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642
27 12,878 14,573 16,151 18,114 36,741 40,113 43,195 46,963
28 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278
29 14,256 16,047 17,708 19,768 39,087 42,557 45,722 49,588
30 14,953 16,791 18,493 20,599 40,256 43,773 46,979 50,892
50 29,707 32,357 34,764 37,689 63,167 67,505 71,420 76,154
100 70,065 74,222 77,929 82,358 118,498 124,342 129,561 135,807

162
Anexa 4. Distribuţia Fisher. Valorile lui F în funcţie de probabilitatea  =
0,01 şi numărul de grade de libertate 1 şi 2
1 1 2 3 4 5 6 8 10 15
2
1 4052 4999 5404 5624 5764 5859 5981 6056 6157
2 98,502 99,000 99,164 99,251 99,302 99,331 99,375 99,397 99,433
3 34,116 30,816 29,457 28,710 28,237 27,911 27,489 27,228 26,872
4 21,198 18,000 16,694 15,977 15,522 15,207 14,799 14,546 14,198
5 16,258 13,274 12,060 11,392 10,967 10,672 10,289 10,051 9,722
6 13,745 10,925 9,780 9,148 8,746 8,466 8,102 7,874 7,559
7 12,246 9,547 8,451 7,847 7,460 7,191 6,840 6,620 6,314
8 11,259 8,649 7,591 7,006 6,632 6,371 6,029 5,814 5,515
9 10,562 8,022 6,992 6,422 6,057 5,802 5,467 5,257 4,962
10 10,044 7,559 6,552 5,994 5,636 5,386 5,057 4,849 4,558
11 9,646 7,206 6,217 5,668 5,316 5,069 4,744 4,539 4,251
12 9,330 6,927 5,953 5,412 5,064 4,821 4,499 4,296 4,010
13 9,074 6,701 5,739 5,205 4,862 4,620 4,302 4,100 3,815
14 8,862 6,515 5,564 5,035 4,695 4,456 4,140 3,939 3,656
15 8,683 6,359 5,417 4,893 4,556 4,318 4,004 3,805 3,522
16 8,531 6,226 5,292 4,773 4,437 4,202 3,890 3,691 3,409
17 8,400 6,112 5,185 4,669 4,336 4,101 3,791 3,593 3,312
18 8,285 6,013 5,092 4,579 4,248 4,015 3,705 3,508 3,227
19 8,185 5,926 5,010 4,500 4,171 3,939 3,631 3,434 3,153
20 8,096 5,849 4,938 4,431 4,103 3,871 3,564 3,368 3,088
21 8,017 5,780 4,874 4,369 4,042 3,812 3,506 3,310 3,030
22 7,945 5,719 4,817 4,313 3,988 3,758 3,453 3,258 2,978
23 7,881 5,664 4,765 4,264 3,939 3,710 3,406 3,211 2,931
24 7,823 5,614 4,718 4,218 3,895 3,667 3,363 3,168 2,889
25 7,770 5,568 4,675 4,177 3,855 3,627 3,324 3,129 2,850
26 7,721 5,526 4,637 4,140 3,818 3,591 3,288 3,094 2,815
27 7,677 5,488 4,601 4,106 3,785 3,558 3,256 3,062 2,783
28 7,636 5,453 4,568 4,074 3,754 3,528 3,226 3,032 2,753
29 7,598 5,420 4,538 4,045 3,725 3,499 3,198 3,005 2,726
30 7,562 5,390 4,510 4,018 3,699 3,473 3,173 2,979 2,700
50 7,171 5,057 4,199 3,720 3,408 3,186 2,890 2,698 2,419
100 6,895 4,824 3,984 3,513 3,206 2,988 2,694 2,503 2,223
500 6,686 4,648 3,821 3,357 3,054 2,838 2,547 2,356 2,075
1000 6,660 4,626 3,801 3,338 3,036 2,820 2,529 2,339 2,056

163
– continuare Anexa 4 –
1 20 24 30 40 60 100 300 500 1000
2
1 6209 6234 6260 6286 6313 6334 6355 6360 6363
2 99,448 99,455 99,466 99,477 99,484 99,491 99,499 99,499 99,499
3 26,690 26,597 26,504 26,411 26,316 26,241 26,163 26,148 26,137
4 14,019 13,929 13,838 13,745 13,652 13,577 13,501 13,486 13,475
5 9,553 9,466 9,379 9,291 9,202 9,130 9,057 9,042 9,032
6 7,396 7,313 7,229 7,143 7,057 6,987 6,916 6,901 6,891
7 6,155 6,074 5,992 5,908 5,824 5,755 5,685 5,671 5,660
8 5,359 5,279 5,198 5,116 5,032 4,963 4,894 4,880 4,869
9 4,808 4,729 4,649 4,567 4,483 4,415 4,346 4,332 4,321
10 4,405 4,327 4,247 4,165 4,082 4,014 3,944 3,930 3,920
11 4,099 4,021 3,941 3,860 3,776 3,708 3,638 3,624 3,613
12 3,858 3,780 3,701 3,619 3,535 3,467 3,397 3,382 3,372
13 3,665 3,587 3,507 3,425 3,341 3,272 3,202 3,187 3,176
14 3,505 3,427 3,348 3,266 3,181 3,112 3,040 3,026 3,015
15 3,372 3,294 3,214 3,132 3,047 2,977 2,905 2,891 2,880
16 3,259 3,181 3,101 3,018 2,933 2,863 2,790 2,775 2,764
17 3,162 3,083 3,003 2,920 2,835 2,764 2,691 2,676 2,664
18 3,077 2,999 2,919 2,835 2,749 2,678 2,604 2,589 2,577
19 3,003 2,925 2,844 2,761 2,674 2,602 2,528 2,512 2,501
20 2,938 2,859 2,778 2,695 2,608 2,535 2,460 2,445 2,433
21 2,880 2,801 2,720 2,636 2,548 2,476 2,400 2,384 2,372
22 2,827 2,749 2,667 2,583 2,495 2,422 2,345 2,329 2,317
23 2,780 2,702 2,620 2,536 2,447 2,373 2,296 2,280 2,268
24 2,738 2,659 2,577 2,492 2,403 2,329 2,251 2,235 2,223
25 2,699 2,620 2,538 2,453 2,364 2,289 2,210 2,194 2,182
26 2,664 2,585 2,503 2,417 2,327 2,252 2,173 2,156 2,144
27 2,632 2,552 2,470 2,384 2,294 2,218 2,138 2,122 2,109
28 2,602 2,522 2,440 2,354 2,263 2,187 2,106 2,090 2,077
29 2,574 2,495 2,412 2,325 2,234 2,158 2,077 2,060 2,047
30 2,549 2,469 2,386 2,299 2,208 2,131 2,049 2,032 2,019
50 2,265 2,183 2,098 2,007 1,909 1,825 1,733 1,713 1,698
100 2,067 1,983 1,893 1,797 1,692 1,598 1,490 1,466 1,447
500 1,915 1,829 1,735 1,633 1,517 1,408 1,268 1,232 1,201
1000 1,897 1,810 1,716 1,613 1,495 1,383 1,235 1,195 1,159

164
Anexa 4. Distribuţia Fisher. Valorile lui F în funcţie de probabilitatea  =
0,05 şi numărul de grade de libertate 1 şi 2
1 1 2 3 4 5 6 8 10 15
2
1 161,45 199,50 215,71 224,58 230,16 233,99 238,88 241,88 245,95
2 18,513 19,000 19,164 19,247 19,296 19,329 19,371 19,396 19,429
3 10,128 9,552 9,277 9,117 9,013 8,941 8,845 8,785 8,703
4 7,709 6,944 6,591 6,388 6,256 6,163 6,041 5,964 5,858
5 6,608 5,786 5,409 5,192 5,050 4,950 4,818 4,735 4,619
6 5,987 5,143 4,757 4,534 4,387 4,284 4,147 4,060 3,938
7 5,591 4,737 4,347 4,120 3,972 3,866 3,726 3,637 3,511
8 5,318 4,459 4,066 3,838 3,688 3,581 3,438 3,347 3,218
9 5,117 4,256 3,863 3,633 3,482 3,374 3,230 3,137 3,006
10 4,965 4,103 3,708 3,478 3,326 3,217 3,072 2,978 2,845
11 4,844 3,982 3,587 3,357 3,204 3,095 2,948 2,854 2,719
12 4,747 3,885 3,490 3,259 3,106 2,996 2,849 2,753 2,617
13 4,667 3,806 3,411 3,179 3,025 2,915 2,767 2,671 2,533
14 4,600 3,739 3,344 3,112 2,958 2,848 2,699 2,602 2,463
15 4,543 3,682 3,287 3,056 2,901 2,790 2,641 2,544 2,403
16 4,494 3,634 3,239 3,007 2,852 2,741 2,591 2,494 2,352
17 4,451 3,592 3,197 2,965 2,810 2,699 2,548 2,450 2,308
18 4,414 3,555 3,160 2,928 2,773 2,661 2,510 2,412 2,269
19 4,381 3,522 3,127 2,895 2,740 2,628 2,477 2,378 2,234
20 4,351 3,493 3,098 2,866 2,711 2,599 2,447 2,348 2,203
21 4,325 3,467 3,072 2,840 2,685 2,573 2,420 2,321 2,176
22 4,301 3,443 3,049 2,817 2,661 2,549 2,397 2,297 2,151
23 4,279 3,422 3,028 2,796 2,640 2,528 2,375 2,275 2,128
24 4,260 3,403 3,009 2,776 2,621 2,508 2,355 2,255 2,108
25 4,242 3,385 2,991 2,759 2,603 2,490 2,337 2,236 2,089
26 4,225 3,369 2,975 2,743 2,587 2,474 2,321 2,220 2,072
27 4,210 3,354 2,960 2,728 2,572 2,459 2,305 2,204 2,056
28 4,196 3,340 2,947 2,714 2,558 2,445 2,291 2,190 2,041
29 4,183 3,328 2,934 2,701 2,545 2,432 2,278 2,177 2,027
30 4,171 3,316 2,922 2,690 2,534 2,421 2,266 2,165 2,015
50 4,034 3,183 2,790 2,557 2,400 2,286 2,130 2,026 1,871
100 3,936 3,087 2,696 2,463 2,305 2,191 2,032 1,927 1,768
500 3,860 3,014 2,623 2,390 2,232 2,117 1,957 1,850 1,686
1000 3,851 3,005 2,614 2,381 2,223 2,108 1,948 1,840 1,676

165
– continuare Anexa 4 –
1 20 24 30 40 60 100 300 500 1000
2
1 248,02 249,05 250,10 251,14 252,20 253,04 253,89 254,06 254,19
2 19,446 19,454 19,463 19,471 19,479 19,486 19,492 19,494 19,495
3 8,660 8,638 8,617 8,594 8,572 8,554 8,536 8,532 8,529
4 5,803 5,774 5,746 5,717 5,688 5,664 5,640 5,635 5,632
5 4,558 4,527 4,496 4,464 4,431 4,405 4,378 4,373 4,369
6 3,874 3,841 3,808 3,774 3,740 3,712 3,683 3,678 3,673
7 3,445 3,410 3,376 3,340 3,304 3,275 3,245 3,239 3,234
8 3,150 3,115 3,079 3,043 3,005 2,975 2,943 2,937 2,932
9 2,936 2,900 2,864 2,826 2,787 2,756 2,723 2,717 2,712
10 2,774 2,737 2,700 2,661 2,621 2,588 2,555 2,548 2,543
11 2,646 2,609 2,570 2,531 2,490 2,457 2,422 2,415 2,410
12 2,544 2,505 2,466 2,426 2,384 2,350 2,314 2,307 2,302
13 2,459 2,420 2,380 2,339 2,297 2,261 2,225 2,218 2,212
14 2,388 2,349 2,308 2,266 2,223 2,187 2,150 2,142 2,136
15 2,328 2,288 2,247 2,204 2,160 2,123 2,085 2,078 2,072
16 2,276 2,235 2,194 2,151 2,106 2,068 2,030 2,022 2,016
17 2,230 2,190 2,148 2,104 2,058 2,020 1,981 1,973 1,967
18 2,191 2,150 2,107 2,063 2,017 1,978 1,938 1,929 1,923
19 2,155 2,114 2,071 2,026 1,980 1,940 1,899 1,891 1,884
20 2,124 2,082 2,039 1,994 1,946 1,907 1,865 1,856 1,850
21 2,096 2,054 2,010 1,965 1,916 1,876 1,834 1,825 1,818
22 2,071 2,028 1,984 1,938 1,889 1,849 1,806 1,797 1,790
23 2,048 2,005 1,961 1,914 1,865 1,823 1,780 1,771 1,764
24 2,027 1,984 1,939 1,892 1,842 1,800 1,756 1,747 1,740
25 2,007 1,964 1,919 1,872 1,822 1,779 1,735 1,725 1,718
26 1,990 1,946 1,901 1,853 1,803 1,760 1,714 1,705 1,698
27 1,974 1,930 1,884 1,836 1,785 1,742 1,696 1,686 1,679
28 1,959 1,915 1,869 1,820 1,769 1,725 1,679 1,669 1,662
29 1,945 1,901 1,854 1,806 1,754 1,710 1,663 1,653 1,645
30 1,932 1,887 1,841 1,792 1,740 1,695 1,647 1,637 1,630
50 1,784 1,737 1,687 1,634 1,576 1,525 1,469 1,457 1,448
100 1,676 1,627 1,573 1,515 1,450 1,392 1,323 1,308 1,296
500 1,592 1,539 1,482 1,419 1,345 1,275 1,183 1,159 1,138
1000 1,581 1,528 1,471 1,406 1,332 1,260 1,161 1,134 1,110

166

S-ar putea să vă placă și