Sunteți pe pagina 1din 432

Econometrie

Suport de Curs-Învățamântul la
distanță

Prof. univ. dr. Zaharia Marian

Asist. Univ. drd. Oprea Cristina

1
Cuprins

Unitatea de învăţare 1 INTRODUCERE ÎN ECONOMETRIE .................................................... 6


Obiectivele Unităţii de Învăţare 1 ......................................................................................................... 6
1.1. Econometria – definiţii şi obiective ................................................................................................ 6
1.2. Modele econometrice..................................................................................................................... 8
Lucrare de verificare 1A .................................................................................................................... 14
Test de autoevaluare 1B ..................................................................................................................... 14
Rezumat ............................................................................................................................................ 16
Bibliografie ....................................................................................................................................... 17
Unitatea de învăţare 2 NOŢIUNI PRIVIND VARIABILELE ALEATOARE ........................... 18
Obiectivele Unităţii de Învăţare 2 ....................................................................................................... 18
2.1. Eveniment. Câmp de Evenimente ................................................................................................ 19
2.2. Variabile aleatoare ...................................................................................................................... 22
Lucrare deverificare 2A ..................................................................................................................... 29
Test de autoevaluare 2B ..................................................................................................................... 29
Rezumat ............................................................................................................................................ 30
Bibliografie ....................................................................................................................................... 31
Unitatea de învăţare 3 CARACTERISTICILE DISTRIBUŢIEI VARIABILEI
ALEATOARE............................................................................................................................... 32
Obiectivele Unităţii de Învăţare 3 ....................................................................................................... 32
3.1 Indicatorii caracteristici variabilei aleatoare privind tendinţa centrală de grupare .......................... 33
3.2 Indicatorii caracteristici variabilei aleatoare privind împrăştierea distribuţiei variabilei aleatoare .. 36
3.3 Particularităţi ale formei de distribuţie.......................................................................................... 41
Lucrare de verificare 3A .................................................................................................................... 42
Test de autoevaluare 3B ..................................................................................................................... 43
Rezumat ............................................................................................................................................ 46
Bibliografie ....................................................................................................................................... 47
Unitatea de învăţare 4 DISTRIBUŢIILE CLASICE ÎN VERIFICAREA IPOTEZELOR
STATISTICE ................................................................................................................................ 48
Obiectivele Unităţii de Învăţare 4 ....................................................................................................... 48

2
4.1 Repartiţia normală normată (Z ) ................................................................................................... 48

4.2 Repartiţia χ
2
............................................................................................................................. 53

4.3 Repartiţia Student ( t ) .................................................................................................................. 55

4.4 Repartiţia Fisher-Snedecor ( F ) ................................................................................................. 56


Lucrare de verificare 4A .................................................................................................................... 57
Test de autoevaluare 4B..................................................................................................................... 57
Rezumat ............................................................................................................................................ 60
Bibliografie ....................................................................................................................................... 61
Unitatea de învăţare 5 IPOTEZE STATISTICE-ASPECTE TEORETICE ................................ 62
Obiectivele Unităţii de Învăţare 5 ...................................................................................................... 62
5.1 Inferenţa statistică........................................................................................................................ 62
5.2 Metodologia testării ipotezelor statistice ...................................................................................... 64
5.3 Tipuri de teste utilizate la testarea ipotezelor statistice ................................................................. 70
Lucrare de verificare 5A .................................................................................................................... 73
Test de autoevaluare 5B..................................................................................................................... 74
Rezumat ............................................................................................................................................ 77
Bibliografie ....................................................................................................................................... 77
Unitatea de învăţare 6 TESTAREA IPOTEZELOR PRIVIND MEDIILE POPULAŢIILOR
CU EŞANTIOANE DE VOLUM MARE .................................................................................... 78
Obiectivele Unităţii de Învăţare 6 ...................................................................................................... 78
6.1 Compararea mediei eşantionului cu media colectivităţii generale ................................................. 78
6.2 Compararea mediilor a două eşantioane ....................................................................................... 83
6.3 Compararea proporţiei eşantionului cu a colectivităţii generale .................................................... 86
Lucrare de verificare 6A .................................................................................................................... 90
Test de autoevaluare 6B..................................................................................................................... 91
Rezumat ............................................................................................................................................ 96
Bibliografie ....................................................................................................................................... 97
Unitatea de învăţare 7 TESTAREA IPOTEZELOR PRIVIND MEDIILE POPULAŢIILOR
CU EŞANTIOANE DE VOLUM MIC ........................................................................................ 98
Obiectivele Unităţii de Învăţare 7 ...................................................................................................... 98
7.1 Compararea mediei unui eşantion de volum redus cu media colectivităţii generale ....................... 98
7.2 Compararea mediilor a două eşantioane de volum redus ............................................................ 102

3
Lucrare de verificare 7A .................................................................................................................. 108
Test de autoevaluare 7B ................................................................................................................... 109
Rezumat .......................................................................................................................................... 114
Bibliografie ..................................................................................................................................... 115
Unitatea de învăţare 8 TESTAREA IPOTEZELOR PRIVIND DISPERSIILE
POPULAŢIILOR ........................................................................................................................ 116
Obiectivele Unităţii de Învăţare 8 ..................................................................................................... 116
8.1 Compararea dispersiei eşantionului cu dispersia colectivităţii generale ....................................... 116
8.2 Compararea dispersiei a două colectivităţi.................................................................................. 119
Lucrare de verificare 8A .................................................................................................................. 123
Test de autoevaluare 8B ................................................................................................................... 123
Rezumat .......................................................................................................................................... 125
Bibliografie ..................................................................................................................................... 126
Unitatea de învăţare 9 ANALIZĂ DISPERSIONALĂ (ANOVA) ........................................... 127
Obiectivele Unităţii de Învăţare 9 ..................................................................................................... 127
9.1 Analiza dispersională unifactorială............................................................................................. 127
9.2 Analiza dispersională bifactorială............................................................................................... 133
Lucrare de verificare 9A .................................................................................................................. 143
Test de autoevaluare 9B ................................................................................................................... 143
Rezumat .......................................................................................................................................... 146
Bibliografie ..................................................................................................................................... 146
Unitatea de învăţare 10 DETERMINAREA ŞI TESTAREA CORELAŢIILOR LINIARE
DINTRE VARIABILELE ECONOMICE.................................................................................. 147
Obiectivele Unităţii de Învăţare 10 ................................................................................................... 147
10.1 Corelația liniară simplă......................................................................................................... 147
10.2 Corelația multiplă ................................................................................................................. 152
Lucrare de verificare 10A ................................................................................................................ 155
Test de autoevaluare 10B ................................................................................................................. 156
Rezumat .......................................................................................................................................... 158
Bibliografie ..................................................................................................................................... 158
Unitatea de învăţare 11 MODELUL DE REGRESIE LINIARĂ UNIFACTORIALĂ ............ 159
Obiectivele Unităţii de Învăţare 11 ................................................................................................... 159
11.1 Ipotezele modelului .............................................................................................................. 159

4
11.2 Determinarea și validarea parametrilor modelului linear unifactorial .................................... 163
Lucrare de verificare 11A ................................................................................................................ 180
Test de autoevaluare 11B ................................................................................................................. 180
Rezumat .......................................................................................................................................... 183
Bibliografie ..................................................................................................................................... 184
Răspunsuri la testele de autoevaluare ......................................................................................... 185
Anexa 1 ....................................................................................................................................... 187
Anexa 2 ....................................................................................................................................... 190
Anexa 3 ....................................................................................................................................... 194
Anexa 4 ....................................................................................................................................... 202
Bibliografie ................................................................................................................................. 214

5
Unitatea de învăţare 1
INTRODUCERE ÎN ECONOMETRIE

Cuprins

Obiectivele Unităţii de Învăţare 1 ................................................................................................... 6


1.1. Econometria – definiţii şi obiective ................................................................................................ 6
1.2. Modele econometrice..................................................................................................................... 8
Lucrare de verificare 1A ............................................................................................................... 14
Test de autoevaluare 1B ................................................................................................................ 14
Rezumat ........................................................................................................................................ 16
Bibliografie ................................................................................................................................... 17

Obiectivele Unităţii de Învăţare 1

După studiul acestei unităţi de învăţare, cursanţii vor avea cunoştinţe despre:
• Ce este econometria.
• Principalele obiective ale econometriei.
• Ce este modelul econometric.
• Ce este modelul economic.
• Diferenţa dontre modelele economice şi modelele econometrice.
• Tipologia modelelor econometrice.
• Etapele creării şi utilizării unui model econometric.
• Tipurile de date utlizate în econometrie.

1.1. Econometria – definiţii şi obiective

6
În anul 1930 la Cleveland un grup de cercetători, printre care I. Fisher, L.V.
Borkiewicy, R. Frisch şi H. Hotelling, înfiinţează Societatea de Econometrie. Acesta este şi
momentul care marchează constituirea econometriei1 ca ştiinţă.

Fie sistemul reprezentat în figura 1.3. Variabilele de intrare xi , din punctul de vedere
al sistemului supus analizei, sunt variabile independente (nu depind de sistemul S ). Aceste
variabile influenţează (determină) valorile variabilei (variabilelor) de ieşire Y . Din acest
punct de vedere variabila Y este o variabilă dependentă. În aceste condiţii are loc relaţia:
Y = f (x ) + ε (1.1)
unde:
f este funcţia de transfer a sistemului reprezentând legea de manifestare a procesului

economic studiat;
x = ( xi )i =1, n este vectorul variabilelor independente;

ε este o variabilă aleatoare care exprimă influenţa factorilor întâmplători asupra


variabilei dependente (Y ) .
Cum f nu este apriori cunoscută, ceea ce se urmăreşte este tocmai identificarea
efectelor variabilelor independente asupra unei variabile dependente şi estimarea efectelor
cauzale pe baza datelor de selecţie în raport cu variabilele observabile.
Ţinând seama de aceste obsevaţii dăm în continuare câteva definiţii ale econometriei
ca ştiinţă.

Definiţia istorică a econometriei:


“experienţa a arătat că fiecare din următoarele
puncte de vedere, al statisticii, al teoriei economice şi al matematicii, este o condiţie
necesară, dar nu şi suficientă pentru o înţelegere efectivă a relaţiilor cantitative din
economia modernă; unificarea lor este aceea care asigură eficienţa. Econometria este
tocmai această unificare.”2

Definiţia restrictivă a econometriei:

1
Termenul “econometrie” a fost introdus de economistul şi statisticianul norvegian Ragnar Frisch şi provine
etimologic de la grecescul “eikonomia” – economie şi respectiv “metren” – măsură.
2
Definiţia a fost formulată de R. Frisch în primul număr al revistei Econometrica.

7
Econometria presupune investigarea fenomenelor
economice numai cu ajutorul modelelor aleatoare (stochastice, probabilistice); ea include
doa cercetările economice ce utilizează metodele inducţiei matematice la verificarea
relaţiilor cantitative formulate în teoria economică cu privire la fenimenele sau procesele
studiate3.

Definiţia extinsă a econometriei:


Econometria în sens larg înseamnă econometria în
sens restrâns, la care se adaugă metodele cercetării operaţionale4.
Ca o primă concluzie econometria urmăreşte aplicarea metodelor statistice în scopul
testării şi cuantificării relaţiilor economice ipotetice utilizând date neexperimentale. Ea
implică utilizarea metodelor matematice şi statistice la formularea, estimarea şi testarea
modelelor economice.
Principalele obiective ale econometriei sunt:
 Estimarea relaţiilor economice
 Testarea ipotezelor privind atât comportamentele egenţilor economici cât şi
fenomenele economice.
 Previziunea variabilelor economice.

1.2. Modele econometrice

Pentru a sublinia specificitatea modelelor econometrice vom face o comparaţie a


acestora cu modelele economice.
Schematic, un sistem economic privit prin prisma analizei economice poate fi
reprezentat conform figurii 1.1.
x1 y1
PROCES
x2 y2
ECONOMIC ym
xn

3
Definiţie propusă de Cowles Comission for Research în Econometrics.
4
Definiţe propusă de economiştii anglo-saxoni.

8
Figura 1.1. Proces studiat prin prisma modelării economice

Modelele economice sunt modele deterministe bazate pe abordarea deterministă a


relaţiilor cauzale dintre evenimente. În cazul prezentat în figura 1.4. modelul economic este:
Y = f (X ) (1.2)
unde: X = (xi )i =1,n este vectorul vatiabilelor independente (cauzale)

( )
Y = yj j =1.m
este vectorul variabilelor dependente (rezultative).

După cum se poate observa, modelele economice nu conţin elemente stochastice şi


nu ţin seama de evenimente întâmplătoare. In studiul relaţiilor dintre două variabile
economice se face ipoteza5 că toate celelalte variabilele au valori constante (rămân
neschimbate) pe durata perioadei de studiu.
Spre deosebire de modelele economice, modelele econometrice sunt modele
stochastice care se deosebesc de modelele economice prin faptul că includ pe lângă elemente
deterministe şi cel puţin un element stochastic (figura 1.2).

ε
x1 y1
PROCES
x2 y2
ECONOMIC ym
xn

Figura 1.2. Proces studiat prin prisma modelării econometrice


În cazul modelelor econometrice, pe lângă influenţele variabilelor independente, este
evidenţiată şi influenţa factorilor cu acţiune întâmplătoare (reziduali) asupra variabilelor
dependente. În abordarea econometrică a procesului studiat relaţia (1.2) devine:

Y = f (X ) + ε (1.3)
La construirea şi utilizarea modelelor econometrice (figura 1.6) se porneşte de la
teoria economică pe baza căreia se construieşte un model care se presune că descrie relaţiile
cauzale dintre una sau mai multe variabile independente şi o variabilă dependentă (rezultat)
şi se obţine într-o primă fază un model economic. În funcţie de numărul de ecuaţii se
5
Ipoteza ceteris paribus.

9
introduc în model una sau mai multe variabile stochastice şi se obţine modelul econometric al
fenomenului studiat.
Pe baza datelor de selecţie reprezentând valorile variabilelor observabile din model se
estimează valorile parametrilor modelului obţinându-se o funcţie de date de observaţie (un
estimator).
Se validează modelul econometric obţinut în raport cu anumite condiţii (convergenţă,
verosimilitate etc.). Dacă modelul nu este valid se încearcă găsirea altui model care, în raport
cu condiţiile impuse sa fie valid (corect).
Dacă modelul este corect atunci acesta poate fi utilizat la testarea ipotezelor privind
valorile numerice ale parametrilor necunoscuţi ai populaţiei din care a fost selectat
eşantionul. De asemenea, validitatea modelului oferă posibilitatea efectuării unor predicţii ale
comportamentului populaţiei respective.

Teorie economică Populaţie studiată

Selecţie
Model economic
Date de selecţie
Model econometric

Estimare

Validare

NU
Model valid?

DA

Testare ipoteze

Politici economice:predicţii/prognoză

Figura 1.3. Etape în practica econometrică

10
Modelele econometrice formează o submulţime de modele inclusă în mulţimea modelelor
economico-matematice care, la rândul lor, pot fi categorisite după diferite criterii printre care
menţionăm:
o După numărul de ecuaţii
- modele cu o singură ecuaţie (conţin o singură variabilă rezultativă y , indiferent
de numărul n al elementelor vectorului variabilelor cauzale
X = (xi )i =1,n ) y = f ( X ) + ε

- modele cu mai multe ecuaţii (conţin mai multe variabile rezultative


( )
Y = yj j =1.m
) Y = f (X ) + ε

o După numărul factorilor luaţi în considerare:


- modele unifactoriale
y = f (x) + ε

- modele multifactoriale
y = f (x1 , x 2 , K , x n ) + ε

o După forma dependenţei dintre variabilele independente (cauzale) şi cele dependente


(rezultative)
- modele liniare (există dependenţă liniară între variabilele rezultative şi cele
cauzale)
- modele neliniare (dependenţa este neliniară)
o În raport cu factorul timp:
- modele statice (dependenţele dintre variabilele modelului se referă la aceleşi
moment (perioadă) de timp
- modele dinamice care, la rândul lor pot fi
 modele dinamice cu variabila timpul (t ) explicită
y = f (xt , t ) + ε i

 modele autoregresive
y = f (x t , y t −k ) + ε

 modele cu decalaj
y = f ( x t , x t −1 , K , x t − k ) + ε

11
Ca şi în cazul general al modelelor economico-matematice, în structura unui model
econometric intră variabilele modelului şi relaţiile dintre variabilele acestuia.
Pe lângă tipurile de variabile prezentate până acum (Variabile independente - cauzale
sau explicative -, variabile dependente - rezultative; variabile deterministe, variabile
stochastice; variabile endogene, variabile exogene) ne mai oprim asupra categorisirii
variabilelor modelelor econometrice în funcţie de valorile pe care le pot lua, şi anume:
 Variabile cantitative. Provin din caracteristici care exprimă atribute cantitative ale
elementelor unei populaţii. Caracteristica principală a variabilelor catitative este
faptul ca iau valori dintr-o scară continuă, cu valorile lor putându-se efectua operaţii
aritmetice. În analizele econometrice, indicatorii statistici relevanţi calculaţi pe baza
valorilor observate sunt media şi abaterea medie pătratică.
 Variabile categoriale (calitative) Provin din carscteristici care exprimă atribute
calitative. Denumirea acestora provine de la faptul că au două sau mai multe nivele de
valori numite categorii. La rândul lor, variabilele categoriale pot fi grupate în:
o Variabile nominale. Valoarea reprezintă codul unei categorii careia îi aparţine
elementul respectiv al pupulaţiei. De exemplu, variabila stare civilă poate
avea codificările:

1 -necăsătorit, 2 – casatorit, 3 – divorţat, 4 – văduv.

o Variabile binare. Au numai două niveluri de valori care descriu complet o


caracteristică a unui element al populaţiei. De exemplu, pentru populaţia
studenti, variabila promovat poate lua două valori:

0 – Nu (nepromovat), 1- Da (promovat).

o Variabile ordinale. Sunt variabile ale căror nivele sunt codificate astfel încât
să poată fi comparate între ele. De exemplu, variabila calitativă satisfacţie a
cărei valoare este dată de răspunsul la întrebarea:

12
Sunteţi mulţumit de calitatea serviciilor hotelului nostru? (2) – foarte
mulţumit; (1) – mulţumit; (0) – indiferent;
(-1) – nemulţumit; (-2) – foarte nemuţumit;

este o variabilă calitativă ordinală.


Relaţiile unui model econometric exprimă dependenţele dintre variabilele cauzale şi
cele rezultative şi pot fi:
• relaţii de identitate – sunt relaţii deterministe privind procesul economic supus
analizei (de exemplu exprimarea profitului ca diferenţă între venituri şi cheltuieli
Pr = V − C );
• relaţii de comportament – exprimă comportamente ale agenţilor economici;
• relaţii tehnologice – exprimă dependeţe dintre variabile care descriu procese
tehnologice (de exemplu funcţiile de producţie);
• relaţii instituţionale – introduc în modelul econometric reglementări impuse de
legislaţia în domeniul procesului economic supus analizei.

Utilizarea modelelor econometrice în studiul proceselor şi fenomenelor economice se


bazează pe datele primare culese prin diverse modalităţi. Din punct de vedere cronologic,
datele primare utilizate într-un model econometric pot îmbrăca trei forme:
 date de tip transversal sau profil (cross-sectional). Măsurătorile asupra
caracteristicilor unui număr mare de elemente ale unei populaţii efectuate la acelaşi
moment de tip. Datele de tip transversal sunt obşnuite prin măsurători de natură
statică şi se caracterizează prin observaţii independente.
 date de tip serii de timp. (serii cronologice). Măsurători asupra caracteristicilor unei
unităţi individuale pe o perioadă lungă de timp. Datorită modului de constituire,
obervaţii indexate în timp, datele de tip serie de timp sunt caracterizate prin
dependenţă serială. Acest tip de date se obţine prin măsurători de natură dinamică
asupra caracteristicilor unui element din populaţie la momente sau intervale succesive
de timp
 date de tip panel. Sunt obţinute prin măsurători atât de natură statică căt şi dinamică
asupra aceloraşi elemente ale populaţiei.

13
Lucrare de verificare 1A

Răspundeţi pe scurt la următoarele întrebări:

1. Ce este econometria?
2. Care sunt principalele obiective ale econometriei?
3. Ce este modelul econometric?
4. Care este diferenţa dintre modelele economice şi modelele econometrice?
5. Care este tipologia modelelelor econometrice?
6. Ce tipuri de date sunt utilizate în econometrie.
7. Care este schema care prezintă etapele creării şi utilizării unui model econometric?

Test de autoevaluare 1B

1. Econometria implică utilizarea:


a. metodelor matematice la formularea, estimarea şi testarea modelelor
economice;
b. metodelor matematice şi statistice la formularea, estimarea şi testarea
modelelor economice;
c. metodelor matematice şi statistice la formularea modelelor economice;
d. metodelor matematice şi statistice la estimarea modelelor economice.

2. Principalele obiective ale econometriei sunt:


a. estimarea relaţiilor economice;
b. testarea ipotezelor privind atât comportamentele egenţilor economici cât şi
fenomenele economice;
c. previziunea variabilelor economice;
d. previziunea comporatmentului agenților economici;

A: a+b+c; B: a+b+d; C: b+c+d; D: a+c+d.

3. Relaţiile unui model econometric exprimă:

14
a. dependenţele dintre variabilele cauzale şi cele rezultative;
b. independenţa dintre variabile;
c. dependenţele dintre variabilele cauzale;
d. dependenţele dintre variabilele rezultative;

4. După numărul de ecuaţii modelele econometrice sunt:


a. modele cu o singură ecuație și modele cu două ecuații;
b. modele cu o singură ecuație și modele cu mai multe ecuații;
c. modele statice și modele dinamice.
d. modele unifactoriale și modele bifactoriale;

5. În funcţie de valorile pe care le pot lua, variabilelor modelelor econometrice se


clasifică astfel:
a. variabile exogene si variabile endogene;
b. variabile cantitative și varialbile calitative;
c. variabile dependente și variabile independente;
d. variabile cauzale și variabile deterministe.

6. Exprimarea profitului ca diferenţă între venituri şi cheltuieli Pr = V − C este o relație


de:
a. comportament;
b. tehnologică;
c. instituțională;
d. identitate.

7. Utilizarea modelelor econometrice în studiul proceselor şi fenomenelor economice se


bazează pe:
a. date secundare;
b. date auxiliare;
c. date primare;
d. date prelucrate.

15
8. Ce date sunt obţinute prin măsurători atât de natură statică căt şi dinamică asupra
aceloraşi elemente ale populaţiei:
a. date de tip serii de timp;
b. date de tip panel;
c. date de tip transversal;
d. date de tip profil.

9. Variabile categoriale provin din caracteristici care exprimă atribute:


a. calitative;
b. normale;
c. cantitative;
d. primare.

10. Variabile ale căror nivele sunt codificate astfel încât să poată fi comparate între ele
sunt;
a. variabile ordinale;
b. variabile cantitative;
c. variabile binare;
d. variabile primare.

Rezumat

Econometria este o ştiinţă care urmăreşte investigarea fenomenelor economice numai


cu ajutorul modelelor aleatoare utilizând metodele inducţiei matematice la verificarea
relaţiilor cantitative formulate în teoria economică cu privire la fenomenele sau procesele
studiate.
Spre deosebire de modelele economice deterministe bazate pe abordarea deterministă
a relaţiilor cauzale dintre evenimente, modelele econometrice sunt modele stochastice care
includ pe lângă elemente deterministe şi elemente aleatoare.
Construirea şi utilizarea modelelor econometrice porneşte de la teoria economică pe
baza căreia se construieşte un model care se presupune că descrie relaţiile cauzale dintre una

16
sau mai multe variabile Pe baza datelor de selecţie reprezentând valorile variabilelor
observabile din model se estimează valorile parametrilor modelului. După validarea
modelului pe baza acestuia se pot efectua predicţii ale comportamentului populaţiei
respective.
Modelele econometrice, pot fi categorisite după diferite criterii printre care după
numărul ecuaţiilor (cu o singură ecuaţie, cu mai multe ecuaţii), numărul factorilor
(unifactoriale), multifactoriale), forma dependenţei dintre variabile (liniare, neliniare),modul
în care este considerat factorul timp (madele statice, modele dinamice) etc.

Bibliografie

Gogonea R.M., Zaharia Econometrie cu aplicaţii în activitatea de comerţ-turism-


M. servicii, Editura Universitară, Bucureşti, 2008,
Isaic-Maniu A., Mitruţ
Statistică, Editura Universitară, Bucureşti, 2003
C.,
Voineagu V.
Jaba E. Statistică, Editura Economică, Bucureşti, 1998

Statistică,ediţia a treia-revizuită, Editura Economică,


Jaba E.
Bucureşti, 2002

17
Unitatea de învăţare 2
NOŢIUNI PRIVIND VARIABILELE ALEATOARE

Cuprins

Obiectivele Unităţii de Învăţare 2 ................................................................................................. 18


2.1. Eveniment. Câmp de Evenimente ................................................................................................ 19
2.2. Variabile aleatoare ...................................................................................................................... 22
Lucrare de verificare 2A ............................................................................................................... 29
Test de autoevaluare 2B ................................................................................................................ 29
Rezumat ........................................................................................................................................ 30
Bibliografie ................................................................................................................................... 31

Obiectivele Unităţii de Învăţare 2

După studierea acestei unităţi de învăţare, cursanţii vor avea cunoştinţe despre teoria
probabilităţilor, şi anume:
• Ce este evenimentul.
• Tipuri de evenimente
• Ce este câmpul de evenimente
• Ce sunt variabilele aleatoare
• Ce sunt variabilele aleatore discrete
• Distribuţia variabilei aleatoare discrete
• Histograma şi pologonul distribuţeiei variabilei aleatoare discrete
• Funcţia de repartiţie a variabilei aleatoare discrete
• Ce sunt variabilele aleatoare continue
• Distribuţia variabilei aleatoare continue
• Reprezentarea grafică a variabilei aleatoare continue
• Funcţia de repartiţie a variabilei aleatoare continue

18
2.1. Eveniment. Câmp de Evenimente

Din punct de vedere al analizelor ce vor fi efectuate pe parcursul acestei lucrări orice
mulţime de elemente care printr-o proprietate comună pot fi considerate împreună constituie o
populaţie. Vom nota populaţia cu Γ , iar cu ϕ ∈ Γ un element generic al său. De exemplu, o
colectivitate de indivizi care au calitatea de a fi studenţi formează o populaţie.
Dacă în raport cu elementele populaţiei Γ considerăm una sau mai multe proprietăţi
spunem că am constituit un criteriu de cercetare. Astfel, dacă în raport cu populaţia „studenţi”
considerăm proprietatea de a fi integralist, am constituit un criteriu de cercetare.
Relizarea complexului de condiţii corespunzătoare criteriului de cercetate se numeşte
experienţă6. În sens larg, experienţa reprezintă un act care poate fi repetat în condiţii date şi care
permite verificarea practică a cunoştinţelor privind diverse fenomene şi procese din realitate.
O noţiune fundamentală în teoria probabilităţilor este cea de eveniment.

Definiţa 2.1. Evenimentul exprimă producerea sau neproducerea unui fenomen în cadrul unui
experienţe.
Evenimentul este rezultatul unui experiment (probă). Dacă în exemplul considerat mai
sus selectăm la întâmplare un element (student) din populaţia studenţi şi dacă acesta este
integralist, în raport cu criteriul ales, evenimentul evidenţiază producera fenomenului de
promovare a tuturor examenelor. Dacă studentul selectat nu este integralist, atunci evenimentul
evidenţiază neproducerea fenomenului de promovare a tuturor exemenelor.

Exemplul 2.1.
Să considerăm că dorim să vedem care sunt rezultatele posibile obţinute prin însumarea
feţelor a două zaruri care au fost aruncate.
Considerând că zarurile nu sunt măsluite, ţinând seama de faptul că feţele acestora pot lua
valori de la 1 la 6, atunci rezultă că suma feţelor la o aruncare poate avea valori în intervalul de
la 2 la 12 (2,3,4,5,6,7,8,9,10,11,12). Sumele feţelor, obţinute în toate cele 36 de combinaţii
posibele, sunt prezentate în tabelul 2.1.

6
Mihăilă N.,Popescu O., “Matematici speciale aplicate în economie”, Editura didactică şi pedagogică, Bucureşti,
1978.

19
Tabelul 2.1. Sumele feţelor obţinute prin aruncarea a două zaruri

Faţă zarul I
1 2 3 4 5 6
1 2 3 4 5 6 7
Faţă 2 3 4 5 6 7 8
zarul 3 4 5 6 7 8 9
II 4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12

După cum se poate observa şi din tabelul 2.1 sunt numai n = 11 evenimente elementare
posibile (2,3,4,5,6,7,8,9,10,11,12).
Notăm: - cu Ω mulţimea tuturor evenimentelor
- cu ωi ∈ Ω evenimentul elementar i ,
Atunci,
{ωi }i =1,n reprezintă mulţimea evenimentelor elementare ale lui Ω .

În cazul exemplului considerat mulţimea evenimentelor elementare este:


{ωi }i=1,n = {2,3,4,5,6,7,8,9,10,11,12} (2.1)

Această mulţime reprezintă o parte (submulţimi) a mulţimii Ω .


Pe lângă mulţimea evenimentelor elementare {ωi }i =1,n , mulţimea Ω conţine şi o serie de

alte evenimente obţinute din combinarea evenimentelor elementare, care formează, de asemenea,
părţi ale mulţimii Ω (submulţime).
De exemplu, un alt eveniment din mulţimea Ω poate fi “suma feţelor cuprinsă între 3 şi
12”, notat cu α .
Vom nota în continuare mulţimea tuturor evenimentelor (elementare şi neelementare) cu
{ei }i =1, N
Fiecărui eveniment ei i se poate asocia un eveniment contrar Cei (complementar) care

se realizează atunci şi numai atunci când nu se realizează ei . De exemplu, evenimentului ω1

(suma feţelor egală cu 2) îi corespunde evenimentul complementar Cω1 = α (“suma feţelor să


fie cuprinsă între 3 şi 12”).
Definiţia 2.2.
Se numeşte eveniment sigur acel eveniment care se poate realiza în oricare din probe.

20
În cazul prezentat, evenimentul sigur reprezintă apariţia unei valori cuprinse în intervalul
închis de la 2 la 12. În consecinţă, evenimentul sigur în cazul dat este chiar mulţimea Ω .
Evenimentului sigur Ω i se asociază evenimentul imposibil notat cu Φ .
Oricare din evenimentele ei care pot să se producă sau nu la efectuarea unei probe
reprezintă un eveniment aleator.
Între două evenimente pot exista sau nu pot apărea relaţii de implicare. Dacă realizarea
evenimentului ei atrage după sine realizarea evenimentului e j (i ≠ j ) , atunci ei ⊂ e j adică

evenimentul ei implică evenimentul e j .

Dacă ei ⊂ e j (evenimentul ei implică evenimentul e j ) şi ei ⊃ e j (evenimentul ei este

implicat în realizarea evenimentului e j ) atunci evenimentele ei şi e j sunt echivalente.

Anterior au fost evidenţiate, printre altele, noţiunile de eveniment sigur, eveniment


aleator, mulţime de evenimente.
Am notat cu Ω evenimentul sigur şi cu {ei }i =1,n mulţimea tuturor evenimentelor aleatoare

care formează mulţimea Ω , iar în continuare vom considera un Κ ca fiind mulţimea nevidă a
părţilor lui Ω care conţine toate evenimentele aleatoare {ei }i =1, N cu N finit.

Definiţia 2.3.
Perechea [Ω, Κ ] reprezintă un câmp finit de evenimente dacă:
 ∀ei ∈ Κ ⇒ Cei ∈ Κ ;

 ∀ei ∧ e j ∈ Κ ⇒ ei U e j ∈ Κ .

Elementele {ei }i =1, N formează un sistem complet de evenimente dacă:


N
 Ue i =Ω
i =1

 ei I e j = Φ∀i ≠ j.

Fie acum, {ωi }i =1,n o submulţime a mulţimii evenimentelor elementare ale câmpului de

evenimente [Ω, Κ ] . Mulţimea {ωi }i =1,n are următoarele proprietăţi:

 ωi ≠ Φ∀i = 1, n
 ωi I ω j = Φ∀i ≠ j

21
n
 Uω = Ω
i =1
i

 ∃ a ∈ [Ω, Κ ], a ≠ ω i , i = 1, n, a.i. a = ω i1 U ... U ω i p ,1 ≤ p ≤ n.

Este uşor de observat că mulţimea evenimentelor elementare din relaţia 2.1 satisface
proprietăţile de mai sus.
Trebuie remarcat aici faptul că, în relaţia 2.1 sunt puse în evidenţă numai evenimentele,
nu şi frecvenţele lor de apariţie. Fiecărui eveniment îi corespunde o anumită frecvenţă de
apariţie. Acestea pot fi egale sau nu.

Exemplul 2.2.
Frecvenţa de apariţie a evenimentelor elementare obţinute prin aruncarea a două zaruri este
calculate în tabelul 2.2.
Tabelul 2.2. Frecvenţa de apariţie a evenimentelor elementare obţinute prin aruncarea a două zaruri

Valoare 2 3 4 5 6 7 8 9 10 11 12
Frecvenţă 1 2 3 4 5 6 5 4 3 2 1

După cum se poate observa şi din tabelul 2.1 în cazul considerat frecvenţele de apariţie a
evenimentelor elementare diferă. Dacă le centralizăm obţinem situaţia din tabelul 1.2.
Frecvenţele de apariţie ale evenimentelor iau valori între 1 şi 6.

2.2. Variabile aleatoare

Mediul economic real, bazat pe competiţie, prin dinamica şi complexitatea sa este


caracterizat de numeroase variabile ale căror valori sunt cunoscute cu certitudine numai după
producerea lor. De exemplu, numărul turiştilor cazaţi într-o zi la un hotel reprezintă variabile ale
căror valori efective sunt cunoscute numai la sfârşitul zilei. Din păcate, în practică valorile
acestor variabile constituie elemente decizionale importante care declanşează acţiuni anterioare
lor (de exemplu aprovizionarea cu alimente). Neputând fi însă cunoscute este necesar să facem
anumite presupuneri (ipoteze) privind valorile lor, ipoteze care aşa cum se va vedea pe parcursul
capitolelor viitoare trebuiesc verificate.

22
Definiţia 2.4.
Se numeşte variabilă aleatoare (stohastică) acea variabilă a cărei realizare constituie
evenimente întâmplătoare dintr-o mulţime care are un sistem determinat de evenimente.
După caracteristicile mulţimii pe care sunt definite, variabilele aleatoare se clasifică în:
• variabile aleatoare discrete definite pe mulţimi discrete cu număr finit de elemente;
• variabile aleatoare continue definite pe mulţimi continue reprezentate printr-un interval
finit sau infinit din ℜ .
Variabilele aleatoare se notează cu litere mari, iar valorile lor cu litere mici
corespunzătoare acestora. De regulă, sunt utilizate literele de la sfârşitul alfabetului (de exemplu,
variabila aleatoare X are la un moment dat valoarea x ).

♦ Variabile aleatoare discrete


Pentru a caracteriza o variabilă aleatoare ne oprim în cele ce urmează asupra
următoarelor aspecte:
• Distribuţia variabilei aleatoare discrete
• Histograma şi poligonul distribuţiei
• Funcţia de repartiţie
 Distribuţia variabilei aleatoare discrete
Pentru a defini o variabilă aleatoare discretă este necesară enumerarea tuturor valorilor
posibile precum şi a probabilităţilor lor de producere.

Exemplul 2.3.
Aşa cum se poate observa din tabelul 2.2 la aruncarea a două zaruri este posibilă
obţinerea a 11 valori. Variabila aleatoare care modelează acest proces va fi:
 2 3 4 5 6 7 8 9 10 11 12 
Z : 1 2 3 4 5 6 5 4 3 2 1 
 
 36 36 36 36 36 36 36 36 36 36 36 
Definiţia 2.5.
Fie X o variabilă aleatoare discretă cu xi , i = 1, n , valoarea acesteia la un moment dat şi
evenimentul ( X = xi ) cu probabilitatea P( X = xi ) = f ( xi ) = pi . Mulţimea perechilor ordonate

(xi , f (xi ))i =1,n se numeşte distribuţia variabilei aleatoare discrete.

23
Simbolic variabila aleatoare X se notează cu:
 x  x 
X  i  sau X  i , i = 1, n (2.2)
 f ( xi )   pi 

unde xi este argumentul variabilei aleatoare, iar f ( xi ) funcţia de probabilitate, cu proprietăţile:

10 f(xi ) ≥ 0

n
20 ∑ f(x ) = 1
i =1
i deoarece Ei = ( X = xi ), i = 1, n , constituie un sistem complet de

evenimente.

 Histograma şi poligonul distribuţiei discrete


În cazul variabilei aleatoare discrete funcţia de probabilitate pi = f ( xi ), i = 1, n , este o

funcţie definită grafic de punctele M ( xi , pi ) .

Luând pe axa absciselor valorile consecutive ale argumentului xi , se obţin intervale7,

astfel încât mijlocul intervalului de ordinul i este considerat ca punct xi , iar pe ordonată valorile

funcţiei de probabilitate se obţin cu aria numeric dată de p i . Totalitatea acestor dreptunghiuri


constituie histograma distribuţiei.

Exemplul 2.4.
Pentru variabila aleatoare care modelează procesul de aruncare a două zaruri histograma
este este ilustrată în figura 2.1.
Dacă notăm cu M i ( xi , p i ) mijloacele segmentelor din partea de sus a dreptunghiurilor şi
le unim prin segmente de drepte, se obţine poligonul distribuţiei.

7
La constituirea histogramei trebuie să se ţină seama de tipul intervalelor de grupare. Dacă intervalele sunt egale
(ca in exemplul nostru) fiecare interval este luat egal cu unitatea de lungime. Dacă intervalele nu sunt
egale atunci acestea se dimensionează în aşa fel încât suprafaţa unei coloane să fie proporţională cu
produsul dintre mărimea intervalului şi frecvenţa sa.

24
Histogram
7
6
Frequency

5
4
3
2
1
0
2 3 4 5 6 7 8 9 10 11 12 More

Figura 2.1. Histograma procesului de aruncare a două zaruri

 Funcţia de repartiţie a variabilei discrete


O caracteristică importantă a unei variabile aleatoare o reprezintă funcţia de repartiţie

Definiţia 2.6.
Se numeşte funcţie de repartiţie a variabilei aleatoare X , funcţia:
F ( x) = P( X < x)

unde evenimentul ( X < x) este dat de: ( X < x ) = U (X = x )


xi ≤ x
i

Cum evenimentele ( X = xi ), i = 1, n sunt incompatibile, atunci:

P( X < x ) = ∑ P( X = x ) = ∑ f ( x ) , deci
xi ≤ x
i
xi ≤ x
i

F ( x) = P ( X < x ) = ∑ f ( x ),
xi ≤ x
i

Considerând graficele distribuţiei variabilei aleatoare, discrete, funcţia de repartiţie F (x)


este suma probabilităţilor pi = f ( xi ) de la stânga punctului de abscisa x , sau suprafaţa

histogramei de la stânga punctului de abscisa x .

Exemplul 2.5.
În cazul aruncării a două zaruri determinăm probabilitatea de a obţine o sumă a feţelor
mai mică decât 6 .
Pornim de la variabila aleatoare:

25
 2 3 4 5 6 7 8 9 10 11 12 
Z : 1 2 3 4 5 6 5 4 3 2 1 
 
 36 36 36 36 36 36 36 36 36 36 36 
şi stabilim funcţia de repartiţie ca fiind:
F (6) = P(Z < 6) = suma probabilităţilor p i de la stânga lui 6.
1 2 3 4 10
F ( 6) = P ( Z < 6) = + + + = ≈ 0,277778
36 36 36 36 36

Funcţia de repartiţie numită şi funcţia cumulativă a probabilităţilor, F ( x) = P ( X < x) are


următoarele proprietăţi:
1 0 .0 ≤ F ( x) ≤ 1

2 . Funcţia F(x) este nedescrescătoare. Dacă x1 < x2 sunt două valori ale argumentului
0

variabilei X, atunci deoarece

F ( x 2 ) − F ( x1 ) = P( x1 ≤ X < x 2 ) ≥ 0
rezultă:
F ( x 2 ) − F ( x1 ) ≥ 0, deci F ( x 2 ) ≥ F ( x1 ) .

3 0 . F(a)=0, F(b)=1 , unde a şi b sunt cea mai mică, respectiv cea mai mare valoare pe care o
poate lua argumentul variabilei X .

♦ Variabile aleatoare continue

Ca şi în cazul variabilelor aleatoare discrete ne vom opri asupra următoarelor aspecte:


• Distribuţia variabilei aleatoare continue
• Reprezentarea grafică a distribuţiei variabilei aleatoare continue
• Funcţia de repartiţie a variabilei aleatoare continue

 Distribuţia variabilei aleatoare continue


Analog variabilei aleatoare discrete, variabila aleatoare continuă X se defineşte prin:
 x 
X :   cu x ∈ [a, b ] (2.3)
 ϕ ( x) 

26
Definiţia 2.7.
 x 
Fie variabila aleatoare X :   cu x ∈ [a, b ] , funcţia ϕ (x) se numeşte densitatea de
 ϕ ( x) 
probabilitate a variabilei aleatoare X .
Funcţia densitate de probabiitate ϕ (x ) se bucură de proprietăţile:

1 0 . ϕ ( x ) ≥ 0 , deoarece dP ≥ 0 şi dx > 0
b
2 0 . ∫ ϕ ( x)dx = 1 . .
a

 Reprezentarea grafică a distribuţiei


În cazul variabilei aleatoare continue funcţia densitate de probabilitate ϕ (x ) , x ∈ [ a, b] ,
reprezentată grafic este o curbă continuă numită curba de distribuţie, iar histrograma
corespunzătoare este un trapez curbiliniu.
 x 
Fie variabila aleatoare: X :  
− x , x ≥ 0 Funcţia densitate de probabilitate este
ϕ ( x) = e 
reprezentată grafic în figura 2.2.:

ϕ (0 ) = 1

ϕ ( x) = e −1

S=1
0
x

Figura 2.2. Graficul funcţiei densitate de probabilitate ϕ ( x) = e −1

Suprafaţa haşurată S este egală cu unitatea, verificând proprietatea 20 a funcţiei densitate


de probabilitate.
 Funcţia de repartiţie a variabilei continue
Probabilitatea ca o variabilă aleatoare să ia valori într-un anumit interval este dată de
funcţia de repartiţie a variabilei respective.

27
Definiţia 2.8.
 x 
Fie variabila aleatoare X :   cu x ∈ [a, b ] şi funcţia densitatea de probabilitate
 ϕ ( x) 
ϕ (x) .
Funcţia

F ( x ) = P( X < x) = ∫ ϕ (t )dt
x
(2.4)
a

reprezintă funcţia de repartiţie a variabilei aleatoare X


În cazul variabilei aleatoare continue, derivata funcţiei de repartiţie reprezintă funcţia
densitate de probabilitate.
dF ( x )
= ϕ ( x) (2.5)
dx
Ţinând seama de interpretarea geometrică a integralei definite, rezultă că, funcţia de
repartiţie reprezintă aria din histogramă pe intervalul [ a, x] .

ϕ (x)

1
x

P( X < x) = F ( x) = ϕ (t )dt
0

ϕ ( x) = e − x

P ( X < 2)
0 x =1 x=2 x

Figura 2.3. Graficele funcţiei densitate de probabilitate ϕ ( x) = e − x

x
şi al funcţiei de repartiţie P( X < x) = F ( x) = ∫ ϕ (t )dt
0

Pentru variabila aleatoare:


 x 
x ≥ 0 avem F (2 ) = P ( X < 2) =
2
X :  
− x ,
 ϕ ( x) = e 
∫ ϕ ( x)dx
0

care este reprezentată grafic în figura 2.3, prin suprafaţa haşurată:

28
Lucrare deverificare 2A

Răspundeţi pe scurt la următoarele întrebări:

1. Ce reprezintă un eveniment?
2. Cum de defineşte câmpul de evenimente.
3. Ce este variabila aleatoare?
4. Ce tipuri de variabile aleatoare cunoaşteţi?
5. Ce este variabila aleatore discretă?
6. Care sunt caracteristicile variabilei aleatoare?
7. Ce este variabila aleatoare continuă?
8. Ce înţelegeţi prin distribuţia variabilei aleatoare?
9. Care este funcţia de repartiţie a variabilei aleatoare continue?
10. Cum se reprezintă grafic variabila aleatoare continuă?

Test de autoevaluare 2B

1. Frecvenţa de apariţie a evenimentelor elementare obţinute prin aruncarea a două zaruri


este:
a. 6;
b. cuprinsă între 1 și 6;
c. cuprinsă între 3 și 6;
d. 3.

2. Variabilă aleatoare este acea variabilă


a. care îşi poate schimba conţinutul o dată sau de mai multe ori pe parcursul
prelucrării;
b. a cărei realizare constituie evenimente întâmplătoare dintr-o mulţime care are un
sistem determinat de evenimente;
c. care poate fi clasificată în mai mult de două subcategorii;
d. care poate fi cuantificată sau măsurată;
3. După caracteristicile mulţimii pe care sunt definite, variabilele aleatoare se clasifică în:

29
a. variabile aleatoare nominale și variabile ordinale;
b. variabile aleatoare calitative și variabile aleatoare cantitative;
c. variabile aleatoare discrete și variabile aleatoare continue;
d. variabile aleatoare primare și variabile aleatoare secundare.

4. Variabile aleatoare continue reprezintă


a. variabile ce pot fi cuantificate;
b. mulţimi continue reprezentate printr-un interval finit sau infinit din ℜ ;
c. mulțimi de evenimente;
d. variabile ce nu pot fi cuantificate;

5. Variabile aleatoare discrete sunt definite


a. pe mulțimi discrete cu număr infinit de elemente;
b. pe mulţimi discrete cu număr finit de elemente;
c. pe mulțimi cu elemente;
d. pe mulțimi de elemente.

Rezumat

În analiza fenomenelor economice cu ajutorul modelelor econometrice se operează cu


noţiuni precum: populaţie (mulţime de elemente care printr-o proprietate comună pot fi
considerate împreună), criteriu de cercetare, experienţă (relizarea complexului de condiţii
corespunzătoare criteriului de cercetate), eveniment (exprimă producerea sau neproducerea unui
fenomen în cadrul unui experienţe).

Un eveniment care la efectuarea unei probe poate să se producă sau nu reprezintă un


eveniment aleator. Fie Ω evenimentul sigur şi cu {ei }i =1,n mulţimea tuturor evenimentelor

aleatoare care formează mulţimea Ω , Elementele {ei }i =1, N formează un sistem complet de
N
evenimente dacă: Ue i = Ω şi ei I e j = Φ∀i ≠ j.
i =1

30
Se numeşte variabilă aleatoare acea variabilă a cărei realizare constituie evenimente
întâmplătoare dintr-o mulţime care formează un sistem complet de evenimente. După
caracteristicile mulţimii pe care sunt definite variabilele aleatoare pot fi discrete sau continue.

În analiza fenomenelor economice, bazată pe modele econometrice, sunt utilizate în


principal variabile aleatoare discrete.

Bibliografie

Andrei T. Statistică şi econometrie, Editura Economică, Bucureşti,


2003

Bădiţă M., Baron T., Statistică pentru afaceri, Editura Eficient, Bucureşti, 1998
Korka M.
Chow G. Econometrics, McGraw Hill, New York, 1989

Clocotici V. Statistică aplicată în psihologie, Editura Polirom,


Bucureşti, 2000

Gogonea R.M., Zaharia


M. Econometrie cu aplicaţii în activitatea de comerţ-turism-
servicii, Editura Universitară, Bucureşti, 2008,

31
Unitatea de învăţare 3
CARACTERISTICILE DISTRIBUŢIEI VARIABILEI ALEATOARE

Cuprins
Unitatea de învăţare 3 CARACTERISTICILE DISTRIBUŢIEI VARIABILEI ALEATOARE 32
Obiectivele Unităţii de Învăţare 3 ............................................................................................. 32
3.1 Indicatorii caracteristici variabilei aleatoare privind tendinţa centrală de grupare ............. 33
3.2 Indicatorii caracteristici variabilei aleatoare privind împrăştierea distribuţiei variabilei
aleatoare .................................................................................................................................... 36
3.3 Particularităţi ale formei de distribuţie ................................................................................ 41
Lucrare de verificare 3A ........................................................................................................... 42
Test de autoevaluare 3B ............................................................................................................ 43
Rezumat ..................................................................................................................................... 46
Bibliografie................................................................................................................................ 47

Obiectivele Unităţii de Învăţare 3

După studiul acestei unităţi de învăţare, cursanţii vor avea cunoştinţe despre:
• cunoaşterea indicatoriilor caracteristici variabilei aleatoare privind tendinţa centrală de
grupare (valoarea medie, mediana, modulul),
• cunoaşterea indicatoriilor caracteristici variabilei aleatoare privind împrăştierea
distribuţiei variabilei aleatoare (intervalul de variaţie, dispersia, abaterea medie pătratică,
covarianţa, coeficientul de împrăştiere
• cunoaşterea indicatoriilor caracteristici variabilei aleatoare privind forma distribuţiei
(simetria şi asimetria, boltirea);

32
3.1 Indicatorii caracteristici variabilei aleatoare privind tendinţa centrală de
grupare

În practica aplicaţiilor în economie drept indicatori numerici ai tendinţei centrale de


grupare, sunt frecvent folosiţi:
• valoarea medie,
• mediană,
• modul.

 Valoarea medie
Definiţia 3.1.
Se numeşte valoare medie a unei variabile aleatoare X , discrete sau continue,
expresia:
n n
M ( X ) = ∑ pi xi = ∑ xi f ( xi ), (variabila discretă) (3.1)
i =1 i =1

b
M ( X ) = ∫ xϕ ( x)dx , (variabila continuă) (3.2)
a

 Fie variabila aleatoare discretă X dată prin

 −1 0 1 2 
X :  
 0,2 0,1 0,4 0,3 

Vom determina valoarea medie ca:


M ( X ) = 0,2 ⋅ (−1) + 0,1 ⋅ 0 + 0,4 ⋅ 1 + 0,3 ⋅ 2 = 0,8

 Pentru variabila aleatoare continuă

 x 
X :  
− x , x≥0
ϕ ( x) = e 
∞ ∞
vom avea: M ( X ) = ∫ xe − x dx = Γ(2) = 1 , unde Γ(a ) = ∫ x a −1e − x dx este integrala Γ a lui Euler.
0 0

Proprietăţile valorii medii a unei variabile aleatoare sunt:


 media unei constante este constanta însăşi
M (K ) = k .

33
k
K :  
Fie constanta  1  atunci M ( K ) = k ⋅ 1 = k

 media produsului dintre o constantă şi o variabilă aleatoare este egală cu produsul


dintre constantă şi media variabilei aleatoare
M (k ⋅ X ) = k ⋅ M ( X )

 media sumei a două variabile aleatoare este egală cu suma mediilor acestora
M ( X + Y ) = M ( X ) + M (Y )

 media produsului a două variabile aleatoare independente este egală cu produsul


mediilor lor
M ( X ⋅ Y ) = M ( X ) ⋅ M (Y )

 Valoarea mediană
Definiţia 3.2.
Se numeşte mediana variabilei aleatoare X , acea valoare M e pentru care, variabila
aleatoare are aceeaşi probabilitate de a fi mai mică sau mai mare ca ea, adică:
P( X < M e ) = P( X > M e ) (3.3)
Pentru variabilele aleatoare discrete mediana M e se deduce din

F ( M e ) = 1 − F ( M e ), sau 2 F ( M e ) = 1 .

1
fiind soluţia ecuaţiei: F ( x ) =
2
 Pentru variabila aleatoare discretă
 −1 0 1 2 
X :  
 0,2 0,1 0,4 0,3 
avem P( X < 1) = P ( X > 1) = 0.3 . În consecinţă M e = 1
Me 1
 Pentru variabilele aleatoare continue, mediana M e este soluţia ecuaţiei ∫
i
ϕ ( x)dx =
2
.

 Modul (Valoarea cea mai probabilă)


Definiţia 3.3.

34
Se numeşte modul (valoarea cea mai probabilă) variabilei aleatoare X , acea valoare
pentru care funcţia de pobabilitate f ( xi ) în cazul variabilelor aleatoare discrete, respectiv
densitatea de probabilitate ϕ (x ) în cazul variabilelor aleatoare continue este maximă.
Poziţionările celor trei indicatori ai tendinţei centrale de grupare prezentaţi mai sus
(valoarea medie, mediana şi modulul) sunt ilustrate în figura 3.1.
modulul modulul
mediana mediana
media media

a. Repartiţie asimetrică b. Repartiţie asimetrică


(left skewed) (rhight skewed)

Modulul=mediană=medie

c. Repartiţie simetrică

Figura 3.1. Poziţionarea valorii medii, medianei şi modulului pentru repartiţia simetrică şi
repartiţii asimetrice8

După cum se poate observa din figura 3.1.c., în cazul repartiţiei simetrice poziţiile celor
trei indicatori coincid. În cazul repartiţiilor asimetrice poziţiile medianei şi mediei (în această
ordine) se află în stânga modulului în cazul repartiţiei left skewed (figura 3.1.a.) respectiv în
dreapta modulului în cazul repartiţiei right skewed (figura 3.1.b.).

8
Spircu L., “Analiza datelor. Aplicaţii economice”, Editura ASE, Bucureşti 2005, pag. 19

35
3.2 Indicatorii caracteristici variabilei aleatoare privind împrăştierea
distribuţiei variabilei aleatoare

Gradul de împrăştiere a distribuţiei variabilei aleatoare este analizat în raport cu


următoarele caracteristici:
• extinderea sau intervalul de variaţie,
• abaterea, abaterea absolută medie,
• dispersia,
• abaterea medie pătratică,
• covarianţa
• coeficientul de împrăştiere
• normarea unei variabile aleatoare

∗ Extinderea sau intervalul de variaţie


Caracteristica cea mai simplă a împrăştierii unei variabile se obţine calculând extinderea
(amplitudinea, intervalul de variaţie) dată de diferenţa valorilor extreme ale argumentelor
variabilei, aceste argumente fiind considerate ordonate în ordinea mărimii lor naturale.
Definiţia 3.4.
Dacă a şi b sunt cea mai mică, respectiv cea mai mare valoare a argumentului xi al
variabilei aleatoare X , atunci extinderea este prin definiţie valoarea numerică
ω = b − a sau ω = x max − x min (3.4)

Datorită modului de calcul, extinderea nu poate fi utilizată în cazul variabilelor cu intervalul de


variaţie nemărginit.
Cu toate că acestă caracteristică prezintă unele inconveniente printre care faptul că nu
depinde de toate valorile variabilei X , ci numai de cele extreme şi nu arată modul de repartizare
în jurul centrului de grupare, pentru uşurinţa de calcul, extinderea este utilizată în statistica
controlului de fabricaţie în serie.

∗ Abaterea. Abaterea absolută medie


Definiţia 3.5.

36
Fie variabila aleatoare X şi α o valoare oarecare din intervalul de variaţie respectiv,
se numeşte abatere a variabilei X , variabila aleatoare ξ , al cărui argument este dat de
diferenţa dintre argumentul lui X şi α , adică:

 xi − α 
ξ   , (3.5)
 f ( xi ) 
dacă X este variabilă aleatoare discretă, respectiv
 x −α 
ξ   , (3.6)
 ϕ (x) 
dacă X este variabilă aleatoare continuă.

În practică se lucrează de regulă cu variabila aleatoare ξ = X − M ( X ) numită abaterea


variabilei aleatoare X de la media sa µ = M ( X ) .

Teorema 3.1.
Media abaterii unei variabile X calculată faţă de valoarea medie, µ = M ( X ) ,
este nulă.
 xi − µ 
Demonstraţie: Fie variabila abatere ξ   , avem
 f ( xi ) 
n n n
M (ξ ) = ∑ ( xi − µ ) f ( xi ) = ∑ xi f ( xi ) − µ ∑ f ( xi ) = µ − µ = 0
i =1 i =1 i =1

Dacă în locul abaterii variabilei ξ definită mai sus utilizăm abaterea absolută

 xi − µ 
ξ a   vom avea

 f ( x )
i 

∑x
i =1
i − µ ⋅ f ( xi ) în cazul variabilei aleatoare discrete, respectiv

+∞
∫−∞
x − µ ⋅ ϕ ( x)dx, în cazul variabile aleatoare continue,

care nu mai este nulă şi care, poate caracteriza împrăştierea variabilei aleatoare X în jurul valorii
ei medii m.
 Dispersia

37
Pe lângă abaterea medie absolută definită anterior, o măsură larg utilizată a împrăştierilor
valorilor variabilei aleatoare faţă de media sa este dispersia.

Definiţia 3.6.
Se numeşte dispersie a variabilei aleatoare X , media M (ξ 2 ) a pătratului variabilei
aleatoare de abatere ξ :

(x − µ)2 
ξ 2  
 (3.7)
 f ( x ) 
Dispersia variabilei aleatoare X se notează de regulă fie cu σ x2 , fie cu D(X). În
consecinţă avem:
σ x2 = D( X ) = M (ξ 2 ) = M [( X − M ( X )) 2 ] = M ( X 2 ) − M 2 ( X )
Dacă variabila aleatoare X este discretă, atunci:

n
D ( X ) = ∑ ( xi − µ ) 2 ⋅ f ( xi ) , (3.8)
i =1

Dacă variabila aleatoare X este continuă, atunci:


+∞
D( X ) = ∫ ( x − µ ) 2 ⋅ ϕ ( x)dx. (3.9)
−∞

Dispersia are proprietăţile:


 Dispersia unei constante este nulă: D( K ) = 0 . Această proprietate decurge din

proprietatea mediei unei constante M ( K ) = k , de unde rezultă: D( K ) = (k − k ) 2 ⋅ 1 = 0


 Dispersia sumei a două variabile aleatoare independente este egală cu suma dispersiilor
fiecărei variabile în parte
D( X + Y ) = D( X ) + D(Y ) .

Ţinând seama de proprietăţile mediei şi de definiţia dispersiei avem


D( X + Y ) = M (( X + Y ) 2 ) − 2 M ( X + Y ) M ( X + Y ) + M 2 ( X + Y ) =
= M (( X + Y ) 2 ) − M 2 ( X + Y ) = M ( X 2 + 2 XY + Y 2 ) − M 2 ( X + Y ) =
= M ( X 2 ) + M ( X ) M (Y ) + M (Y 2 ) − M 2 ( X ) − M ( X ) M (Y ) − M 2 (Y ) =
= M ( X 2 ) − M 2 ( X ) + M (Y 2 ) − M 2 (Y ) = D( X ) + D(Y )

 Dispersia diferenţei a două variabile aleatoate independente este egală cu suma


dispersiilor lor

38
D( X − Y ) = D( X ) + D(Y ) sau σ x − y = σ x + σ y .
2 2 2

Într-adevăr avem:
D( X − Y ) = D( X + ( −1)Y ) = D( X ) + ( −1) 2 D(Y ) = D( X ) + D(Y )

 Orice translaţie aplicată argumentului unei variabile aleatoare nu schimbă dispersia


variabilei.
D( X + K ) = D( X ) + D( K ) = D( X ), sau σ x + k = σ x2

 Dispersia produsului dintre o constantă şi o variabilă aleatoare este egală cu produsul


dintre dispersia variabilei şi pătratul constantei
D( K ⋅ X ) = k 2 ⋅ D( X ) sau σ kx2 = k 2 ⋅ σ k2

 Pentru orice transformare liniară aplicată asupra argumentului, de forma: Y = aX + b ,


avem:
D(Y ) = a 2 ⋅ D( X ) . sau σ aX
2
+b = a ⋅ σ x .
2 2

 Generalizând pentru un sistem { X k } de n variabile mutual independente, asupra cărora

se aplică transformarea liniară a k X k + bk avem:

n  n
D ∑ (a k X k + bk ) = ∑ a k2 ⋅ D( X k ).
 k =1  k =1
Teorema 3.2.
Dispersia mediei aritmetice a n variabile independente X j , j = 1, n care

urmează aceeaşi lege de distribuţie, este egală cu dispersia uneia din variabilele împarţită la
numărul variabilelor.

Demonstraţie:
 n 
∑ Xk 
= 1
n
n ⋅ D( X ) D( X )
D k =1 ∑ D( X )= = .
 n  n2 k =1
k
n2 n
 
 

∗ Abaterea medie pătratică


Definiţia 2.15.

39
Se numeşte abaterea medie pătratică a variabilei X sau abaterea medie tip
(standard) valoarea medie de ordinul doi a abaterii, adică:

σ x = M (ξ 2 ) = D ( X ) (3.10)

Consecinţa teoremei 2.2.


Abaterea medie pătratică a mediei aritmetice a n variabile
independente X j , j = 1, n care urmează aceeaşi lege de distribuţie, este dată de relaţia

D( X ) D( X ) σx
σ X = D( X ) = = = . (3.11)
n n n

∗ Covarianţă
Definiţia 2.16.

Se numeşte covarianţă a două variabile aleatoare X şi Y , şi se notează cu


cov( X , Y ) = σ xy , moment centrat mixt al celor două variabile

σ xy = M [( X − µ x ) ⋅ (Y − µ y )] , unde µ x = M ( X ), µ y = M (Y ) (3.12)

Dezvoltând produsul valorilor centrate şi aplicând operatorul de medie, se obţine formula


de calcul:
σ xy = M ( X ⋅ Y ) − M ( X ) ⋅ M (Y ) (3.13)

Observaţie: Dacă variabilele X şi Y sunt independente, atunci σ xy = 0 .

∗ Coeficientul de împrăştiere
Coeficientul de împrăştiere al unei variabile aleatoare X se exprimă ca raport dintre o
valoare a împrăştierii şi o mărime de aceeaşi natură şi are rolul de a înlătura influenţa naturii
variabilei aleatoare X asupra măsurii împrăştierii respective.
În practică, o expresie a coeficientului de împrăştiere frecvent utilizată este:
σx
V= ⋅ 100 . (3.14)
µx

∗ Normarea unei variabile aleatoare


Definiţia 2.17.
Fiind dată variabila aleatoare X , transformata

40
X − µx
Z= (3.15)
σx
este numită normarea variabilei X la variabila Z .

Variabila normată Z are proprietăţile:


- valoarea medie a variabilei normate este nulă.

 X − µ  M (X ) − µ
M (Z ) = M  = = 0. (3.16)
 σ  σ
- dispersia şi abaterea medie pătratică ale variabilei normate sunt egale cu unitatea.

 X − µ  D( X ) σ
2
D( Z ) = D = = 2 = 1. (3.17)
 σ  σ2 σ

3.3 Particularităţi ale formei de distribuţie

Principalele caracteristici ale formei distribuţiei unei variabile aleatoare sunt:


• simetria şi asimetria
• boltirea

 Simetria şi asimetria
Distribuţia unei variabile aleatoare X definită de funcţia f(x), este simetrică faţă de
valoarea medie m, dacă este satisfăcută de relaţia f (µ − ξ ) = f (µ + ξ ) , pentru orice abatere
ξ = x−µ.
Grafic aceasta înseamnă că, dacă două puncte M 1 si M 2 simetrice faţă de dreapta x = µ ,
de ordonate egale, se situează pe curba distribuţiei aceasta este simetrică, iar în caz contrar
distribuţia este asimetrică .
Pentru o distribuţie simetrică, media, mediana şi modul (pentru distribuţia unimodală) au
aceeaşi valoare.
Se dovedeşte că momentele centrate de ordin impar ale oricărei distribuţii simetrice sunt
nule.

41
Coeficientul care măsoară asimetria este notat cu α, şi este definit astfel ca pentru α = 0,
distribuţia să fie simetrică, iar pentru α ≠ 0, distribuţia este asimetrică.
Sunt folosiţi cu deosebire următorii coeficienţi de asimetrie:
M (X ) − M0 (X )
α1 = ( Pearson) , (3.18)
σx
µ3
α2 = ( Fisher) (3.19)
σ3

În cazul simetriei α 1 = 0, α 2 = 0, Reciproca nu este adevărată.

 Boltirea (Turtirea)
Curbele de distribuţie pot avea boltiri sau turtiri diferite. Coeficientul de boltire folosit
este
µ4
β= (Fisher). (3.20)
σ4
Boltirea unei distribuţii oarecare se compară de obicei cu distribuţia normală9 pentru
care β = 3.
Diferenţa E = β – 3 este numită excesul distribuţiei.
Dacă E > 0, (deci β > 3), distribuţia este numită de tip leptokurtic.
Dacă E < 0, (deci β < 3), distribuţia este numită de tip platykurtic.

Lucrare de verificare 3A

Răspundeți pe scurt la următoarele întrebări:


1. Care sunt indicatorii caracteristici variabilei aleatoare privind tendinţa centrală de
grupare?
2. Care sunt indicatorii caracteristici variabilei aleatoare privind împrăștierea dsitribuției
variabilei aleatoare?
3. Care sunt indicatorii caracteristici variabilei aleatoare forma distribuției?
4. Cum se definește mediana?
5. Cum se definește modulul?

9
Vezi în Capitolul III, “Distribuţiile clasice – baza verificării ipotezelor statistice în comerţ- turism-sevicii”,
subcaputolul 3.2.1., “Repartiţia normală normată ( Z )”.

42
6. Cum se definește dispersia?
7. Cum se definește abaterea medie pătratică?

Test de autoevaluare 3B

1. Modulul reprezintă:
a. Valoarea cea mai des întânită într-o serie statistică;
b. Valoarea din mijlocul unei serii statistice, în care observațiile au fost ordonate
crescător;
c. Valoarea cea mai puțin întânită într-o serie statistică;
d. Valoarea care imparte distribuția seriei statistice în două părți de volum egal;

2. Modulul reprezintă:
a. Valoarea cea mai des întânită într-o serie statistică;
b. Valoarea din mijlocul unei serii statistice, în care observațiile au fost ordonate
crescător;
c. Valoarea cea mai puțin întânită într-o serie statistică;
d. Valoarea care imparte distribuția seriei statistice în două părți de volum egal;

3. Repartiția pe gupe de vărstă a personalului dintr-o unitate școlară se prezintă în


tabelul de mai jos:
Vârsta (ani) 15-25 25-35 35-45 45-55 55-65
Nr. Pers. 7 12 20 8 3

Se obțin următăoarele valori pentru indicatorii tendinței centrale de grupare a


variabilei aleatoare:
a. Media 32,6 ani, mediana 33,25 ani și modulul 35 ani.
b. Media 38,25 ani, mediana 39 ani și modulul 37,6 ani;
c. Media 37,6 ani, mediana 38,25 ani și modulul 39 ani;
d. Media 35,6 ani, mediana 37,25 ani și modulul 38 ani.

4. Repartiția pe gupe de vărstă a personalului dintr-o unitate școlară se prezintă în


tabelul de mai jos:

43
Vârsta (ani) 15-25 25-35 35-45 45-55 55-65
Nr. Pers. 7 12 20 8 3

Se obțin următăoarele valori pentru indicatorii sintetici ai variației:


a. dispersia medie liniară 9,58 ani, dispersia 10,68 ani și abaterea medie 114,24
pătratică ani.
b. dispersia medie liniară 8,58 ani, dispersia 114,24 și abaterea medie pătratică 10,68
ani;
a. dispersia medie liniară 9,58 ani, dispersia 100,18 și abaterea medie pătratică 12,18
ani;
c. dispersia medie liniară 10,68 ani, dispersia 9,58 și abaterea medie pătratică 114,24
ani.

5. În scopul analizei situației financiare a unui lanț hotelier, la un moment dat, se


efectuează un sondaj simplu pe un eșantion de 30 de angajați, privind numărul de ore
suplimentare lucrate de aceștia și s-au obținut următoarele date:
Grupe de angajați după numărul 2-6 6-10 10-14 14-18 18-22
de ore suplimentare lucrate
Nr. angajați 9 10 5 4 2

Se obțin următăoarele valori pentru indicatorii tendinței centrale de grupare a


variabilei aleatoare:
b. Media 8,3 angajați, mediana 9,6 angajați și modulul 5,66 angajați.
c. Media 9,3 angajați, mediana 8,6 angajați și modulul 6,66 angajați.
d. Media 8,6 angajați, mediana 9,3 angajați și modulul 6,66 angajați.
e. Media 6,66 angajați, mediana 8,6 angajați și modulul 9,3 angajați.

6. Pentru analiza de la întrebarea numărul 5 putem afirma următoarele:


a. seria este neomogenă, variaţia este mare, media nu este reprezentativă;
b. seria este omogenă, variaţia este mică, media este reprezentativă;
c. seria este neomogenă, variaţia este mică, media este reprezentativă;
d. seria este omogenă, variaţia este mică, media nu este reprezentativă;

44
7. Distribuţia elevilor unei clase de liceu în funcţie de numărul de absențe dintr-o lună se
prezintă astfel:
Nr. de absențe cumulate 14 15 16 17 18 19 20
Nr. elevi 2 6 10 15 8 5 4

Se obțin următoarele valori pentru indicatorii tendinței centrale de grupare a


variabilei aleatoare:
a. Media 15,04 absențe, mediana 15 absențe și modulul 15 zile;
b. Media 17,04 absențe, mediana 17 absențe și modulul 17 zile;
c. Media 17,04 absențe, mediana 16,5 absențe și modulul 17 zile;
d. Media 17,04 absențe, mediana 17,5 absențe și modulu5l 17, zile.

8. Un studiu efectuat asupra unui număr de 50 de firme comerciale a reliefat următoarele


informaţii cu privire la valoarea vânzărilor lunare (mii RON) , astfel:
Gruparea firme comerciale după 75-85 85-95 95-105 105-115 115-125
valoarea vânzărilor
Nr. firme 5 10 15 14 6

Se obțin următăoarele valori pentru indicatorii tendinței centrale de grupare a


variabilei aleatoare:
a. Media 101,2 firme, mediana 102 firme și modulul 103,3 firme;
b. Media 102 firme, mediana 101,2 firme și modulul 101,2 firme;
c. Media 101 firme, mediana 102 firme și modulul 102 firme;
d. Media 101 firme, mediana 101 firme și modulul 101,2 firme;

9. Un studiu efectuat asupra unui număr de 50 de firme comerciale a reliefat următoarele


informaţii cu privire la valoarea vânzărilor lunare (mii RON) , astfel:
Gruparea firme comerciale după 78-85 85-95 95-105 105-115 115-125
valoarea vânzărilor
Nr. firme 5 10 15 14 6

45
Se obțin următăoarele valori pentru indicatorii sintetici ai variației:
a. dispersia 132,16 și abaterea medie pătratică 12,8 firme;
b. dispersia 11,6 și abaterea medie pătratică 134,56 firme;
c. dispersia 134,56 și abaterea medie pătratică 11,6 firme;
d. dispersia 13,56 și abaterea medie pătratică 1,6 firme.

10. Pentru studiul de la întrebarea numărul 9 putem afirma următoarele:


a. seria este neomogenă, variaţia este mare, media nu este reprezentativă;
b. seria este omogenă, variaţia este mică, media este reprezentativă;
c. seria este neomogenă, variaţia este mică, media este reprezentativă;
d. seria este omogenă, variaţia este mică, media nu este reprezentativă;

Rezumat

O variabilă aleatoare discretă se caracterizează prin funcţie sa de repartiţie şi o anumită


distribuţie. Fie X o variabilă aleatoare discretă cu xi , i = 1, n , valoarea acesteia la un moment dat
şi evenimentul ( X = xi ) cu probabilitatea P( X = xi ) = f ( xi ) = pi . Mulţimea perechilor ordonate
(xi , f (xi ))i =1,n se numeşte distribuţia variabilei aleatoare discrete.
Principalii indicatori ai tendinţei centrale a distribuţiei variabilei aleatoare sunt: valoarea
medie, mediana (acea valoare pentru care, variabila aleatoare are aceeaşi probabilitate de a fi
mai mică sau mai mare ca ea) şi modulul (valoarea cea mai probabilă).
Gradul de împrăştiere a distribuţiei variabilei aleatoare este analizat în principal cu
ajutorul indicatorilor: extinderea sau intervalul de variaţie,abaterea, abaterea absolută medie,
dispersia, abaterea medie pătratică şi coeficientul de împrăştiere.
Pentru evidenţierea anumitor particularităţi ale formei distribuţiei variabilelor aleatoare se
utilizează parametrii: simetria (asimetria) şi boltirea (turtirea).
X − µx
De asemenea pentru o variabilă aleatoare discretă X , se defineşte transformata Z =
σx
numită normata variabilei X . Variabila aleatoare normată (Z) are media zero şi abaterea medie
pătratică egală cu 1.

46
Bibliografie

Gogonea R.M., Zaharia Econometrie cu aplicaţii în activitatea de comerţ-turism-


M. servicii, Editura Universitară, Bucureşti, 2008,
Pecican Şt. E. Econometrie pentru...economişti, Editura Economică
Bucureşti, 2007

Stewart J. Econometrics, Ph.Allan, London, 1991

Şerban R. Teoria probabilităţilor şi statistică Matematică, Editura


Dacia Nova, 2001

Voineagu V, Ţiţan E., Teorie şi practică econometrică, Editura Meteor Press,


Şerban R., Ghiţă S., 2007
Tudose D., Boboc C.,
Pele D.

47
Unitatea de învăţare 4
DISTRIBUŢIILE CLASICE ÎN VERIFICAREA IPOTEZELOR
STATISTICE

Cuprins
Unitatea de învăţare 4 DISTRIBUŢIILE CLASICE ÎN VERIFICAREA IPOTEZELOR
STATISTICE ................................................................................................................................ 48
Obiectivele Unităţii de Învăţare 4 ............................................................................................. 48

4.1 Repartiţia normală normată (Z ) .......................................................................................... 53

4.2 Repartiţia χ
2
...................................................................................................................... 53
4.3 Repartiţia Student ( t ) .......................................................................................................... 55
4.4 Repartiţia Fisher-Snedecor ( F ) ......................................................................................... 56
Lucrare de verificare 4A ........................................................................................................... 57
Test de autoevaluare 4B ............................................................................................................ 57
Rezumat ..................................................................................................................................... 60
Bibliografie................................................................................................................................ 61

Obiectivele Unităţii de Învăţare 4

Dupa studiul acestei unităţi de învăţare cursanţii vor avea cunoştinţe despre:
• Repartiţia normal normată Z ;

Repartiţia χ
2

• Repartiţia Student t
• Repartiţia Fisher-Snedecor F

4.1 Repartiţia normală normată (Z )

48
Aplicarea unui model teoretic conduce la obţinerea unor rezultate care, deşi sunt
orientative, totuşi au un grad ridicat de utilitate.
În acest context, în multe situaţii, sunt utilizate repartiţiile teoretice pentru conturarea cât
mai exactă a rezultatelor necesare pentru definitivarea deciziilor manageriale.
Repartiţia normală normată este întâlnită şi sub numele de repartiţia normală standard sau
repartiţia normală redusă, tocmai pentru că redă un caz particular al repartiţiei normale.
Denumită şi repartiţia Gauss-Laplace, repartiţia normală este exprimată printr-o variabilă
aleatoare X cu media m şi dispersia σ 2 , normată X~N ( µ , σ 2 ), a cărei funcţia de repartiţie este:
(t −m)2
1 −
F (x) = P (X<x) = ∫ x
⋅e 2σ 2
dt, (4.1)
−∞ σ 2π
 x ∈ R, σ > 0
cu 
µ , σ − parametrii fun ct iei de repartitie [ M ( X ) = µ şi D ( X ) = σ ]
2 2

Conturarea mai clare a repartiţiei normale are în vedere următoarele proprietăţi:


PN1. Variabilei aleatoare X cu repartiţia N( µ , σ 2 ) îi corespunde:

 momente centrale
− de ordin impar egale cu zero : µ 2 K +1 = 0

 (2 K )!
− de ordin par : µ 2 K = 2 K ⋅ K ! ⋅ σ
2K

 coeficenţi de asimetrie şi boltire: B1 = 0 şi B2 = 3


PN2. Suma unor variabile independente repartizate normal este tot o variabilă aleatoare
repartizată normal
 X = X 1 + X 2 + ... + X K
 , unde:
 X ~ N (µ,σ )
X 1 , X 2 , ..., X K sunt variabile independente cu repartiţii normale având media µ i şi

dispersia σ i2
K K
µ = ∑ µ i şi σ 2 = ∑ σ i2
i =1 i =1

PN3. Pentru o combinaţie liniară finită de variabile aleatoare independente, proprietatea


anterioară poate fii transpusă astfel: dacă X 1 , X 2 , ..., X K sunt variabile aleatoare

49
independente repartizate normal cu media µi şi dispersia σ i2 , atunci suma

α 1 X 1 + α 2 X 2 + ... + α K X K = X este o variabilă aleatoare repartizată normal X~N ( µ , σ 2 ),


K K
unde µ = ∑ α i µ i şi σ 2 = ∑ α i2σ i2
i =1 i =1

Repartiţia normală normată se prezintă grafic printr-o curbă normală care se numeşte şi
clopotul lui Gauss, datorită următoarelor caracteristici:
- reprezentarea este simetrică faţă de dreapta x = µ , iar cele două părţii ale curbei tind
asimptotic spre axa absciselor Ox.
- distribuţia fiind unimodală, valoarea maximă va fii atinsă pentru x = µ în punctul:
1
σ 2π

a) deplasare spre b) deplasare spre stânga

Figura 4.1. Deplasarea curbei repartiţiei normale


pentru σ constant şi µ variabil
- punctele de inflexiune ale graficului sunt ( µ - σ ) şi ( µ + σ ), deoarece în respectivele
punce convexitatea curbei se modifică în concavitate.
- dacă abaterea standard este constantă σ , modificarea mediei ( µ ) determină o translaţie
a curbei prin Ox spre dreapta (figura 4.1.a) sau spre stânga (figura 4.1.b) fără să-şi
schimbe forma.
- dacă media ( µ ) este constantă, atunci modificarea abaterii standard ( σ ) determină o
modificare a formei curbei (figura 4.2); modificarea constă în „ascuţiunea” sau
aplatzarea acesteia, după cum are loc micşorarea sau creşterea valorii parametrului
σ .

50
Figura 4.2. Modificarea curbei repartiţiei normale
pentru σ variabil şi m constant
Un exemplu de curbă Gauss-Laplace pentru o repartiţie normală X ~ N (1,5;1) prezentat în
figura 4.3

0,4

0,2

-0,5 0,5 1,5 2,5 3,5

Figura 4.3. Curba normală10 cu µ = 1,5 şi σ = 1


Ultima proprietate a repartiţiei normale prin transformarea de variabilă definită
X −µ
Z= (4.2)
σ
reprezintă fundamentul formării repartiţiei normale reduse (normată) Z
Definiţia 4.1.
Variabila aleatoare Z are o repartiţia normală normată cu media zero şi dispersia egală
cu 1 având funcţia de repartiţie N (z;0,1) .
Graficul repartiţiei normale (figura 2.8) este simetric faţă de axa ordonatelor yy’, iar
valoarea maximă este atinsă în punctul f(0)=0,3989 ≅ 0,4. Punctele de inflexiune sunt z = -1 şi z
= +1.
10
După Clocotici V., Stan A., Statistică aplicată în psihologie, pag. 132.

51
0,4

0,2

-2 -1 1 2

(− z ) (+ z )
Figura 4.4. Graficul funcţiei de repartiţie normală normată
Funcţia de repartiţie a variabilei aleatoare normală normată este:
u2
1 −
F ( z) = ∫ e
z 2
du (4.3)
2π −∞

Deoarece curba este simetrică, deci F (0) = 0,5, din definiţia funcţiei repartiţiei avem:
F ( z ) = P (Z < z ) = α

Importantă din punct de vedere aplicativ este şi funcţia φ (z) ce prezintă aria de sub
ramura pozitivă a densităţii şi probabilităţii (figura 4.5) care se stabileşte în raport cu funcţia de
repartiţie normală redusă astfel:
1
φ ( z) = F ( z) − , z ≥ 0 (4.4)
2

f (z )

Φ(z )

-2 2

Figura 4.5. Graficul funcţiei Φ (z )


Valorile funcţiilor de repartiţie F (z ) şi φ ( z ) sunt tabelate.

52
În această carte, este prezentată o Anexă 1 cu un tabel în care sunt incluse valorile
funcţiei φ (z ) .

Repartiţia χ
2
4.2

Ea reprezintă o repartiţie a unei variabile aleatoare determinată ca o sumă a pătratelor


unor variabile aleatoare independente repartizate normal standard:
χ 2 = Z12 + Z 22 + ... + Z r2 ,
unde Z1 , Z 2 ,..., Z r sunt variabile aleatoare independente cu repartiţia N(0,1).
În raport cu densitatea de probabilitate, respectiv funcţia de repartiţie se poate construi
graficul repartiţiei χ 2 .

Definiţia 2.19.
Densitatea de probabilitate ϕ ( χ 2 ; a, g) a repartiţiei χ 2 este:
g x
1 −1 −
ϕ ( x) = g
⋅ x2 ⋅e 2a2
, x≥ 0 (4.5)
g
2 ⋅ a ⋅ Γ 
2 g

2
unde: g – gradele de libertate ale repartiţiei
Γ - repartiţia Gamma
În cazul repartiţiei χ 2 întâlnim următoarele situaţii:

• dacă a=1 şi x ≥ 0 , atunci densitatea de repartiţie devine:


g x
1 −1 −
ϕ ( x, g ) = g
⋅x 2
⋅e 2
(4.6)
g
2 ⋅ Γ 
2

2
• dacă x < 0 , atunci ϕ ( x, g ) =0.
Funcţia de repartiţie este:
x
F ( x) = ∫ ϕ (t , g )dt
−∞

Graficul repartiţiei χ 2 se construieşte în funcţie de valorile parametrilor a şi g .


Parametrul g reprezintă numărul gradelor de libertate, adică numărul variabilelor independente
care au în vedere mărimea luată în considerare, a căror variaţie nu admite nici o restricţie.
53
Pentru a = 1 şi g = 2, 4, 6, 15 graficul repartiţiei χ 2 se prezintă în figura 4.6.

Indicatorii statistici caracteristici sunt: M (χ 2 ) = g şi D 2 (χ 2 ) = 2 g


Observaţie
Dacă g > 30 , atunci χ 2 se apropie de graficul distribuţiei normale.

Pentru repartiţia χ 2 , valoarea tabelară sau teoretică este de forma: χ12−α ,n −1 , χ 2 α ,


1− , n −1
2

χ α2 , χ α2 , n −1 , unde n − 1 = g reprezintă numărul gradelor de libertate.


, n −1
2

f (x : g ,1)
g =2
g =4
0,2
g =6

g = 15

0,1

x
5 10 20

Figura 4.6. Graficul distribuţiei χ 2

Valorile teoretice sau tabelare ale lui χ 2 se preiau din Tabela χ 2 , prezentată în Anexa 2

în care funcţia de probabilitate este P (χ 2 > χ 02 ) = α

Repartiţia χ 2 este întotdeauna pozitivă, neexistând ramura ei negativă, ceea ce determină

o notare inversată a valorilor critice din stânga graficului. În locul lui − χ α2 ,n −1 există χ 12−α ,n −1 şi

nu se folseşte − χ α2 , în locul său fiind utilizat χ 2 α .


, n −1 1− ,n −1
2 2

54
4.3 Repartiţia Student ( t )

Această repartiţie a apărut din necesitatea de a studia în profunzime informaţiile privind


colectivităţile statistice prin caracteristica de a admite probabilităţi mai mari de eroare.
Ca şi în repartiţia χ 2 , repartiţia Student depinde de un singur parametru denumit numărul
gradelor de libertate notat cu „g”.

Definiţia 2.20.
Distribuţia Student este acea distribuţie a cărei densităţi de probabilitate este dată de
funcţia:
 g +1
Γ 
ϕ (t , g ) =
1
⋅  2 

1
, (4.7)
g +1
gπ g
Γ   t  2 2

 2  1 + 
 g
unde Γ ( x ) = funcţia gamma.
Funcţia de repartiţie a distribuţiei Student este:
x
F ( x) = ∫ ϕ (t , g )dt (4.8)
−∞

Principalii indicatori statistici caracteristici ai repartiţiei Student sunt:


• M (t) = 0
g
2
• D (t) = , unde g > 2
g −2

Observaţie
Dacă g > 30 , atunci lim f (t , g ) ≈ N (t ;0,1) , deci repartiţia Student (figura 4.7) este
g →∞

aproximativ o repartiţie normală.

55
ϕ
0,4
distribuţia t
distribuţia N (x;0,1)

0,2

x
-2 -1 1 2

Figura 4.7. Graficul distribuţiei t pentru g > 30

Valorile pentru care P( t < tα , g ) = α există ( tα ,n −1 , t α ) şi pot fi preluate din Tabelul


, n −1
2

distribuţiei Student, t (Anexa 3), cu menţiunea că, acele valori α şi g care nu există în tabel se
utilizează aproximarea normală standard.

4.4 Repartiţia Fisher-Snedecor ( F )

Această repartiţie are în vedere compararea mediilor populaţiilor normale luând în


considerare împrăştierea datelor ambelor colectivităţi (dispersiile colectivităţilor).
Dacă repartiţiile χ 2 şi t depind de un parametru g , repartiţia F se stabileşte în funcţie de
doi parametri g1 şi g 2 având semnificaţia unor grade de libertate. Acestea se formează pe baza
unei variabile aleatoare ce are valoarea câtului altor două astfel de variabile ( g1 - numărul
gradelor de libertate pentru numărător, g 2 - numărul gradelor de libertate pentru numitor).
Repartiţia F reprezintă o variabilă aleatoare X care se formează astfel:
y g
X = 1⋅ 2 ,
y 2 g1

unde: y1 , y 2 sunt variabile aleatorii independente repartiţiei χ 2 , cu g1 şi g 2 grade de libertate.

Definiţia 2.21.
Vom spune despre o variabilă aleatoare că are distribuţie Fisher-Snedecor dacă funcţia
densitatea de probabilitate a acesteia este de forma:

56
 g + g2 
Γ 1  g1 g2
g1
−1

ϕ (F ) =  2  ⋅ g1 ⋅ g 2 ⋅
2 2
F 2
, F≥ 0 (4.9)
g1 + g 2
 g1   g 2 
Γ  ⋅   ( g1 + g 2 ) 2
F

 2  2 
unde: Γ ( p ) - funcţia Gamma
g1 şi g 2 - numărul gradelor de libertate
Funcţia de repartiţie este:

P( F > F0 ) = ∫ ϕ ( F )dF = δ
0

ale cărei valori se regăsesc în Tabelul repartiţiei F (Fisher-Snedecor) prezentată în Anexa 4.


Indicatorii statistici caracteristici ai repartiţiei F sunt:
g2
M (F) = (4.10)
g2 − 2
2 g 22 ( g1 + g 2 − 2)
D 2 (F) = , pentru g 2 > 2 (4.11)
g 1 ( g 2 − 4)( g 2 − 2) 2
Deoarece repartiţia F nu este simetrică, între valorile critice există relaţia:
1
F1−α ; g1 ; g 2 = (1.12)
Fα ; g1g 2
Aplicabilitatea repartiţiilor teoretice este evidenţiată în următoarele capitole pentru a reflecta
necesitatea cunoaşterii lor cât mai profunde, în vederea utilizării lor corecte, în diferite ipostaze
practice ale fenomenelor şi proceselor economice.

Lucrare de verificare 4A

Răspundeţi pe scurt la următoarele întrebări:


1. Cum definiţi repartiţia normal normată Z ?

2. Cum definiţi repartiţia χ ?


2

3. Cum definiţi repartiţia Student ?


4. Cum definiţi repartiţia Fisher-Snedecor F?

Test de autoevaluare 4B

1. Repartiţia normală normată este întâlnită şi sub numele de:


a. repartiţia normală standard sau repartiţia normală redusă;

57
b. distribuţie normală;
c. repartiţia Gauss-Laplace;
d. repartiţia student.

2. Variabila aleatoare Z are o repartiţie normată cu:


a. modulul 1 şi dispersia 2;
b. media 1 şi dispersia 2;
c. media 0 şi dispersia egală cu 1;
d. modulul 0 şi dispersia 1.

3. Care afirmaţie este adevărată:


a. repartiţia normală normată se prezintă grafic printr-o curbă normală care se
numeşte şi clopotul lui Gauss;
b. repartiţia normală normată se prezintă grafic printr-o linie dreaptă denumită şi
dreapta de regresie;
c. repartiţia normală normată se prezintă grafic printr-o curbă normală care se
numeşte şi curba lui Koch;
d. repartiţia normală normată se prezintă grafic printr-o linie dreaptă denumită şi
dreapta de regresie.

4. Repartiţia χ 2 este întotdeauna:


a. pozitivă;
b. negativă;
c. cuprinsă între 0 şi 1;
d. cuprinsă între -1 şi 1.

5. Repartiţia χ 2 reprezintă o repartiţie a unei variabile aleatoare determinate ca o:


a. dieferenţă a pătratelor unor variabile aleatoare independente repartizate normal
standard;
b. sumă a pătratelor unor variabile aleatoare independente repartizate normal
standard;

58
c. sumă a unor variabile aleatoare independente repartizate normal standard;
d. dieferenţă a unor variabile aleatoare independente repartizate normal standard.

6. Pentru repartiţia χ 2 , valoarea tabelară sau teoretică este de forma:

a. χ 12−α ,n , χ 2 α , χ α2 , χ α2 ,n ;
1− , n ,n
2 2

b. χ α2 ,n −1 , χ α2 , χ α2 , χ α2 , n−1 ;
, n −1 , n −1
2 2

c. χ 12−α ,n −1 , χ 2 α , χ α2 , χ α2 , n−1 ;
1− , n −1 ,n −1
2 2

d. χ12−α , χ 2 α , χ α2 , χ α2 ;
1−
2 2

7. Ce afirmaţie este adevărată:


a. repartiţia χ 2 este întotdeauna negativă, neexistând ramura ei pozitivă, ceea ce
determină o notare inversată a valorilor critice din dreapta graficului;
b. repartiţia χ 2 poate lua atât valori positive cât și valori negative;

c. repartiţia χ 2 este întotdeauna pozitivă, neexistând ramura ei negativă, ceea ce


determină o notare inversată a valorilor critice din stânga graficului;
d. repartiţia χ 2 ia valori cuprinse în intervalul [0;1].

8. Repartiţia Student depinde de un singur parametru denumit:


a. numărul gradelor de libertate;
b. nivel de încredere;
c. variabilă aleatoare;
d. coeficient de încredere.

9. Repartiţia F (Fisher-Snedecor) are în vedere:


a. compararea mediilor populaţiilor normale luând în considerare dispersiile
colectivităţilor;

59
b. compararea mediilor populaţiilor normale luând în considerare modulul
colectivităţilor;
c. însumarea mediilor populaţiilor normale;
d. compararea mediilor populaţiilor normale luând în considerare împrăştierea
datelor ambelor colectivităţi.

10. Repartiţia F (Fisher-Snedecor) se stabileşte în funcţie de:


a. doi parametrii;
b. un parametru;
c. 3 parametrii;
d. nici un parametru.

Rezumat

Principalele repartiţii de probabilitate utilizate în testarea şi studiul ipotezelor şi


modelelor econometrice sunt distribuţia normală normată (Z), distribuţia Student (t), distribuţia
χ 2
şi distribuţia Fisher-Snedecor (F).
u2
1 −
Funcţia de repartiţie a variabilei aleatoare normală normată este F ( z ) = ∫ e
z 2
du .
2π −∞

Importantă din punct de vedere aplicativ este şi funcţia φ (z) (funcţia integrală a lui Laplace)
1
astfel încât F ( z) = + φ ( z ), z ≥ 0 . Valorile Foncţiilor φ (z) şi F(z) sunt tabelate (Anexa 1).
2
Repartiţia χ 2 este întotdeauna pozitivă. Valoarile tabelate ale repartiţiei χ 2 , sunt de

forma χ α2 , n−1 , unde n − 1 = g este numărul gradelor de libertate şi sunt prezentate în Anexa 2.

Repartiţia Student (ale cărei valori tabelate se găsesc în Anexa 3)este utilizată atunci când
numărul numărul gradelor de libertate este relativ mic (uzual) sub 30. Dacă g tinde către infinit
repartiţia Student converge către repartiţia normală normată.
y1 g 2
Repartiţia F caracterizează o variabilă aleatoare X de forma: X = ⋅ , unde: y1 , y 2 sunt
y 2 g1

variabile aleatorii independente de repartiţie χ 2 , cu g1 şi g 2 grade de libertate. Valorile tabelate


ale acesteia se află în Anexa 4.

60
Bibliografie

Cristache S.E., Şerban Lucrări aplicative de statistică şi econometrie pentru


D. administrarea afacerilor, Editura ASE, Bucureşti, 2007

Clocotici V. Statistică aplicată în psihologie, Editura Polirom,


Bucureşti, 2000

Cristache S.E., Şerban Lucrări aplicative de statistică şi econometrie pentru


D. administrarea afacerilor, Editura ASE, Bucureşti, 2007

Dougherty Ch. Introduction to Econometrics, Oxford University Press,


2007

Gogonea R.M. STATISTICA. Baza teoretico-aplicativă pentru comerţ-


servicii- turism, Editura Universitară, Bucureşti, 2009

HsiaoJohnston J., Econometric Methods, New York:McGraw-Hill, 1997


Dinardo J.,
Isaic-Maniu A., Mitruţ
Statistică, Editura Universitară, Bucureşti, 2003
C.,
Voineagu V.
Jaba E. Statistică, Editura Economică, Bucureşti, 1998

Statistică,ediţia a treia-revizuită, Editura Economică,


Jaba E.
Bucureşti, 2002

61
Unitatea de învăţare 5
IPOTEZE STATISTICE-ASPECTE TEORETICE

Cuprins

Obiectivele Unităţii de Învăţare 5 .................................................................................................. 62


5.1 Inferenţa statistică ..................................................................................................................... 62
5.2 Metodologia testării ipotezelor statistice ................................................................................. 64
5.3 Tipuri de teste utilizate la testarea ipotezelor statistice .......................................................... 70
Lucrare de verificare 5A ................................................................................................................. 73
Test de autoevaluare 5B ................................................................................................................. 74
Rezumat ........................................................................................................................................... 76
Bibliografie ...................................................................................................................................... 77

Obiectivele Unităţii de Învăţare 5

Dupa studiul acestei unităţi de învăţare cursanţii vor avea cunoştinţe despre:
• Inferenţa statistică;
• Ipoteza statistică;
• Elementele teoretice care intervin în testarea ipotezelor statistice sunt:
• ipotezele: nulă şi alternativă;
• limita de semnificaţie şi valori critice de respingere;
• regiune de respingere (critică);
• statistica testului;
• verificarea ipotezei.

5.1 Inferenţa statistică

62
Metodologia corelaţiei simple liniare a cercetării ştiinţifice este precedată de o treaptă
esenţială care vizează stabilirea şi confirmarea sau infirmarea unor ipoteze ce cuprind anumite
aspecte importante necesar a fi studiate în legătură cu procesul sau fenomenul analizat.
Această treaptă include metode denumite inferenţiale deoarece, prin intermediul acestora,
se estimează caracteristicile unor colectivităţi statistice.
Definiţia 5.1. Inferenţa este o operaţiea logică de trecere de la un enunţ la altul şi în care
ultimul enunţ este dedus din primul.
Din punctul de vedere al acestei lucrări enunţurile sunt reprezentate prin ipoteze
statistice, iar inferenţa este reprezentată de procesul de extindere la nivelul colectivităţii generale
Γ a unor rezultate obţinute dintr-o subcolectivitate reprezentaivă γ ⊂ Γ (figura 5.1).

Subcolectivitatea reprezentativă γ este rezultatul unor observaţii efectuate prin aplicarea


unui procedeu de extragere adecvat cerinţelor.
Definiţia 5.2. Prin ipoteză vom înţelege o presupunere cu caracter provizoriu, formulată pe baza
unor date exterimentale existente la un moment dat
Ipoteza statistică este reflectată printr-o presupunere enunţată pe baza unei acţiuni
desfăşurate în cadrul unui fenomen sau proces, care ulterior este supusă unui proces de verificare
statistică.

63
Extragere subpopulaţie

Subcolecti
Extindere Rezultate Colectivitate
vitate Estimare statistică

γ Γ

(eşantion
INFERENŢĂ

Particular Inducţie General

Figura 5.1. Procesul inferenţei statistice

Practic, ipoteza statistică vizează o caracteristică a populaţiei (colectivităţii statistice) Γ


pe care, pe baza datelor din eşantionul reprezentativ γ şi a unor metode specifice, este valiată
(adoptată) sau nu (respinsă).
Aplicarea inferenţei statistice are la bază procedeul testării ipotezelor statistice, care va fi
descris pe larg în continuare.

5.2 Metodologia testării ipotezelor statistice

Testarea ipotezelor statistice reprezintă o componentă a influenţei prin circuitul pe care-l


descrie ca urmare a aplicării metodologiei (figura 5.2.)

64
Verificare

IPOTEZE

Colectivitate Eşantion cu date


generală METODOLOGIA experimentale

Γ TESTĂRII γ

Stabilire

IPOTEZE

Figura 5.2. Circuitul metodologiei testării

În general, presupunerea vizează un parametru (medie, dispersie11, etc.) sau o lege de


repartiţie a unor variabile aleatoare.
Testarea are în vedere următoarele aspecte:
• se formează ipotezele : H 0 (nulă), H 1 (alternativă);

• se stabileşte α şi valorile critice corespunzătoare tipului de test aplicat;


• se precizează regiunea de respingere sau critică ( Rr ), în funcţie de tipul testului;
• se aplică statistica testului;
• se ia o decizie în funcţie de modul cum se încadrează rezultatul, în interiorul sau
exteriorul regiunii de respingere.
Elementele teoretice care intervin în testarea ipotezelor statistice sunt:
• ipotezele: nulă şi alternativă;
• limita de semnificaţie şi valori critice de respingere;
• regiune de respingere (critică);
• statistica testului;
• verificarea ipotezei.

 Ipoteza nulă şi ipoteza alternativă

11
Vezi Capitolul II “2.2. Caracteristicile distribuţiei variabilei aleatoare”.

65
Cele două ipoteze (nulă şi alternativă) formează o pereche nelipsită în cadrul
metodologiei testării.

Definiţia 5.3. Se numeşte ipoteză nulă şi se notează cu H 0 acea presupunere prin care se
formulează supoziţia conform căreia nu există diferenţă semnificativă între parametrii
comparaţi (primează caracterul întâmplător).
Alternativa la H 0 , apare ca o altă alternativă care poate fi adevărată în condiţiile
respingerii ipotezei nule.
Definiţia 5.4. Se numeşte ipoteză alternativă şi se notează cu H 1 presupunerea conform căreia
există o diferenţă semnificativă (cazuri speciale: mai mare sau mai mică) între parametri
comparaţi.
Ambele ipoteze trebuiesc stabilite iniţial, ca prime etape în cadrul metodologiei testării
fiind considerate mutual exhaustive ca urmare a imposibilităţii împlinirii simultane a acestora,
dar cu realizarea obligatorie a uneia din ele (respingerea ipotezei nule H 0 conduce la stabilirea

ipotezei alternative H 1 ca fiind adevărate sau dacă ipoteza nulă H 0 este adevărată, atunci ipoteza

alternativă H 1 se respinge).

 Limită de semnificaţie şi valori critice de respingere


Metodologia testării are în vedere două evenimente compuse:
• evenimentul realizat ( E R ) - care include şi celelalte evenimente auxiliare şi conduce la
respingerea ipotezei H0
• evenimentul contrar celui realizat ( E CR ) – evenimentul care evidenţiază îndeplinirea
ipotezei nule H0.
Principiile esenţiale pentru realizarea celor două evenimente sunt:
• probabilitatea evenimentului realizat ( E R ) sub H0 este reprezentată de evenimentele
elementare care sunt egal probabile doar în condiţiile ipotezelor nule şi se poate
determina numindu-se probabilitate critică
PC = P(E R ) = PH 0 (E R ) (5.1)

66
• probabiliatea evenimentului realizat ( E R ) sub H1 este mai mare decât sub H0, dar nu se
poate determina decât funcţia de celealtă.
Probabilitatea critică este interpretată a fi mică sau nu prea „mică” în raport cu un anumit
nivel denumit prag sau limită de semnificaţie notat cu α .
Regula de decizie se stabileşte în funcţie de probabilitatea critică ( PC ) astfel:
• dacă PC este mai „mică” de α ( PC ≤ α ), atunci H0 se respinge (evenimentul realizat se
consideră neaşteptat în contextul ipotezei H0, în timp ce ipoteza H1 îi asigură o
probabilitate mai mare de aspiraţie).
• Dacă PC este mai „mare” de α , atunci H0 nu se respinge (evenimentul realizat se
consideră aşteptat să se întâmple).
Limita de semnificaţie α poate lua valori cuprinse între 0,5 şi 0,0001 (cele mai utilizate
fiind 0,05 şi 0,01), acestea fiind stabilite teoretic.
Dacă α = 0,05 sau altfel spus α = 5% înseamnă că riscul de respingere al ipotezei nule
H0 este de 5% (când respingem ipoteza nulă H0 este posibil să se greşească în proporţie de 5%).
Limita de semnificaţie ( α ) are un rol esenţial în cadrul testării ipotezelor statistice
reprezentând acel prag sau linie care separă rezultatele ce resping ipoteza nulă de celelalte care
nu resping.
În acest context apare acea regiune de respingere (regiunea critică) notată Rr în care sunt
incluse rezultatele ce resping ipoteza nulă.
Definiţia 5.5. Punctele care determină regiunea de respingere se numesc valori critice ale
testului şi sunt reprezentate de Quantilele distribuţiei utilizate în aplicarea respectivului test.
Valorile critice de respingere vC .R sunt valori tabelare sau teoretice ale testelor ( Z α , Z α ,
2

tα , ... , etc), care se preiau din tabele teoretice prezentate în Anexele 1- 4.

 Regiunea de respingere (critică):


Valoarea critică delimitează în cadrul repartiţiei o regiune reprezentând regiunea critică.
Definiţia 5.6. Regiunea de respingere ( Rr ), denumită şi regiune critică, este reprezentată de
aceea arie din graficul de repartiţie, în care ipoteza nulă se respinge.

67
Regiunea include probabilitatea de realizare a evenimentului alternativ, deci este
adevărată ipoteza alternativă H 1 .
În procesul de decizie al unui test statistic se pot produce erori care apar sub două forme
(tabelul 4.1).
• eroare de tip I. (de speţa întâi): se respinge ipoteza nulă H 0 , deşi ea este adevărată.
Riscul producerii unei erori de tip I este α .
• eroare de tip II (de apeţa a doua): nu se respinge ipoteza nulă H 0 , deşi ea este falsă.

Riscul producerii unui tip de eroare este β .


Tabelul 5.1. Erori în procesul decizional statistic
Ipoteza
Decizia în test
H 0 adevărată H 0 falsă

Respingere H 0 Eroare de tip I Decizie precisă (1-p)

Acceptare H 0 Decizie precisă (1- α ) Eroare de tip II (risc β )

Legătura dintre probabilităţile α şi β este prezentată în figura 5.3.


Definiţia 5.7. Statistica testului este acea relaţie ce prezintă într-o formă matematică, tipul
testului stabilit în raport cu cel al distribuţiilor statistice descrise de fenomenul sau procesul
analizat.
Rezultatul obţinut ca urmare a aplicării statisticii testului se numeşte valoarea calculată a
testului (notată: Z c , sau t c , sau χ c2 , sau Fc etc).

f x ()
H0 H1

α
β

µ0 C µ1 x

68
12
Figura 5.3 Legătura dintre probabilităţile α şi β

 Statistica testului

 Testarea ipotezei
Verificarea ipotezei constă în compararea rezultatului obţinut prin aplicarea statisticii
testului la valorile calculate cu valoarea critică şi stabilirea deciziei finale ca find una din
situaţiile :
 dacă valoarea calculată intră în regiunea de respingere, atunci ipoteza nulă H 0 se

respinge (se consideră adevărată ipoteza alternativă H 1 ).


 dacă valoarea calculată este în afara regiunii de respingere, atunci ipoteza nulă
H 0 este adevărată (se respinge ipoteza alternativă H 1 ).
Din punct de vedere teoretic, testarea ipotezelor statistice presupune parcurgerea unor
etape ilustrate în figură 4.4.
Succint, aceste etape constau în:
 se precizează ipoteza nulă ( H o ) prin care se specifică: nu există diferenţă semnificativă
între parametrii comparaţi (medii, dispersii etc).
 se stabileşte ipoteza alternativă ( H 1 ): există diferenţă semnificativă între parametrii
comparaţi (medii, dispersii etc).
 se precizează tipul testului statistic utilizat în raport cu datele aplicaţiei, cu ipoteza
alternativă şi cu volumul eşantionului; se începe schiţarea graficului.
 în funcţie de nivelul de încredere ( 1 − α ), se determină limita de semnificaţie ( α ), cu
ajutorul căreia se stabileşte:
► valoarea critică de respingere (valoarea testului statistic tabelar sau teoretic),
plasându-se pe grafic;
► regiunea de respingere ( Rr ).

12
Voineagu V., Ţiţan E., Şerban R., Chiţă S., Todose D., Boboc C., Pele D., Teorie şi practică econometrică,
Editura Meteor Press, Bucureşti, 2006, pag.89.

69
Stabilirea ipotezelor

- Ipoteza H 0
- Ipoteza H1

Alegerea

TIPULUI TESTULUI

Alegerea
Valoarea critică Regiunea
LIMITEI DE
vC . R SEMNIFICAŢIE de respingere

STATISTICA TESTULUI

NU DA
PER ∈ R R

Se acceptă H 0 Se respinge H 0

Figura 5.4 Etapele testării ipotezelor statistice

 se determină valoarea statistică a testului calculat, aplicându-se relaţia de calcul adecvată


tipului testului utilizat, iar valoarea obţinută se plasează pe grafic.
 se compară valoarea testul statistic tabelar sau teoretic cu valoarea statistică a testului
calculat şi se stabileşte dacă rezultatul statistic al testului calculat intră sau nu în regiunea
de respingere Rr , luându-se decizia adecvată situaţiei.

5.3 Tipuri de teste utilizate la testarea ipotezelor statistice

În funcţie de sensul abaterii inclusă în ipoteza alternativă H 1 apar trei tipuri de teste:
• Test unilateral stânga
• Test bilateral

70
• Test unilateral dreapta

 Testul unilateral stânga


Testul unilateral sânga are următoarele caracteristici:
- ipotezele testului sunt:
 de exemplu, dacă se compară mediile a două eşantioane ( x1 şi x 2 ), avem:
H 0 : x1 = x 2

H 1 : x1 < x 2

 în alt exemplu, dacă se compară două dispersii ( σ 12 şi σ 22 ), vom avea:

σ 12
H 0 : σ 12 = σ 22 sau H 0 : =1
σ 22
σ 12
H 1 : σ 12 < σ 22 sau H 1 : <1
σ 22
- Regiunea de respingere ( RR ) şi valoarea critică de respingere ( vC .R ) sunt prezentate în
figura 5.1
- Limita de semnificaţie este α

RR

vC . R

Figura 5.1 Baza teoretică grafică a testului unilateral stânga

 Testul bilateral
Pentru testul bilateral avem:
- ipotezele testului :
 de exemplu, dacă se compară mediile a două eşantioane ( x1 şi x 2 ), avem:

71
H 0 : x1 = x 2

H 1 : x1 ≠ x2

 în alt exemplu, dacă se compară două dispersii ( σ 12 şi σ 22 ), vom avea:

σ 12
H 0 : σ 12 = σ 22 sau H 0 : =1
σ 22

σ 12
H 1 : σ ≠ σ sau H 1 : 2 ≠ 1
2 2

σ2
1 2

- Regiunea de respingere ( RR ) şi valoarea critică de respingere ( vC .R ) sunt prezentate în


figura 4.6
α
- Limita de semnificaţie este
2

RR
RR

vC . R vC .R

negativă pozitivă

Figura 5.2. Baza teoretică grafică a testului bilateral

 Testul unilateral dreapta


Testul unilateral dreapta, se mai numeşte şi testul direcţional dreapta. El se poate descrie
prin următoarele caracteristici:

- ipotezele testului sunt:


 de exemplu, dacă se compară mediile a două eşantioane ( x1 şi x 2 ), avem:

H 0 : x1 = x 2

H 1 : x1 > x 2

72
 în alt exemplu, dacă se compară două dispersii ( σ 12 şi σ 22 ), vom avea:

σ 12
H 0 : σ 12 = σ 22 sau H 0 : =1
σ 22

σ 12
H 1 : σ > σ sau H 1 : 2 > 1
2 2

σ2
1 2

- Regiunea de respingere ( RR ) şi valoarea critică de respingere ( vC . R ) sunt prezentate


în figura 5.3
- Limita de semnificaţie este α

RR

vC . R

pozitivă
Figura 5.3. Baza teoretică grafică a testului unilateral dreapta

Procedeul testării ipotezelor statistice are în vedere nu numai tipul ipotezei alternative,
dar şi următoarele două elemente:
♦ volumul eşantionului ( n ), cu cele două cazuri: eşantion de volum mic ( n < 30 ) şi
eşantion de volum mare ( n ≥ 30 );
♦ dispersia colectivităţii generale ( σ 2 ) din care se extrag eşantioanele, cu cele două
situaţii: σ 2 cunoscut şi σ 2 necunoscut.

Lucrare de verificare 5A

Răspundeţi pe scurt la următoarele întrebări:


1. Ce reprezintă inferenţa statistica?
2. Cum se defineşte ipoteza statistică?

73
3. Ce înţelegeţi prin procedeul de testare a ipotezelor statistice?
4. Ce reprezintă ipoteza nulă într-un proces de testare de ipoteze statistice?
5. Care este diferenţa dintre H0 şi H1?
6. În testarea ipotezelor, ce determină mărimea regiunii critice?
7. Ce reprezintă testul sau criteriul de semnificaţie?
8. Ce reprezintă regiunea critică?
9. Când se comite o eroare de gradul întâi?
10. Când se comite o eroare de gradul al doilea?
11. Care sunt paşii în construirea unui test statistic?

Test de autoevaluare 5B

1. Ipoteza statistica este:


a. presupunerea care se face cu privire la parametrii unei repartiţii;
b. presupunerea la legea de repartiţie pe care o urmează anumite variabile aleatoare;
c. procedeul de constituire a eşantionului;
d. orice presupunere privind o variabilă.

2. Testul sau criteriul de semnificatie este:


a. procedeul de verificare a unei ipoteze statistice.
b. eroarea de genul intai;
c. riscul de genul intai;
d. procedeul econometric de gradul întâi.

3. În testarea ipotezelor, ce determină mărimea regiunii critice?


a. valorile tabelare sau teoretice ale testelor Z α , Z α ;
2

b. valorile tabelare sau teoretice ale testelor Z α −1 , Z α −1 ;


2

c. valorile tabelare sau teoretice ale testelor Fα −1 , Fα −1 ;


2

d. valorile tabelare sau teoretice ale testelor Fα , Fα ;


2

74
4. În funcţie de sensul abaterii inclusă în ipoteza alternativă H 1 apar:
a. două tipuri de teste;
b. trei tipuri de teste;
c. patru tipuri de teste;
d. un singur test.

5. Dacă se compară mediile a două eşantioane ( x1 şi x 2 ), ipotezele testului unilateral dreapta


sunt:
a. H 0 : x1 = x2 şi H 1 : x1 < x 2 ;

b. H 0 : x1 = x2 şi H 1 : x1 > x2 ;

c. H 0 : x1 > x 2 şi H 1 : x1 < x 2 ;

d. H 0 : x1 ≠ x 2 şi H 1 : x1 < x 2 .

6. Procedeul testării ipotezelor statistice are în vedere:


a. Tipul ipotezei alternative;
b. Dispersia colectivităţii generale;
c. Media colectivităţii generale;
d. Volumul eşantionului.
A=a+b+d; B=a+c+d; C=b+c+d.

7. Dacă se compară două dispersii ( σ 12 şi σ 22 ), ipotezele testului bilateral sunt:

a. H 0 : σ 12 = σ 22 şi H 1 : σ 12 ≠ σ 22 ;

b. H 0 : σ 12 = σ 22 şi H 1 : σ 12 > σ 22 ;

c. H 0 : σ 12 = σ 22 şi H 1 : σ 12 < σ 22 ;

d. H 0 : σ 12 ≠ σ 22 şi H 1 : σ 12 > σ 22 .

8. Dacă se compară două dispersii ( σ 12 şi σ 22 ), limita de semnificaţie este:


a. α ;
b. α 2 ;

75
1
c. ;
α
α
d. .
2

9. Potrivit figurii următoare, la testarea ipotezelor statistice, se aplică:


a. testul unilateral dreapta;
b. testul bilateral;
c. testul unilateral dreapta;
d. nici un test.

RR

vC . R

10. Potrivit figurii următoare, la testarea ipotezelor statistice, se aplică:


a. testul unilateral dreapta;
b. testul bilateral;
c. testul unilateral dreapta;
d. nici un test.

RR
RR

vC . R vC .R

negativă pozitivă

76
Rezumat

Ipoteza statistică este o presupunere cu caracter provizoriu, formulată pe baza unor date
exterimentale existente la un moment dat. Testarea ipotezelor statistice presupune parcurgerea
următoarelor etape: formularea ipotezelor : H 0 (nulă) şi H 1 (alternativă), stabilirea pragului de

semnificaţie α , determinarea valorile critice corespunzătoare pragului de semnificaţie şi tipului


de test aplicat, determinarea regiunii (regiunilor) de respingere sau critică determinarea statisticii
testului şi luarea deciziei în funcţie de modul cum se încadrează statistica testului, în interiorul
sau exteriorul regiunii de respingere.
Principalele noţiuni utilizate în procesul de testare a ipotezelor statistice sunt:
Elementele teoretice care intervin în testarea ipotezelor statistice sunt: ipotezele testului ( H 0 şi

H 1 , disjuncte şi exhaustive), pragul (limita) de semnificaţie, valoarei critică, regiune de


respingere (critică), statistica testului.
La testarea ipotezelor statistice sunt utilizate trei tipuri de teste: testul bilateral (două
valori critice şi două regiuni de respingere) utilizat pentru o ipoteză alternativă de genul “diferă
semnificativ de”, test unilateral stânga (o regiune de respingere) utilizat pentru o ipoteză
alternativă de genul “ semnificativ mai mic decât” şi testul unilateral dreapta (o regiune de
respingere) utilizat pentru o ipoteză alternativă de genul “ semnificativ mai mare decât”.

Bibliografie

Andrei T. Statistică şi econometrie, Editura Economică, Bucureşti,


2003

Bădiţă M., Baron T., Statistică pentru afaceri, Editura Eficient, Bucureşti, 1998
Korka M.
Biji M., Biji E. Statistică teoretică, Editura Didactică şi Pedagogică,
Bucureşti, 1979

Cristache S.E., Şerban Lucrări aplicative de statistică şi econometrie pentru


D. administrarea afacerilor, Editura ASE, Bucureşti, 2007

Gogonea R.M., Zaharia Econometrie cu aplicaţii în activitatea de comerţ-turism-


M. servicii, Editura Universitară, Bucureşti, 2008,

77
Unitatea de învăţare 6
TESTAREA IPOTEZELOR PRIVIND MEDIILE POPULAŢIILOR CU
EŞANTIOANE DE VOLUM MARE

Cuprins
Obiectivele Unităţii de Învăţare 6 .................................................................................................. 78
6.1 Compararea mediei eşantionului cu media colectivităţii generale ........................................ 78
6.2 Compararea mediilor a două eşantioane .................................................................................. 83
6.3 Compararea proporţiei eşantionului cu a colectivităţii generale ............................................ 86
Lucrare de verificare 6A ................................................................................................................. 90
Test de autoevaluare 6B ................................................................................................................. 91
Rezumat ........................................................................................................................................... 96
Bibliografie ...................................................................................................................................... 97

Obiectivele Unităţii de Învăţare 6

După studiul acestei unităţi de învăţare cursanţii vor avea cunoştinţe despre:
• testarea ipotezei statistice privind compararea mediei eşantionului cu media
colectivităţii generale;
• testarea ipotezei statistice privind compararea mediilor a două eşantioane de
volum mare;
• testarea ipotezei statistice privind compararea proporţiei eşantionului cu a
colectivităţii generale;

6.1 Compararea mediei eşantionului cu media colectivităţii generale

Stabilirea volumului fiecărui eşantion cu care se lucrează în cadrul testării ipotezelor


statistice, permite aplicarea unui anumit tip de test statistic.

78
În condiţiile utilizării unor eşantioane de volum mare ( n ≥ 30 ) s-a demonstrat necesitatea
aplicării statisticii Z
Aplicarea testului Z în cazul comparării mediei eşantionului γ de volum n cu media
colectivităţii generale Γ presupune studierea unei populaţii statistice, de variabilitate constantă,
pentru a stabili dacă valoarea mediei a acestuia este aceeaşi cu a eşantionului utilizat în cercetare
Repartiţia normală redusă care stă la baza testului Z are în vedere funcţia de repartiţie

N (µ , σ 2 ) , cu parametri µ = 0 şi σ = 1
2

Statistica testului calculat se stabileşte în raport cu gradul de cunoaştere a dispersiei

colectivităţii generale ( σ ):
2

 σ 2 cunoscut :
x − µ ip x − µ ip
Zc = = (6.1)
σ2 σ
n n

 σ 2 necunoscut:
x − µ ip x − µ ip
Zc = = (6.2)
s2 s
n n

unde:
n - volumul eşantionului
µ ip - media ipotetică
x - media eşantionului
σ 2 - dispersia colectivităţii generale
σ - abaterea medie pătratică a colectivităţii generale
s 2 - estimaţia dispersiei colectivităţii generale
s - estimaţia abaterii medii pătratice a colectivităţii generale
În raport cu direcţia abaterii inclusă în ipoteza alternativă, testul Z aplicat poate
a. − unilateral stânga

fi: b. − bilateral
c. − unilateral dreapta

79
 Testul Z unilateral stânga
Acest tip de test este utilizat în situaţia practică ce direcţionesză abaterea spre stânga, mai
precis ipoteza alternativă precizează că media populaţiei eşantionului este mai mică decât a
populaţiei.
Pe grafic (figura 6.1), densitatea de probabilitate este limitată la stânga de aria regiunii de
respingere a ipotezei nule. Această regiune este demarcată de valoarea critică − Z α . Pentru o

limită de semnificaţie α , valoarea lui Z denumit şi „Z tabelar sau teoretic” se preia din anexa 1,
tabelul cu valorile funcţiei Gauss Laplace.

RR

H 0 se respinge − Zα

Figura 6.1 Elementele teoretice ale testului Z unilateral stânga

Etapele aplicării testului:


1. - se precizează ipoteza nulă : H 0 : µ = µ ip

2. - se stabileşte ipoteza alternativă : H 1 : µ < µ ip

3. - se precizează tipul testului statistic utilizat în raport cu volumul eşantionului n ≥ 30 , datele


aplicaţiei şi H 1 (se aplică testul Z unilateral stânga) şi se începe schiţarea graficului;
4. - în funcţie de nivelul de încredere ( 1 − α ), se determină limita de semnificaţie ( α ), cu
ajutorul căreia se stabileşte :
► Z tabelar sau teoretic: - Z α (Anexa 1), iar valoarea se trece pe grafic

► regiunea de respingere ( Rr ) : dacă Z calculat < − Z α , atunci H o se respinge şi este

adevărată ipoteza H 1 .

80
5. - se calculează valoarea statistică a testului cu una din relaţiile 4.2 sau 4.3, iar valoarea
obţinută se plasează pe grafic.
6. - se compară valoarea lui Z c cu - Z α şi se stabileşte dacă rezultatul statistic al testului

calculat Z c intră sau nu intră în regiunea de respingere Rr , luându-se decizia adecvată


situaţiei.

 Testul Z bilateral
Aplicarea testului are în vedere ipoteza alternativă prin care se specifică faptul că media
eşantionului diferă semnificativ de media colectivităţii generale.
Graficul, figura 6.2, indică o limitare a densităţii de probabilitate în ambele părţi, atât la
stânga cât şi la dreapta de aria de respingere a ipotezei nule. Cele două regiuni de respingere sunt
prezentate pe grafic începând cu valorile critice - Z α , respectiv Z α .
2 2

RR
RR

H 0 se respinge H 0 se respinge

− Zα Zα
2 2

Figura 6.2. Elementele teoretice ale testului Z unilateral bilateral

Utilizarea testului presupune parcurgerea următoarelor etape:


1. Ipoteza nulă: H 0 : µ = µ ip

2. Ipoteza alternativă: H 1 : µ ≠ µ ip

3. Deoarece n ≥ 30 , din datele aplicaţiei şi H 1 , atunci se aplică testul Z bilateral şi se începe


schiţarea graficului.
4. În funcţie de nivelul de încredere ( 1 − α ), se determină limita de semnificaţie ( α ), cu ajutorul
căreia se stabileşte :

81
► Z tabelar sau teoretic: Z α şi - Z α (anexă 1 cu valorile funcţiei Gauss Laplace), iar
2 2

valorile se plasează pe grafic


► regiunea de respingere ( Rr ): dacă Z c < - Z α sau Z c > Z α , atunci H o se respinge şi este
2 2

adevărată ipoteza H 1 .
5. Se calculează valoarea statistică a testului cu una din relaţiile 4.2 sau 4.3, iar valoarea
obţinută se plasează pe grafic.
6. Se compară Z c cu Z α şi/sau cu - Z α , astfel urmărindu-se dacă se verifică una din relaţiile Rr
2 2

şi se ia decizia adecvată situaţiei.

 Testul Z unilateral dreapta


Ipoteza alternativă a acestui test constă în afirmaţia că media eşantionului este mai mare
decât cea a colectivităţii generale.Această remarcă se evidenţiază în reprezentarea grafică în care
se prezintă o limitare a densităţii de probabilitate la dreapta, printr-o arie de regiuni de respingere
a ipotezei nule.
În cazul acestui test regiunea de respingere este demarcată prin valoarea critică Z α
(figura 6.3).

RR

Zα H 0 se respinge

Figura 6.3. Elementele teoretice ale testului Z unilateral dreapta

Etapele care trebuiesc parcurse pentru aplicarea tetsului „z” unilateral dreapta sunt cele
prezentate anterior în cadrul celorlalte două tipuri de teste „z”.
1. Ipoteza nulă: H 0 : µ = µ ip

82
2. Ipoteza alternativă: H 1 : µ ≠ µ ip

3. Deoarece n ≥ 30 , din datele aplicaţiei şi H 1 , atunci se aplică testul Z unilateral dreapta şi se


începe schiţarea graficului.
4. În funcţie de nivelul de încredere ( 1 − α ), se determină limita de semnificaţie ( α ), cu ajutorul
căreia se stabileşte :
► Z tabelar sau teoretic: Z α (anexa 1) – şi valorile se plasează pe grafic

► regiunea de respingere ( Rr ) : dacă Z c > Z α , atunci H o se respinge şi este adevărată

ipoteza H 1 .
5. Se calculează valoarea statistică a testului cu una din relaţiile 4.2 sau 4.3, iar valoarea
obţinută se plasează pe grafic.
6. Se compară Z c cu Z α , astfel urmărindu-se dacă se verifică relaţia Rr şi se ia decizia adecvată
situaţiei.

6.2 Compararea mediilor a două eşantioane

În anumite situaţii practica necesită realizarea unei analize statistice prin compararea a
două medii ce reprezintă două eşantioane care trebuiesc studiate.
Principalele caracteristici ce permit aplicarea testului Z pentru compararea mediilor ce
revin celor două eşantioane sunt:
1. - eşantioanele sunt de volum mare ( n1 ≥ 30 şi n2 ≥ 30 )

( ) (
2. – variabilele au tendinţe de normalitate: X 1 ≈ N µ1 , σ 12 şi X 2 ≈ N µ 2 , σ 22 )
Statistica testului calculat este:
 σ 2 cunoscut :
x1 − x 2
zc = (6.3)
σ 12 σ 22
+
n1 n2

 σ 2 necunoscut:
x1 − x 2
zc = (6.4)
2 2
s1 s
+ 2
n1 n2

83
unde:
n1 – volumul primului eşantion
n 2 – volumul celui de-al doilea eşantion
x1 - media eşantionului 1
x2 − media eşantionului 2

σ 12 - dispersia primului eşantion


σ 22 - dispersia celui de-al doilea eşantion
s12 - estimaţia dispersiei primului eşantion

s 22 - estimaţia dispersiei celui de-al doilea eşantion

Cazuri particulare:
1. - dacă dispersiile celor două populaţii eşantionate sunt egale, σ 1 2 = σ 2 2 = σ 2 , atunci
statistica testului calculat va fi:
 σ 2 cunoscut :
x1 − x 2
zc = (6.5)
1 1
σ +
n1 n2

 σ 2 necunoscut:
x1 − x 2
zc = (6.6)
1 1
s +
n1 n 2

2. - dacă cele două eşantioane au acelaşi volum n1 = n2 = n , atunci statistica testului calculat
va fi:
 σ 2 cunoscut :
x1 − x 2
zc = (6.7)
σ 12 + σ 2 2
n
 σ 2 necunoscut:

84
x1 − x 2
zc = (6.8)
s1 + s 2
2 2

n
Direcţia abaterii ipotezei alternative implică şi în cazul comparării mediilor celor două
eşantioane apariţia celor trei tipuri de teste:
• unilateral stânga
• bilateral
• unilateral dreapta

Etapele ce trebuiesc parcurse, în toate cele trei tipuri de teste, sunt prezentate după cum
urmează:
1. Se prezintă ipoteza nulă H 0 : µ1 = µ 2

2. Se stabileşte ipoteza alternativă ( H 1 ) în funcţie de tipul testului, astfel:

2.1. - testul unilateral stânga: H 1 : µ1 < µ 2

2.2. - testul bilateral: H 1 : µ1 ≠ µ 2

2.3. - test unilateral dreapta: H 1 : µ1 > µ 2


3. Se precizează tipul testului statistic utilizat în raport cu datele aplicaţiei, volumul eşantionului
(dacă n>30, atunci se aplică testul „z”) , H 1 şi se începe schiţarea graficului.
4. În funcţie de nivelul de încredere ( 1 − α ) se determină limita de semnificaţie ( α ) cu ajutorul
căruia se stabileşte:
4.1. - testul unilateral stânga:
► „Z” tabelar sau teoretic Z α (Anexa 1) şi valoarea cu semnul „-„ se
plasează pe grafic .
► Regiunea de respingere Rr : dacă Z c < Z α , atunci H o se respinge şi este

adevărată ipoteza H 1 .
4.2. - testul bilateral:
► „Z” tabelar sau teoretic Z α (Anexa 1) şi valorile cu semnele „+” şi ”-„ se plasează
2

pe grafic.

85
► Regiunea de respingere Rr : dacă Z c < - Z α sau Z c > Z α atunci H o se respinge şi e
2 2

adevărată ipoteza H 1 .
4.3. - test unilateral dreapta:
► „Z” tabelar sau teoretic Z α (anexa 1) şi valoarea cu semnul „+„ se plasează pe
grafic.
► Regiunea de respingere Rr : dacă Z c > Z α , atunci H o se respinge şi este adevărată

ipoteza H 1 .
5. Se calculează valoarea statistică a testului calculat cu una din relaţiile 4.4 – 4.9, iar valoarea
obţinută se plasează pe grafic.
6. Se compară valoarea lui Z c cu una din valorile lui: - Z α , - Z α , Z α , sau Z α , şi se stabileşte
2 2

dacă rezultatul statistic al testului calculat, Z c , intră în regiunea de respingere Rr , luându-se


decizia adecvată situaţiei.

6.3 Compararea proporţiei eşantionului cu a colectivităţii generale

În practică apar cazuri care necesită testarea proporţiei unui eşantion cu testarea
proporţiei colectivităţii generale.
Aspectele pe care le vizează aplicarea testului Z în cazul comparării proporţiei
eşantionului cu cea a colectivităţii generale sunt:
∗ distribuţia repartizării proporţiilor trebuie să fie o distribuţie dihotomică ale cărei
caracteristici sunt modelate în general prin variabile repartizate binominal;
∗ distribuţia binominală este normală dacă:
n ⋅ p ≥ 5, n(1 − p ) ≥ 5 ,

unde „p” reprezintă proporţia (media) eşantionului.


În rapot cu volumul eşantionului apar următoarele situaţii:
♦ dacă „n” este suficient de mare (n>30) , în general în practică, relaţiile prezentate sunt
îndeplinite, deci apare o distribuţie normală a repartiţiei binominale, ceea ce implică aplicarea
testului „z”.

86
♦ dacă „n” este mai mic (n<30), se utilizează probabilitatea elementului compus sub H o
printr-o sumă a probabilităţilor de apariţie a evenimentelor caracterizate de un număr de
„succese” mai mare sau egal cu „r”.
n
PH 0 = ∑ C n P0 (1 − p 0 ) n −i
i i

i=r

Această relaţie conduce la obţinerea probabilităţilor critice, situaţie în care distribuţia de


eşantionare a proporţiei va fi tot una de tip Z, ceea ce implică aplicarea aceluiaşi tip de test şi
anume, testul Z.
Statistica testului calculat este:
f − p ip
Zc = (6.9)
f (1 − f )
n
unde:
n = volumul eşantionului
p ip = proporţia ipotetică

f = proporţia eşantionului
Ipoteza alternativă, prin direcţia abaterii pe care o prezintă, implică apariţia unuia dintre
cele trei tipuri de teste Z deja prezentate:
♦ unilateral stânga
♦ bilateral
♦ unilateral dreapta.
Aplicarea testului presupune parcurgerea următoarelor etape:
1. Se prezintă ipoteza nulă: H 0 : p = p o

2. Se stabileşte ipoteza alternativă ( H 1 ) în funcţie de tipul testului, astfel:


2.1. -testul unilateral stânga: H 1 : p < p ip

2.2. -testul bilateral: H 1 : p ≠ pip

2.3. -test unilateral dreapta: H 1 : p > pip

3. Se precizează tipul testului statistic utilizat în raport cu datele aplicaţiei, H 1 şi volumul


eşantionului (dacă n>30, atunci se aplică testul „Z”) şi se începe construcţia graficului.

87
4. În funcţie de nivelul de încredere ( 1 − α ) se determină limita de semnificaţie ( α ) cu ajutorul
căruia se stabileşte:
4.1. - testul unilateral stânga:
► „Z” tabelar sau teoretic Z α (anexa 1) şi valoarea cu semnul „-„ se plasează pe grafic
.
► regiunea de respingere Rr : dacă Z c < Z α , atunci H o se respinge şi este adevărată

ipoteza H 1 .
4.2. - testul bilateral:
► „Z” tabelar sau teoretic Z α (anexa 1) şi valorile cu semnele „+” şi ”-„ se plasează
2

pe grafic.
► regiunea de respingere Rr : dacă Z c > - Z α sau Z c > Z α , atunci H o se respinge şi
2 2

este adevărată ipoteza H 1 .

4.1.- test unilateral dreapta:


► „Z” tabelar sau teoretic Z α (anexa 1) şi valoarea cu semnul „+„ se plasează pe
grafic.
► regiunea de respingere Rr : dacă Z c > Z α , atunci H o se respinge şi este adevărată

ipoteza H 1 .

5. Se calculează valoarea statistică a testului calculat cu relaţia (3.21), iar valoarea obţinută se
plasează pe grafic.

6. se compară valoarea lui Z c cu una din valorile lui: - Z α , - Z α , Z α , sau Z α , şi se stabileşte


2 2

dacă rezultatul statistic al testului calculat, Z c , intră în regiunea de respingere Rr , luându-


se decizia adecvată situaţiei.

88
Exemplul 6.1.
Managerul unui lanţ hotelier s-a gândit să analizeze situaţia cheltuielilor ultimei luni, cu
scopul de a reduce pe viitor nivelul acestora. În acest context, s-a realizat un studiu privind
cheltuielile cu angajaţii trimişi la cursurile de training şi s-a stabilit că, pe fiecare angajat
cheltuiala este distribuită normal cu o medie de 980 UM şi o dispersie de 2500.
Se consideră că, această cheltuială medie pe angajat este mai mare decât cea stabilită la
980 UM. În vederea verificării afirmaţiei, se selectează aleatoriu un eşantion de 40 salariaţi
pentru care se înregistrează cheltuielile cu training-ul şi se stabileşte valoarea medie a acestor
cheltuieli la 1110 UM.
Pentru o probabilitate de 99,9%, poate managerul să concluzioneze că această cheltuială
medie pe angajat este mai mare de 980 UM?

Rezolvare:
Notaţii: µ ip = 980 UM

σ 2 = 2500
n = 40 salariaţi
x = 1110 UM
( 1 − α ) = 99,9%
1 Ipoteza nulă H 0 : µ = µ ip

(nu există diferenţă semnificativă între cheltuiala medie pe angajat şi cea stabilită
ipotetic la nivelul lanţului hotelier)
2 Ipoteza alternativă H 1 : µ > µ ip

( cheltuiala medie pe angajat este mai mare decât cea ipotetică stabilită la nivelul
lanţului hotelier)
3 Dacă n= 40 angajaţi >30, atunci se aplică testul Z (testul Z unilateral dreapta)
4 Se determină Z tabelar (teoretic) similar celor prezentate în exemplul 4.1 şi pentru α = 0.001
se obţine Z α = Z 0.001 = 3,085
5 Valoarea statistică a testului (valoarea calculată) este:

89
x − µ ip x − µ ip 1110 − 980 130
Zc = = = = = 16,43
σ σ2 2500 7,91
n n 40

Rr

Z α = 3,085 Z c = 16,43
H 0 se respinge

Figura 6.4. Verificarea ipotezei H 0


(nu există diferenţă semnificativă între cheltuiala medie pe angajat şi cea stabilită ipotetic la
nivelul lanţului hotelier)
6 Deoarece aşa cum se prezintă şi în figura 4.17, Z c (16,43) > Z α (3,085) , iar Z c intră în Rr ,

atunci H o se respinge şi este adevărată ipoteza H 1 , deci concluzia este că, managerul a
anticipat bine: cheltuiala medie pe angajat este mai mare de 980 UM.

Lucrare de verificare 6A

Răspundeţi pe scurt la următoarele întrebări:


1. Pentru o valoare de -1,29 a testului critic Z, schiţaţi distribuţia lui Z şi indicaţi locul
regiunii critice.
2. Pentru o valoare de 2,33 a testului critic Z, schiţaţi distribuţia lui Z şi indicaţi locul
regiunii critice.
3. Pentru α = 0,05 şi φ (Z calculat) =0,40 specificaţi dacă ipoteza nulă este respinsă în cazul
testului bilateral.
4. Pentru α = 0,025 şi φ (Z calculat) =0,45 specificaţi dacă ipoteza alternativă este acceptată
în cazul testului bilateral.

90
5. Într-un test în care se testează ipoteza nulă H0: µ =100 şi ipoteza alternative H1: µ>100 se
obţine valoarea testului z = 2,26, aflaţi pragul de semnificaţie corespunzător valorii
calculate a testului.

Test de autoevaluare 6B

1. Managerul unei structuri de primire turistică doreşte să verifice dacă durata medie a
sejurului turiştilor cazaţi este mai mică de 6 zile. Acesta presupune că durata medie a
unui sejur este de 6 zile, iar abaterea medie practică este de 2 zile. Testarea ipotezei este
completată prin selectarea aleatoare a unui eşantion de 80 turişti pentru care se stabileşte
că durata medie a sejurului este de 5 zile; nivelul de încredere este de 95%. Care sunt cele
două ipoteze?
a. H0: nu există diferenţă semnificativă între durata medie a sejurului şi cea
presupusă de manager
H1: durata medie a sejurului este mai mică decât cea presupusă de manager.
b. H0: nu există diferenţă semnificativă între durata medie a sejurului şi cea
presupusă de manager
H1: durata medie a sejurului este mai mare decât cea presupusă de manager.
c. H0: nu există diferenţă semnificativă între durata medie a sejurului şi cea
presupusă de manager.
H1: există diferenţă semnificativă între durata medie a sejurului şi cea presupusă
de manager.
d. H0: există diferenţă semnificativă între durata medie a sejurului şi cea presupusă
de manager
H1: durata medie a sejurului este mai mică decât cea presupusă de manager.

2. Managerul unei structuri de primire turistică doreşte să verifice dacă durata medie a
sejurului turiştilor cazaţi este mai mică de 6 zile. Acesta presupune că durata medie a
unui sejur este de 6 zile, iar abaterea medie practică este de 2 zile. Testarea ipotezei este
completată prin selectarea aleatoare a unui eşantion de 80 turişti pentru care se stabileşte

91
că durata medie a sejurului este de 5 zile; nivelul de încredere este de 95%. Valoarea
statistică a testului (valoarea calculată) este:
a. -4,55;
b. -3,55;
c. 2.35;
d. 7,25.

3. Un comerciant este de părere că, un român consumă în medie într-o lună mai puţin de 8
kg de pâine şi ar vrea să verifice această opinie. În acest sens, s-a realizat o anchetă pe un
eşantion aleatoriu de 49 familii din toate judeţele României şi a relevat un consum mediu
de 8,2 kg, cu o abatere medie pătratică de 1,7 kg. Dacă acceptăm un nivel de încredere de
95%, valoarea statistică a testului (valoarea calculată) este:
a. 0,95
b. 0,83
c. 1
d. 0,24.

4. Salariul mediu pe angajat stabilit pentru 35 agenţii de turism dintr-un judeţ este de 1600
lei. La nivelul regiunii care include judeţul respectiv s-a determinat pentru toate agenţiile,
un salariu mediu de 1585 lei pe angajat şi o abatere de 76,55 lei. Dacă cei interesaţi
doresc să arate, pentru o probabilitate de 99%, dacă salariul mediu pe angajat stabilit la
nivelul agenţiilor de turism ale judeţului diferă semnificativ de cel determinat pentru toate
agenţiile de turism din regiune, care sunt cele două ipoteze statistice?
a. H0: nu există diferenţă semnificativă salariul mediu pe angajat şi cel ipotetic.
H1:salariul mediu pe angajat este mai mic decât cel ipotetic.
b. H0: nu există diferenţă semnificativă între salariul mediu pe angajat şi cel ipotetic.
H1: există diferenţă semnificativă între salariul mediu pe angajat şi cel ipotetic.
c. H0: nu există diferenţă semnificativă salariul mediu pe angajat şi cel ipotetic.
H1:salariul mediu pe angajat este mai mare decât cel ipotetic.
d. H0: există diferenţă semnificativă salariul mediu pe angajat şi cel ipotetic.
H1:salariul mediu pe angajat este mai mic decât cel ipotetic.

92
5. Salariul mediu pe angajat stabilit pentru 35 agenţii de turism dintr-un judeţ este de 1600
lei. La nivelul regiunii care include judeţul respectiv s-a determinat pentru toate agenţiile,
un salariu mediu de 1585 lei pe angajat şi o abatere de 76,55 lei. Se doreşte testarea
ipotezei conform căreia salariul mediu pe angajat stabilit la nivelul agenţiilor de turism
ale judeţului diferă semnificativ de cel determinat pentru toate agenţiile de turism din
regiune. În urma testării acestei ipoteze pentru o probabilitate de 99% , putem afirma că:
a. Zcalculat = -1,16, se admite ipoteza nulă şi putem trage concluzia că nu există
diferenţă semnificativă între salariile medii stabilite la nivelul celor 35 agenţii de
turism şi la nivelul regiunii;
b. Zcalculat = 1,16, se respinge ipoteza nulă şi putem trage concluzia că există diferenţă
semnificativă între salariile medii stabilite la nivelul celor 35 agenţii de turism şi
la nivelul regiunii;
c. Zcalculat = 1,06, se admite ipoteza nulă şi putem trage concluzia că nu există
diferenţă semnificativă între salariile medii stabilite la nivelul celor 35 agenţii de
turism şi la nivelul regiunii;
d. Zcalculat = 1,16, se admite ipoteza nulă şi putem trage concluzia că nu există
diferenţă semnificativă între salariile medii stabilite la nivelul celor 35 agenţii de
turism şi la nivelul regiunii.

6. Managerul unui lanţ hotelier s-a gândit să analizeze situaţia cheltuielilor ultimei luni, cu
scopul de a reduce pe viitor nivelul acestora. În acest context, s-a realizat un studiu
privind cheltuielile cu angajaţii trimişi la cursurile de training şi s-a stabilit că, pe fiecare
angajat cheltuiala este distribuită normal cu o medie de 1090 UM.
Acesta consideră că, respectiva cheltuială medie pe angajat este mai mare decât cea
stabilită la 1090 UM. În vederea verificării afirmaţiei, se selectează aleatoriu un eşantion
de 40 salariaţi pentru care se înregistrează cheltuielile cu training-ul şi se stabileşte
valoarea medie de 1110 UM, iar abaterea standard de 50 UM. Pentru o probabilitate de
99,9%, valoarea statistică a testului (valoarea calculată) este:
a. 2,83
b. 2,53
c. 1,53

93
d. -2,55

7. Managerul unui lanţ hotelier s-a gândit să analizeze situaţia cheltuielilor ultimei luni, cu
scopul de a reduce pe viitor nivelul acestora. În acest context, s-a realizat un studiu
privind cheltuielile cu angajaţii trimişi la cursurile de training şi s-a stabilit că, pe fiecare
angajat cheltuiala este distribuită normal cu o medie de 1090 UM.
Acesta consideră că, respectiva cheltuială medie pe angajat este mai mare decât cea
stabilită la 1090 UM. În vederea verificării afirmaţiei, se selectează aleatoriu un eşantion
de 40 salariaţi pentru care se înregistrează cheltuielile cu training-ul şi se stabileşte
valoarea medie de 1110 UM, iar abaterea standard de 50 UM. Pentru o probabilitate de
99,9%, managerul concluzionează că:
a. această cheltuială medie pe angajat este mai mare decât cea presupusă de manager
de 1090 UM;
b. această cheltuiala medie pe angajat nu diferă semnificativ de cea presupusă de
manager de 1090 UM;
c. această cheltuială medie pe angajat este mai mică decât cea presupusă de manager
de 1090 UM;
d. această cheltuiala medie pe angajat diferă semnificativ de cea presupusă de
manager de 1090 UM.

8. Un fermier doreşte să verifice dacă în ceea ce priveşte producţia de lapte, după


cumpărarea şi utilizarea unui tonomat (aparat pentru vânzarea laptelui) profitul este mai
ridicat. În acest scop a fost înregistrat profitul într-o lună (31 de zile) înaintea cumpărării
aparatului şi în următoarea lună (30 de zile) după achiziţionarea şi utilizarea lui. Testarea
ipotezei se realizează pe baza celor două eşantioane, datele stabilite permiţând
înregistrarea următoarelor caracteristici:

Înainte de cumpărarea aparatului: După cumpărarea aparatului:


n 1 =31 de zile n 2 = 30 de zile
x1 =1200 UM x 2 = 2030 UM
s1 =231 UM s2 = 323 UM

În urma testării acestei ipoteze pentru o probabilitate de 99% , putem afirma că:

94
a. deoarece, Z c > − Z α (−1,15 > −1,645) , rezultă că ipoteza H0 se admite, ceea ce
înseamnă că profitul fermierului producător de lapte este mai mic după
cumpărarea aparatului;
b. deoarece, Z c < − Z α (−11,15 < −1,645) , rezultă că ipoteza H0 se admite, ceea ce
înseamnă că profitul fermierului producător de lapte este mai mică după
cumpărarea aparatului;
c. deoarece, Z c < − Z α (−11,15 < −1,645) , rezultă că ipoteza H0 se respinge şi este
adevărată ipoteza H1, ceea ce înseamnă că profitul fermierului producător de lapte
este mai mare după cumpărarea aparatului;
d. deoarece, Z c < − Z α (−12,5 < −1,645) , rezultă că ipoteza H0 se respinge şi este
adevărată ipoteza H1, ceea ce înseamnă că profitul fermierului producător de lapte
diferă semnificativ după cumpărarea aparatului;

9. ANAT a propus o modificare a reglementărilor statutului salariaţilor din agenţiile de


turism. Modificarea poate fi efectuată numai în condiţiile în care mai mult de 51% dintre
reprezentanţii angajaţilor sunt de acord cu ea. Pentru a stabili dacă această modificare
poate fi indusă în statut s-a selectat aleatoriu un eşantion de 150 reprezentanţi ai
angajaţilor, dintre care 80 de persoane au răspuns că sunt de acord cu respectiva
modificare. În urma testării ipotezei conform căreia proporţia reprezentanţilor din
eşantion nu diferă semnificativ de cea a tuturor celor din ANAT, putem afirma că:
a. Deoarece Z c (0,5) < Z α (1,645) , atunci se respinge H0, deci proporţia
reprezentanţilor din eşantion diferă semnificativ de cea a tuturor celor din ANAT.
Concluzia este că modificarea statului ANAT poate fi pusă în discuţia
reprezentanţilor în vederea aplicării ei.
b. Deoarece Z c (0,5) < Z α (1,645) , atunci se admite ipoteza H0, deci proporţia
reprezentanţilor din eşantion nu diferă semnificativ de cea a tuturor celor din
ANAT. Concluzia este că modificarea statului ANAT poate fi pusă în discuţia
reprezentanţilor în vederea aplicării ei.
c. Deoarece Z c (0,5) > Z α (0,45) , atunci se respinge ipoteza H0, deci proporţia
reprezentanţilor din eşantion diferă semnificativ de cea a tuturor celor din ANAT.
Concluzia este că modificarea statului ANAT poate fi pusă în discuţia
reprezentanţilor în vederea aplicării ei.

95
d. Deoarece Z c (0,5) > Z α (0,45) , atunci se admite ipoteza H0, deci proporţia
reprezentanţilor din eşantion diferă semnificativ de cea a tuturor celor din ANAT.
Concluzia este că modificarea statului ANAT poate fi pusă în discuţia
reprezentanţilor în vederea aplicării ei.

10. Un manager al unui magazin afirmă că, 16% dintre clienţii magazinului sunt bărbaţi.
Unul dintre vânzători nu este de acord cu această afirmaţie. Pentru studiu se formează un
eşantion de 100 clienţi şi se stabileşte că 25% dintre aceştia sunt bărbaţi. Ne putem baza
pe afirmaţia managerului cu un nivel de încredere de 95%?
a. deoarece Z c (2,25) > Z α (1,96) , atunci ipoteza H0 se respinge, deci se acceptă
2

ipoteza H1, prin urmare, afirmaţia managerului nu este adevărată, deoarece


proporţia stabilită diferă semnificativ de cea presupusă.
b. deoarece Z c (2,25) > Z α (0,5) , atunci ipoteza H0 se respinge, deci se acceptă
2

ipoteza H1, prin urmare, afirmaţia managerului nu este adevărată, deoarece


proporţia stabilită diferă semnificativ de cea presupusă.
c. deoarece Z c (1,25) < Z α (1,96) , atunci ipoteza H0 se admite, prin urmare, afirmaţia
2

managerului este adevărată, deoarece proporţia stabilită nu diferă semnificativ de


cea presupusă.
d. deoarece Z c (2,25) > Z α (0,5) , atunci ipoteza H0 se admite, prin urmare, afirmaţia
2

managerului este adevărată, deoarece proporţia stabilită nu diferă semnificativ de


cea presupusă.

Rezumat

Pentru testarea indicatorului medie, pentru eşantioane mai mari de 30 de elemente se utilizează
testul Z. Sunt prezentate modalităţile de testare a mediei populaţiei generale, a mediilor a două
populaţii şi în particular a proporţiei existente într-o colectivitate.

96
Pentru testarea ipotezei privind media populaţiei generale statistica testului pentru σ 2
x − µ ip x − µ ip x − µ ip x − µ ip
cunoscut este Z c = = sau Z c = = în caz contrar. Regiunile critice
σ2 σ s2 s
n n n n

sunt determinate în funcţie de pragul de semnificaţie ales şi de enunţurile concrete ale ipotezelor
H 0 (nulă) şi H 1 (alternativă).
Similar, pentru testarea ipotezei privind mediile a două populaţii, statistica testului este
x1 − x 2 x1 − x 2 f − p ip
zc = sau z c = , iar pentru testatrea proporţiilor Z c = .
σ 12 σ 22 s1
2
s
2
f (1 − f )
+ + 2
n1 n2 n1 n2 n

Testările se efectuează parcurgând secvenţial etapele prezentate în unitatea de învăţare 5.

Bibliografie
Cristache S.E., Şerban Lucrări aplicative de statistică şi econometrie pentru
D. administrarea afacerilor, Editura ASE, Bucureşti, 2007

Gogonea R.M., Zaharia Econometrie cu aplicaţii în activitatea de comerţ-turism-


M. servicii, Editura Universitară, Bucureşti, 2008,
Elemente de analiză şi prognoză în turism, Editura
Hapenciuc C.V. Junimea, Iaşi, 2004
Isaic-Maniu A., Mitruţ
Statistică, Editura Universitară, Bucureşti, 2003
C.,
Voineagu V.
Jaba E.
Statistică, Editura Economică, Bucureşti, 1998

Pecican Şt. E. Econometrie pentru...economişti, Editura Economică


Bucureşti, 2007

97
Unitatea de învăţare 7
TESTAREA IPOTEZELOR PRIVIND MEDIILE POPULAŢIILOR CU
EŞANTIOANE DE VOLUM MIC

Bibliografie
Obiectivele Unităţii de Învăţare 7 ............................................................................................. 98
7.1 Compararea mediei unui eşantion de volum redus cu media colectivităţii generale .......... 98
7.2 Compararea mediilor a două eşantioane de volum redus .................................................. 102
Lucrare de verificare 7A ......................................................................................................... 108
Test de autoevaluare 7B .......................................................................................................... 109
Rezumat................................................................................................................................... 114
Bibliografie.................................................................................Error! Bookmark not defined.

Obiectivele Unităţii de Învăţare 7

După studiul acestei unităţi de învăţare cursanţii vor avea cunoştinţe despre:
• testarea ipotezei statistice privind compararea unui eşantion de volum redus cu
media colectivităţii generale;
• testarea ipotezei statistice privind compararea mediilor a două eşantioane de
volum redus;

7.1 Compararea mediei unui eşantion de volum redus cu media


colectivităţii generale

Eşantioanele de volum redus reprezintă acele eşantioane care sunt formate din mai puţin
de 30 elemente componente ( n < 30 ) extrase dintr-o colectivitate generală ce urmează a fi
cercetată.
Procesul de testare aplicat unor astfel de eşantioane se bazează pe aplicarea testului
STUDENT ( t ).

98
Caracteristicile ce stau la baza aplicării testului Student ( t ) care includ imposibilitatea
stabiliri dispersiei colectivităţii generale, deci implicit a abaterii medii pătratice, precum şi
formarea unor eşantioane de volum redus, cu mai puţin de 30 de componente, reprezintă
principalele elemente necesare în derularea analizei de comparare a mediei unui eşantion cu cea
a colectivităţii generale.
Testul t poate fi aplicat pornind de la considerentul că distribuţia normală redusă
caracterizează colectivitatea generală.
Deoarece în general, pentru astfel de eşantioane nu prea se cunoaşte dispersia
colectivităţii generale, deci nici abaterea medie pătratică, se va utiliza testul (t ) numai în condiţia
estimării abaterii standard a colectivităţii generale cu cea a eşantionului.
Fiind este vorba de un eşantion redus (n < 30 ) , abaterea medie pătratică (standard)
estimată se determină cu relaţia:
n

∑ (x
i =1
i − x)2
s = s2 = , (7.1)
n −1
Statistica testului calculat va fi:
x − µ ip x − µ ip
tc = = (7.2)
s2 s
n n

unde:
x − media eşantionului

µ ip - media ipotetică a colectivităţii generale


s − abaterea standard estimată
n – volumul eşantionului
Deoarece, ca şi în celelalte cazuri, la testului Student se ţine seama de direcţia abaterii
stabilită în ipoteza alternativă, atunci deciziile se formează tot în raport cu tipul testului studiat:
unilateral stânga, bilateral, unilateral dreapta.
În acest context, ipotezele testului Student şi regiunile de respingere sunt asemănătoare
cu cele ale testului Z .

99
Observaţie
De remarcat că, deoarece la repartiţia Student vorbim de gradele de libertate, atunci
valorile critice care limitează densitatea de probabilitate, deci valorile repartiţiei Student (Anexa
3) au formele
► ± tα , n −1 , pentru testul unilateral drepta, stânga

► ± tα , pentru testul bilateral.


, n −1
2

În aceste condiţii, avem următoarele etape:


1. Se prezintă ipoteza nulă: H 0 : µ = µ ip

2. Se stabileşte ipoteza alternativă ( H 1 ) în funcţie de tipul testului, astfel:


2.1. - testul unilateral stânga: H 1 : µ < µ ip

2.2. - testul bilateral: H 1 : µ ≠ µ ip

2.3. - test unilateral dreapta: H 1 : µ > µ ip

3. Se precizează tipul testului statistic utilizat în raport cu datele aplicaţiei, H 1 , volumul

eşantionului (dacă n<30, atunci se aplică testul t ) şi se începe schiţarea graficului.


4. În funcţie de nivelul de încredere ( 1 − α ) se determină limita de semnificaţie ( α ) cu ajutorul
căreia se stabileşte:
4.1. - testul unilateral stânga (figura 7.1)
► valoarea lui t tabelar sau teoretic tα (Anexa 3), cu semnul ”-„ se plasează pe
grafic .
► regiunea de respingere Rr : dacă t c < −tα , n −1 , atunci H o se respinge

Rr

H 0 se respinge − tα ;n −1

100
Figura 7.1 Aplicarea testului t unilateral stânga
(compararea mediei eşantionului cu a colectivităţii generale)

4.2. - testul bilateral (figura 7.2):


► valorile lui t tabelar sau teoretic t α (Anexa 3), cu semnele „+” şi ”-„ se plasează
2

pe grafic.
► regiunea de respingere Rr : dacă t c < - t α sau t c > t α atunci H o se respinge
, n −1 , n −1
2 2

Rr
Rr

H 0 se respinge H 0 se respinge

− tα tα
;n −1 ; n −1
2 2

Figura 7.2. Aplicarea testului t bilateral


(compararea mediei eşantionului cu a colectivităţii generale)

4.3. - test unilateral dreapta (figura 7.3)


► t tabelar sau teoretic tα , n−1 (Anexa 3) şi valoarea cu semnul „+„ se plasează pe

grafic.
► regiunea de respingere Rr : dacă t c > tα , n −1 , atunci H o se respinge

Rr

tα ;n −1 H 0 se respinge

Figura 7.3. Aplicarea testului t unilateral dreapta

101
(compararea mediei eşantionului cu a colectivităţii generale)

5. Se calculează valoarea statistică a testului determinată cu relaţia (3.28), iar valoarea obţinută
se plasează pe grafic.
6. Se compară valoarea t c cu una din valorile - tα ,n −1 , - t α , tα , tα , n−1 şi se stabileşte dacă
, n −1 , n −1
2 2

rezultatul statistic al testului calculat t c intră în regiunea de respingere Rr , luându-se decizia


adecvată situaţiei.

7.2 Compararea mediilor a două eşantioane de volum redus

De multe ori deciziile din activitatea economică, din afaceri, trebuiesc stabilite prin
compararea unor informaţii destul de reduse.
În aceste condiţii, se poate vorbi despre compararea a două eşantioane de volum mic (n<
30) caracterizate astfel:
 un eşantion de volum n1 < 30 cu media x1 şi dispersia s12 este extras dintr-o colectivitate

generală cu media µ1 şi dispersia σ 12 .

 alt eşantion de volum n2 < 30 , cu media x 2 şi dispersia s 22 este extras dintr-o colectivitate

generală cu media µ 2 şi dispersia σ 22 .


Două cazuri cu aplicabilitate practică prezintă interes pentru analiza econometrică:
• Eşantioanele sunt independente şi provin din colectivităţi generale cu abateri
standard egale.
• Eşantioanele sunt independente şi provin din colectivităţi generale cu abateri
standard diferite (inegale).

♦ Eşantioane independente din colectivităţi generale


cu abateri standard egale
În practică pot să apară situaţii în care trebuie să se formeze două eşantioane
independente care provin din colectivităţi generale cu dispersii egale.
σ 1 2 = σ 2 2 = σ 2 , deci σ 1 = σ 2 = σ

102
Repartiţia Student tabelară sau teoretică va avea n1 + n2 − 2 grade de libertate, iar
statistica testului calculat va fi:
x1 − x2 x1 − x 2
tc = = (7.3)
1 1  1
+
1
s e2 ⋅  +  se
 n1 n 2  n1 n 2

unde s e este abaterea standard estimată determinată cu relaţia:

(n1 − 1) s12 + (n 2 − 1) s 22
se = (7.4)
n1 + n2 − 2

Atât ipotezele testului Student, cât şi regiunile de respingere sunt asemănătoare cu cele

prezentate anterior, exceptând valorile critice în care apare testul t tabelar care apar de forma:
tα ; n1 +n2 − 2 , pentru testul unilateral, respectiv t α , pentru testul bilateral.
, n1 + n2 − 2
2

În aceste condiţii avem, următoarele etape:


1. Se prezintă ipoteza nulă H 0 : x1 = x 2

2. Se stabileşte ipoteza alternativă ( H 1 ) în funcţie de tipul testului, astfel:

2.1. - testul unilateral stânga: H 1 : x1 < x 2

2.2. - testul bilateral: H 1 : x1 ≠ x 2

2.3. - test unilateral dreapta: H 1 : x1 > x 2


3. Se precizează tipul testului statistic utilizat în raport cu datele aplicaţiei şi volumul

eşantionului (dacă n<30, atunci se aplică testul t şi se construieşte graficul.


4. În funcţie de nivelul de încredere ( 1 − α ) se determină limita de semnificaţie ( α ) cu ajutorul
căreia se stabileşte:
4.1. - testul unilateral stânga (figura 7.4):

► valoarea lui t tabelar sau teoretic tα ; n1 +n2 − 2 (Anexa 3), cu semnul ”-„ se plasează pe

grafic.
► regiunea de respingere Rr : dacă t c < −tα ; n1 + n2 − 2 , atunci H o se respinge şi este

adevărată ipoteza H 1 .

103
Rr

H 0 se respinge − tα ;n1 + n2 − 2

Figura 7.4 Aplicarea testului t unilateral stânga


(compararea mediilor a două eşantioane)

4.2. - testul bilateral (figura 7.5):


► valorile lui t tabelar sau teoretic t α (Anexa 3), cu semnele „+” şi ”-„ se plasează
; n1 + n2 − 2
2
pe grafic.
► regiunea de respingere Rr : dacă t c < - t α sau t c > t α atunci H o se
; n1 + n2 − 2 ; n1 + n2 − 2
2 2

respinge şi este adevărată ipoteza H 1 .

Rc
Rc

H 0 se respinge H 0 se respinge

− tα tα
; n1 + n2 − 2 ; n1 + n2 − 2
2 2

Figura 7.5. Aplicarea testului t bilateral


(compararea mediilor a două eşantioane)

4.3. test unilateral dreapta (figura 7.6):


► ttabelar sau teoretic tα ;n1 +n2 − 2 (Anexa 3) şi valoarea cu semnul „+„ se plasează pe
grafic
► regiunea de respingere Rr : dacă t c > tα ;n1 + n2 − 2 , atunci H o se respinge şi este adevărată
ipoteza H 1 .

104
Rr

tα ; n1 +n2 − 2 H 0 se respinge

Figura 7.6. Aplicarea testului t unilateral dreapta


(compararea mediilor a două eşantioane)

5. Se calculează statistica testului cu relaţia (3.29), iar valoarea obţinută se plasează pe grafic.
6. Se compară valoarea lui t c cu una din valorile - tα ; n1 +n2 − 2 , - t α , tα , tα ; n1 +n2 − 2 şi se
; n1 + n2 − 2 ; n1 + n2 − 2
2 2

stabileşte dacă rezultatul statistic al testului calculat t c intră în regiunea de respingere Rr ,


luându-se decizia adecvată situaţiei.

♦ Eşantioane independente din colectivităţi generale


cu abateri standard inegale

Particularitatea acestei ipostaze constă în faptul că deoarece dispersiile nu sunt egale, deci
nici abaterile standard nu pot avea aceaşi valoare, se va aplica testul utilizând estimaţia abaterii
standard la nivelul fiecărui eşantion:

n1

∑ (x
i =1
i1 − x1 ) 2
s1 = s12 = (7.5)
n1 − 1

n2

∑ (x
i =1
i2 − x2 ) 2
s 2 = s 22 = (7.6)
n2 − 1

Statistica testului Student calculată va fi:

x1 − x 2
tc = (7.7)
2 2
s1 s
+ 2
n1 n2

105
Ipotezele testului Student şi regiunile de respingere vor fi similare celor prezentate în
ipostaza anterioară, pentru eşantioanele independente provenind din colectivităţi generale cu
abateri standard egale.
În aceste condiţii avem, următoarele etape:
1. Se prezintă ipoteza nulă H 0 : x1 = x 2

2. Se stabileşte ipoteza alternativă ( H 1 ) în funcţie de tipul testului, astfel:


2.1. -testul unilateral stânga: H 1 : x1 < x 2
2.2. - testul bilateral: H 1 : x1 ≠ x 2
2.3. - test unilateral dreapta: H 1 : x1 > x 2
3. Se precizează tipul testului statistic utilizat în raport cu datele aplicaţiei şi volumul
eşantionului (dacă n>30, atunci se aplică testul t ) şi se construieşte graficul.
4. În funcţie de nivelul de încredere ( 1 − α ) se determină limita de semnificaţie ( α ) cu ajutorul
căruia se stabileşte:
4.1. - testul unilateral stânga (vezi figura 7.4):
► t tabelar sau teoretic tα ;n1 + n2 − 2 (Anexa 3) şi valoarea cu semnul ”-„ se plasează pe grafic.
► regiunea de respingere Rr : dacă t c < −tα ;n1 + n2 − 2 , atunci H o se respinge şi este adevărată
ipoteza H 1 .
4.2. - testul bilateral (vezi figura 7.5):
► t tabelar sau teoretic t α (Anexa 3) şi valorile cu semnele „+” şi ”-„ se plasează pe
; n1 + n2 − 2
2
grafic.
► regiunea de respingere Rr : dacă t c < - t α sau t c > t α atunci H o se respinge
; n1 +n2 − 2 ; n1 +n2 − 2
2 2

şi este adevărată ipoteza H 1 .


4.3. - test unilateral dreapta (vezi figura 7.6):
► t tabelar sau teoretic tα ;n1 +n2 − 2 (Anexa 3) şi valoarea cu semnul „+„ se plasează pe
grafic.
► regiunea de respingere Rr : dacă t c > tα ;n1 + n2 − 2 , atunci H o se respinge şi este adevărată
ipoteza H 1 .
5. Se determină valoarea statistică a testului calculat cu relaţia (3.33), iar valoarea obţinută se
plasează pe grafic.
6. Se compară valoarea lui t c cu una din valorile - tα ; n1 + n2 − 2 , - t α , tα , tα ; n1 + n2 − 2 şi
; n1 +n2 − 2 ; n1 +n2 − 2
2 2

se stabileşte dacă rezultatul statistic al testului calculat t c intră în regiunea de respingere


Rr , luându-se decizia adecvată situaţiei.

106
Exemplul 7.1.
Într-o zonă montană, între două tipuri de pensiuni turistice rurale (1 margaretă şi 2
margarete), cu acelaşi număr de camere, se testează ipoteza conform căreia nu există diferenţă
semnificativă privind cheltuielile medii de întreţinere din sezonul turistic de iarnă.
Ştiind că, probabilitatea luată în considerare este de 98%, testarea se realizează pentru 6
pensiuni de 1 margaretă şi 4 unităţi de 2 margarete de la care sunt preluate datele privind
cheltuielile de întreţinere din sezonul turistic de iarnă şi sunt prelucrate. Rezultatele testării sunt
prezentate în tabelul 4.2:
Tabelul 7.2. - Caracteristicile eşantioanelor din cele două pensiuni
Pensiunea de 1 margaretă Pensiunea de 2 margarete
n1= 6 n2 = 4

x1 = 4,5 mii UM x 2 = 4,84 mii UM

s1 = 0,15 mii UM s 2 = 0,44 mii UM

Rezolvare:
1. Ipoteza nulă H 0 : x1 = x 2
(nu există diferenţă semnificativă între cheltuielile medii de întreţinere ale pensiunilor
turistice rurale de o margaretă şi ale celor de două margarete).
2. Ipoteza alternativă H 1 : x1 ≠ x 2
(există diferenţă semnificativă între cheltuielile medii de întreţinere ale pensiunilor
turistice rurale de o margaretă şi ale celor de două margarete).
3. Dacă n1 = 6 şi n 2 = 4, ambele mai mici de 30, atunci se aplică testul t (testul t bilateral)
4. Fiind test " t " bilateral probabilitatea de 98% va fi evidenţiată prin
α
= 0,02 ⇒ t α = t 0,02;8 = 2,896
2 2
; n1 + n2 − 2

Regiunea de respingere Rr este: t c < − t α sau t c > t α ⇒ H o se respinge, deci


; n1 + n2 − 2 ; n1 + n2 − 2
2 2

este adevărată ipoteza H 1 .


5. Valoarea statistică a testului (valoarea calculată) se determină cu relaţia 4.16, după
determinarea abaterii standard estimată, astfel:

107
(n1 − 1) s12 + (n2 − 1) s 22 (6 − 1) ⋅ 0,15 2 + (4 − 1) ⋅ 0,44 2
se = = = 0,29
n1 + n2 − 2 6+4−2

s e = 0,0867 = 0,29

x1 − x 2 4,5 − 4,84
tc = = = − 1,82
1 1 1 1
se + 0,29 ⋅ +
n1 n2 6 4

Deoarece
− tα (−2,896) < t c (− 1,82) < t α (2,896) ,
; n1 + n2 − 2 ; n1 + n 2 − 2
2 2

atunci t c este în afara Rr , rezultă că H o este adevărată.

Rr
Rr

H 0 se respinge H 0 se respinge

− tα = −2,896 tα = 2,896
; n1 +n2 − 2 ;n1 + n2 − 2
2
t c = −1,82 2

Se acceptă H 0
o
Figura 7. 7. Testarea ipotezei H 0 :
nu există diferenţă semnificativă între cheltuielile medii de întreţinere ale celor două
categorii de pensiuni

6. Concluzia (figura 7.7) este că nu există diferenţă semnificativă între cheltuielile medii de
întreţinere ale pensiunilor turistice rurale de o margaretă şi cele ale pensiunilor de două
margrete.

Lucrare de verificare 7A

Răspundeţi pe scurt la următoarele întrebări:


1. Cum se testează ipoteza privind compararea mediei unui eşantion de volum redus cu
media colectivităţii generale?

108
2. Cum se testează ipoteza privind compararea mediilor a două eşantioane de volum redus?
3. Pentru o valoare de -1,71 a testului student (t) critic, schiţaţi distribuţia lui t şi indicaţi
locul regiunii critice.
4. Pentru o valoare de 2,33 a testului (t) critic, schiţaţi distribuţia lui t şi indicaţi locul
regiunii critice.
5. Pentru 1 − α = 95% şi t calculat=0,40 specificaţi dacă ipoteza nulă este respinsă în cazul
testului unilateral stânga.

Test de autoevaluare 7B

1. În vederea verificării greutăţii produselor dintr-un lot de piese se extrage aleator simplu şi
repetat un eşantion format din 25 piese. La nivelul eşantionului observat se obţine o
greutate medie de 340 g şi o abatere standard de 10g. Se studiază ipoteza potrivit căreia
greutatea medie a unei piese din întregul lot concordă cu greutatea medie prevăzută în
normele STAS, µ 0 = 330 g . (riscul asumat este α = 0,05 ). Valoarea statistică a testului
(valoarea calculată) este:
a. 4
b. 5
c. 4,75
d. 5,25

2. În vederea verificării greutăţii produselor dintr-un lot de piese se extrage aleator simplu şi
repetat un eşantion format din 25 piese. La nivelul eşantionului observat se obţine o
greutate medie de 340 g şi o abatere standard de 10g. Se studiază ipoteza potrivit căreia
greutatea medie a unei piese din întregul lot concordă cu greutatea medie prevăzută în
normele STAS, µ 0 = 330 g . (riscul asumat este α = 0,05 ). Care sunt cele două ipoteze
statistice?
a. H 0 : µ ≠ µ 0 (există diferenţă semnificativă între greutatea medie a unei piese
din întregul lot şi greutatea medie prevăzută în normele STAS).
H 1 : µ > µ 0 (greutatea medie a unei piese din întregul lot este mai mare
decăt greutatea medie prevăzută în normele STAS).

109
b. H 0 : µ = µ 0 (nu există diferenţă semnificativă între greutatea medie a unei
piese din întregul lot şi greutatea medie prevăzută în normele STAS).
H 1 : µ < µ 0 (greutatea medie a unei piese din întregul lot este mai mică
decât greutatea medie prevăzută în normele STAS).
c. H 0 : µ = µ 0 (nu există diferenţă semnificativă între greutatea medie a unei
piese din întregul lot şi greutatea medie prevăzută în normele STAS).
H 1 : µ ≠ µ 0 (există diferenţă semnificativă între greutatea medie a unei piese
din întregul lot şi greutatea medie prevăzută în normele STAS).
d. H 0 : µ ≠ µ 0 (există diferenţă semnificativă între greutatea medie a unei piese
din întregul lot şi greutatea medie prevăzută în normele STAS).
H 1 : µ < µ 0 (greutatea medie a unei piese din întregul lot este mai mica
decât greutatea medie prevăzută în normele STAS).

3. Patronul unei pensiuni turistice rurale, în vederea ridicări calităţii activităţilor desfăşurate,
doreşte să-şi analizeze mai atent cheltuielile şi presupune că, în medie, cheltuiala zilnică
în perioada de sezon este de 400 UM pe turist. Testarea ipotezei presupune o selectare
aleatorie a 25 de zile, pentru care se înregistreză valorile (UM): 430, 280, 300, 250, 330,
280, 400, 410, 400, 380, 330, 350, 380, 280, 330, 390, 290, 380, 450, 370, 380, 330, 410,
390, 380. În urma testării potezei conform căreia, pentru o probabilitate de 95%, în medie
cheltuiala zilnică în perioada de sezon este mai mică de 400 UM pe turist, se poate trage
următoarea concluzie:
a. deoarece t c (−4,13) < −tα ,n −1 (−1,711) , rezultă că între cheltuielile medii

comparate există diferenţă semnificativă.


b. deoarece t c ( −3,50) < −tα , n −1 (−1,711) , rezultă că între cheltuielile medii

comparate există diferenţă semnificativă.


c. deoarece t c (−4,13) > −tα , n −1 (−1,711) , rezultă că între cheltuielile medii

comparate nu există diferenţă semnificativă.


d. deoarece t c (−4,13) ≠ −tα , n −1 (−1,711) , rezultă că între cheltuielile medii

comparate nu există diferenţă semnificativă.

110
4. Se extrag aleator, simplu, repetat, două eşantioane, primul format din 8 persoane de sex
masculin, iar al doilea din 10 persoane de sex feminin. Ştiind că, probabilitatea luată în
considerare este de 99%, iar rezultatele prelucrării datelor sunt următoarele:

Eşantionul persoane de sex masculin Eşantionul persoane de sex feminin


nF = 22 femei nM = 20 băieţi
x F = 26 ani xM = 30 ani
s F = 8 ani s M = 4 ani

În urma testării ipotezei statistice potrivit căreia vârsta medie a persoanelor de sex
masculin este mai mare decât a celor de sex feminine, valoarea calculate a testului este:
a. 1,82;
b. 2, 28;
c. -1,82;
d. -2,28.

5. Într-o zonă montană, între două tipuri de pensiuni turistice rurale (1 margaretă şi 2
margarete), cu acelaşi număr de camere, se testează ipoteza conform căreia nu există
diferenţă semnificativă privind cheltuielile medii de întreţinere din sezonul turistic de
iarnă. Ştiind că, probabilitatea luată în considerare este de 98%, testarea se realizează
pentru 6 pensiuni de 1 margaretă şi 4 unităţi de 2 margarete de la care sunt preluate datele
privind cheltuielile de întreţinere din sezonul turistic de iarnă şi sunt prelucrate.
Caracteristicile eşantioanelor din cele două pensiuni sunt următoarele:

Pensiunea de 1 margaretă Pensiunea de 2 margarete


n1= 6 n2 = 4
x1 = 4,5 mii UM x2 = 4,84 mii UM
s1 = 0,15 mii UM s 2 = 0,44 mii UM

Rezultatele testării sunt:


a. nu există diferenţă semnificativă între cheltuielile medii de întreţinere ale
pensiunilor turistice rurale de o margaretă şi cele ale pensiunilor de două
margarete deoarece (t calculat = -2,896);

111
b. există diferenţă semnificativă între cheltuielile medii de întreţinere ale
pensiunilor turistice rurale de o margaretă şi cele ale pensiunilor de două
margarete deoarece (t calculat = -2,896);
c. există diferenţă semnificativă între cheltuielile medii de întreţinere ale
pensiunilor turistice rurale de o margaretă şi cele ale pensiunilor de două
margarete deoarece (t calculat = 2,896);
d. cheltuielile medii de întreţinere ale pensiunilor turistice rurale de o margaretă
sunt mai mari decât cele ale pensiunilor de două margarete deoarece (t calculat =
-2,896);

6. O companie doreşte să introducă o nouă metodă de realizare a unui produs. Se selectează


20 de produse pentru care se înregistrează timpii de realizare cu vechea metodă şi 22 de
produse pentru noua metodă. Rezultatele sunt:

Metoda actuală Noua metodă


n 1 = 20 n 2 = 22
x1 = 27,1 minute x 2 = 25,4 minute
s1 = 3,7 minute s2 = 3,1 minute

Se testează, cu o probabilitate de 95%, ipoteza conform căreia noua metodă duce la un


consum de timp semnificativ mai mic.
Ipotezele statistice sunt:
a. Ipoteza nulă: nu există diferenţă semnificativă între consumul de timp realizat
de noua metodă şi cel realizat de vechea metodă;
Ipoteza alternativă: consumul de timp realizat de noua metodă este
semnificativ mai mare decât cel realizat de vechea metodă;
b. Ipoteza nulă: nu există diferenţă semnificativă între consumul de timp realizat
de noua metodă şi cel realizat de vechea metodă;
Ipoteza alternativă: nu există diferenţă semnificativă între consumul de timp
realizat de noua metodă şi cel realizat de vechea metodă;
c. Ipoteza nulă: nu există diferenţă semnificativă între consumul de timp realizat
de noua metodă şi cel realizat de vechea metodă;
Ipoteza alternativă: consumul de timp realizat de noua metodă este
semnificativ mai mic decât cel realizat de vechea metodă;

112
d. Ipoteza nulă: există diferenţă semnificativă între consumul de timp realizat de
noua metodă şi cel realizat de vechea metodă;
Ipoteza alternativă: consumul de timp realizat de noua metodă este
semnificativ mai mic decât cel realizat de vechea metodă;

7. O companie doreşte să introducă o nouă metodă de realizare a unui produs. Se selectează


20 de produse pentru care se înregistrează timpii de realizare cu vechea metodă şi 22 de
produse pentru noua metodă. Rezultatele sunt:

Metoda actuală Noua metodă


n 1 = 20 n 2 = 22
x1 = 27,1 minute x 2 = 25,4 minute
s1 = 3,7 minute s2 = 3,1 minute

În urma testării, cu o probabilitate de 95%, a ipotezei conform căreia noua metodă duce la
un consum de timp semnificativ mai mic, putem spune că:
a. se admite ipoteza nulă, nu există diferenţă semnificativă între consumul de
timp realizat de noua metodă şi cel realizat de vechea metodă;
b. se respinge ipoteza nulă, există diferenţă semnificativă între consumul de timp
realizat de noua metodă şi cel realizat de vechea metodă;;
c. se respinge ipoteza nulă, consumul de timp realizat de noua metodă este
semnificativ mai mic decât cel realizat de vechea metodă;
d. se admite ipoteza nulă, există diferenţă semnificativă între consumul de timp
realizat de noua metodă şi cel realizat de vechea metodă;
8. Se doreşte testarea ipotezei conform căreia între două mărci de imprimante nu există
diferenţe semnificative privind cheltuielile de funcţionare. Pentru aceasta, 20 de posesori
de imprimante (8 posesori ai primei mărci, 12 posesori ai celei de a doua) sunt rugaţi să
ţină evidenţa cheltuielor de funcţionare pe o perioadă de un an de zile. Rezultatele
prelucrării datelor sunt:

Marca 1 Marca 2
n1= 8 n 2 = 12
x1 = 56,96 UM x 2 = 52,73 UM
s1 = 4,9 s2 = 6,4

113
Pentru o probabilitate de 90%, putem spune că:
a. nu există diferenţe semnificative privind cheltuielile de funcţionare ale celor
două mărci de imprimante;
b. există diferenţe semnificative privind cheltuielile de funcţionare ale celor două
mărci de imprimante;
c. cheltuielile de funcţionare cu prima marcă de imprimantă sunt semnificativ
mai mari decăt cheltuielile de funcţionare cu cea de-a doua marcă de
imprimantă;
d. cheltuielile de funcţionare cu prima marcă de imprimantă sunt semnificativ
mai mici decăt cheltuielile de funcţionare cu cea de-a doua marcă de
imprimantă;

Rezumat

Pentru testarea indicatorului medie, pentru eşantioane mai mici de 30 de elemente se


utilizează testul Student (t).

Pentru testarea ipotezei privind media populaţiei generale statistica testului este
n

x − µ ip x − µ ip ∑ (x
i =1
i − x)2
tc = = unde s = s 2 = . Regiunile critice sunt determinate în
s2 s n −1
n n

funcţie de pragul de semnificaţie ales, numărul gradelor de libertate (g=n-1) şi de enunţurile


concrete ale ipotezelor H 0 (nulă) şi H 1 (alternativă).

Similar, pentru testarea ipotezei privind mediile a două populaţii, statistica testului este

x1 − x 2 x1 − x 2 (n1 − 1) s12 + (n 2 − 1) s 22
sau t c = = , unde s e = .
1 1  1 1 n1 + n2 − 2
s e2 ⋅  +  se +
 n1 n2  n1 n 2

Testările se efectuează parcurgând secvenţial etapele prezentate în unitatea de învăţare 5.

114
Bibliografie

Bădiţă M., Baron T., Statistică pentru afaceri în comerţ – turism, vol 1, 2,
Cristache S.E. Editura Luceafărul, Bucureşti, 2002

Gogonea R.M., Zaharia Econometrie cu aplicaţii în activitatea de comerţ-turism-


M. servicii, Editura Universitară, Bucureşti, 2008.

Oprea C., Zaharia M. Elemente de analiza datelor și modelare utilizând Excel,


Editura Universitară, Bucureşti, 2011

Voineagu V, Ţiţan E., Teorie şi practică econometrică, Editura Meteor Press,


Şerban R., Ghiţă S., 2007
Tudose D., Boboc C.,
Pele D.

115
Unitatea de învăţare 8
TESTAREA IPOTEZELOR PRIVIND DISPERSIILE POPULAŢIILOR

Cuprins

Obiectivele Unităţii de Învăţare 8 ........................................................................................... 116


8.1 Compararea dispersiei eşantionului cu dispersia colectivităţii generale ........................... 116
8.2 Compararea dispersiei a două colectivităţi ........................................................................ 119
Lucrare de verificare 8A ......................................................................................................... 123
Test de autoevaluare 8B .......................................................................................................... 123
Rezumat ................................................................................................................................... 125
Bibliografie.............................................................................................................................. 126

Obiectivele Unităţii de Învăţare 8

După studiul acestei unităţi de învăţare cursanţii vor avea cunoştinţe despre:
• testarea ipotezei statistice privind compararea dispersiei eşantionului cu dispersia
colectivităţii generale;
• testarea ipotezei statistice privind compararea dispersiei a două colectivităţi;

8.1 Compararea dispersiei eşantionului cu dispersia colectivităţii generale

Cei mai utilizaţi indicatori în procesul inferenţei statistice sunt: media, dispersia şi
proporţia. Un rol important în cadrul inferenţei o au şi testările ipotezelor statistice aplicate în
condiţiile comparării dispersiilor.
Repartiţia χ 2 este utilizată cu preponderenţă în testarea ipotezelor statistice permiţând
studierea mai detaliată, chiar şi sub aspect calitativ, a colectivităţilor statistice.
Statistica testului calculat este:

116
(n − 1) s 2
χ c2 = (5.1)
σ2
În aceste condiţii, etapele de aplicare a testului χ 2 sunt următoarele:

1. Se prezintă ipoteza nulă: H 0 : σ 2 = σ i2

2. Se stabileşte ipoteza alternativă ( H 1 ) în funcţie de tipul testului, astfel:

2.1. - testul unilateral stânga: H 1 : σ 2 < σ i2

2.2. - testul bilateral: H 1 : σ 2 ≠ σ i2

2.3. - test unilateral dreapta: H 1 : σ 2 > σ i2


3. Se precizează tipul testului statistic utilizat în raport cu datele aplicaţiei şi ipoteza alternative
( H 1 ), iar apoi se începe schiţarea graficului.
4. În funcţie de nivelul de încredere ( 1 − α ) se determină limita de semnificaţie ( α ) cu ajutorul
căruia se stabileşte:
4.1. - testul unilateral stânga (figura 5.1):
► se determină χ 2 tabelar (Anexa 2) sub forma χ12−α , n −1 , iar valoarea se plasează pe

grafic.
► regiunea de respingere Rr : dacă χ 2 c < χ 21−α , n −1 , atunci H o se respinge şi este

adevărată ipoteza H 1 .

Rr

H 0 se respinge χ12−α ; n−1

Figura 5.1 Elementele teoretice ale testului χ 2 unilateral stânga


4.2. - testul bilateral (figura 5.2):
► se determină χ 2 tabelar (Anexa 2), adică valorile pentru χ 2 α şi χ α2 .
1− ; n −1 ;n −1
2 2

117
► regiunea de respingere Rr : dacă χ c2 < χ 2 α sau χ c2 > χ α2 , atunci H o se
1− , n −1 ,n −1
2 2

respinge şi este adevărată ipoteza H 1 .

Rr
Rr

H 0 se respinge H 0 se respinge

χ2α χ α2
1− ; n −1 ; n −1
2 2

Figura 5.2. Elementele teoretice ale testului χ 2 bilateral


4.3. - test unilateral dreapta (figura 5.3.):
► se determină χ 2 tabelar (Anexa 2), adică χ α2 , n−1 iar valoarea se plasează pe

grafic.
► regiunea de respingere Rr : dacă, χ c2 > χ α2 ,n −1 , atunci H o se respinge şi este

adevărată ipoteza H 1 .

Rr

χα2 ; n −1 H 0 se respinge

Figura 5.3 Elementele teoretice ale testului χ 2 unilateral dreapta


5. Se calculează valoarea statistică a testului determinat cu relaţia (5.1), iar valoarea obţinută se
plasează pe grafic.

118
6. Se compară valoarea lui χ c2 cu una din valorile χ12−α , n −1 , χ 2 α , χ α2 , χ α2 , n −1 conformă
1− , n −1 , n −1
2 2

tipului testului aplicat şi se stabileşte dacă rezultatul statistic al testului calculat χ c2 intră în

regiunea de respingere Rr , luându-se decizia adecvată situaţiei.

8.2 Compararea dispersiei a două colectivităţi

Compararea dispersiilor a două colectivităţi se poate realiza fie direct, fie utilizând
raportul acestora.
Aplicarea testului presupune următoarele:
• colectivităţile comparate să fie formate din variabile aleatoare: X 1 şi X 2 ;

• variabilele utilizate să fie repartizate normal: X 1 ~ N (m1 , σ 12 ) şi X 2 ~ N (m 2 , σ 22 );

• eşantioanele de volum n1 şi n 2 extrase din colectivităţile comparate să permită

stabilirea estimaţiilor dispersiilor S12 şi S 22 .


Stabilirea statisticii testului Fisher calculat:
S12 σ 22
Fc = ⋅ (5.2.)
S 22 σ 12

Observaţie: Dacă σ 12 = σ 22 , atunci statistica testului calculat devine:


S12
Fc = . (5.3.)
S 22

Testul F se aplică şi el în toate cele trei situaţii:


 test unilateral stânga,
 bilateral,
 unilateral dreapta.
Pentru testarea ipotezelor se utilizează F teoretic sau tabelar, în funcţie de tipul testului
(unilateral stânga, dreapta sau bilateral), care poate avea una din formele:
- pentru testul unilateral stânga: F1−α ; n1 −1; n2 −1 ,

- pentru testul bilateral: F α şi Fα ,


1− ; n1 −1; n2 −1 ; n1 −1; n2 −1
2 2

119
- pentru testul unilateral dreapta: Fα ; n1 −1; n2 −1 ,

în care:
α - limita de semnificaţie
n1 -1= g1 = gradele de libertate pentru variabila aleatoare Y1
n 2 -1= g 2 = gradele de libertate pentru variabila aleatoare Y2
Graficele testului în funcţie de tipul acestuia îmbracă formele:
• testul unilateral stânga (figura 5.4):
► F tabelar sau teoretic F1−α ; n1 −1; n2 −1 (Anexa 4) şi valoarea se plasează pe grafic.

► regiunea de respingere Rr : dacă Fc < F1−α ; n1 −1; n2 −1 , atunci H o se respinge şi este

adevărată ipoteza H 1 .

Rr

H 0 se respinge F1−α ; n1 −1; n2 −1

Figura 5.4 - Elementele teoretice ale testului F unilateral stânga

• testul bilateral (figura 5.5.):


► F tabelar sau teoretic F α şi Fα (Anexa 4) se plasează pe grafic.
1− ; n1 −1; n2 −1 ; n1 −1; n2 −1
2 2

► regiunea de respingere Rr : dacă Fc < F α sau Fc > Fα atunci H o se


1− ; n1 −1; n2 −1 ; n1 −1; n2 −1
2 2

respinge şi este adevărată ipoteza H 1 .

120
Rr
Rr

H 0 se respinge H 0 se respinge

F α Fα
1− ; n1 −1; n2 −1 ; n1 −1; n2 −1
2 2

Figura 5.5. - Elementele teoretice ale testului F bilateral

• test unilateral dreapta (figura 5.6):


► F tabelar sau teoretic Fα ; n1 −1; n2 −1 (Anexa 4) şi valoarea se plasează pe grafic.

► regiunea de respingere Rr : dacă Fc > Fα ; n1 −1; n2 −1 , atunci H o se respinge şi este

adevărată ipoteza H 1 .

Rr

Fα ; n1 −1; n2 −1H 0 se respinge

Figura 5.6. - Elementele teoretice ale testului F unilateral dreapta

În practică cele mai utilizate teste sunt: bilateral şi unilateral dreapta.

Exemplul 8.1.
Departamentul de vânzări al unei firme comerciale dispune de următoarele date privind
cererea unui produs. 80, 59, 66, 83, 36, 58, 55, 64, 63, 66. Datele u fost selectate dintr-o
colectivitate normal distribuită. pentru o probabilitate de 95% să se testeze ipotezele:
H0: σ2=100, respectiv H1: σ2>100.

121
Rezolvare:
Primele două etape ce trebuiesc parcurse pentru testarea ipotezelor statistice prin
aplicarea testului χ2 au fost prezentate în enunțul problemei:
1. Ipoteza nulă: σ2=100
2. Ipoteza altenativă: H1: σ2>100
3. Datele inițiale ne conduc la concluzia că se aplică testul χ2 (se compară dispersiile).
4. Deoarece (1-α)=95% ⇒ α=0,05, iar n=10 trebuiesc determinate elementele:
 χ2 teoretic:

 Regiunea de respingere (Rr) este: , atunci H0 se respinge.

5. Valoarea statistică a testului (valoarea calculată):


Cunoaștem și trebuie să determinăm dispersia eșantionului s2.

Deoarece n=10 < 30 ⇒

Rr

χ c2 = 15,42 χ 02,05;9 = 16,92


H 0 se admite

6. Deoarece, χ c2 (15,42) < χ α2;n −1 (16,92) atunci H0 este adevărat, şi anume, gradul de împrăştiere

a valorilor eşantionului privind cererea pentru un anumit produs nu diferă semnificativ de


cel stabilit la ivelul colectivităţii generale, care este 100.
122
Lucrare de verificare 8A

1. Cum se testează ipoteza privind compararea dispersiei eşantionului cu dispersia


colectivităţii generale?
2. Cum se testează ipoteza privind compararea dispersiei a două colectivităţi?
3. Care este relaţia pentru calculul valorii statistice a testului privind compararea dispersiei
eşantionului cu dispersia colectivităţii generale?
4. Care este relaţia pentru calculul valorii statistice a testului privind compararea dispersiei a
două colectivităţi?
5. Care sunt paşii în construirea unui test statistic privind compararea dispersiei eşantionului
cu dispersia colectivităţii generale?

Test de autoevaluare 8B
1. Statistica testului calculat este:
n ⋅ s2
a. χ c2 =
σ2
(n − 1) s 2
b. χ c2 = ;
σ2
(n + 1) s 2
c. χ c2 = ;
σ2
(n − 1) s
d. χ c2 = .
σ2
2. Patronul unei pensiuni turistice rurale testează în 10 zile consumul zilnic de lapte (litri):
10, 8, 10, 9, 7, 11, 10, 12, 7, 10. Presupunând că selecţia se realizează dintr-o colectivitate
normal distribuită, pentru o probabilitate de 95% să se testeze ipotezele:
H 0 : σ 2 = 4 , respectiv H 1 : σ 2 > 4 .

Regiunea de respingere (Rr ) este:


a. χ c2 > χ α2 ;n ;

b. χ c2 > χ α2 ;n −1 ;

c. χ c2 > χ α2 ;
; n −1
2

123
d. χ c2 > χ n2−1 .

3. Patronul unei pensiuni turistice rurale testează în 10 zile consumul zilnic de lapte (litri):
10, 8, 10, 9, 7, 11, 10, 12, 7, 10. Presupunând că selecţia se realizează dintr-o colectivitate
normal distribuită, pentru o probabilitate de 95% să se testeze ipotezele:
H 0 : σ 2 = 4 , respectiv H 1 : σ 2 > 4 .

Valoarea statistică a testului este:

a. 6,1;
b. 5,9;
c. 6,5;
d. 5,5.

4. Un analist doreşte studierea preferinţelor turiştilor în ceea ce priveşte tipul unităţilor de


cazare după gradul de confort (s-au format două categorii: una care include unităţile de 1
şi 2 stele şi alta care le include pe cel e de 3 şi 4, eventual 5 stele). Acest aspect a fost
analizat prin compararea împrăştierii cheltuielilor colectivităţii turiştilor ce preferă prima
categorie (cu unităţi de 1 şi 2 stele) cu împrăştierea cheltuielilor colectivităţii turiştilor ce
preferă a doua categorie (unităţi de 3, 4, 5 stele).
Studiul porneşte de la presupunerea că distribuţia cheltuielilor (UM) pe cele două
colectivităţi sunt aproximativ normale, iar din ele au fost extrase două eşantioane de
volum 46 şi 55 de persoane, abaterile standard stabilite (UM) fiind: σ 12 = 1,42 UM şi

σ 22 = 0,43 UM, în condiţiile în care probabilitatea rezultatelor este de 95%.


Unităţile de 1 şi 2 stele Unităţi de 3, 4, 5 stele
n 1 = 46 n 2 = 55
σ 12 = 1,42 UM σ 22 = 0,43 UM

Ipotezele statistice sunt:


σ 12 σ 12
a. H 0 : ≠ 1 şi H : > 1;
σ 22 σ 22
1

124
σ 12 σ 12
b. H 0 : = 1 şi H : < 1;
σ 22 σ 22
1

σ 12 σ 12
c. H 0 : 2 = 1 şi H 1 : 2 ≠ 1 ;
σ2 σ2

σ 12 σ 12
d. H 0 : = 1 şi H : > 1.
σ 22 σ 22
1

5. Un analist doreşte studierea preferinţelor turiştilor în ceea ce priveşte tipul unităţilor de


cazare după gradul de confort (s-au format două categorii: una care include unităţile de 1
şi 2 stele şi alta care le include pe cele de 3 şi 4, eventual 5 stele). Acest aspect a fost
analizat prin compararea împrăştierii cheltuielilor colectivităţii turiştilor ce preferă prima
categorie (cu unităţi de 1 şi 2 stele) cu împrăştierea cheltuielilor colectivităţii turiştilor ce
preferă a doua categorie (unităţi de 3, 4, 5 stele).
Studiul porneşte de la presupunerea că distribuţia cheltuielilor (UM) pe cele două
colectivităţi sunt aproximativ normale, iar din ele au fost extrase două eşantioane de
volum 46 şi 55 de persoane, abaterile standard stabilite (UM) fiind: σ 12 = 1,42 UM şi

σ 22 = 0,43 UM, în condiţiile în care probabilitatea rezultatelor este de 95%. Testul


statistic are valorea:
a. 9,9;
b. 11,9;
c. 10,9;
d. 10,5.

Rezumat

Pentru testarea dispersiilor, este utilizată cu preponderenţă repartiţia χ 2


Pentru testarea ipotezei privind dispersia populaţiei generale statistica testului este
(n − 1) s 2
χ =
2
. Regiunile critice sunt determinate în funcţie de pragul de semnificaţie ales,
σ2
c

numărul gradelor de libertate (g=n-1) şi de enunţurile concrete ale ipotezelor H 0 (nulă) şi H 1


(alternativă).

125
Similar, pentru testarea ipotezei privind dispersiile a două populaţii, statistica testului este sau
S12 σ 22 S12
Fc = ⋅ . Dacă σ 2
= σ 2
, atunci statistica testului calculat devine F = ..
S 22 σ 12
1 2 c
S 22
Testările se efectuează parcurgând secvenţial etapele prezentate în unitatea de învăţare 5.

Bibliografie

Statistică,ediţia a treia-revizuită, Editura Economică,


Jaba E.
Bucureşti, 2002
Mitruţ C., Şerban D
Statistics for Bussiness Administration, Editura ASE,
Bucureşti, 2003

Oprea C., Zaharia M. Elemente de analiza datelor și modelare utilizând Excel,


Editura Universitară, Bucureşti, 2011

Gogonea R.M., Zaharia Econometrie cu aplicaţii în activitatea de comerţ-turism-


M. servicii, Editura Universitară, Bucureşti, 2008,

126
Unitatea de învăţare 9
ANALIZĂ DISPERSIONALĂ (ANOVA)

Cuprins

Unitatea de învăţare 9 ANALIZĂ DISPERSIONALĂ (ANOVA) ........................................... 127


Obiectivele Unităţii de Învăţare 9 ........................................................................................... 127
9.1 Analiza dispersională unifactorială ................................................................................... 127
9.2 Analiza dispersională bifactorială ..................................................................................... 133
Lucrare de verificare 9A ......................................................................................................... 143
Test de autoevaluare 9B .......................................................................................................... 143
Rezumat ................................................................................................................................... 146
Bibliografie.............................................................................................................................. 146

Obiectivele Unităţii de Învăţare 9

După studiul acestei unităţi de învăţare cursanţii vor avea cunoştinţe despre:
• testarea ipotezei statistice privind compararea dispersiei eşantionului cu dispersia
colectivităţii generale;
• testarea ipotezei statistice privind compararea dispersiei a două colectivităţi;
• utilizarea intrumentelor Excel în aplicarea testului ANOVA.

9.1 Analiza dispersională unifactorială

Studierea legăturilor dintre fenomenele şi procesele economice include şi aplicarea


analizei dispersionale, înainte sau după utilizarea metodei de corelaţie şi regresie, oferind
posibilitatea verificării afirmaţiilor privind existenţa legăturii, precum şi testarea validităţii
modelului de regresie.
Analiza dispersională include mai multe trepte de calcul în atingerea obiectivului urmărit,
ceea ce necesită clarificarea celor doi termeni specifici utilizaţi, după cum urmează:

127
• variabilă dependentă – reprezintă variabila rezultativă, obligatoriu cantitativă, după care
se compară grupele şi este supusă analizei;
• variabila independent – este exprimată prin factorul care influenţează într-o anumită
măsură variabila dependentă.
În fucţie de numărul factorilor, analiza dispersională poate fi:
∗ unifactorială
∗ bifactorială
∗ multifactorială
Modelul de bază al analizei dispersionale constă în însumarea a două elemente
componente ce reprezintă efectele unor cauze sistematice şi întâmplătoare.
În cazul analizei dispersionale unifactoriale, cauzele sistematice sunt rezumate sub forma
unui singur factor cu acţiune esenţială.
Analiza dispersională, implicit cea unifactorială presupune utilizarea testului parametric
ANOVA, adică a testului Fisher (testul F ), care se bazează pe următoarele considerente:
1. - populaţiile Γ din care se extrag k eşantioane γ trebuie să fie normal distribuite;
2. - dispersiile populaţiilor trebuie să fie egale
( σ 12 = σ 22 = σ 32 = ... = σ k2 = σ );
3. - eşantioanele selectate trebuie să fie independente.
Neîndeplinirea celei de-a doua reguli transformă testul parametric într-unul neparametric
cunoscut sub denumirea de testul lui Kruskal Wallis, care constă în compararea tendinţei centrale
a două sau mai multe eşantioane independente.
Testul F stabileşte dacă mediile eşantioanelor comparate diferă semnificativ.
Ipoteza nulă ( H 0 ) este cea prin care se menţionează că mediile eşantioanelor comparate
sunt egale (figura 5.7) sau altfel spus, mediile de grupă ale fiecărui eşantion nu diferă
semnificativ, deci factorul esenţial nu are o influenţă relevantă asupra variabilei rezultative.
H 0 : µ1 = µ 2 = µ 3 = ... = µ k

Prin ipoteza alternativă H 1 se presupune că, dacă cel puţin între două medii de grupă ale
eşantioanelor comparate există o diferenţă semnificativă, atunci factorul de grupare ( x ) are o
influenţă însemnată asupra variabilei rezultative y .

128
y
y
yr
y2
y1=y2= =yr
y1

o x1 x2 ...... xr x o x1 x2 ..... xr x

H0 H1

Figura 9.1 - Evidenţierea ipotezelor H 0 şi H 1

Dacă dintr-o populaţie Γ au fost extrase eşantioane γ j sub forma grupelor, acestea pot

îmbrăca următoarele forme:


• forma seriilor simple;
• forma seriilor cu frecvenţe.

 Serii simple
În cazul seriilor simple, datele statistice apar într-o tabelă a cărei formă generală este
dată în tabelul 5.1.

Tabelul 9.1. - Forma teoretică a tabelului distribuţei simple pe grupe


Volumul
Grupe după
Valorile caracteristicii rezultative ( y ) grupelor
factorul x
(n)
x1 y11 y12 y13 ... y1 j ... y1n1 n1

x2 y 21 y 22 y 23 ... y2 j ... y 2n2 n2


... ... ... ... ... ... ... ... ...
xi yi1 yi 2 yi3 ... y ij ... y ini ni

... ... ... ... ... ... ... ... ...


xr y r1 yr 2 yr3 ... y rj ... y inr nr

129
Mediile utilizate sunt:
- media de grupă ( y1 , y 2 , y 3 , ..., yi , ..., y r ) :
ni

∑y j =1
ij

yi = (9.1.)
ni

- media generală ( y 0 )
r ni r
∑∑
i =1 j =1
yij ∑yn i i
i =1
y0 = r
= r
(9.2.)
∑n
i =1
i ∑n
i =1
i

 Serii cu frecvenţe
Pentru seriile cu frecvenţe, datele statistice sunt prezentate pentru analiză într-o tabelă
a cărei formă generală este dată prin tabelul 5.2.

Tabelul 9.2. Forma teoretică a tabelului unei distribuţii bidimensionale

Valorile caracteristicii rezultative ( y )


Grupe după factorul x Total
y1 y2 ... yj ... y n1
m
x1 n11 n12 ... n1 j ... n1m n1 = ∑ n1 j
j =1
m

x2 n21 n22 ... n2 j ... n2 m n2 = ∑ n2 j


j =1

... ... ... ... ... ... ...


m
xi ni1 ni 2 ... n ij ... n im ni = ∑ nij
j =1

... ... ... ... ... ... ...


m
xr nr 1 nr 2 ... nrj ... n rm nr = ∑ nrj
j =1
r r r r r m
Total n1` = ∑ ni1 n2` = ∑ ni 2 ... n `j = ∑ nij ... nm` = ∑ nim n = ∑∑ nij
i =1 i =1 i =1 i =1 i =1 j =1

Relaţiile de calcul ale mediilor utilizate în acest caz, necesare în vederea aplicării testului
F , sunt următoarele:
- media de grupă ( y1 , y 2 , y 3 , ..., yi , ..., y r )

130
m

∑y n
j =1
j ij

yi = m
(9.3.)
∑n
j =1
ij

- media generală ( y 0 )
m r
∑y n
j =1
j j ∑yn i i
i =1
y0 = m
= r
(9.4.)
∑n j =1
j ∑n
i =1
i

Schema structurală de aplicare a analizei dispersionale unifactoriale se poate reduce la


relaţii, ale căror rezultate pot fi prezentate într-o formă de tipul celei ilustrate în tabelul 9.3

Tabelul 9.3. Forma teoretică a tabelului pentru ANOVA unifactorială


Dispersia
corectată
Tipul Varianţa (S) Gradele de Statistica
(S2)
variantei - suma pătratelor- libertate (df) testului F
- media
pătratelor-
Factorială r
S1
S1 = ∑ ( y i − y 0 ) ni S12 =
2
(între df1 = r − 1
grupe) i =1 df1
Reziduală
ni
S 2 = ∑∑ ( y ij − y i )
r
(în S2
2
df 2 = n − r S 22 = S12
interiorul i =1 j =1 df 2 Fc = 2
grupelor) S2
ni
S 0 = ∑∑ ( y ij − y 0 )
r
df 0 = n − 1
2

Totală i =1 j =1
df 0 = df 1 + df 2
S 0 = S1 + S 2

Aplicarea statisticii testului F are în vedere determinarea lui Fcalculat, astfel:


S12
Fc = (9.5.)
S 22
unde:
- S12 reprezintă dispersie corectată sistematică :

131
r

S1 ∑(y
i =1
i − y 0 ) 2 ni
S12 = = (9.6.)
r −1 r −1
în care:
r
S 1 = ∑ ( y i − y 0 ) 2 ni (9.7.)
i =1

S1 = varianţa factorială (varianţa dintre grupe, determinată ca suma pătratelor


abaterilor mediilor de grupă yi , de la media generală y 0 )
r − 1 = numărul gradelor de libertate calculat ca numărul total al grupelor r
decrementat cu 1.
- S 22 reprezintă dispersie corectată reziduală :
r ni

S2
∑∑
i =1 j =1
( y ij − yi ) 2
S 22 = = (9.8.)
n−r n−r
în care:
r ni
S 2 = ∑∑ ( yij − yi ) 2 (9.9.)
i =1 j =1

S 2 = varianţa reziduală (varianţa din interiorul grupelor determinată ca sumă a

pătratelor abaterilor valorilor individuale y ij de la valorile mediilor de grupă y i


)

n − r = numărul gradelor de libertate calculat ca diferenţă între volumul eşantionului n


şi numărul total al grupelor r .

În continuare, după compararea valorii calculate a statisticii testului F ( Fc ) cu cea


teoretică sau tabelară ( Ft ), se ia decizia privind validitatea presupunerii (ipotezei). Valoarea

tabelară ( Ft ) se stabileşte pentru o limită de semnificaţie α şi g1 respectiv g 2 grade de libertate

(unde: g1 = r − 1 , g 2 = n − r ) şi se preia din tabelul cu valorile funcţiei F (Anexa 4).


În funcţie de raportul dintre valorile Fc şi Ft avem următoarele concluzii:
1. - dacă Fc < Fα , r −1, n − r , atunci se acceptă ipoteza nulă H0, deci:

 ipoteza nulă ( H 0 ) este considerată adevărată;

132
 nu există diferenţe semnificative între mediile de grupă comparate (nu există
diferenţe semnificative între eşantioanele comparate);
 factorul x nu este semnificativ statistic, adică nu influenţează semnificativ variabila
rezultativă y .
2. - dacă Fc > Fα , r −1, n − r , atunci se respinge ipoteza nulă H0, deci:

 ipoteza alternativă ( H 1 ) este considerată adevărată;


 există diferenţe semnificative între mediile de grupă comparate (există diferenţe
semnificative între eşantioanele comparate);
 factorul x este semnificativ statistic, adică influenţează semnificativ variabila
rezultativă

9.2 Analiza dispersională bifactorială

Modelul de analiză dispersională bifactorială se bazează pe acelaşi principiu al însumării


efectelor cauzelor sistematice cu cele ale celor întâmplătoare, numai că, variaţia sistematică este
explicată prin intermediul a doi factori cu influenţă semnificativă asupra variabilei rezultative.
Datele statistice care sunt supuse analizei dispersionale bifactoriale se pot reprezenta sub
forma dată în tabelul 5.4.

Tabelul 9.4. Forma tabelului cu distribuţii pe niveluri, după doi factori


F.II
F.II1 ... F.IIj ... F.IIq
F.I

x111 ... x1 j1 ... x1q1


. . . . .
F.I1 . . . . .
. . . . .
x11n ... x1 jn ... x1qn
. . . . . .
. . . . . .
. . . . . .
xi11 ... xij1 ... xiq1
. . . . .
F.Ii . . . . .
. . . . .
xi1n ... xijn ... xiqn
. . . . . .

133
. . . . . .
. . . . . .
x h11 ... x hj1 ... x hq1
. . . . .
F.Ih . . . . .
. . . . .
x h1n ... x hjn ... x hqn

In tabelul 9.4. apar următoarele elemente:


F.I şi F.II – reprezintă doi factori principali de influenţă asupra unei variabile rezultative y ; x –
variabila dependentă, cu valori ale caracteristicii rezultative xijk ;

F.I – are „ h ” niveluri (grupe, eşantioane);


F.II – are „ q ” niveluri (grupe, eşantioane);
n – numărul celulelor tabelului, corespunzătoare fiecărui nivel (grupă, eşantion);

xijk - valorile caracteristicii rezultative, adică a - k - a informaţie (dată statistică) din

eşantionul corespunzător grupei nivelului „ i ” al primului factor (F.I) şi nivelului „ j ” al celui de-
al doilea factor (F.II)

Tabelul 9.5. – Forma teoretică a tabelului pentru ANOVA bifactorială


Dispersia
Varianţa (S) corectată
Gradele de Statistica
Tipul variantei - suma (S2)
libertate (df) testului F
pătratelor - media
pătratelor
Factorul 1 (F.I) S1 df1 S12 S12
FF .I =
Factorul 1
S2 df2 S 22 S 32
(F.II)
S 22
Factorială FF .II = 2
S3
Interacţiunea
S1_2 df1_2 S12_ 2 S12_ 2
celor doi factori
FF .I _ FII =
S 32
Reziduală S3 df3 S 32
Totală S0 df0

Aplicarea testului F , a cărei formă a tabelului ANOVA este prezentată în tabelul 9.5.,
presupune calcularea tuturor indicatorilor auxiliari, astfel:

134
 Varianţa
 Varianţa factorului F.I ( S1 )
- se determină ca sumă a abaterilor pătrate ale mediilor liniilor de la media generală,
datorate primului factor (F.I);
- este indicator de comensurare a variaţiei explicate de F.II;
- se calculează cu relaţia:
h 2

S1 = qn∑ ( xi* − x ) (9.10.)


i =1

 Varianţa factorului F.II ( S2 )


- se calculează ca sumă a abaterilor pătrate ale mediilor coloanelor de la media generală,
datorate celui de-al doilea factor (F.II);
- este indicator de comensurare a variaţiei explicate de F.II;
- se determină cu relaţia:
2

S 2 = hn∑ (x* j − x )
q
(9.11.)
j =1

 Varianţa interacţiunii factorului F.I cu factorul F.II ( S1_2 )


- se calculează ca sumă a pătratelor, datorate interacţiunii ambilor factori (F.I şi F.II);
- este indicator de comensurare a variaţiei explicate de interacţiunii celor doi factori (F.I
şi F.II);
- se determină cu relaţia:

S1 _ 2 = n∑∑ (xij − xi* − x* j − x )


h q
2
(9.12.)
i =1 j =1

 Varianţa reziduală ( S3 )
- se determină ca sumă reziduală a pătratelor celor doi factori, stabilind variaţia internă a
grupului;
- este indicator de comensurare a variaţiei neexplicate a interacţiunii ambilor factori;
- se calculează cu relaţia:
2

S 3 = ∑∑∑ (xijk − xij )


h q n
(9.13.)
i =1 j =1 k =1

 Varianţa totală ( S0 )

135
S 0 = S 1 + S 2 + S1 _ 2 + S 3
2

S 0 = ∑∑∑ (xijk − x )
h q n
(9.14.)
i =1 j =1 k =1

 Gradele de libertate
 Gradele de libertate corespunzătoare factorului F.I ( df1 )
df1 = h − 1 (9.15.)
 Gradele de libertate corespunzătoare factorului F.II ( df2 )
df 2 = q − 1 (9.16.)
 Gradele de libertate corespunzătoare interacţiunii factorului F.I cu factorul F.II ( df1_2)
df 1 _ 2 = (h − 1) ⋅ (q − 1) (9.17.)

 Gradele de libertate corespunzătoare reziduală ( df3 )


df 3 = hq ⋅ (n − 1) (9.18.)
 Gradele de libertate corespunzătoare totală ( df0 )
df 0 = hqn − 1

df 0 = df1 + df 2 + df1−2 + df 3 (9.19.)

 Dispersia corectată
 Dispersia corectată a factorului F.I ( S12 )

S1
S12 = (9.20.)
df1

 Dispersia corectată a factorului F.II ( S 22 )

S2
S 22 = (9.21.)
df 2

 Dispersia corectată a interacţiunii factorului F.I cu factorul F.II ( S12_ 2 )

S1 _ 2
S12_ 2 = (9.22.)
df1 _ 2

 Dispersia corectată reziduală ( S 32 )

136
S3
S 32 = (9.23.)
df 3
Completarea tabelului (9.5) cu rezultatele obţinute prin aplicarea formulelor prezentate
permit continuarea metodologiei de aplicare a testului F prin testarea ipotezelor privind
semnificaţia contribuţiei factorilor la precizarea variaţiei variabilei dependente.
În cazul analizei dispersionale bifactoriale apar trei seturi de ipoteze care, în funcţie de
factorii la care se referă, sunt:
Pentru factorul F.I:
H0: factorul F.I nu este semnificativ (mediile determinate la nivelul liniilor nu diferă
semnificativ)
H1: factorul F.I este semnificativ (mediile determinate la nivelul liniilor diferă în mod
semnificativ)
Pentru factorul F.II,
H0: factorul F.II nu este semnificativ (mediile determinate la nivelul coloanelor nu
diferă semnificativ)
H1: factorul F.II este semnificativ (mediile determinate la nivelul coloanelor diferă în
mod semnificativ)

Pentru interacţiunea dintre factori (factorul F.I şi F.II),


H0: interacţiunea factorilor nu este semnificativă (mediile determinate la nivelul
celulelor nu diferă semnificativ)
H1: interacţiunea factorilor este semnificativă (mediile determinate la nivelul celulelor
diferă în mod semnificativ)

Deciziile de respingere a ipotezei nule au în vedere următoarele reguli prezentate pe cele


trei seturi de ipoteze:
a. FF.I > F1−α , h −1,hq (n −1)

b. FF.II > F1−α , q −1, hq (n −1)

c. FF.I_F.II > F1−α ,(h −1)(q −1), hq (n −1)

În această situaţie, rezultatele obţinute se vor concluziona în verdictul conform căruia,


ambii factori au o influenţă semnificativă asupra variabilei rezultative.

137
Analiza dispersională bifactorială, în raport cu modul de formare a nivelurilor factorilor,
cuprinde următoarele modele:
• model cu efecte sistematice – reprezentat de modelul în care datele statistice ale
nivelurilor factorilor se formează din întreaga colectivitate; între respectivele date statistice
apar diferenţe sistematice datorate doar clasificării după cei doi factori; acest model include
elemente ca: x , α i , β j , δ ij şi σ 2 care sunt mărimi fixe necunoscute;

• model cu efecte întâmplătoare – este un model în care datele statistice ale nivelurilor
factorilor se extrag aleatoriu dintr-o colectivitate supusă cercetării; abaterile ce se pot stabili
între datele statistice ale nivelurilor vor fi întâmplătoare; elementele incluse în model vor fi:
o α i , β j , δ ij - mărimi aleatorii cu dispersiile σ α2 , σ β2 , σ α2 ,β ,

o parametrii x , σ 2 , σ α2 , σ β2 , σ α2 ,β care nu sunt cunoscuţi;

• model cu efecte mixte – este modelul care cuprinde date statistice pe fiecare nivel al
factorilor implicaţi, ce s-au format astfel: după un factor se extrag şi se formează sistematic, iar
după celălalt factor se obţin aleatoriu; diferenţele care apar între datele statistice la fiecare nivel
sunt de tip sistematic după un factor şi aleatoriu după celălalt, în funcţie de cum s-au format
respectivele date;
Presupunând că primul factor este întâmplător, atunci elementele specifice modelului
vor fi:
 x şi β j - mărimi nealeatorii

 α i şi δ ij - mărimi aleatorii

 parametrii x , β j , σ α2 , σ α2 ,β şi σ 2 care nu sunt cunoscuţi

Exemplul 9.1.
Situaţia privind tarifele practicate pentru 25 de pensiuni în perioada de sezon din 2008
situate în mediul rural sau urban, dintr-o regiune turistică este prezentată în tabelul 9.6.
Să se verifice dacă mediul unde este construită pensiunea influenţează semnificativ
variaţia încasărilor, folosind testul F de analiză dispersională (ANOVA). Nivelul de
semnificaţie ales este α = 0,05.

138
Tabelul 9.6. Tarifele practicate de două categorii de pensiuni
Medii Valoarea tarifelor practicate ( lei ) Număr pensiuni
Rural 140, 138, 150, 142, 140, 140, 135, 148, 147, 135, 140, 138, 139, 145, 140 15
Urban 120, 141, 137, 152, 152, 148, 145, 145, 135, 145 10

Rezolvare:
Notaţii:
x – variabila factorială care formează grupele (mediul: rural şi urban)
y – variabila rezultativă (valoarea tarifelor practicate)

( 1 − α ) = 95 %
1. Ipoteza nulă H 0 : µ R = µU
(valoarea medie a tarifelor practicate în mediul rural nu diferă semnificativ de valoarea medie a
tarifelor practicate în mediul urban)
2. Ipoteza alternativă H 1 : µ R ≠ µU
(valoarea medie a tarifelor practicate în mediul rural diferă semnificativ de valoarea medie a
tarifelor practicate în mediul urban)
3. Datele aplicaţiei conduc la utilizarea testului Fisher (testul F unilateral dreapta)
4. Deoarece ( 1 − α )100=95, atunci, utilizând valorile tabelate ale funcţiei F (Anexa 4),
pentru α =0,05 rezultă:
Fα , r −1, n − r = F0, 05; 2 −1; 25−1 = F0 , 05;1; 24 = 4,26

5. Valoarea statistică a testului (valoarea calculată) se determină cu relaţia (5.27) astfel:


 Se determină, cu relaţiile (5.28) şi (5.29), dispersia corectată sistematică:
15 10

∑ yij
j =1 2117
∑y
j =1
ij
1420
yR = = = 141,13 lei yU = = = 142 lei
ni 15 ni 10
2

∑yn
i =1
i i
141,13 ⋅ 15 + 142 ⋅ 10
y0 = 2
= = 141,48 lei
25
∑n
i =1
i

S12 =
(141,13 − 141,48)2 ⋅ 15 + (142 − 141,48)2 ⋅ 10 = 4,54
2 −1

139
 Se determină, cu relaţiile (5.30) şi (5.31), dispersia corectată reziduală:
σ i2 ( σ R2 , σ U2 )

∑ (y − yR ) ∑ (y − yU )
15 10
2 2
ij ij
281,73 822
σ R2 = i =1
= = 18,78 lei σ U2 = i =1
= = 82 lei
n 15 n 10
18,78 ⋅ 15 + 82 ⋅ 10 1101,7
S 22 = = = 47,9 lei
25 − 2 23
S12 4,54
Statistica testului va fi: Fc = = = 0,09
S 32 47,9

6. Deoarece Fc (0,09) < Fα ;r −1;n − r ( 4,26) , iar Fc nu intră în Rr , atunci H o este adevărată, deci

concluzia este că, valoarea medie a tarifelor practicate în mediul rural nu diferă
semnificativ de cea a mediului urban.

Exemplul 9.1.
O agenţie de turism realizează un nou pachet turistic pe care-l consideră avantajos din
punct de vedere al raportului calitate-preţ. Managerul agenţiei trebuie să studieze dacă există
diferenţe semnificative între numărul pachetelor care s-ar vinde în medie zilnic în cele trei zone
turistice spre care-şi îndreaptă atenţia (zona montană, balneară şi de litoral).
În vederea stabilirii de către manager cărei zone să se adreseze cu precădere pachetul
turistic, acesta declanşează o campanie publicitară atât în regiunea montană, în cea balneară cât
şi în cea de litoral. După încheierea campaniei publicitare, timp de o jumătate de lună (15 zile),
se derulează o cercetare cu privire la preferinţele clienţilor în ceea ce priveşte pachetul turistic ce
se doreşte a fi lansat pe piaţă, rezultatele obţinute fiind prezentate în tabelul 9.7.

Tabelul 9.7. Preferinţele clienţilor privind pachetele turistice


Zona montană 18 16 17 17 16 16 18 19 19 17 10 16 15 16 18
Zona balneară 16 16 15 18 14 13 13 11 11 11 15 10 15 10 10
Zona de litoral 10 8 10 11 8 7 10 12 12 11 10 8 9 9 10

Rezolvare:

Ipotezele statistice sunt: H 0 : µ1 = µ 2 = µ 3

H 1 : cel puţin două medii sunt diferite.

140
În funcţie de datele aplicaţiei şi ipotezele stabilite, trebuie să se aplice ANOVA: Single Factor
(analiză de varianţă cu un singur factor) din EXCEL, parcurgând etapele:
1-se introduc datele cu noţiunile din capul de tabel, în primele trei coloane începând cu A1,
B1, C1, până la A16, B16, C16;
2- se selectează toate datele din coloane, inclusiv capul de tabel, de la A1 la C16
3- din meniu se selectează Tools şi se parcurg paşii: Data Analysis - ANOVA: Single Factor
4- în fereastra deschisă:
 la Input Range se selectează datele de la A1 la C16
 se activează Labels in First
 se specifică Grouped by Columns
 se activează Output Range şi se selectează o căsuţă în care se doreşte să se
poziţioneze rezultatele
 OK
Rezultatele sunt ilustrate în tabel 9.8:
Tabelul 9.8. Tabelul ANOVA cu rezultatele analizei
Anova: Single Factor

SUMMARY
Groups Count Sum Average Variance
Z.Montană 15 248 16,53333 4,695238
Z.Balneară 15 198 13,2 6,742857
Z.de Litoral 15 145 9,666667 2,238095
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 353,7333 2 176,8667 38,79735 0,0000 3,219942
Within Groups 191,4667 42 4,55873

Total 545,2 44

Explicarea elementelor ce apar în tabel 9.8:


 în SUMMARY avem:
∗ count - numărul unităţilor din fiecare populaţie este 15 zile;
∗ sum – numărul total de pachete vândute
∗ average – număr mediu de pachete vândute zilnic
∗ variance – dispersia populaţiilor

141
 în ANOVA – elementele sunt prezentate în tabelul 9.3 din cadrul subcapitolului 9.1 (mai
precis, la 5.2.1- analiza factorială unifactorială)
∗ SS este varianţa (suma pătratelor, notată cu S în tabelul 5.3), obţinută:
► pe varianta factorială, Between Groups (între grupe): S1 = 353,7333

► pe varianta reziduală, Within Groups (în interiorul grupelor): S 2 = 191,4667


► pe total: S 0 = 545,2 = S1 + S 2

∗ df sunt gradele de libertate

► pe varianta factorială, Between Groups (între grupe): df1 = r − 1 = 3 − 1 = 2


► pe varianta reziduală, Within Groups (în interiorul grupelor):
df 2 = n − r = (15 ⋅ 3) − 3 = 42
► pe total: df 0 = n − 1 = 44 = df 1 + df 2

∗ MS – dispersia corectată (media pătratelor notată cu S 2 în tabelul 5.3)


► pe varianta factorială, Between Groups (între grupe):
S1 353,7333
S12 = = = 176,8667
df1 2
► pe varianta reziduală, Within Groups (în interiorul grupelor):
S 2 191,4667
S 22 = = = 4,55873
df 2 42
∗ Testul F
S12 176,8667
Fc = 2 = = 38,79735
S2 4,55873
∗ P- value este pragul de semnificaţie (0,0000)
∗ F crit.- 3,219942 este valoarea teoretică sau tabelară a testului Fisher

Interpretarea rezultatelor prezentate în tabel 9.8:


• Rezultatele tabelului SUMMARY indică prezenţa celor mai multe pachete vândute în
zona montană, în timp ce zonei balneare îi corespunde cea mai mare împrăştiere a
datelor.
• ANOVA prezintă Statistica F cu valoarea de 38,797 ca fiind mult mai mare decât cea
critică de 3,2199, cea ce înseamnă că cel puţin două medii diferă semnificativ, fapt

142
confirmat şi prin valoarea pragului de semnificaţie P-value de 0,00000000028595 care
este mai mic decât 0,05.

Lucrare de verificare 9A

Răspundeţi pe scurt la următoarele întrebări:


1. Când se recomandă utilizarea metodei de analiză dispersională?
2. Prin ce se exprimă variabila independentă în cazul testului ANOVA?
3. Cum se numește indicele de mărime a efectului pentru testul ANOVA?
4. La ce se referă dispersia intragrup?
5. Pentru a aplica testul ANOVA ce indicatori auxiliari se calculează?
6. Care sunt tipurile de varianţă utilizate în ANOVA şi ce reprezintă ele?
7. Ce sunt dispersiile corectate?
8. Cum se stabileşte regiunea critică pentru testul F?

Test de autoevaluare 9B

1. Pentru 20 de magazine situate în zona centrală, semicentrala şi periferică a unui oraş, se


cunosc valorile vânzărilor (mil. RON):
Zona Valoarea vânzărilor (mil. RON) Nr. magazine
Centrală 27; 22; 21; 20; 28; 29; 22; 20; 16 9
Semicentrala 15; 20; 23; 23; 25 5
Periferică 9; 15; 13; 18; 12; 10 6

Să se stabilească dacă zona de amplasare a magazinelor influențează valoarea vânzărilor.


În urma aplicării metodei ANOVA de analiză dispersională a rezultat următoarea
concluzie:
a. zona de amplasare nu influențează valoarea vânzărilor (Statistica F este
12,10);
b. zona de amplasare influențează valoarea vânzărilor (Statistica F este 12,10);
c. zona de amplasare influențează valoarea vânzărilor (Statistica F este 3,59);
d. zona de amplasare nu influențează valoarea vânzărilor (Statistica F este 3,59);

143
2. Managerul unei fabrici de pâine doreşte înlocuirea unor utilaje aflate în dotare. În vederea
fundamentării acestei decizii, managerul solicită o analiză a vechimii utilajelor şi a
costului de întreţinere anual al acestora. Astfel, utilajele din dotarea fabricii, în număr de
20, au fost grupate după vechime (ani) în 3 grupe: utilaje cu vechime mică (<5 ani), utilaje
cu vechime medie (5-10 ani) și utilaje cu vechime mare (>10 ani) şi s-a înregistrat costul
de întreținere al acestora (u.m.). În urma aplicării metodei ANOVA de analiză
dispersională, și a prelucrării datelor cu Excel, s-au obținut următoarele rezultate:

ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 6.792595238 …… …………. …………. 0.01153 3.591531
Within Groups ………………. 0.578641

Total 16.6295 19

a. Statistica F este 3,59, gradele de libertate df1 pentru varianta factorială este 1
şi dispersia corectată pentru varianta factorială este 6,79;
b. Statistica F este 5,87, gradele de libertate df1 pentru varianta factorială este 2
şi dispersia corectată pentru varianta factorială este 3,40;
c. Statistica F este 5,87, gradele de libertate df1 pentru varianta factorială este 1
şi dispersia corectată pentru varianta factorială este 3,40;
d. Statistica F este 3,40, gradele de libertate df1 pentru varianta factorială este 3
şi dispersia corectată pentru varianta factorială este 5,87.

3. Conducerea unei facultăţi dorește să determine dacă existenţa unei platform de e-learning
ajută studenții să învețe. Pentru aceasta se formează 2 grupe de studiu: studenții din
Grupul A nu beneficiază de platform e-learning la pregătirea cursurilor, studenții din
Grupul B beneficiază de pregătire suplimentară prin utilizarea platformei de e-learning.
După prima sesiune de examene, studenții primesc notele obţinute. Mediile studenţiilor
după prima sesiune sunt prezentate în tabelul următor:

Grupele de studenţi Mediile obţinute


Grupul A 6,5; 8; 7; 9; 5,5; 6; 8; 6,5; 7; 7,5
Grupul B 8; 7,5; 9,5; 10; 8;7,5; 6,5; 7,5; 8; 9,5

144
Să se stabilească dacă utilizarea platformei e-learning a influențat rezultatele obținute la
examene de către studenți (nivel de semnificație 5%).
a. Deoarece Fc (3,29) < F0, 05;18;19 (4,42) , iar Fc intră în Rr , concluzia este că,

utilizarea platformei e-learning nu a influențat rezultatele obținute la examene


de către studenți.
b. Deoarece Fc (5,19) > F0, 05;17;19 (3,49) , iar Fc nu intră în Rr , concluzia este că,

utilizarea platformei e-learning a influențat rezultatele obținute la examene de


către studenți.
c. Deoarece Fc (5,19) > F0, 05;18;19 ( 4,42) , iar Fc nu intră în Rr , concluzia este că,

utilizarea platformei e-learning a influențat rezultatele obținute la examene de


către studenți.
d. Deoarece Fc (3,29) < F0, 05;17;19 (3,49) , iar Fc intră în Rr , concluzia este că,

utilizarea platformei e-learning nu a influențat rezultatele obținute la examene


de către studenți.

4. O firmă de cercetări de marketing dorește să stabilească în ce mod tipurile de publicitate


influențează vânzările unui anumit produs. În acest scop se analizează vânzările pentru
obținute exclusiv prin reclame TV și prin reclame radio pentru 10 produse alimentare.

Tipul de publicitate Vânzările obţinute


TV 27; 22; 21; 25; 24
Radio 15; 13; 14; 20;19

Să se stabilească dacă tipul de publicitate utilizat a influențat vânzările obținute (nivel de


semnificație 5%).
a. tipul de publicitate nu influențează valoarea vânzărilor (Statistica F este 4,7);
b. tipul de publicitate nu influențează valoarea vânzărilor (Statistica F este
18,75);
c. tipul de publicitate influențează valoarea vânzărilor (Statistica F este 15,01);
d. tipul de publicitate influențează valoarea vânzărilor (Statistica F este 18,75);

145
Rezumat
În studiul legăturilor dintre fenomenele şi procesele economice o metodă deosebit de utilă
este analiza dispersională, aceasta oferind posibilitatea verificării afirmaţiilor privind existenţa
legăturii, precum şi testarea validităţii modelului de regresie. În funcţie de numărul factorilor,
analiza dispersională poate fi unifactorială, bifactorială sau multifactorială.
Analiza dispersională, presupune utilizarea testului parametric ANOVA, care se bazează
pe următoarele considerente: populaţiile Γ din care se extrag k eşantioane γ trebuie să fie

normal distribuite, - dispersiile populaţiilor trebuie să fie egale ( σ 12 = σ 22 = σ 32 = ... = σ k2 = σ ), -


eşantioanele selectate trebuie să fie independente. Neîndeplinirea celei de-a doua reguli
transformă testul parametric într-unul neparametric cunoscut sub denumirea de testul lui Kruskal
Wallis, care constă în compararea tendinţei centrale a două sau mai multe eşantioane
independente.
Ipoteza nulă ( H 0 ) este presupunerea conform căreia mediile de grupă ale fiecărui
eşantion nu diferă semnificativ, deci factorul esenţial nu are o influenţă relevantă asupra
variabilei rezultative. H 0 : µ1 = µ 2 = µ 3 = ... = µ k

Prin ipoteza alternativă H 1 se presupune că, cel puţin între două medii de grupă ale
eşantioanelor comparate există o diferenţă semnificativă, şi în consecinţă, factorul de grupare ( x )
are o influenţă însemnată asupra variabilei rezultative y .
În procesul testării ipotezei nule ( H 0 ) se utilizează tabelul ANOVA. Pentru testare este
utilizat este Fisher (F).

Bibliografie

Gogonea R.M., Zaharia Econometrie cu aplicaţii în activitatea de comerţ-turism-


M. servicii, Editura Universitară, Bucureşti, 2008,

Oprea C., Zaharia M. Elemente de analiza datelor și modelare utilizând Excel,


Editura Universitară, Bucureşti, 2011

146
Unitatea de învăţare 10
DETERMINAREA ŞI TESTAREA CORELAŢIILOR LINIARE DINTRE
VARIABILELE ECONOMICE

Cuprins
Obiectivele Unităţii de Învăţare 10 ......................................................................................... 147
10.1 Corelația liniară simplă ................................................................................................ 147
10.2 Corelația multiplă ......................................................................................................... 152
Lucrare de verificare 10A ....................................................................................................... 155
Test de autoevaluare 10B ........................................................................................................ 156
Rezumat ................................................................................................................................... 158
Bibliografie.............................................................................................................................. 158

Obiectivele Unităţii de Învăţare 10

După studiul acestei unităţi de învăţare cursanţii vor avea cunoştinţe despre:
• aplicabilitatea modelelor econometrice de analiză a legăturilor prin intermediul
coeficienților de corelație;
• testarea coeficientului de corelație;

10.1 Corelația liniară simplă

Coeficientul de corelaţie ( r ) reprezintă un indicator statistic de analiză a legăturii dintre


două sau mai multe variabile statistice. El este utilizat, în cazul studierii liniarităţii dintre o
variabilă rezultativă şi alta factorială (sau mai multe factoriale), scopul aplicării lui derivând
tocmai din capacitatea acestuia de a stabili direcţia şi gradul de intensitate a respectivei legături.
În cazul corelaţiei simple liniare, acest coeficient se determină în raport cu abaterile celor
două variabile, variabila x (factorială) şi variabila y (rezultativă), astfel:

147
• pentru o serie bidimensională simplă:
n

∑ (x
i =1
i − x )( y i − y )
cov( x; y ) σ xy
r= = = (10.1)
nσ xσ y σ xσ y σ xσ y
care, după efectuarea calculelor are forma:
n

∑ (x
i =1
i − x )( y i − y )
r= (10.2)
 n 2 
n
2
 (x i − x )  ⋅  ( y i − y ) 
∑ ∑
 i =1   i =1 

respectiv:
n n n
n ∑
i =1
xi y i − ∑ ∑y
i =1
xi ⋅
i =1
i
r= (10.3)
 n  n    n 2  n
2
 
2


 xi −  xi   ⋅  y i − 
 i =1
2
    ∑
 y i   ∑ ∑
  i =1    i =1  i =1  

unde: n - numărul variabilelor perechi (x, y ) incluse în analiză;


σ x - abaterea medie pătratică a variabilei factoriale x
σ y - abaterea medie pătratică a variabilei rezultative y

σ xy - abaterea medie pătratică corespunzătoare ambelor

variabile xy
• pentru o serie bidimensională cu frecvenţe:
n

∑ (x
i =1
i − x )( y i − y )n xy
r= n
(10.4)
∑n
i =1
xy σ xσ y

după efectuarea calculelor relaţia (6.4) devine:


n k n n n n

∑∑ n ⋅ ∑∑ xyn − ∑ xn ⋅ ∑ yn
i =1 j =1
xy
i =1 i =1
xy
i =1
x
i =1
y
(10.5)
r
 n n n
 n 
2
 n n n
 n  
2

∑∑ n ∑ x n
 i =1 n =1
xy
i =1
2
x ∑
−  xnx 
 i =1 
 ∑∑ n ∑ y n
  i =1 i =1
xy
i =1
2
y ∑
−  yn y  
 i =1  
 

Dacă acest coeficient de corelaţie se determină la nivelul unui eşantion, atunci relaţia
(6.4) pentru o serie bidimensională simplă devine:

148
cov( x, y ) s xy
r= sau r= (10.6)
sx ⋅ s y sx ⋅ s y

unde s x - estimatorul abaterii medii pătratice a variabilei factoriale x

s y - estimatorul abaterii medii pătratice a variabilei rezultative y

s xy - estimatorul abaterii medii pătratice corespunzătoare

ambelor variabile xy

Valorile indicatorului prezentat trebuie să se încadreze în intervalul [− 1 ; 1] .


Semnul coeficientului de corelaţie depinde numai de numărătorul relaţiei de calcul şi
reflectă direcţia legăturii, astfel:
 dacă r < 0 , atunci legătura dintre factorul x şi rezultativa y este indirectă
(variaţia factorului x în sensul unei creşteri determină o variaţie a rezultativei y
în direcţia unei scăderi sau scăderea lui x determină o creştere a lui y );
 dacă r > 0 , atunci legătura dintre variabila factorială x şi cea rezultativă y este
directă (creşterea factorialei x determină o creştere a rezultativei y sau scăderea
lui x conduce la o scădere a lui y ).
Valorile coeficientului de corelaţie stabilesc gradul de intensitate a legăturii valorilor
coeficientului de corelaţie sunt prezentate în tabelul 10.1.

Tabelul 10.1. Semnificaţiile valorilor coeficientului de corelaţie


Dacă r = 0 , NU există legătură între variabilele studiate
Legătură INVERSĂ, dacă r ∈ (− 1 ; 0) Legătură DIRECTĂ, dacă r ∈ (0 ; 1)
Interval Tipul legăturii Interval Tipul legăturii
r ∈ (− 0,2 ; 0) inversă foarte slabă r ∈ (0 ; 0,2) directă foarte slabă
r ∈ (− 0,5 ; − 0,2) inversă slabă r ∈ (0,2 ; 0,5) directă slabă
r ∈ (− 0,75 ; − 0,5) inversă de intensitate r ∈ (0,5 ; 0,75) directă de intensitate
medie medie
r ∈ (− 0,95 ; − 0,75) inversă puternică r ∈ (0,75 ; 0,95) directă puternică
r ∈ (− 1 ; − 0,95) Inversă foarte puternică r ∈ (0,95 ; 1) directă foarte puternică
r = −1 Inversă perfectă r =1 directă perfectă

149
Determinarea coeficientului de corelaţie la nivelul unui eşantion şi interpretarea acestuia,
reprezintă o prima etapă necesară aplicării metodologiei econometrice de stabilire a semnificaţiei
coeficientului de corelaţie al colectivităţii generale din care a fost selectat eşantionul cercetat.
Procesul testării semnificaţiei coeficientului de corelaţie ( ρ ) în raport cu cel al
eşantionului ( r ) se desfăşoară pornind de la următoarele aspecte:
• variabila rezultativă y şi cea factorială x să fie repartizate normal;
• coeficientul de corelaţie al colectivităţii generale ( ρ ) s-ar determina astfel:

∑ (X − X )(Yi − Y )
n

cov( X , Y ) σ xy i
ρ= = = i =1

[(X ][ ]
(10.7)
σ xσ y σ xσ y − X ) ⋅ (Yi − Y )
2 2
i

• estimatorul coeficientului de corelaţie (r), în condiţiile unui eşantion de volum redus ( n < 30 )
se prezintă ca un estimator:
- absolut corect cu: M (r ) = ρ şi σ 2 (r ) → 0

1− r2
- cu abaterea medie pătratică: s r =
n−2

 1− r 2 
- având distribuţia normală: N  ρ , 
 n−2 
Etapele parcurse pentru testarea semnificaţiei coeficientului de corelaţie sunt:
1. Ipoteza nulă H 0 : ρ = 0 (coeficientul de corelaţie al colectivităţii nu este semnificativ
statistic, deci nu diferă semnificativ de zero),
2. Ipoteza alternativă H 1 : ρ ≠ 0 (coeficientul de corelaţie al colectivităţii este semnificativ
statistic, deci diferă semnificativ de zero).
2.1. - testul unilateral stânga: H 1 : ρ < 0 (coeficientul de corelaţie al colectivităţii este
semnificativ statistic, deci mai mic semnificativ de zero)
2.2. - testul bilateral: H 1 : ρ ≠ 0 (coeficientul de corelaţie al colectivităţii este
semnificativ statistic, deci diferă semnificativ de zero)
2.3. - test unilateral dreapta: H 1 : ρ > 0 (coeficientul de corelaţie al colectivităţii este
semnificativ statistic, deci mai mare semnificativ de zero)
3. În raport cu datele şi cerinţele aplicaţiei se utilizează testul t

150
( Student)
4. Se stabileşte limita de semnificaţie α şi regiunea de respingere
4.1. - testul unilateral stânga:
► „t” tabelar sau teoretic tα ; n − 2 (Anexa 3) şi valoarea cu semnul ”-„ se plasează pe

grafic.
► regiunea de respingere Rr : dacă t c < −tα ; n − 2 , atunci H o se respinge, deci

coeficientul de corelaţie este semnificativ mai mic decât zero.


4.2. - testul bilateral:
► „t” tabelar sau teoretic t α (Anexa 3) şi valorile cu semnele „+” şi ”-„ se
; n−2
2

plasează pe grafic.
► regiunea de respingere Rr : dacă t c < - t α sau t c > t α atunci H o deci
; n−2 ; n−2
2 2

coeficientul de corelaţie este semnificativ diferit de zero.


4.3. - test unilateral dreapta:
► „t” tabelar sau teoretic tα ; n − 2 (Anexa 3) şi valoarea cu semnul „+„ se plasează pe

grafic.
► regiunea de respingere Rr : dacă t c > tα ; n − 2 , atunci H o se respinge, deci

coeficientul de corelaţie este semnificativ mai mare decât zero.


5. Statistica testului13 calculată este:
r
tc = ⋅ n−2 (10.8)
1− r2
6. Concluzia se stabileşte în funcţie de regiunea de respingere şi valoarea calculată t c , astfel: se

compară valoarea lui t c cu una din valorile - tα ; n − 2 , - t α , tα , tα ; n − 2 şi se stabileşte


; n−2 ; n−2
2 2

dacă rezultatul statistic al testului calculat t c intră sau nu, în regiunea de respingere Rr ,
luându-se decizia adecvată situaţiei.

13
Vezi Capitolul II “Distribuţii utilizate în analize econometrice”, Subcapitolul 2.3.. “Distribuţii clasice în
verificarea ipotezelor statistice”, în 2.3.3. “Repartiţia Student”

151
Testarea semnificaţiei coeficientului de corelaţie simplă liniară se poate realiza şi cu
ajutorul testului Fisher14 (testul F ), utilizând aceeaşi metodologie ca şi în cazul testării
raportului de corelaţie, numai că, statistica testului este:
r2
Fc = ⋅ (n − 2 ) (10.9)
1− r2
Pentru comparaţie, valoarea tabelară (teoretică) a testului se preia tot din Anexa 4, pentru:
F1−α ;k ;n − k −1 , F α , Fα Fα ;k ;n −k −1 .
1− ; k ; n − k −1 ; k ; n − k −1
2 2

10.2 Corelația multiplă

În studierea corelaţiei din cadrul activităţilor de comerţ-turism-servicii trebuie utilizaţi


indicatori care să permită o interpretare a modului în care se concretizează legătura.
Formarea unei legături multiple liniare între caracteristicile studiate creează posibilitatea
utilizării coeficientului de corelaţie multiplă.
Coeficientul de corelaţie multiplă se stabileşte în raport cu coeficientul de corelaţie
simplă şi, în special pe baza relaţiei de egalitate dintre raportul de corelaţie şi coeficientul de
corelaţie simplă ( R = r ).
În funcţie de tipul seriei bidimensionale, raportul de corelaţie utilizat este:
 pentru o serie bidimensională simplă

∑ (y )
n
− yˆ x1 , x2 ,..., xn
2
i
i =1
R y / x1, , x2 ,..., xn = 1 − n
(10.10)
∑ (y − y)
2
i
i =1

 pentru o serie bidimensională cu frecvenţe

∑ (y )
n
− yˆ x1 , x2 ,... xn n x1, 2 , 3,..., n
2
i
i =1
R y / x1x2 ,... xn = 1 − n
(10.11)
∑ (y − y) ny
2
i
i =1

În general, dacă o caracteristică rezultativă este influenţată de doi factori, atunci în


funcţie de tipul factorilor, coeficientul de corelaţie multiplă are formele:

14
Ibidem,în subcapitolul 2.3 “2.3.4. Repartiţia Fisher-Snedecor”

152
 pentru factori interpendenţi:

ry2/ x1 + ry2/ x2 − 2ry / x1 ry / x2 rx1 x2


R y / x1 , x2 = ry / x1 , x2 = (10.12)
1 − rx21x2

 pentru factori independenţi, deoarece rx1x2 = 0 rezultă:

R y / x1 , x2 = ry / x1 , x2 = ry2/ x1 + ry2/ x2 (10.13)

Utilizarea relaţiei (10.13) are în vedere, în special, verificarea liniarităţii funcţiei de


estimare. Subliniem că relaţia (10.13) este adevărată (se verifică) numai în cazul în care între
variabilele analizate există o relaţie de liniaritate.
Similar modului de definire a coeficientului de corelaţie (relaţia 6.1) se deduce imediat că
ry / x1 , ry / x2 , respectiv rx1x2 au expresiile:
n n n
n∑ x1i yi − ∑ x1i ⋅ ∑ y i
i =1 i =1 i =1
ry / x1 = (10.14)
 n 2  n 
2
 n 2  n  
2

∑ x1i −  ∑ x1i   ∑ i  ∑ i  
⋅ y − y
 i =1  i =1    i =1  i =1  
n n n
n ∑ x 2 i y i − ∑ x 2i ⋅ ∑ y i
i =1 i =1 i =1
ry / x 2 = (10.15)
n 2  n    n
2
 n  
2

∑ x 2i −  ∑ x 2i   ⋅ ∑ yi2 −  ∑ yi  
 i =1  i =1    i =1  i =1  

n n n
n∑ x1i x 2 i − ∑ x1i ⋅ ∑ x 2 i
i =1 i =1 i =1
rx1x2 = (10.16)
 n
  n 2
  n
 n  
2

∑ x12i −  ∑ x1i   ∑ 2 i
⋅ − ∑ 2i  
2
x  x 
 i =1  i =1    i =1  i =1 

Tendinţa de interacţiune dintre factorii de influenţă între care există o relaţie de


interdependenţă şi variabila rezultativă, precum şi ierarhizarea caracteristicilor factoriale, poate fi
evidenţiată ca urmare a aplicării metodologiei de calcul a unui tip de corelaţie denumită corelaţie
parţială.
Corelaţia parţială se stabileşte în raport cu valorile coeficientului de corelaţie multiplă, iar
coeficienţii de corelaţie parţiali formaţi se determină astfel:

153
• când caracteristica x 2 este constantă, coeficientul de corelaţie parţială între y şi x1
este:

σ y2 / x − σ x2 x σ x2 x
ry / x1 ( x2 ) = 2 1 2
= 1− 1 2
(10.19)
σ y2 / x 2
σ y2 / x 2

sau
ry / x1 − ry / x2 ⋅ rx1x2
ry / x1 ( x2 ) = (10.20)
(1 − r )(1 − r )
2
y / x2
2
x1 x2

Coeficientul de corelaţie ry / x1 ( x2 ) ne indică gradul de influenţă a primului factor ( x1 )

asupra caracteristicii rezultative ( y ), în condiţiile menţinerii constante a celui de-al

doilea factor ( x 2 ).

• când caracteristica x1 este constantă, coeficientul de corelaţie parţială între y şi x2


este:

σ y2 / x − σ x2 x σ x2 x
ry / x2 ( x1 ) = 1 1 2
= 1− 1 2
(10.21)
σ 2
y / x1 σ 2
y / x1

sau
ry / x2 − ry / x1 ⋅ rx1x2
ry / x2 ( x1 ) = (10.22)
(1 − r )(1 − r )
2
y / x1
2
x1 x2

Coeficientul de corelaţie ry / x2 x1 ne indică gradul de influenţă a celui de-al doilea factor

( x 2 ) asupra caracteristicii rezultative ( y ), în condiţiile menţinerii constante a primei

caracteristici factoriale ( x1 ).
Studierea legăturii dintre mai multe caracteristici factoriale şi cea rezultativă, prin
utilizarea coeficienţilor de corelaţie parţiali, presupune o reflectare a influenţei fiecărei variabile
factoriale în parte, asupra celei rezultative, în condiţiile menţinerii constante a influenţei
celeilalte variabile factoriale.
Ca şi în cazul coeficientului de corelaţie simplă liniară, determinarea coeficientului de
corelaţie multiplă are în vedere aplicarea indicatorului, printr-o metodologie econometrică
adecvată şi în cazul testării semnificaţiei acestuia la nivelul colectivităţii generale din care a fost
selectat eşantionul aflat în studiu.

154
Verificarea semnificaţiei coeficientului de corelaţie multiplă, cât şi a coeficienţilor
parţiali reprezintă un proces de testare a valorii acestora în sensul de a stabili dacă valorile
rezultate sunt reale sau se datorează în cea mai mare parte acţiunii erorilor aleatoare care apar în
urma derulării sondajului.
Metodologia testării semnificaţiei este aceeaşi cu cea utilizată la testarea coeficientului de
corelaţie simplă liniară.
După stabilirea ipotezelor (nulă şi alternativă), se precizează limita de semnificaţie şi
regiunea de respingere, pentru ca în următoarea etapă, să se aplice unul testele prezentate mai
sus:
o Testul Student ( t ), cu statistica (relaţia 6.8):
r
tc = ⋅ n−2
1− r2
o Testul Fisher – Snedecor ( F ), cu statistica (relaţia 6.9):
r2
Fc = ⋅ (n − 2 )
1− r2

Decizia finală are în vedere o comparare a valorii determinate pentru t c sau Fc cu una

din valorile - tα ;n − 2 , - t α , tα , tα ;n − 2 sau F1−α ;k ;n − k −1 , F α , Fα Fα ;k ;n −k −1 stabilindu-


;n −2 ;n −2 1− ; k ; n − k −1 ; k ; n − k −1
2 2 2 2

se dacă rezultatul statistic al testului calculat t c , respectiv Fc intră sau nu, în regiunea de

respingere Rr , luându-se decizia adecvată situaţiei (dacă valoarea calculată intră în regiunea de
respingere atunci ipoteza nulă se respinge, iar coeficientul este considerat semnificativ statistic)
Esenţa utilizări coeficienţilor de corelaţie simpli, multipli sau parţiali în cadrul modelelor
econometrice constă în stabilirea gradului în care valorile determinate prin aplicarea
metodologiilor de calcul adecvate, sunt reale sau se datorează în cea mai mare parte erorilor
întâmplătoare de sondaj.

Lucrare de verificare 10A

Răspundeţi pe scurt la următoarele întrebări:


1. Ce reprezintă coeficientul de corelație?

155
2. Care sunt valorile coeficientului de corelație ce stabilesc gradul de intensitate a
legăturii dintre variabilele analizate?
3. Care sunt etapele ce trebuiesc parcurse pentru testarea semnificației coeficientului de
corelație?
4. Care este formula cu care se calculează statistica testului coeficientului de corelație?
5. Care este testul cu ajutorul căruia se testează semnificația coeficientului de corelație
simplă liniară?

Test de autoevaluare 10B

1. Verificarea intensitãţii legãturii dintre variabilele economice cantitative presupune


utilizarea:
a. testului F;
b. coeficientului de contingenţã;
c. analizei dispersionale;
d. coeficientului de corelaţie.

2. Coeficientul de corelație arată:


a. cât de puternică este legătura dintre variabile;
b. omogenitatea legăturii dintre variabile;
c. erorile seriei de date;
d. abaterile modelului econometric.

3. Intervalele de valori ale coeficientului de corelație sunt:


a. ry/x (0; 0,2) - legatura directă foarte slabă;
b. ry/x (0,2; 0,5) – legatură directă slabă;
c. ry/x (0,5; 0,75) – legatură directă de intensitate medie;
d. ry/x (0,75; 0,95) - legatura este biunivoca si de inteensitate slaba
e. ry/x (0,75; 0,95) - legatură directă puternică;
f. ry/x (0,95; 1) – legatură directă foarte puternică.
A: a, b, c, d, e; B: a, c, d, f; C: a, b, c, e, f; D: b, c, d, e.

156
4. Un agent economic urmăreşte creşterea profitului activităţii sale, prin utilizarea
optimă a capacităţilor de producţie. Pentru analiză utilizează date din cinci luni,
astfel:
Profitul 7 9 11 12 14
Capacit de producție 9 12 14 11 16

Coeficientul de corelație simplă este:


a. 0,98;
b. 0,81;
c. 0,56;
d. 1.

5. Se cunosc următoarele date referitoare la venitul lunar şi cheltuielile medii lunare cu


educația efectuate de 10 familii incluse în eşantionion:
1800 1900 1500 1700 2100 2500 1900 2200 2600 2000
Venit lunar
Cheltuieli medii 400 450 450 600 800 700 500 600 700 500
lunare cu educația

Coeficientul de corelație simplă este:


a. 0,60;
b. 0,81;
c. 0,68;
d. 0,97.

6. Se cunosc următoarele date referitoare la vânzările a 10 produse astfel:


Prețul produselor 19 11 17 15 14 12 11 17 12 16
Cheltuieli cu
publicitatea 5 2 5 3 3 4 2 4 3 4

Coeficientul de corelație simplă este:


a. 0,89;
b. 0,83;
c. 0,68;
d. 0,75.

157
Rezumat

Pentru determinarea corelaţiilor dintre două sau mai multe variabile economice un
indicator foarte des utilizat este coeficientul de corelaţie liniară (r). În cazul corelaţiei liniare
n n n
n ∑
i =1
xi y i − ∑ ∑y
i =1
xi ⋅
i =1
i
simple acesta are forma: r = .
 n  n    n 2  n
2
 
2


 i =1  i =1

 xi −  xi   ⋅  y i − 
2
   
 i =1

 i =1

y i  
 

  

Valorile lui r ∈ [− 1;1] şi indică direcţia şi intensitatea legăturii dintre cele două variabile.
Coeficientul de corelaţie multiplă în cazul în care variabila rezultativă este influenţată de
ry2/ x1 + ry2/ x2 − 2ry / x1 ry / x2 rx1 x2
doi factori are forma ry / x1 , x2 = pentru factori interpendenţi, respectiv
1 − rx21 x2

ry / x1 , x2 = ry2/ x1 + ry2/ x2 pentru factori independenţi, deoarece rx1 x2 = 0 .

Testarea semnificaţiei statistice a valorii coeficientului de corelaţie liniară simplă se poate


r
face utilizând testul Student, cu statistica t c = ⋅ n − 2 sau testul Fischer cu statistica
1− r2

r2
Fc = ⋅ (n − 2) . Testările se efectuează parcurgând secvenţial etapele prezentate în unitatea
1− r2
de învăţare 5.

Bibliografie

Gogonea R.M., Zaharia Econometrie cu aplicaţii în activitatea de comerţ-turism-


M. servicii, Editura Universitară, Bucureşti, 2008,

Oprea C., Zaharia M. Elemente de analiza datelor și modelare utilizând Excel,


Editura Universitară, Bucureşti, 2011

Voineagu V, Ţiţan E., Teorie şi practică econometrică, Editura Meteor Press,


Şerban R., Ghiţă S., 2007
Tudose D., Boboc C.,
Pele D.

158
Unitatea de învăţare 11
MODELUL DE REGRESIE LINIARĂ UNIFACTORIALĂ

Bibliografie

Unitatea de învăţare 11 Modelul de regresie liniară unifactorială ............................................. 159


Obiectivele Unităţii de Învăţare 11 ......................................................................................... 159
11.1 Ipotezele modelului ...................................................................................................... 163
11.2 Determinarea și validarea parametrilor modelului linear unifactorial ......................... 155
Lucrare de verificare 11A ....................................................................................................... 180
Test de autoevaluare 11B ........................................................................................................ 180
Rezumat ................................................................................................................................... 183
Bibliografie.............................................................................................................................. 184

Obiectivele Unităţii de Învăţare 11

După studiul acestei unităţi de învăţare cursanţii vor avea cunoştinţe despre:
• ipotezele modelului regresie unifactorial;
• determinarea și validarea modelului de regresie unifactorial;

11.1 Ipotezele modelului

Conceptul statistic de regresie15 a fost utilizat pentru prima dată în 1886 de biologul
englez Francis Golton (1822-1894).
Utilizarea regresiei presupune aplicarea unei metode statistice care să vizeze depistarea,
stabilirea şi comensurarea unei relaţii constituite între două sau mai multe variabile, în care una

15
Termenul provine din latinescul „regresia” s-a conturat pe baza rezultatelor observării şi analizei
orientate spre „întoarcerea spre medie”.

159
este rezultativă (dependentă), iar cealaltă sau celelalte sunt explicative (apar sub forma factorilor
esenţiali de influenţă).
Metoda regresiei este fundamentată pe măsurarea şi previzionarea influenţei pe care unul
sau mai mulţi factori o poate avea asupra evoluţiei unui fenomen sau proces economic.
Deoarece, în cadrul metodei apar valori perechi de variabile utilizate şi parametri
corespunzători acestora sub forma mediilor, dispersiilor, abaterilor standard, etc, ea reprezintă o
componentă a metodelor parametrice de măsurare şi analiză a legăturilor formate în cadrul
derulării unor procese sau fenomene economice.
Elementul fundamental în cadrul metodei regresiei îl reprezintă funcţia de regresie.
Definiţia 6.1. Numim funcţie de regresie acea funcţie care sintetizează forma dependenţei
( )
variabilei rezultative Y , de variabilele factoriale X x1 , x 2 , K , x n .
În acest context, funcţia de regresie este o funcţie de modulare sub forma ecuaţiei medie
de tendinţă, ca rezultat a utilizării unor ecuaţii de estimare.
Funcţia de regresie poate să apară sub forma unei reprezentări grafice şi poate fi validată
prin intermediul testului F (Fisher Snedecor) de analiză dispersională.
Activitatea practică impune să se acorde o atenţie deosebită în alegerea corectă a funcţiei
de regresie pentru că, în studierea legăturilor dintre fenomenele şi procese economice este cea
mai importantă şi exprimă foarte clar relaţia dintre variabilele studiate (rezultativă şi factorială /
factoriale).
Tipul funcţiei de regresie este stabilit în raport cu reprezentarea grafică a norului de
puncte, corespunzătoare distribuţiei studiate („scalter diagram”- diagrama împrăşterii punctelor
pe grafic).
Astfel, o analiză detaliată şi cât mai exactă a unui proces sau fenomen economic impune
o studiere clară a tipului funcţiei de regresie după o clasificare realizată în raport cu
variabilele şi parametrii incluşi în model, după cum urmează:
• liniar în raport cu parametrii, în care atât variabilele modelului cât şi parametrii sunt la
puterea întâi. În cazul regresiei statistice, reprezentarea grefică a unui astfel de model se
rezumă la o linie dreaptă crescătoare sau descrescătoare care străbate mijlocul norului de
puncte urmând sensul alungirii acestuia; liniaritatea este dată de ecuaţia:
yˆ = a 0 + a1 x (11.1)
în cazul unifactorial respectiv,

160
yˆ = a 0 + a1 x1 + ... + a K x K (11.2)
în cazul multifactorial.
• neliniar cu următoarele variante:
► neliniar în raport cu variabilele dar liniar în raport cu parametri–este acea
reprezentare în care cel puţin una dintre variabilele explicative este la o putere
diferită de putera întâi de forme precum:
yˆ = a 0 + a1 x + a 2 x 2 ; yˆ = aX a Z β ( a ≠ 1, β ≠ 1 ), (11.3)

yˆ = a 0 + a1 (1 / x) etc.
► neliniar în raport cu parametrii dar liniar în raport cu variabilele, caz în care cel
puţin un parametru este la o putere diferită de puterea întâi, precum:

yˆ = a + a 2 x , yˆ = a x etc. (11.4)
► neliniar în raport cu variabilele şi cu parametrii - caz în care cel puţin o variabilă şi
cel puţin un parametru sunt la o putere diferită de puterea întâi, cum ar fi:
yˆ = a 2 x + a x 2 etc. (11.5)
Importanţa deosebită acordată funcţiei regresiei se transpune printr-o eficienţă
ridicată în utilizarea metodelor regresiei la nivelul multor domenii de activitate.
Conjunctura în care se aplică modelul unifactorial de regresie liniară vizează atingerea
unor ipoteze sintezate prin patru aspecte:
1. Stabilirea soluţiilor – are în vedere ca date utilizate:
• să fie obţinute fără erori simetrice de observare;
• să fie în număr suficient de mare (mai mare decât numărul parametilor astimaţi).
2. Variabila factorială (x)
• este nestocastică;
• are acelaşi valori în condiţiile repetării sondajului;
• este evidenţiată datorită variabilităţii nivelurilor înregistrate în cadrul eşantionului
(dispersia σ x2 ).
3. Modelul de regresie
• este liniar în raport cu parametrii;
• este corect stabilit prin:

161
∗ alegerea potrivită a formei funcţionale:
- liniară
- neliniară transformată în liniară
∗ cuprinderea celor mai importanţi factori verificată printr-o valoare destul de mare
a coeficienţilor de determinaţie ( R 2 ).
y
M (Y | X = X i ) = α + β X i

erori

pozitive

erori

negative
x1 x2 x3 x

Figura 11.116. Distribuţia de probabilitate pentru ε i


4. Variabila reziduală ( ε i )

• este de medie zero şi urmează o repartiţie normală (figura 6.1):


M (ε i ) = 0 , unde ε i ~ N (0, σ 2 )

• cuprinde o împrăştiere egală (figura 6.1) pentru diferite segmente de valori xi ceea
ce reprezintă ipoteza de homoscedasticitate:
Var (ε i ) = σ 2 constantă (∀ i )

16
Voineagu V., Ţiţan E., Şerban R., Ghiţă S., Todose D., Boboc C., Pele D., “Teorie şi practică econometrică”,
Editura Meteor Press, Bucureşti 2007, pag. 170

162
Y

X
0

Figura 11.2 Dispersie constantă a rezidurilor (homoscedasticitate)

• nu este corelată cu variabila factorială ( x ), deci:


Cov(ε i , xi ) = 0

• nu este autocorelată în sensul că, abaterile observaţiilor de la valorile presupuse nu


sunt corelate.
Cov (ε i , ε j ) = 0

11.2 Determinarea și validarea parametrilor modelului linear unifactorial

Aplicabilitatea coeficientului de corelaţie în econometrie este strâns legată de regresia


liniară17 şi în principal, de parametrii ce formează funcţia de regresie liniară.
În raport cu modul de stabilire a parametrilor ecuaţiei de regresie liniară, coeficientul de
corelaţie poate fi determinat prin două variante:

Varianta 1:

17
Vezi Capitolul VII “Modelul regresiei liniare”, subcapitolul 7.1.1. “Stabilirea şi aplicarea modelului unifactorial
de regresie liniară”

163
n
n ∑y
i =1
i

n n

∆b
∑x ∑x y
i =1
i
i =1
i i

r= = , care conduce la
∆⋅∆y n n
n ∑x
i =1
i n ∑y
i =1
i

n n
⋅ n n

∑ xi
i =1
∑ xi2
i =1
∑ yii =1
∑y
i =1
2
i

relaţia:
n n n
n∑ xi y i − ∑ xi ⋅ ∑ y i
i =1 i =1 i =1
r= (11.6)
 n
  n 2
  n
 n  
2

∑ xi2 −  ∑ xi   ∑ i
⋅ y 2
−  ∑ i 
y 
 i =1  i =1    i =1  i =1  

Varianta 2:
s xy s xy
Din relaţiile r = şi b = rezultă că:
sx ⋅ s y s x2

sx
r = b⋅ (11.7)
sy

Relaţia (6.37) evidenţiază mai bine legătura coeficientului de corelaţie ( r ) cu coeficientul


de regresie ( b ), deci implicit cu metoda regresiei.
Deoarece, s x şi s y sunt întotdeauna pozitive, ambii coeficienţi vor avea acelaşi semn

care va indica direcţia legăturii (vor avea aceeaşi interpretare în ceea ce priveşte direcţia
legăturii).
Tendinţa de liniaritate a legăturii dintre o variabilă rezultativă şi alta explicativă, de tip
factorial, este reflectată nu numai printr-o reprezentare grafică însoţită de aplicarea modelului de
regresie liniar, dar şi prin egalitatea dintre raportul de corelaţie ( R ) şi coeficientul de corelaţie
( r ): R = r .

Regresia unifactorială liniară este reprezentată printr-un model în care:

• asupra caracteristicii rezultative acţionează în principal un singur factor variabil


(variabila explicativă sau independentă), deci:
164
► la nivelul colectivităţii generale: Y = f ( X i )

► la nivelul eşantionului: y = f ( xi )

• restul factorilor sunt consideraţi neesenţiali şi au o acţiune constantă şi neglijabilă


rezumată într-o valoare medie ε i pentru colectivitatea generală şi ei pentru eşantion.

• forma reprezentării grafice şi a funcţiei regresiei teoretice a distribuţiei în raport cu cele


două variabile este de tip liniar, astfel:

► pentru colectivitatea generală : Yˆi = α + β xi

► pentru eşantion: yˆ i = a + b xi
Posibilităţile de aplicare practică a modelului de regresie unifactorială liniară are în
vedere următoarea reprezentare grafică din figura 7.2.

3
0,5 β = 0,5

2
1

y = 1 + 0,5 ⋅ x
1
α =1

x
1 2 3 4

Figura 7.2. Evidenţierea grafică a parametrilor funcţiei de regresie liniară unifactorială

Graficul (11.8) ne arată că, pe colectivitatea statistică generală, aplicarea modelului ce


reflectă influenţa factorului x asupra rezultativei y presupune utilizarea ecuaţiei de regresie
liniară
Yi = α + β xi + ε i (11.8)

Notând cu Yˆ înfluenţa factorului determinist asupra variabilei rezultative Y , relaţia


(11.9) devine:

165
Yi = Yˆi + ε i (11.9)

unde Yˆi = α + β xi .

Interpretarea parametrilor α şi β este dată de reprezentarea grafică (figura 11.8) astfel:


α – este punctul de intersecţie al dreptei de regresie cu axa OY
β – este pantă a dreptei de regresie; în analiză, β apare sub denumirea de coeficient de
regresie, care ne arată cu câte unităţi se modifică y sub influenţa variaţiei factorului x cu o
unitate.
De cele mai multe ori, în practică, modelul regresiei unifactoriale liniare se aplică pe un
eşantion γ cu n perechi de observare: (x1 , y1 ) , ( x2 , y 2 ) , ( x3 , y 3 ) ,..., (x n , y n ) , astfel:

y i = a + b xi + ei (11.10)
care poate şi scrisă şi sub forma:
yi = yˆ i + ei (11.11)

în care yˆ i = a + b xi

Parametrii a şi b sunt estimatori ai punctului de intercepţie α , respectiv ai pantei liniei


de regresie β .
Dacă se doreşte o analiză a elementului rezidual sub forma erorilor, atunci se poate stabili
nivelul acestuia după cum urmează:
► pentru colectivitatea generală

ε i = Yi − Υˆ i (11.12)

► pentru eşantion

ei = yi − yˆ i (11.13)

În ambele situaţii, atât eroarea aleatoare ( ε i ), cât şi estimatorul elementului rezidual ( ei )

ne indică diferenţele ce apar între valorile reale (empirice) şi cele rezultate prin observare ( Υi

sau yi ).
Modelul unifactorial de regresie liniară poate fi aplicat la nivelul unui eşantion numai
dacă există posibilitatea estimării parametrilor incluşi în respectivul model.

166
Estimarea parametrilor (a, b ) se poate realiza prin aplicarea unei metode statistico-
matematice, cum ar fi: metoda celor mai mici pătrate, metodele bayesiene, metoda verosimilităţii
maxime.
Alegerea metodei celei mai fidele şi adecvate situaţiei în care se prezintă procesul studiat,
precum şi obţinerea unei calităţi ridicate a estimatorilor necesită respectarea următoarelor
criterii18:
• să fie cât mai mare gradul de determinare ( R 2 );
• abaterile stabilite între valorile empirice ( yi ) şi cele teoretice obţinute prin ajustare

∑ (y − yˆ i ) = minim;
2
( ŷi ) să fie cât mai reduse, a.î. i
i

• estimările stabilite să reprezinte soluţii nedeplasate, consistente şi eficiente;


• să fie minim costul necesar aplicării metodei de estimare.
În general practica a demonstrat că metoda cea mai fidelă şi utilizată este metoda celor
mai mici pătrate. Denumirea metodei evidenţiază principalele ei caracteristici: suma pătratelor
abaterilor valorilor empirice de la cele teoretice să fie minimă.
n n
min ∑(y
i =1
i − yˆ i ) 2 = min ∑(y
i =1
i − a − bxi ) 2 (11.14)

n
Notând cu S = ∑ ( y i − a − bxi ) 2 , din condiţiile de optim de ordinul întâi:
i =1

 ∂S  n
 ∂a = 0 

2 ( y i − a − bxi )(−1) = 0
 ⇒  i =n1 ⇒
 ∂S = 0 2 ( y − a − bx )(− x ) = 0
 ∂b  ∑
 i =1
i i i

 n  n n n


2 ( a + bxi − y i ) = 0
 i =1

 a+
 i =1

i =1
xi − ∑
i =1
yi = 0
 n ⇒  n n n
2 ( ax + bx 2 − x y ) = 0 a x + b x 2 −
 ∑
 i =1
i i i i  ∑
 i =1
i ∑
i =1
i
i =1
∑xi y i = 0

obţinem sistemul de ecuaţii normale:

18
Pecican E. Ş., “Econometrie pentru... economişti”, Editura economică, Bucureşti 2007, pag. 64.

167
 n n

 na + b ∑
i =1
x i = ∑
i =1
yi
 n n n (11.15)
a ∑ xi + b∑ xi2 = ∑ xi y i
 i =1 i =1 i =1

Pentru determinarea expresiilor parametrilor a şi b din sistemul de ecuaţii normale


(11.16) aplicăm metoda determinanţilor astfel:
n n

∑y
i =1
i ∑x i =1
i

n n

∆a
∑ xi y i
i =1
∑x
i =1
2
i

a= = , de unde rezultă:
∆ n
n ∑xi =1
i

n n

∑ xi
i =1
∑x
i =1
2
i

n n n n

∑ yi ⋅ ∑ xi2 − ∑ xi ⋅ ∑ xi yi
i =1 i =1 i =1 i =1
a= 2
(11.16)
n
  n
n∑ x 2i − ∑ xi 
i =1  i =1 
respectiv
n
n ∑x
i =1
i

n n


∑ xi
i =1
∑x y
i =1
i i

b= b = , de unde, pentru parametrul b rezultă:


∆ n
n ∑x
i =1
i

n n

∑x
i =1
i ∑x
i =1
i
2

n n n
n ∑ xi y i − ∑ xi ⋅ ∑ y i
i =1 i =1 i =1
b= 2
(11.17)
n
 n 
n ∑ x −  ∑ xi 
i
2

i =1  i =1 
Utilizarea modelului regresiei unifactoriale liniare nu permite numai stabilirea funcţiei de
regresie şi determinarea cu ajutorul sistemului de ecuaţii normale a parametrilor acestuia, ci
permite şi interpretarea estimatorilor determinaţi astfel:
168
 Parametrul estimator a :
- este denumit şi termen liber;
- are caracter de mărime medie – indică valoarea variabilei rezultative y când toţi
factorii neesenţiali au o acţiune constantă (este nivelul mediu al variabilei y
determinată prin influenţa celorlalţi factori, în afara lui xi ).

- în reprezentarea grafică, indică punctul de întâlnire dintre axa OY şi panta dreptei de


regresie.
- valoarea pozitivă ( a > 0 ) sau negativă ( a < 0 ) nu are nici o relevanţă în modelul
regresiei.
 Parametrul estimator b :
- se numeşte coeficient de regresie;
- arată:
 gradul de influenţă a variabilităţii factoriale x asupra rezultativei y (cu cât variază în
medie y în condiţiile modificării cu o unitate a factorului x ).
 direcţia legăturii:

◊ b > 0 , legătură directă (creşterea valorilor variabilei factoriale x determină o


creştere a valorilor ecuaţiilor de regresie şi invers).
◊ b < 0 , legătură inversă sau indirectă (creşterea valorilor variabilei factoriale x
determină o scădere a valorilor ecuaţiilor de regeresie şi invers).
◊ b ≠ 0 , nu există legătură; variabilele sunt independente valoarea medie a a
caracteristicii factoriale x este egală cu cea a caracteristicii rezultative).
- în reprezentarea grafică, parametrii exprimă panta dreptei de regresie.
Odată cu interpretatrea parametrilor estimatori a şi b se încheie prima treaptă a
modelului regresiei unifactoriale liniare prin care s-a stabilit şi s-a aplicat metoda.

Verificarea validităţii modelului unifactorial de regresie liniară


A doua treaptă de analiză a modelului unifactorial de regresie liniară este reprezentată de
verificarea validităţii metodei, prin intermediul căreia se doreşte o confirmare a stabilirii şi
utilizării respectivului model.

169
Confirmarea de alegere şi utilizare corectă a modelului unifactorial de regresie liniară
este completă numai după parcurgerea următoarelor etape:
- testarea validităţii modelul unifactorial de regresie liniară utilizând metod ANOVA
- stabilirea şi testarea semnificaţiei raportului de corelaţie (R).
- testarea semnificaţiei parametrii modelului regresiei unifactoriale liniare şi estimarea lor pe
interval de încredere.

Exemplul 11.1.
În cadrul unui proiect este inclusă o cercetare care necesită studierea unui
eşantion format din 15 supermarket-uri. Studiul care trebuie realizat vizează analiza legăturii
care se stabileşte între salariul mediu acordat salariaţilor şi profitul înregistrat de respectivele
supermarket-uri, pe baza datelor din tabelul 6.2.

Tabelul 6.2. Profitul şi salariul mediu la 15 supermarket-uri

Profit
8 6 4 9 11 4 7 8 10 4 12 9 5 12 11
(mil. lei)
Salariul
mediu 32 22 18 30 40 15 25 24 35 21 35 27 20 36 33
(mii lei)

Se cere:
1 Să se stabilească direcţia şi intensitatea legăturii dintre salariul mediu acordat salariaţilor şi
profitul înregistrat de respectivele supermarket-uri.
2 Testaţi semnificaţia coeficientului de corelaţie determinat

Rezolvare:

1. Stabilirea direcţiei şi intensităţii legăturii presupune determinarea coeficientul de corelaţie


simplă liniară.

Se identifică cele două variabile:

xi – variabila factorială = profitul (mil. lei) înregistrat pentru fiecare supermarket

yi - variabila dependentă = salariul mediu pe salariat (mii lei) acordat la nivelul fiecărui
supermarket

170
Determinarea coeficientului de corelaţie presupune parcurgerea algoritmului din tabelul
11.3.

Înlocuind valorile sumelor din tabelul 11.3 în relaţia


n

∑ (x
i =1
i − x )( y i − y )
r=
 n 2 
n
2
 ( xi − x )  ⋅  ( y i − y ) 
∑ ∑
 i =1   i =1 

coeficientul de corelaţie dintre salariul mediu acordat salariaţilor şi profitul înregistrat de


respectivele supermarket-uri este:
279,53
r= ≈ 0,93 (11.18)
118 ⋅ 763,49

Valoarea coeficientului de corelaţie, r = + 0,93 ne arată că, între salariul mediu acordat
salariaţilor şi profitul înregistrat de respectivele supermarket-uri, există o legătură directă
puternică, deoarece r ∈ (0,75 ; 0,95) .

Tabelul 11.3. Determinarea coeficientul de corelaţie liniară simplă

Profit Salariul mediu


(mil.lei) (mii lei) (xi − x )( yi − y ) ( xi − x )2 ( y i − y )2
xi yi
8 32 0 0 19,9809
6 22 11,06 4 30,5809
4 18 38,12 16 90,8209
9 30 2,47 1 6,1009
11 40 37,41 9 155,5009
4 15 50,12 16 157,0009
7 25 2,53 1 6,4009
8 24 0 0 12,4609
10 35 14,94 4 55,8009
4 21 26,12 16 42,6409
12 35 29,88 16 7,4700
9 27 - 0,53 1 0,2809
5 20 22,59 9 56,7009
12 36 33,88 16 71,7409
11 33 10,94 9 29,9209
15 n 15 15

∑ (xi − x )( yi − y ) ∑ ( xi − x ) ∑ (y − y)
15

∑y
2 2
∑x
i =1
i i
i =1 i =1 i =1
i
i =1
= 120 = 413 = 279,53 = 118 = 763,49

171
2. Testarea semnificaţiei coeficientului de corelaţie

 Varianta 1 – cu testul Student ( t )


Etapele parcurse pentru testarea semnificaţiei coeficientului de corelaţie sunt:
1. Ipoteza nulă H 0 : ρ = 0 (coeficientul de corelaţie al colectivităţii nu este semnificativ
statistic, deci nu diferă semnificativ de zero).
2. Ipoteza alternativă H 1 : ρ > 0 (coeficientul de corelaţie al colectivităţii este semnificativ
statistic, deci mai mare semnificativ de zero).
3. Se utilizează testul t ( Student) - test unilateral dreapta
4. Se stabileşte limita de semnificaţie α = 0,05 , de unde testul t tabelar sau

teoretic tα ;n − 2 = t 0, 05;15− 2 = t 0, 05;13 = 2,16 şi regiunea de respingere Rr : dacă t c > tα ;n − 2 , atunci

H o se respinge, deci coeficientul de corelaţie este semnificativ mai mare decât zero.
5. Statistica testului:
r 0,93
tc = ⋅ n−2 = ⋅ 15 − 2 = 9,13
1− r2 1 − 0,93 2

6. Concluzia se stabileşte în funcţie de regiunea de respingere şi valoarea calculată t c , astfel:

valoarea lui t c = 9,13 cu valoarea tα ;n − 2 = 2,16 şi se observă că t c > tα ;n − 2 , deci H o se

respinge, prin urmare coeficientul de corelaţie este semnificativ statistic (fiind semnificativ
mai mare decât zero).

 Varianta 2 – cu testul Fisher Snedecor ( F )


Etapele parcurse pentru testarea semnificaţiei coeficientului de corelaţie sunt:
1. Ipoteza nulă H 0 : ρ = 0 (coeficientul de corelaţie al colectivităţii nu este semnificativ
statistic, deci nu diferă semnificativ de zero).
2. Ipoteza alternativă H 1 : ρ > 0 (coeficientul de corelaţie al colectivităţii este semnificativ
statistic, deci mai mare semnificativ de zero).
3. Se utilizează testul F (Fisher Snedecor) - test unilateral dreapta.

172
4. Se stabileşte limita de semnificaţie α = 0,05 , de unde testul F tabelar sau teoretic este

Fc = Fα ;k ;n − k −1 = F0 , 05;1;15− 2 = F0 , 05;1;13 = 4,67 şi regiunea de respingere Rr : dacă Fc > Fα ;1;n − 2 ,

atunci H o se respinge, deci coeficientul de corelaţie este semnificativ mai mare decât zero.
5. Statistica testului:
r2 0,932
Fc = ⋅ (n − 2 ) = ⋅ (15 − 2) = 83,23
1− r2 1 − 0,932
6. Concluzia se stabileşte în funcţie de relaţia: Fc > Fα ;1;n − 2 ( 83,23 > 4,67 ), deci H o se respinge,

prin urmare coeficientul de corelaţie este semnificativ statistic (fiind semnificativ mai mare
decât zero).

Exemplul 11.2.
Managerul unei structuri de primire turistică doreşte să stabilească, pe baza
unui model econometric, gradul de dependenţă a valorii încasărilor de numărul de turişti şi
durata medie a sejurului. Datele înregistrate de acesta sunt cele din tabelul (6.4).

Tabelul 11.4. Valoarea încasărilor pentru diverse durate ale sejurului şi numărul de turişti la nivelul
unei pensiuni
Valoarea încasărilor (UM) 7,4 6,7 6,0 6,3 6,8 7,9 10,5 8,8 8,4 6,3 5,9 9,5
Număr turişti (mii) 5,0 2,4 1,8 1,7 1,2 1,6 4,7 3,9 3,0 1,1 2,0 5,1
Durata medie a sejurului
4,5 3,5 4,0 4,5 5,0 5,5 6,0 6,5 5,0 4,0 4,0 4,5
(zile)

Se cere:
1. Să se stabilească direcţia şi intensitatea legăturilor dintre valoarea încasărilor,
numărul turiştilor şi durata medie a sejurului.
2. Testaţi semnificaţia coeficienţilor de corelaţie determinaţi
Rezolvare:
1. Stabilirea direcţiei şi intensităţii legăturilor dintre valoarea încasărilor, numărul
turiştilor şi durata medie a sejurului.

Relaţia de dependenţă stabilită între caracteristici este:

173
Valoarea încasărilor = f (nr. turişti, durata medie a sejurului)
Notaţii : yi - valoarea încasărilor (caracteristică dependentă)

x1i - numărul turiştilor (caracteristică independentă)

x2i - durata medie a sejurului (caracteristică independentă)


Se stabilește gradul de dependenţă al fiecărei caracteristici.
Coeficientul de corelaţie dintre valoarea încasărilor şi numărul de turişti se determină
cu valorile corespunzătoare din ultima linie a tabelului 11.5.

Tabelul 11.5. Tabelul cu algoritmul de calcul pentru coeficientul de corelaţie ( ry / x1 )

Valoarea
Număr
încasărilor
2 2
turişti (mii) x1i yi x1i yi
(UM)
x1i
yi

5,0 7,4 37,00 25,00 54,76


2,4 6,7 16,08 5,76 44,89
1,8 6,0 10,80 3,24 36,00
1,7 6,3 10,71 2,89 39,69
1,2 6,8 8,16 1,44 46,24
1,6 7,9 12,64 2,56 62,41
4,7 10,5 49,35 22,09 110,25
3,9 8,8 34,32 15,21 77,44
3,0 8,4 25,20 9,00 70,56
1,1 6,3 6,93 1,21 39,69
2,0 5,9 11,80 4,00 34,81
5,1 9,5 48,45 26,01 90,25
12 12 12 12 12

∑ x1i ∑ yi ∑x ∑x ∑y
2 2
1i y i 1i i
i =1 i =1 i =1 i =1 i =1
= 33,5 = 90,5 = 271,44 = 118,41 = 706,99

174
n n n
n∑ x1i yi − ∑ x1i ⋅ ∑ y i
i =1 i =1 i =1
ry / x1 =
 n
 n

2
  n
 n  
2

∑ x12i −  ∑ x1i   ∑ i  ∑ i  
⋅ y 2
− y
 i =1  i =1    i =1  i =1  

12 ⋅ 271,44 − 33,5 ⋅ 90,5


ry / x1 = = 0,76 rezultat care ne arată că, între
12 ⋅ 118,41 − 33,5 2 ⋅ 12 ⋅ 706,93 − 90,5 2

numărul turiştilor şi valoarea încasărilor există o legătură directă puternică, deoarece


ry / x1 ∈ (0,75 ; 0,95) .

Coeficientul de corelaţie dintre valoarea încasărilor şi durata medie a sejurului se


determină cu valorile corespunzătoare din ultima linie a tabelului 11.6:
Tabelul 11.6. Tabelul cu algoritmul de calcul pentru coeficientul de corelaţie ( ry / x2 )

Durata
Valoarea
medie a
încasărilor 2 2
sejurului x 2i y i x 2i yi
(UM)
(zile)
yi
x 2i
4,5 7,4 33,30 20,25 54,76
3,5 6,7 23,45 12,25 44,89
4,0 6,0 24,00 16,00 36,00
4,5 6,3 28,35 20,25 39,69
5,0 6,8 34,00 25,00 46,24
5,5 7,9 43,45 30,25 62,41
6,0 10,5 63,00 36,00 110,25
6,5 8,8 57,20 42,25 77,44
5,0 8,4 42,00 25,00 70,50
4,0 6,3 25,20 16,00 39,69
4,0 5,9 23,60 16,00 34,81
4,5 9,5 42,75 20,25 90,25
12 12 12 12 12

∑x ∑ yi ∑ x 2i y i ∑ x 2i ∑y
2 2
2i i
i =1 i =1 i =1 i =1 i =1
= 57,00 = 90,50 = 440,30 = 279,50 = 706,93
n n n
n ∑ x 2 i y i − ∑ x 2i ⋅ ∑ y i
i =1 i =1 i =1
ry / x 2 =
n 2  n    n 2  n
2
 
2

∑ x 2 i −  ∑ x 2i   ⋅ ∑ y i −  ∑ y i  
 i =1  i =1    i =1  i =1  

175
12 ⋅ 440,30 − 57 ⋅ 90,50
r y / x2 = = 0,71 valoare care ne indică existenţa unei
12 ⋅ 279,50 − 57 2 ⋅ 12 ⋅ 706,93 − 90,50 2

legături de intensitate medie stabilită între durata medie a sejurului şi valoarea încasărilor.
Se verifica dacă există interdependenţă între variabilele factoriale x1 (numărul turiştilor)
şi x2 (durata medie a sejurului). (tabelul 11.7)
Tabelul 11.7. Tabelul cu algoritmul de calcul pentru coeficientul de corelaţie ( rx1 ,x2 )
Durata
Număr
medie a
turişti 2 2
sejurului x1i x 2i x1i x2i
(mii)
(zile)
x1i
x 2i
5,0 4,5 22,50 25,00 20,25
2,4 3,5 8,40 5,76 12,25
1,8 4,0 7,20 3,24 16,00
1,7 4,5 7,65 2,89 20,25
1,2 5,0 6,00 1,44 25,00
1,6 5,5 8,80 2,56 30,25
4,7 6,0 28,2 22,09 36,00
3,9 6,5 25,35 15,21 42,25
3,0 5,0 15,00 9,00 25,00
1,1 4,0 4,40 1,21 16,00
2,0 4,0 8,00 4,00 16,00
5,1 4,5 22,95 26,01 20,25
12 12 12 12 12

∑x ∑x ∑ x1i x2i ∑ x1i ∑x


2 2
1i 2i 2i
i =1 i =1 i =1 i =1 i =1
= 33,50 = 57,00 = 164,45 = 118,41 = 279,50

n n n
n∑ x1i x 2 i − ∑ x1i ⋅ ∑ x 2 i
i =1 i =1 i =1
rx1x2 =
 n 2  n   n 2  n
2
 
2

∑ x1i −  ∑ x1i   ⋅ ∑ x 2 i −  ∑ x 2 i  
 i =1  i =1    i =1  i =1  

12 ⋅ 164,45 − 33,50 ⋅ 57,00


rx1x2 = = 0,36 rezultat care indică existenţa
12 ⋅ 118,41 − 33,50 2 ⋅ 12 ⋅ 279,50 − 57,00 2
unei independenţe între cei doi factori care influenţează valoarea încasărilor şi se determină
coeficientului de corelaţie liniară multiplă.
Înlocuim valorile coeficienţilor de corelaţie determinaţi şi rezultă:

176
0,76 2 + 0,712 − 2 ⋅ 0,76 ⋅ 0,71 ⋅ 0,36
R y / x1 , x2 = ry / x1 , x2 = = 0,89
1 − 0,36 2

Coeficientul de corelaţie liniară multiplă obţinut indică existenţa unei legături puternice
între valoarea încasărilor şi cei doi factori principali de influenţă (numărul turiştilor şi durata
medie a sejurului).
Studierea legăturii dintre caracteristicile factoriale (numărul turiştilor şi durata medie a
sejurului) şi cea rezultativă (valoarea încasărilor), prin utilizarea coeficienţilor de corelaţie
parţiali, presupune stabilirea gradul de influenţă a fiecărei variabile factoriale în parte, asupra
celei rezultative, în condiţiile menţinerii constante a influenţei celeilalte variabile factoriale.
Astfel, rezultă:
ry / x1 − ry / x2 ⋅ rx1x2 0,76 − 0,71 ⋅ 0,36
ry / x1 ( x2 ) = = ≅ 0,77
(1 − r )(1 − r )
2
y / x2
2
x1 x2 (1 − 0,71 )⋅ (1 − 0,36 )
2 2

In condiţiile menţinerii constante a duratei sejurului, coeficientul de corelaţie cu valoarea


ry / x1 ( x2 ) = 0,77 , ne indică influenţa puternică numărului turiştilor asupra valorii încasărilor,

deoarece ry / x1 ( x2 ) ∈ (0,75 ; 0,95) .

Dacă menţinem constant factorul x2 atunci rezultă:


ry / x2 − ry / x1 ⋅ rx1x2 0,71 − 0,76 ⋅ 0,36
ry / x2 ( x1 ) = = ≅ 0,72
(1 − r )(1 − r )
2
y / x1
2
x1 x2 (1 − 0,76 )⋅ (1 − 0,36 )
2 2

O influenţă de intensitate medie, dar destul de apropiată de cea puternică este remarcată
şi în cazul duratei medii a sejurului asupra valorii încasărilor, în condiţiile în care numărul mediu
al turiştilor s-a menţinut constant, fapt confirmat prin valoarea coeficientului de corelaţie:
ry / x2 ( x1 ) = 0,72 , deoarece ry / x2 ( x1 ) ∈ (0,5 ; 0,75) .

2. Testarea semnificaţiei coeficienţilor de corelaţie


 Varianta 1 – cu testul Student ( t )

Etapele parcurse pentru testarea semnificaţiei coeficientului de corelaţie sunt:


1. Ipoteza nulă H 0 : ρ = 0 (coeficientul de corelaţie al colectivităţii nu este semnificativ
statistic, deci nu diferă semnificativ de zero).
177
2. Ipoteza alternativă H 1 : ρ > 0 (coeficientul de corelaţie al colectivităţii este semnificativ
statistic, deci mai mare semnificativ de zero).
3. Se utilizează testul t ( Student) - test unilateral dreapta.
4. Se stabileşte limita de semnificaţie α = 0,05 , de unde testul t tabelar sau

teoretic tα ;n − 2 = t 0, 05;12− 2 = t 0, 05;10 = 2,228 şi regiunea de respingere Rr : dacă t c > tα ;n − 2 , atunci

H o se respinge, deci coeficientul de corelaţie este semnificativ mai mare decât zero.
5. Statisticile testului calculate pentru cei trei indicatori sunt:
 pentru coeficientul de corelaţie multiplă ( R y / x1 , x2 = ry / x1 , x2 = 0,89 ):

( )
t c ry / x1 , x2 =
r
⋅ n−2 =
0,89
⋅ 12 − 2 = 6,17
1− r 2
1 − 0,89 2

 pentru coeficientul de corelaţie parţial, cu factoriala x 2 constantă ( ry / x1 ( x2 ) = 0,77 )

( )
t c ry / x1 ( x2 ) =
r
⋅ n−2 =
0,77
⋅ 12 − 2 = 3,81
1− r 2
1 − 0,77 2

 pentru coeficientul de corelaţie parţial, cu factoriala x1 constantă ( ry / x2 ( x1 ) = 0,72 )

( )
t c ry / x2 ( x1 ) =
r
⋅ n−2 =
0,72
⋅ 12 − 2 = 3,28
1− r 2
1 − 0,72 2

6. Concluzia se stabileşte în funcţie de regiunea de respingere şi valoarea calculată t c , astfel:

• pentru coeficientul de corelaţie multiplă : t c (ry / x1 , x2 ) = 6,17 > 2,228 = tα ;n − 2 , deci

H o se respinge, prin urmare coeficientul de corelaţie multiplă este semnificativ


statistic (fiind semnificativ mai mare decât zero).
• pentru coeficientul de corelaţie parţial, cu factoriala x2 constantă :

( )
t c ry / x1 ( x2 ) = 3,81 > 2,228 = tα ;n − 2 , deci H o se respinge, prin urmare acest

coeficient de corelaţie parţial este semnificativ statistic (fiind semnificativ mai mare
decât zero).
• pentru coeficientul de corelaţie parţial, cu factoriala x1 constantă
: t c (ry / x2 ( x1 ) ) = 3,28 > 2,228 = tα ;n − 2 , deci H o se respinge, prin urmare acest

178
coeficient de corelaţie parţial este semnificativ statistic (fiind semnificativ mai mare
decât zero).

 Varianta 2 – testul Fisher Snedecor ( F )

Etapele parcurse pentru testarea semnificaţiei coeficientului de corelaţie sunt:


1. Ipoteza nulă H 0 : ρ = 0 (coeficientul de corelaţie al colectivităţii nu este semnificativ
statistic, deci nu diferă semnificativ de zero).
2. Ipoteza alternativă H 1 : ρ > 0 (coeficientul de corelaţie al colectivităţii este semnificativ
statistic, deci mai mare semnificativ de zero).
3. Se utilizează testul F (Fisher Snedecor) - test unilateral dreapta
4. Se stabileşte limita de semnificaţie α = 0,05 , de unde testul F tabelar sau teoretic este

Fc = Fα ;k ;n − k −1 = F0, 05;1;112 − 2 = F0, 05;1;10 = 4,96 şi regiunea de respingere Rr : dacă Fc > Fα ;1;n − 2 ,

atunci H o se respinge, deci coeficientul de corelaţie este semnificativ mai mare decât zero.
5. Statisticile testului calculate pentru cei trei indicatori sunt:
 pentru coeficientul de corelaţie multiplă ( R y / x1 , x2 = ry / x1 , x2 = 0,89 ):

( )
F ry / x1 , x2 =
r2
⋅ (n − 2 ) =
0,89 2
⋅ (12 − 2) = 38,10
1− r2 1 − 0,89 2
 pentru coeficientul de corelaţie parţial, cu factoriala x 2 constantă ( ry / x1 ( x2 ) = 0,77 ):

( )
F ry / x1 ( x2 ) =
r2
⋅ (n − 2 ) =
0,77 2
⋅ (12 − 2) = 14,56
1− r2 1 − 0,77 2
 pentru coeficientul de corelaţie parţial, cu factoriala x1 constantă ( ry / x2 ( x1 ) = 0,72 ):

( )
F ry / x2 ( x1 ) =
r2
⋅ (n − 2 ) =
0,72 2
⋅ (12 − 2) = 10,76
1− r2 1 − 0,72 2
6. Concluzia se stabileşte în funcţie de regiunea de respingere şi valoarea calculată f c , astfel:

• pentru coeficientul de corelaţie multiplă: F (ry / x1 , x2 ) = 38,10 > 4,96 = Fα ;1;n− 2 , deci

H o se respinge, prin urmare coeficientul de corelaţie multiplă este semnificativ


statistic (fiind semnificativ mai mare decât zero).

179
• pentru coeficientul de corelaţie parţial, cu factoriala x2 constantă
: F (ry / x1 ( x2 ) ) = 14,56 > 4,96 = Fα ;1;n − 2 , deci H o se respinge, prin urmare acest

coeficient de corelaţie parţial este semnificativ statistic (fiind semnificativ mai mare
decât zero).
• pentru coeficientul de corelaţie parţial, cu factoriala x1 constantă
: F (ry / x2 ( x1 ) ) = 10,76 > 4,96 = Fα ;1;n − 2 , deci H o se respinge, deci H o se respinge,

prin urmare acest coeficient de corelaţie parţial este semnificativ statistic (fiind
semnificativ mai mare decât zero).

Lucrare de verificare 11A

1. Ce presupune utilizarea metodei regresiei?


2. Care esete elementul fundamental în cadrul metodei regresiei?
3. Cum se validează modelul de regresie?
4. Care sunt etapele parcurse pentru testarea semnificaţiei coeficientului de corelaţie?
5. Care sunt ipotezele modelului unifactorial de regresie liniară?

Test de autoevaluare 11B

1. Metoda regresiei este metoda prin care


a. se poate explica forma legăturii (liniara, curbilinie);
b. se poate previziona nivelul unui factor în funcție de valorile altor factori;
c. se poate stabili omogenitatea factorilor și legăturilor;
d. se poate previziona forma legăturii (liniara, curbilinie).
A: c; B: a,b; C: a,b,c; D:a,c.

2. Validarea modelului de regresie


a. se realizeaza aplicînd testul Z;
b. se realizeaza aplicând testul Fisher-Snedecor (testul F);
c. se realizeaza aplicând testul T;

180
d. se realizează aplicând testul Student.

3. Legăturile multiple studiază:


a. dependența dintre o variabila cauzală x și o variabilă y, unde y = f(x);
b. dependența dintre o caracteristică dependentă y și două sau mai multe
caracteristici independente;
c. dependența dintre două variabile;
d. idependența dintre mai multe variabile.

4. Legăturile directe există în cazul în care:


a. coeficientul de regresie este negativ;
b. cele două caracteristici se modifică în sens invers;
c. coeficientul de determinație este negativ;
d. caracteristica dependentă se modifică în același sens cu caracteristica
independentă.

5. Pentru a analiza dependența dintre venituri și cheltuieli s-au înregistrat date


referitoare la aceste variabile pentru 10 gospodării, astfel:
Venituri
1,3 1,7 3,0 3,0 1,8 2,0 1,2 3,2 3,8 1,3
(mii lei)
Cheltuieli
1,0 1,3 2,7 2,2 1,1 1,0 2,0 2,5 3,2 1,0
(mii lei)

În urma aplicării modelului de regresie putem spune că:


a. legătura dintre venituri și cheltuieli este una de intensitate medie (R=0,72);
b. legătura dintre venituri și cheltuieli este una de intensitate puternică (R=0,85);
c. legătura dintre venituri și cheltuieli este una de intensitate medie (R=0,69);
d. legătura dintre venituri și cheltuieli este una de intensitate foarte puternică
(R=0,96);

6. Se cunosc informații despre prețul a 5 case vândute în Ploiești, în zona de Sud, în anul
2012 și suprafața locuibilă a acestora.
Suprafața locuită 1,6 1,7 1,9 2,05 2,27
Prețul 2,5 2,6 2,7 2,7 2,8

181
Ecuația de regresie este:
a. Y=0,41+1,89 X
b. Y=0,32+1,22 X
c. Y=1,88+0,41 X
d. Y=2,33+1,56 X

7. Se cunosc informații despre prețul a 5 case vândute în Ploiești, în zona de Sud, în anul
2012 și suprafața locuibilă a acestora.
Suprafața locuită 1,6 1,7 1,9 2,05 2,27
Prețul 2,5 2,6 2,7 2,7 2,8

În urma prelucrării datelor și specificării ecuației de regresie, se testează validitatea


modelului pentru un nivel de semnificație de 5%. În concluzie putem spune că:
a. modelul este valid și între cele două variabile există o legătură de intensitate
puternică;
b. modelul nu este valid;
c. modelul este valid și între cele două variabile există o legătură de intensitate
foarte puternică;
d. modelul este valid și și între cele două variabile există o legătură de intensitate
slabă;

8. Se cunosc informații cu privire la notele obținute de 10 studenți la disciplina


econometrie, precum și numărul de absențe acumulate de aceștia.
X (Nr absente) 8 3 0 5 2 4 1 3 5 1
Y (Nota) 4 8 10 6 8 7 9 9 5 10

Ecuația de regresie este:


a. Y=1,22+0,8178X
b. Y=-10,22+0,82X
c. Y= 10,22-0,8178X
d. Y=2.22-1,2X

182
9. Se cunosc informații cu privire la notele obținute de 10 studenți la disciplina
econometrie, precum și numărul de absențe acumulate de aceștia.
X (Nr absente) 8 3 0 5 2 4 1 3 5 1
Y (Nota) 4 8 10 6 8 7 9 9 5 10

În urma prelucrării datelor și specificării ecuației de regresie, se testează validitatea


modelului pentru un nivel de semnificație de 5%. În concluzie putem spune că:
a. modelul este valid și între cele două variabile există o legătură de intensitate
puternică;
b. modelul nu este valid;
c. modelul este valid și între cele două variabile există o legătură de intensitate
medie;
d. modelul este valid și și între cele două variabile există o legătură de intensitate
slabă;

10. Se cunosc informatii cu privire la profitul si cheltuielile cu publicitatea pentru 5 firme


din judetul Prahova.
X (CHELTUIELI CU
35 36 34 32 27
PUBLICITATEA)
Y (PROFIT) 28 29 28 26 27

Ecuația de regresie este:


a. Y=20,76+0,21X
b. Y=20,76+0,21X
c. Y= 20,76+0,21X
d. Y=0,21+20,76X

Rezumat
Metoda regresiei este fundamentată pe măsurarea şi previzionarea influenţei pe care unul
sau mai mulţi factori o poate avea asupra evoluţiei unui fenomen sau proces economic. În cazul
modelului liniar unifactorial numărul factorilor este egal cu 1. Deoarece, în cadrul metodei apar
valori perechi de variabile utilizate şi parametri corespunzători acestora sub forma mediilor,

183
dispersiilor, abaterilor standard, etc, aceasta reprezintă o componentă a metodelor parametrice de
măsurare şi analiză a legăturilor formate în cadrul derulării unor procese sau fenomene
economice.
Forma generală a modelului ce reflectă influenţa factorului x asupra rezultativei y

este Yi = α + β xi + ε i . Notând cu Yˆ înfluenţa factorului determinist asupra variabilei

rezultative Y , modelul devine Yi = Yˆi + ε i unde Yˆi = α + β xi .

Estimarea parametrilor (a, b ) se poate realiza prin aplicarea unei metode statistico-
matematice, cum ar fi: metoda celor mai mici pătrate, metodele bayesiene, metoda verosimilităţii
maxime.
Testarea validităţii modelului şi a semnificaţiei statistice a parametrilor acestuia se
efectuează cu ajutorul ANOVA. De asemenea se determină şi se testează raportul de corelaţie şi
coeficientul de detrminaţie.

Bibliografie

Gogonea R.M., Zaharia Econometrie cu aplicaţii în activitatea de comerţ-turism-


M. servicii, Editura Universitară, Bucureşti, 2008,

Oprea C., Zaharia M. Elemente de analiza datelor și modelare utilizând Excel,


Editura Universitară, Bucureşti, 2011

Voineagu V, Ţiţan E., Teorie şi practică econometrică, Editura Meteor Press,


Şerban R., Ghiţă S., 2007
Tudose D., Boboc C.,
Pele D.

184
Răspunsuri la testele de autoevaluare

Test de autoevaluare 1B 9. c;
1. a; 10. c.
2. A: a+b+c;
Test de autoevaluare 4B
3. a;
1. c;
4. b;
2. c;
5. b;
3. a;
6. d;
4. a;
7. c;
5. b;
8. b;
6. c;
9. a;
7. c;
10. a.
8. a;
Test de autoevaluare 2B 9. d;
1. b; 10. a.
2. b;
Test de autoevaluare 5B
3. c;
1. a;
4. b;
2. a;
5. d.
3. a;
Test de autoevaluare 3B 4. b;
1. d; 5. a;
2. a; 6. A;
3. c; 7. b;
4. b; 8. d;
5. b; 9. c;
6. a; 10. b.
7. b;
8. a;

185
2. b

Test de autoevaluare 6B 3. c
4. d
1. a;
2. a; Test de autoevaluare 10B
3. b; 1. d
4. b; 2. a
5. d; 3. C
6. b; 4. b
7. b; 5. c
8. c; 6. b
9. b;
10. a.
Test de autoevaluare 11B
Test de autoevaluare 7B
1. B
1. b;
2. b
2. c;
3. b
3. a;
4. d
4. c;
5. b
5. a;
6. a
6. c;
7. c
7. c;
8. c
8. b.
9. a
Test de autoevaluare 8B 10. a
1. b;
2. b;
3. a;
4. d;
5. c.

Test de autoevaluare 9B
1. b

186
Anexa 1

Distribuţia normală.
x2
z 1 −
Funcţia integrală a lui Laplace Φ (z ) = ∫ e 2 dx
0 2π

z Ф(z) z Ф(z) z Ф(z) z Ф(z) z Ф(z)

0,00 0,00000 0,30 0,11790 0,60 0,22575 0,90 0,31595 1,20 0,38495

0,01 0,00400 0,31 0,12170 0,61 0,22905 0,91 0,31860 1,21 0,38685

0,02 0,00800 0,32 0,12550 0,62 0,23235 0,92 0,32120 1,22 0,38875

0,03 0,01195 0,33 0,12930 0,63 0,23565 0,93 0,32380 1,23 0,39065

0,04 0,01595 0,34 0,13305 0,64 0,23890 0,94 0,32640 1,24 0,39250

0,05 0,01995 0,35 0,13685 0,65 0,24215 0,95 0,32895 1,25 0,39435

0,06 0,02390 0,36 0,14060 0,66 0,24535 0,96 0,33145 1,26 0,39615

0,07 0,02790 0,37 0,14430 0,67 0,24855 0,97 0,33400 1,27 0,39795

0,08 0,03190 0,38 0,14805 0,68 0,25175 0,98 0,33645 1,28 0,39975

0,09 0,03585 0,39 0,15175 0,69 0,25490 0,99 0,33890 1,29 0,40150

0,10 0,03985 0,40 0,15540 0,70 0,25805 1,00 0,34135 1,30 0,40320

0,11 0,04380 0,41 0,15910 0,71 0,26115 1,01 0,34375 1,31 0,40490

0,12 0,04775 0,42 0,16275 0,72 0,26425 1,02 0,34615 1,32 0,40660

0,13 0,05170 0,43 0,16640 0,73 0,26730 1,03 0,34850 1,33 0,40825

0,14 0,05565 0,44 0,17005 0,74 0,27035 1,04 0,35085 1,34 0,40990

0,15 0,05960 0,45 0,17365 0,75 0,27335 1,05 0,35315 1,35 0,41150

0,16 0,06355 0,46 0,17725 0,76 0,27635 1,06 0,35545 1,36 0,41310

0,17 0,06750 0,47 0,18130 0,77 0,27935 1,07 0,35770 1,37 0,41465

187
z Ф(z) z Ф(z) z Ф(z) z Ф(z) z Ф(z)

0,18 0,07140 0,48 0,18440 0,78 0,28230 1,08 0,35995 1,38 0,41620

0,19 0,07535 0,49 0,18795 0,79 0,28525 1,09 0,36215 1,39 0,41775

0,20 0,07925 0,50 0,19145 0,80 0,28815 1,10 0,36435 1,40 0,41925

0,21 0,08315 0,51 0,19495 0,81 0,29105 1,11 0,36650 1,41 0,42075

0,22 0,08705 0,52 0,19845 0,82 0,29390 1,12 0,36875 1,42 0,42220

0,23 0,09095 0,53 0,20195 0,83 0,29675 1,13 0,37075 1,43 0,42365

0,24 0,09485 0,54 0,20540 0,84 0,29955 1,14 0,37285 1,44 0,42505

0,25 0,09870 0,55 0,20885 0,85 0,30235 1,15 0,37495 1,45 0,42645

0,26 0,10255 0,56 0,21225 0,86 0,30510 1,16 0,37700 1,46 0,42785

0,27 0,10640 0,57 0,21565 0,87 0,30785 1,17 0,37800 1,47 0,42920

0,28 0,11025 0,58 0,21655 0,88 0,31055 1,18 0,38100 1,48 0,43055

0,29 0,11410 0,59 0,22240 0,89 0,31325 1,19 0,38300 1,49 0,43190

188
Distribuţia normală

x2
z 1 −
Funcţia integrală a lui Laplace Φ (z ) = ∫ e 2 dx (continuare)
0 2π

z Ф(z) z Ф(z) z Ф(z) z Ф(z) z Ф(z)

1,50 0,43320 1,72 0,45730 1,94 0,47380 2,32 0,48985 2,76 0,49710

1,51 0,43450 1,73 0,45820 1,95 0,47440 2,34 0,49035 2,78 0,49730

1,52 0,43575 1,74 0,45905 1,96 0,47500 2,36 0,49085 2,80 0,49745

1,53 0,43700 1,75 0,45995 1,97 0,47560 2,38 0,49135 2,82 0,49760

1,54 0,43820 1,76 0,46080 1,98 0,47615 2,40 0,49180 2,84 0,49775

1,55 0,43945 1,77 0,46165 1,99 0,47670 2,42 0,49225 2,86 0,49790

1,56 0,44060 1,78 0,46245 2,00 0,47725 2,44 0,49265 2,88 0,49800

1,57 0,44180 1,79 0,46325 2,02 0,47830 2,46 0,49305 2,90 0,49810

1,58 0,44295 1,80 0,46405 2,04 0,47935 2,48 0,49345 2,92 0,49825

1,59 0,44410 1,81 0,46485 2,06 0,48030 2,50 0,49380 2,94 0,49835

1,60 0,44520 1,82 0,46560 2,08 0,48125 2,52 0,49415 2,96 0,49845

1,61 0,44630 1,83 0,46640 2,10 0,48215 2,54 0,49445 2,98 0,49855

1,62 0,44740 1,84 0,46710 2,12 0,48300 2,56 0,49475 3,00 0,49865

1,63 0,44845 1,85 0,46785 2,14 0,48380 2,58 0,49505 3,20 0,49930

1,64 0,44950 1,86 0,46855 2,16 0,48460 2,60 0,49535 3,40 0,49965

1,65 0,45055 1,87 0,46925 2,18 0,48535 2,62 0,49560 3,60 0,49984

1,66 0,45155 1,88 0,46995 2,20 0,48610 2,64 0,49585 3,80 0,49993

1,67 0,45255 1,89 0,47060 2,22 0,48670 2,66 0,49610 4,00 0,49996

1,68 0,45350 1,90 0,47130 2,24 0,48745 2,68 0,49630 4,50 0,49999

1,69 0,45450 1,91 0,47195 2,26 0,48810 2,70 0,49655 5,00 0,50000

1,70 0,45545 1,92 0,47270 2,28 0,48870 2,72 0,49675

1,71 0,45635 1,93 0,47320 2,30 0,48930 2,74 0,49695

189
Anexa 2

Distribuţia χ
2

Funcţie de probabilitatea P ( χ 2 > χα2 ) = δ

α
0,990 0,975 0,950 0,900 0,100
l

1 0,0002 0,001 0,0039 0,0158 2,71

2 0,02 0,05 0,10 0,21 4,61

3 0,12 0,22 0,35 0,58 6,25

4 0,30 0,48 0,71 1,06 7,78

5 0,55 0,83 1,15 1,61 9,24

6 0,87 1,24 1,64 2,20 10,64

7 1,24 1,69 2,17 2,83 12,02

8 1,65 2,18 2,73 3,49 13,36

9 2,09 2,70 3,33 4,17 14,68

10 2,56 3,25 3,94 4,87 15,99

11 3,05 3,82 4,57 5,58 17,27

12 3,57 4,40 5,23 6,30 18,55

13 4,11 5,01 5,89 7,04 19,81

14 4,66 5,63 6,57 7,79 21,06

15 5,23 6,26 7,26 8,55 22,31

16 5,81 6,91 7,96 9,31 23,54

17 6,41 7,56 8,67 10,08 24,77

18 7,01 8,23 9,39 10,86 25,99

19 7,63 8,91 10,12 11,65 27,20

20 8,26 9,59 10,85 12,44 28,41

190
α
0,990 0,975 0,950 0,900 0,100
l

21 8,90 10,28 11,59 13,24 29,61

22 9,54 10,98 12,34 14,04 30,81

23 10,20 11,69 13,09 14,85 32,01

24 10,86 12,40 13,85 15,66 33,20

25 11,52 13,12 14,61 16,47 34,38

26 12,20 13,84 15,38 17,29 35,56

27 12,88 14,57 16,15 18,11 36,74

28 13,57 15,31 16,93 18,94 37,92

29 14,26 16,05 17,71 19,77 39,09

30 14,95 16,79 18,49 20,60 40,26

191
Distribuţia χ2
Funcţie de probabilitatea P( χ 2 > χα2 ) = δ

(continuare)
α
0,050 0,025 0,010 0,001
l

1 3,84 5,02 6,63 10,83

2 5,99 7,38 9,21 13,82

3 7,81 9,35 11,34 16,27

4 9,49 11,14 13,28 18,47

5 11,07 12,83 15,09 20,52

6 12,59 14,45 16,81 22,46

7 14,07 16,01 18,47 24,32

8 15,51 17,53 20,09 26,13

9 16,92 19,02 21,67 27,88

10 18,31 20,48 23,21 29,59

11 19,67 21,92 24,72 31,26

12 21,03 23,34 26,22 32,91

13 22,36 24,74 27,69 34,53

14 23,68 26,12 29,14 36,12

15 25,00 27,49 30,58 37,70

16 26,30 28,84 32,00 39,25

17 27,59 30,19 33,41 40,79

18 28,87 31,53 34,80 42,31

19 30,14 32,85 36,19 43,82

20 31,41 34,17 37,57 45,32

192
α
0,050 0,025 0,010 0,001
l

21 32,67 35,48 38,93 46,80

22 33,92 36,78 40,29 48,27

23 35,17 38,08 41,64 49,73

24 36,41 39,37 42,98 51,18

25 37,65 40,65 44,31 52,62

26 38,88 41,92 45,64 54,05

27 40,11 43,19 46,96 55,48

28 41,34 44,46 48,28 56,89

29 42,56 45,72 49,59 58,30

30 43,77 46,98 50,89 59,70

193
Anexa 3

Distribuţia Student (t )

Funcţia P(t ≤ tα ) şi numărul l al gradelor de libertate

Nivel de semnificaţie pentru testul bilateral

α
0,50 0,20 0,10 0,05 0,02
l

1 1,000 3,078 6,314 31,821


12,706
2 0,816 1,886 2,920 4,303 6,965

3 0,765 1,638 2,353 3,482 4,541

4 0,741 1,533 2,132 2,776 3,747

5 0,727 1,476 2,015 2,571 3,365

6 0,718 1,440 1,943 2,447 3,143

7 0,711 1,415 1,895 2,365 2,998

8 0,706 1,397 1,860 2,306 2,896

9 0,703 1,383 1,833 2,262 2,821

10 0,700 1,372 1,812 2,228 2,764

11 0,697 1,363 1,796 2,201 2,718

12 0,695 1,356 1,782 2,179 2,681

13 0,694 1,350 1,771 2,160 2,650

14 0,692 1,345 1,761 2,145 2,624

15 0,691 1,341 1,753 2,131 2,602

16 0,690 1,337 1,746 2,120 2,583

17 0,689 1,333 1,740 2,110 2,567

18 0,688 1,330 1,734 2,101 2,552

194
Nivel de semnificaţie pentru testul bilateral

α
0,50 0,20 0,10 0,05 0,02
l

19 0,688 1,328 1,729 2,093 2,539

20 0,687 1,325 1,725 2,086 2,528

α 0,25 0,10 0,05 0,025 0,01

l Nivel de semnificaţie pentru testul unilateral

195
Distribuţia Student (t )
Funcţia P(t ≤ tα ) şi numărul l al gradelor de libertate

(continuare)
α Nivel de semnificaţie pentru testul bilateral

l 0,50 0,20 0,10 0,05 0,02

21 0,686 1,323 1,721 2,080 2,518

22 0,686 1,321 1,717 2,074 2,508

23 0,685 1,319 1,714 2,069 2,500

24 0,685 1,318 1,711 2,064 2,492

25 0,684 1,316 1,708 2,060 2,485

26 0,684 1,315 1,706 2,056 2,479

27 0,684 1,314 1,703 2,052 2,473

28 0,683 1,313 1,701 2,048 2,467

29 0,683 1,312 1,699 2,045 2,462

30 0,683 1,310 1,697 2,042 2,457

35 0,682 1,306 1,690 2,030 2,438

40 0,681 1,303 1,684 2,021 2,423

45 0,680 1,301 1,679 2,014 2,412

50 0,679 1,299 1,676 2,009 2,403

60 0,679 1,296 1,671 2,000 2,390

70 0,678 1,294 1,667 1,994 2,381

80 0,678 1,292 1,664 1,990 2,374

90 0,677 1,291 1,662 1,987 2,368

100 0,677 1,290 1,660 1,984 2,364

196
α Nivel de semnificaţie pentru testul bilateral

l 0,50 0,20 0,10 0,05 0,02

120 0,677 1,289 1,658 1,980 2,358

200 0,676 1,286 1,653 1,972 2,345

500 0,675 1,283 1,648 1,965 2,334

1000 0,675 1,282 1,646 1,962 2,330

∞ 0,675 1,282 1,645 1,960 2,326

α
0,25 0,10 0,05 0,025 0,01
. ƒ

Nivel de semnificaţie pentru testul unilateral

197
Distribuţia Student (t )

Funcţia P(t ≤ tα ) şi numărul l al gradelor de libertate

(continuare)

Nivel de semnificaţie pentru testul bilateral

α
0,01 0,002 0,001 0,0001
l

1 63,657 318,309 636,618


6366,198

2 9,925 22,327 31,598 99,992

3 5,841 10,214 12,924 28,000

4 4,604 7,173 8,610 15,544

5 4,032 5,893 6,869 11,178

6 3,707 5,208 5,959 9,082

7 3,499 4,785 5,408 7,885

8 3,355 4,501 5,041 7,120

9 3,250 4,297 4,781 6,594

10 3,169 4,144 4,587 6,211

11 3,106 4,025 4,437 5,921

12 3,055 3,930 4,318 5,694

13 3,102 3,852 4,221 5,513

14 2,977 3,787 4,140 5,363

15 2,947 3,733 4,073 5,239

16 2,921 3,686 4,015 5,134

198
17 2,898 3,646 3,965 5,014

α
0,01 0,002 0,001 0,0001
l

18 2,878 3,610 3,922 4,966

19 2,861 3,579 3,883 4,897

20 2,845 3,552 3,850 4,837

α 0,005 0,001 0,0005 0,00005

l Nivel de semnificaţie pentru testul unilateral

199
Distribuţia Student (t )

Funcţia P(t ≤ tα ) şi numărul l al gradelor de libertate

(continuare)
Nivel de semnificaţie pentru testul bilateral

α
0,01 0,002 0,001 0,0001
l

21 2,831 3,527 3,819 4,784

22 2,819 3,505 3,792 4,736

23 2,807 3,485 3,767 4,693

24 2,797 3,467 3,745 4,654

25 2,787 3,450 3,725 4,619

26 2,779 3,435 3,707 4,587

27 2,771 3,421 3,690 4,558

28 2,763 3,408 3,674 4,530

29 2,756 3,396 3,659 4,506

30 2,750 3,385 3,646 4,482

35 2,724 3,340 3,591 4,389

40 2,704 3,307 3,551 4,321

45 2,690 3,281 3,520 4,269

50 2,678 3,261 3,496 4,288

60 2,660 3,232 3,460 4,169

70 2,648 3,211 3,435 4,127

80 2,639 3,195 3,416 4,096

90 2,632 3,183 3,402 4,072

200
α
0,01 0,002 0,001 0,0001
l

100 2,626 3,174 3,390 4,053

120 2,617 3,160 3,373 4,025

200 2,601 3,131 3,340 3,970

500 2,586 3,107 3,310 3,922

1000 2,581 3,098 3,300 3,906

∞ 2,576 3,090 3,290 3,891

α
0,005 0,001 0,0005 0,00005
l

Nivel de semnificaţie pentru testul unilateral

201
Anexa 4

Distribuţia Fisher-Snedecor (F )

Valorile funcţiei F pentru I 1 şi I 2 grade de libertate şi α = 0,05 nivelul de semnificaţie


I1 1 2 3 4 5
I2
1 161,4 199,5 215,7 224,6 230,2

2 18,51 19,00 19,16 19,25 19,30

3 10,13 9,55 9,28 9,12 9,01

4 7,71 6,94 6,59 6,39 6,26

5 6,61 5,79 5,41 5,19 5,05

6 5,99 5,14 4,76 4,53 4,39

7 5,58 4,74 4,35 4,12 3,97

8 5,32 4,46 4,07 3,84 3,69

9 5,12 4,26 3,86 3,63 3,48

10 4,96 4,10 3,71 3,48 3,33

11 4,84 3,98 3,59 3,36 3,20

12 4,75 3,88 3,49 3,26 3,11

13 4,67 3,80 3,41 3,18 3,02

14 4,60 3,74 3,34 3,11 2,96

15 4,54 3,68 3,29 3,06 2,90

16 4,49 3,63 3,24 3,01 2,85

17 4,45 3,59 3,20 2,96 2,81

18 4,41 3,55 3,16 2,93 2,77

19 4,38 3,52 3,13 2,90 2,74

20 4,35 3,49 3,10 2,87 2,71

21 4,32 3,47 3,07 2,84 2,68

202
22 4,30 3,44 3,05 2,92 2,66

I1 1 2 3 4 5
I2
23 4,28 3,42 3,03 2,80 2,64

24 4,26 3,40 3,01 2,78 2,62

25 4,24 3,38 2,99 2,76 2,60

26 4,22 3,37 2,98 2,74 2,59

27 4,21 3,35 2,96 2,73 2,57

28 4,20 3,34 2,95 2,71 2,56

29 4,18 3,33 2,93 2,70 2,54

30 4,17 3,32 2,92 2,69 2,53

40 4,08 3,23 2,84 2,61 2,45

60 4,00 3,15 2,70 2,52 2,37

120 3,92 3,07 2,68 2,45 2,29

4,84 2,99 2,60 2,37 2,21


203
Distribuţia Fisher-Snedecor (F )

Valorile funcţiei F pentru I 1 şi I 2 grade de libertate şi α = 0,05 nivel de semnificaţie


(continuare)
I1 . a 6 7 8 12
I2 ∞

1 234,0 238,9 213,9 249,0 254,3

2 19,33 19,37 19,41 19,45 19,50

3 8,94 8,84 8,71 8,64 8,53

4 6,16 6,04 5,91 5,77 5,63

5 4,95 4,82 4,68 4,53 4,36

6 4,28 4,15 4,00 3,84 3,67

7 3,87 3,73 3,57 3,41 3,23

8 3,58 3,28 3,12 2,93


3,44
9 3,37 3,23 3,07 2,90 2,71

10 3,22 3,07 2,91 2,74 2,54

11 3,09 2,95 2,79 2,61 2,40

12 3,00 2,85 2,69 2,50 2,30

13 2,92 2,77 2,60 2,42 2,21

14 2,85 2,70 2,53 2,35 2,13

15 2,79 2,64 2,48 2,29 2,07

16 2,74 2,59 2,42 2,24 2,01

17 2,70 2,55 2,38 2,19 1,96

18 2,66 2,51 2,34 2,15 1,92

19 2,63 2,48 2,31 2,11 1,88

20 2,60 2,45 2,28 2,08 1,84

21 2,57 2,42 2,25 2,05 1,81

204
22 2,55 2,40 2,23 2,03 1,78

I1 . a 6 7 8 12
I2 ∞

23 2,53 2,38 2,20 2,00 1,76

24 2,51 2,36 2,18 1,98 1,73

25 2,49 2,34 2,16 1,96 1,71

26 2,47 2,32 2,15 1,95 1,69

27 2,46 2,30 2,13 1,93 1,67

28 2,44 2,29 2,12 1,91 1,65

29 2,43 2,28 2,10 1,90 1,64

30 2,42 2,27 2,09 1,89 1,62

40 2,34 2,18 2,00 1,79 1,51

60 2,25 2,10 1,92 1,70 1,39

120 2,17 2,02 1,83 1,61 1,25

2,09 1,94 1,75 1,52 1,00


205
Distribuţia Fisher-Snedecor (F )

Valorile funcţiei F pentru I 1 şi I 2 grade de libertate şi α = 0,01nivelul de semnificaţie


I1 1 2 3 4 5
I2
1 4052 4999 5403 5625 5764

2 98,49 99,00 99,17 99,25 99,30

3 34,12 30,81 29,46 28,71 28,24

4 21,20 18,00 16,69 15,98 15,52

5 16,26 13,27 12,06 11,39 10,97

6 13,74 10,92 9,78 9,15 8,75

7 12,25 9,55 8,45 7,85 7,46

8 11,26 8,65 7,59 7,01 6,63

9 10,56 8,02 6,99 6,42 6,06

10 10,04 7,56 6,55 5,99 5,64

11 9,65 7,20 6,22 5,67 5,32

12 9,33 6,93 5,95 5,41 5,06

13 9,07 6,70 5,74 5,20 4,86

14 8,86 6,51 5,56 5,03 4,69

15 8,68 6,36 5,42 4,89 4,56

16 8,53 6,23 5,29 4,77 4,44

17 8,40 6,11 5,18 4,67 4,34

18 8,28 6,01 5,09 4,58 4,25

19 8,18 5,93 5,01 4,50 4,17

20 8,10 5,85 4,94 4,43 4,10

21 8,02 5,78 4,87 4,37 4,04

22 7,94 5,72 4,82 4,31 3,99

206
23 7,88 5,66 4,76 4,26 3,94

I1 1 2 3 4 5
I2
24 7,82 5,61 4,72 4,22 3,90

25 7,77 5,57 4,68 4,18 3,86

26 7,72 5,53 4,64 4,14 3,82

27 7,68 5,49 4,60 4,11 3,78

28 7,64 5,45 4,57 4,07 3,75

29 7,60 5,42 4,54 4,04 3,73

30 7,56 5,39 4,51 4,02 3,70

40 7,31 5,18 4,31 3,83 3,51

60 7,08 4,98 4,13 3,65 3,34

120 6,85 4,79 3,96 3,48 3,17

6,64 4,60 3,78 3,32 3,02


207
Distribuţia Fisher-Snedecor (F )

Valorile funcţiei F pentru I 1 şi I 2 grade de libertate şi α = 0,01nivel de semnificaţie


(continuare)
I1 . a 6 8 12 24
I2 ∞

1 5859 5981 6106 6234 6366

2 99,33 99,36 99,42 99,46 99,50

3 27,91 27,49 27,05 26,60 26,12

4 15,21 14,80 14,37 13,93 13,46

5 10,67 10,27 9,89 9,47 9,02

6 8,47 8,10 7,72 7,31 6,88

7 7,19 6,84 6,47 6,07 5,65

8 6,37 5,67 5,28 4,86


6,03
9 5,80 5,47 5,11 4,73 4,31

10 5,39 5,06 4,71 4,33 3,91

11 5,07 4,74 4,40 4,02 3,60

12 4,82 4,50 4,16 3,78 3,36

13 4,62 4,30 3,96 3,59 3,16

14 4,46 4,14 3,80 3,43 3,00

15 4,32 4,00 3,67 3,29 2,87

16 4,20 3,89 3,55 3,18 2,75

17 4,10 3,79 3,45 3,08 2,65

18 4,01 3,71 3,37 3,00 2,57

19 3,94 3,63 3,30 2,92 2,49

20 3,87 3,56 3,23 2,86 2,42

21 3,81 3,51 3,17 2,80 2,36

208
22 3,76 3,45 3,12 2,75 2,31

I1 . a 6 8 12 24
I2 ∞

23 3,71 3,41 3,07 2,70 2,26

24 3,67 3,36 3,03 2,66 2,21

25 3,63 3,32 2,99 2,62 2,17

26 3,59 3,29 2,96 2,58 2,13

27 3,56 3,26 2,93 2,55 2,10

28 3,53 3,23 2,90 2,52 2,06

29 3,50 3,20 2,87 2,49 2,03

30 3,47 3,17 2,84 2,47 2,01

40 3,29 2,99 2,66 2,29 1,80

60 3,12 2,82 2,50 2,12 1,60

120 2,96 2,66 2,34 1,95 1,38

2,80 2,51 2,18 1,79 1,00


209
Distribuţia Fisher-Snedecor (F )

Valorile funcţiei F pentru I 1 şi I 2 grade de libertate şi α = 0,001nivelul de semnificaţie


I1 1 2 3 4 5
I2
1 405282 500000 540379 562500 576405

2 998,5 999,0 999,2 999,2 999,3

3 167,5 148,5 141,1 137,1 134,6

4 74,14 61,25 56,18 53,44 51,71

5 47,04 36,61 33,20 31,09 29,75

6 35,51 27,00 23,70 21,90 20,81

7 29,22 21,69 18,77 17,19 16,21

8 25,42 18,49 15,83 14,39 13,49

9 22,86 16,39 13,90 12,56 11,71

10 21,04 14,91 12,55 11,28 10,48

11 19,69 13,81 11,56 10,35 9,58

12 18,64 12,97 10,80 9,63 8,89

13 17,81 12,31 10,21 9,07 8,35

14 17,14 11,78 9,73 8,62 7,92

15 16,59 11,34 9,34 8,25 7,57

16 16,12 10,97 9,00 7,94 7,27

17 15,72 10,66 8,73 7,68 7,02

18 15,38 10,39 8,49 7,46 6,81

19 15,08 10,16 8,28 7,26 6,61

20 14,82 9,95 8,10 7,10 6,46

21 14,59 9,77 7,94 6,95 6,32

210
22 14,38 9,61 7,80 6,81 6,19

I1 1 2 3 4 5
I2
23 14,19 9,47 7,67 6,67 6,08

24 14,03 9,34 7,55 6,59 5,98

25 13,88 9,22 7,45 6,49 5,88

26 13,74 9,12 7,36 6,41 5,80

27 13,61 9,02 7,27 6,33 5,73

28 13,50 8,93 7,19 6,25 5,66

29 13,39 8,85 7,12 6,19 5,59

30 13,29 8,77 7,05 6,12 5,53

40 12,61 8,25 6,60 5,70 5,13

60 11,97 7,76 6,17 5,31 4,76

120 11,38 7,31 5,79 4,95 4,42

10,83 6,91 5,42 4,62 4,10


211
Distribuţia Fisher-Snedecor (F )

Valorile funcţiei F pentru I 1 şi I 2 grade de libertate şi α = 0,001nivel de semnificaţie


(continuare)
I1 . a 6 8 12 24
I2 ∞

1 585937 598144 610667 623497 636619

2 999,3 999,4 999,4 999,5 999,5

3 132,8 130,6 128,3 125,9 123,5

4 50,53 49,00 47,41 45,7 44,05

5 28,84 27,64 26,42 25,14 23,78

6 20,03 19,03 17,99 16,89 15,75

7 15,52 14,63 13,71 12,73 11,69

8 12,86 11,19 10,30 9,34


12,04
9 11,13 10,37 9,57 8,72 7,81

10 9,92 9,20 8,45 7,64 7,76

11 9,05 8,35 7,63 6,85 6,00

12 8,38 7,71 7,00 6,25 5,42

13 7,86 7,21 6,52 5,78 4,97

14 7,43 6,80 6,13 5,41 4,60

15 7,09 6,47 5,81 5,10 4,31

16 6,81 6,19 5,55 4,85 4,06

17 6,56 5,96 5,32 4,63 3,85

18 6,35 5,76 5,13 4,45 3,67

19 6,18 5,59 4,97 4,29 3,52

20 6,02 5,44 4,82 4,15 3,38

21 5,88 5,31 4,71 4,03 3,26

212
22 5,76 5,19 4,58 3,92 3,15

I1 . a 6 8 12 24
I2 ∞

23 5,65 5,09 4,48 3,82 3,05

24 5,55 4,99 4,39 3,74 2,97

25 5,46 4,91 4,31 3,66 2,89

26 5,38 4,83 4,24 3,59 2,82

27 5,31 4,76 4,17 3,52 2,75

28 5,24 4,69 4,11 3,46 2,70

29 5,18 4,64 4,05 3,41 2,64

30 5,12 4,58 4,00 3,36 2,59

40 4,73 4,21 3,64 3,01 2,23

60 4,37 3,87 3,31 2,69 1,90

120 4,04 3,55 3,02 2,40 1,56

3,74 3,27 2,74 2,13 1,00


213
Bibliografie

Andrei T. Statistică şi econometrie, Editura Economică, Bucureşti,


2003

Bădiţă M., Baron T., Statistică pentru afaceri, Editura Eficient, Bucureşti, 1998
Korka M.
Bădiţă M., Baron T., Statistică pentru afaceri în comerţ – turism, vol 1, 2,
Cristache S.E. Editura Luceafărul, Bucureşti, 2002

Bierens H.J. Introduction to the Mathematical and Statistical


Foundations of Econometrics, Cambridge University
Press, Cambridge, 2004

Biji M., Biji E. Statistică teoretică, Editura Didactică şi Pedagogică,


Bucureşti, 1979

Box George E.P., Time Series Analysis: Forecasting and Control,


Gwilym M Jenkins, Edgewood Cliffs, NJ: Prentice-Hall, 1994
Gregory C. Reinsel
Chow G. Econometrics, McGraw Hill, New York, 1989

Clocotici V. Statistică aplicată în psihologie, Editura Polirom,


Bucureşti, 2000

Cristache S.E., Şerban Lucrări aplicative de statistică şi econometrie pentru


D. administrarea afacerilor, Editura ASE, Bucureşti, 2007

Dougherty Ch. Introduction to Econometrics, Oxford University Press,


2007

Gogonea R.M. STATISTICA. Baza teoretico-aplicativă pentru comerţ-


servicii- turism, Editura Universitară, Bucureşti, 2009

Gogonea R.M. Cercetarea statistică în turismul rural. Studiul turismului


rural din zona Bran-Moeciu, Editura Universitară,
Bucureşti, 2006

Gogonea R.M., Zaharia Econometrie cu aplicaţii în activitatea de comerţ-turism-


M. servicii, Editura Universitară, Bucureşti, 2008,

Gogonea R.M., Zaharia Sustainable Development in Barsa Land. A Correlation


st
M., Hapenciuc C.V. Analysis and System Modeling “, 31 International
Convention on Information and Communication
Technology, Electronics and microelectronics”, MIPRO
2008, vol. V, Opatija, Croaţia, 2008

Gogonea R.M., Zaharia “Econometric Models Applied in Study of Unemployment

214
M., Rate Evolution in Romania”, in Recent Advances in
Fuzzy Systems, Proceedings of the 10th WSEAS
Int.Conf. on Fuzzy Systems (FS’09), p.116-121, Prague,
Czech Republic, 2009, (ISI/SCI)

Gujarati D.N. Basic Econometrics, McGraw Hill, New York, 1995

Hannan E.J., Deistler The Statistical Theory of Linear Systems, New York:
M. Wiley, 1988

Hapenciuc C.V. Cercetarea statistică în turism, editura Didactică şi


pedagogică, Bucureşti, 2003
Elemente de analiză şi prognoză în turism, Editura
Hapenciuc C.V.
Junimea, Iaşi, 2004
Harvey A.C. Trends, Cycles and Autoregressions, Economic Journal,
Vol 107, 1997

HsiaoJohnston J., Econometric Methods, New York:McGraw-Hill, 1997


Dinardo J.,
Isaic-Maniu A., Mitruţ
Statistică, Editura Universitară, Bucureşti, 2003
C.,
Voineagu V.
Jaba E. Statistică, Editura Economică, Bucureşti, 1998

Statistică,ediţia a treia-revizuită, Editura Economică,


Jaba E.
Bucureşti, 2002
Mihăilă N.,
Matematici speciale aplicate în economie, Editura
Popescu O.
Didactică şi Pedagogică, 1978
Mitruţ C., Şerban D
Statistics for Bussiness Administration, Editura ASE,
Bucureşti, 2003

Oprescu Gh. Dinamică economică stochastică. Mecanisme de filtrare


şi predicţie, Editura ASE, Bucureşti, 2007

Oprescu Gh., Spircu L., Bazele ciberneticii economice, Editura Inforec Bucureşti,
Zaharia M. 1997

Pecican Şt. E. Econometrie pentru...economişti, Editura Economică


Bucureşti, 2007

Popescu Th. Serii de timp. Aplicaţii în analiza sistemelor, Editura


Tehnică, Bucureşti, 2000

Reinsel G.C. Elements of Multivariate Time Series Analysis, Springer


Varleg, New York, 1997

Stewart J. Econometrics, Ph.Allan, London, 1991

Şerban R. Teoria probabilităţilor şi statistică Matematică, Editura


Dacia Nova, 2001

Voineagu V, Ţiţan E., Teorie şi practică econometrică, Editura Meteor Press,

215
Şerban R., Ghiţă S., 2007
Tudose D., Boboc C.,
Pele D.
Wonnacott T.H., Introductory Statistics for Business and Economics, New
Wonnacott R.J., York:Wiley,1990

Zaharia M., Hapenciuc Analysis of the Correlation Between the Existing


C., Gogonea R.M. Accommodation Capacity and the Number of Tourists
Arrived in Suceava Country Structure of Tourist
Reception, Revista de Turism Nr.5/anul III/2008

Zaharia M., Hospodar Using Tar Models in Analyses of Stock Volatility, in


A. Economic Computing and Economic Cybernetics Studies
and Research, Nr.1– 4/1997

Zaharia M., Zaheu I., Study Regarding SNP Petrom Stock List Evolution by
Stan E. R. Using Autoregressive Models, International Conference
Economy and Business Sunny Beach Bulgaria, in
„Economic & Business / International Scientific
Publications 2008”, vol 2, Part 1, 2008

216
Econometrie
Suport de Curs-Învățamântul la
distanță

Prof. univ. dr. Zaharia Marian

Asist. Univ. drd. Oprea Cristina

1
Cuprins

Unitatea de învăţare 1 INTRODUCERE ÎN ECONOMETRIE .................................................... 6


Obiectivele Unităţii de Învăţare 1 ......................................................................................................... 6
1.1. Econometria – definiţii şi obiective ................................................................................................ 6
1.2. Modele econometrice..................................................................................................................... 8
Lucrare de verificare 1A .................................................................................................................... 14
Test de autoevaluare 1B ..................................................................................................................... 14
Rezumat ............................................................................................................................................ 16
Bibliografie ....................................................................................................................................... 17
Unitatea de învăţare 2 NOŢIUNI PRIVIND VARIABILELE ALEATOARE ........................... 18
Obiectivele Unităţii de Învăţare 2 ....................................................................................................... 18
2.1. Eveniment. Câmp de Evenimente ................................................................................................ 19
2.2. Variabile aleatoare ...................................................................................................................... 22
Lucrare deverificare 2A ..................................................................................................................... 29
Test de autoevaluare 2B ..................................................................................................................... 29
Rezumat ............................................................................................................................................ 30
Bibliografie ....................................................................................................................................... 31
Unitatea de învăţare 3 CARACTERISTICILE DISTRIBUŢIEI VARIABILEI
ALEATOARE............................................................................................................................... 32
Obiectivele Unităţii de Învăţare 3 ....................................................................................................... 32
3.1 Indicatorii caracteristici variabilei aleatoare privind tendinţa centrală de grupare .......................... 33
3.2 Indicatorii caracteristici variabilei aleatoare privind împrăştierea distribuţiei variabilei aleatoare .. 36
3.3 Particularităţi ale formei de distribuţie.......................................................................................... 41
Lucrare de verificare 3A .................................................................................................................... 42
Test de autoevaluare 3B ..................................................................................................................... 43
Rezumat ............................................................................................................................................ 46
Bibliografie ....................................................................................................................................... 47
Unitatea de învăţare 4 DISTRIBUŢIILE CLASICE ÎN VERIFICAREA IPOTEZELOR
STATISTICE ................................................................................................................................ 48
Obiectivele Unităţii de Învăţare 4 ....................................................................................................... 48

2
4.1 Repartiţia normală normată (Z ) ................................................................................................... 48

4.2 Repartiţia χ
2
............................................................................................................................. 53

4.3 Repartiţia Student ( t ) .................................................................................................................. 55

4.4 Repartiţia Fisher-Snedecor ( F ) ................................................................................................. 56


Lucrare de verificare 4A .................................................................................................................... 57
Test de autoevaluare 4B..................................................................................................................... 57
Rezumat ............................................................................................................................................ 60
Bibliografie ....................................................................................................................................... 61
Unitatea de învăţare 5 IPOTEZE STATISTICE-ASPECTE TEORETICE ................................ 62
Obiectivele Unităţii de Învăţare 5 ...................................................................................................... 62
5.1 Inferenţa statistică........................................................................................................................ 62
5.2 Metodologia testării ipotezelor statistice ...................................................................................... 64
5.3 Tipuri de teste utilizate la testarea ipotezelor statistice ................................................................. 70
Lucrare de verificare 5A .................................................................................................................... 73
Test de autoevaluare 5B..................................................................................................................... 74
Rezumat ............................................................................................................................................ 77
Bibliografie ....................................................................................................................................... 77
Unitatea de învăţare 6 TESTAREA IPOTEZELOR PRIVIND MEDIILE POPULAŢIILOR
CU EŞANTIOANE DE VOLUM MARE .................................................................................... 78
Obiectivele Unităţii de Învăţare 6 ...................................................................................................... 78
6.1 Compararea mediei eşantionului cu media colectivităţii generale ................................................. 78
6.2 Compararea mediilor a două eşantioane ....................................................................................... 83
6.3 Compararea proporţiei eşantionului cu a colectivităţii generale .................................................... 86
Lucrare de verificare 6A .................................................................................................................... 90
Test de autoevaluare 6B..................................................................................................................... 91
Rezumat ............................................................................................................................................ 96
Bibliografie ....................................................................................................................................... 97
Unitatea de învăţare 7 TESTAREA IPOTEZELOR PRIVIND MEDIILE POPULAŢIILOR
CU EŞANTIOANE DE VOLUM MIC ........................................................................................ 98
Obiectivele Unităţii de Învăţare 7 ...................................................................................................... 98
7.1 Compararea mediei unui eşantion de volum redus cu media colectivităţii generale ....................... 98
7.2 Compararea mediilor a două eşantioane de volum redus ............................................................ 102

3
Lucrare de verificare 7A .................................................................................................................. 108
Test de autoevaluare 7B ................................................................................................................... 109
Rezumat .......................................................................................................................................... 114
Bibliografie ..................................................................................................................................... 115
Unitatea de învăţare 8 TESTAREA IPOTEZELOR PRIVIND DISPERSIILE
POPULAŢIILOR ........................................................................................................................ 116
Obiectivele Unităţii de Învăţare 8 ..................................................................................................... 116
8.1 Compararea dispersiei eşantionului cu dispersia colectivităţii generale ....................................... 116
8.2 Compararea dispersiei a două colectivităţi.................................................................................. 119
Lucrare de verificare 8A .................................................................................................................. 123
Test de autoevaluare 8B ................................................................................................................... 123
Rezumat .......................................................................................................................................... 125
Bibliografie ..................................................................................................................................... 126
Unitatea de învăţare 9 ANALIZĂ DISPERSIONALĂ (ANOVA) ........................................... 127
Obiectivele Unităţii de Învăţare 9 ..................................................................................................... 127
9.1 Analiza dispersională unifactorială............................................................................................. 127
9.2 Analiza dispersională bifactorială............................................................................................... 133
Lucrare de verificare 9A .................................................................................................................. 143
Test de autoevaluare 9B ................................................................................................................... 143
Rezumat .......................................................................................................................................... 146
Bibliografie ..................................................................................................................................... 146
Unitatea de învăţare 10 DETERMINAREA ŞI TESTAREA CORELAŢIILOR LINIARE
DINTRE VARIABILELE ECONOMICE.................................................................................. 147
Obiectivele Unităţii de Învăţare 10 ................................................................................................... 147
10.1 Corelația liniară simplă......................................................................................................... 147
10.2 Corelația multiplă ................................................................................................................. 152
Lucrare de verificare 10A ................................................................................................................ 155
Test de autoevaluare 10B ................................................................................................................. 156
Rezumat .......................................................................................................................................... 158
Bibliografie ..................................................................................................................................... 158
Unitatea de învăţare 11 MODELUL DE REGRESIE LINIARĂ UNIFACTORIALĂ ............ 159
Obiectivele Unităţii de Învăţare 11 ................................................................................................... 159
11.1 Ipotezele modelului .............................................................................................................. 159

4
11.2 Determinarea și validarea parametrilor modelului linear unifactorial .................................... 163
Lucrare de verificare 11A ................................................................................................................ 180
Test de autoevaluare 11B ................................................................................................................. 180
Rezumat .......................................................................................................................................... 183
Bibliografie ..................................................................................................................................... 184
Răspunsuri la testele de autoevaluare ......................................................................................... 185
Anexa 1 ....................................................................................................................................... 187
Anexa 2 ....................................................................................................................................... 190
Anexa 3 ....................................................................................................................................... 194
Anexa 4 ....................................................................................................................................... 202
Bibliografie ................................................................................................................................. 214

5
Unitatea de învăţare 1
INTRODUCERE ÎN ECONOMETRIE

Cuprins

Obiectivele Unităţii de Învăţare 1 ................................................................................................... 6


1.1. Econometria – definiţii şi obiective ................................................................................................ 6
1.2. Modele econometrice..................................................................................................................... 8
Lucrare de verificare 1A ............................................................................................................... 14
Test de autoevaluare 1B ................................................................................................................ 14
Rezumat ........................................................................................................................................ 16
Bibliografie ................................................................................................................................... 17

Obiectivele Unităţii de Învăţare 1

După studiul acestei unităţi de învăţare, cursanţii vor avea cunoştinţe despre:
• Ce este econometria.
• Principalele obiective ale econometriei.
• Ce este modelul econometric.
• Ce este modelul economic.
• Diferenţa dontre modelele economice şi modelele econometrice.
• Tipologia modelelor econometrice.
• Etapele creării şi utilizării unui model econometric.
• Tipurile de date utlizate în econometrie.

1.1. Econometria – definiţii şi obiective

6
În anul 1930 la Cleveland un grup de cercetători, printre care I. Fisher, L.V.
Borkiewicy, R. Frisch şi H. Hotelling, înfiinţează Societatea de Econometrie. Acesta este şi
momentul care marchează constituirea econometriei1 ca ştiinţă.

Fie sistemul reprezentat în figura 1.3. Variabilele de intrare xi , din punctul de vedere
al sistemului supus analizei, sunt variabile independente (nu depind de sistemul S ). Aceste
variabile influenţează (determină) valorile variabilei (variabilelor) de ieşire Y . Din acest
punct de vedere variabila Y este o variabilă dependentă. În aceste condiţii are loc relaţia:
Y = f (x ) + ε (1.1)
unde:
f este funcţia de transfer a sistemului reprezentând legea de manifestare a procesului

economic studiat;
x = ( xi )i =1, n este vectorul variabilelor independente;

ε este o variabilă aleatoare care exprimă influenţa factorilor întâmplători asupra


variabilei dependente (Y ) .
Cum f nu este apriori cunoscută, ceea ce se urmăreşte este tocmai identificarea
efectelor variabilelor independente asupra unei variabile dependente şi estimarea efectelor
cauzale pe baza datelor de selecţie în raport cu variabilele observabile.
Ţinând seama de aceste obsevaţii dăm în continuare câteva definiţii ale econometriei
ca ştiinţă.

Definiţia istorică a econometriei:


“experienţa a arătat că fiecare din următoarele
puncte de vedere, al statisticii, al teoriei economice şi al matematicii, este o condiţie
necesară, dar nu şi suficientă pentru o înţelegere efectivă a relaţiilor cantitative din
economia modernă; unificarea lor este aceea care asigură eficienţa. Econometria este
tocmai această unificare.”2

Definiţia restrictivă a econometriei:

1
Termenul “econometrie” a fost introdus de economistul şi statisticianul norvegian Ragnar Frisch şi provine
etimologic de la grecescul “eikonomia” – economie şi respectiv “metren” – măsură.
2
Definiţia a fost formulată de R. Frisch în primul număr al revistei Econometrica.

7
Econometria presupune investigarea fenomenelor
economice numai cu ajutorul modelelor aleatoare (stochastice, probabilistice); ea include
doa cercetările economice ce utilizează metodele inducţiei matematice la verificarea
relaţiilor cantitative formulate în teoria economică cu privire la fenimenele sau procesele
studiate3.

Definiţia extinsă a econometriei:


Econometria în sens larg înseamnă econometria în
sens restrâns, la care se adaugă metodele cercetării operaţionale4.
Ca o primă concluzie econometria urmăreşte aplicarea metodelor statistice în scopul
testării şi cuantificării relaţiilor economice ipotetice utilizând date neexperimentale. Ea
implică utilizarea metodelor matematice şi statistice la formularea, estimarea şi testarea
modelelor economice.
Principalele obiective ale econometriei sunt:
 Estimarea relaţiilor economice
 Testarea ipotezelor privind atât comportamentele egenţilor economici cât şi
fenomenele economice.
 Previziunea variabilelor economice.

1.2. Modele econometrice

Pentru a sublinia specificitatea modelelor econometrice vom face o comparaţie a


acestora cu modelele economice.
Schematic, un sistem economic privit prin prisma analizei economice poate fi
reprezentat conform figurii 1.1.
x1 y1
PROCES
x2 y2
ECONOMIC ym
xn

3
Definiţie propusă de Cowles Comission for Research în Econometrics.
4
Definiţe propusă de economiştii anglo-saxoni.

8
Figura 1.1. Proces studiat prin prisma modelării economice

Modelele economice sunt modele deterministe bazate pe abordarea deterministă a


relaţiilor cauzale dintre evenimente. În cazul prezentat în figura 1.4. modelul economic este:
Y = f (X ) (1.2)
unde: X = (xi )i =1,n este vectorul vatiabilelor independente (cauzale)

( )
Y = yj j =1.m
este vectorul variabilelor dependente (rezultative).

După cum se poate observa, modelele economice nu conţin elemente stochastice şi


nu ţin seama de evenimente întâmplătoare. In studiul relaţiilor dintre două variabile
economice se face ipoteza5 că toate celelalte variabilele au valori constante (rămân
neschimbate) pe durata perioadei de studiu.
Spre deosebire de modelele economice, modelele econometrice sunt modele
stochastice care se deosebesc de modelele economice prin faptul că includ pe lângă elemente
deterministe şi cel puţin un element stochastic (figura 1.2).

ε
x1 y1
PROCES
x2 y2
ECONOMIC ym
xn

Figura 1.2. Proces studiat prin prisma modelării econometrice


În cazul modelelor econometrice, pe lângă influenţele variabilelor independente, este
evidenţiată şi influenţa factorilor cu acţiune întâmplătoare (reziduali) asupra variabilelor
dependente. În abordarea econometrică a procesului studiat relaţia (1.2) devine:

Y = f (X ) + ε (1.3)
La construirea şi utilizarea modelelor econometrice (figura 1.6) se porneşte de la
teoria economică pe baza căreia se construieşte un model care se presune că descrie relaţiile
cauzale dintre una sau mai multe variabile independente şi o variabilă dependentă (rezultat)
şi se obţine într-o primă fază un model economic. În funcţie de numărul de ecuaţii se
5
Ipoteza ceteris paribus.

9
introduc în model una sau mai multe variabile stochastice şi se obţine modelul econometric al
fenomenului studiat.
Pe baza datelor de selecţie reprezentând valorile variabilelor observabile din model se
estimează valorile parametrilor modelului obţinându-se o funcţie de date de observaţie (un
estimator).
Se validează modelul econometric obţinut în raport cu anumite condiţii (convergenţă,
verosimilitate etc.). Dacă modelul nu este valid se încearcă găsirea altui model care, în raport
cu condiţiile impuse sa fie valid (corect).
Dacă modelul este corect atunci acesta poate fi utilizat la testarea ipotezelor privind
valorile numerice ale parametrilor necunoscuţi ai populaţiei din care a fost selectat
eşantionul. De asemenea, validitatea modelului oferă posibilitatea efectuării unor predicţii ale
comportamentului populaţiei respective.

Teorie economică Populaţie studiată

Selecţie
Model economic
Date de selecţie
Model econometric

Estimare

Validare

NU
Model valid?

DA

Testare ipoteze

Politici economice:predicţii/prognoză

Figura 1.3. Etape în practica econometrică

10
Modelele econometrice formează o submulţime de modele inclusă în mulţimea modelelor
economico-matematice care, la rândul lor, pot fi categorisite după diferite criterii printre care
menţionăm:
o După numărul de ecuaţii
- modele cu o singură ecuaţie (conţin o singură variabilă rezultativă y , indiferent
de numărul n al elementelor vectorului variabilelor cauzale
X = (xi )i =1,n ) y = f ( X ) + ε

- modele cu mai multe ecuaţii (conţin mai multe variabile rezultative


( )
Y = yj j =1.m
) Y = f (X ) + ε

o După numărul factorilor luaţi în considerare:


- modele unifactoriale
y = f (x) + ε

- modele multifactoriale
y = f (x1 , x 2 , K , x n ) + ε

o După forma dependenţei dintre variabilele independente (cauzale) şi cele dependente


(rezultative)
- modele liniare (există dependenţă liniară între variabilele rezultative şi cele
cauzale)
- modele neliniare (dependenţa este neliniară)
o În raport cu factorul timp:
- modele statice (dependenţele dintre variabilele modelului se referă la aceleşi
moment (perioadă) de timp
- modele dinamice care, la rândul lor pot fi
 modele dinamice cu variabila timpul (t ) explicită
y = f (xt , t ) + ε i

 modele autoregresive
y = f (x t , y t −k ) + ε

 modele cu decalaj
y = f ( x t , x t −1 , K , x t − k ) + ε

11
Ca şi în cazul general al modelelor economico-matematice, în structura unui model
econometric intră variabilele modelului şi relaţiile dintre variabilele acestuia.
Pe lângă tipurile de variabile prezentate până acum (Variabile independente - cauzale
sau explicative -, variabile dependente - rezultative; variabile deterministe, variabile
stochastice; variabile endogene, variabile exogene) ne mai oprim asupra categorisirii
variabilelor modelelor econometrice în funcţie de valorile pe care le pot lua, şi anume:
 Variabile cantitative. Provin din caracteristici care exprimă atribute cantitative ale
elementelor unei populaţii. Caracteristica principală a variabilelor catitative este
faptul ca iau valori dintr-o scară continuă, cu valorile lor putându-se efectua operaţii
aritmetice. În analizele econometrice, indicatorii statistici relevanţi calculaţi pe baza
valorilor observate sunt media şi abaterea medie pătratică.
 Variabile categoriale (calitative) Provin din carscteristici care exprimă atribute
calitative. Denumirea acestora provine de la faptul că au două sau mai multe nivele de
valori numite categorii. La rândul lor, variabilele categoriale pot fi grupate în:
o Variabile nominale. Valoarea reprezintă codul unei categorii careia îi aparţine
elementul respectiv al pupulaţiei. De exemplu, variabila stare civilă poate
avea codificările:

1 -necăsătorit, 2 – casatorit, 3 – divorţat, 4 – văduv.

o Variabile binare. Au numai două niveluri de valori care descriu complet o


caracteristică a unui element al populaţiei. De exemplu, pentru populaţia
studenti, variabila promovat poate lua două valori:

0 – Nu (nepromovat), 1- Da (promovat).

o Variabile ordinale. Sunt variabile ale căror nivele sunt codificate astfel încât
să poată fi comparate între ele. De exemplu, variabila calitativă satisfacţie a
cărei valoare este dată de răspunsul la întrebarea:

12
Sunteţi mulţumit de calitatea serviciilor hotelului nostru? (2) – foarte
mulţumit; (1) – mulţumit; (0) – indiferent;
(-1) – nemulţumit; (-2) – foarte nemuţumit;

este o variabilă calitativă ordinală.


Relaţiile unui model econometric exprimă dependenţele dintre variabilele cauzale şi
cele rezultative şi pot fi:
• relaţii de identitate – sunt relaţii deterministe privind procesul economic supus
analizei (de exemplu exprimarea profitului ca diferenţă între venituri şi cheltuieli
Pr = V − C );
• relaţii de comportament – exprimă comportamente ale agenţilor economici;
• relaţii tehnologice – exprimă dependeţe dintre variabile care descriu procese
tehnologice (de exemplu funcţiile de producţie);
• relaţii instituţionale – introduc în modelul econometric reglementări impuse de
legislaţia în domeniul procesului economic supus analizei.

Utilizarea modelelor econometrice în studiul proceselor şi fenomenelor economice se


bazează pe datele primare culese prin diverse modalităţi. Din punct de vedere cronologic,
datele primare utilizate într-un model econometric pot îmbrăca trei forme:
 date de tip transversal sau profil (cross-sectional). Măsurătorile asupra
caracteristicilor unui număr mare de elemente ale unei populaţii efectuate la acelaşi
moment de tip. Datele de tip transversal sunt obşnuite prin măsurători de natură
statică şi se caracterizează prin observaţii independente.
 date de tip serii de timp. (serii cronologice). Măsurători asupra caracteristicilor unei
unităţi individuale pe o perioadă lungă de timp. Datorită modului de constituire,
obervaţii indexate în timp, datele de tip serie de timp sunt caracterizate prin
dependenţă serială. Acest tip de date se obţine prin măsurători de natură dinamică
asupra caracteristicilor unui element din populaţie la momente sau intervale succesive
de timp
 date de tip panel. Sunt obţinute prin măsurători atât de natură statică căt şi dinamică
asupra aceloraşi elemente ale populaţiei.

13
Lucrare de verificare 1A

Răspundeţi pe scurt la următoarele întrebări:

1. Ce este econometria?
2. Care sunt principalele obiective ale econometriei?
3. Ce este modelul econometric?
4. Care este diferenţa dintre modelele economice şi modelele econometrice?
5. Care este tipologia modelelelor econometrice?
6. Ce tipuri de date sunt utilizate în econometrie.
7. Care este schema care prezintă etapele creării şi utilizării unui model econometric?

Test de autoevaluare 1B

1. Econometria implică utilizarea:


a. metodelor matematice la formularea, estimarea şi testarea modelelor
economice;
b. metodelor matematice şi statistice la formularea, estimarea şi testarea
modelelor economice;
c. metodelor matematice şi statistice la formularea modelelor economice;
d. metodelor matematice şi statistice la estimarea modelelor economice.

2. Principalele obiective ale econometriei sunt:


a. estimarea relaţiilor economice;
b. testarea ipotezelor privind atât comportamentele egenţilor economici cât şi
fenomenele economice;
c. previziunea variabilelor economice;
d. previziunea comporatmentului agenților economici;

A: a+b+c; B: a+b+d; C: b+c+d; D: a+c+d.

3. Relaţiile unui model econometric exprimă:

14
a. dependenţele dintre variabilele cauzale şi cele rezultative;
b. independenţa dintre variabile;
c. dependenţele dintre variabilele cauzale;
d. dependenţele dintre variabilele rezultative;

4. După numărul de ecuaţii modelele econometrice sunt:


a. modele cu o singură ecuație și modele cu două ecuații;
b. modele cu o singură ecuație și modele cu mai multe ecuații;
c. modele statice și modele dinamice.
d. modele unifactoriale și modele bifactoriale;

5. În funcţie de valorile pe care le pot lua, variabilelor modelelor econometrice se


clasifică astfel:
a. variabile exogene si variabile endogene;
b. variabile cantitative și varialbile calitative;
c. variabile dependente și variabile independente;
d. variabile cauzale și variabile deterministe.

6. Exprimarea profitului ca diferenţă între venituri şi cheltuieli Pr = V − C este o relație


de:
a. comportament;
b. tehnologică;
c. instituțională;
d. identitate.

7. Utilizarea modelelor econometrice în studiul proceselor şi fenomenelor economice se


bazează pe:
a. date secundare;
b. date auxiliare;
c. date primare;
d. date prelucrate.

15
8. Ce date sunt obţinute prin măsurători atât de natură statică căt şi dinamică asupra
aceloraşi elemente ale populaţiei:
a. date de tip serii de timp;
b. date de tip panel;
c. date de tip transversal;
d. date de tip profil.

9. Variabile categoriale provin din caracteristici care exprimă atribute:


a. calitative;
b. normale;
c. cantitative;
d. primare.

10. Variabile ale căror nivele sunt codificate astfel încât să poată fi comparate între ele
sunt;
a. variabile ordinale;
b. variabile cantitative;
c. variabile binare;
d. variabile primare.

Rezumat

Econometria este o ştiinţă care urmăreşte investigarea fenomenelor economice numai


cu ajutorul modelelor aleatoare utilizând metodele inducţiei matematice la verificarea
relaţiilor cantitative formulate în teoria economică cu privire la fenomenele sau procesele
studiate.
Spre deosebire de modelele economice deterministe bazate pe abordarea deterministă
a relaţiilor cauzale dintre evenimente, modelele econometrice sunt modele stochastice care
includ pe lângă elemente deterministe şi elemente aleatoare.
Construirea şi utilizarea modelelor econometrice porneşte de la teoria economică pe
baza căreia se construieşte un model care se presupune că descrie relaţiile cauzale dintre una

16
sau mai multe variabile Pe baza datelor de selecţie reprezentând valorile variabilelor
observabile din model se estimează valorile parametrilor modelului. După validarea
modelului pe baza acestuia se pot efectua predicţii ale comportamentului populaţiei
respective.
Modelele econometrice, pot fi categorisite după diferite criterii printre care după
numărul ecuaţiilor (cu o singură ecuaţie, cu mai multe ecuaţii), numărul factorilor
(unifactoriale), multifactoriale), forma dependenţei dintre variabile (liniare, neliniare),modul
în care este considerat factorul timp (madele statice, modele dinamice) etc.

Bibliografie

Gogonea R.M., Zaharia Econometrie cu aplicaţii în activitatea de comerţ-turism-


M. servicii, Editura Universitară, Bucureşti, 2008,
Isaic-Maniu A., Mitruţ
Statistică, Editura Universitară, Bucureşti, 2003
C.,
Voineagu V.
Jaba E. Statistică, Editura Economică, Bucureşti, 1998

Statistică,ediţia a treia-revizuită, Editura Economică,


Jaba E.
Bucureşti, 2002

17
Unitatea de învăţare 2
NOŢIUNI PRIVIND VARIABILELE ALEATOARE

Cuprins

Obiectivele Unităţii de Învăţare 2 ................................................................................................. 18


2.1. Eveniment. Câmp de Evenimente ................................................................................................ 19
2.2. Variabile aleatoare ...................................................................................................................... 22
Lucrare de verificare 2A ............................................................................................................... 29
Test de autoevaluare 2B ................................................................................................................ 29
Rezumat ........................................................................................................................................ 30
Bibliografie ................................................................................................................................... 31

Obiectivele Unităţii de Învăţare 2

După studierea acestei unităţi de învăţare, cursanţii vor avea cunoştinţe despre teoria
probabilităţilor, şi anume:
• Ce este evenimentul.
• Tipuri de evenimente
• Ce este câmpul de evenimente
• Ce sunt variabilele aleatoare
• Ce sunt variabilele aleatore discrete
• Distribuţia variabilei aleatoare discrete
• Histograma şi pologonul distribuţeiei variabilei aleatoare discrete
• Funcţia de repartiţie a variabilei aleatoare discrete
• Ce sunt variabilele aleatoare continue
• Distribuţia variabilei aleatoare continue
• Reprezentarea grafică a variabilei aleatoare continue
• Funcţia de repartiţie a variabilei aleatoare continue

18
2.1. Eveniment. Câmp de Evenimente

Din punct de vedere al analizelor ce vor fi efectuate pe parcursul acestei lucrări orice
mulţime de elemente care printr-o proprietate comună pot fi considerate împreună constituie o
populaţie. Vom nota populaţia cu Γ , iar cu ϕ ∈ Γ un element generic al său. De exemplu, o
colectivitate de indivizi care au calitatea de a fi studenţi formează o populaţie.
Dacă în raport cu elementele populaţiei Γ considerăm una sau mai multe proprietăţi
spunem că am constituit un criteriu de cercetare. Astfel, dacă în raport cu populaţia „studenţi”
considerăm proprietatea de a fi integralist, am constituit un criteriu de cercetare.
Relizarea complexului de condiţii corespunzătoare criteriului de cercetate se numeşte
experienţă6. În sens larg, experienţa reprezintă un act care poate fi repetat în condiţii date şi care
permite verificarea practică a cunoştinţelor privind diverse fenomene şi procese din realitate.
O noţiune fundamentală în teoria probabilităţilor este cea de eveniment.

Definiţa 2.1. Evenimentul exprimă producerea sau neproducerea unui fenomen în cadrul unui
experienţe.
Evenimentul este rezultatul unui experiment (probă). Dacă în exemplul considerat mai
sus selectăm la întâmplare un element (student) din populaţia studenţi şi dacă acesta este
integralist, în raport cu criteriul ales, evenimentul evidenţiază producera fenomenului de
promovare a tuturor examenelor. Dacă studentul selectat nu este integralist, atunci evenimentul
evidenţiază neproducerea fenomenului de promovare a tuturor exemenelor.

Exemplul 2.1.
Să considerăm că dorim să vedem care sunt rezultatele posibile obţinute prin însumarea
feţelor a două zaruri care au fost aruncate.
Considerând că zarurile nu sunt măsluite, ţinând seama de faptul că feţele acestora pot lua
valori de la 1 la 6, atunci rezultă că suma feţelor la o aruncare poate avea valori în intervalul de
la 2 la 12 (2,3,4,5,6,7,8,9,10,11,12). Sumele feţelor, obţinute în toate cele 36 de combinaţii
posibele, sunt prezentate în tabelul 2.1.

6
Mihăilă N.,Popescu O., “Matematici speciale aplicate în economie”, Editura didactică şi pedagogică, Bucureşti,
1978.

19
Tabelul 2.1. Sumele feţelor obţinute prin aruncarea a două zaruri

Faţă zarul I
1 2 3 4 5 6
1 2 3 4 5 6 7
Faţă 2 3 4 5 6 7 8
zarul 3 4 5 6 7 8 9
II 4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12

După cum se poate observa şi din tabelul 2.1 sunt numai n = 11 evenimente elementare
posibile (2,3,4,5,6,7,8,9,10,11,12).
Notăm: - cu Ω mulţimea tuturor evenimentelor
- cu ωi ∈ Ω evenimentul elementar i ,
Atunci,
{ωi }i =1,n reprezintă mulţimea evenimentelor elementare ale lui Ω .

În cazul exemplului considerat mulţimea evenimentelor elementare este:


{ωi }i=1,n = {2,3,4,5,6,7,8,9,10,11,12} (2.1)

Această mulţime reprezintă o parte (submulţimi) a mulţimii Ω .


Pe lângă mulţimea evenimentelor elementare {ωi }i =1,n , mulţimea Ω conţine şi o serie de

alte evenimente obţinute din combinarea evenimentelor elementare, care formează, de asemenea,
părţi ale mulţimii Ω (submulţime).
De exemplu, un alt eveniment din mulţimea Ω poate fi “suma feţelor cuprinsă între 3 şi
12”, notat cu α .
Vom nota în continuare mulţimea tuturor evenimentelor (elementare şi neelementare) cu
{ei }i =1, N
Fiecărui eveniment ei i se poate asocia un eveniment contrar Cei (complementar) care

se realizează atunci şi numai atunci când nu se realizează ei . De exemplu, evenimentului ω1

(suma feţelor egală cu 2) îi corespunde evenimentul complementar Cω1 = α (“suma feţelor să


fie cuprinsă între 3 şi 12”).
Definiţia 2.2.
Se numeşte eveniment sigur acel eveniment care se poate realiza în oricare din probe.

20
În cazul prezentat, evenimentul sigur reprezintă apariţia unei valori cuprinse în intervalul
închis de la 2 la 12. În consecinţă, evenimentul sigur în cazul dat este chiar mulţimea Ω .
Evenimentului sigur Ω i se asociază evenimentul imposibil notat cu Φ .
Oricare din evenimentele ei care pot să se producă sau nu la efectuarea unei probe
reprezintă un eveniment aleator.
Între două evenimente pot exista sau nu pot apărea relaţii de implicare. Dacă realizarea
evenimentului ei atrage după sine realizarea evenimentului e j (i ≠ j ) , atunci ei ⊂ e j adică

evenimentul ei implică evenimentul e j .

Dacă ei ⊂ e j (evenimentul ei implică evenimentul e j ) şi ei ⊃ e j (evenimentul ei este

implicat în realizarea evenimentului e j ) atunci evenimentele ei şi e j sunt echivalente.

Anterior au fost evidenţiate, printre altele, noţiunile de eveniment sigur, eveniment


aleator, mulţime de evenimente.
Am notat cu Ω evenimentul sigur şi cu {ei }i =1,n mulţimea tuturor evenimentelor aleatoare

care formează mulţimea Ω , iar în continuare vom considera un Κ ca fiind mulţimea nevidă a
părţilor lui Ω care conţine toate evenimentele aleatoare {ei }i =1, N cu N finit.

Definiţia 2.3.
Perechea [Ω, Κ ] reprezintă un câmp finit de evenimente dacă:
 ∀ei ∈ Κ ⇒ Cei ∈ Κ ;

 ∀ei ∧ e j ∈ Κ ⇒ ei U e j ∈ Κ .

Elementele {ei }i =1, N formează un sistem complet de evenimente dacă:


N
 Ue i =Ω
i =1

 ei I e j = Φ∀i ≠ j.

Fie acum, {ωi }i =1,n o submulţime a mulţimii evenimentelor elementare ale câmpului de

evenimente [Ω, Κ ] . Mulţimea {ωi }i =1,n are următoarele proprietăţi:

 ωi ≠ Φ∀i = 1, n
 ωi I ω j = Φ∀i ≠ j

21
n
 Uω = Ω
i =1
i

 ∃ a ∈ [Ω, Κ ], a ≠ ω i , i = 1, n, a.i. a = ω i1 U ... U ω i p ,1 ≤ p ≤ n.

Este uşor de observat că mulţimea evenimentelor elementare din relaţia 2.1 satisface
proprietăţile de mai sus.
Trebuie remarcat aici faptul că, în relaţia 2.1 sunt puse în evidenţă numai evenimentele,
nu şi frecvenţele lor de apariţie. Fiecărui eveniment îi corespunde o anumită frecvenţă de
apariţie. Acestea pot fi egale sau nu.

Exemplul 2.2.
Frecvenţa de apariţie a evenimentelor elementare obţinute prin aruncarea a două zaruri este
calculate în tabelul 2.2.
Tabelul 2.2. Frecvenţa de apariţie a evenimentelor elementare obţinute prin aruncarea a două zaruri

Valoare 2 3 4 5 6 7 8 9 10 11 12
Frecvenţă 1 2 3 4 5 6 5 4 3 2 1

După cum se poate observa şi din tabelul 2.1 în cazul considerat frecvenţele de apariţie a
evenimentelor elementare diferă. Dacă le centralizăm obţinem situaţia din tabelul 1.2.
Frecvenţele de apariţie ale evenimentelor iau valori între 1 şi 6.

2.2. Variabile aleatoare

Mediul economic real, bazat pe competiţie, prin dinamica şi complexitatea sa este


caracterizat de numeroase variabile ale căror valori sunt cunoscute cu certitudine numai după
producerea lor. De exemplu, numărul turiştilor cazaţi într-o zi la un hotel reprezintă variabile ale
căror valori efective sunt cunoscute numai la sfârşitul zilei. Din păcate, în practică valorile
acestor variabile constituie elemente decizionale importante care declanşează acţiuni anterioare
lor (de exemplu aprovizionarea cu alimente). Neputând fi însă cunoscute este necesar să facem
anumite presupuneri (ipoteze) privind valorile lor, ipoteze care aşa cum se va vedea pe parcursul
capitolelor viitoare trebuiesc verificate.

22
Definiţia 2.4.
Se numeşte variabilă aleatoare (stohastică) acea variabilă a cărei realizare constituie
evenimente întâmplătoare dintr-o mulţime care are un sistem determinat de evenimente.
După caracteristicile mulţimii pe care sunt definite, variabilele aleatoare se clasifică în:
• variabile aleatoare discrete definite pe mulţimi discrete cu număr finit de elemente;
• variabile aleatoare continue definite pe mulţimi continue reprezentate printr-un interval
finit sau infinit din ℜ .
Variabilele aleatoare se notează cu litere mari, iar valorile lor cu litere mici
corespunzătoare acestora. De regulă, sunt utilizate literele de la sfârşitul alfabetului (de exemplu,
variabila aleatoare X are la un moment dat valoarea x ).

♦ Variabile aleatoare discrete


Pentru a caracteriza o variabilă aleatoare ne oprim în cele ce urmează asupra
următoarelor aspecte:
• Distribuţia variabilei aleatoare discrete
• Histograma şi poligonul distribuţiei
• Funcţia de repartiţie
 Distribuţia variabilei aleatoare discrete
Pentru a defini o variabilă aleatoare discretă este necesară enumerarea tuturor valorilor
posibile precum şi a probabilităţilor lor de producere.

Exemplul 2.3.
Aşa cum se poate observa din tabelul 2.2 la aruncarea a două zaruri este posibilă
obţinerea a 11 valori. Variabila aleatoare care modelează acest proces va fi:
 2 3 4 5 6 7 8 9 10 11 12 
Z : 1 2 3 4 5 6 5 4 3 2 1 
 
 36 36 36 36 36 36 36 36 36 36 36 
Definiţia 2.5.
Fie X o variabilă aleatoare discretă cu xi , i = 1, n , valoarea acesteia la un moment dat şi
evenimentul ( X = xi ) cu probabilitatea P( X = xi ) = f ( xi ) = pi . Mulţimea perechilor ordonate

(xi , f (xi ))i =1,n se numeşte distribuţia variabilei aleatoare discrete.

23
Simbolic variabila aleatoare X se notează cu:
 x  x 
X  i  sau X  i , i = 1, n (2.2)
 f ( xi )   pi 

unde xi este argumentul variabilei aleatoare, iar f ( xi ) funcţia de probabilitate, cu proprietăţile:

10 f(xi ) ≥ 0

n
20 ∑ f(x ) = 1
i =1
i deoarece Ei = ( X = xi ), i = 1, n , constituie un sistem complet de

evenimente.

 Histograma şi poligonul distribuţiei discrete


În cazul variabilei aleatoare discrete funcţia de probabilitate pi = f ( xi ), i = 1, n , este o

funcţie definită grafic de punctele M ( xi , pi ) .

Luând pe axa absciselor valorile consecutive ale argumentului xi , se obţin intervale7,

astfel încât mijlocul intervalului de ordinul i este considerat ca punct xi , iar pe ordonată valorile

funcţiei de probabilitate se obţin cu aria numeric dată de p i . Totalitatea acestor dreptunghiuri


constituie histograma distribuţiei.

Exemplul 2.4.
Pentru variabila aleatoare care modelează procesul de aruncare a două zaruri histograma
este este ilustrată în figura 2.1.
Dacă notăm cu M i ( xi , p i ) mijloacele segmentelor din partea de sus a dreptunghiurilor şi
le unim prin segmente de drepte, se obţine poligonul distribuţiei.

7
La constituirea histogramei trebuie să se ţină seama de tipul intervalelor de grupare. Dacă intervalele sunt egale
(ca in exemplul nostru) fiecare interval este luat egal cu unitatea de lungime. Dacă intervalele nu sunt
egale atunci acestea se dimensionează în aşa fel încât suprafaţa unei coloane să fie proporţională cu
produsul dintre mărimea intervalului şi frecvenţa sa.

24
Histogram
7
6
Frequency

5
4
3
2
1
0
2 3 4 5 6 7 8 9 10 11 12 More

Figura 2.1. Histograma procesului de aruncare a două zaruri

 Funcţia de repartiţie a variabilei discrete


O caracteristică importantă a unei variabile aleatoare o reprezintă funcţia de repartiţie

Definiţia 2.6.
Se numeşte funcţie de repartiţie a variabilei aleatoare X , funcţia:
F ( x) = P( X < x)

unde evenimentul ( X < x) este dat de: ( X < x ) = U (X = x )


xi ≤ x
i

Cum evenimentele ( X = xi ), i = 1, n sunt incompatibile, atunci:

P( X < x ) = ∑ P( X = x ) = ∑ f ( x ) , deci
xi ≤ x
i
xi ≤ x
i

F ( x) = P ( X < x ) = ∑ f ( x ),
xi ≤ x
i

Considerând graficele distribuţiei variabilei aleatoare, discrete, funcţia de repartiţie F (x)


este suma probabilităţilor pi = f ( xi ) de la stânga punctului de abscisa x , sau suprafaţa

histogramei de la stânga punctului de abscisa x .

Exemplul 2.5.
În cazul aruncării a două zaruri determinăm probabilitatea de a obţine o sumă a feţelor
mai mică decât 6 .
Pornim de la variabila aleatoare:

25
 2 3 4 5 6 7 8 9 10 11 12 
Z : 1 2 3 4 5 6 5 4 3 2 1 
 
 36 36 36 36 36 36 36 36 36 36 36 
şi stabilim funcţia de repartiţie ca fiind:
F (6) = P(Z < 6) = suma probabilităţilor p i de la stânga lui 6.
1 2 3 4 10
F ( 6) = P ( Z < 6) = + + + = ≈ 0,277778
36 36 36 36 36

Funcţia de repartiţie numită şi funcţia cumulativă a probabilităţilor, F ( x) = P ( X < x) are


următoarele proprietăţi:
1 0 .0 ≤ F ( x) ≤ 1

2 . Funcţia F(x) este nedescrescătoare. Dacă x1 < x2 sunt două valori ale argumentului
0

variabilei X, atunci deoarece

F ( x 2 ) − F ( x1 ) = P( x1 ≤ X < x 2 ) ≥ 0
rezultă:
F ( x 2 ) − F ( x1 ) ≥ 0, deci F ( x 2 ) ≥ F ( x1 ) .

3 0 . F(a)=0, F(b)=1 , unde a şi b sunt cea mai mică, respectiv cea mai mare valoare pe care o
poate lua argumentul variabilei X .

♦ Variabile aleatoare continue

Ca şi în cazul variabilelor aleatoare discrete ne vom opri asupra următoarelor aspecte:


• Distribuţia variabilei aleatoare continue
• Reprezentarea grafică a distribuţiei variabilei aleatoare continue
• Funcţia de repartiţie a variabilei aleatoare continue

 Distribuţia variabilei aleatoare continue


Analog variabilei aleatoare discrete, variabila aleatoare continuă X se defineşte prin:
 x 
X :   cu x ∈ [a, b ] (2.3)
 ϕ ( x) 

26
Definiţia 2.7.
 x 
Fie variabila aleatoare X :   cu x ∈ [a, b ] , funcţia ϕ (x) se numeşte densitatea de
 ϕ ( x) 
probabilitate a variabilei aleatoare X .
Funcţia densitate de probabiitate ϕ (x ) se bucură de proprietăţile:

1 0 . ϕ ( x ) ≥ 0 , deoarece dP ≥ 0 şi dx > 0
b
2 0 . ∫ ϕ ( x)dx = 1 . .
a

 Reprezentarea grafică a distribuţiei


În cazul variabilei aleatoare continue funcţia densitate de probabilitate ϕ (x ) , x ∈ [ a, b] ,
reprezentată grafic este o curbă continuă numită curba de distribuţie, iar histrograma
corespunzătoare este un trapez curbiliniu.
 x 
Fie variabila aleatoare: X :  
− x , x ≥ 0 Funcţia densitate de probabilitate este
ϕ ( x) = e 
reprezentată grafic în figura 2.2.:

ϕ (0 ) = 1

ϕ ( x) = e −1

S=1
0
x

Figura 2.2. Graficul funcţiei densitate de probabilitate ϕ ( x) = e −1

Suprafaţa haşurată S este egală cu unitatea, verificând proprietatea 20 a funcţiei densitate


de probabilitate.
 Funcţia de repartiţie a variabilei continue
Probabilitatea ca o variabilă aleatoare să ia valori într-un anumit interval este dată de
funcţia de repartiţie a variabilei respective.

27
Definiţia 2.8.
 x 
Fie variabila aleatoare X :   cu x ∈ [a, b ] şi funcţia densitatea de probabilitate
 ϕ ( x) 
ϕ (x) .
Funcţia

F ( x ) = P( X < x) = ∫ ϕ (t )dt
x
(2.4)
a

reprezintă funcţia de repartiţie a variabilei aleatoare X


În cazul variabilei aleatoare continue, derivata funcţiei de repartiţie reprezintă funcţia
densitate de probabilitate.
dF ( x )
= ϕ ( x) (2.5)
dx
Ţinând seama de interpretarea geometrică a integralei definite, rezultă că, funcţia de
repartiţie reprezintă aria din histogramă pe intervalul [ a, x] .

ϕ (x)

1
x

P( X < x) = F ( x) = ϕ (t )dt
0

ϕ ( x) = e − x

P ( X < 2)
0 x =1 x=2 x

Figura 2.3. Graficele funcţiei densitate de probabilitate ϕ ( x) = e − x

x
şi al funcţiei de repartiţie P( X < x) = F ( x) = ∫ ϕ (t )dt
0

Pentru variabila aleatoare:


 x 
x ≥ 0 avem F (2 ) = P ( X < 2) =
2
X :  
− x ,
 ϕ ( x) = e 
∫ ϕ ( x)dx
0

care este reprezentată grafic în figura 2.3, prin suprafaţa haşurată:

28
Lucrare deverificare 2A

Răspundeţi pe scurt la următoarele întrebări:

1. Ce reprezintă un eveniment?
2. Cum de defineşte câmpul de evenimente.
3. Ce este variabila aleatoare?
4. Ce tipuri de variabile aleatoare cunoaşteţi?
5. Ce este variabila aleatore discretă?
6. Care sunt caracteristicile variabilei aleatoare?
7. Ce este variabila aleatoare continuă?
8. Ce înţelegeţi prin distribuţia variabilei aleatoare?
9. Care este funcţia de repartiţie a variabilei aleatoare continue?
10. Cum se reprezintă grafic variabila aleatoare continuă?

Test de autoevaluare 2B

1. Frecvenţa de apariţie a evenimentelor elementare obţinute prin aruncarea a două zaruri


este:
a. 6;
b. cuprinsă între 1 și 6;
c. cuprinsă între 3 și 6;
d. 3.

2. Variabilă aleatoare este acea variabilă


a. care îşi poate schimba conţinutul o dată sau de mai multe ori pe parcursul
prelucrării;
b. a cărei realizare constituie evenimente întâmplătoare dintr-o mulţime care are un
sistem determinat de evenimente;
c. care poate fi clasificată în mai mult de două subcategorii;
d. care poate fi cuantificată sau măsurată;
3. După caracteristicile mulţimii pe care sunt definite, variabilele aleatoare se clasifică în:

29
a. variabile aleatoare nominale și variabile ordinale;
b. variabile aleatoare calitative și variabile aleatoare cantitative;
c. variabile aleatoare discrete și variabile aleatoare continue;
d. variabile aleatoare primare și variabile aleatoare secundare.

4. Variabile aleatoare continue reprezintă


a. variabile ce pot fi cuantificate;
b. mulţimi continue reprezentate printr-un interval finit sau infinit din ℜ ;
c. mulțimi de evenimente;
d. variabile ce nu pot fi cuantificate;

5. Variabile aleatoare discrete sunt definite


a. pe mulțimi discrete cu număr infinit de elemente;
b. pe mulţimi discrete cu număr finit de elemente;
c. pe mulțimi cu elemente;
d. pe mulțimi de elemente.

Rezumat

În analiza fenomenelor economice cu ajutorul modelelor econometrice se operează cu


noţiuni precum: populaţie (mulţime de elemente care printr-o proprietate comună pot fi
considerate împreună), criteriu de cercetare, experienţă (relizarea complexului de condiţii
corespunzătoare criteriului de cercetate), eveniment (exprimă producerea sau neproducerea unui
fenomen în cadrul unui experienţe).

Un eveniment care la efectuarea unei probe poate să se producă sau nu reprezintă un


eveniment aleator. Fie Ω evenimentul sigur şi cu {ei }i =1,n mulţimea tuturor evenimentelor

aleatoare care formează mulţimea Ω , Elementele {ei }i =1, N formează un sistem complet de
N
evenimente dacă: Ue i = Ω şi ei I e j = Φ∀i ≠ j.
i =1

30
Se numeşte variabilă aleatoare acea variabilă a cărei realizare constituie evenimente
întâmplătoare dintr-o mulţime care formează un sistem complet de evenimente. După
caracteristicile mulţimii pe care sunt definite variabilele aleatoare pot fi discrete sau continue.

În analiza fenomenelor economice, bazată pe modele econometrice, sunt utilizate în


principal variabile aleatoare discrete.

Bibliografie

Andrei T. Statistică şi econometrie, Editura Economică, Bucureşti,


2003

Bădiţă M., Baron T., Statistică pentru afaceri, Editura Eficient, Bucureşti, 1998
Korka M.
Chow G. Econometrics, McGraw Hill, New York, 1989

Clocotici V. Statistică aplicată în psihologie, Editura Polirom,


Bucureşti, 2000

Gogonea R.M., Zaharia


M. Econometrie cu aplicaţii în activitatea de comerţ-turism-
servicii, Editura Universitară, Bucureşti, 2008,

31
Unitatea de învăţare 3
CARACTERISTICILE DISTRIBUŢIEI VARIABILEI ALEATOARE

Cuprins
Unitatea de învăţare 3 CARACTERISTICILE DISTRIBUŢIEI VARIABILEI ALEATOARE 32
Obiectivele Unităţii de Învăţare 3 ............................................................................................. 32
3.1 Indicatorii caracteristici variabilei aleatoare privind tendinţa centrală de grupare ............. 33
3.2 Indicatorii caracteristici variabilei aleatoare privind împrăştierea distribuţiei variabilei
aleatoare .................................................................................................................................... 36
3.3 Particularităţi ale formei de distribuţie ................................................................................ 41
Lucrare de verificare 3A ........................................................................................................... 42
Test de autoevaluare 3B ............................................................................................................ 43
Rezumat ..................................................................................................................................... 46
Bibliografie................................................................................................................................ 47

Obiectivele Unităţii de Învăţare 3

După studiul acestei unităţi de învăţare, cursanţii vor avea cunoştinţe despre:
• cunoaşterea indicatoriilor caracteristici variabilei aleatoare privind tendinţa centrală de
grupare (valoarea medie, mediana, modulul),
• cunoaşterea indicatoriilor caracteristici variabilei aleatoare privind împrăştierea
distribuţiei variabilei aleatoare (intervalul de variaţie, dispersia, abaterea medie pătratică,
covarianţa, coeficientul de împrăştiere
• cunoaşterea indicatoriilor caracteristici variabilei aleatoare privind forma distribuţiei
(simetria şi asimetria, boltirea);

32
3.1 Indicatorii caracteristici variabilei aleatoare privind tendinţa centrală de
grupare

În practica aplicaţiilor în economie drept indicatori numerici ai tendinţei centrale de


grupare, sunt frecvent folosiţi:
• valoarea medie,
• mediană,
• modul.

 Valoarea medie
Definiţia 3.1.
Se numeşte valoare medie a unei variabile aleatoare X , discrete sau continue,
expresia:
n n
M ( X ) = ∑ pi xi = ∑ xi f ( xi ), (variabila discretă) (3.1)
i =1 i =1

b
M ( X ) = ∫ xϕ ( x)dx , (variabila continuă) (3.2)
a

 Fie variabila aleatoare discretă X dată prin

 −1 0 1 2 
X :  
 0,2 0,1 0,4 0,3 

Vom determina valoarea medie ca:


M ( X ) = 0,2 ⋅ (−1) + 0,1 ⋅ 0 + 0,4 ⋅ 1 + 0,3 ⋅ 2 = 0,8

 Pentru variabila aleatoare continuă

 x 
X :  
− x , x≥0
ϕ ( x) = e 
∞ ∞
vom avea: M ( X ) = ∫ xe − x dx = Γ(2) = 1 , unde Γ(a ) = ∫ x a −1e − x dx este integrala Γ a lui Euler.
0 0

Proprietăţile valorii medii a unei variabile aleatoare sunt:


 media unei constante este constanta însăşi
M (K ) = k .

33
k
K :  
Fie constanta  1  atunci M ( K ) = k ⋅ 1 = k

 media produsului dintre o constantă şi o variabilă aleatoare este egală cu produsul


dintre constantă şi media variabilei aleatoare
M (k ⋅ X ) = k ⋅ M ( X )

 media sumei a două variabile aleatoare este egală cu suma mediilor acestora
M ( X + Y ) = M ( X ) + M (Y )

 media produsului a două variabile aleatoare independente este egală cu produsul


mediilor lor
M ( X ⋅ Y ) = M ( X ) ⋅ M (Y )

 Valoarea mediană
Definiţia 3.2.
Se numeşte mediana variabilei aleatoare X , acea valoare M e pentru care, variabila
aleatoare are aceeaşi probabilitate de a fi mai mică sau mai mare ca ea, adică:
P( X < M e ) = P( X > M e ) (3.3)
Pentru variabilele aleatoare discrete mediana M e se deduce din

F ( M e ) = 1 − F ( M e ), sau 2 F ( M e ) = 1 .

1
fiind soluţia ecuaţiei: F ( x ) =
2
 Pentru variabila aleatoare discretă
 −1 0 1 2 
X :  
 0,2 0,1 0,4 0,3 
avem P( X < 1) = P ( X > 1) = 0.3 . În consecinţă M e = 1
Me 1
 Pentru variabilele aleatoare continue, mediana M e este soluţia ecuaţiei ∫
i
ϕ ( x)dx =
2
.

 Modul (Valoarea cea mai probabilă)


Definiţia 3.3.

34
Se numeşte modul (valoarea cea mai probabilă) variabilei aleatoare X , acea valoare
pentru care funcţia de pobabilitate f ( xi ) în cazul variabilelor aleatoare discrete, respectiv
densitatea de probabilitate ϕ (x ) în cazul variabilelor aleatoare continue este maximă.
Poziţionările celor trei indicatori ai tendinţei centrale de grupare prezentaţi mai sus
(valoarea medie, mediana şi modulul) sunt ilustrate în figura 3.1.
modulul modulul
mediana mediana
media media

a. Repartiţie asimetrică b. Repartiţie asimetrică


(left skewed) (rhight skewed)

Modulul=mediană=medie

c. Repartiţie simetrică

Figura 3.1. Poziţionarea valorii medii, medianei şi modulului pentru repartiţia simetrică şi
repartiţii asimetrice8

După cum se poate observa din figura 3.1.c., în cazul repartiţiei simetrice poziţiile celor
trei indicatori coincid. În cazul repartiţiilor asimetrice poziţiile medianei şi mediei (în această
ordine) se află în stânga modulului în cazul repartiţiei left skewed (figura 3.1.a.) respectiv în
dreapta modulului în cazul repartiţiei right skewed (figura 3.1.b.).

8
Spircu L., “Analiza datelor. Aplicaţii economice”, Editura ASE, Bucureşti 2005, pag. 19

35
3.2 Indicatorii caracteristici variabilei aleatoare privind împrăştierea
distribuţiei variabilei aleatoare

Gradul de împrăştiere a distribuţiei variabilei aleatoare este analizat în raport cu


următoarele caracteristici:
• extinderea sau intervalul de variaţie,
• abaterea, abaterea absolută medie,
• dispersia,
• abaterea medie pătratică,
• covarianţa
• coeficientul de împrăştiere
• normarea unei variabile aleatoare

∗ Extinderea sau intervalul de variaţie


Caracteristica cea mai simplă a împrăştierii unei variabile se obţine calculând extinderea
(amplitudinea, intervalul de variaţie) dată de diferenţa valorilor extreme ale argumentelor
variabilei, aceste argumente fiind considerate ordonate în ordinea mărimii lor naturale.
Definiţia 3.4.
Dacă a şi b sunt cea mai mică, respectiv cea mai mare valoare a argumentului xi al
variabilei aleatoare X , atunci extinderea este prin definiţie valoarea numerică
ω = b − a sau ω = x max − x min (3.4)

Datorită modului de calcul, extinderea nu poate fi utilizată în cazul variabilelor cu intervalul de


variaţie nemărginit.
Cu toate că acestă caracteristică prezintă unele inconveniente printre care faptul că nu
depinde de toate valorile variabilei X , ci numai de cele extreme şi nu arată modul de repartizare
în jurul centrului de grupare, pentru uşurinţa de calcul, extinderea este utilizată în statistica
controlului de fabricaţie în serie.

∗ Abaterea. Abaterea absolută medie


Definiţia 3.5.

36
Fie variabila aleatoare X şi α o valoare oarecare din intervalul de variaţie respectiv,
se numeşte abatere a variabilei X , variabila aleatoare ξ , al cărui argument este dat de
diferenţa dintre argumentul lui X şi α , adică:

 xi − α 
ξ   , (3.5)
 f ( xi ) 
dacă X este variabilă aleatoare discretă, respectiv
 x −α 
ξ   , (3.6)
 ϕ (x) 
dacă X este variabilă aleatoare continuă.

În practică se lucrează de regulă cu variabila aleatoare ξ = X − M ( X ) numită abaterea


variabilei aleatoare X de la media sa µ = M ( X ) .

Teorema 3.1.
Media abaterii unei variabile X calculată faţă de valoarea medie, µ = M ( X ) ,
este nulă.
 xi − µ 
Demonstraţie: Fie variabila abatere ξ   , avem
 f ( xi ) 
n n n
M (ξ ) = ∑ ( xi − µ ) f ( xi ) = ∑ xi f ( xi ) − µ ∑ f ( xi ) = µ − µ = 0
i =1 i =1 i =1

Dacă în locul abaterii variabilei ξ definită mai sus utilizăm abaterea absolută

 xi − µ 
ξ a   vom avea

 f ( x )
i 

∑x
i =1
i − µ ⋅ f ( xi ) în cazul variabilei aleatoare discrete, respectiv

+∞
∫−∞
x − µ ⋅ ϕ ( x)dx, în cazul variabile aleatoare continue,

care nu mai este nulă şi care, poate caracteriza împrăştierea variabilei aleatoare X în jurul valorii
ei medii m.
 Dispersia

37
Pe lângă abaterea medie absolută definită anterior, o măsură larg utilizată a împrăştierilor
valorilor variabilei aleatoare faţă de media sa este dispersia.

Definiţia 3.6.
Se numeşte dispersie a variabilei aleatoare X , media M (ξ 2 ) a pătratului variabilei
aleatoare de abatere ξ :

(x − µ)2 
ξ 2  
 (3.7)
 f ( x ) 
Dispersia variabilei aleatoare X se notează de regulă fie cu σ x2 , fie cu D(X). În
consecinţă avem:
σ x2 = D( X ) = M (ξ 2 ) = M [( X − M ( X )) 2 ] = M ( X 2 ) − M 2 ( X )
Dacă variabila aleatoare X este discretă, atunci:

n
D ( X ) = ∑ ( xi − µ ) 2 ⋅ f ( xi ) , (3.8)
i =1

Dacă variabila aleatoare X este continuă, atunci:


+∞
D( X ) = ∫ ( x − µ ) 2 ⋅ ϕ ( x)dx. (3.9)
−∞

Dispersia are proprietăţile:


 Dispersia unei constante este nulă: D( K ) = 0 . Această proprietate decurge din

proprietatea mediei unei constante M ( K ) = k , de unde rezultă: D( K ) = (k − k ) 2 ⋅ 1 = 0


 Dispersia sumei a două variabile aleatoare independente este egală cu suma dispersiilor
fiecărei variabile în parte
D( X + Y ) = D( X ) + D(Y ) .

Ţinând seama de proprietăţile mediei şi de definiţia dispersiei avem


D( X + Y ) = M (( X + Y ) 2 ) − 2 M ( X + Y ) M ( X + Y ) + M 2 ( X + Y ) =
= M (( X + Y ) 2 ) − M 2 ( X + Y ) = M ( X 2 + 2 XY + Y 2 ) − M 2 ( X + Y ) =
= M ( X 2 ) + M ( X ) M (Y ) + M (Y 2 ) − M 2 ( X ) − M ( X ) M (Y ) − M 2 (Y ) =
= M ( X 2 ) − M 2 ( X ) + M (Y 2 ) − M 2 (Y ) = D( X ) + D(Y )

 Dispersia diferenţei a două variabile aleatoate independente este egală cu suma


dispersiilor lor

38
D( X − Y ) = D( X ) + D(Y ) sau σ x − y = σ x + σ y .
2 2 2

Într-adevăr avem:
D( X − Y ) = D( X + ( −1)Y ) = D( X ) + ( −1) 2 D(Y ) = D( X ) + D(Y )

 Orice translaţie aplicată argumentului unei variabile aleatoare nu schimbă dispersia


variabilei.
D( X + K ) = D( X ) + D( K ) = D( X ), sau σ x + k = σ x2

 Dispersia produsului dintre o constantă şi o variabilă aleatoare este egală cu produsul


dintre dispersia variabilei şi pătratul constantei
D( K ⋅ X ) = k 2 ⋅ D( X ) sau σ kx2 = k 2 ⋅ σ k2

 Pentru orice transformare liniară aplicată asupra argumentului, de forma: Y = aX + b ,


avem:
D(Y ) = a 2 ⋅ D( X ) . sau σ aX
2
+b = a ⋅ σ x .
2 2

 Generalizând pentru un sistem { X k } de n variabile mutual independente, asupra cărora

se aplică transformarea liniară a k X k + bk avem:

n  n
D ∑ (a k X k + bk ) = ∑ a k2 ⋅ D( X k ).
 k =1  k =1
Teorema 3.2.
Dispersia mediei aritmetice a n variabile independente X j , j = 1, n care

urmează aceeaşi lege de distribuţie, este egală cu dispersia uneia din variabilele împarţită la
numărul variabilelor.

Demonstraţie:
 n 
∑ Xk 
= 1
n
n ⋅ D( X ) D( X )
D k =1 ∑ D( X )= = .
 n  n2 k =1
k
n2 n
 
 

∗ Abaterea medie pătratică


Definiţia 2.15.

39
Se numeşte abaterea medie pătratică a variabilei X sau abaterea medie tip
(standard) valoarea medie de ordinul doi a abaterii, adică:

σ x = M (ξ 2 ) = D ( X ) (3.10)

Consecinţa teoremei 2.2.


Abaterea medie pătratică a mediei aritmetice a n variabile
independente X j , j = 1, n care urmează aceeaşi lege de distribuţie, este dată de relaţia

D( X ) D( X ) σx
σ X = D( X ) = = = . (3.11)
n n n

∗ Covarianţă
Definiţia 2.16.

Se numeşte covarianţă a două variabile aleatoare X şi Y , şi se notează cu


cov( X , Y ) = σ xy , moment centrat mixt al celor două variabile

σ xy = M [( X − µ x ) ⋅ (Y − µ y )] , unde µ x = M ( X ), µ y = M (Y ) (3.12)

Dezvoltând produsul valorilor centrate şi aplicând operatorul de medie, se obţine formula


de calcul:
σ xy = M ( X ⋅ Y ) − M ( X ) ⋅ M (Y ) (3.13)

Observaţie: Dacă variabilele X şi Y sunt independente, atunci σ xy = 0 .

∗ Coeficientul de împrăştiere
Coeficientul de împrăştiere al unei variabile aleatoare X se exprimă ca raport dintre o
valoare a împrăştierii şi o mărime de aceeaşi natură şi are rolul de a înlătura influenţa naturii
variabilei aleatoare X asupra măsurii împrăştierii respective.
În practică, o expresie a coeficientului de împrăştiere frecvent utilizată este:
σx
V= ⋅ 100 . (3.14)
µx

∗ Normarea unei variabile aleatoare


Definiţia 2.17.
Fiind dată variabila aleatoare X , transformata

40
X − µx
Z= (3.15)
σx
este numită normarea variabilei X la variabila Z .

Variabila normată Z are proprietăţile:


- valoarea medie a variabilei normate este nulă.

 X − µ  M (X ) − µ
M (Z ) = M  = = 0. (3.16)
 σ  σ
- dispersia şi abaterea medie pătratică ale variabilei normate sunt egale cu unitatea.

 X − µ  D( X ) σ
2
D( Z ) = D = = 2 = 1. (3.17)
 σ  σ2 σ

3.3 Particularităţi ale formei de distribuţie

Principalele caracteristici ale formei distribuţiei unei variabile aleatoare sunt:


• simetria şi asimetria
• boltirea

 Simetria şi asimetria
Distribuţia unei variabile aleatoare X definită de funcţia f(x), este simetrică faţă de
valoarea medie m, dacă este satisfăcută de relaţia f (µ − ξ ) = f (µ + ξ ) , pentru orice abatere
ξ = x−µ.
Grafic aceasta înseamnă că, dacă două puncte M 1 si M 2 simetrice faţă de dreapta x = µ ,
de ordonate egale, se situează pe curba distribuţiei aceasta este simetrică, iar în caz contrar
distribuţia este asimetrică .
Pentru o distribuţie simetrică, media, mediana şi modul (pentru distribuţia unimodală) au
aceeaşi valoare.
Se dovedeşte că momentele centrate de ordin impar ale oricărei distribuţii simetrice sunt
nule.

41
Coeficientul care măsoară asimetria este notat cu α, şi este definit astfel ca pentru α = 0,
distribuţia să fie simetrică, iar pentru α ≠ 0, distribuţia este asimetrică.
Sunt folosiţi cu deosebire următorii coeficienţi de asimetrie:
M (X ) − M0 (X )
α1 = ( Pearson) , (3.18)
σx
µ3
α2 = ( Fisher) (3.19)
σ3

În cazul simetriei α 1 = 0, α 2 = 0, Reciproca nu este adevărată.

 Boltirea (Turtirea)
Curbele de distribuţie pot avea boltiri sau turtiri diferite. Coeficientul de boltire folosit
este
µ4
β= (Fisher). (3.20)
σ4
Boltirea unei distribuţii oarecare se compară de obicei cu distribuţia normală9 pentru
care β = 3.
Diferenţa E = β – 3 este numită excesul distribuţiei.
Dacă E > 0, (deci β > 3), distribuţia este numită de tip leptokurtic.
Dacă E < 0, (deci β < 3), distribuţia este numită de tip platykurtic.

Lucrare de verificare 3A

Răspundeți pe scurt la următoarele întrebări:


1. Care sunt indicatorii caracteristici variabilei aleatoare privind tendinţa centrală de
grupare?
2. Care sunt indicatorii caracteristici variabilei aleatoare privind împrăștierea dsitribuției
variabilei aleatoare?
3. Care sunt indicatorii caracteristici variabilei aleatoare forma distribuției?
4. Cum se definește mediana?
5. Cum se definește modulul?

9
Vezi în Capitolul III, “Distribuţiile clasice – baza verificării ipotezelor statistice în comerţ- turism-sevicii”,
subcaputolul 3.2.1., “Repartiţia normală normată ( Z )”.

42
6. Cum se definește dispersia?
7. Cum se definește abaterea medie pătratică?

Test de autoevaluare 3B

1. Modulul reprezintă:
a. Valoarea cea mai des întânită într-o serie statistică;
b. Valoarea din mijlocul unei serii statistice, în care observațiile au fost ordonate
crescător;
c. Valoarea cea mai puțin întânită într-o serie statistică;
d. Valoarea care imparte distribuția seriei statistice în două părți de volum egal;

2. Modulul reprezintă:
a. Valoarea cea mai des întânită într-o serie statistică;
b. Valoarea din mijlocul unei serii statistice, în care observațiile au fost ordonate
crescător;
c. Valoarea cea mai puțin întânită într-o serie statistică;
d. Valoarea care imparte distribuția seriei statistice în două părți de volum egal;

3. Repartiția pe gupe de vărstă a personalului dintr-o unitate școlară se prezintă în


tabelul de mai jos:
Vârsta (ani) 15-25 25-35 35-45 45-55 55-65
Nr. Pers. 7 12 20 8 3

Se obțin următăoarele valori pentru indicatorii tendinței centrale de grupare a


variabilei aleatoare:
a. Media 32,6 ani, mediana 33,25 ani și modulul 35 ani.
b. Media 38,25 ani, mediana 39 ani și modulul 37,6 ani;
c. Media 37,6 ani, mediana 38,25 ani și modulul 39 ani;
d. Media 35,6 ani, mediana 37,25 ani și modulul 38 ani.

4. Repartiția pe gupe de vărstă a personalului dintr-o unitate școlară se prezintă în


tabelul de mai jos:

43
Vârsta (ani) 15-25 25-35 35-45 45-55 55-65
Nr. Pers. 7 12 20 8 3

Se obțin următăoarele valori pentru indicatorii sintetici ai variației:


a. dispersia medie liniară 9,58 ani, dispersia 10,68 ani și abaterea medie 114,24
pătratică ani.
b. dispersia medie liniară 8,58 ani, dispersia 114,24 și abaterea medie pătratică 10,68
ani;
a. dispersia medie liniară 9,58 ani, dispersia 100,18 și abaterea medie pătratică 12,18
ani;
c. dispersia medie liniară 10,68 ani, dispersia 9,58 și abaterea medie pătratică 114,24
ani.

5. În scopul analizei situației financiare a unui lanț hotelier, la un moment dat, se


efectuează un sondaj simplu pe un eșantion de 30 de angajați, privind numărul de ore
suplimentare lucrate de aceștia și s-au obținut următoarele date:
Grupe de angajați după numărul 2-6 6-10 10-14 14-18 18-22
de ore suplimentare lucrate
Nr. angajați 9 10 5 4 2

Se obțin următăoarele valori pentru indicatorii tendinței centrale de grupare a


variabilei aleatoare:
b. Media 8,3 angajați, mediana 9,6 angajați și modulul 5,66 angajați.
c. Media 9,3 angajați, mediana 8,6 angajați și modulul 6,66 angajați.
d. Media 8,6 angajați, mediana 9,3 angajați și modulul 6,66 angajați.
e. Media 6,66 angajați, mediana 8,6 angajați și modulul 9,3 angajați.

6. Pentru analiza de la întrebarea numărul 5 putem afirma următoarele:


a. seria este neomogenă, variaţia este mare, media nu este reprezentativă;
b. seria este omogenă, variaţia este mică, media este reprezentativă;
c. seria este neomogenă, variaţia este mică, media este reprezentativă;
d. seria este omogenă, variaţia este mică, media nu este reprezentativă;

44
7. Distribuţia elevilor unei clase de liceu în funcţie de numărul de absențe dintr-o lună se
prezintă astfel:
Nr. de absențe cumulate 14 15 16 17 18 19 20
Nr. elevi 2 6 10 15 8 5 4

Se obțin următoarele valori pentru indicatorii tendinței centrale de grupare a


variabilei aleatoare:
a. Media 15,04 absențe, mediana 15 absențe și modulul 15 zile;
b. Media 17,04 absențe, mediana 17 absențe și modulul 17 zile;
c. Media 17,04 absențe, mediana 16,5 absențe și modulul 17 zile;
d. Media 17,04 absențe, mediana 17,5 absențe și modulu5l 17, zile.

8. Un studiu efectuat asupra unui număr de 50 de firme comerciale a reliefat următoarele


informaţii cu privire la valoarea vânzărilor lunare (mii RON) , astfel:
Gruparea firme comerciale după 75-85 85-95 95-105 105-115 115-125
valoarea vânzărilor
Nr. firme 5 10 15 14 6

Se obțin următăoarele valori pentru indicatorii tendinței centrale de grupare a


variabilei aleatoare:
a. Media 101,2 firme, mediana 102 firme și modulul 103,3 firme;
b. Media 102 firme, mediana 101,2 firme și modulul 101,2 firme;
c. Media 101 firme, mediana 102 firme și modulul 102 firme;
d. Media 101 firme, mediana 101 firme și modulul 101,2 firme;

9. Un studiu efectuat asupra unui număr de 50 de firme comerciale a reliefat următoarele


informaţii cu privire la valoarea vânzărilor lunare (mii RON) , astfel:
Gruparea firme comerciale după 78-85 85-95 95-105 105-115 115-125
valoarea vânzărilor
Nr. firme 5 10 15 14 6

45
Se obțin următăoarele valori pentru indicatorii sintetici ai variației:
a. dispersia 132,16 și abaterea medie pătratică 12,8 firme;
b. dispersia 11,6 și abaterea medie pătratică 134,56 firme;
c. dispersia 134,56 și abaterea medie pătratică 11,6 firme;
d. dispersia 13,56 și abaterea medie pătratică 1,6 firme.

10. Pentru studiul de la întrebarea numărul 9 putem afirma următoarele:


a. seria este neomogenă, variaţia este mare, media nu este reprezentativă;
b. seria este omogenă, variaţia este mică, media este reprezentativă;
c. seria este neomogenă, variaţia este mică, media este reprezentativă;
d. seria este omogenă, variaţia este mică, media nu este reprezentativă;

Rezumat

O variabilă aleatoare discretă se caracterizează prin funcţie sa de repartiţie şi o anumită


distribuţie. Fie X o variabilă aleatoare discretă cu xi , i = 1, n , valoarea acesteia la un moment dat
şi evenimentul ( X = xi ) cu probabilitatea P( X = xi ) = f ( xi ) = pi . Mulţimea perechilor ordonate
(xi , f (xi ))i =1,n se numeşte distribuţia variabilei aleatoare discrete.
Principalii indicatori ai tendinţei centrale a distribuţiei variabilei aleatoare sunt: valoarea
medie, mediana (acea valoare pentru care, variabila aleatoare are aceeaşi probabilitate de a fi
mai mică sau mai mare ca ea) şi modulul (valoarea cea mai probabilă).
Gradul de împrăştiere a distribuţiei variabilei aleatoare este analizat în principal cu
ajutorul indicatorilor: extinderea sau intervalul de variaţie,abaterea, abaterea absolută medie,
dispersia, abaterea medie pătratică şi coeficientul de împrăştiere.
Pentru evidenţierea anumitor particularităţi ale formei distribuţiei variabilelor aleatoare se
utilizează parametrii: simetria (asimetria) şi boltirea (turtirea).
X − µx
De asemenea pentru o variabilă aleatoare discretă X , se defineşte transformata Z =
σx
numită normata variabilei X . Variabila aleatoare normată (Z) are media zero şi abaterea medie
pătratică egală cu 1.

46
Bibliografie

Gogonea R.M., Zaharia Econometrie cu aplicaţii în activitatea de comerţ-turism-


M. servicii, Editura Universitară, Bucureşti, 2008,
Pecican Şt. E. Econometrie pentru...economişti, Editura Economică
Bucureşti, 2007

Stewart J. Econometrics, Ph.Allan, London, 1991

Şerban R. Teoria probabilităţilor şi statistică Matematică, Editura


Dacia Nova, 2001

Voineagu V, Ţiţan E., Teorie şi practică econometrică, Editura Meteor Press,


Şerban R., Ghiţă S., 2007
Tudose D., Boboc C.,
Pele D.

47
Unitatea de învăţare 4
DISTRIBUŢIILE CLASICE ÎN VERIFICAREA IPOTEZELOR
STATISTICE

Cuprins
Unitatea de învăţare 4 DISTRIBUŢIILE CLASICE ÎN VERIFICAREA IPOTEZELOR
STATISTICE ................................................................................................................................ 48
Obiectivele Unităţii de Învăţare 4 ............................................................................................. 48

4.1 Repartiţia normală normată (Z ) .......................................................................................... 53

4.2 Repartiţia χ
2
...................................................................................................................... 53
4.3 Repartiţia Student ( t ) .......................................................................................................... 55
4.4 Repartiţia Fisher-Snedecor ( F ) ......................................................................................... 56
Lucrare de verificare 4A ........................................................................................................... 57
Test de autoevaluare 4B ............................................................................................................ 57
Rezumat ..................................................................................................................................... 60
Bibliografie................................................................................................................................ 61

Obiectivele Unităţii de Învăţare 4

Dupa studiul acestei unităţi de învăţare cursanţii vor avea cunoştinţe despre:
• Repartiţia normal normată Z ;

Repartiţia χ
2

• Repartiţia Student t
• Repartiţia Fisher-Snedecor F

4.1 Repartiţia normală normată (Z )

48
Aplicarea unui model teoretic conduce la obţinerea unor rezultate care, deşi sunt
orientative, totuşi au un grad ridicat de utilitate.
În acest context, în multe situaţii, sunt utilizate repartiţiile teoretice pentru conturarea cât
mai exactă a rezultatelor necesare pentru definitivarea deciziilor manageriale.
Repartiţia normală normată este întâlnită şi sub numele de repartiţia normală standard sau
repartiţia normală redusă, tocmai pentru că redă un caz particular al repartiţiei normale.
Denumită şi repartiţia Gauss-Laplace, repartiţia normală este exprimată printr-o variabilă
aleatoare X cu media m şi dispersia σ 2 , normată X~N ( µ , σ 2 ), a cărei funcţia de repartiţie este:
(t −m)2
1 −
F (x) = P (X<x) = ∫ x
⋅e 2σ 2
dt, (4.1)
−∞ σ 2π
 x ∈ R, σ > 0
cu 
µ , σ − parametrii fun ct iei de repartitie [ M ( X ) = µ şi D ( X ) = σ ]
2 2

Conturarea mai clare a repartiţiei normale are în vedere următoarele proprietăţi:


PN1. Variabilei aleatoare X cu repartiţia N( µ , σ 2 ) îi corespunde:

 momente centrale
− de ordin impar egale cu zero : µ 2 K +1 = 0

 (2 K )!
− de ordin par : µ 2 K = 2 K ⋅ K ! ⋅ σ
2K

 coeficenţi de asimetrie şi boltire: B1 = 0 şi B2 = 3


PN2. Suma unor variabile independente repartizate normal este tot o variabilă aleatoare
repartizată normal
 X = X 1 + X 2 + ... + X K
 , unde:
 X ~ N (µ,σ )
X 1 , X 2 , ..., X K sunt variabile independente cu repartiţii normale având media µ i şi

dispersia σ i2
K K
µ = ∑ µ i şi σ 2 = ∑ σ i2
i =1 i =1

PN3. Pentru o combinaţie liniară finită de variabile aleatoare independente, proprietatea


anterioară poate fii transpusă astfel: dacă X 1 , X 2 , ..., X K sunt variabile aleatoare

49
independente repartizate normal cu media µi şi dispersia σ i2 , atunci suma

α 1 X 1 + α 2 X 2 + ... + α K X K = X este o variabilă aleatoare repartizată normal X~N ( µ , σ 2 ),


K K
unde µ = ∑ α i µ i şi σ 2 = ∑ α i2σ i2
i =1 i =1

Repartiţia normală normată se prezintă grafic printr-o curbă normală care se numeşte şi
clopotul lui Gauss, datorită următoarelor caracteristici:
- reprezentarea este simetrică faţă de dreapta x = µ , iar cele două părţii ale curbei tind
asimptotic spre axa absciselor Ox.
- distribuţia fiind unimodală, valoarea maximă va fii atinsă pentru x = µ în punctul:
1
σ 2π

a) deplasare spre b) deplasare spre stânga

Figura 4.1. Deplasarea curbei repartiţiei normale


pentru σ constant şi µ variabil
- punctele de inflexiune ale graficului sunt ( µ - σ ) şi ( µ + σ ), deoarece în respectivele
punce convexitatea curbei se modifică în concavitate.
- dacă abaterea standard este constantă σ , modificarea mediei ( µ ) determină o translaţie
a curbei prin Ox spre dreapta (figura 4.1.a) sau spre stânga (figura 4.1.b) fără să-şi
schimbe forma.
- dacă media ( µ ) este constantă, atunci modificarea abaterii standard ( σ ) determină o
modificare a formei curbei (figura 4.2); modificarea constă în „ascuţiunea” sau
aplatzarea acesteia, după cum are loc micşorarea sau creşterea valorii parametrului
σ .

50
Figura 4.2. Modificarea curbei repartiţiei normale
pentru σ variabil şi m constant
Un exemplu de curbă Gauss-Laplace pentru o repartiţie normală X ~ N (1,5;1) prezentat în
figura 4.3

0,4

0,2

-0,5 0,5 1,5 2,5 3,5

Figura 4.3. Curba normală10 cu µ = 1,5 şi σ = 1


Ultima proprietate a repartiţiei normale prin transformarea de variabilă definită
X −µ
Z= (4.2)
σ
reprezintă fundamentul formării repartiţiei normale reduse (normată) Z
Definiţia 4.1.
Variabila aleatoare Z are o repartiţia normală normată cu media zero şi dispersia egală
cu 1 având funcţia de repartiţie N (z;0,1) .
Graficul repartiţiei normale (figura 2.8) este simetric faţă de axa ordonatelor yy’, iar
valoarea maximă este atinsă în punctul f(0)=0,3989 ≅ 0,4. Punctele de inflexiune sunt z = -1 şi z
= +1.
10
După Clocotici V., Stan A., Statistică aplicată în psihologie, pag. 132.

51
0,4

0,2

-2 -1 1 2

(− z ) (+ z )
Figura 4.4. Graficul funcţiei de repartiţie normală normată
Funcţia de repartiţie a variabilei aleatoare normală normată este:
u2
1 −
F ( z) = ∫ e
z 2
du (4.3)
2π −∞

Deoarece curba este simetrică, deci F (0) = 0,5, din definiţia funcţiei repartiţiei avem:
F ( z ) = P (Z < z ) = α

Importantă din punct de vedere aplicativ este şi funcţia φ (z) ce prezintă aria de sub
ramura pozitivă a densităţii şi probabilităţii (figura 4.5) care se stabileşte în raport cu funcţia de
repartiţie normală redusă astfel:
1
φ ( z) = F ( z) − , z ≥ 0 (4.4)
2

f (z )

Φ(z )

-2 2

Figura 4.5. Graficul funcţiei Φ (z )


Valorile funcţiilor de repartiţie F (z ) şi φ ( z ) sunt tabelate.

52
În această carte, este prezentată o Anexă 1 cu un tabel în care sunt incluse valorile
funcţiei φ (z ) .

Repartiţia χ
2
4.2

Ea reprezintă o repartiţie a unei variabile aleatoare determinată ca o sumă a pătratelor


unor variabile aleatoare independente repartizate normal standard:
χ 2 = Z12 + Z 22 + ... + Z r2 ,
unde Z1 , Z 2 ,..., Z r sunt variabile aleatoare independente cu repartiţia N(0,1).
În raport cu densitatea de probabilitate, respectiv funcţia de repartiţie se poate construi
graficul repartiţiei χ 2 .

Definiţia 2.19.
Densitatea de probabilitate ϕ ( χ 2 ; a, g) a repartiţiei χ 2 este:
g x
1 −1 −
ϕ ( x) = g
⋅ x2 ⋅e 2a2
, x≥ 0 (4.5)
g
2 ⋅ a ⋅ Γ 
2 g

2
unde: g – gradele de libertate ale repartiţiei
Γ - repartiţia Gamma
În cazul repartiţiei χ 2 întâlnim următoarele situaţii:

• dacă a=1 şi x ≥ 0 , atunci densitatea de repartiţie devine:


g x
1 −1 −
ϕ ( x, g ) = g
⋅x 2
⋅e 2
(4.6)
g
2 ⋅ Γ 
2

2
• dacă x < 0 , atunci ϕ ( x, g ) =0.
Funcţia de repartiţie este:
x
F ( x) = ∫ ϕ (t , g )dt
−∞

Graficul repartiţiei χ 2 se construieşte în funcţie de valorile parametrilor a şi g .


Parametrul g reprezintă numărul gradelor de libertate, adică numărul variabilelor independente
care au în vedere mărimea luată în considerare, a căror variaţie nu admite nici o restricţie.
53
Pentru a = 1 şi g = 2, 4, 6, 15 graficul repartiţiei χ 2 se prezintă în figura 4.6.

Indicatorii statistici caracteristici sunt: M (χ 2 ) = g şi D 2 (χ 2 ) = 2 g


Observaţie
Dacă g > 30 , atunci χ 2 se apropie de graficul distribuţiei normale.

Pentru repartiţia χ 2 , valoarea tabelară sau teoretică este de forma: χ12−α ,n −1 , χ 2 α ,


1− , n −1
2

χ α2 , χ α2 , n −1 , unde n − 1 = g reprezintă numărul gradelor de libertate.


, n −1
2

f (x : g ,1)
g =2
g =4
0,2
g =6

g = 15

0,1

x
5 10 20

Figura 4.6. Graficul distribuţiei χ 2

Valorile teoretice sau tabelare ale lui χ 2 se preiau din Tabela χ 2 , prezentată în Anexa 2

în care funcţia de probabilitate este P (χ 2 > χ 02 ) = α

Repartiţia χ 2 este întotdeauna pozitivă, neexistând ramura ei negativă, ceea ce determină

o notare inversată a valorilor critice din stânga graficului. În locul lui − χ α2 ,n −1 există χ 12−α ,n −1 şi

nu se folseşte − χ α2 , în locul său fiind utilizat χ 2 α .


, n −1 1− ,n −1
2 2

54
4.3 Repartiţia Student ( t )

Această repartiţie a apărut din necesitatea de a studia în profunzime informaţiile privind


colectivităţile statistice prin caracteristica de a admite probabilităţi mai mari de eroare.
Ca şi în repartiţia χ 2 , repartiţia Student depinde de un singur parametru denumit numărul
gradelor de libertate notat cu „g”.

Definiţia 2.20.
Distribuţia Student este acea distribuţie a cărei densităţi de probabilitate este dată de
funcţia:
 g +1
Γ 
ϕ (t , g ) =
1
⋅  2 

1
, (4.7)
g +1
gπ g
Γ   t  2 2

 2  1 + 
 g
unde Γ ( x ) = funcţia gamma.
Funcţia de repartiţie a distribuţiei Student este:
x
F ( x) = ∫ ϕ (t , g )dt (4.8)
−∞

Principalii indicatori statistici caracteristici ai repartiţiei Student sunt:


• M (t) = 0
g
2
• D (t) = , unde g > 2
g −2

Observaţie
Dacă g > 30 , atunci lim f (t , g ) ≈ N (t ;0,1) , deci repartiţia Student (figura 4.7) este
g →∞

aproximativ o repartiţie normală.

55
ϕ
0,4
distribuţia t
distribuţia N (x;0,1)

0,2

x
-2 -1 1 2

Figura 4.7. Graficul distribuţiei t pentru g > 30

Valorile pentru care P( t < tα , g ) = α există ( tα ,n −1 , t α ) şi pot fi preluate din Tabelul


, n −1
2

distribuţiei Student, t (Anexa 3), cu menţiunea că, acele valori α şi g care nu există în tabel se
utilizează aproximarea normală standard.

4.4 Repartiţia Fisher-Snedecor ( F )

Această repartiţie are în vedere compararea mediilor populaţiilor normale luând în


considerare împrăştierea datelor ambelor colectivităţi (dispersiile colectivităţilor).
Dacă repartiţiile χ 2 şi t depind de un parametru g , repartiţia F se stabileşte în funcţie de
doi parametri g1 şi g 2 având semnificaţia unor grade de libertate. Acestea se formează pe baza
unei variabile aleatoare ce are valoarea câtului altor două astfel de variabile ( g1 - numărul
gradelor de libertate pentru numărător, g 2 - numărul gradelor de libertate pentru numitor).
Repartiţia F reprezintă o variabilă aleatoare X care se formează astfel:
y g
X = 1⋅ 2 ,
y 2 g1

unde: y1 , y 2 sunt variabile aleatorii independente repartiţiei χ 2 , cu g1 şi g 2 grade de libertate.

Definiţia 2.21.
Vom spune despre o variabilă aleatoare că are distribuţie Fisher-Snedecor dacă funcţia
densitatea de probabilitate a acesteia este de forma:

56
 g + g2 
Γ 1  g1 g2
g1
−1

ϕ (F ) =  2  ⋅ g1 ⋅ g 2 ⋅
2 2
F 2
, F≥ 0 (4.9)
g1 + g 2
 g1   g 2 
Γ  ⋅   ( g1 + g 2 ) 2
F

 2  2 
unde: Γ ( p ) - funcţia Gamma
g1 şi g 2 - numărul gradelor de libertate
Funcţia de repartiţie este:

P( F > F0 ) = ∫ ϕ ( F )dF = δ
0

ale cărei valori se regăsesc în Tabelul repartiţiei F (Fisher-Snedecor) prezentată în Anexa 4.


Indicatorii statistici caracteristici ai repartiţiei F sunt:
g2
M (F) = (4.10)
g2 − 2
2 g 22 ( g1 + g 2 − 2)
D 2 (F) = , pentru g 2 > 2 (4.11)
g 1 ( g 2 − 4)( g 2 − 2) 2
Deoarece repartiţia F nu este simetrică, între valorile critice există relaţia:
1
F1−α ; g1 ; g 2 = (1.12)
Fα ; g1g 2
Aplicabilitatea repartiţiilor teoretice este evidenţiată în următoarele capitole pentru a reflecta
necesitatea cunoaşterii lor cât mai profunde, în vederea utilizării lor corecte, în diferite ipostaze
practice ale fenomenelor şi proceselor economice.

Lucrare de verificare 4A

Răspundeţi pe scurt la următoarele întrebări:


1. Cum definiţi repartiţia normal normată Z ?

2. Cum definiţi repartiţia χ ?


2

3. Cum definiţi repartiţia Student ?


4. Cum definiţi repartiţia Fisher-Snedecor F?

Test de autoevaluare 4B

1. Repartiţia normală normată este întâlnită şi sub numele de:


a. repartiţia normală standard sau repartiţia normală redusă;

57
b. distribuţie normală;
c. repartiţia Gauss-Laplace;
d. repartiţia student.

2. Variabila aleatoare Z are o repartiţie normată cu:


a. modulul 1 şi dispersia 2;
b. media 1 şi dispersia 2;
c. media 0 şi dispersia egală cu 1;
d. modulul 0 şi dispersia 1.

3. Care afirmaţie este adevărată:


a. repartiţia normală normată se prezintă grafic printr-o curbă normală care se
numeşte şi clopotul lui Gauss;
b. repartiţia normală normată se prezintă grafic printr-o linie dreaptă denumită şi
dreapta de regresie;
c. repartiţia normală normată se prezintă grafic printr-o curbă normală care se
numeşte şi curba lui Koch;
d. repartiţia normală normată se prezintă grafic printr-o linie dreaptă denumită şi
dreapta de regresie.

4. Repartiţia χ 2 este întotdeauna:


a. pozitivă;
b. negativă;
c. cuprinsă între 0 şi 1;
d. cuprinsă între -1 şi 1.

5. Repartiţia χ 2 reprezintă o repartiţie a unei variabile aleatoare determinate ca o:


a. dieferenţă a pătratelor unor variabile aleatoare independente repartizate normal
standard;
b. sumă a pătratelor unor variabile aleatoare independente repartizate normal
standard;

58
c. sumă a unor variabile aleatoare independente repartizate normal standard;
d. dieferenţă a unor variabile aleatoare independente repartizate normal standard.

6. Pentru repartiţia χ 2 , valoarea tabelară sau teoretică este de forma:

a. χ 12−α ,n , χ 2 α , χ α2 , χ α2 ,n ;
1− , n ,n
2 2

b. χ α2 ,n −1 , χ α2 , χ α2 , χ α2 , n−1 ;
, n −1 , n −1
2 2

c. χ 12−α ,n −1 , χ 2 α , χ α2 , χ α2 , n−1 ;
1− , n −1 ,n −1
2 2

d. χ12−α , χ 2 α , χ α2 , χ α2 ;
1−
2 2

7. Ce afirmaţie este adevărată:


a. repartiţia χ 2 este întotdeauna negativă, neexistând ramura ei pozitivă, ceea ce
determină o notare inversată a valorilor critice din dreapta graficului;
b. repartiţia χ 2 poate lua atât valori positive cât și valori negative;

c. repartiţia χ 2 este întotdeauna pozitivă, neexistând ramura ei negativă, ceea ce


determină o notare inversată a valorilor critice din stânga graficului;
d. repartiţia χ 2 ia valori cuprinse în intervalul [0;1].

8. Repartiţia Student depinde de un singur parametru denumit:


a. numărul gradelor de libertate;
b. nivel de încredere;
c. variabilă aleatoare;
d. coeficient de încredere.

9. Repartiţia F (Fisher-Snedecor) are în vedere:


a. compararea mediilor populaţiilor normale luând în considerare dispersiile
colectivităţilor;

59
b. compararea mediilor populaţiilor normale luând în considerare modulul
colectivităţilor;
c. însumarea mediilor populaţiilor normale;
d. compararea mediilor populaţiilor normale luând în considerare împrăştierea
datelor ambelor colectivităţi.

10. Repartiţia F (Fisher-Snedecor) se stabileşte în funcţie de:


a. doi parametrii;
b. un parametru;
c. 3 parametrii;
d. nici un parametru.

Rezumat

Principalele repartiţii de probabilitate utilizate în testarea şi studiul ipotezelor şi


modelelor econometrice sunt distribuţia normală normată (Z), distribuţia Student (t), distribuţia
χ 2
şi distribuţia Fisher-Snedecor (F).
u2
1 −
Funcţia de repartiţie a variabilei aleatoare normală normată este F ( z ) = ∫ e
z 2
du .
2π −∞

Importantă din punct de vedere aplicativ este şi funcţia φ (z) (funcţia integrală a lui Laplace)
1
astfel încât F ( z) = + φ ( z ), z ≥ 0 . Valorile Foncţiilor φ (z) şi F(z) sunt tabelate (Anexa 1).
2
Repartiţia χ 2 este întotdeauna pozitivă. Valoarile tabelate ale repartiţiei χ 2 , sunt de

forma χ α2 , n−1 , unde n − 1 = g este numărul gradelor de libertate şi sunt prezentate în Anexa 2.

Repartiţia Student (ale cărei valori tabelate se găsesc în Anexa 3)este utilizată atunci când
numărul numărul gradelor de libertate este relativ mic (uzual) sub 30. Dacă g tinde către infinit
repartiţia Student converge către repartiţia normală normată.
y1 g 2
Repartiţia F caracterizează o variabilă aleatoare X de forma: X = ⋅ , unde: y1 , y 2 sunt
y 2 g1

variabile aleatorii independente de repartiţie χ 2 , cu g1 şi g 2 grade de libertate. Valorile tabelate


ale acesteia se află în Anexa 4.

60
Bibliografie

Cristache S.E., Şerban Lucrări aplicative de statistică şi econometrie pentru


D. administrarea afacerilor, Editura ASE, Bucureşti, 2007

Clocotici V. Statistică aplicată în psihologie, Editura Polirom,


Bucureşti, 2000

Cristache S.E., Şerban Lucrări aplicative de statistică şi econometrie pentru


D. administrarea afacerilor, Editura ASE, Bucureşti, 2007

Dougherty Ch. Introduction to Econometrics, Oxford University Press,


2007

Gogonea R.M. STATISTICA. Baza teoretico-aplicativă pentru comerţ-


servicii- turism, Editura Universitară, Bucureşti, 2009

HsiaoJohnston J., Econometric Methods, New York:McGraw-Hill, 1997


Dinardo J.,
Isaic-Maniu A., Mitruţ
Statistică, Editura Universitară, Bucureşti, 2003
C.,
Voineagu V.
Jaba E. Statistică, Editura Economică, Bucureşti, 1998

Statistică,ediţia a treia-revizuită, Editura Economică,


Jaba E.
Bucureşti, 2002

61
Unitatea de învăţare 5
IPOTEZE STATISTICE-ASPECTE TEORETICE

Cuprins

Obiectivele Unităţii de Învăţare 5 .................................................................................................. 62


5.1 Inferenţa statistică ..................................................................................................................... 62
5.2 Metodologia testării ipotezelor statistice ................................................................................. 64
5.3 Tipuri de teste utilizate la testarea ipotezelor statistice .......................................................... 70
Lucrare de verificare 5A ................................................................................................................. 73
Test de autoevaluare 5B ................................................................................................................. 74
Rezumat ........................................................................................................................................... 76
Bibliografie ...................................................................................................................................... 77

Obiectivele Unităţii de Învăţare 5

Dupa studiul acestei unităţi de învăţare cursanţii vor avea cunoştinţe despre:
• Inferenţa statistică;
• Ipoteza statistică;
• Elementele teoretice care intervin în testarea ipotezelor statistice sunt:
• ipotezele: nulă şi alternativă;
• limita de semnificaţie şi valori critice de respingere;
• regiune de respingere (critică);
• statistica testului;
• verificarea ipotezei.

5.1 Inferenţa statistică

62
Metodologia corelaţiei simple liniare a cercetării ştiinţifice este precedată de o treaptă
esenţială care vizează stabilirea şi confirmarea sau infirmarea unor ipoteze ce cuprind anumite
aspecte importante necesar a fi studiate în legătură cu procesul sau fenomenul analizat.
Această treaptă include metode denumite inferenţiale deoarece, prin intermediul acestora,
se estimează caracteristicile unor colectivităţi statistice.
Definiţia 5.1. Inferenţa este o operaţiea logică de trecere de la un enunţ la altul şi în care
ultimul enunţ este dedus din primul.
Din punctul de vedere al acestei lucrări enunţurile sunt reprezentate prin ipoteze
statistice, iar inferenţa este reprezentată de procesul de extindere la nivelul colectivităţii generale
Γ a unor rezultate obţinute dintr-o subcolectivitate reprezentaivă γ ⊂ Γ (figura 5.1).

Subcolectivitatea reprezentativă γ este rezultatul unor observaţii efectuate prin aplicarea


unui procedeu de extragere adecvat cerinţelor.
Definiţia 5.2. Prin ipoteză vom înţelege o presupunere cu caracter provizoriu, formulată pe baza
unor date exterimentale existente la un moment dat
Ipoteza statistică este reflectată printr-o presupunere enunţată pe baza unei acţiuni
desfăşurate în cadrul unui fenomen sau proces, care ulterior este supusă unui proces de verificare
statistică.

63
Extragere subpopulaţie

Subcolecti
Extindere Rezultate Colectivitate
vitate Estimare statistică

γ Γ

(eşantion
INFERENŢĂ

Particular Inducţie General

Figura 5.1. Procesul inferenţei statistice

Practic, ipoteza statistică vizează o caracteristică a populaţiei (colectivităţii statistice) Γ


pe care, pe baza datelor din eşantionul reprezentativ γ şi a unor metode specifice, este valiată
(adoptată) sau nu (respinsă).
Aplicarea inferenţei statistice are la bază procedeul testării ipotezelor statistice, care va fi
descris pe larg în continuare.

5.2 Metodologia testării ipotezelor statistice

Testarea ipotezelor statistice reprezintă o componentă a influenţei prin circuitul pe care-l


descrie ca urmare a aplicării metodologiei (figura 5.2.)

64
Verificare

IPOTEZE

Colectivitate Eşantion cu date


generală METODOLOGIA experimentale

Γ TESTĂRII γ

Stabilire

IPOTEZE

Figura 5.2. Circuitul metodologiei testării

În general, presupunerea vizează un parametru (medie, dispersie11, etc.) sau o lege de


repartiţie a unor variabile aleatoare.
Testarea are în vedere următoarele aspecte:
• se formează ipotezele : H 0 (nulă), H 1 (alternativă);

• se stabileşte α şi valorile critice corespunzătoare tipului de test aplicat;


• se precizează regiunea de respingere sau critică ( Rr ), în funcţie de tipul testului;
• se aplică statistica testului;
• se ia o decizie în funcţie de modul cum se încadrează rezultatul, în interiorul sau
exteriorul regiunii de respingere.
Elementele teoretice care intervin în testarea ipotezelor statistice sunt:
• ipotezele: nulă şi alternativă;
• limita de semnificaţie şi valori critice de respingere;
• regiune de respingere (critică);
• statistica testului;
• verificarea ipotezei.

 Ipoteza nulă şi ipoteza alternativă

11
Vezi Capitolul II “2.2. Caracteristicile distribuţiei variabilei aleatoare”.

65
Cele două ipoteze (nulă şi alternativă) formează o pereche nelipsită în cadrul
metodologiei testării.

Definiţia 5.3. Se numeşte ipoteză nulă şi se notează cu H 0 acea presupunere prin care se
formulează supoziţia conform căreia nu există diferenţă semnificativă între parametrii
comparaţi (primează caracterul întâmplător).
Alternativa la H 0 , apare ca o altă alternativă care poate fi adevărată în condiţiile
respingerii ipotezei nule.
Definiţia 5.4. Se numeşte ipoteză alternativă şi se notează cu H 1 presupunerea conform căreia
există o diferenţă semnificativă (cazuri speciale: mai mare sau mai mică) între parametri
comparaţi.
Ambele ipoteze trebuiesc stabilite iniţial, ca prime etape în cadrul metodologiei testării
fiind considerate mutual exhaustive ca urmare a imposibilităţii împlinirii simultane a acestora,
dar cu realizarea obligatorie a uneia din ele (respingerea ipotezei nule H 0 conduce la stabilirea

ipotezei alternative H 1 ca fiind adevărate sau dacă ipoteza nulă H 0 este adevărată, atunci ipoteza

alternativă H 1 se respinge).

 Limită de semnificaţie şi valori critice de respingere


Metodologia testării are în vedere două evenimente compuse:
• evenimentul realizat ( E R ) - care include şi celelalte evenimente auxiliare şi conduce la
respingerea ipotezei H0
• evenimentul contrar celui realizat ( E CR ) – evenimentul care evidenţiază îndeplinirea
ipotezei nule H0.
Principiile esenţiale pentru realizarea celor două evenimente sunt:
• probabilitatea evenimentului realizat ( E R ) sub H0 este reprezentată de evenimentele
elementare care sunt egal probabile doar în condiţiile ipotezelor nule şi se poate
determina numindu-se probabilitate critică
PC = P(E R ) = PH 0 (E R ) (5.1)

66
• probabiliatea evenimentului realizat ( E R ) sub H1 este mai mare decât sub H0, dar nu se
poate determina decât funcţia de celealtă.
Probabilitatea critică este interpretată a fi mică sau nu prea „mică” în raport cu un anumit
nivel denumit prag sau limită de semnificaţie notat cu α .
Regula de decizie se stabileşte în funcţie de probabilitatea critică ( PC ) astfel:
• dacă PC este mai „mică” de α ( PC ≤ α ), atunci H0 se respinge (evenimentul realizat se
consideră neaşteptat în contextul ipotezei H0, în timp ce ipoteza H1 îi asigură o
probabilitate mai mare de aspiraţie).
• Dacă PC este mai „mare” de α , atunci H0 nu se respinge (evenimentul realizat se
consideră aşteptat să se întâmple).
Limita de semnificaţie α poate lua valori cuprinse între 0,5 şi 0,0001 (cele mai utilizate
fiind 0,05 şi 0,01), acestea fiind stabilite teoretic.
Dacă α = 0,05 sau altfel spus α = 5% înseamnă că riscul de respingere al ipotezei nule
H0 este de 5% (când respingem ipoteza nulă H0 este posibil să se greşească în proporţie de 5%).
Limita de semnificaţie ( α ) are un rol esenţial în cadrul testării ipotezelor statistice
reprezentând acel prag sau linie care separă rezultatele ce resping ipoteza nulă de celelalte care
nu resping.
În acest context apare acea regiune de respingere (regiunea critică) notată Rr în care sunt
incluse rezultatele ce resping ipoteza nulă.
Definiţia 5.5. Punctele care determină regiunea de respingere se numesc valori critice ale
testului şi sunt reprezentate de Quantilele distribuţiei utilizate în aplicarea respectivului test.
Valorile critice de respingere vC .R sunt valori tabelare sau teoretice ale testelor ( Z α , Z α ,
2

tα , ... , etc), care se preiau din tabele teoretice prezentate în Anexele 1- 4.

 Regiunea de respingere (critică):


Valoarea critică delimitează în cadrul repartiţiei o regiune reprezentând regiunea critică.
Definiţia 5.6. Regiunea de respingere ( Rr ), denumită şi regiune critică, este reprezentată de
aceea arie din graficul de repartiţie, în care ipoteza nulă se respinge.

67
Regiunea include probabilitatea de realizare a evenimentului alternativ, deci este
adevărată ipoteza alternativă H 1 .
În procesul de decizie al unui test statistic se pot produce erori care apar sub două forme
(tabelul 4.1).
• eroare de tip I. (de speţa întâi): se respinge ipoteza nulă H 0 , deşi ea este adevărată.
Riscul producerii unei erori de tip I este α .
• eroare de tip II (de apeţa a doua): nu se respinge ipoteza nulă H 0 , deşi ea este falsă.

Riscul producerii unui tip de eroare este β .


Tabelul 5.1. Erori în procesul decizional statistic
Ipoteza
Decizia în test
H 0 adevărată H 0 falsă

Respingere H 0 Eroare de tip I Decizie precisă (1-p)

Acceptare H 0 Decizie precisă (1- α ) Eroare de tip II (risc β )

Legătura dintre probabilităţile α şi β este prezentată în figura 5.3.


Definiţia 5.7. Statistica testului este acea relaţie ce prezintă într-o formă matematică, tipul
testului stabilit în raport cu cel al distribuţiilor statistice descrise de fenomenul sau procesul
analizat.
Rezultatul obţinut ca urmare a aplicării statisticii testului se numeşte valoarea calculată a
testului (notată: Z c , sau t c , sau χ c2 , sau Fc etc).

f x ()
H0 H1

α
β

µ0 C µ1 x

68
12
Figura 5.3 Legătura dintre probabilităţile α şi β

 Statistica testului

 Testarea ipotezei
Verificarea ipotezei constă în compararea rezultatului obţinut prin aplicarea statisticii
testului la valorile calculate cu valoarea critică şi stabilirea deciziei finale ca find una din
situaţiile :
 dacă valoarea calculată intră în regiunea de respingere, atunci ipoteza nulă H 0 se

respinge (se consideră adevărată ipoteza alternativă H 1 ).


 dacă valoarea calculată este în afara regiunii de respingere, atunci ipoteza nulă
H 0 este adevărată (se respinge ipoteza alternativă H 1 ).
Din punct de vedere teoretic, testarea ipotezelor statistice presupune parcurgerea unor
etape ilustrate în figură 4.4.
Succint, aceste etape constau în:
 se precizează ipoteza nulă ( H o ) prin care se specifică: nu există diferenţă semnificativă
între parametrii comparaţi (medii, dispersii etc).
 se stabileşte ipoteza alternativă ( H 1 ): există diferenţă semnificativă între parametrii
comparaţi (medii, dispersii etc).
 se precizează tipul testului statistic utilizat în raport cu datele aplicaţiei, cu ipoteza
alternativă şi cu volumul eşantionului; se începe schiţarea graficului.
 în funcţie de nivelul de încredere ( 1 − α ), se determină limita de semnificaţie ( α ), cu
ajutorul căreia se stabileşte:
► valoarea critică de respingere (valoarea testului statistic tabelar sau teoretic),
plasându-se pe grafic;
► regiunea de respingere ( Rr ).

12
Voineagu V., Ţiţan E., Şerban R., Chiţă S., Todose D., Boboc C., Pele D., Teorie şi practică econometrică,
Editura Meteor Press, Bucureşti, 2006, pag.89.

69
Stabilirea ipotezelor

- Ipoteza H 0
- Ipoteza H1

Alegerea

TIPULUI TESTULUI

Alegerea
Valoarea critică Regiunea
LIMITEI DE
vC . R SEMNIFICAŢIE de respingere

STATISTICA TESTULUI

NU DA
PER ∈ R R

Se acceptă H 0 Se respinge H 0

Figura 5.4 Etapele testării ipotezelor statistice

 se determină valoarea statistică a testului calculat, aplicându-se relaţia de calcul adecvată


tipului testului utilizat, iar valoarea obţinută se plasează pe grafic.
 se compară valoarea testul statistic tabelar sau teoretic cu valoarea statistică a testului
calculat şi se stabileşte dacă rezultatul statistic al testului calculat intră sau nu în regiunea
de respingere Rr , luându-se decizia adecvată situaţiei.

5.3 Tipuri de teste utilizate la testarea ipotezelor statistice

În funcţie de sensul abaterii inclusă în ipoteza alternativă H 1 apar trei tipuri de teste:
• Test unilateral stânga
• Test bilateral

70
• Test unilateral dreapta

 Testul unilateral stânga


Testul unilateral sânga are următoarele caracteristici:
- ipotezele testului sunt:
 de exemplu, dacă se compară mediile a două eşantioane ( x1 şi x 2 ), avem:
H 0 : x1 = x 2

H 1 : x1 < x 2

 în alt exemplu, dacă se compară două dispersii ( σ 12 şi σ 22 ), vom avea:

σ 12
H 0 : σ 12 = σ 22 sau H 0 : =1
σ 22
σ 12
H 1 : σ 12 < σ 22 sau H 1 : <1
σ 22
- Regiunea de respingere ( RR ) şi valoarea critică de respingere ( vC .R ) sunt prezentate în
figura 5.1
- Limita de semnificaţie este α

RR

vC . R

Figura 5.1 Baza teoretică grafică a testului unilateral stânga

 Testul bilateral
Pentru testul bilateral avem:
- ipotezele testului :
 de exemplu, dacă se compară mediile a două eşantioane ( x1 şi x 2 ), avem:

71
H 0 : x1 = x 2

H 1 : x1 ≠ x2

 în alt exemplu, dacă se compară două dispersii ( σ 12 şi σ 22 ), vom avea:

σ 12
H 0 : σ 12 = σ 22 sau H 0 : =1
σ 22

σ 12
H 1 : σ ≠ σ sau H 1 : 2 ≠ 1
2 2

σ2
1 2

- Regiunea de respingere ( RR ) şi valoarea critică de respingere ( vC .R ) sunt prezentate în


figura 4.6
α
- Limita de semnificaţie este
2

RR
RR

vC . R vC .R

negativă pozitivă

Figura 5.2. Baza teoretică grafică a testului bilateral

 Testul unilateral dreapta


Testul unilateral dreapta, se mai numeşte şi testul direcţional dreapta. El se poate descrie
prin următoarele caracteristici:

- ipotezele testului sunt:


 de exemplu, dacă se compară mediile a două eşantioane ( x1 şi x 2 ), avem:

H 0 : x1 = x 2

H 1 : x1 > x 2

72
 în alt exemplu, dacă se compară două dispersii ( σ 12 şi σ 22 ), vom avea:

σ 12
H 0 : σ 12 = σ 22 sau H 0 : =1
σ 22

σ 12
H 1 : σ > σ sau H 1 : 2 > 1
2 2

σ2
1 2

- Regiunea de respingere ( RR ) şi valoarea critică de respingere ( vC . R ) sunt prezentate


în figura 5.3
- Limita de semnificaţie este α

RR

vC . R

pozitivă
Figura 5.3. Baza teoretică grafică a testului unilateral dreapta

Procedeul testării ipotezelor statistice are în vedere nu numai tipul ipotezei alternative,
dar şi următoarele două elemente:
♦ volumul eşantionului ( n ), cu cele două cazuri: eşantion de volum mic ( n < 30 ) şi
eşantion de volum mare ( n ≥ 30 );
♦ dispersia colectivităţii generale ( σ 2 ) din care se extrag eşantioanele, cu cele două
situaţii: σ 2 cunoscut şi σ 2 necunoscut.

Lucrare de verificare 5A

Răspundeţi pe scurt la următoarele întrebări:


1. Ce reprezintă inferenţa statistica?
2. Cum se defineşte ipoteza statistică?

73
3. Ce înţelegeţi prin procedeul de testare a ipotezelor statistice?
4. Ce reprezintă ipoteza nulă într-un proces de testare de ipoteze statistice?
5. Care este diferenţa dintre H0 şi H1?
6. În testarea ipotezelor, ce determină mărimea regiunii critice?
7. Ce reprezintă testul sau criteriul de semnificaţie?
8. Ce reprezintă regiunea critică?
9. Când se comite o eroare de gradul întâi?
10. Când se comite o eroare de gradul al doilea?
11. Care sunt paşii în construirea unui test statistic?

Test de autoevaluare 5B

1. Ipoteza statistica este:


a. presupunerea care se face cu privire la parametrii unei repartiţii;
b. presupunerea la legea de repartiţie pe care o urmează anumite variabile aleatoare;
c. procedeul de constituire a eşantionului;
d. orice presupunere privind o variabilă.

2. Testul sau criteriul de semnificatie este:


a. procedeul de verificare a unei ipoteze statistice.
b. eroarea de genul intai;
c. riscul de genul intai;
d. procedeul econometric de gradul întâi.

3. În testarea ipotezelor, ce determină mărimea regiunii critice?


a. valorile tabelare sau teoretice ale testelor Z α , Z α ;
2

b. valorile tabelare sau teoretice ale testelor Z α −1 , Z α −1 ;


2

c. valorile tabelare sau teoretice ale testelor Fα −1 , Fα −1 ;


2

d. valorile tabelare sau teoretice ale testelor Fα , Fα ;


2

74
4. În funcţie de sensul abaterii inclusă în ipoteza alternativă H 1 apar:
a. două tipuri de teste;
b. trei tipuri de teste;
c. patru tipuri de teste;
d. un singur test.

5. Dacă se compară mediile a două eşantioane ( x1 şi x 2 ), ipotezele testului unilateral dreapta


sunt:
a. H 0 : x1 = x2 şi H 1 : x1 < x 2 ;

b. H 0 : x1 = x2 şi H 1 : x1 > x2 ;

c. H 0 : x1 > x 2 şi H 1 : x1 < x 2 ;

d. H 0 : x1 ≠ x 2 şi H 1 : x1 < x 2 .

6. Procedeul testării ipotezelor statistice are în vedere:


a. Tipul ipotezei alternative;
b. Dispersia colectivităţii generale;
c. Media colectivităţii generale;
d. Volumul eşantionului.
A=a+b+d; B=a+c+d; C=b+c+d.

7. Dacă se compară două dispersii ( σ 12 şi σ 22 ), ipotezele testului bilateral sunt:

a. H 0 : σ 12 = σ 22 şi H 1 : σ 12 ≠ σ 22 ;

b. H 0 : σ 12 = σ 22 şi H 1 : σ 12 > σ 22 ;

c. H 0 : σ 12 = σ 22 şi H 1 : σ 12 < σ 22 ;

d. H 0 : σ 12 ≠ σ 22 şi H 1 : σ 12 > σ 22 .

8. Dacă se compară două dispersii ( σ 12 şi σ 22 ), limita de semnificaţie este:


a. α ;
b. α 2 ;

75
1
c. ;
α
α
d. .
2

9. Potrivit figurii următoare, la testarea ipotezelor statistice, se aplică:


a. testul unilateral dreapta;
b. testul bilateral;
c. testul unilateral dreapta;
d. nici un test.

RR

vC . R

10. Potrivit figurii următoare, la testarea ipotezelor statistice, se aplică:


a. testul unilateral dreapta;
b. testul bilateral;
c. testul unilateral dreapta;
d. nici un test.

RR
RR

vC . R vC .R

negativă pozitivă

76
Rezumat

Ipoteza statistică este o presupunere cu caracter provizoriu, formulată pe baza unor date
exterimentale existente la un moment dat. Testarea ipotezelor statistice presupune parcurgerea
următoarelor etape: formularea ipotezelor : H 0 (nulă) şi H 1 (alternativă), stabilirea pragului de

semnificaţie α , determinarea valorile critice corespunzătoare pragului de semnificaţie şi tipului


de test aplicat, determinarea regiunii (regiunilor) de respingere sau critică determinarea statisticii
testului şi luarea deciziei în funcţie de modul cum se încadrează statistica testului, în interiorul
sau exteriorul regiunii de respingere.
Principalele noţiuni utilizate în procesul de testare a ipotezelor statistice sunt:
Elementele teoretice care intervin în testarea ipotezelor statistice sunt: ipotezele testului ( H 0 şi

H 1 , disjuncte şi exhaustive), pragul (limita) de semnificaţie, valoarei critică, regiune de


respingere (critică), statistica testului.
La testarea ipotezelor statistice sunt utilizate trei tipuri de teste: testul bilateral (două
valori critice şi două regiuni de respingere) utilizat pentru o ipoteză alternativă de genul “diferă
semnificativ de”, test unilateral stânga (o regiune de respingere) utilizat pentru o ipoteză
alternativă de genul “ semnificativ mai mic decât” şi testul unilateral dreapta (o regiune de
respingere) utilizat pentru o ipoteză alternativă de genul “ semnificativ mai mare decât”.

Bibliografie

Andrei T. Statistică şi econometrie, Editura Economică, Bucureşti,


2003

Bădiţă M., Baron T., Statistică pentru afaceri, Editura Eficient, Bucureşti, 1998
Korka M.
Biji M., Biji E. Statistică teoretică, Editura Didactică şi Pedagogică,
Bucureşti, 1979

Cristache S.E., Şerban Lucrări aplicative de statistică şi econometrie pentru


D. administrarea afacerilor, Editura ASE, Bucureşti, 2007

Gogonea R.M., Zaharia Econometrie cu aplicaţii în activitatea de comerţ-turism-


M. servicii, Editura Universitară, Bucureşti, 2008,

77
Unitatea de învăţare 6
TESTAREA IPOTEZELOR PRIVIND MEDIILE POPULAŢIILOR CU
EŞANTIOANE DE VOLUM MARE

Cuprins
Obiectivele Unităţii de Învăţare 6 .................................................................................................. 78
6.1 Compararea mediei eşantionului cu media colectivităţii generale ........................................ 78
6.2 Compararea mediilor a două eşantioane .................................................................................. 83
6.3 Compararea proporţiei eşantionului cu a colectivităţii generale ............................................ 86
Lucrare de verificare 6A ................................................................................................................. 90
Test de autoevaluare 6B ................................................................................................................. 91
Rezumat ........................................................................................................................................... 96
Bibliografie ...................................................................................................................................... 97

Obiectivele Unităţii de Învăţare 6

După studiul acestei unităţi de învăţare cursanţii vor avea cunoştinţe despre:
• testarea ipotezei statistice privind compararea mediei eşantionului cu media
colectivităţii generale;
• testarea ipotezei statistice privind compararea mediilor a două eşantioane de
volum mare;
• testarea ipotezei statistice privind compararea proporţiei eşantionului cu a
colectivităţii generale;

6.1 Compararea mediei eşantionului cu media colectivităţii generale

Stabilirea volumului fiecărui eşantion cu care se lucrează în cadrul testării ipotezelor


statistice, permite aplicarea unui anumit tip de test statistic.

78
În condiţiile utilizării unor eşantioane de volum mare ( n ≥ 30 ) s-a demonstrat necesitatea
aplicării statisticii Z
Aplicarea testului Z în cazul comparării mediei eşantionului γ de volum n cu media
colectivităţii generale Γ presupune studierea unei populaţii statistice, de variabilitate constantă,
pentru a stabili dacă valoarea mediei a acestuia este aceeaşi cu a eşantionului utilizat în cercetare
Repartiţia normală redusă care stă la baza testului Z are în vedere funcţia de repartiţie

N (µ , σ 2 ) , cu parametri µ = 0 şi σ = 1
2

Statistica testului calculat se stabileşte în raport cu gradul de cunoaştere a dispersiei

colectivităţii generale ( σ ):
2

 σ 2 cunoscut :
x − µ ip x − µ ip
Zc = = (6.1)
σ2 σ
n n

 σ 2 necunoscut:
x − µ ip x − µ ip
Zc = = (6.2)
s2 s
n n

unde:
n - volumul eşantionului
µ ip - media ipotetică
x - media eşantionului
σ 2 - dispersia colectivităţii generale
σ - abaterea medie pătratică a colectivităţii generale
s 2 - estimaţia dispersiei colectivităţii generale
s - estimaţia abaterii medii pătratice a colectivităţii generale
În raport cu direcţia abaterii inclusă în ipoteza alternativă, testul Z aplicat poate
a. − unilateral stânga

fi: b. − bilateral
c. − unilateral dreapta

79
 Testul Z unilateral stânga
Acest tip de test este utilizat în situaţia practică ce direcţionesză abaterea spre stânga, mai
precis ipoteza alternativă precizează că media populaţiei eşantionului este mai mică decât a
populaţiei.
Pe grafic (figura 6.1), densitatea de probabilitate este limitată la stânga de aria regiunii de
respingere a ipotezei nule. Această regiune este demarcată de valoarea critică − Z α . Pentru o

limită de semnificaţie α , valoarea lui Z denumit şi „Z tabelar sau teoretic” se preia din anexa 1,
tabelul cu valorile funcţiei Gauss Laplace.

RR

H 0 se respinge − Zα

Figura 6.1 Elementele teoretice ale testului Z unilateral stânga

Etapele aplicării testului:


1. - se precizează ipoteza nulă : H 0 : µ = µ ip

2. - se stabileşte ipoteza alternativă : H 1 : µ < µ ip

3. - se precizează tipul testului statistic utilizat în raport cu volumul eşantionului n ≥ 30 , datele


aplicaţiei şi H 1 (se aplică testul Z unilateral stânga) şi se începe schiţarea graficului;
4. - în funcţie de nivelul de încredere ( 1 − α ), se determină limita de semnificaţie ( α ), cu
ajutorul căreia se stabileşte :
► Z tabelar sau teoretic: - Z α (Anexa 1), iar valoarea se trece pe grafic

► regiunea de respingere ( Rr ) : dacă Z calculat < − Z α , atunci H o se respinge şi este

adevărată ipoteza H 1 .

80
5. - se calculează valoarea statistică a testului cu una din relaţiile 4.2 sau 4.3, iar valoarea
obţinută se plasează pe grafic.
6. - se compară valoarea lui Z c cu - Z α şi se stabileşte dacă rezultatul statistic al testului

calculat Z c intră sau nu intră în regiunea de respingere Rr , luându-se decizia adecvată


situaţiei.

 Testul Z bilateral
Aplicarea testului are în vedere ipoteza alternativă prin care se specifică faptul că media
eşantionului diferă semnificativ de media colectivităţii generale.
Graficul, figura 6.2, indică o limitare a densităţii de probabilitate în ambele părţi, atât la
stânga cât şi la dreapta de aria de respingere a ipotezei nule. Cele două regiuni de respingere sunt
prezentate pe grafic începând cu valorile critice - Z α , respectiv Z α .
2 2

RR
RR

H 0 se respinge H 0 se respinge

− Zα Zα
2 2

Figura 6.2. Elementele teoretice ale testului Z unilateral bilateral

Utilizarea testului presupune parcurgerea următoarelor etape:


1. Ipoteza nulă: H 0 : µ = µ ip

2. Ipoteza alternativă: H 1 : µ ≠ µ ip

3. Deoarece n ≥ 30 , din datele aplicaţiei şi H 1 , atunci se aplică testul Z bilateral şi se începe


schiţarea graficului.
4. În funcţie de nivelul de încredere ( 1 − α ), se determină limita de semnificaţie ( α ), cu ajutorul
căreia se stabileşte :

81
► Z tabelar sau teoretic: Z α şi - Z α (anexă 1 cu valorile funcţiei Gauss Laplace), iar
2 2

valorile se plasează pe grafic


► regiunea de respingere ( Rr ): dacă Z c < - Z α sau Z c > Z α , atunci H o se respinge şi este
2 2

adevărată ipoteza H 1 .
5. Se calculează valoarea statistică a testului cu una din relaţiile 4.2 sau 4.3, iar valoarea
obţinută se plasează pe grafic.
6. Se compară Z c cu Z α şi/sau cu - Z α , astfel urmărindu-se dacă se verifică una din relaţiile Rr
2 2

şi se ia decizia adecvată situaţiei.

 Testul Z unilateral dreapta


Ipoteza alternativă a acestui test constă în afirmaţia că media eşantionului este mai mare
decât cea a colectivităţii generale.Această remarcă se evidenţiază în reprezentarea grafică în care
se prezintă o limitare a densităţii de probabilitate la dreapta, printr-o arie de regiuni de respingere
a ipotezei nule.
În cazul acestui test regiunea de respingere este demarcată prin valoarea critică Z α
(figura 6.3).

RR

Zα H 0 se respinge

Figura 6.3. Elementele teoretice ale testului Z unilateral dreapta

Etapele care trebuiesc parcurse pentru aplicarea tetsului „z” unilateral dreapta sunt cele
prezentate anterior în cadrul celorlalte două tipuri de teste „z”.
1. Ipoteza nulă: H 0 : µ = µ ip

82
2. Ipoteza alternativă: H 1 : µ ≠ µ ip

3. Deoarece n ≥ 30 , din datele aplicaţiei şi H 1 , atunci se aplică testul Z unilateral dreapta şi se


începe schiţarea graficului.
4. În funcţie de nivelul de încredere ( 1 − α ), se determină limita de semnificaţie ( α ), cu ajutorul
căreia se stabileşte :
► Z tabelar sau teoretic: Z α (anexa 1) – şi valorile se plasează pe grafic

► regiunea de respingere ( Rr ) : dacă Z c > Z α , atunci H o se respinge şi este adevărată

ipoteza H 1 .
5. Se calculează valoarea statistică a testului cu una din relaţiile 4.2 sau 4.3, iar valoarea
obţinută se plasează pe grafic.
6. Se compară Z c cu Z α , astfel urmărindu-se dacă se verifică relaţia Rr şi se ia decizia adecvată
situaţiei.

6.2 Compararea mediilor a două eşantioane

În anumite situaţii practica necesită realizarea unei analize statistice prin compararea a
două medii ce reprezintă două eşantioane care trebuiesc studiate.
Principalele caracteristici ce permit aplicarea testului Z pentru compararea mediilor ce
revin celor două eşantioane sunt:
1. - eşantioanele sunt de volum mare ( n1 ≥ 30 şi n2 ≥ 30 )

( ) (
2. – variabilele au tendinţe de normalitate: X 1 ≈ N µ1 , σ 12 şi X 2 ≈ N µ 2 , σ 22 )
Statistica testului calculat este:
 σ 2 cunoscut :
x1 − x 2
zc = (6.3)
σ 12 σ 22
+
n1 n2

 σ 2 necunoscut:
x1 − x 2
zc = (6.4)
2 2
s1 s
+ 2
n1 n2

83
unde:
n1 – volumul primului eşantion
n 2 – volumul celui de-al doilea eşantion
x1 - media eşantionului 1
x2 − media eşantionului 2

σ 12 - dispersia primului eşantion


σ 22 - dispersia celui de-al doilea eşantion
s12 - estimaţia dispersiei primului eşantion

s 22 - estimaţia dispersiei celui de-al doilea eşantion

Cazuri particulare:
1. - dacă dispersiile celor două populaţii eşantionate sunt egale, σ 1 2 = σ 2 2 = σ 2 , atunci
statistica testului calculat va fi:
 σ 2 cunoscut :
x1 − x 2
zc = (6.5)
1 1
σ +
n1 n2

 σ 2 necunoscut:
x1 − x 2
zc = (6.6)
1 1
s +
n1 n 2

2. - dacă cele două eşantioane au acelaşi volum n1 = n2 = n , atunci statistica testului calculat
va fi:
 σ 2 cunoscut :
x1 − x 2
zc = (6.7)
σ 12 + σ 2 2
n
 σ 2 necunoscut:

84
x1 − x 2
zc = (6.8)
s1 + s 2
2 2

n
Direcţia abaterii ipotezei alternative implică şi în cazul comparării mediilor celor două
eşantioane apariţia celor trei tipuri de teste:
• unilateral stânga
• bilateral
• unilateral dreapta

Etapele ce trebuiesc parcurse, în toate cele trei tipuri de teste, sunt prezentate după cum
urmează:
1. Se prezintă ipoteza nulă H 0 : µ1 = µ 2

2. Se stabileşte ipoteza alternativă ( H 1 ) în funcţie de tipul testului, astfel:

2.1. - testul unilateral stânga: H 1 : µ1 < µ 2

2.2. - testul bilateral: H 1 : µ1 ≠ µ 2

2.3. - test unilateral dreapta: H 1 : µ1 > µ 2


3. Se precizează tipul testului statistic utilizat în raport cu datele aplicaţiei, volumul eşantionului
(dacă n>30, atunci se aplică testul „z”) , H 1 şi se începe schiţarea graficului.
4. În funcţie de nivelul de încredere ( 1 − α ) se determină limita de semnificaţie ( α ) cu ajutorul
căruia se stabileşte:
4.1. - testul unilateral stânga:
► „Z” tabelar sau teoretic Z α (Anexa 1) şi valoarea cu semnul „-„ se
plasează pe grafic .
► Regiunea de respingere Rr : dacă Z c < Z α , atunci H o se respinge şi este

adevărată ipoteza H 1 .
4.2. - testul bilateral:
► „Z” tabelar sau teoretic Z α (Anexa 1) şi valorile cu semnele „+” şi ”-„ se plasează
2

pe grafic.

85
► Regiunea de respingere Rr : dacă Z c < - Z α sau Z c > Z α atunci H o se respinge şi e
2 2

adevărată ipoteza H 1 .
4.3. - test unilateral dreapta:
► „Z” tabelar sau teoretic Z α (anexa 1) şi valoarea cu semnul „+„ se plasează pe
grafic.
► Regiunea de respingere Rr : dacă Z c > Z α , atunci H o se respinge şi este adevărată

ipoteza H 1 .
5. Se calculează valoarea statistică a testului calculat cu una din relaţiile 4.4 – 4.9, iar valoarea
obţinută se plasează pe grafic.
6. Se compară valoarea lui Z c cu una din valorile lui: - Z α , - Z α , Z α , sau Z α , şi se stabileşte
2 2

dacă rezultatul statistic al testului calculat, Z c , intră în regiunea de respingere Rr , luându-se


decizia adecvată situaţiei.

6.3 Compararea proporţiei eşantionului cu a colectivităţii generale

În practică apar cazuri care necesită testarea proporţiei unui eşantion cu testarea
proporţiei colectivităţii generale.
Aspectele pe care le vizează aplicarea testului Z în cazul comparării proporţiei
eşantionului cu cea a colectivităţii generale sunt:
∗ distribuţia repartizării proporţiilor trebuie să fie o distribuţie dihotomică ale cărei
caracteristici sunt modelate în general prin variabile repartizate binominal;
∗ distribuţia binominală este normală dacă:
n ⋅ p ≥ 5, n(1 − p ) ≥ 5 ,

unde „p” reprezintă proporţia (media) eşantionului.


În rapot cu volumul eşantionului apar următoarele situaţii:
♦ dacă „n” este suficient de mare (n>30) , în general în practică, relaţiile prezentate sunt
îndeplinite, deci apare o distribuţie normală a repartiţiei binominale, ceea ce implică aplicarea
testului „z”.

86
♦ dacă „n” este mai mic (n<30), se utilizează probabilitatea elementului compus sub H o
printr-o sumă a probabilităţilor de apariţie a evenimentelor caracterizate de un număr de
„succese” mai mare sau egal cu „r”.
n
PH 0 = ∑ C n P0 (1 − p 0 ) n −i
i i

i=r

Această relaţie conduce la obţinerea probabilităţilor critice, situaţie în care distribuţia de


eşantionare a proporţiei va fi tot una de tip Z, ceea ce implică aplicarea aceluiaşi tip de test şi
anume, testul Z.
Statistica testului calculat este:
f − p ip
Zc = (6.9)
f (1 − f )
n
unde:
n = volumul eşantionului
p ip = proporţia ipotetică

f = proporţia eşantionului
Ipoteza alternativă, prin direcţia abaterii pe care o prezintă, implică apariţia unuia dintre
cele trei tipuri de teste Z deja prezentate:
♦ unilateral stânga
♦ bilateral
♦ unilateral dreapta.
Aplicarea testului presupune parcurgerea următoarelor etape:
1. Se prezintă ipoteza nulă: H 0 : p = p o

2. Se stabileşte ipoteza alternativă ( H 1 ) în funcţie de tipul testului, astfel:


2.1. -testul unilateral stânga: H 1 : p < p ip

2.2. -testul bilateral: H 1 : p ≠ pip

2.3. -test unilateral dreapta: H 1 : p > pip

3. Se precizează tipul testului statistic utilizat în raport cu datele aplicaţiei, H 1 şi volumul


eşantionului (dacă n>30, atunci se aplică testul „Z”) şi se începe construcţia graficului.

87
4. În funcţie de nivelul de încredere ( 1 − α ) se determină limita de semnificaţie ( α ) cu ajutorul
căruia se stabileşte:
4.1. - testul unilateral stânga:
► „Z” tabelar sau teoretic Z α (anexa 1) şi valoarea cu semnul „-„ se plasează pe grafic
.
► regiunea de respingere Rr : dacă Z c < Z α , atunci H o se respinge şi este adevărată

ipoteza H 1 .
4.2. - testul bilateral:
► „Z” tabelar sau teoretic Z α (anexa 1) şi valorile cu semnele „+” şi ”-„ se plasează
2

pe grafic.
► regiunea de respingere Rr : dacă Z c > - Z α sau Z c > Z α , atunci H o se respinge şi
2 2

este adevărată ipoteza H 1 .

4.1.- test unilateral dreapta:


► „Z” tabelar sau teoretic Z α (anexa 1) şi valoarea cu semnul „+„ se plasează pe
grafic.
► regiunea de respingere Rr : dacă Z c > Z α , atunci H o se respinge şi este adevărată

ipoteza H 1 .

5. Se calculează valoarea statistică a testului calculat cu relaţia (3.21), iar valoarea obţinută se
plasează pe grafic.

6. se compară valoarea lui Z c cu una din valorile lui: - Z α , - Z α , Z α , sau Z α , şi se stabileşte


2 2

dacă rezultatul statistic al testului calculat, Z c , intră în regiunea de respingere Rr , luându-


se decizia adecvată situaţiei.

88
Exemplul 6.1.
Managerul unui lanţ hotelier s-a gândit să analizeze situaţia cheltuielilor ultimei luni, cu
scopul de a reduce pe viitor nivelul acestora. În acest context, s-a realizat un studiu privind
cheltuielile cu angajaţii trimişi la cursurile de training şi s-a stabilit că, pe fiecare angajat
cheltuiala este distribuită normal cu o medie de 980 UM şi o dispersie de 2500.
Se consideră că, această cheltuială medie pe angajat este mai mare decât cea stabilită la
980 UM. În vederea verificării afirmaţiei, se selectează aleatoriu un eşantion de 40 salariaţi
pentru care se înregistrează cheltuielile cu training-ul şi se stabileşte valoarea medie a acestor
cheltuieli la 1110 UM.
Pentru o probabilitate de 99,9%, poate managerul să concluzioneze că această cheltuială
medie pe angajat este mai mare de 980 UM?

Rezolvare:
Notaţii: µ ip = 980 UM

σ 2 = 2500
n = 40 salariaţi
x = 1110 UM
( 1 − α ) = 99,9%
1 Ipoteza nulă H 0 : µ = µ ip

(nu există diferenţă semnificativă între cheltuiala medie pe angajat şi cea stabilită
ipotetic la nivelul lanţului hotelier)
2 Ipoteza alternativă H 1 : µ > µ ip

( cheltuiala medie pe angajat este mai mare decât cea ipotetică stabilită la nivelul
lanţului hotelier)
3 Dacă n= 40 angajaţi >30, atunci se aplică testul Z (testul Z unilateral dreapta)
4 Se determină Z tabelar (teoretic) similar celor prezentate în exemplul 4.1 şi pentru α = 0.001
se obţine Z α = Z 0.001 = 3,085
5 Valoarea statistică a testului (valoarea calculată) este:

89
x − µ ip x − µ ip 1110 − 980 130
Zc = = = = = 16,43
σ σ2 2500 7,91
n n 40

Rr

Z α = 3,085 Z c = 16,43
H 0 se respinge

Figura 6.4. Verificarea ipotezei H 0


(nu există diferenţă semnificativă între cheltuiala medie pe angajat şi cea stabilită ipotetic la
nivelul lanţului hotelier)
6 Deoarece aşa cum se prezintă şi în figura 4.17, Z c (16,43) > Z α (3,085) , iar Z c intră în Rr ,

atunci H o se respinge şi este adevărată ipoteza H 1 , deci concluzia este că, managerul a
anticipat bine: cheltuiala medie pe angajat este mai mare de 980 UM.

Lucrare de verificare 6A

Răspundeţi pe scurt la următoarele întrebări:


1. Pentru o valoare de -1,29 a testului critic Z, schiţaţi distribuţia lui Z şi indicaţi locul
regiunii critice.
2. Pentru o valoare de 2,33 a testului critic Z, schiţaţi distribuţia lui Z şi indicaţi locul
regiunii critice.
3. Pentru α = 0,05 şi φ (Z calculat) =0,40 specificaţi dacă ipoteza nulă este respinsă în cazul
testului bilateral.
4. Pentru α = 0,025 şi φ (Z calculat) =0,45 specificaţi dacă ipoteza alternativă este acceptată
în cazul testului bilateral.

90
5. Într-un test în care se testează ipoteza nulă H0: µ =100 şi ipoteza alternative H1: µ>100 se
obţine valoarea testului z = 2,26, aflaţi pragul de semnificaţie corespunzător valorii
calculate a testului.

Test de autoevaluare 6B

1. Managerul unei structuri de primire turistică doreşte să verifice dacă durata medie a
sejurului turiştilor cazaţi este mai mică de 6 zile. Acesta presupune că durata medie a
unui sejur este de 6 zile, iar abaterea medie practică este de 2 zile. Testarea ipotezei este
completată prin selectarea aleatoare a unui eşantion de 80 turişti pentru care se stabileşte
că durata medie a sejurului este de 5 zile; nivelul de încredere este de 95%. Care sunt cele
două ipoteze?
a. H0: nu există diferenţă semnificativă între durata medie a sejurului şi cea
presupusă de manager
H1: durata medie a sejurului este mai mică decât cea presupusă de manager.
b. H0: nu există diferenţă semnificativă între durata medie a sejurului şi cea
presupusă de manager
H1: durata medie a sejurului este mai mare decât cea presupusă de manager.
c. H0: nu există diferenţă semnificativă între durata medie a sejurului şi cea
presupusă de manager.
H1: există diferenţă semnificativă între durata medie a sejurului şi cea presupusă
de manager.
d. H0: există diferenţă semnificativă între durata medie a sejurului şi cea presupusă
de manager
H1: durata medie a sejurului este mai mică decât cea presupusă de manager.

2. Managerul unei structuri de primire turistică doreşte să verifice dacă durata medie a
sejurului turiştilor cazaţi este mai mică de 6 zile. Acesta presupune că durata medie a
unui sejur este de 6 zile, iar abaterea medie practică este de 2 zile. Testarea ipotezei este
completată prin selectarea aleatoare a unui eşantion de 80 turişti pentru care se stabileşte

91
că durata medie a sejurului este de 5 zile; nivelul de încredere este de 95%. Valoarea
statistică a testului (valoarea calculată) este:
a. -4,55;
b. -3,55;
c. 2.35;
d. 7,25.

3. Un comerciant este de părere că, un român consumă în medie într-o lună mai puţin de 8
kg de pâine şi ar vrea să verifice această opinie. În acest sens, s-a realizat o anchetă pe un
eşantion aleatoriu de 49 familii din toate judeţele României şi a relevat un consum mediu
de 8,2 kg, cu o abatere medie pătratică de 1,7 kg. Dacă acceptăm un nivel de încredere de
95%, valoarea statistică a testului (valoarea calculată) este:
a. 0,95
b. 0,83
c. 1
d. 0,24.

4. Salariul mediu pe angajat stabilit pentru 35 agenţii de turism dintr-un judeţ este de 1600
lei. La nivelul regiunii care include judeţul respectiv s-a determinat pentru toate agenţiile,
un salariu mediu de 1585 lei pe angajat şi o abatere de 76,55 lei. Dacă cei interesaţi
doresc să arate, pentru o probabilitate de 99%, dacă salariul mediu pe angajat stabilit la
nivelul agenţiilor de turism ale judeţului diferă semnificativ de cel determinat pentru toate
agenţiile de turism din regiune, care sunt cele două ipoteze statistice?
a. H0: nu există diferenţă semnificativă salariul mediu pe angajat şi cel ipotetic.
H1:salariul mediu pe angajat este mai mic decât cel ipotetic.
b. H0: nu există diferenţă semnificativă între salariul mediu pe angajat şi cel ipotetic.
H1: există diferenţă semnificativă între salariul mediu pe angajat şi cel ipotetic.
c. H0: nu există diferenţă semnificativă salariul mediu pe angajat şi cel ipotetic.
H1:salariul mediu pe angajat este mai mare decât cel ipotetic.
d. H0: există diferenţă semnificativă salariul mediu pe angajat şi cel ipotetic.
H1:salariul mediu pe angajat este mai mic decât cel ipotetic.

92
5. Salariul mediu pe angajat stabilit pentru 35 agenţii de turism dintr-un judeţ este de 1600
lei. La nivelul regiunii care include judeţul respectiv s-a determinat pentru toate agenţiile,
un salariu mediu de 1585 lei pe angajat şi o abatere de 76,55 lei. Se doreşte testarea
ipotezei conform căreia salariul mediu pe angajat stabilit la nivelul agenţiilor de turism
ale judeţului diferă semnificativ de cel determinat pentru toate agenţiile de turism din
regiune. În urma testării acestei ipoteze pentru o probabilitate de 99% , putem afirma că:
a. Zcalculat = -1,16, se admite ipoteza nulă şi putem trage concluzia că nu există
diferenţă semnificativă între salariile medii stabilite la nivelul celor 35 agenţii de
turism şi la nivelul regiunii;
b. Zcalculat = 1,16, se respinge ipoteza nulă şi putem trage concluzia că există diferenţă
semnificativă între salariile medii stabilite la nivelul celor 35 agenţii de turism şi
la nivelul regiunii;
c. Zcalculat = 1,06, se admite ipoteza nulă şi putem trage concluzia că nu există
diferenţă semnificativă între salariile medii stabilite la nivelul celor 35 agenţii de
turism şi la nivelul regiunii;
d. Zcalculat = 1,16, se admite ipoteza nulă şi putem trage concluzia că nu există
diferenţă semnificativă între salariile medii stabilite la nivelul celor 35 agenţii de
turism şi la nivelul regiunii.

6. Managerul unui lanţ hotelier s-a gândit să analizeze situaţia cheltuielilor ultimei luni, cu
scopul de a reduce pe viitor nivelul acestora. În acest context, s-a realizat un studiu
privind cheltuielile cu angajaţii trimişi la cursurile de training şi s-a stabilit că, pe fiecare
angajat cheltuiala este distribuită normal cu o medie de 1090 UM.
Acesta consideră că, respectiva cheltuială medie pe angajat este mai mare decât cea
stabilită la 1090 UM. În vederea verificării afirmaţiei, se selectează aleatoriu un eşantion
de 40 salariaţi pentru care se înregistrează cheltuielile cu training-ul şi se stabileşte
valoarea medie de 1110 UM, iar abaterea standard de 50 UM. Pentru o probabilitate de
99,9%, valoarea statistică a testului (valoarea calculată) este:
a. 2,83
b. 2,53
c. 1,53

93
d. -2,55

7. Managerul unui lanţ hotelier s-a gândit să analizeze situaţia cheltuielilor ultimei luni, cu
scopul de a reduce pe viitor nivelul acestora. În acest context, s-a realizat un studiu
privind cheltuielile cu angajaţii trimişi la cursurile de training şi s-a stabilit că, pe fiecare
angajat cheltuiala este distribuită normal cu o medie de 1090 UM.
Acesta consideră că, respectiva cheltuială medie pe angajat este mai mare decât cea
stabilită la 1090 UM. În vederea verificării afirmaţiei, se selectează aleatoriu un eşantion
de 40 salariaţi pentru care se înregistrează cheltuielile cu training-ul şi se stabileşte
valoarea medie de 1110 UM, iar abaterea standard de 50 UM. Pentru o probabilitate de
99,9%, managerul concluzionează că:
a. această cheltuială medie pe angajat este mai mare decât cea presupusă de manager
de 1090 UM;
b. această cheltuiala medie pe angajat nu diferă semnificativ de cea presupusă de
manager de 1090 UM;
c. această cheltuială medie pe angajat este mai mică decât cea presupusă de manager
de 1090 UM;
d. această cheltuiala medie pe angajat diferă semnificativ de cea presupusă de
manager de 1090 UM.

8. Un fermier doreşte să verifice dacă în ceea ce priveşte producţia de lapte, după


cumpărarea şi utilizarea unui tonomat (aparat pentru vânzarea laptelui) profitul este mai
ridicat. În acest scop a fost înregistrat profitul într-o lună (31 de zile) înaintea cumpărării
aparatului şi în următoarea lună (30 de zile) după achiziţionarea şi utilizarea lui. Testarea
ipotezei se realizează pe baza celor două eşantioane, datele stabilite permiţând
înregistrarea următoarelor caracteristici:

Înainte de cumpărarea aparatului: După cumpărarea aparatului:


n 1 =31 de zile n 2 = 30 de zile
x1 =1200 UM x 2 = 2030 UM
s1 =231 UM s2 = 323 UM

În urma testării acestei ipoteze pentru o probabilitate de 99% , putem afirma că:

94
a. deoarece, Z c > − Z α (−1,15 > −1,645) , rezultă că ipoteza H0 se admite, ceea ce
înseamnă că profitul fermierului producător de lapte este mai mic după
cumpărarea aparatului;
b. deoarece, Z c < − Z α (−11,15 < −1,645) , rezultă că ipoteza H0 se admite, ceea ce
înseamnă că profitul fermierului producător de lapte este mai mică după
cumpărarea aparatului;
c. deoarece, Z c < − Z α (−11,15 < −1,645) , rezultă că ipoteza H0 se respinge şi este
adevărată ipoteza H1, ceea ce înseamnă că profitul fermierului producător de lapte
este mai mare după cumpărarea aparatului;
d. deoarece, Z c < − Z α (−12,5 < −1,645) , rezultă că ipoteza H0 se respinge şi este
adevărată ipoteza H1, ceea ce înseamnă că profitul fermierului producător de lapte
diferă semnificativ după cumpărarea aparatului;

9. ANAT a propus o modificare a reglementărilor statutului salariaţilor din agenţiile de


turism. Modificarea poate fi efectuată numai în condiţiile în care mai mult de 51% dintre
reprezentanţii angajaţilor sunt de acord cu ea. Pentru a stabili dacă această modificare
poate fi indusă în statut s-a selectat aleatoriu un eşantion de 150 reprezentanţi ai
angajaţilor, dintre care 80 de persoane au răspuns că sunt de acord cu respectiva
modificare. În urma testării ipotezei conform căreia proporţia reprezentanţilor din
eşantion nu diferă semnificativ de cea a tuturor celor din ANAT, putem afirma că:
a. Deoarece Z c (0,5) < Z α (1,645) , atunci se respinge H0, deci proporţia
reprezentanţilor din eşantion diferă semnificativ de cea a tuturor celor din ANAT.
Concluzia este că modificarea statului ANAT poate fi pusă în discuţia
reprezentanţilor în vederea aplicării ei.
b. Deoarece Z c (0,5) < Z α (1,645) , atunci se admite ipoteza H0, deci proporţia
reprezentanţilor din eşantion nu diferă semnificativ de cea a tuturor celor din
ANAT. Concluzia este că modificarea statului ANAT poate fi pusă în discuţia
reprezentanţilor în vederea aplicării ei.
c. Deoarece Z c (0,5) > Z α (0,45) , atunci se respinge ipoteza H0, deci proporţia
reprezentanţilor din eşantion diferă semnificativ de cea a tuturor celor din ANAT.
Concluzia este că modificarea statului ANAT poate fi pusă în discuţia
reprezentanţilor în vederea aplicării ei.

95
d. Deoarece Z c (0,5) > Z α (0,45) , atunci se admite ipoteza H0, deci proporţia
reprezentanţilor din eşantion diferă semnificativ de cea a tuturor celor din ANAT.
Concluzia este că modificarea statului ANAT poate fi pusă în discuţia
reprezentanţilor în vederea aplicării ei.

10. Un manager al unui magazin afirmă că, 16% dintre clienţii magazinului sunt bărbaţi.
Unul dintre vânzători nu este de acord cu această afirmaţie. Pentru studiu se formează un
eşantion de 100 clienţi şi se stabileşte că 25% dintre aceştia sunt bărbaţi. Ne putem baza
pe afirmaţia managerului cu un nivel de încredere de 95%?
a. deoarece Z c (2,25) > Z α (1,96) , atunci ipoteza H0 se respinge, deci se acceptă
2

ipoteza H1, prin urmare, afirmaţia managerului nu este adevărată, deoarece


proporţia stabilită diferă semnificativ de cea presupusă.
b. deoarece Z c (2,25) > Z α (0,5) , atunci ipoteza H0 se respinge, deci se acceptă
2

ipoteza H1, prin urmare, afirmaţia managerului nu este adevărată, deoarece


proporţia stabilită diferă semnificativ de cea presupusă.
c. deoarece Z c (1,25) < Z α (1,96) , atunci ipoteza H0 se admite, prin urmare, afirmaţia
2

managerului este adevărată, deoarece proporţia stabilită nu diferă semnificativ de


cea presupusă.
d. deoarece Z c (2,25) > Z α (0,5) , atunci ipoteza H0 se admite, prin urmare, afirmaţia
2

managerului este adevărată, deoarece proporţia stabilită nu diferă semnificativ de


cea presupusă.

Rezumat

Pentru testarea indicatorului medie, pentru eşantioane mai mari de 30 de elemente se utilizează
testul Z. Sunt prezentate modalităţile de testare a mediei populaţiei generale, a mediilor a două
populaţii şi în particular a proporţiei existente într-o colectivitate.

96
Pentru testarea ipotezei privind media populaţiei generale statistica testului pentru σ 2
x − µ ip x − µ ip x − µ ip x − µ ip
cunoscut este Z c = = sau Z c = = în caz contrar. Regiunile critice
σ2 σ s2 s
n n n n

sunt determinate în funcţie de pragul de semnificaţie ales şi de enunţurile concrete ale ipotezelor
H 0 (nulă) şi H 1 (alternativă).
Similar, pentru testarea ipotezei privind mediile a două populaţii, statistica testului este
x1 − x 2 x1 − x 2 f − p ip
zc = sau z c = , iar pentru testatrea proporţiilor Z c = .
σ 12 σ 22 s1
2
s
2
f (1 − f )
+ + 2
n1 n2 n1 n2 n

Testările se efectuează parcurgând secvenţial etapele prezentate în unitatea de învăţare 5.

Bibliografie
Cristache S.E., Şerban Lucrări aplicative de statistică şi econometrie pentru
D. administrarea afacerilor, Editura ASE, Bucureşti, 2007

Gogonea R.M., Zaharia Econometrie cu aplicaţii în activitatea de comerţ-turism-


M. servicii, Editura Universitară, Bucureşti, 2008,
Elemente de analiză şi prognoză în turism, Editura
Hapenciuc C.V. Junimea, Iaşi, 2004
Isaic-Maniu A., Mitruţ
Statistică, Editura Universitară, Bucureşti, 2003
C.,
Voineagu V.
Jaba E.
Statistică, Editura Economică, Bucureşti, 1998

Pecican Şt. E. Econometrie pentru...economişti, Editura Economică


Bucureşti, 2007

97
Unitatea de învăţare 7
TESTAREA IPOTEZELOR PRIVIND MEDIILE POPULAŢIILOR CU
EŞANTIOANE DE VOLUM MIC

Bibliografie
Obiectivele Unităţii de Învăţare 7 ............................................................................................. 98
7.1 Compararea mediei unui eşantion de volum redus cu media colectivităţii generale .......... 98
7.2 Compararea mediilor a două eşantioane de volum redus .................................................. 102
Lucrare de verificare 7A ......................................................................................................... 108
Test de autoevaluare 7B .......................................................................................................... 109
Rezumat................................................................................................................................... 114
Bibliografie.................................................................................Error! Bookmark not defined.

Obiectivele Unităţii de Învăţare 7

După studiul acestei unităţi de învăţare cursanţii vor avea cunoştinţe despre:
• testarea ipotezei statistice privind compararea unui eşantion de volum redus cu
media colectivităţii generale;
• testarea ipotezei statistice privind compararea mediilor a două eşantioane de
volum redus;

7.1 Compararea mediei unui eşantion de volum redus cu media


colectivităţii generale

Eşantioanele de volum redus reprezintă acele eşantioane care sunt formate din mai puţin
de 30 elemente componente ( n < 30 ) extrase dintr-o colectivitate generală ce urmează a fi
cercetată.
Procesul de testare aplicat unor astfel de eşantioane se bazează pe aplicarea testului
STUDENT ( t ).

98
Caracteristicile ce stau la baza aplicării testului Student ( t ) care includ imposibilitatea
stabiliri dispersiei colectivităţii generale, deci implicit a abaterii medii pătratice, precum şi
formarea unor eşantioane de volum redus, cu mai puţin de 30 de componente, reprezintă
principalele elemente necesare în derularea analizei de comparare a mediei unui eşantion cu cea
a colectivităţii generale.
Testul t poate fi aplicat pornind de la considerentul că distribuţia normală redusă
caracterizează colectivitatea generală.
Deoarece în general, pentru astfel de eşantioane nu prea se cunoaşte dispersia
colectivităţii generale, deci nici abaterea medie pătratică, se va utiliza testul (t ) numai în condiţia
estimării abaterii standard a colectivităţii generale cu cea a eşantionului.
Fiind este vorba de un eşantion redus (n < 30 ) , abaterea medie pătratică (standard)
estimată se determină cu relaţia:
n

∑ (x
i =1
i − x)2
s = s2 = , (7.1)
n −1
Statistica testului calculat va fi:
x − µ ip x − µ ip
tc = = (7.2)
s2 s
n n

unde:
x − media eşantionului

µ ip - media ipotetică a colectivităţii generale


s − abaterea standard estimată
n – volumul eşantionului
Deoarece, ca şi în celelalte cazuri, la testului Student se ţine seama de direcţia abaterii
stabilită în ipoteza alternativă, atunci deciziile se formează tot în raport cu tipul testului studiat:
unilateral stânga, bilateral, unilateral dreapta.
În acest context, ipotezele testului Student şi regiunile de respingere sunt asemănătoare
cu cele ale testului Z .

99
Observaţie
De remarcat că, deoarece la repartiţia Student vorbim de gradele de libertate, atunci
valorile critice care limitează densitatea de probabilitate, deci valorile repartiţiei Student (Anexa
3) au formele
► ± tα , n −1 , pentru testul unilateral drepta, stânga

► ± tα , pentru testul bilateral.


, n −1
2

În aceste condiţii, avem următoarele etape:


1. Se prezintă ipoteza nulă: H 0 : µ = µ ip

2. Se stabileşte ipoteza alternativă ( H 1 ) în funcţie de tipul testului, astfel:


2.1. - testul unilateral stânga: H 1 : µ < µ ip

2.2. - testul bilateral: H 1 : µ ≠ µ ip

2.3. - test unilateral dreapta: H 1 : µ > µ ip

3. Se precizează tipul testului statistic utilizat în raport cu datele aplicaţiei, H 1 , volumul

eşantionului (dacă n<30, atunci se aplică testul t ) şi se începe schiţarea graficului.


4. În funcţie de nivelul de încredere ( 1 − α ) se determină limita de semnificaţie ( α ) cu ajutorul
căreia se stabileşte:
4.1. - testul unilateral stânga (figura 7.1)
► valoarea lui t tabelar sau teoretic tα (Anexa 3), cu semnul ”-„ se plasează pe
grafic .
► regiunea de respingere Rr : dacă t c < −tα , n −1 , atunci H o se respinge

Rr

H 0 se respinge − tα ;n −1

100
Figura 7.1 Aplicarea testului t unilateral stânga
(compararea mediei eşantionului cu a colectivităţii generale)

4.2. - testul bilateral (figura 7.2):


► valorile lui t tabelar sau teoretic t α (Anexa 3), cu semnele „+” şi ”-„ se plasează
2

pe grafic.
► regiunea de respingere Rr : dacă t c < - t α sau t c > t α atunci H o se respinge
, n −1 , n −1
2 2

Rr
Rr

H 0 se respinge H 0 se respinge

− tα tα
;n −1 ; n −1
2 2

Figura 7.2. Aplicarea testului t bilateral


(compararea mediei eşantionului cu a colectivităţii generale)

4.3. - test unilateral dreapta (figura 7.3)


► t tabelar sau teoretic tα , n−1 (Anexa 3) şi valoarea cu semnul „+„ se plasează pe

grafic.
► regiunea de respingere Rr : dacă t c > tα , n −1 , atunci H o se respinge

Rr

tα ;n −1 H 0 se respinge

Figura 7.3. Aplicarea testului t unilateral dreapta

101
(compararea mediei eşantionului cu a colectivităţii generale)

5. Se calculează valoarea statistică a testului determinată cu relaţia (3.28), iar valoarea obţinută
se plasează pe grafic.
6. Se compară valoarea t c cu una din valorile - tα ,n −1 , - t α , tα , tα , n−1 şi se stabileşte dacă
, n −1 , n −1
2 2

rezultatul statistic al testului calculat t c intră în regiunea de respingere Rr , luându-se decizia


adecvată situaţiei.

7.2 Compararea mediilor a două eşantioane de volum redus

De multe ori deciziile din activitatea economică, din afaceri, trebuiesc stabilite prin
compararea unor informaţii destul de reduse.
În aceste condiţii, se poate vorbi despre compararea a două eşantioane de volum mic (n<
30) caracterizate astfel:
 un eşantion de volum n1 < 30 cu media x1 şi dispersia s12 este extras dintr-o colectivitate

generală cu media µ1 şi dispersia σ 12 .

 alt eşantion de volum n2 < 30 , cu media x 2 şi dispersia s 22 este extras dintr-o colectivitate

generală cu media µ 2 şi dispersia σ 22 .


Două cazuri cu aplicabilitate practică prezintă interes pentru analiza econometrică:
• Eşantioanele sunt independente şi provin din colectivităţi generale cu abateri
standard egale.
• Eşantioanele sunt independente şi provin din colectivităţi generale cu abateri
standard diferite (inegale).

♦ Eşantioane independente din colectivităţi generale


cu abateri standard egale
În practică pot să apară situaţii în care trebuie să se formeze două eşantioane
independente care provin din colectivităţi generale cu dispersii egale.
σ 1 2 = σ 2 2 = σ 2 , deci σ 1 = σ 2 = σ

102
Repartiţia Student tabelară sau teoretică va avea n1 + n2 − 2 grade de libertate, iar
statistica testului calculat va fi:
x1 − x2 x1 − x 2
tc = = (7.3)
1 1  1
+
1
s e2 ⋅  +  se
 n1 n 2  n1 n 2

unde s e este abaterea standard estimată determinată cu relaţia:

(n1 − 1) s12 + (n 2 − 1) s 22
se = (7.4)
n1 + n2 − 2

Atât ipotezele testului Student, cât şi regiunile de respingere sunt asemănătoare cu cele

prezentate anterior, exceptând valorile critice în care apare testul t tabelar care apar de forma:
tα ; n1 +n2 − 2 , pentru testul unilateral, respectiv t α , pentru testul bilateral.
, n1 + n2 − 2
2

În aceste condiţii avem, următoarele etape:


1. Se prezintă ipoteza nulă H 0 : x1 = x 2

2. Se stabileşte ipoteza alternativă ( H 1 ) în funcţie de tipul testului, astfel:

2.1. - testul unilateral stânga: H 1 : x1 < x 2

2.2. - testul bilateral: H 1 : x1 ≠ x 2

2.3. - test unilateral dreapta: H 1 : x1 > x 2


3. Se precizează tipul testului statistic utilizat în raport cu datele aplicaţiei şi volumul

eşantionului (dacă n<30, atunci se aplică testul t şi se construieşte graficul.


4. În funcţie de nivelul de încredere ( 1 − α ) se determină limita de semnificaţie ( α ) cu ajutorul
căreia se stabileşte:
4.1. - testul unilateral stânga (figura 7.4):

► valoarea lui t tabelar sau teoretic tα ; n1 +n2 − 2 (Anexa 3), cu semnul ”-„ se plasează pe

grafic.
► regiunea de respingere Rr : dacă t c < −tα ; n1 + n2 − 2 , atunci H o se respinge şi este

adevărată ipoteza H 1 .

103
Rr

H 0 se respinge − tα ;n1 + n2 − 2

Figura 7.4 Aplicarea testului t unilateral stânga


(compararea mediilor a două eşantioane)

4.2. - testul bilateral (figura 7.5):


► valorile lui t tabelar sau teoretic t α (Anexa 3), cu semnele „+” şi ”-„ se plasează
; n1 + n2 − 2
2
pe grafic.
► regiunea de respingere Rr : dacă t c < - t α sau t c > t α atunci H o se
; n1 + n2 − 2 ; n1 + n2 − 2
2 2

respinge şi este adevărată ipoteza H 1 .

Rc
Rc

H 0 se respinge H 0 se respinge

− tα tα
; n1 + n2 − 2 ; n1 + n2 − 2
2 2

Figura 7.5. Aplicarea testului t bilateral


(compararea mediilor a două eşantioane)

4.3. test unilateral dreapta (figura 7.6):


► ttabelar sau teoretic tα ;n1 +n2 − 2 (Anexa 3) şi valoarea cu semnul „+„ se plasează pe
grafic
► regiunea de respingere Rr : dacă t c > tα ;n1 + n2 − 2 , atunci H o se respinge şi este adevărată
ipoteza H 1 .

104
Rr

tα ; n1 +n2 − 2 H 0 se respinge

Figura 7.6. Aplicarea testului t unilateral dreapta


(compararea mediilor a două eşantioane)

5. Se calculează statistica testului cu relaţia (3.29), iar valoarea obţinută se plasează pe grafic.
6. Se compară valoarea lui t c cu una din valorile - tα ; n1 +n2 − 2 , - t α , tα , tα ; n1 +n2 − 2 şi se
; n1 + n2 − 2 ; n1 + n2 − 2
2 2

stabileşte dacă rezultatul statistic al testului calculat t c intră în regiunea de respingere Rr ,


luându-se decizia adecvată situaţiei.

♦ Eşantioane independente din colectivităţi generale


cu abateri standard inegale

Particularitatea acestei ipostaze constă în faptul că deoarece dispersiile nu sunt egale, deci
nici abaterile standard nu pot avea aceaşi valoare, se va aplica testul utilizând estimaţia abaterii
standard la nivelul fiecărui eşantion:

n1

∑ (x
i =1
i1 − x1 ) 2
s1 = s12 = (7.5)
n1 − 1

n2

∑ (x
i =1
i2 − x2 ) 2
s 2 = s 22 = (7.6)
n2 − 1

Statistica testului Student calculată va fi:

x1 − x 2
tc = (7.7)
2 2
s1 s
+ 2
n1 n2

105
Ipotezele testului Student şi regiunile de respingere vor fi similare celor prezentate în
ipostaza anterioară, pentru eşantioanele independente provenind din colectivităţi generale cu
abateri standard egale.
În aceste condiţii avem, următoarele etape:
1. Se prezintă ipoteza nulă H 0 : x1 = x 2

2. Se stabileşte ipoteza alternativă ( H 1 ) în funcţie de tipul testului, astfel:


2.1. -testul unilateral stânga: H 1 : x1 < x 2
2.2. - testul bilateral: H 1 : x1 ≠ x 2
2.3. - test unilateral dreapta: H 1 : x1 > x 2
3. Se precizează tipul testului statistic utilizat în raport cu datele aplicaţiei şi volumul
eşantionului (dacă n>30, atunci se aplică testul t ) şi se construieşte graficul.
4. În funcţie de nivelul de încredere ( 1 − α ) se determină limita de semnificaţie ( α ) cu ajutorul
căruia se stabileşte:
4.1. - testul unilateral stânga (vezi figura 7.4):
► t tabelar sau teoretic tα ;n1 + n2 − 2 (Anexa 3) şi valoarea cu semnul ”-„ se plasează pe grafic.
► regiunea de respingere Rr : dacă t c < −tα ;n1 + n2 − 2 , atunci H o se respinge şi este adevărată
ipoteza H 1 .
4.2. - testul bilateral (vezi figura 7.5):
► t tabelar sau teoretic t α (Anexa 3) şi valorile cu semnele „+” şi ”-„ se plasează pe
; n1 + n2 − 2
2
grafic.
► regiunea de respingere Rr : dacă t c < - t α sau t c > t α atunci H o se respinge
; n1 +n2 − 2 ; n1 +n2 − 2
2 2

şi este adevărată ipoteza H 1 .


4.3. - test unilateral dreapta (vezi figura 7.6):
► t tabelar sau teoretic tα ;n1 +n2 − 2 (Anexa 3) şi valoarea cu semnul „+„ se plasează pe
grafic.
► regiunea de respingere Rr : dacă t c > tα ;n1 + n2 − 2 , atunci H o se respinge şi este adevărată
ipoteza H 1 .
5. Se determină valoarea statistică a testului calculat cu relaţia (3.33), iar valoarea obţinută se
plasează pe grafic.
6. Se compară valoarea lui t c cu una din valorile - tα ; n1 + n2 − 2 , - t α , tα , tα ; n1 + n2 − 2 şi
; n1 +n2 − 2 ; n1 +n2 − 2
2 2

se stabileşte dacă rezultatul statistic al testului calculat t c intră în regiunea de respingere


Rr , luându-se decizia adecvată situaţiei.

106
Exemplul 7.1.
Într-o zonă montană, între două tipuri de pensiuni turistice rurale (1 margaretă şi 2
margarete), cu acelaşi număr de camere, se testează ipoteza conform căreia nu există diferenţă
semnificativă privind cheltuielile medii de întreţinere din sezonul turistic de iarnă.
Ştiind că, probabilitatea luată în considerare este de 98%, testarea se realizează pentru 6
pensiuni de 1 margaretă şi 4 unităţi de 2 margarete de la care sunt preluate datele privind
cheltuielile de întreţinere din sezonul turistic de iarnă şi sunt prelucrate. Rezultatele testării sunt
prezentate în tabelul 4.2:
Tabelul 7.2. - Caracteristicile eşantioanelor din cele două pensiuni
Pensiunea de 1 margaretă Pensiunea de 2 margarete
n1= 6 n2 = 4

x1 = 4,5 mii UM x 2 = 4,84 mii UM

s1 = 0,15 mii UM s 2 = 0,44 mii UM

Rezolvare:
1. Ipoteza nulă H 0 : x1 = x 2
(nu există diferenţă semnificativă între cheltuielile medii de întreţinere ale pensiunilor
turistice rurale de o margaretă şi ale celor de două margarete).
2. Ipoteza alternativă H 1 : x1 ≠ x 2
(există diferenţă semnificativă între cheltuielile medii de întreţinere ale pensiunilor
turistice rurale de o margaretă şi ale celor de două margarete).
3. Dacă n1 = 6 şi n 2 = 4, ambele mai mici de 30, atunci se aplică testul t (testul t bilateral)
4. Fiind test " t " bilateral probabilitatea de 98% va fi evidenţiată prin
α
= 0,02 ⇒ t α = t 0,02;8 = 2,896
2 2
; n1 + n2 − 2

Regiunea de respingere Rr este: t c < − t α sau t c > t α ⇒ H o se respinge, deci


; n1 + n2 − 2 ; n1 + n2 − 2
2 2

este adevărată ipoteza H 1 .


5. Valoarea statistică a testului (valoarea calculată) se determină cu relaţia 4.16, după
determinarea abaterii standard estimată, astfel:

107
(n1 − 1) s12 + (n2 − 1) s 22 (6 − 1) ⋅ 0,15 2 + (4 − 1) ⋅ 0,44 2
se = = = 0,29
n1 + n2 − 2 6+4−2

s e = 0,0867 = 0,29

x1 − x 2 4,5 − 4,84
tc = = = − 1,82
1 1 1 1
se + 0,29 ⋅ +
n1 n2 6 4

Deoarece
− tα (−2,896) < t c (− 1,82) < t α (2,896) ,
; n1 + n2 − 2 ; n1 + n 2 − 2
2 2

atunci t c este în afara Rr , rezultă că H o este adevărată.

Rr
Rr

H 0 se respinge H 0 se respinge

− tα = −2,896 tα = 2,896
; n1 +n2 − 2 ;n1 + n2 − 2
2
t c = −1,82 2

Se acceptă H 0
o
Figura 7. 7. Testarea ipotezei H 0 :
nu există diferenţă semnificativă între cheltuielile medii de întreţinere ale celor două
categorii de pensiuni

6. Concluzia (figura 7.7) este că nu există diferenţă semnificativă între cheltuielile medii de
întreţinere ale pensiunilor turistice rurale de o margaretă şi cele ale pensiunilor de două
margrete.

Lucrare de verificare 7A

Răspundeţi pe scurt la următoarele întrebări:


1. Cum se testează ipoteza privind compararea mediei unui eşantion de volum redus cu
media colectivităţii generale?

108
2. Cum se testează ipoteza privind compararea mediilor a două eşantioane de volum redus?
3. Pentru o valoare de -1,71 a testului student (t) critic, schiţaţi distribuţia lui t şi indicaţi
locul regiunii critice.
4. Pentru o valoare de 2,33 a testului (t) critic, schiţaţi distribuţia lui t şi indicaţi locul
regiunii critice.
5. Pentru 1 − α = 95% şi t calculat=0,40 specificaţi dacă ipoteza nulă este respinsă în cazul
testului unilateral stânga.

Test de autoevaluare 7B

1. În vederea verificării greutăţii produselor dintr-un lot de piese se extrage aleator simplu şi
repetat un eşantion format din 25 piese. La nivelul eşantionului observat se obţine o
greutate medie de 340 g şi o abatere standard de 10g. Se studiază ipoteza potrivit căreia
greutatea medie a unei piese din întregul lot concordă cu greutatea medie prevăzută în
normele STAS, µ 0 = 330 g . (riscul asumat este α = 0,05 ). Valoarea statistică a testului
(valoarea calculată) este:
a. 4
b. 5
c. 4,75
d. 5,25

2. În vederea verificării greutăţii produselor dintr-un lot de piese se extrage aleator simplu şi
repetat un eşantion format din 25 piese. La nivelul eşantionului observat se obţine o
greutate medie de 340 g şi o abatere standard de 10g. Se studiază ipoteza potrivit căreia
greutatea medie a unei piese din întregul lot concordă cu greutatea medie prevăzută în
normele STAS, µ 0 = 330 g . (riscul asumat este α = 0,05 ). Care sunt cele două ipoteze
statistice?
a. H 0 : µ ≠ µ 0 (există diferenţă semnificativă între greutatea medie a unei piese
din întregul lot şi greutatea medie prevăzută în normele STAS).
H 1 : µ > µ 0 (greutatea medie a unei piese din întregul lot este mai mare
decăt greutatea medie prevăzută în normele STAS).

109
b. H 0 : µ = µ 0 (nu există diferenţă semnificativă între greutatea medie a unei
piese din întregul lot şi greutatea medie prevăzută în normele STAS).
H 1 : µ < µ 0 (greutatea medie a unei piese din întregul lot este mai mică
decât greutatea medie prevăzută în normele STAS).
c. H 0 : µ = µ 0 (nu există diferenţă semnificativă între greutatea medie a unei
piese din întregul lot şi greutatea medie prevăzută în normele STAS).
H 1 : µ ≠ µ 0 (există diferenţă semnificativă între greutatea medie a unei piese
din întregul lot şi greutatea medie prevăzută în normele STAS).
d. H 0 : µ ≠ µ 0 (există diferenţă semnificativă între greutatea medie a unei piese
din întregul lot şi greutatea medie prevăzută în normele STAS).
H 1 : µ < µ 0 (greutatea medie a unei piese din întregul lot este mai mica
decât greutatea medie prevăzută în normele STAS).

3. Patronul unei pensiuni turistice rurale, în vederea ridicări calităţii activităţilor desfăşurate,
doreşte să-şi analizeze mai atent cheltuielile şi presupune că, în medie, cheltuiala zilnică
în perioada de sezon este de 400 UM pe turist. Testarea ipotezei presupune o selectare
aleatorie a 25 de zile, pentru care se înregistreză valorile (UM): 430, 280, 300, 250, 330,
280, 400, 410, 400, 380, 330, 350, 380, 280, 330, 390, 290, 380, 450, 370, 380, 330, 410,
390, 380. În urma testării potezei conform căreia, pentru o probabilitate de 95%, în medie
cheltuiala zilnică în perioada de sezon este mai mică de 400 UM pe turist, se poate trage
următoarea concluzie:
a. deoarece t c (−4,13) < −tα ,n −1 (−1,711) , rezultă că între cheltuielile medii

comparate există diferenţă semnificativă.


b. deoarece t c ( −3,50) < −tα , n −1 (−1,711) , rezultă că între cheltuielile medii

comparate există diferenţă semnificativă.


c. deoarece t c (−4,13) > −tα , n −1 (−1,711) , rezultă că între cheltuielile medii

comparate nu există diferenţă semnificativă.


d. deoarece t c (−4,13) ≠ −tα , n −1 (−1,711) , rezultă că între cheltuielile medii

comparate nu există diferenţă semnificativă.

110
4. Se extrag aleator, simplu, repetat, două eşantioane, primul format din 8 persoane de sex
masculin, iar al doilea din 10 persoane de sex feminin. Ştiind că, probabilitatea luată în
considerare este de 99%, iar rezultatele prelucrării datelor sunt următoarele:

Eşantionul persoane de sex masculin Eşantionul persoane de sex feminin


nF = 22 femei nM = 20 băieţi
x F = 26 ani xM = 30 ani
s F = 8 ani s M = 4 ani

În urma testării ipotezei statistice potrivit căreia vârsta medie a persoanelor de sex
masculin este mai mare decât a celor de sex feminine, valoarea calculate a testului este:
a. 1,82;
b. 2, 28;
c. -1,82;
d. -2,28.

5. Într-o zonă montană, între două tipuri de pensiuni turistice rurale (1 margaretă şi 2
margarete), cu acelaşi număr de camere, se testează ipoteza conform căreia nu există
diferenţă semnificativă privind cheltuielile medii de întreţinere din sezonul turistic de
iarnă. Ştiind că, probabilitatea luată în considerare este de 98%, testarea se realizează
pentru 6 pensiuni de 1 margaretă şi 4 unităţi de 2 margarete de la care sunt preluate datele
privind cheltuielile de întreţinere din sezonul turistic de iarnă şi sunt prelucrate.
Caracteristicile eşantioanelor din cele două pensiuni sunt următoarele:

Pensiunea de 1 margaretă Pensiunea de 2 margarete


n1= 6 n2 = 4
x1 = 4,5 mii UM x2 = 4,84 mii UM
s1 = 0,15 mii UM s 2 = 0,44 mii UM

Rezultatele testării sunt:


a. nu există diferenţă semnificativă între cheltuielile medii de întreţinere ale
pensiunilor turistice rurale de o margaretă şi cele ale pensiunilor de două
margarete deoarece (t calculat = -2,896);

111
b. există diferenţă semnificativă între cheltuielile medii de întreţinere ale
pensiunilor turistice rurale de o margaretă şi cele ale pensiunilor de două
margarete deoarece (t calculat = -2,896);
c. există diferenţă semnificativă între cheltuielile medii de întreţinere ale
pensiunilor turistice rurale de o margaretă şi cele ale pensiunilor de două
margarete deoarece (t calculat = 2,896);
d. cheltuielile medii de întreţinere ale pensiunilor turistice rurale de o margaretă
sunt mai mari decât cele ale pensiunilor de două margarete deoarece (t calculat =
-2,896);

6. O companie doreşte să introducă o nouă metodă de realizare a unui produs. Se selectează


20 de produse pentru care se înregistrează timpii de realizare cu vechea metodă şi 22 de
produse pentru noua metodă. Rezultatele sunt:

Metoda actuală Noua metodă


n 1 = 20 n 2 = 22
x1 = 27,1 minute x 2 = 25,4 minute
s1 = 3,7 minute s2 = 3,1 minute

Se testează, cu o probabilitate de 95%, ipoteza conform căreia noua metodă duce la un


consum de timp semnificativ mai mic.
Ipotezele statistice sunt:
a. Ipoteza nulă: nu există diferenţă semnificativă între consumul de timp realizat
de noua metodă şi cel realizat de vechea metodă;
Ipoteza alternativă: consumul de timp realizat de noua metodă este
semnificativ mai mare decât cel realizat de vechea metodă;
b. Ipoteza nulă: nu există diferenţă semnificativă între consumul de timp realizat
de noua metodă şi cel realizat de vechea metodă;
Ipoteza alternativă: nu există diferenţă semnificativă între consumul de timp
realizat de noua metodă şi cel realizat de vechea metodă;
c. Ipoteza nulă: nu există diferenţă semnificativă între consumul de timp realizat
de noua metodă şi cel realizat de vechea metodă;
Ipoteza alternativă: consumul de timp realizat de noua metodă este
semnificativ mai mic decât cel realizat de vechea metodă;

112
d. Ipoteza nulă: există diferenţă semnificativă între consumul de timp realizat de
noua metodă şi cel realizat de vechea metodă;
Ipoteza alternativă: consumul de timp realizat de noua metodă este
semnificativ mai mic decât cel realizat de vechea metodă;

7. O companie doreşte să introducă o nouă metodă de realizare a unui produs. Se selectează


20 de produse pentru care se înregistrează timpii de realizare cu vechea metodă şi 22 de
produse pentru noua metodă. Rezultatele sunt:

Metoda actuală Noua metodă


n 1 = 20 n 2 = 22
x1 = 27,1 minute x 2 = 25,4 minute
s1 = 3,7 minute s2 = 3,1 minute

În urma testării, cu o probabilitate de 95%, a ipotezei conform căreia noua metodă duce la
un consum de timp semnificativ mai mic, putem spune că:
a. se admite ipoteza nulă, nu există diferenţă semnificativă între consumul de
timp realizat de noua metodă şi cel realizat de vechea metodă;
b. se respinge ipoteza nulă, există diferenţă semnificativă între consumul de timp
realizat de noua metodă şi cel realizat de vechea metodă;;
c. se respinge ipoteza nulă, consumul de timp realizat de noua metodă este
semnificativ mai mic decât cel realizat de vechea metodă;
d. se admite ipoteza nulă, există diferenţă semnificativă între consumul de timp
realizat de noua metodă şi cel realizat de vechea metodă;
8. Se doreşte testarea ipotezei conform căreia între două mărci de imprimante nu există
diferenţe semnificative privind cheltuielile de funcţionare. Pentru aceasta, 20 de posesori
de imprimante (8 posesori ai primei mărci, 12 posesori ai celei de a doua) sunt rugaţi să
ţină evidenţa cheltuielor de funcţionare pe o perioadă de un an de zile. Rezultatele
prelucrării datelor sunt:

Marca 1 Marca 2
n1= 8 n 2 = 12
x1 = 56,96 UM x 2 = 52,73 UM
s1 = 4,9 s2 = 6,4

113
Pentru o probabilitate de 90%, putem spune că:
a. nu există diferenţe semnificative privind cheltuielile de funcţionare ale celor
două mărci de imprimante;
b. există diferenţe semnificative privind cheltuielile de funcţionare ale celor două
mărci de imprimante;
c. cheltuielile de funcţionare cu prima marcă de imprimantă sunt semnificativ
mai mari decăt cheltuielile de funcţionare cu cea de-a doua marcă de
imprimantă;
d. cheltuielile de funcţionare cu prima marcă de imprimantă sunt semnificativ
mai mici decăt cheltuielile de funcţionare cu cea de-a doua marcă de
imprimantă;

Rezumat

Pentru testarea indicatorului medie, pentru eşantioane mai mici de 30 de elemente se


utilizează testul Student (t).

Pentru testarea ipotezei privind media populaţiei generale statistica testului este
n

x − µ ip x − µ ip ∑ (x
i =1
i − x)2
tc = = unde s = s 2 = . Regiunile critice sunt determinate în
s2 s n −1
n n

funcţie de pragul de semnificaţie ales, numărul gradelor de libertate (g=n-1) şi de enunţurile


concrete ale ipotezelor H 0 (nulă) şi H 1 (alternativă).

Similar, pentru testarea ipotezei privind mediile a două populaţii, statistica testului este

x1 − x 2 x1 − x 2 (n1 − 1) s12 + (n 2 − 1) s 22
sau t c = = , unde s e = .
1 1  1 1 n1 + n2 − 2
s e2 ⋅  +  se +
 n1 n2  n1 n 2

Testările se efectuează parcurgând secvenţial etapele prezentate în unitatea de învăţare 5.

114
Bibliografie

Bădiţă M., Baron T., Statistică pentru afaceri în comerţ – turism, vol 1, 2,
Cristache S.E. Editura Luceafărul, Bucureşti, 2002

Gogonea R.M., Zaharia Econometrie cu aplicaţii în activitatea de comerţ-turism-


M. servicii, Editura Universitară, Bucureşti, 2008.

Oprea C., Zaharia M. Elemente de analiza datelor și modelare utilizând Excel,


Editura Universitară, Bucureşti, 2011

Voineagu V, Ţiţan E., Teorie şi practică econometrică, Editura Meteor Press,


Şerban R., Ghiţă S., 2007
Tudose D., Boboc C.,
Pele D.

115
Unitatea de învăţare 8
TESTAREA IPOTEZELOR PRIVIND DISPERSIILE POPULAŢIILOR

Cuprins

Obiectivele Unităţii de Învăţare 8 ........................................................................................... 116


8.1 Compararea dispersiei eşantionului cu dispersia colectivităţii generale ........................... 116
8.2 Compararea dispersiei a două colectivităţi ........................................................................ 119
Lucrare de verificare 8A ......................................................................................................... 123
Test de autoevaluare 8B .......................................................................................................... 123
Rezumat ................................................................................................................................... 125
Bibliografie.............................................................................................................................. 126

Obiectivele Unităţii de Învăţare 8

După studiul acestei unităţi de învăţare cursanţii vor avea cunoştinţe despre:
• testarea ipotezei statistice privind compararea dispersiei eşantionului cu dispersia
colectivităţii generale;
• testarea ipotezei statistice privind compararea dispersiei a două colectivităţi;

8.1 Compararea dispersiei eşantionului cu dispersia colectivităţii generale

Cei mai utilizaţi indicatori în procesul inferenţei statistice sunt: media, dispersia şi
proporţia. Un rol important în cadrul inferenţei o au şi testările ipotezelor statistice aplicate în
condiţiile comparării dispersiilor.
Repartiţia χ 2 este utilizată cu preponderenţă în testarea ipotezelor statistice permiţând
studierea mai detaliată, chiar şi sub aspect calitativ, a colectivităţilor statistice.
Statistica testului calculat este:

116
(n − 1) s 2
χ c2 = (5.1)
σ2
În aceste condiţii, etapele de aplicare a testului χ 2 sunt următoarele:

1. Se prezintă ipoteza nulă: H 0 : σ 2 = σ i2

2. Se stabileşte ipoteza alternativă ( H 1 ) în funcţie de tipul testului, astfel:

2.1. - testul unilateral stânga: H 1 : σ 2 < σ i2

2.2. - testul bilateral: H 1 : σ 2 ≠ σ i2

2.3. - test unilateral dreapta: H 1 : σ 2 > σ i2


3. Se precizează tipul testului statistic utilizat în raport cu datele aplicaţiei şi ipoteza alternative
( H 1 ), iar apoi se începe schiţarea graficului.
4. În funcţie de nivelul de încredere ( 1 − α ) se determină limita de semnificaţie ( α ) cu ajutorul
căruia se stabileşte:
4.1. - testul unilateral stânga (figura 5.1):
► se determină χ 2 tabelar (Anexa 2) sub forma χ12−α , n −1 , iar valoarea se plasează pe

grafic.
► regiunea de respingere Rr : dacă χ 2 c < χ 21−α , n −1 , atunci H o se respinge şi este

adevărată ipoteza H 1 .

Rr

H 0 se respinge χ12−α ; n−1

Figura 5.1 Elementele teoretice ale testului χ 2 unilateral stânga


4.2. - testul bilateral (figura 5.2):
► se determină χ 2 tabelar (Anexa 2), adică valorile pentru χ 2 α şi χ α2 .
1− ; n −1 ;n −1
2 2

117
► regiunea de respingere Rr : dacă χ c2 < χ 2 α sau χ c2 > χ α2 , atunci H o se
1− , n −1 ,n −1
2 2

respinge şi este adevărată ipoteza H 1 .

Rr
Rr

H 0 se respinge H 0 se respinge

χ2α χ α2
1− ; n −1 ; n −1
2 2

Figura 5.2. Elementele teoretice ale testului χ 2 bilateral


4.3. - test unilateral dreapta (figura 5.3.):
► se determină χ 2 tabelar (Anexa 2), adică χ α2 , n−1 iar valoarea se plasează pe

grafic.
► regiunea de respingere Rr : dacă, χ c2 > χ α2 ,n −1 , atunci H o se respinge şi este

adevărată ipoteza H 1 .

Rr

χα2 ; n −1 H 0 se respinge

Figura 5.3 Elementele teoretice ale testului χ 2 unilateral dreapta


5. Se calculează valoarea statistică a testului determinat cu relaţia (5.1), iar valoarea obţinută se
plasează pe grafic.

118
6. Se compară valoarea lui χ c2 cu una din valorile χ12−α , n −1 , χ 2 α , χ α2 , χ α2 , n −1 conformă
1− , n −1 , n −1
2 2

tipului testului aplicat şi se stabileşte dacă rezultatul statistic al testului calculat χ c2 intră în

regiunea de respingere Rr , luându-se decizia adecvată situaţiei.

8.2 Compararea dispersiei a două colectivităţi

Compararea dispersiilor a două colectivităţi se poate realiza fie direct, fie utilizând
raportul acestora.
Aplicarea testului presupune următoarele:
• colectivităţile comparate să fie formate din variabile aleatoare: X 1 şi X 2 ;

• variabilele utilizate să fie repartizate normal: X 1 ~ N (m1 , σ 12 ) şi X 2 ~ N (m 2 , σ 22 );

• eşantioanele de volum n1 şi n 2 extrase din colectivităţile comparate să permită

stabilirea estimaţiilor dispersiilor S12 şi S 22 .


Stabilirea statisticii testului Fisher calculat:
S12 σ 22
Fc = ⋅ (5.2.)
S 22 σ 12

Observaţie: Dacă σ 12 = σ 22 , atunci statistica testului calculat devine:


S12
Fc = . (5.3.)
S 22

Testul F se aplică şi el în toate cele trei situaţii:


 test unilateral stânga,
 bilateral,
 unilateral dreapta.
Pentru testarea ipotezelor se utilizează F teoretic sau tabelar, în funcţie de tipul testului
(unilateral stânga, dreapta sau bilateral), care poate avea una din formele:
- pentru testul unilateral stânga: F1−α ; n1 −1; n2 −1 ,

- pentru testul bilateral: F α şi Fα ,


1− ; n1 −1; n2 −1 ; n1 −1; n2 −1
2 2

119
- pentru testul unilateral dreapta: Fα ; n1 −1; n2 −1 ,

în care:
α - limita de semnificaţie
n1 -1= g1 = gradele de libertate pentru variabila aleatoare Y1
n 2 -1= g 2 = gradele de libertate pentru variabila aleatoare Y2
Graficele testului în funcţie de tipul acestuia îmbracă formele:
• testul unilateral stânga (figura 5.4):
► F tabelar sau teoretic F1−α ; n1 −1; n2 −1 (Anexa 4) şi valoarea se plasează pe grafic.

► regiunea de respingere Rr : dacă Fc < F1−α ; n1 −1; n2 −1 , atunci H o se respinge şi este

adevărată ipoteza H 1 .

Rr

H 0 se respinge F1−α ; n1 −1; n2 −1

Figura 5.4 - Elementele teoretice ale testului F unilateral stânga

• testul bilateral (figura 5.5.):


► F tabelar sau teoretic F α şi Fα (Anexa 4) se plasează pe grafic.
1− ; n1 −1; n2 −1 ; n1 −1; n2 −1
2 2

► regiunea de respingere Rr : dacă Fc < F α sau Fc > Fα atunci H o se


1− ; n1 −1; n2 −1 ; n1 −1; n2 −1
2 2

respinge şi este adevărată ipoteza H 1 .

120
Rr
Rr

H 0 se respinge H 0 se respinge

F α Fα
1− ; n1 −1; n2 −1 ; n1 −1; n2 −1
2 2

Figura 5.5. - Elementele teoretice ale testului F bilateral

• test unilateral dreapta (figura 5.6):


► F tabelar sau teoretic Fα ; n1 −1; n2 −1 (Anexa 4) şi valoarea se plasează pe grafic.

► regiunea de respingere Rr : dacă Fc > Fα ; n1 −1; n2 −1 , atunci H o se respinge şi este

adevărată ipoteza H 1 .

Rr

Fα ; n1 −1; n2 −1H 0 se respinge

Figura 5.6. - Elementele teoretice ale testului F unilateral dreapta

În practică cele mai utilizate teste sunt: bilateral şi unilateral dreapta.

Exemplul 8.1.
Departamentul de vânzări al unei firme comerciale dispune de următoarele date privind
cererea unui produs. 80, 59, 66, 83, 36, 58, 55, 64, 63, 66. Datele u fost selectate dintr-o
colectivitate normal distribuită. pentru o probabilitate de 95% să se testeze ipotezele:
H0: σ2=100, respectiv H1: σ2>100.

121
Rezolvare:
Primele două etape ce trebuiesc parcurse pentru testarea ipotezelor statistice prin
aplicarea testului χ2 au fost prezentate în enunțul problemei:
1. Ipoteza nulă: σ2=100
2. Ipoteza altenativă: H1: σ2>100
3. Datele inițiale ne conduc la concluzia că se aplică testul χ2 (se compară dispersiile).
4. Deoarece (1-α)=95% ⇒ α=0,05, iar n=10 trebuiesc determinate elementele:
 χ2 teoretic:

 Regiunea de respingere (Rr) este: , atunci H0 se respinge.

5. Valoarea statistică a testului (valoarea calculată):


Cunoaștem și trebuie să determinăm dispersia eșantionului s2.

Deoarece n=10 < 30 ⇒

Rr

χ c2 = 15,42 χ 02,05;9 = 16,92


H 0 se admite

6. Deoarece, χ c2 (15,42) < χ α2;n −1 (16,92) atunci H0 este adevărat, şi anume, gradul de împrăştiere

a valorilor eşantionului privind cererea pentru un anumit produs nu diferă semnificativ de


cel stabilit la ivelul colectivităţii generale, care este 100.
122
Lucrare de verificare 8A

1. Cum se testează ipoteza privind compararea dispersiei eşantionului cu dispersia


colectivităţii generale?
2. Cum se testează ipoteza privind compararea dispersiei a două colectivităţi?
3. Care este relaţia pentru calculul valorii statistice a testului privind compararea dispersiei
eşantionului cu dispersia colectivităţii generale?
4. Care este relaţia pentru calculul valorii statistice a testului privind compararea dispersiei a
două colectivităţi?
5. Care sunt paşii în construirea unui test statistic privind compararea dispersiei eşantionului
cu dispersia colectivităţii generale?

Test de autoevaluare 8B
1. Statistica testului calculat este:
n ⋅ s2
a. χ c2 =
σ2
(n − 1) s 2
b. χ c2 = ;
σ2
(n + 1) s 2
c. χ c2 = ;
σ2
(n − 1) s
d. χ c2 = .
σ2
2. Patronul unei pensiuni turistice rurale testează în 10 zile consumul zilnic de lapte (litri):
10, 8, 10, 9, 7, 11, 10, 12, 7, 10. Presupunând că selecţia se realizează dintr-o colectivitate
normal distribuită, pentru o probabilitate de 95% să se testeze ipotezele:
H 0 : σ 2 = 4 , respectiv H 1 : σ 2 > 4 .

Regiunea de respingere (Rr ) este:


a. χ c2 > χ α2 ;n ;

b. χ c2 > χ α2 ;n −1 ;

c. χ c2 > χ α2 ;
; n −1
2

123
d. χ c2 > χ n2−1 .

3. Patronul unei pensiuni turistice rurale testează în 10 zile consumul zilnic de lapte (litri):
10, 8, 10, 9, 7, 11, 10, 12, 7, 10. Presupunând c