Sunteți pe pagina 1din 21

Tema 2

CURS – ECONOMETRIE
Testarea ipotezelor statistice
3.1. Noţiuni generale privind testarea ipotezelor statistice
3.2. Verificarea ipotezelor statistice
3.3. Câteva exemple de ipoteze statistice testate

3.1. Noţiuni generale privind testarea ipotezelor statistice

Procesul de luare a deciziilor presupune analiza şi interpretarea evidenţelor oferite


de datele pe care le avem la dispoziţie.

Definiție: Ipoteza statistică este o ipoteză asupra unor parametri ai unei repartiții
teoretice, iar verificarea acesteia reprezintă stabilirea adevărului sau falsității ipotezei, pe
baza observațiilor statistice.

Ipotezele apar întotdeauna în perechi: ipoteza nulă şi ipoteza alternativă. Ipoteza


ce urmează a fi testată se numeşte ipoteză nulă şi este notată cu H 0. Ea constă
întotdeauna în admiterea caracterului întâmplător al deosebirilor, adică în presupunerea
că nu există deosebiri esenţiale. Respingerea ipotezei nule care este testată implică
acceptarea unei alte ipoteze. Această altă ipoteză este numită ipoteză alternativă şi este
notată cu H1. Procedeul de verificare a unei ipoteze se numeşte test al ipotezei sau
criteriu de semnificaţie. Calitatea unui test este dată de puterea sa, dar şi de erorile
potenţiale de tip/gen I (risc α sau prag de semnificaţie) şi de tip/gen II (risc β). Pornind
de la criteriul maximizării atunci se impun valori maxime pentru nivelul de încredere al
unui test este (1-α) şi pentru puterea sa (1-β)

Definiție: Procedeul de verificare a unei ipoteze statistice se numeşte test sau criteriu
desemnificaţie

Cu cât probabilităţile comiterii erorilor de genul întâi şi de genul al doilea sunt


mai mici, cu atât testul este mai bun. Nivelurile riscurilor se stabilesc în funcţie de
considerente economice şi de natura testului.

Scopul unui test statistic este acela de a stabili dacă ipoteza nulă este adevărată
sau falsă.
1
Testele statistice furnizează criterii pe baza cărora se acceptă sau se respinge o
ipoteză cu privire la o populație statistică pe baza observațiilor făcute sau a datelor
statistice existente. Alegerea testului nu depinde de eșantion ci de procedeul de testare a
ipotezei statistice.

În deciziile rezultate în urma aplicării testelor statistice pot să apară și erori.


Aceste erori sunt grupate, în teoria modelării econometrice, în două mari clase de
erori de testare a unei ipoteze statistice:
 Erori de tip I – sunt erorile comise prin eliminarea unei ipoteze nule, deși aceasta
este adevărată și care deține un risc sau o probabilitate de comitere α (prag de
semnificație). Din acest prag de semnificație se deduce nivelul de încredere al
unui test statistic sau probabilitatea de garantare a rezultatelor (1-α)
 Erori de tip II – sunt erorile care apar în urma acceptării unei ipoteze nule, deși
aceasta este falsă și care deține un risc sau o probabilitate de comitere β iar
puterea testului statistic se notează cu 1-

Tabelul nr. 3.1. ilustrează legătura dintre decizia pe care o luăm referitor la ipoteza nulă
şi adevărul sau falsitatea ipoteze

Tabelul nr. 3.1. – Erorile în testarea ipotezelor statistice


Decizia de Ipoteza adevărată
acceptare H0 H1
H0 Decizie corectă (probabilitate 1-α) Eroare de tip II (risc β)
H1 Eroare de tip I (risc α) Decizie corectă
(probabilitate 1-β)

Cu cât probabilităţile comiterii erorilor de tip I şi de tip II sunt mai mici, cu atât
testul este mai bun.

Definiție: Probabilitatea de a respinge ipoteza nulă (H o) când este falsă se numește


puterea testului. Puterea testului este dată de mărimea eșantionului.
În teoria deciziei axată pe testarea ipotezelor statistice se urmărește alegerea
acelui test statistic care pentru un prag de semnificație , puterea este maximă (1-)
Tot de la o ipoteză de lucru, numită și ipoteză nulă H o, se pornește și pentru
formularea unui criteriu de semnificație. Ipoteza nulă H0 presupune că între indicatori nu
există o diferență semnificativă. Dacă, în urma comparației între valoarea estimată a
unui test statistic și valoarea teoretică a aceluiași test statistic, valoarea estimată este mai
mare, atunci se respinge ipoteza nulă. Dacă valoarea estimată a testului statistic este mai
mică decât valoarea teoretică atunci se acceptă ipoteza nulă.

2
3.2. Verificarea ipotezelor statistice

Testele statistice, în funcție de demersul statistic al testării ipotezelor, se împart în


două categorii:
 Teste pentru verificarea semnificației parametrilor repartiției – sunt folosite pentru
a compara estimatorii obținuți prin prelucrarea datelor cu parametrii
corespunzători populației. Aceste teste se împart în:
 Teste referitoare la parametrii repartiției (testul z sau testul t);
 Teste de egalitate – omogenitate (testul F);
 Testul de ajustare (testul χ2);
 Teste de independență

 Teste pentru verificarea concordanței repartițiilor – sunt utilizate pentru a verifica


dacă valorile urmează repartiția teoretică propusă.

Verificarea ipotezelor statistice presupune parcurgerea următoarelor etape:


 Etapa 1: Se identifică ipoteza statistică specială despre parametrul populaţiei sau
legea derepartiţie (H0) precum și ipoteza alternativă (H1)
 Etapa 2: Se calculează indicatorii statistici, utilizaţi pentru a accepta sau a
respinge ipoteza nulă.
 Etapa 3: Se stabileşte testul statistic ce va fi utilizat drept criteriu de acceptare
sau de respingere a ipotezei nule
 Etapa 4: Se stabileşte regiunea critică, Rc.
Regiunea critică reprezintă valorile numerice ale testului statistic pentru care ipoteza
nulă H0 va fi respinsă.
Regiunea critică se stabilește pornind de la valoarea teoretică a statisticii testului.
Valoarea teoretică a statisticii testului este o valoare tabelară în funcție de forma
distribuției, de volumul eșantionului și de probabilitatea cu care se garantează
rezultatele.
 Etapa 5: Se calculează valoarea numerică a testului statistic folosind datele din
eșantion.
 Etapa 6: Se iau deciziile privind acceptarea sau respingerea ipotezei nule. Această
etapă de luare a deciziei se bazează pe etapa 4 (regiunea critică) și etapa 5
(valoarea numerică a testului statistic).
Se întâlnesc următoarele situații:
 dacă valoarea numerică a testului statistic este în regiunea critică atunci se
respinge ipoteza nulă;
 dacă valoarea numerică a testului statisticnu este în regiunea critică atunci
se acceptă ipoteza nulă

3
În continuare sunt prezentate o serie de teste statistice folosite în luarea deciziilor:
a) testul statistic z sau testul diferenței dintre două medii
Utilizarea testului z are loc atunci când eșantioanele sunt mari (n > 30) iar
repartiția teoretică este normal distribuită cu parametrii x̄=0 și σ2.
În funcție de modul de definire a regiunii critice potem avea: test unilateral
dreapta, test unilateral stânga și test bilateral.
Ipotezele admisibile pentru fiecare tip de test:
 testul z unilateral dreapta: H0: x̄≤ X̄ și H1: x̄> X̄
 testul z unilateral stânga: H0: x̄≥ X̄ și H1: x̄< X̄
 testul z bilateral: H0: x̄= X̄ și H1: x̄≠ X̄
unde: X̄ este media teoretică iar x̄ este media selecției

Aplicarea testului constă în compararea unei valori empirice z c cu o valoare


teoretică.

Se ajunge la următoarele decizii:


x̄− X̄
≥z 1−α
2
σ
 testul z unilateral dreapta: dacă
și se acceptă ipoteza alternativă H1
√ n atunci se respinge ipoteza nulă H0

x̄− X̄
≤z α
σ2
 testul z unilateral stânga: dacă
se acceptă ipoteza alternativă H1
√ n atunci se respinge ipoteza nulă H 0 și

x̄− X̄
| |>z α
2 1−
σ
 testul z bilateral: √ n
2

atunci se acceptă ipoteza nulă H0.


În cazul în care avem două eșantioane de volum mare (n 1 > 30 și n2 > 30) cu mediile
2 2
x̄ 1 și x̄ 2 , și cu dispersiile σ 1 și σ 2 valoarea calculată a testului z devine:
x̄ 1− x̄ 2
σ 21 σ 22
√ +
n1 n2

b) testul statistic t sau testul diferenței dintre două medii


Ipotezele admisibile pentru fiecare tip de test:
 testul t unilateral dreapta: H0: x̄≤ X̄ și H1: x̄> X̄
4
 testul t unilateral stânga: H0: x̄≥ X̄ și H1: x̄< X̄
 testul t bilateral: H0: x̄= X̄ și H1: x̄≠ X̄
unde: X̄ este media teoretică iar x̄ este media selecției

Aplicarea testului constă în compararea unei valori empirice tc cu o valoare


teoretică.

Se ajunge la următoarele decizii:


x̄ − X̄
≥t n−1 ;1−α
2
σ
 testul t unilateral dreapta: dacă
H0 și se acceptă ipoteza alternativă H1
n−1 √ atunci se respinge ipoteza nulă

x̄ − X̄
≤t n−1 ;α
σ2
 testul t unilateral stânga: dacă
și se acceptă ipoteza alternativă H1
n−1 √ atunci se respinge ipoteza nulă H0

x̄− X̄
| |>t α
2 n−1;1−
σ
 testul t bilateral: √ n−1
2

atunci se acceptă ipoteza nulă H0

În cazul în care avem două eșantioane de volum mic (n 1 < 30 și n2 < 30) cu mediile x̄ 1
2 2
și x̄ 2 , și cu estimațiile dispersiilor S 1 și S 2 valoarea calculată a testului t devine:
x̄1 − x̄ 2
S 21 S 22
√ +
n 1 n2

c) testul statistic χ2 pentru verificarea disperisiei unei populației


Testul statistic χ2 este utilizat pentru a verifica dacă distribuția unei populații se
abate semnificativ de la repartiția normală sau dacă repartiția empirică diferă de
repartiția teoretică.

Deci, testul statistic utilizat în testarea ipotezei privind dispersia populației ( σ 2 ) este:
2
2 ( n−1 ) s
χc=
σ2
unde: s2 este dispersia eșantionului iar σ2 este dispersia colectivității.

5
Aplicarea testului χ2 constă în compararea unei valori empirice χ 2c cu o valoare
2
teoretică χ α ; ν .

unde: υ este numărul gradelor de libertate și este r – l – 1, r este numărul de grupe, l este
numărul parametrilor repartiției.

2 2 2 2
Ipoteza nulă H0 este σ =σ 0 iar ipoteza alternativ: σ ≠σ 0

Utilizarea testului statistic χ2 se bazează pe următoarele reguli de decizie:


2 2
 dacă χ c ≥ χ α ; ν atunci se respinge ipoteza nulă și se acceptă ipoteza alternativă
2 2
 dacă χ c < χ α ; ν atunci se acceptă ipoteza nulă

d) testul statistic F pentru verificarea raportului dintre două dispersii


Testul statistic F este folosit pentru verificarea ipotezei egalității dispersiilor a
două eșantioane independente.

Aplicarea testului F presupune parcurgerea următoarelor etape:


2 2
 Etapa 1: Se stabilește ipoteza nulă H0: σ 1 =σ 2 și ipoteza alternativă H1:
2 2
σ 1 ≠σ 2
 Etapa 2: Se stabilește valoarea teoretică a testului statistic: Fα;υ1;υ2 unde: υ1 = n1 –
1, n1 volumul primului eșantion;
υ2 = n2 – 1, n2 volumul celui de-al II-lea eșantion.
S 21
F c=
 Etapa 3: Se determină valoarea empirică a testului statistic: S 22 ; unde:
S 21 , S 22 sunt estimațiile dispersiilor celor două eșantioane
 Etapa 4: Se ia decizia astfel:
F c≥F α ; ν ; ν
 dacă 1 2 atunci se respinge ipoteza nulă și se acceptă ipoteza

alternativă
Fc< Fα;ν ;ν
 dacă 1 2 atunci se acceptă ipoteza nulă

3.3. Exemple de ipoteze statistice testate

Exemplul nr. 1

6
20 de persoane au fost împărțite în două grupuri egale. Fiecare grup a fost hrănit în
conformitate cu una din cele două diete alimentare prestabilite (A, B). La sfârșitul a trei
săptămâni, a fost înregistrată creșterea în greutate a fiecărei persoane:

Tabelul nr. 3.1. – Creșterile în greutate în funcție de dieta alimentară


Dieta A 5 14 7 9 11 7 13 14 12 8
Dieta B 5 21 16 23 4 16 13 19 9 21
a) Se poate afirma cu o probabilitate de 95% că dieta A a condus la o creștere medie
a greutății semnificativ mai mică decât dieta B?
b) Se poate afirma dacă tipul dietei influențează sau nu creșterea în greutate a
persoanelor?

H1 greutatea ptr dieta A este semnificativ mai mica fata de greutatea ptr dieta B
H0 greutatea ptr dieta A nu este semnificativ mai mica fata de greutatea ptr dieta B

Răspuns

 Etapa 1: Stabilim ipoteza nulă: H0 : x dieta A =x dieta B (mediile celor două populații
sunt egale) și ipoteza alternativă x dieta A ≠x dieta B (mediile celor două populații
nu sunt egale)
 Etapa 2: Stabilim testul statistic – în continuare folosim testul statistic t (testul
diferenței dintre două medii) deoarece atât n1 cât și n2 sunt < 30.
 Etapa 3: Stabilim valoarea teoretică a testului statistic t α;υ pentru un prag de
semnificație α =0,05 și cu un număr de grade de libertate υ = 20 – 2 = 18; t0,05;18 =
2,1
 Etapa 4: Calculăm valoarea testului statistic folosind pachetele de programe din
Excel sau Eviews
Folosind pachetul de programe Data Analysis din Excel
Pasul 1: Folosim pachetul DATA ANALYSIS din meniul DATA
Din fereastra de dialog care apare selectam testul t cu variații egale: TWO-SAMPLE
ASSUMING EQUAL VARIANCE

7
Pasul 2: Completăm câmpurile din fereastra de mai jos cu următoarele informații:

1. Variable 1 Range: Este domeniul care cuprinde valorile creșterii în greutate pentru
dieta A
2. Variable 2 Range: Este domeniul care cuprinde valorile creșterii în greutate pentru
dieta B
3. Hypothesized Mean Difference: se introduce 0 ceea ce înseamnă că presupunem că
cele două medii sunt egale (conform ipotezei nule - Ho).
4. Labels: trebuie bifat pentru că în selecţia noastră am luat și capul de tabel.
5. Alpha: eroarea alpha este 0,05 – nivelul de semnificaţie al testului t.
6. Output Range: rezultatele vor fi afişate in aceeaşi pagină începând cu celula C8

Pasul 3: Se vor obţine următoarele rezultate:

t-Test: Two-Sample Assuming Equal


Variances
  Dieta A Dieta B
Mean 10 14,7
8
10,444 46,011
Variance 44 11
Observations 10 10
28,227
Pooled Variance 78
Hypothesized
Mean Difference 0
df 18
-
1,9780
t Stat 8
0,0317
P(T<=t) one-tail 17
1,7340
t Critical one-tail 64
0,0634
P(T<=t) two-tail 34
2,1009
t Critical two-tail 22  

 Se compară media aritmetică a creșterii în greutate pentru dieta A: 10 Kg cu media


creșterii în greutate pentru dieta B: 14,7 Kg. (Mean).
 Numărul de observații atât pentru primul cât și pentru cel de-al doilea eșantion este
de 10.
 df – gradele de libertate = 18 calculate după formula n1 + n2 – 2 = 18.
 t Stat este parametrul testului și este egală cu 1,978.
 P(T<=t) one tail - Probabilitatea one-tail este 0,032. Deoarece probabilitatea obţinută
este mai mică decât α = 0,05 se poate trage concluzia că testul one-tail este statistic
semnificativ. Ipoteza nulă nu este confirmată. Deci se poate spune că media
aritmetică a creșterii în greutate pentru dieta A este mai mică semnificativ decât
media aritmetică a creșterii în greutate pentru dieta B cu o eroare α = 0,05
 t critic one-tail = 1,734. Dacă t stat >t critic one−tail  se poate spune că  media aritmetică
a creșterii în greutate pentru dieta A este mai mică semnificativ decât media creșterii
în greutate pentru dieta B.
 Probabilitatea two-tail este 0,063. Deoarece probabilitatea obţinută este mai mare
decât 0,05 se poate trage concluzia că testul two-tail este statistic nesemnificativ.
 t critical two-tail = 2,1. Dacă t stat ∉[−t critic one−tail , t critic one−tail ]  se poate spune că 
media aritmetică a creșterii în greutate pentru dieta A este mai mică semnificativ
decât media aritmetică a creșterii în greutate pentru dieta B

9
b) Se poate afirma dacă tipul dietei influențează sau nu creșterea în greutate a
persoanelor?
 Etapa 1: Se stabilește ipoteza nulă: H0 : tipul de dietă nu influențează semnificativ
creșterea în greutate și ipoteza alternativă H1 tipul de dietă influențează
semnificativ creșterea în greutate
 Etapa 2: Se stabilește testul statistic – în continuare vom folosi testul statistic F.
 Etapa 3: Se stabilește valoarea teoretică a testului statistic F α;υ1;υ2 pentru un prag
de semnificație α =0,05 și cu un număr de grade de libertate υ 1 = 2 – 1 = 1 și υ 2 =
20 – 2 = 18; F0,05;1;18 = 4,41
 Etapa 4: Se calculează valoarea testului statistic folosind pachetele de programe
din Excel sau Eviews

Folosind pachetul de programe Data Analysis din Excel

Pasul 1: Folosim pachetul DATA ANALYSIS din meniul DATA


Din fereastra de dialog care apare selectam testul ANOVA: SINGLE FACTOR

Pasul 2: Completăm câmpurile din fereastra de mai jos cu următoarele informații:

10
1. Input range: sunt selectate creșterile în greutate pentru cele două tipuri de
diete;
2. Grouped by: poziționarea șirurilor de date (în cazul nostrul pe rând);
3. Labels: trebuie bifat pentru că în selecţia noastră am luat și capul de tabel;
4. Alpha: eroarea alpha este 0,05 – nivelul de semnificaţie al testului t.
5. Output Range: rezultatele vor fi afişate in aceeaşi pagină începând cu celula
C8

Pasul 3: Se vor obţine următoarele rezultate:


Anova: Single Factor
SUMMARY
Varianc
Groups Count Sum Average e
10,4444
Dieta A 10 100 10 4
46,0111
Dieta B 10 147 14,7 1

ANOVA
Source of
Variation SS df MS F P-value F crit
Between 110,4 3,91281 0,06343 4,41387
Groups 5 1 110,45 2 4 3
Within 28,2277
Groups 508,1 18 8
618,5
Total 5 19        

În secțiunea Summary sunt prezentate informații pentru ambele șiruri de date referitoare
la: numărul de observații – Count - (atât pentru primul șir cât și pentru cel de-al doilea
avem câte 10 observații), Sum este suma valorilor din șirurile de date (pentru primul șir,
dieta A suma valorilor este de 100 iar pentru șirul de date dieta B, suma este 147),
Average este valoarea medie a creșterii în greutate pentru dieta A este de 10 Kg iar
pentru dieta B este de 14,7 Kg.
În secțiunea Source of Variation se reprezintă descompunerea în variaţie explicată
(Between Groups) şi variaţie neexplicată (Within Groups)
 SS este coloana sumelor de pătrate
 df este coloana gradelor de libertate asociate sumelor de pătrate
 MS conţine mediile sumelor de pătrate
 F este valoarea calculată a staticii F
11
 P-value, F crit sunt, respectiv, probabilitatea critică şi valoarea critică care permit
decizia în testul statistic: ipoteza nulă a grupurilor omogene se respinge dacă p-
value este mai mică sau egală cu pragul a ales sau dacă valoarea F calculată este
mai mare sau egală cu valoarea critică.

Deoarece F = 3,913 < F crit = 4,414 respectiv probabilitatea critică P – value =


0,063 > α = 0,05 se acceptă ipoteza nulă H0 deci tipul dietei nu influențează creșterea
greutății persoanelor.

Prelucrarea datelor folosind pachetul de programe Eviews


Pasul 1: Alegem opțiunea TEST OF EQUALITY din meniul VIEW

Deoarece F-statistic = 3,913 < F0,05;1;18 = 4,414 respectiv probabilitatea critică


Probability = 0,063 > α = 0,05 se acceptă ipoteza nulă H0 deci tipul dietei nu
influențează creșterea greutății persoanelor.

Exemplul nr. 2
Pentru 20 de magazine situate în zona centrală şi periferică a unui oraş, se cunosc
valorile vânzărilor (mil. RON):

Tabelul nr. 3.2. – Valorile vânzărilor în funcție de zona de amplasare


Zona Valoarea vânzărilor (mil. RON)
Centrală 27; 22; 21; 20; 28; 29; 22; 20; 16; 25; 26
12
Periferică 9; 15; 13; 18; 12; 10; 14; 18; 15

Se poate afirma cu o probabilitate de 95% că variația vânzărilor din zona centrală sunt
superioare celor din zona periferică.

Răspuns
 Etapa 1: Stabilim ipoteza nulă: H0 : x centrala =x periferica (mediile celor două populații
sunt egale) și ipoteza alternativă x centrala≠x periferica (mediile celor două populații nu
sunt egale)
 Etapa 2: Stabilim testul statistic – în continuare folosim testul statistic t (testul
diferenței dintre două medii) deoarece atât n1 cât și n2 sunt < 30.
 Etapa 3: Stabilim valoarea teoretică a testului statistic t α;υ pentru un prag de
semnificație α =0,05 și cu un număr de grade de libertate υ = 20 – 2 = 18; t0,05;18 =
2,1
 Etapa 4: Calculăm valoarea testului statistic folosind pachetele de programe din
Excel

Pasul 1: Folosim pachetul DATA ANALYSIS din meniul DATA


Din fereastra de dialog care apare selectam testul t cu variații inegale: TWO-SAMPLE
ASSUMING UNEQUAL VARIANCE

Pasul 2: Completăm câmpurile din fereastra de mai jos cu următoarele informații:

13
Pasul 3: Se vor obţine următoarele rezultate:

t-Test: Two-Sample Assuming


Unequal Variances

Centra Periferi
  lă că
23,272 13,7777
Mean 73 8
16,218 9,94444
Variance 18 4
Observations 11 9
Hypothesized
Mean Difference 0
df 18
5,9120
t Stat 78
6,75E-
P(T<=t) one-tail 06
1,7340
t Critical one-tail 64
1,35E-
P(T<=t) two-tail 05
2,1009
t Critical two-tail 22  

 Se compară media aritmetică a variației vânzărilor din zona contrală: 23,27 mil. lei
cu media variației vânzărilor din zona periferică: 13,78 mil. (Mean).
14
 Numărul de observații eșantion este 11 iar pentru cel de-al doilea eșantion este de 9.
 df – gradele de libertate = 18 calculate după formula n1 + n2 – 2 = 18.
 t Stat este parametrul testului și este egală cu 5,91.
 P(T<=t) one tail - Probabilitatea one-tail este 0,000000675. Deoarece probabilitatea
obţinută este mai mică decât α = 0,05 se poate trage concluzia că testul one-tail este
statistic semnificativ. Ipoteza nulă nu este confirmată. Deci se poate spune că media
aritmetică a vânzărilor din zona centrală este semnificativ mai mare decât media
aritmetică a vânzărilor din zona periferică cu o eroare α = 0,05
 t critic one-tail = 1,734. Dacă t stat >t critic one−tail  se poate spune că  media aritmetică
a vânzărilor din zona centrală este semnificativ mai mare decât media vânzărilor din
zona periferică.

Exemplul nr. 3

Tabelul nr. 3.3. – Evoluţia şomajului BIM în perioada 1996 – 2012 – mii șomeri
1996 1997 1998 1999 2000 2001 2002 2003 2004
Masculi
378,66 343,23 386,5 438,3 456,25 413,87 494,08 408,01 490,8
n
Feminin 369,4 321,46 301,9 307,23 319,22 297,43 351,2 283,75 308,73
continuare tabel
2005 2006 2007 2008 2009 2010 2011 2012
Masculi
420,32 452,41 398,67 369,23 423,76 436,71 431,42 419,41
n
Feminin 284,14 275,97 242,27 206,32 256,93 288,44 298,80 281,80
Sursa: https://statistici.insse.ro/shop/?page=tempo3&lang=ro&ind=AMG130A

a) Se poate afirma cu o probabilitate de 95% că numărul de bărbați șomeri este


semnificativ mai mare decât al femeilor șomere?
b) Se poate afirma dacă sexul persoanelor șomere influențează sau nu numărul de
persoane șomere?

Răspuns

Din graficul prezentat mai jos se constată că, în perioada analizată, 1996 – 2012,
numărul bărbaților șomeri este mai mare decât cel al femeilor șomere.

15
Evoluția bărbaților și femeilor șomere în perioada 1996-2012

Masculi
n
Feminin

a) Se poate afirma cu o probabilitate de 95% că numărul de bărbați șomeri este


semnificativ mai mare decât al femeilor șomere?
x someriM =x someriF
 Etapa 1: Se stabilește ipoteza nulă: H0 : (mediile celor două
x someriM ≠x someriF
populații sunt egale) și ipoteza alternativă (mediile celor
două populații nu sunt egale)
 Etapa 2: Se stabilește testul statistic – în continuare vom folosi testul statistic t
(testul diferenței dintre două medii) deoarece atât n1 cât și n2 sunt < 30.
 Etapa 3: Se stabilește valoarea teoretică a testului statistic t α;υ pentru un prag de
semnificație α =0,05 și cu un număr de grade de libertate υ = 30 – 2 = 28; t 0,05;28 =
2,05
 Etapa 4: Se calculează valoarea testului statistic folosind pachetele de programe
din Excel sau Eviews

Folosind pachetul de programe Data Analysis din Excel


Pasul 1: Folosim pachetul de programe DATA ANALYSIS din meniul DATA
Din fereastra de dialog care apare selectam testul t cu variatii egale: TWO-SAMPLE
ASSUMING EQUAL VARIANCE.
Pasul 2: Completăm câmpurile din fereastra de mai jos cu următoarele informații:
1. Variable 1 Range: Este domeniul care cuprinde numărul bărbaților șomeri în
perioada 1996-2012
2. Variable 2 Range: Este domeniul care cuprinde numărul femeilor șomere în
perioada 1996-2012
3. Hypothesized Mean Difference: se introduce 0 ceea ce înseamnă că
presupunem că cele două medii sunt egale (conform ipotezei nule - Ho).
4. Labels trebuie bifat pentru că în selecţia noastră am luat și capul de tabel.
5. Alpha – eroarea alpha este 0,05 – nivelul de semnificaţie al testului t.
16
6. Output Range – rezultatele vor fi afişate in aceeaşi pagină începând cu celula
R9

Pasul 3: Se vor obţine următoarele rezultate:


t-Test: Two-Sample Assuming Equal Variances
  Masculin Feminin
293,822
Mean 421,2724 9
1455,05
Variance 1595,958 4
Observations 17 17
Pooled Variance 1525,506
Hypothesized Mean
Difference 0
df 32
t Stat 9,5135
P(T<=t) one-tail 3,79E-11
t Critical one-tail 1,693889
P(T<=t) two-tail 7,57E-11
t Critical two-tail 2,036933  

 Se compară media aritmetică a numărului de șomeri bărbați: 421,27 mii persoane cu


media numărului de șomeri femei: 293,82 mii persoane. (Mean).
 Numărul de observații atât pentru primul cât și pentru cel de-al doilea eșantion este
de 17.
 df – gradele de libertate = 32 calculate după formula n1 + n2 – 2 = 17 + 17 – 2 = 32.
 t Stat este parametrul testului și este egală cu 9,51.

17
 P(T<=t) one tail - Probabilitatea one-tail este 0,00000000000379. Deoarece
probabilitatea obţinută este mai mică decât α = 0,05 se poate trage concluzia că testul
one-tail este statistic semnificativ. Ipoteza nulă nu este confirmată. Deci se poate
spune că media aritmetică a numărului de șomeri bărbați este mai mare semnificativ
decât media aritmetică a numărului de șomeri femei cu o eroare α = 0,05
 t critic one-tail = 1,69. Dacă t stat >t critic one−tail  se poate spune că  media aritmetică a
numărului de bărbați șomeri este mai mare semnificativ decât media numărului de
femei șomere.
 Probabilitatea two-tail este 0,0000000000076. Deoarece probabilitatea obţinută este
mai mică decât 0,05 se poate trage concluzia că testul two-tail este statistic
semnificativ.
 t critical two-tail = 2,04. Dacă t stat ∉[−t critic one−tail , t critic one−tail ]  se poate spune că 
media aritmetică a bărbaților șomeri este mai mare semnificativ decât media
aritmetică a femeilor șomere.
 Folosind pachetul de programe Eviews
Pasul 1: Deschidem cele două variabile sub formă de grup: OPEN AS GROUP

Pasul 2: Bifăm opțiunea TEST OF EQUALITY din meniul View

18
Pasul 3: Obţinem următoarele rezultate:

Deoarece valoarea calculată a testului t este 9,51 este mai mare decât valoarea
teoretică a testului t0,05;32 = 2,04 respectiv probabilitatea (0) este mai mică decât pragul
de semnificație α = 0,05 se poate spune că că  media aritmetică a bărbaților șomeri este
mai mare semnificativ decât media aritmetică a femeilor șomere.

b) Se poate afirma dacă sexul persoanelor șomere influențează sau nu numărul de


persoane șomere?
 Etapa 1: Se stabilește ipoteza nulă: H0 : sexul nu influențează semnificativ
numărul persoanelor șomere și ipoteza alternativă H 1 sexul influențează
semnificativ numărul persoanelor șomere
 Etapa 2: Se stabilește testul statistic – în continuare vom folosi testul statistic F.
 Etapa 3: Se stabilește valoarea teoretică a testului statistic F α;υ1;υ2 pentru un prag
de semnificație α =0,05 și cu un număr de grade de libertate υ 1 = 2 – 1 = 1 și υ 2 =
34 – 2 = 32; F0,05;1;32 = 4,17
 Etapa 4: Se calculează valoarea testului statistic folosind pachetele de programe
din Excel sau Eviews
 Folosind pachetul de programe Data Analysis din Excel
Pasul 1: Alegem opţiunea DATA ANALYSIS din meniul DATA
Din fereastra de dialog care apare selectam testul ANOVA: ANOVA: SINGLE
FACTOR
Pasul 2: Completăm câmpurile din fereastra de mai jos cu următoarele informații:
 Input range: sunt selectate numărul de persoane șomere de sex feminin și
masculin;
19
 Grouped by: poziționarea șirurilor de date (în cazul nostrul pe rând);
 Labels trebuie bifat pentru că în selecţia noastră am luat și capul de tabel;
 Alpha – eroarea alpha este 0,05 – nivelul de semnificaţie al testului t.
 Output Range – rezultatele vor fi afişate in aceeaşi pagină începând cu celula C8

Pasul 3: Obţinem următoarele rezultate:

Anova: Single Factor


SUMMARY
Averag Varianc
Groups Count Sum e e
7161,6 421,272 1595,95
Masculin 17 3 4 8
4994,9 293,822 1455,05
Feminin 17 9 9 4
ANOVA
Source of P-
Variation SS df MS F value F crit
Between 138068, 138068, 90,5066 7,57E- 4,14909
Groups 5 1 5 8 11 7
Within 1525,50
Groups 48816,2 32 6
186884,
Total 7 33        
În secțiunea Summary sunt prezentate informații pentru ambele șiruri de date
referitoare la: numărul de observații – Count - (atât pentru primul șir cât și pentru cel de-
al doilea avem câte 17 observații), Sum este suma valorilor din șirurile de date (pentru
20
primul șir, șomeri de sex masculin valorilor este de 7161,63 mii persoane iar pentru
șirul de date șomeri de sex feminin suma este 4994,99 mii persoane), Average este
valoarea medie a numărului de bărbați șomeri este de 421,27 mii persoane iar pentru
numărul de femei șomere este de 293,82 mii persoane.
Deoarece F = 90,51 ≥ F crit = 4,15 respectiv probabilitatea critică P – value = 0
< α = 0,05 se respinge ipoteza nulă H0 deci sexul influențează semnificativ numărul
șomerilor.
 Folosind pachetul de programe Eviews
Bifăm opțiunea TEST OF EQUALITY din meniul View

Se constată că se poate respinge ipoteza nulă, deci sexul influențează semnificativ


numărul șomerilor, deoarece F = 90,51 ≥ F0,05;1;32 = 4,17 respectiv probabilitatea critică
P – value = 0 < α = 0,05.

21

S-ar putea să vă placă și