Sunteți pe pagina 1din 23

DATELE DE INTRARE:

Num r mediu de salaria i din sectorul energiei electrice termice, gaze i ap (2007) 3365 1234 4656 1602 963 1076 3853 1406 4447 1762 2718 1529 5149 5094 3209 1832 4018

Regiunile de dezvoltare

Nr. Crt.

Judete

C tig salarial din sectorul energiei electrice termice, gaze i ap (2007) 2037 1775 2157 1877 1904 1710 2131 1987 2158 2245 2110 1671 2087 2551 2288 1961 2207

PIB (2007) Milioane lei

Popula ia din 2007 (mii persoane)

Nord-Vest

Nord-Est

Sud-Vest Oltenia

1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5

Bihor Bistri a-N s ud Cluj Maramure Satu Mare S laj Bac u Boto ani Ia i Neam Suceva Vaslui Dolj Gorj Mehedin i Olt Vlcea

11488.9 4976.4 18020.9 7012.7 5341.6 3883.6 9846.2 4737.6 12071.9 6659.7 8864.8 3809.9 10675.0 7613.9 3755.6 5566.3 6808.8

594 316 692 513 366 243 719 454 825 566 705 455 712 381 298 475 411

a. Realizarea i interpretarea regresiei unifactoriale y i ! f x i

Nr. mediu salaria i din sectorul energiei electrice termice, gaze i ap = f (PIB) X- variabila cauz , explicativ ; PIB Y- variabila efect, explicata; Nr. mediu salaria i din sectorul energiei electrice termice, gaze i ap

1. S se reprezinte grafic datele


CORELOGRAMA DINTRE VARIABILA EFECT,"NUMARUL MEDIU DE SALARIATI DIN SECTORUL ENERGIEI ELECTRICE GAZE SI APA" SI VARIABILA CAUZA "PIB 2007"
Numarul mediu de salariati din sectorul energiei electrice, termice, gaze si apa(2007) (mii persoane)
7 6 5 4 3 2 1 0 0 5 y = 0.2856x + 0.5759 R = 0.5096

PIB 2007 (miliarde lei)

10

15

20

Corelograma sugereaz c exist leg tur direct

i liniar ntre cele dou variabile.

2. S se determine modelul de regresie pe baza datelor din e antion


Exist o func ie f astfel nct variabila X explic variabila Y prin func ia f, Y ! f X , o func ie liniar f x ! E  F x . Modelul liniar de regresie este Y ! E  F X  I . 2

Pentru fiecare dintre cele n=17 jude e s-au notat valorile celor dou variabile, X i Y, ob inndu-se astfel seria de date _ x1 , y1 , x2 , y 2 ,..., x n , y n sau xi , yi , i ! 1, n . Pe baza acestui a e antion vom determina estimatorii a i b ai parametrilor E i F ai modelului de regresie. Estimatorii a i b reprezint solu ia sistemului ecua iilor normale:

n n na  b xi ! yi i !1 i !1 n n n x  b x2 ! x y a i i i i i !1 i !1 i !1

Rezolvarea sistemului folosind metoda determinan ilor: a !


n

(a ( si b ! b , ( (

n unde ( !
n i i !1 n

x
i !1 n i !1 n

este determinantul matricei sistemului de ecua ii,


2 i

x x yi
iar (a !
i !1 n i i i !1

xi
i !1 n i !1

n , (b !
n i i !1

y
i !1 n i i !1

sunt minorii corespunz tori celor dou


i

x y x
necunoscute.
! a b !

2 i

x x y

n n 2 n n y i xi  xi xi y i ( a i !1 i !1 i !1 i!1 ! 2 n n ( n xi2  xi i !1 i !1 n n n n xi yi  xi yi (b i !1 i!1 ! i !1 2 n ( n n xi2  xi i!1 i!1

Calculele intermediare sunt prezentate n tabelul de mai jos:


Valorile x i ale Valorile y i ale NR.CRT variabilei X variabilei Y 1 11,5 3,365 2 5 1,234 3 18 4,656 4 7 1,602 5 5 0,963 6 4 1,076 7 10 3,853 8 5 1,406 9 12 4,447 10 7 1,762 11 9 2,718 12 4 1,529 13 11 5,149 14 8 5,094 15 4 3,209 16 6 1,832 17 7 4,018 TOTAL 133,5 47,913

xi 2
132,25 25 324 49 25 16 100 25 144 49 81 16 121 64 16 36 49

yi 2
11,323225 1,522756 21,678336 2,566404 0,927369 1,157776 14,845609 1,976836 19,775809 3,104644 7,387524 2,337841 26,512201 25,948836 10,297681 3,356224 16,144324

xi yi
38,6975 6,17 83,808 11,214 4,815 4,304 38,53 7,03 53,364 12,334 24,462 6,116 56,639 40,752 12,836 10,992 28,126

1272,25

170,863395

440,1895

Se ob ine:

( a 47,913 v 1272,25  133,5 v 440,1895 ! ! 0,58 ( 17 v 1272,25  17822,25 (b 17 v 440,19  133,5 v 47,913 ! 0,28 , ! b! 17 v 1272, 25  17822,25 ( a!

O alta metoda de determinare a ecuatiei de regresie se bazeaza pe baza datelor din urm torul tabel:

Coefficients

Standard Error

t Stat

P-value

Lower 95%

Upper 95%

Lower 95,0%

Upper 95,0% 1,9096 0,4397

Intercept 0,575936942 0,625713051 0,920448983 0,371904825 0,757738851 1,909613 -0,75774 PIB(2007)(miliarde lei) 0,285558592 0,072329164 3,948042208 0,001288647 0,131392629 0,439725 0,131393

prin urmare dreapta de regresie este de ecua ie y ! a  b x ! 0.58  0.28 x , ecua ia de regresie liniar n e antion este y i ! a  b xi  ei ! 0.58  0.28 x i  ei , i ! 1,17 , iar valorile ajustate ale observa iilor y i , i ! 1,17 prin regresie sunt y i ! a  b xi ! 0,58  0.28 xi , i ! 1,17 . a = 0,58- intercept, termen liber, reprezint valoarea pe care o ia variabila efect atunci cand nivelul variabilei cauz este 0. In cazul nostru, coeficientul nu are o interpretare semnificativ statistic. b = 0,28 la cre terea cu o unitate (1 miliard lei) a PIB, nr de salaria i va cre te cu 0,28 mii persoane. b>0 legatur direct ntre cele 2 variabile.

3. S se verifice validitatea modelului de regresie pentru un nivel de semnifica ie 0,05.


Validitatea modelului de regresie Pentru testarea validit ii modelului se formuleaz cele dou ipoteze: H0: modelul de regresie este nevalid statistic, cu alternativa H1: modelul de regresie este valid statistic. Statistica utilizat pentru a decide care dintre ipoteze se accept este: s
2 y/ x 2 e

(2y / x ! k Fisher k ,nk 1 , (2e n  k 1

F!

unde k este num rul de variabile explicative din modelul de regresie (n cazul nostru, k=1 deoarece avem un model de regresie liniar unifactorial sau simpl , adic cu o singur variabil explicativ ). Fie nivelul sau pragul de semnifica ie al testului, iar 1- este nivelul de ncredere al testului. n cazul nostru = 5%= 0,05. 5

Pentru calculul statisticii Fcalc folosim tabelul ANOVA:

Sursa varia iei

Suma p tratelor (SS-Sum of Squares)


n

Grade de libertate (df degrees of freedom)

Media p tratelor (MS- Mean of Squares) Dispersiile corectate


2 sy/ x !

Valoarea statisticii F
2 sy / x

Fcritic

Datorat regresiei (Regression) Rezidual (Residual)

SSR ! (2y / x ! yi  y
i !1

(2y / x k

Fcalc !

se2

FE ';k ,n k 1

SSE ! (2e ! y i  yi
i !1

nk1
2

2 se !

(2e n  k 1

Total

SST ! ( ! yi  y
i !1

2 y

n1

s !

2 y

(2y n 1

Tabelul ANOVA calculat cu ajutorul programului informatic Excel este urm torul:
ANOVA Df Regression Residual Total 1 15 16 SS 18,2561975 17,56863461 35,82483212 MS 18,2561975 1,171242308 F 15,58703727 Significance F 0,001288647

Regula de decizie: Fcalculat= 15,58 Fcritic= F ;k;n-k-1= F0,05;1;15=4,49

Fcalc " Fcritic ! FE ';k ,n  k 1 , adic Fcalc se g se te n regiunea critic , atunci respingem H0 i
accept m H1, c modelul de regresie este valid statistic.

4. S se testeze semnifica ia parametrilor modelului de regresie, pentru un nivel de semnifica ie 0,05.


Testarea parametrului : H0: =0 (parametrul este nesemnificativ statistic) H1: 0 (parametrul este semnificativ statistic, adic semnificativ diferit de 0) Statistica testului este t !

a E Student ( nk 1) , sa !s e 2 x 1  n este abaterea standard (eroarea n xi  x 2 i !1

x2 2 1 s ! se  n unde a n xi  x 2 i !1

2 2 standard) a estimatorului a, s e este disperia reziduala, iar s e ! s e este abaterea standard rezidual (eroarea standard rezidual sau a erorilor).

Pentru a calcula statistica testului m-am folosit de urmatoarele date:

Intercept PIB(2007)(miliarde lei)

Coefficients 0,575936942 0,285558592

Standard Error 0,625713051 0,072329164

t Stat 0,920448983 3,948042208

Valoarea calculat a statisticii testului, n ipoteza c H0 este adevar t , adic

=0, este

t calc !

a0 a a 0,58 ! ! 0,92 , cu sa= 0,62. ! , deci t calc ! sa sa s a 0,63


Dac nivelul de semnifica ie este =0,05, atunci tE ' ! t 0, 05 ! 2,131 si t calc ! 0,62 Ra , deci acceptam H0 i concluzion m ca
2 ; n  k 1 2 ;15

nu

este semnificativ statistic. Testarea semnifica iei parametrului H0: =0 (parametrul este nesemnificativ statistic) H1: 0 (parametrul este semnificativ statistic, adic semnificativ diferit de 0)

Statistica testului este t !


2 unde sb ! s e

bF Student ( nk 1) , sb se


2 xi  x i !1 n

x
i !1

 x

este abaterea standard (eroarea standard) a

estimatorului b,
2 2 s e este dispersia rezidual , iar s e ! s e este abaterea standard rezidual (eroarea standard

rezidual ). Pentru calcularea statisticii testului am folosit acela i tabel de mai sus.

Intercept PIB(2007)(miliarde lei)

Coefficients 0,575936942 0,285558592

Standard Error 0,625713051 0,072329164

t Stat 0,920448983 3,948042208

Valoarea calculat a statisticii testului, n ipoteza c H0 este adevar t , adic

=0, este

t calc !

b0 b b 0,2855 ! , deci t calc ! s ! 0,072 ! 3,948 , cu sb=0,072. sb sb b

Cum t E ';n k 1 ! t 0 , 05 ;15 ! 2,131 , atunci t calc ! 3,948 Rc !  g;2,131 2,131; g , deci respingen
2 2

H0 i concluzion m ca este semnificativ statistic, cu o probabilitate de 0,05 de a comite o eroare de primul tip (s respingem H0 cnd aceasta este adev rat ).

5. S se m soare intensitatea leg turii dintre variabile folosind coeficientul de corela ie i raportul de corela ie, testnd semnifica ia acestora pentru un nivel de semnifica ie 0,05.
1. M surarea intensit ii utiliznd coeficientul liniar de corela ie Pearson

xi  x yi  y
rxy !
i !1

x y
i

nx y !

x  x
i i !1

y  y
i i !1

!
2

i !1

n 2 n xi  n x 2 yi2  n y 2 i !1 i !1

n n n n xi yi  xi yi i !1 i !1 i !1 n 2 n 2 n 2 n 2 n xi  xi n yi  yi i !1 i !1 i !1 i !1

rxy !

17 440,1895 133,5 47,913 ! 0,71 17 1272,25  17822,25 17 170,863  2295,655

Valoarea coeficientului de corela ie Pearson, pozitiv i relativ apropiat de 1, arat c ntre cele dou variabile exist o leg tura liniar direct i de intensitate puternica. Testarea semnifica iei coeficientului de corela ie Pierson Ipotezele testate sunt: : =0 ( nu este semnificativ statistic) : 0 ( este semnificativ statistic) Statistica testului este: t= 

Valoarea calculat a statisticii testului este urm toarea: =


 

=3, 89, unde r- coeficientul de corela ie Pierson

Valoarea critica a lui t, pentru un prag de semnifica ie de 5% i 15 grade de libertate este de 2,131 rezult c :  > , adic  , adic resping , accept , deci coeficientul de corela ie Pierson este semnificativ statistic.

2. M surarea intensit ii utiliznd raportul de corela ie (R)


Regression Statistics Multiple R 0,713860055 R Square 0,509596177 Adjusted R Square 0,476902589 Standard Error 1,082239487 Observations 17 ANOVA Df Regression Residual Total 1 15 16 SS 18,2561975 17,56863461 35,82483212 MS 18,2561975 1,171242308 F 15,58703727 Significance F 0,001288647

R!

SSR ! SST

(2y / x (2y

18,256 ! 0,71 35,825

Cum b>0, |R|=|r|. Valoarea raportului de corela ie, pozitiv i relativ apropiat de 1, arat c ntre cele dou variabile exist o leg tura liniar direct i de intensitate puternica Testarea semnifica iei coeficientului de corela ie Pierson Testarea validit ii sau semnifica iei raportului de corela ie const n testarea H0: Raportul de corela ie este nesemnificativ statistic (variabila X nu are influen semnificativ asupra lui Y) cu alternativa H1: Raportul de corela ie este semnificativ statistic (semnificativ diferit de 0, adic variabila X are influen semnificativ asupra lui Y).

10

R2 k F! Fisher k ,n  k 1 Statistica testului este . 1 R2 n  k 1


Pentru a calcula statistica testului avem nevoie de valoarea coeficientului de 2 determina ie, notat cu R , (R Square), valoare pe care o g sim in tabelul urm tor:
Regression Statistics Multiple R 0,713860055 R Square 0,509596177 Adjusted R Square 0,476902589 Standard Error 1,082239487 Observations 17

0,509 1 Valoarea calculat a statisticii testului este F ! 1  0,509 ! 15,9 , 17  1  1 accea i valoare ca la testarea validit ii modelului de regresie folosind ANOVA.

Daca

testearea

se

realizeaza

la

un

prag

de

semnifica ie

=0,05,

atunci

Fcritic ! FE ';k , n k 1 ! F0, 05;1,15 ! 4,54 .


Compar m Fcalc=15,9> 4,54=Fcritic, respingem ipoteza nul H0 i concluzion m c raportul de corela ie este semnificativ diferit de zero, adic variabila X (distan a) are o influen semnificativ asupra variabilei Y (prejudiciul).

6. Ce pondere din varia ia variabilei efect este explicat variabilei cauz ?


Regression Statistics Multiple R 0,713860055 R Square 0,509596177 Adjusted R Square 0,476902589 Standard Error 1,082239487 Observations 17

de variatia

Pentru ponderea din varia ia variabilei efect numarul mediu de salaria i din sectorul energiei electrice, termice, gaze si apa (2007) explicat de variabila cauz PIB (2007) vom utiliza coeficientul de determina ie, R 2 , R square. Valoarea acestuia a fost calculat de programul informatic Excel, Rsquare=0,509, cu valoarea procentual de 50,9%. 11

n concluzie, din varia ia total a variabilei efect n propor ie de 50,9% este explicat de variabila cauz , restul de 49,1% fiind explicat de varia ia factorilor aleatori.

REZOLVARE FOLOSIND EXCEL:


PIB(2007)(miliarde lei) Mean Standard Error Median Mode Standard Deviation Sample Variance Kurtosis Skewness Range Minimum Maximum Sum Count Confidence Level(95,0%) 7,852941176 0,907246871 7 5 3,74067468 13,99264706 1,956316119 1,296037778 14 4 18 133,5 17 1,923277438

SUMMARY OUTPUT Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations 0,713860055 0,509596177 0,476902589 1,082239487 17

ANOVA df Regression Residual Total 1 15 16 SS 18,2561975 17,56863461 35,82483212 MS 18,2561975 1,171242308

F 15,5870372

Coefficients

Standard Error

t Stat

P-value

12

Intercept PIB(2007)(miliarde lei)

0,575936942 0,285558592

0,625713051 0,072329164

0,920448983 3,948042208

0,37190482 0,00128864

RESIDUAL OUTPUT Observation 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Predicted Numarul mediu de salariati 3,859860746 2,0037299 5,715991592 2,574847084 2,0037299 1,718171308 3,431522859 2,0037299 4,002640042 2,574847084 3,145964267 1,718171308 3,71708145 2,860405675 1,718171308 2,289288492 2,574847084 Residuals -0,494860746 -0,7697299 -1,059991592 -0,972847084 -1,0407299 -0,642171308 0,421477141 -0,5977299 0,444359958 -0,812847084 -0,427964267 -0,189171308 1,43191855 2,233594325 1,490828692 -0,457288492 1,443152916

13

b. Realizarea i interpretarea regresiei multifactoriale: y i ! f x1i , x 2i , x3i Unde: yi - num r mediu de salaria i din sectorul energiei electrice termice, gaze i ap (2007) (mii
persoane) x1i - c tig salarial din sectorul energiei electrice termice, gaze i ap (2007)( mii lei)

x 2i - PIB din 2007 (miliarde lei) x3i - popula ia din 2007 ( sute de mii persoane) ..

Num r mediu salaria i din sectorul energiei electrice termice, gaze i ap = f (C tig salarial din sectorul energiei electrice termice, gaze i ap , PIB, Popula ie)

1 S se determine modelul de regresie pe baza datelor din e antion


La nivelul e antionului, modelul de regresie liniar multifactorial este:
y x1 , x2 , x 3i ! b0  b1 x1i  b2 x 2 i  b3 x 31  ei , i= {1,2,3,17} cu component predictibil :
= + + + , i= {1,2,3,17}. Coefficients -6,13971509 3,57846274 0,198832498 0,011611699

Intercept Castig salarial (mii lei) PIB(2007)(miliarde lei) populatie(sute mii persoane)

Pe baza tabelului de mai sus, calculat de programul informatic Excel, am determinat modelul de regresie la nivelul e antionului: (Intercept)= -6,14 = termenul liber al modelului, care arat care este valoarea medie a variabilei explicate (efect) atunci cnd nivelul tuturor celor K variabile explicative este 0. (C tig salarial(mii lei))= 3,58 (PIB (2007)(miliarde lei))= 0,2 (Popula ue (sute mii persoane))= 0,01 Coeficien ii , i arat influen a par ial a fiec rei variabile independente, atunci cnd influen a tuturor celorlalte variabile independente este considerat constant . A adar,   , i={1,2,...,17} 14

2 S se verifice validitatea modelului de regresie pentru un nivel de semnifica ie 0,05.


Pentru testarea validit ii modelului se formuleaz cele dou ipoteze: H0: modelul de regresie este nevalid statistic, cu alternativa H1: modelul de regresie este valid statistic. Statistica utilizat pentru a decide care dintre ipoteze se accept este:
2 sy / x

(2y / x ! k Fisher k ,nk 1 , (2e n  k 1

F!

2 e

unde k este num rul de variabile explicative din modelul de regresie (n cazul nostru, k=3 deoarece avem un model de regresie liniar multifactorial sau multipl ) Fie nivelul sau pragul de semnifica ie al testului, iar 1- este nivelul de ncredere al testului. n cazul nostru = 5%= 0,05. Pentru calculul statisticii Fcalc folosim tabelul ANOVA:

Sursa varia iei

Suma p tratelor (SS-Sum of Squares)


n

Grade de libertate (df degrees of freedom)

Media p tratelor (MS- Mean of Squares) Dispersiile corectate


2 sy/ x !

Valoarea statisticii F
2 sy / x

Fcritic

Datorat regresiei (Regression) Rezidual (Residual)

SSR ! (2y / x ! yi  y
i !1

(2y / x k

Fcalc !

se2

FE ';k ,n k 1

SSE ! (2e ! y i  yi
i !1

nk1
2

2 se !

(2e n  k 1

Total

SST ! (2y ! yi  y
i !1

n1

s !

2 y

(2y n 1

15

Tabelul ANOVA calculat cu ajutorul programului informatic Excel este urm torul:
ANOVA df Regression Residual Total 3 13 16 SS 26,99677791 8,828054206 35,82483212 MS F 8,99892597 13,25162 0,679081093 Significance F 0,0003

Statistica testului se noteaz cu sus.

, corespunz tor nota iei F din tabelul ANOVA de mai

Fcalc !

2 sy / x

se2

Regula de decizie: 

Fcalc " Fcritic ! FE ';k ,n  k 1 , adic Fcalc se g se te n regiunea critic , atunci respingem H0 i
accept m H1, c modelul de regresie este valid statistic.

3 S se testeze semnifica ia parametrilor modelului de regresie, pentru un nivel de semnifica ie 0,05.


Pentru a testa semnificatia parametrilor modelului de regresie am utilizat datele din urm torul table:

Coefficients Intercept Castig salarial (mii lei) PIB(2007)(miliarde lei) populatie(sute mii persoane)

P-value Lower 95% -6,13971509 2,005757217 3,061045992 0,009104 10,47289011

Standard Error

t Stat

Upper 95% -1,806540075 5,736169757 0,398182692 0,426077583

3,57846274 0,998767972 3,582876946 0,003339 1,420755723 0,198832498 0,092276007 2,154758361 0,050515 0,000517695 0,011611699 0,19184961 0,060525007 0,952658 0,402854185

16

Coefficients

Standard t stat Error Testul t Abaterea standard

P-value

Lower Limita inferioar a intervalului de ncredere a parametrului

Upper Limita superioar a intervalului de ncredere a parametrului -1,806540075 b0  t E / 2 ; n  3 s b 0 5,736169757 b1  t E / 2; n  3 sb1

Intercept
b0= -6,14

s b0

tb0 !
=2

b0 sb 0 b1 s b1 b2 sb 2

0,009104<0,05
 este semnificativ

-3,06

-10,47289011 b0  t E / 2 ; n  3 s b 0 1,420755723 b1  tE / 2; n 3 s b1

Castig salarial (mii lei)

b1= 3,57

s b1 = 0,2

t b1 !

0,003339<0,05
coeficientul b1 este semnificativ

3,58

b2=0,19

PIB(2007)(miliarde lei)
=0,01

s b2

tb2 !
= 0,92

0,050515>0,05
coeficientul b2 nu este semnificativ

2,15

-0,000517695 b2  t E / 2; n  3 s b 2 -0,402854185

0,398182692 b2  tE / 2; n  3 s b 2

0,952658>0,05 populatie(sute mii persoane)


= 0,19

0,06

Coeficientul Nu este semnificativ

0,426077583

Testarea semnifica iei parametrului F 0 H0 : F 0 = 0 (panta F 0 este zero, adic F 0 nu este semnificativ diferit de zero, deci F 0 nu este semnificativ statistic) H1 : F 0 { 0, (panta F 0 nu este diferit de zero, adic F 0 este semnificativ diferit de zero, deci F 0 este semnificativ statistic) Deoarece n = 17 30 avem e antion de volum redus i pentru testare vom utiliza testul t. tiind c pragul de semnifica ie este E ! 0,05 i k ! 3 (exist trei factori de influen ) se stabile te:


Statistica testului este: t calc ! t b0 ! Regula de decizie

b0 ! 3,06 sb0

17

t b 0  3,06 t critic 2,16 , adic nu apartine regiunii critice, adic accept Ho, resping H1, deci parametrul nu este valid statistic y pragul critic P-value b0 = 0,009104< E ! 0,05 pragul de semnifica ie, rezult c parametrul nu este valid statistic limita inferioar a intervalului de ncredere (lower 95% =-10,47289011) este cu acela i semn fa de limita superioar a intervalului (upper 95% =-1,806540075); intervalul de ncredere este - 10,47289011 e F 0 e - 1,806540075 ; y Testarea semnifica iei parametrului F 1 : H0 : F 1 = 0 (panta F 1 este zero, adic F 1 nu este semnificativ diferit de zero, deci F 1 nu este semnificativ statistic) H1 : F 1 { 0, (panta F 1 nu este diferit de zero, adic F 1 este semnificativ diferit de zero, deci F 1 este semnificativ statistic) Deoarece n = 17 30 avem e antion de volum redus i pentru testare vom utiliza testul t. tiind c pragul de semnifica ie este E ! 0,05 i k=3 (exist trei factori de influen ) se stabile te:

Statistica testului este: t calc ! t b1 !

b1 ! 3,58 s b1

Regula de decizie: y t c 3,58 " t critic 2,16 , adic apar ine regiunii critice, prin urmare resping H0, accept H1, deci parametrul nu este semnificiativ statistic y pragul critic P-value = 0,003339< E ! 0,05 pragul de semnifica ie , deci parametrul F 1 nu este semnificativ statistic y limita inferioar a intervalului de ncredere (lower 95% =1,420755723) este cu acela i semn ca limita superioar a intervalului (upper 95% =)5,736169757; intervalul de ncredere este 1,420755723 e F 1 e 5,736169757 ;parametrul este semnificativ statistic

4 S se m soare intensitatea leg turii dintre variabile folosind raportul de corela ie, testnd semnifica ia acestuia pentru un nivel de semnifica ie 0,05.
Valoarea calculat a raportului de corela ie o reg sim in urm torul tabel, sub nota ia de Multiple R:
Regression Statistics Multiple R 0,868088264 R Square 0,753577234 Adjusted R Square 0,696710442 Standard Error 0,824063767

18

Observations

17

R= 0,86, raportul de corela ie are o valoare pozitiv legatura dintre variabile este puternica O alt metod de calcul pentru R este urm toarea:
ANOVA df Regression Residual Total 3 13 16

i care tinde la 1, ceea ce inseamn c

SS 26,99677791 8,828054206 35,82483212

MS F 8,99892597 13,25162 0,679081093

Significance F 0,000299529

R!

(2y / x SSR 26,99 ! ! ! 0,86 SST (2y 8,82

Testarea semnifica iei raportului de corela ie, =0,05 Testarea validit ii sau semnifica iei raportului de corela ie const n testarea H0: Raportul de corela ie este nesemnificativ statistic (variabila X nu are influen semnificativ asupra lui Y) cu alternativa H1: Raportul de corela ie este semnificativ statistic (semnificativ diferit de 0, adic variabila X are influen semnificativ asupra lui Y).

R2 k F! Fisher k ,n  k 1 Statistica testului este . 1 R2 n  k 1


Pentru a calcula statistica testului avem nevoie de valoarea coeficientului de 2 determina ie, notat cu R , (R Square), valoare pe care o g sim in tabelul urm tor:
Regression Statistics Multiple R 0,868088264 R Square 0,753577234 Adjusted R Square 0,696710442 Standard Error 0,824063767 Observations 17

R Square = 0,75

19

0,75 1 Valoarea calculat a statisticii testului este F ! 1  0,75 ! 39,47 . 17  3  1

Daca

testearea

se

realizeaza

la

un

prag

de

semnifica ie

=0,05,

atunci

Fcritic ! FE ';k ,n k 1 ! F0, 05;3,13 ! 3,41 .


Compar m Fcalc=39,47> 3,41=Fcritic, respingem ipoteza nul H0 i concluzion m c raportul de corela ie este semnificativ diferit de zero, adic variabila X (distan a) are o influen semnificativ asupra variabilei Y (prejudiciul).

5 Ce pondere din varia ia variabilei efect este explicat variabilelor?


Regression Statistics Multiple R 0,868088264 R Square 0,753577234 Adjusted R Square 0,696710442 Standard Error 0,824063767 Observations 17

de variatia

Pentru a afla ponderea din variatia variabilei efect explicate de variatia variabilelor cauz vom utilize coeficientul de determina ie, R square sub forma procentual (coeficientul de determina ie sub forma procentuala). R square(%)= 75%, adic 75% din varia ia variabilei efect(Nr mediu de salariati din sectorul energiei electrice, termice, gaze si apa) este explicat de varia ia variabilelor cauz (Castig salarial din sectorul energiei electrice, termice, gaze si apa (2007), PIB (2007), Populatia din 2007), restul de 25% datorndu-se factorilor aleatori.

20

REZOLVARE FOLOSIND EXCEL:


Castig salarial (mii lei) Mean Standard Error Median Mode Standard Deviation Sample Variance Kurtosis Skewness Range Minimum Maximum Sum Count Confidence Level(95,0%) 2,050352941 0,054338599 2,087 #N/A 0,224043785 0,050195618 0,307646307 0,183678495 0,88 1,671 2,551 34,856 17 0,115192684

populatie(sute mii persoane) Mean Standard Error Median Mode Standard Deviation Sample Variance Kurtosis Skewness Range Minimum Maximum Sum Count Confidence Level(95,0%) 5,132353 0,417149 4,75 #N/A 1,719947 2,958219 -1,04211 0,221263 5,82 2,43 8,25 87,25 17 0,884315

PIB(2007)(miliarde lei) Mean Standard Error Median Mode Standard Deviation Sample Variance Kurtosis Skewness Range Minimum Maximum Sum Count Confidence Level(95,0%) 7,852941 0,907247 7 5 3,740675 13,99265 1,956316 1,296038 14 4 18 133,5 17 1,923277

21

SUMMARY OUTPUT Regression Statistics Multiple R 0,868088264 R Square 0,753577234 Adjusted R Square 0,696710442 Standard Error 0,824063767 Observations 17 ANOVA df Regression Residual Total 3 13 16 Coefficients Intercept -6,13971509 Castig salarial (mii 3,57846274 lei) PIB(2007)(miliarde 0,198832498 lei) populatie(sute mii persoane) 0,011611699 RESIDUAL OUTPUT Observation 1 2 3 4 5 6 7 8 9 10 11 12 13 Predicted Numarul mediu de salariati 3,505160734 1,242911734 5,238366967 2,028454977 1,710339277 0,803002617 3,557802108 2,01756998 4,064394 3,351483466 3,282196254 0,688059372 3,598369427 Residuals -0,140160734 -0,008911734 -0,582366967 -0,426454977 -0,747339277 0,272997383 0,295197892 -0,61156998 0,382606 -1,589483466 -0,564196254 0,840940628 1,550630573 Significance SS MS F F 26,99677791 8,99892597 13,25162 0,000299529 8,828054206 0,679081093 35,82483212 Standard Error t Stat P-value Lower 95% Upper 95%

2,005757217 3,061045992 0,009104 10,47289011 1,806540075 0,998767972 3,582876946 0,003339 1,420755723 5,736169757 0,092276007 2,154758361 0,050515 0,000517695 0,398182692 0,19184961 0,060525007 0,952658 0,402854185 0,426077583

22

14 15 16 17

4,62384392 2,877740515 2,125800903 3,197503748

0,47015608 0,331259485 -0,293800903 0,820496252

23