Sunteți pe pagina 1din 23

1

Universitatea: DUNAREA DE JOS DIN GALATI Facultatea : STIINTE ECONOMICE SI ADMINISTRAREA AFACERILOR

PROIECT BAZELE STATISTICII

Student: NICULCEA TEFAN

CUPRINS

Tema proiect 3 Capitolul I. 1.1Calculul mediei aritmetice si a medianei veniturilor6 1.2 Calculul mediei aritmetice si a medianei cheltuielilor..7 Capitolul II.Aprecierea dispersiei si asimetriei celor doua variabile 2.1 Dispersia si asimetria veniturilor..8 2.2 Dispersia si asimetria cheltuielilor10 Capitolul III. Determinarea intervalelor de incredere 3.1 Determinarea intervalelor de incredere pentru mediile aritmetice ale veniturilor.12 3.2 Determinarea intervalelor de incredere pentru mediile aritmetice ale cheltuielilor..14 Capitolul IV.Analiza legaturilor dintre cele doua variabile 4.1 Aprecierea pe baza reprezentarii grafice a sensului, intensitatii si formei legaturilor dintre cele doua variabile..16 4.2 Determinarea parametrilor unei legaturi liniare simple intre cele doua variabile19 4.3 Interpretarea rezultatelor regresiei20

TEMA PROIECT In urma unei cercetari intreprinse pentru un esantion de 50 de persoane asupra relatiei dintre veniturile disponibile si cheltuielile pentru un sortiment de produs s-au obtinut urmatoarele rezultate: Tabel nr. 1: Cheltuieli pentru sortimentul de Nr.crt. 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Venit lunar (lei) 1 811 811 831 851 861 861 901 911 911 921 961 991 991 991 1001 produs (lei) 2 106.4 106.4 106.4 107.4 107.4 107.4 108.4 108.4 108.4 108.4 109.4 110.4 110.4 110.4 110.4

16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

998 998 1011 1011 1011 1031 1041 1061 1061 1046 1046 1041 1041 1041 1081 1091 1121 1121 1121 1121 1121

178.7 178.7 111.4 111.4 111.4 111.4 111.4 156.6 156.6 156.6 156.6 112.4 112.4 112.4 112.4 113.4 157.6 157.6 112.4 112.4 113.4

37 38 39 40 41 42 43 44 45 46 47 48 49 50

1121 1121 1121 1161 1171 1201 1251 1281 1311 1391 1451 1491 1511 1501

113.4 113.4 113.4 114.4 115.4 115.4 117.4 117.4 118.4 120.4 122.4 123.4 123.4 123.4

Se cere : 1. Sa se caracterizeze cele doua variabile prin intermediul mediei aritmetice si a medianei; 2. Sa se aprecieze dispersia si asimetria valorilor celor doua variabile ; 3. Sa se determine, cu o probabilitate de 95% , intervalul de incredere al mediilor aritmetice ale celor doua variabile; 4. Sa se analizeze legatura dintre cele doua variabile determinandu-se parametrii unei functii liniare de regresie care sa reflecte dependenta cheltuielilor pentru sortimentul de produs fata de veniturile disponibile.

CAPITOLUL I 1.1Calculul mediei aritmetice si a medianei veniturilor Tabelul nr. 2 . Sumar al statisticii descriptive pentru variabila X Nr. Sumar al atatisticii descriptive Valori crt 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 pentru variabila X Mean Median Mode Std Error Std Dev. Variance Coeff. Var. Lower 95%CL Upper 95%CL 25th Percentile 75th Percentile Sum Minimum Maximum 1st Smallest 1st Largest Range Count Skewness P(Skewness) Kurtosis P(Kurtosis) Confidence Level (95,0%) 1078.080 1043.500 1121.000 24.620 174.092 30308.198 16.148 1029.824 1126.3356 991.000 1121.000 53904.000 811.000 1511.000 811.000 1511.000 700.000 50.000 0.924 0.010 0.718 0.246 48.2556

Din tabelul nr.2 media aritmetica (Mean) a veniturilor lunare este urmatoarea: Mean=1078.08 (lei) Din tabelul nr.2 mMediana (Median) esantionului de venituri lunare este urmatoarea: Median= 1043.5 (lei) 1.2 Calculul mediei aritmetice si a medianei cheltuielilor Tabelul nr. 3 . Sumar al statisticii descriptive pentru variabila Y Nr. Sumar al atatisticii descriptive Valori crt 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 pentru variabila Y Mean Median Mode Std Error Std Dev. Variance Coeff. Var. Lower 95%CL Upper 95%CL 25th Percentile 75th Percentile Sum Minimum Maximum 1st Smallest 1st Largest Range Count Skewness P(Skewness) 120.696 112.400 112.400 2.723 19.255 370.772 15.954 115.539 126.033 110.400 120.900 6034.800 106.400 178.700 106.400 178.700 72.300 50.000 1.897 0.000

21 22 23

Kurtosis P(Kurtosis) Confidence Level (95,0%)

2.420 0.015 5.337

Din tabelul nr.3 media aritmetica (Mean) a cheltuielilor lunare este urmatoarea: Mean=120.696(lei) Din tabelul nr.3 mediana (Median) esantionului de cheltuieli lunare este urmatoarea: Median= 112.40 (lei)

CAPITOLUL II Aprecierea dispersiei si asimetriei celor doua variabile 2.1 Dispersia si asimetria veniturilor Vom apela la informatiile cuprinse in tabelul nr. 2 . Abaterea medie patratica de sondaj are urmatoarea valoare: S =174.092(lei) Nivelul de incredere( Confidence Level ) Confidence Level = 1.96 x 174.092 / =48.2556

=1.96 - coeficient de incredere Varianta esantionului ,care apare in tabel sub denumirea Sample Variance reprezinta : =30308.198(lei ) ; Abaterea medie patratica a esantionului ,care apare in table sub denumirea de Deviation reprezinta: =174.092 lei . Standard

Pe baza abaterii medii patratice si a mediei aritmetice calculate in capitolul anterior se poate determina coeficientul de variatie: =(174.092/1078.08)* 100=16.148% In interpretarea omogenitatii seriei se poate alege drept criteriu de delimitare valoarea de 35% .Astfel ,daca valoarea coeficientului de variatie este mai mica sau egala decat 35% putem considera ca seria este omogena ,iar media aritmetica este semnificativ reprezentativa pentru valorile seriei.In schimb, daca se obtine o valoare de 35%se poate afirma ca seria este omogena iar media aritmetica nu este semnificativ reprezentativa pentru valorile seriei . In cazul nostru valoarea de 16.148% ne indreptateste sa afirmam ca seria este omogena iar media aritmetica de 1078.08 lei este semnificativ reprezentativa pentru valorile seriei . Programul Excel permite interpretari de mare acuratete ale asimetriei si boltirii valorilor unui esantion. Sensul asimetriei este dat de valoarea indicatorului cara apare in tabelul nr. 2 sub denumirea de Skewness.Atunci cand valoarea acestuia este mai mare decat zero se poate considera ca esantionul are o asimetrie pozitiva.In schimb ,daca valoarea sa este mai mica decat zero se poate afirma ca esantionul are o asimetrie negativa. In cazul nostru , valoarea de 0.924 are semnificatia unei asimetrii pozitive. In aprecierea intensitatii asimetriei ne putem folosi de marimea numita eroarea standard a asimetriei ,notate cu sesx, care este data de relatia; Sesx=(6/N) Unde N este numarul de unitati ale esantionului, in cazul nostrum N=50 Sesx=(6/50) =0.3464 Interpretarea intensitatii asimetriei de baza se realizeaza prin comparatia dintre marimile Skewness ; Sesx , astfel: -atunci cand valoarea in modul a indicatorului Skewness este mai mare decat dublul valorii

marimii ( ISkewness>2* Sesx ) rezulta ca esantionul este semnificativ asimetric;

10

-in caz contrar, esantionul nu este semnificativ asimetric. Observatie:Simbolul ISkewnessI are semnificatia unei valori in modul a marimii Skewness. In cazul nostru, deoarece ISkewnessI=0.924 este mai mare decat 2* Sesx=2*0.3464=0.6928 vom aprecia ca esantionul este semnificativ asimetric. Boltirea esantionului poate fi apreciata pe baza indicatorului notat Kurtosis astfel: -cand Kurtosis=0 , se considera ca boltirea distributiei esantionului este identica cu cea a unei distributii normale; -o valoare strict pozitiva indica o distributie leptokurtica, cu o reprezentare grafica mai ascutita fata de curba unei distributii normale; -o valoare strict negative reflecta o distributie mezokurtica cu o reprezentare grafica neteda fata de curba unei distributii normale; In cazul nostru , deoarece Kurtosis=0.718 vom aprecia ca distributia este leptokurtica,cu o reprezentare grafica mai ascutita fata de curba unei distributii normale. 2.2 Dispersia si asimetria cheltuielilor Vom apela la informatiile cuprinse in tabelul nr. 3 .

Abaterea medie patratica de sondaj are urmatoarea valoare: S=19.255(lei) Nivelul de incredere( Confidence Level )

Confidence Level = 1.96 x19.255 /

=5.337

=1.96 - coeficient de incredere

11

Varianta esantionului ,care apare in tabel sub denumirea Sample Variance reprezinta : =370.772 (lei ) ; Abaterea medie patratica a esantionului ,care apare in table sub denumirea de Deviation reprezinta: =19.255 lei . Pe baza abaterii medii patratice si a mediei aritmetice calculate in capitolul anterior se poate determina coeficientul de variatie: =(19.255/120.696)* 100=15.95% In interpretarea omogenitatii seriei se poate alege drept criteriu de delimitare valoarea de 35% .Astfel ,daca valoarea coeficientului de variatie este mai mica sau egala decat 35% putem considera ca seria este omogena ,iar media aritmetica este semnificativ reprezentativa pentru valorile seriei.In schimb, daca se obtine o valoare de 35%se poate afirma ca seria este omogena iar media aritmetica nu este semnificativ reprezentativa pentru valorile seriei . In cazul nostru valoarea de 15.95% ne indreptateste sa afirmam ca seria este omogena iar media aritmetica de 120.696 lei este semnificativ reprezentativa pentru valorile seriei . Programul Excel permite interpretari de mare acuratete ale asimetriei si boltirii valorilor unui esantion. Sensul asimetriei este dat de valoarea indicatorului cara apare in tabelul nr. 2 sub denumirea de Skewness.Atunci cand valoarea acestuia este mai mare decat zero se poate considera ca esantionul are o asimetrie pozitiva.In schimb ,daca valoarea sa este mai mica decat zero se poate afirma ca esantionul are o asimetrie negativa. In cazul nostru, valoarea de 1.897 are semnificatia unei asimetrii pozitive. In aprecierea intensitatii asimetriei ne putem folosi de marimea numita eroarea standard a asimetriei ,notate cu sesx, care este data de relatia; Sesx=(6/N) Standard

12

Unde N este numarul de unitati ale esantionului, in cazul nostrum N=50 Sesx=(6/50) =0.3464 Interpretarea intensitatii asimetriei de baza se realizeaza prin comparatia dintre marimile Skewness ; Sesx , astfel: -atunci cand valoarea in modul a indicatorului Skewness este mai mare decat dublul valorii

marimii ( ISkewness>2* Sesx ) rezulta ca esantionul este semnificativ asimetric; -in caz contrar, esantionul nu este semnificativ asimetric. Observatie:Simbolul ISkewnessI are semnificatia unei valori in modul a marimii Skewness. In cazul nostru, deoarece ISkewnessI=1.897 este mai mare decat 2* Sesx=2*0.3464=0.6928 vom aprecia ca esantionul este semnificativ asimetric. Boltirea esantionului poate fi apreciata pe baza indicatorului notat Kurtosis astfel: -cand Kurtosis=0 , se considera ca boltirea distributiei esantionului este identica cu cea a unei distributii normale; -o valoare strict pozitiva indica o distributie leptokurtica, cu o reprezentare grafica mai ascutita fata de curba unei distributii normale; -o valoare strict negative reflecta o distributie mezokurtica cu o reprezentare grafica neteda fata de curba unei distributii normale; In cazul nostru , deoarece Kurtosis=2.420 vom aprecia ca distributia este leptokurtica,cu o reprezentare grafica mai ascutita fata de curba unei distributii normale.

CAPITOLUL III

3.1 Determinarea intervalelor de incredere pentru mediile aritmetice ale veniturilor

13

In cazul unui esantion de 50 unitati statistice , stabilirea intervalului de incredere pentru media aritmetica a populatiei are la baza formula:

unde: este media aritmetica a esantionului; este media aritmetica a populatiei cercetate; coeficient de incredere ( pentru o probabilitate de 95% ii corespunde un coeficient de incredere =1.96) n=50 este volumul esantionului; S este o marime numita abatere medie patratica de sondaj, data de relatia:

Nivelul de incredere( Confidence Level )

Confidence Level =

=48.2556

=1.96 - coeficient de incredere Programul Excel calculeaza automat expresia denumirea Confidence Level. Vom utiliza informatiile cuprinse in tabelul nr. 2 Nr. Sumar al atatisticii descriptive Valori crt 1 pentru variabila X Mean 1078.080 a carei valoare o afiseaza sub

14

2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Median Mode Std Error Std Dev. Variance Coeff. Var. Lower 95%CL Upper 95%CL 25th Percentile 75th Percentile Sum Minimum Maximum 1st Smallest 1st Largest Range Count Skewness P(Skewness) Kurtosis P(Kurtosis) Confidence Level (95,0%)

1043.500 1121.000 24.620 174.092 30308.198 16.148 1029.824 1126.3356 991.000 1121.000 53904.000 811.000 1511.000 811.000 1511.000 700.000 50.000 0.924 0.010 0.718 0.246 48.2556

Media aritmetica a veniturilor (apare in tabelul nr. 2 sub denumirea Mean) reprezinta 1078.08 lei. Pentru o probabilitate de 95% a rezultat o valoare Confidence Level=48.2556 Rezulta urmatorul interval de incredere, stabilit pentru o probabilitate de 95%: [1078.08-48.2556; 1078.08+48.2556] = [1029.824;1126.3356] In concluzie ,se poate afirma , cu o probabilitate de 95%, ca media aritmetica a veniturilor tuturor consumatorilor sortimentului de produs se afla in intervalul

15

[1029.824;1126.3356].

3.2 Determinarea intervalelor de incredere pentru mediile aritmetice ale cheltuielilor In cazul unui esantion de 50 unitati statistice , stabilirea intervalului de incredere pentru media aritmetica a populatiei are la baza formula:

unde: este media aritmetica a esantionului; este media aritmetica a populatiei cercetate; coeficient de incredere ( pentru o probabilitate de 95% ii corespunde un coeficient de incredere =1.96) n=50 este volumul esantionului; S este o marime numita abatere medie patratica de sondaj, data de relatia:

Nivelul de incredere( Confidence Level ) Confidence Level = =1.96 - coeficient de incredere Programul Excel calculeaza automat expresia denumirea Confidence Level. Vom utiliza informatiile cuprinse in tabelul nr. 3 Nr. Sumar al atatisticii descriptive Valori crt 1 2 3 4 pentru variabila Y Mean Median Mode Std Error 120.696 112.400 112.400 2.723 a carei valoare o afiseaza sub =5.337

16

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Std Dev. Variance Coeff. Var. Lower 95%CL Upper 95%CL 25th Percentile 75th Percentile Sum Minimum Maximum 1st Smallest 1st Largest Range Count Skewness P(Skewness) Kurtosis P(Kurtosis) Confidence Level (95,0%)

19.255 370.772 15.954 115.539 126.033 110.400 120.900 6034.800 106.400 178.700 106.400 178.700 72.300 50.000 1.897 0.000 2.420 0.015 5.337

Media aritmetica a veniturilor (apare in tabelul nr. 3 sub denumirea Mean) reprezinta 120.696 lei. Pentru o probabilitate de 95% a rezultat o valoare Confidence Level=5.337 Rezulta urmatorul interval de incredere, stabilit pentru o probabilitate de 95%: [120.696-5.337; 120.696+5.337] = [115.539;126.033] In concluzie ,se poate afirma , cu o probabilitate de 95%, ca media aritmetica a veniturilor tuturor consumatorilor sortimentului de produs se afla in intervalul [115.539;126.033].

17

CAPITOLUL IV Analiza legaturilor dintre cele doua variabile 4.1 Aprecierea pe baza reprezentarii grafice a sensului, intensitatii si formei legaturilor dintre cele doua variabile Tabelul nr.4 Nr. Crt. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Venituri 811 811 831 851 861 861 901 911 911 921 961 991 991 991 1001 998 Cheltuieli 106.4 106.4 106.4 107.4 107.4 107.4 108.4 108.4 108.4 108.4 109.4 110.4 110.4 110.4 110.4 178.7

18

17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37

998 1011 1011 1011 1031 1041 1061 1061 1046 1046 1041 1041 1041 1081 1091 1121 1121 1121 1121 1121 1121

178.7 111.4 111.4 111.4 111.4 111.4 156.6 156.6 156.6 156.6 112.4 112.4 112.4 112.4 113.4 157.6 157.6 112.4 112.4 113.4 113.4

19

38 39 40 41 42 43 44 45 46 47 48 49 50

1121 1121 1161 1171 1201 1251 1281 1311 1391 1451 1491 1511 1501

113.4 113.4 114.4 115.4 115.4 117.4 117.4 118.4 120.4 122.4 123.4 123.4 123.4

Pentru aprecierea sensului, intensitatii si formei legaturii dintre cele doua variabile ( Venituri, Cheltuieli) se poate recurge la reprezentarea acestora intr-un sistem de axe carteziene. Folosind programul Excel (Chart Wizard) obtinem reprezentarea grafica a celor doua variabile. Din reprezentarea grafica a celor doua variabile se poate deduce ca este vorba de o legatura directa (cresterea lui X determina cresterea lui Y), iar gruparea punctelor ne sugereaza o intensitate semnificativa . In plus , reprezentarea grafica are conturul unei drepte , ceea ce ne face sa credem ca putem apela la o functie de regresie liniara.

4.2 Determinarea parametrilor unei legaturi liniare simple intre cele doua variabile

20

O legatura liniara simpla are forma: Yxi=a+b*xi In care: -Yxi reprezinta valoarea teoretica a caracteristicii dependente Y pentru unitatea statistica i; -xi reprezinta valoarea empirica a caracteristicii independente x pentru unitatea statistica I; -a si b sunt parametrii regresiei dintre x si y Tabelul 5-Parametrii regresiei

Descriptive Statistics Variable Column Y Column X Mean 120.696 1078.080 Std Dev. 19.255 174.092 N 50 50

Summary S.E. R2 0.024 R 0.154 Adj. R2 0.003 Estimate 19.222 of

ANOVA Source Regression Residual Total Sum Sq. 433.034 17734.805 18167.839 D.F. 1 48 49 Mean Sq. 433.034 369.475 F 1.172 Prob. 0.284

Regression Coefficients

21

-95% Source Intercept Column X Coefficient Std Error 102.287 0.017 17.220 0.016 0.154 Std Beta C.I. 67.663 -0.015

+95% C.I. t Prob. 0.000 0.284

136.911 5.940 0.049 1.083

Din tabel extragem valoarea din dreptul denumirii Intercept care corespunde coeficientului a=102.287 si pe cea din dreptul denumirii column X= 0.017 care corespunde valorii b. Rezulta: a=85.145 lei b=0.017 lei Yxi=102.287+0.017*xi ceea ce ne conduce la urmatoarea ecuatie de regresie:

4.3 Interpretarea rezultatelor regresiei Pentru interpretarea rezultatelor regresiei vom folosi informatiile prezentate in tabelul 5 pe care, pentru facilitarea analizei, il vom diviza in mai multe componente.

Tab. 5. Parametrii regresiei

Descriptive Statistics Variable Column Y Column X Mean 120.696 1078.080 Std Dev. 19.255 174.092 N 50 50

Summary

22

S.E. R2 0.024 R 0.154 Adj. R2 0.003 Estimate 19.222

of

ANOVA Source Regression Residual Total Sum Sq. 433.034 17734.805 18167.839 D.F. 1 48 49 Mean Sq. 433.034 369.475 F 1.172 Prob. 0.284

Regression Coefficients -95% Source Intercept Column X Coefficient Std Error 102.287 0.017 17.220 0.016 0.154 Std Beta C.I. 67.663 -0.015 +95% C.I. t Prob. 0.000 0.284

136.911 5.940 0.049 1.083

4.3.1.

Interpretarea sensului si intensitatii legaturii dintre cele

doua variabile

Pentru aprecierea sensului si intensitatii legaturii dintre cele doua variabile putem folosi valorile coeficientului de determinare R2 si a coeficientului de corelatie rxy. Coeficientul de determinare R2 , care apare in tabelul 5 sub denumirea R Square reprezinta 0.024, ceea ce inseamna ca 2.4 % din variatia cheltuielilor pentru sortimentul de produs a fost cauzata de variatia veniturilor disponibile. Coeficientul de corelatie rxy, care apare in tabelul 5. sub denumirea Multiple R reprezinta 0,154, Valoarea sa pozitiva si apropiata de 1 semnifica o legatura directa .

4.3.2.

Stabilirea intervalelor de incredere pentru parametrii

23

regresiei Pentru intervalele de incredere ale parametrilor regresiei ne-am propus o probabilitate de 95% cu care sa garantam rezultatele obtinute. In raport cu acest nivel au fost calculate, prin programul Excel, limitele inervalelor de incredere ale coeficientilor a si b.

Limitele inferioara si superioara ale intervalului de incredere pentru coeficientul a pot fi extrase din tabelul 5 din intersectia randului care corespunde denumirii Intercept cu coloanele care corespund denumirilor Lower 95% , respectiv, Upper 95% . Rezulta ca se poate afirma, cu o probabilitate de 95%, ca valoarea coeficientului a apartine intervalului [67.663;136.911]. Limitele inferioara si superioara ale intervalului de incredere pentru coeficientul b pot fi extrase din tabelul 5 din intersectia randului care corespunde denumirii X cu coloanele care corespund denumirilor Lower 95% , respectiv, Upper 95% .

Rezulta ca se poate afirma, cu o probabilitate de 95%, ca valoarea coeficientului b apartine intervalului [-0.015;0.049 ].

S-ar putea să vă placă și