Sunteți pe pagina 1din 19

Academia de Studii Economice

Bucureşti

LUCRARE INDIVIDUALĂ NR.1


LA DISCIPLINA STATISTICĂ

Student:

Anul II REI, Grupa 936

Profesor îndrumător:
Mihail Korka
- 2009 -

2
1. Să se prezinte sub formă tabelară datele primare, cu indicarea sursei.

Tabel nr. 1: Debitul Investiţiilor Directe Externe, 2006 (miliarde Euro)


Nr. Intrări Ieşiri xi − x yi − y
Tara ( x ) ( y ) ( xi ) ⋅ ( y i )
Crt. i i

1 Belgia 57 50 2850 26 21
2 Cehia 5 1 5 -26 -28
3 Danemarca 6 7 42 -25 -22
4 Germania 34 63 2142 3 34
5 Irlanda 10 18 180 -21 -11
6 Spania 16 71 1136 -15 42
7 Franţa 58 87 5046 27 58
8 Italia 30 33 990 -1 4
9 Luxemburg (2) 77 65 5005 46 36
10 Ungaria 8 6 48 -23 -23
11 Olanda (3) 3 18 54 -28 -11
12 Polonia 11 3 33 -20 -26
13 Portugalia 6 3 18 -25 -26
14 Suedia 22 19 418 -9 -10
15 Marea Britanie 111 64 7104 8 35
16 Elveţia -1 -44 44 -32 -73
Total 453 464 25115 -43 0

(1) Elveţia 2005 ;


(2) Entităţi cu obiectiv special excluse stocul Debitului Investiţiilor Externe ;
(3) Excluzând entităţile cu obiectiv special.

Sursa: Eurostat (tec00053, tec00049, tec00046 şi tec00047), Biroul de Analiză


Economică
2. Pentru fiecare variabilă cercetată, să se observe amplitudinea variaţiei pentru a
putea stabili 5-8 intervale de grupare. Să se grupeze elementele colectivităţii (ţările
observate) pe aceste intervale (Observaţie: Mărimea intervalelor poate fi rotunjită
încât să permită stabilirea unor centre de interval uşor de întrebuinţat în calculul
indicatorilor).

(A) Intrări

Amplitudinea variaţiei
Ax = x max − x min = 111 − ( − 1) = 112 milioane Euro
• 5 intervale de grupare
A 112
k= x = = 22,4 miliarde Euro, dar datorită faptului că valoarea lui k nu este un
5 5
număr întreg, pasul următor de numărare ar putea fi şi 23.

Tabel nr. 2: Gruparea celor 16 de ţări după valoarea intrărilor


Intervale de Număr Centru de interval Frecvenţele cumulate
grupare ţări (ni) (xi) crescător (Fc)
(-1) - 22* 9 ( −1) + 22 = 10 ,2 9
2
22 - 45 3 22 + 45 12
= 33 ,5
2
45 - 68 2 45 + 68 14
= 56 ,5
2
68 - 91 1 68 + 91 15
= 79 ,5
2
91 - 114 1 91 +114 16
= 102 ,5
2
*Partea superioară nu este inclusă în interval.

4
(B) Ieşiri

Amplitudinea variaţiei
Ay = y max − y min = 87 − ( − 44 ) = 131 milioane Euro
• 5 intervale de grupare
Ay 131
k= = = 26,2 miliarde Euro, dar datorită faptului că valoarea lui k nu este un
5 5
număr întreg, pasul următor de numărare ar putea fi şi 27.

Tabel nr. 3: Gruparea celor 16 tari după valoarea ieşirilor


Intervale de Număr ţări Centru de interval (xi) Frecvenţele cumulate
grupare (ni) crescător (Fc)
(-44) - (-17)* 1 (-44) + (-17) 1
= −30 ,5
2
(-17) - 10 5 (-17) +10 6
= −3,5
2
10 – 37 4 10 + 37 10
= 23 ,5
2
37 - 64 2 37 + 64 12
= 50 ,5
2
64 - 91 4 64 + 91 16
= 77 ,5
2
*Partea superioară nu este inclusă în interval.

5
3. Să se facă o reprezentare grafică a rezultatului acestei grupări pe intervale egale
(de exemplu, diagrama de coloane sau histograma)

(A) Intrări

Graficul nr. 1

Reprezentarea grafica a gruparii datelor pe intervale

15

10 9

Numar tari
5 3
2
1 1
0
Intervalele de grupare

(-1); 22 22; 45 45; 68 68; 91 91; 114


(B) Ieşiri

Graficul nr. 2

Reprezentarea grafica a gruparii datelor pe intervale

15

10

Numar tari 5
5 4 4
2
1
0

Intervale de grupare

(-44); (-17) (-17); 10 10; 37 37; 64 64; 91

6
4. Pentru fiecare variabilă cercetată, să se facă o grupare tipologică pe tipuri de ţări,
în funcţie de apartenenţa lor la o anumită categorie de ţări (de exemplu, cele 15 state
membre UE înainte de decizia de lărgire a Uniunii, cele 12 state care au devenit
membre UE începând cu 2005, celelalte ţări europene).

Tabel nr. 4: Ţări grupate după anul în care s-au integrat în UE:
Ţări Ţări integrate Ţări Ţări Ţări Ţări care nu
integrate în în anul 1973 integrate în integrate în integrate în sunt
anul 1951 (n2) anul 1986 anul anul 2004 integrate în
(anul în care (n3) 1995 (n4) (n5) UE (n6)
s-a fondat
UE) (n1)
Belgia Danemarca Spania Suedia Cehia Elveţia
Germania Irlanda Portugalia Ungaria
Franţa Marea Britanie Polonia
Italia
Luxemburg
Olanda

n1 6
q1 = ⋅ 100 = ⋅ 100 = 37,5%;
∑ ni
i
16

n2 3
q2 = ⋅ 100 = ⋅ 100 = 18,75%;
∑ ni
i
16

n3 2
q3 = ⋅ 100 = ⋅ 100 = 12,5%;
∑ ni
i
16

n4 1
q4 = ⋅ 100 = ⋅ 100 = 6,25%;
∑ ni
i
16

n5 3
q5 = ⋅ 100 = ⋅ 100 = 18,75%;
∑ ni
i
16

n6 1
q6 = ⋅ 100 = ⋅ 100 = 6,25%;
∑ ni
i
16

7
5. Să se facă o reprezentare grafică a rezultatului acestei noi grupări a datelor
observate (de exemplu o diagrama de structură circulară sau pătrată).

Grafic nr. 3

Reprezentarea grafica a gruparii tarilor in functie de


anul integrarii in UE

6.25

18.75
37.5

6.25

12.5
18.75

q1 q2 q3 q4 q5 q6

8
6. Pentru fiecare variabilă, pe baza repartiţiei de frecvenţă obţinute la punctul 2 al
lucrării, sa se stabilească indicatorii tendinţei centrale (media aritmetică, mediana şi
modul), indicatorii sintetici ai variaţiei şi indicatorii asimetriei.

a) Media aritmetică ponderată:

16

∑x i ⋅ ni
(10,5 ⋅ 9) + ( 33,5 ⋅ 3) + ( 56,5 ⋅ 2) + ( 79,5 ⋅ 1) + (102,5 ⋅ 1) =
x= i =1
16
=
16
∑n i =1
i

94,5 + 100,5 + 113 + 79,5 + 102,5 490


= = = 30,62 ≈ 31miliardeEuro
16 16
16

∑y i ⋅ ni
[ ( − 30,5) ⋅ 1] + [ ( − 3,5) ⋅ 5] + ( 23,5 ⋅ 4) + ( 50,5 ⋅ 2) + ( 77,5 ⋅ 4) =
y= i =1
16
=
16
∑n i =1
i

=
( − 30,5) + ( − 17,5) + 94 + 101 + 310 = 457 = 28,56 ≈ 29miliardeEuro
16 16

b) Mediana:

16

∑n i +1
16 + 1
locMe = i =1
= = 8,5
2 2
Me = 8,5 ∈ [ ( − 1) ;22 )
Me =1
locMe − ∑n i
8,5 − 0
Me = x Me
0 +k Me
⋅ i =1
= ( − 1) + 23 ⋅ = 20,72 ≈ 21miliardeEu ro
n Me 9
Me = 8,5 ∈ [ ( − 17 ) ;10]
Me =1
locMe − ∑n i
8,5 − 1
Me = y Me
0 +k Me
⋅ i =1
= ( − 17 ) + 27 ⋅ = 23,5 ≈ 24miliardeEu ro
n Me 5

c) Modul:

∆1 9−0
Mo = x0Me + k Me ⋅ = ( − 1) + 23 ⋅ = 12,8
∆1 + ∆ 2 ( 9 − 0 ) + ( 9 − 3)
∆1 5 −1
Mo = y 0Me + k Me ⋅ = ( − 17 ) + 27 ⋅ = 4,6
∆1 + ∆ 2 ( 5 − 1) + ( 5 − 4)
d) Abaterea medie liniară

9
d =
∑| x − x | ⋅n
i i
=
∑n i

| ( −10 ,5) − 31 | ⋅9+ | 33,5 − 31 | ⋅3+ | 56 ,5 − 31 | ⋅2+ | 79 ,5 − 31 | ⋅1+ | 102 ,5 − 31 | ⋅1


= =
16
373 ,5 + 7,5 + 51 + 48,5 + 71,5 552
= = = 34 ,5 ≈ 35 miliardeEu ro
16 16

d =
∑| yi − y | ⋅ni =
∑ni
| ( − 30 ,5) − 29 | ⋅1+ | ( − 3,5) − 29 | ⋅5 + 23,5 − 29 ⋅ 4+ | 50 ,5 − 29 | ⋅2+ | 77 ,5 − 29 | ⋅4
=
16
59 ,5 + 162 ,5 + 22 + 43 + 194 481
= = = 30 ,06 ≈ 30 miliardeEu ro
16 16
e) e) Dispersia:

∑ ( x − x)
2
⋅ ni
σ
i
2
= =
∑n i

=
{[ ( − 10,5) − 31] ⋅ 9} + [( 33,5 − 31) ⋅ 3] + [( 56,5 − 31) ⋅ 2] + [( 79,5 − 31) ⋅1] + [(102,5 − 31) ⋅1] =
2 2 2 2 2

16
15500 ,25 + 18,75 + 1300 ,5 + 2352 ,25 + 5112 ,25
= =
16
24284
= 1517 ,75 ≈ 1518 miliardeEu ro
16
∑( y − y)
2
⋅ ni
σ
i
2
= =
∑n i

=
{[ ( − 30,5) − 29] ⋅1} + {[ ( − 3,5) − 29] ⋅ 5} + [( 23,5 − 29 ) ⋅ 4] + [( 50,5 − 29) ⋅ 2] + [( 77,5 − 29 ) ⋅ 4] =
2 2 2 2 2

16
3540 ,25 + 5281,25 + 121 + 924 ,5 + 9409 19276
= = = 1204 ,75 ≈ 1205 miliardeEu ro
16 16
f) Abaterea standard:

σ = σ 2 = 1518 = 38 ,96 ≈ 39 miliardeEu ro


σ = σ 2 = 1205 = 34 ,71 ≈ 35 miliardeEu ro

g) Coeficientul de variaţie:

σ 39
v= ⋅100 = ⋅100 ≈ 126 %
x 31
σ 35
v = ⋅100 = ⋅100 ≈ 121 %
y 29

10
h) Indicatorii asimetriei:

as = x − Mo = 31 −12 ,8 =18 ,2
as 18 ,2
Cas = = = 0,46
σ 39
as = y − Mo = 29 − 4,6 = 24 ,4
as 24 ,4
Cas = = = 0,69
σ 35

11
7. Comparând indicatorii celor două repartiţii de frecvenţă, să se observe şi să se
comenteze asemănările şi/sau deosebirile dintre cele două variabile studiate pe
aceleaşi ţări.

Jumătate din cele 16 ţări studiate au avut o valoare a intrărilor mai mică de 21
miliarde de Euro, iar cealaltă jumătate a avut o valoare a intrărilor mai mare decât 21
miliarde de Euro. În ceea ce priveşte valoarea ieşirilor în cele 16 ţări putem spune, în
urma calculelor, că jumătate din ele au avut în anul 2006 o valoare a intrărilor mai mare
de 24 miliarde de Euro, iar cealaltă jumătate o valoare a intrărilor mai mică de 24
miliarde de Euro.
Cele mai multe dintre ţări au avut în anul 2006 o valoare a intrărilor de
aproximativ 12,44 miliarde de Euro şi o valoare a ieşirilor de aproximativ 3,16 miliarde
de Euro.
Având în vedere relaţia Mo < Me < x si Mo < Me < y putem deduce că seriile în
cauză prezintă o asimetrie de stânga sau pozitivă.
Cele 16 ţări luate în discuţie au în medie o valoare a intrărilor cu 35 miliarde Euro
mai mare sau mai mică decât media calculată (31 miliarde Euro) şi o valoare a ieşirilor cu
30 miliarde Euro mai mare sau mai mică decât media calculată (29 miliarde Euro).
Dar, luând în considerare valoarea coeficientului de variaţie, care depăşeşte în
ambele cazuri (intrări şi ieşiri) cu mult pragul de 35% , putem lansa ipoteza potrivit căreia
colectivitatea este eterogenă, astfel că media tinde să fi nereprezentativă.
Valoarea coeficientului de asimetrie ne indică faptul că în cazul celor două serii
putem vorbi despre o asimetrie puternică, valorile depăşind limita superioară a
intervalului (-0,3; 0,3). În consecinţă indicatorii tendinţei centrale tind să fie
nesemnificativi.

12
11. Folosind datele iniţiale (negrupate), să se reprezinte grafic legătura dintre X şi
Y. Cum comentaţi aşezarea norului de puncte faţă de axele de referinţă ale
graficului?

Grafic nr. 4

13
Se constată că cele 16 de puncte având drept coordonate variabilele x i şi yi din tabel,
alcătuiesc o mulţime de puncte din care o parte sunt restranse spre originea sistemului de
axe, ceea ce inseamna ca intre acele puncte exista o legatura puternica, iar o alta parte
sunt imprastiate pe o arie mare ceea ce ne sugereaza ca că legătura dintre acele puncte nu
este foarte puternică.

14
12. Să se estimeze şi comenteze parametrii funcţiei liniare de regresie. Care este
semnificaţia funcţiei de regresie astfel identificată? Cum comentaţi diferenţele
dintre valorile reale ale caracteristicii Y şi valorile estimate cu ajutorul funcţiei de
regresie?

Tabel nr. 5
Nr. xi yi xi ⋅ y i x i2 y i2 Yi =1 + xi ( yi − Yi ) 2
Crt.
1 57 50 2850 3249 2500 58 64
2 5 1 5 25 1 6 25
3 6 7 42 36 49 7 0
4 34 63 2142 1156 3969 35 784
5 10 18 180 100 324 11 49
6 16 71 1136 256 5041 17 2916
7 58 87 5046 3364 7569 59 784
8 30 33 990 900 1089 31 4
9 77 65 5005 5929 4225 78 169
10 8 6 48 64 36 9 9
11 3 18 54 9 324 4 196
12 11 3 33 121 9 12 81
13 6 3 18 36 9 7 16
14 22 19 418 484 361 23 16
15 111 64 7104 12321 4096 112 2304
16 -1 -44 44 1 1936 0 1936
Tot. 453 464 25115 28051 31538 469 9353

15
 n n

 na + b∑ xi = ∑ y i  16a + 453b = 464


 i =1 i =1
 n ⇒  ⇒
 453a + 28048b = 25115
n n
a x + b ( x ) 2 = x ⋅ y
 ∑ i =1
i ∑i=1 i ∑i=1 i i
 464− 453b
 464− 453b  a=
 a= 16
 16 ⇒ ⇒
464− 453b
 453a + 28051b = 25115  453⋅ + 28051b = 25115
 16
 464− 453b
 a=
 16 ⇒
 210192− 205209b + 448816b = 401840
 464− 453b  464− 453b
 a= a =
 16 ⇒ 16 ⇒
 243607b = 191648  b = 0,78 ≈ 1
 464− 453⋅ 1  11  a ≈ 1
a = a =
 16 ⇒  16 ⇒  → f ( xi ) = 1 + xi
 b≈1   b ≈ 1
 b≈1

• Parametrul a nu are semnificaţie economică;


• Parametrul b este numit coeficientul de regresie şi arată prin semnul său că între
intrări şi ieşiri există o influenţă directă. La fiecare creştere cu o unitate a cauzei,
variabila efect tinde să se modifice în acelaşi sens cu o unitate.
∑(y − Yi )
2
i 9353
S yi = = = 584,5625 = 24,1777 ≈ 24
Yxi n 16
S yi
Yx i 24
e= ⋅ 100 = ⋅ 100 = 85,56 ≈ 86
y 28,05
Rezultatul arată că în fiecare ţară cercetată, între valorile reale şi cele estimate pe
baza funcţiei liniare de regresie există o diferenţă de 24 de miliarde de Euro, iar procentul
de 86% ne indică faptul că avem o eroare foarte mare, altfel spus, funcţia de regresie nu
descrie corect evoluţia ieşirilor din cele 16 ţări.

16
13. Să se estimeze şi comenteze coeficientul de corelaţie liniară dintre cele două
variabile.

∑ (x )( )
16
− x ⋅ yi − y
i
10154 ⋅ 21840
r= i =1
= = 0,54
n ⋅σ x ⋅σ y 16 ⋅ 39 ⋅ 35
Coeficientul Pearson de corelaţie liniară ne indică faptul că între cele doua variabile
există o asociatie, legatura de intensitate medie.

Nr. Crt. xi yi A=xi-31 B=yi-29 A*B


1 57 50 26 21 546
2 5 1 -26 -28 728
3 6 7 -25 -22 550
4 34 63 3 34 102
5 10 18 -21 -11 231
6 16 71 -15 42 -630
7 58 87 27 58 1566
8 30 33 -1 4 -4
9 77 65 46 36 1656
10 8 6 -23 -23 529
11 3 18 -28 -11 308
12 11 3 -20 -26 520
131 6 3 -25 -26 650
14 22 19 -9 -10 90
15 111 64 80 35 2800
16 -1 -44 -32 -73 2336
Total 453 464 - - 11978

17
14. Să se caracterizeze intensitatea legăturii dintre cele două variabile prin metode
neparametrice (coeficientul de corelaţie a rangurilor).

Tabel nr. 6
Nr. Intrări Ieşiri Rang Rang di d i2
Crt. xi yi după după
xi yi
1 57 50 4 6 -2 4
2 5 1 14 15 -1 1
3 6 7 12 11 1 1
4 34 63 5 5 0 0
5 10 18 10 9 1 1
6 16 71 8 2 6 36
7 58 87 3 1 2 4
8 30 33 6 7 -1 1
9 77 65 2 3 -1 1
10 8 6 11 12 -1 1
11 3 18 15 10 5 25
12 11 3 9 13 -4 16
13 6 3 13 14 -1 1
14 22 19 7 8 -1 1
15 111 64 1 4 -3 9
16 -1 -44 16 16 0 0
Tot - - 0
453 464
. 102

6∑ d i2 6 ⋅ 1020 6120
rs = 1 − =1− =1− = 1 − 1,5 = −0,5
(
n n −1
2
) 16 ⋅ 255 4080

Acest Coeficient al rangurilor ne indica, prin valoarea sa, ca intre variabilele


studiate exista o legatura de intensitate medie, iar semnul minus ne indica faptul ca avem
o legatura inversa.

18
15. Cum explicaţi diferenţele dintre coeficientul de corelaţie parametrică (punctul
13) şi coeficientul/coeficienţii de corelaţie a rangurilor?

Luand in considerare valorile obtinute prin calculul Coeficientului Pearson si al


Coeficientului Spearman, care sunt foarte apropiate, putem confirma existenta unei
legaturi inverse de intensitate medie intre variabilele numerice cercetate.

19