Documente Academic
Documente Profesional
Documente Cultură
FACULTATEA DE MANAGEMENT-MARKETING
MASTER ................
PROIECT
METODE CANTITATIVE
CONF.UNIV.DR.ELENA BUGUDUI
Masterand
Nicolae Marian George
AN II
2017-2018
CERINTE PROIECT:
Se vor prelua datele a doua variabile (eventual una a ofertei si una a cererii din
servicii) intre care exista o legatura, fiecare evidentiata printr-o serie de date de 10 – 15
ani(de preferat pe 15) cat mai recente, precizand sursa de date.
1.Sa se motiveze alegerea temei si sa se prezinte aspecte privind variabilele alese in studiu,
precizand care este variabila rezultativa si care este cea factoriala;
2.Sa se analizeze fiecare variabila folosind Descriptiv Statistics cu interpretarile teoretice si
economice de rigoare;
3.Daca se presupune ca seria de date a fiecarei variabila reprezinta un esantion de volum 10%
din colectivitatea generala, extras prin selectie aleatoare simpla nerepetata, se cere:
3.2.sa se stabileasca volumul unui nou esantion daca eroarea medie limita admisa se
reduce la jumatate pentru o probabilitate de 99% pentru care valoarea critica este 2,624;
4.Sa se masoare intensitatea legaturii dintre cele doua variabile utilizand atat metoda
parametrica a coeficientului de corelatie (cu graficul Scatter si functia correlation din Excel),
cat si metodele neparametrice (Spearman, Kendall);
7.2.Sa se ajusteze datele folosind metodele mecanice (spor mediu si indice mediu);
8.Concluzii.
9.Bibliografie.
1. Alegerea temei
TABEL.1
An Nr de spitale Nr de medici
(442+446+447+427+425+433+436+447+458+474+50+464+473+499+527+554)/16=7455/1
6=465,9375.
(45786+46773+45805+46919+48150+47388+46936+48199+50267+50386+52204+52541+5
3681+54086+54929+56110)/16=800160/16=50010.
Median- mediana – valoarea care depaseste jumatate dintre observatii, este o valoare
„negociata”pentru date ordinale (valoarea care imparte cel mai bine observatiile). Ea
presupune ordine intre valori si nu se aplica datelor nominale. Este un indicator de tendinta
centrala preferat in locul mediei pentru distributii continue asimetrice.
Mediana unei serii ordonate este valoarea care imparte sirul ordonat al valorilor
variabilelor in doua parti, fiecare parte continand acelasi numar de valori. Mediana face parte
din categoria cuartilelor.
Medianul este termenul al (n+1)/2-lea daca n este impar si media dintre termenii n/2 si
n/2+1 daca n este par.
-50% din numarul de spitale din cei 16 ani este mai mic decat mediana 453 si
-50% din numarul de spitale din cei 16 ani este mai mic decat mediana 453
In cazul variabilei numarul de medici putem spune ca:
-50% din numarul de medici din cei 16 ani este mai mic decat mediana 49233 si
-50% din numarul de medici din cei 16 ani este mai mic decat mediana 49233.
Mode – modul – este cea mai frecventa valoare din seria de date; este utilizata in
special pentru date discrete.
Media si mediana pot fi utilizate numai cu date numerice. Modul poate fi utilizat atat
cu date numerice, cat si cu date nominale sau cu date sub forma de nume sau
etichete. Culoarea ochilor, sexul si culoarea parului sunt exemple de date nominale.
Media este extrem de sensibila la valori extreme sau valori extreme care sunt mult
mai mari sau mai mici decat restul valorilor dintr-un set de date. Mediana este preferata in
cazurile in care exista valori exagerate, deoarece mediana ia in considerare doar valorile
medii, nefiind afectata de valorile extreme.
Mediana si modul sunt indicatori de pozitie.
In activitatile economico-sociale prezinta interes acele aspecte care apar cel mai
frecvent in derularea lor. In aceste cazuri se foloseste parametrul statistic de pozitie numit
modul sau dominanta.
Modul sau valoarea ce are cea mai mare frecventa in seria de date se determina astfel:
se ordoneaza valorile seriei de date si se determina care este valoarea cea mai frecventa.
O serie statistica poate avea mai multe moduri. Modul prezinta interes daca este unic.
Pentru seria de date numarul de medici modul nu exista, deci seria este amodala.
Pentru seria de date X modul este 447, deci seria este unimodala, avem 2 ani in care avem
acelasi numar de spitale, 447.
Pentru a masura gradul de imprastiere a datelor unei serii statistice fata de medie se
folosesc urmatorii parametri de pozitie: dispersia si abaterea medie patratica.
Deviatia standard a unui set de date permite estimarea uniformitatii valorilor acestuia,
mai precis, cu cat valoarea acesteia este mai mica cu atat valorile setului sunt grupate in jurul
valorii medii. Invers, cu cat deviatia standard este mai mare, cu atat valorile setului sunt mai
departate fata de valoarea medie.
Dispersia se refera la raspandirea valorilor din jurul tendintei centrale. Exista doua
masuri comune de dispersie, intervalul si abaterea standard. Intervalul este pur si simplu cea
mai mare valoare minus cea mai mica valoare; iar abaterea standard am descris-o mai sus.
s2 este dispersia.
Pentru b2 > 0, repartitia se numeste leptocurtica, iar pentru b2 < 0, se numeste platicurtica.
Dacă b2 = 0, repartitia este mezocurtica.
PCT.3
n=16
n=10%N
N=160
p=95%(probabilitate)
t=2,145
MEDIA pentru
X= 465.9375 numarul de spitale
MEDIA pentru
X= 50010 numarul de medici
dispersia=s 2= 21277,2381
eroare de selectie=sx= 138,38177
eroarea maxima 296,828897
admisibila=∆X=
Intervalul de incredere
347,0759 ≤ μ ≤ 940,7337
Nivelul totalizator
72885,9397 ≤ μ ≤ 197554,0763
Intervalul de incredere ne arata ca daca pentru 21 de luni s-a facturat in medie suma de
643,9048 mii lei pentru 210 luni, in medie se factureaza intre 347,0759 mii lei si 940,7337
mii lei.
Nivelul totalizator ne spune ca in 210 se va factura lunar intre 72885,9397 mii lei si
197554,0763 mii lei cu o probabilitate de 95%si cu o eroare de 296,828897 mii lei/luna.
dispersia=s 2= 33479,619
eroare de selectie=sx= 173,584726
eroarea maxima
admisibila=∆X= 372,339238
Intervalul de incredere
235,5656 ≤ μ ≤ 980,2440
Nivelul totalizator
49468,7681 ≤ μ ≤ 205851,2479
Intervalul de incredere ne arata ca daca pentru 21 de luni s-a incasat in medie suma de
607,9048 mii lei pentru 210 luni, in medie se incaseaza intre 235,5656 mii lei si 980,2440 mii
lei.
Nivelul totalizator ne spune ca in 210 se va incasa lunar intre 49468.7681 mii lei si
205851,2479 mii lei cu o probabilitate de 95%si cu o eroare de 372,339238 mii lei/luna.
Pct.3.2.
n=21
n=10%N
N=210
p=99%(probabilitate)
t=2,624
X Y
442 45786
446 46773
447 45805
427 46919
425 48150
433 47388
436 46936
447 48199
458 50267
474 50386
503 52204
464 52541
473 53681
499 54086
527 54929
554 56110
7455 800160
GRAFICUL SCATTER
NR
X- Y- RX RY d=rx-ry d2 P Q S=P-Q
LUNI
1 442 45786 5 1 4 16
2 446 46773 6 3 3 9
3 447 45805 7 2 5 25
4 427 46919 2 4 -2 4
5 425 48150 1 7 -6 36
6 433 47388 3 6 -3 9
7 436 46936 4 5 -1 1
8 447 48199 8 8 0 0
9 458 50267 9 9 0 0
10 474 50386 12 10 2 4
11 503 52204 14 11 3 9
12 464 52541 10 12 -2 4
13 473 53681 11 13 -2 4
14 499 54086 13 14 -1 1
15 527 54929 15 15 0 0
16 554 56110 16 16 0 0
r 0,75 ; 0,95
SPEARMAN = 0.820588235, exista o relatie directa, puternica
KENDALL =
5. Coeficientul de asociere
Yulle
Se ia valoarea medie si se arata ce sume sunt peste val.medie si cate sunt sub valoarea medie
Val. Medie Val. Medie
Numar spitale Numar medici
X Y = 466 = 50010
SUME
PESTE
442 45786 VAL.MEDIE 6 8
SUME SUB
446 46773 VAL.MEDIE 10 8
447 45805 TOTAL 16 16
427 46919
425 48150
433 47388
436 46936
447 48199
458 50267
474 50386
503 52204
464 52541
473 53681
499 54086
527 54929
554 56110
7455 800160
6. Regresia
X Y
442 45786
446 46773
447 45805
427 46919
425 48150
433 47388
436 46936
447 48199
458 50267
474 50386
503 52204
464 52541
473 53681
499 54086
527 54929
554 56110
7455 800160
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.886228043
R Square 0.785400144
Adjusted R
Square 0.770071582
Standard
Error 1668.174831
Observations 16
ANOVA
Significance
df SS MS F F
Regression 1 142584630.3 1.43E+08 51.23769509 4.87337E-06
Residual 14 38959301.74 2782807
Total 15 181543932
Standard
Coefficients Error t Stat P-value Lower 95% Upper 95%
Intercept 11610.33677 5380.727905 2.157763 0.048805808 69.82318225 23150.85035 6
Nr de spitale 82.41376415 11.51343618 7.158051 4.87337E-06 57.7198995 107.1076288
PROBABILITY
RESIDUAL OUTPUT OUTPUT
Predicted
Nr de Nr de
Observation medici Residuals Percentile medici
-
1 48037.22052 2251.220521 3.125 45786
-
2 48366.87558 1593.875577 9.375 45805
-
3 48449.28934 2644.289341 15.625 46773
4 46801.01406 117.9859417 21.875 46919
5 46636.18653 1513.81347 28.125 46936
6 47295.49664 92.50335678 34.375 47388
-
7 47542.73794 606.7379357 40.625 48150
-
8 48449.28934 250.2893414 46.875 48199
9 49355.84075 911.159253 53.125 50267
-
10 50674.46097 288.4609735 59.375 50386
-
11 53064.46013 860.4601339 65.625 52204
12 49850.32333 2690.676668 71.875 52541
13 50592.04721 3088.952791 78.125 53681
14 52734.80508 1351.194923 84.375 54086
-
15 55042.39047 113.3904736 90.625 54929
-
16 57267.56211 1157.562106 96.875 56110
Prin intermediul regresiei se pot face predictii ale unei variabile, in functie de valoarea alteia.
Predictia este procesul de estimare a valorii unei variabile cunoscand valoarea unei alte
variabile.
Regresia ne arata cum (ca forma analitica) o variabila este dependenta de alta variabila (sau de
alte variabile).
7.
7.1. Indicatori absoluti, relativi si medii
X Y
442 45786
446 46773
447 45805
427 46919
425 48150
433 47388
436 46936
447 48199
458 50267
474 50386
503 52204
464 52541
473 53681
499 54086
527 54929
554 56110
7455 800160
max.x 554
min.x 425
max.y 56110
min.y 45786
a) Indicatori absoluti
Indicatorul absolut arata care este echivalenta (in cifre absolute) a unei modificari (in plus
sau in minus) cu 1%. A= Y0
100
Nr de spitale Nr de medici
An
(t) Δ t/1 (t) Δ t/1
1 442 0 45786 0
2 446 4 46773 987
3 447 5 45805 19
4 427 -15 46919 1133
5 425 -17 48150 2364
6 433 -9 47388 1602
7 436 -6 46936 1150
8 447 5 48199 2413
9 458 16 50267 4481
10 474 32 50386 4600
11 503 61 52204 6418
12 464 22 52541 6755
13 473 31 53681 7895
14 499 57 54086 8300
15 527 85 54929 9143
16 554 112 56110 10324
Nr de spitale Nr de medici
An
(t) (t)
1 442 - 45786 -
2 446 4 46773 987
3 447 1 45805 -968
4 427 -20 46919 1114
5 425 -2 48150 1231
6 433 8 47388 -762
7 436 3 46936 -452
8 447 11 48199 1263
9 458 11 50267 2068
10 474 16 50386 119
11 503 29 52204 1818
12 464 -39 52541 337
13 473 9 53681 1140
14 499 26 54086 405
15 527 28 54929 843
16 554 27 56110 1181
b) Indicatori relativi
Nr de
An Nr de spitale (t)
medici
Nr de
An Nr de spitale (t)
medici
1 442 - 45786 -
2 446 1,01 46773 1,02
3 447 1,00 45805 0,98
4 427 0,96 46919 1,02
5 425 1,00 48150 1,03
6 433 1,02 47388 0,98
7 436 1,01 46936 0,99
8 447 1,03 48199 1,03
9 458 1,02 50267 1,04
10 474 1,03 50386 1,00
11 503 1,06 52204 1,04
12 464 0,92 52541 1,01
13 473 1,02 53681 1,02
14 499 1,05 54086 1,01
15 527 1,06 54929 1,02
16 554 1,05 56110 1,02
Nr de
An Nr de spitale (t)
medici
1 442 - 45786 -
2 446 0,01 46773 0,02
3 447 0,01 45805 0,00
4 427 - 0,03 46919 0,02
5 425 - 0,04 48150 0,05
6 433 - 0,02 47388 0,03
7 436 - 0,01 46936 0,03
8 447 0,01 48199 0,05
9 458 0,04 50267 0,10
10 474 0,07 50386 0,10
11 503 0,14 52204 0,14
12 464 0,05 52541 0,15
13 473 0,07 53681 0,17
14 499 0,13 54086 0,18
15 527 0,19 54929 0,20
16 554 0,25 56110 0,23
Nr de
An Nr de spitale (t)
medici
1 442 - 45786 -
2 446 0,01 46773 0,02
3 447 0,00 45805 - 0,02
4 427 - 0,04 46919 0,02
5 425 - 0,00 48150 0,03
6 433 0,02 47388 - 0,02
7 436 0,01 46936 - 0,01
8 447 0,03 48199 0,03
9 458 0,02 50267 0,04
10 474 0,03 50386 0,00
11 503 0,06 52204 0,04
12 464 - 0,08 52541 0,01
13 473 0,02 53681 0,02
14 499 0,05 54086 0,01
15 527 0,06 54929 0,02
16 554 0,05 56110 0,02
c) Indicatori medii
Nivelul mediu al seriei
Reprezintă valoarea medie a indicatorului sau fenomenului corespunzătoare întregului orizont
de timp analizat.
Ritmul mediu
Metoda indicelui mediu – este tot o metoda mecanica, usor de aplicat, care se
bazeaza pe relatia existenta intre primul termen al seriei, indicele mediu si un termen oarecare
al seriei. Se foloseste atunci cand termenii seriei au tendinta unei progresii geometrice, in care
ratia poate fi considerata egala cu indicele mediu al dinamicii. Relatia care sta la baza
ajustarii prin procedeul modificarii medii absolute este: k i 1 Y y I . In acest caz vom avea:
1 0 1 1 Y y I y ; 1 2 1 Y y I ; 2 3 1 Y y I ; …………… n n 1 n 1 Y y I y . Si
in cadrul acestei metode Y1 = y1 şi Yn = yn . Si cu ajutorul acestei metode sunt eliminate
toate fluctuatiile evolutive intamplatoare, valorile teoretice Yi inscriinduse pe o linie curba.
x y
672 349
993 578
787 683
421 579
524 845
882 760
521 509
593 537
656 592
679 693
545 535
456 1051
891 244
792 572
603 671
509 460
595 630
567 831
582 773
587 535
667 339
13522 12766
Bin Frequency Cumulative %
244 0 0,00%
339 0 0,00%
349 0 0,00%
460 2 9,52%
509 1 14,29%
535 2 23,81%
535 0 23,81%
537 0 23,81%
572 2 33,33%
578 0 33,33%
579 0 33,33%
592 2 42,86%
630 3 57,14%
671 2 66,67%
683 2 76,19%
693 0 76,19%
760 0 76,19%
773 0 76,19%
831 2 85,71%
845 0 85,71%
1051 3 100,00%
More 0 100,00%
LIMITELE INTERVALELOR SUNT: 244, 339, 349, 460, 509, 535, 535,537, 572, 578, 579,
592, 630, 671, 683, 693, 760, 773, 831, 845, 1051
INTERVALE
DE VARIATIE FRECVENTA
(MII LEI) ABSOLUTA
244-339 0
339-349 0
349-460 0
460-509 2
509-535 1
535-535 2
535-537 0
537-572 0
572-578 2
578-579 0
579-592 0
592-630 2
630-671 3
671-683 2
683-693 2
693-760 0
760-773 0
773-831 0
831-845 2
845-1051 0
1051 3
0