Sunteți pe pagina 1din 24

PROIECT

“Interdependența dintre numărul de oaspeți într-o cafenea și numărul de cazuri


covid inregistrate”

București 2021
CERINȚELE PROIECTULUI
Se vor prelua datele a două variabile/caracteristici (eventual o variabilă a ofertei și una
a cererii) între care există o legătură, fiecare evidențiată printr-o serie de cel puțin 20 de
date cu frecvență pe: ani/semestre/trimestre/luni/zile, cât mai recente, precizând sursa
de date.
Se cere:
1. Să se motiveze alegerea temei prezentând aspecte privind variabilele alese
în studiu, să se precizeze variabila rezultativă (y) și cea factorială(x); y=f(x) , să se
reprezinte grafic cele doua serii de date.
2. Să se calculeze Indicatorii tendinței centrale, ai variabilității si formei
distribuției pentru fiecare serie simplă de date, cu interpretările teoretice și
economice.
3. Să se grupeze valorile înregistrate pentru fiecare variabilă/caracteristică
pe intervale egale, să se prezinte repartițiile unidimensionale obținute sub formă
de tabele și grafice statistice și să se calculeze indicatorii tendinței centrale,
explicând diferențele obținute față de punctul 2.
4. Să se analizeze fiecare caracteristică/variabilă folosind Descriptiv Statistics
cu interpretările teoretice și economice, să se specifice în funcție de care din cele
două caracteristici/variabile, colectivitatea este mai omogenă .
5. Dacă se presupune că seria de date a fiecărei variabile reprezintă un
eșantion de volum 10% din colectivitatea generală, extras prin selecție aleatoare
simplă repetată, se cere:
5.1. să se estimeze media generală și nivelul totalizator pentru o
probabilitate de 95% cu valoare critică 2,085;
5.2. să se stabilească volumul unui nou eșantion dacă eroarea medie
limită admisă se reduce la jumătate pentru o probabilitate de 99% pentru
care valoarea critică este 2,624.
6. Să se măsoare intensitatea legăturii dintre cele două variabile utilizând
metode grafice ( graficul Scatter), metode parametrice (funcția correlation din
Excel, Regresia etc.) și metode neparametrice ( Spearman);
7. Pentru fiecare variabilă in parte din seriile cronologice supuse studiului, să se
determine și să se interpreteze indicatorii absoluți, relativi și medii;
8. Concluzii
9. Bibliografie

1. Să se motiveze alegerea temei prezentând aspecte privind variabilele alese în


studiu, să se precizeze variabila rezultativă (y) și cea factorială (x); y=f(x), să se
reprezinte grafic cele doua serii de date.

Impactul COVID-19 asupra ramurii economiei HORECA a fost unul din cel mai
important. Analiza prezentă incearcă să stabilească, dacă există o legatură semnificativă intre
numărul de oasepeți/clienți ce frecventează acea societate comericială și numărul de cazuri
covid inregistrate în sectorul/zona în care e deschisă o unitate HORECA și
Datele au fost preluate din raportul Z al Tucano Coffee SRL și de pe www.graphs.ro,

fiind selectate pe o perioadă de 21 de zile (04.12.2020-24.12.2020).

Nr.crt. Nr. de cazuri


Nr. oaspeti*
Data covid**
(x)
(y)
1 04.12.2020 185 986
2 05.12.2020 194 1627
3 06.12.2020 219 1588
4 07.12.2020 158 1828
5 08.12.2020 189 1946
6 09.12.2020 182 1946
7 10.12.2020 173 1762
8 11.12.2020 228 1867
9 12.12.2020 236 1156
10 13.12.2020 267 1142
11 14.12.2020 167 556
12 15.12.2020 188 1143
13 16.12.2020 163 1127
14 17.12.2020 186 903
15 18.12.2020 203 1088
16 19.12.2020 220 1167
17 20.12.2020 232 600
18 21.12.2020 192 341
19 22.12.2020 200 819
20 23.12.2020 175 967
21 24.12.2020 99 1096
Total 4056 25655
(sursa: raportul lunar Z al Tucano Coffee SRL și www.graphs.ro)

Variabila rezultativă y este influenţată de una sau mai multe variabile cauzale/factoriale
x, considerate ca esenţiale, pe lângă acestea existând şi alte variabile neînregistrate sau
nespecificate.

În cazul nostru:

- variabila rezultativă y : numărul de oaspeți

- variabila factorială (cauzală) : x numărul de cazuri covid-19,

La fel de bine s-ar fi putut alege y = nr. cazuri covid si x = nr. oaspeti.

2500
Distribuția datelor inregistrate
Nr. oaspeti* Nr. de cazuri covid**
2000

1500

1000

500

0
20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20
/ 20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20
/4 /5 /6 /7 /8 /9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
12 12 12 12 12 12 12/ 12/ 12/ 12/ 12/ 12/ 12/ 12/ 12/ 12/ 12/ 12/ 12/ 12/ 12/

Figura nr. 1. Distributia evoluitie variabilelor, sub forma de coloane


(sursa: raportul lunar Z al Tucano Coffee SRL și www.graphs.ro)
Evoluția datelor pe zile
Nr. oaspeti* Nr. de cazuri covid**
2500

2000

1500

1000

500

0
20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20
/ 20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20
/4 /5 /6 /7 /8 /9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
12 12 12 12 12 12 12/ 12/ 12/ 12/ 12/ 12/ 12/ 12/ 12/ 12/ 12/ 12/ 12/ 12/ 12/

(sursa: raportul lunar Z al Tucano Coffee SRL și www.graphs.ro)


Figura nr. 2. Distributia evoluitie variabilelor, sub forma poligonului frecventelor

2. Să se calculeze Indicatorii tendinței centrale, ai variabilității si formei


distribuției pentru fiecare serie simplă de date cu interpretările teoretice și
economice.
A. Numărul de oaspeți
Indicatorii tendinței tentrale(ITC): Media, Mediana, Modul
Media se calculează în general ca medie aritmetică a valorilor măsurate, fiind o estimare a
"centrului" unei distribuții de valori.

Media aritmetică este suma valorilor imparțită la numărul lor:

- media pentru numărul de oaspeți: 193,14;

Interpretare: In medie, in perioada analizata, in unitatea Tucano, au intrat 193 persoane pe zi.

Mediana unei serii ordonate este valoarea care imparte șirul ordonat al valorilor variabilelor în
doua părți, fiecare parte conținând același număr de valori( 50%).

Loc Med= (n+1)/2

Mediana reprezintă termenul al (n+1)/2 lea

In cazul nostru n =21 zile, al 11 lea termen din seria ordonată, deci avem:

- mediana pentru numarul de oaspeti: 189; Interpretare

Modul(valoarea dominantă)– cea mai frecventă valoare din seria de date și este utilizată în
special pentru date discrete.

O serie statistică poate avea mai multe moduri sau niciunul.


Pentru seria de date aferentă numărului de oaspeți, nu există nici un mod, deci seria este
amodală.

Indicatorii Variabilității(IV): Amplitudinea, Dispersia, Eroarea standard, Coeficientul de


variație

Amplitudinea este definită ca xmax-xmin(diferențadintre valoarea maximă și cea minimă), unde

In cazul nostru avem:

- pentru numărul de oaspeți: 99 persoane ;

A= 267-99 = 168 persoane Interpretare

Dispersia reprezintă răspândirea valorilor din jurul tendinței centrale. Nu are unitate
de măsură.

Este medie pătratică a abaterilor fiecărui element de la media mulțimii

1
D=
n
∑ ( x i−x )2
D = 1213,129

Abaterea medie patratică/Abaterea standard este rădăcina medie pătrată a mulțimii abaterilor
fiecărui element de la media mulțimii/radical din dispersie.

SD=
√ 1
n
∑ ( x i−x )
2

SD=34,83 persoane Interpretare

Coeficientul de variatie, este un indicator cu ajutorul caruia se determină gradul de


omogenitate precum și reprezentativitatea mediei.

Cv = abaterea standard*100/valoarea medie

Cv1=34,83*100/193,14=18%

Colectivitate omogenă și medie reprezentativă.


Indicatorii formei distribuției: Coeficientul de asimetrie
....de calculat
B. Nr cazuri de covid înregistrate
Utilizînd aceleași formule de calcul pentru indicatorii tendinței centrale, ai
variabilității și formei distribuției se obțin următoarele valori:
Indicatorii tendinței centrale:
Media: 1221,667 cazuri
Interpretare: In medie, în perioada analizată, s-au nregistrat 1222 cazuri pe zi.
Mediana:
In 50% din zilele analizate s-au inregistrat mai mult de 1142 azuri de covid /zi.
Modul:
În cele mai multe zile s-au înregistrat un număr de 1946 cazuri de covid.
Indicatorii Variabilității: Amplitudinea, Dispersia, Eroarea standard, Coeficientul de variație

Amplitudinea = 1605 cazuri


În periada analizată, umîrul cazurilor de covid înregistrate au fost între 341 si 1946
de cazuri, deci o diferență de 1605 cazuri.
Pentru a măsura gradul de împrăștiere a datelor unei serii statistice față de medie se folosesc
dispersia și abaterea medie patratică.

Dispersia: 223778,1 (fără interpretare economică)


Eroarea standard/abaterea medie pătratică: 473,0519 cazuri
In medie, abaterea de la media zilnică de cazuri înregistrate a fost de 473 azuri .
Coeficientul de variație:

Cv2=473,05*100/1221,66=38,72%

Valoarea coeficinetului de variație este mai mare de 35% (stabilit prin convenție),
deci, colectivitatea (mulțimea datelor înregistrate pentru cazuri de covid) este
neomogenă, iar media aritmetică este nesimnificativă.
Indicatorii formei distribuției: Coeficientul de asimetrie
....de calculat

3. Să se grupeze valorile înregistrate pentru fiecare variabilă/caracteristică pe


intervale egale, să se prezinte repartițiile unidimensionale obținute sub formă de
tabele și grafice statistice.

Sistematizarea datelor - Gruparea pe 4 intervale egale

Se utilizeaza Excel, Data Analysis Histograma(vezi Excel)

A. Variabila Nr. oaspeți

Gupe nr.oaspeți FC(frecvente FC(frecvente


nr. zile cumulate cumulate
frecvența (ni) xi xi*ni crescator) descrescator)
99-141 1 120 120 1 21
141-183 6 162 972 7 20
183-225 10 17 14
204 2040
225-267 4 246 984 21 4
TOTAL 21   4116  

Histogram
12
10
8
Frequency

6
4
2
0
141 183 225 267 More
Bin

C. Variabila nr de cazuri covid

Grupe nr. Nr.


cazuri coivid zile(ni) Xi FC xi*ni
341-743 3 542 3 1626
743-1145 9 944 12 8496
1145-1547 2 1346 14 2692
1547-1949 7 1748 21 12236
TOTAL 21 4580   25050

Histogram
10
8
Frequency

6
4
2
0
743 1145 1547 1949 More
4. Să se analizeze fiecare caracteristică/variabilă folosind Descriptiv Statistics cu
interpretările teoretice și economice, să se specifice în funcție de care din cele
două caracteristici/variabile, colectivitatea este mai omogenă .

Nr. oaspeti* Nr. de cazuri covid**

Mean 193,1429 Mean 1221,667


Standard Error 7,600528 Standard Error 103,2284
Median 189 Median 1142
Mode #N/A Mode 1946
Standard Deviation 34,83 Standard Deviation 473,0519
Sample Variance 1213,129 Sample Variance 223778,1
Kurtosis 1,977104 Kurtosis -0,83646
Skewness -0,41737 Skewness 0,090354
Range 168 Range 1605
Minimum 99 Minimum 341
Maximum 267 Maximum 1946
Sum 4056 Sum 25655
Count 21 Count 21
Confidence Confidence
Level(95,0%) 15,85442 Level(95,0%) 215,3307

Mean(media) .Este un indicator al tendintei centrale.

- media pentru numărul de oaspeți: 193,14;

Ex.interpretare: In medie, in perioada analizata, in unitatea Tucano, au intrat 193 oaspeti/zi

- media pentru numărul de cazuri covid-19: 1221,67.

Ex.interpretare: In medie, in perioada analizata, au fost inregistrate 1222 cazuri/zi

Standard error(eroarea standard) este eroarea medie de reprezentativitate, o măsură a


depărtării de valoarea așteptată și ne arată cât de apropiate sunt datele reale față de valoarea
așteptată(media).

Median(mediana) reprezintă valoarea care la care se găsește jumătate dintre observații, este o
valoare care se obține după ordonarea datelor. Este un indicator al tendintei centrale.

In cazul nostru n =21 zile, al 11 lea termen din seria ordonată, deci avem:

- mediana pentru numarul de oaspeti: 189; In 50% din numărul zilelor analizate
numărul zilnic al clienților a fost mai mic decât 189.
- mediana pentru numarul de cazuri covid: 1142. In 50% din numărul zilelor
analizate s-au inregistrat mai mult de 1142 cazuri de covid /zi.

Mode(valoarea dominantă)– cea mai frecventă valoare din seria de date și este utilizată în
special pentru date discrete. Este un indicator al tendintei centrale.

Pentru seria de date aferentă numărului de oaspeți, nu există nici un mod, deci seria este
amodală.

Pentru seria de date aferentă numărului de cazuri covid-19, modul este 1946. Cel mai frecvent
număr de cazuri inregistrat a fost 1946.

Sample variance(dispersia) evidențiază răspândirea valorilor in jurul tendinței centrale.Pe


lângă dispersie, imprăștierea datelor in jurul valorii medii o pune in evidență și abaterea
standard. 

Dispersia este medie pătratică a abaterilor fiecărui element de la media mulțimii

1
D=
n
∑ ( x i−x )
2

Standard deviation(abaterea medie patratică) a unei mulțimi de numere este rădăcina medie
pătrată a mulțimii abaterilor fiecărui element de la media mulțimii/radical din dispersie.

SD=
√ 1
n
∑ ( x i−x )
2

Kurtosis(coeficientul de aplatizare sau boltire) - un indicator folosit în analiza formei


distribuției unei serii de date pentru a indica gradul de aplatizare sau de ascuțire a unei
distribuții.

In cazul nostru, pentru numărul de cazuri de covid inregistrate, coeficientul de


aplatizare este negativ, (-0,83) iar pentru numărul de oaspeti coeficientul este pozitiv, (+ 1,98)
(Se evidentiaza și in histogramă - pentru numărul de clienți avem o distribuție leptocurtică și
pentru numărul de cazuri covid,o distribuie platicurtică).

Skewness(coeficientul de asimetrie) este abaterea de la forma simetrică a distribuției și arată


gradul de asimetrie a unei repartiții.

Coeficientul de asimetrie Skewnwss este mai mare decât 0 pentru numărul de cazuri covid-19,
deci avem asimetrie la dreapta, pentru numărul de clienți, unde coeficientul de asimetrie este
mai mic decat zero, iar la nr cazuri, coeficientul este foarte apropiat de 0, deci o distributie
aproape simetrică (vezi histograma).

Range (amplitudinea) este definită ca xmax-xmin(diferența dintre valorile maximă și minimă),


Amplitudinea oferă o imagine a intinderii datelor, dependentă de numărul de valori. Cu cât se
înregistrează mai multe date, cu atât crește posibilitatea de a obține o amplitudine mai mare.
Minimum reprezintă valoarea minima din setul de date. In cazul nostru avem:

- pentru numărul de oaspeți: 99;

- pentru numărul de cazuri covid-19: 341.

Maximum reprezintă valoarea maximă din setul de date. În cazul nostru avem:

- pentru numărul de oaspeți: 267;

- pentru numărul de cazuri covid-19: 1946.

Sum(suma) reprezintă suma tuturor valorilor din setul de date. În cazul nostru avem:

- pentru numărul de oaspeți: 4056;

- pentru numărul de cazuri covid-19: 25655.

Count este numărul de înregistrări din setul de date. În cazul nostru este 21, deoarece avem
date pentru 21 zile (21 linii în tabel).

Confidence Level (95.0%) sau eroarea limită/ maximă este intervalul de încredere pentru
medie. Arată probabilitatea ca intervalul de încredere al unui parametru, să conțină valoarea
adevarată a parametrului. Dacă se construiesc în mod repetat intervale de încredere plecând de
la eșantioane diferite, procentul intervalelor care conțin valoarea adevarată a parametrului va
tinde către siguranța statistică.

Coeficientul de variație, este un indicator cu ajutorul căruia se calculează gradul de


omogenitate.

Cv = abaterea standard*100/valoarea medie

Cv1=34,83*100/193,14=18%

Cv2=473,05*100/1221,66=38,72%

Cv1<Cv2, deci colectivitatea numărului de oaspeți a unității comerciale este mai omogenă
decât colectivitatea numărului de cazuri de covid. Media cliențilorr este reprezentativă din
punct de vedere statistic, în perioada analizată.

5. Dacă se presupune că seria de date a fiecărei variabile reprezintă un eșantion de


volum 10% din colectivitatea generală, extras prin selecție aleatoare simplă
repetată, se cere:
5.1. să se estimeze media generală și nivelul totalizator pentru o
probabilitate de 95% cu valoare critică 2,085
5.2. să se stabilească volumul unui nou eșantion dacă eroarea medie limită
admisă se reduce la jumătate pentru o probabilitate de 99% pentru care
valoarea critică este 2,624;

5.1.Estimarea mediei generale si nivelul totalizator

Deoarece seria de date este formată din 21 seturi de date, atunci avem:

n=21

Presupunem că această serie reprezintă un esantion de 10%, atunci obținem:

10
n=10 % ∙ N = ∙N
100

100
N=21∙ =¿210
10

Estimarea mediei generale si nivelul totalizator

Interval de Medie x−Δ x̄ <μ <x +Δ x̄


încredere Totalizator N⋅( x− Δ x̄ ) < ∑ xi < ( x+ Δ x̄ )⋅N
(Sursa: Suportul de curs)

95 % ( probabilitate ) ⇒t=2,085( valoare critica)

A. Pentru variabila corespunzatoare numărului de clienți avem:

x=193,14 ( media pentru numărul de clienți )

Dispersia( s 2)=1213,129( calculată în fișierul Excel) in DS

Eroare medie de selectie ( s x )=


√ s2
n
=7,6/¿ Standard Error

Eroare maxima admisibila ( ∆ x ) =2.085 ∙ s x =15,85442/¿Confidence Level (95.0%)

Intervalul de incredere

x−Δ x̄ <μ <x +Δ x̄

193,14−15.85< µ<193,14+15,85

177< µ<209

Nivel totalizaor
N⋅( x− Δ x̄ ) < ∑ xi < ( x+ Δ x̄ )⋅N

210 ⋅177<∑ x i <209 ⋅ 210

37170<∑ x i <43890

Recomandare: Prezentati interpretarea

B. Pentru variabila corespunzatoare numarului de cazuri covid avem:

X =1221,667(media pentru numarul de cazuri covid−19)

Dispersia ( s )=¿223778,1 (calculată în fișierul Excel)


2

Eroare medie de selectie (s x )=


√ s2
n
=103,22838 / Standard Error

Eroare maxima admisibila ( ∆ x ) =t ∙ s x =215,3307 /Confidence Level (95.0%)

Intervalul de incredere

x−Δ x̄ <μ <x +Δ x̄

1221,667−215,3307<µ< 1221,667+215,3307

1006< µ<1437

Nivel totalizaor

N⋅( x− Δ x̄ ) < ∑ xi < ( x+ Δ x̄ )⋅N

210 ⋅ 1006<∑ x i <1437 ⋅ 210

211260<∑ x i <301770

Recomandare: Prezentati interpretarea

5.2. Volumul unui nou eșantion


2 2
¿ t ⋅s
Volumul noului eșantion n=
Δ ¿2

(Sursa: Suportul de curs)

Eroarea medie admisă se va reduce la jumatate

99 % ( probabilitate ) ⇒ t=2,624 (valoare critica)

A. Pentru variabila corespunzătoare numărului de oaspeți/clienți avem:


x=193,14 ( media pentru numărul de oaspeți )

Dispersia( s 2)=1213,129(calculată în fișierul Excel )


2
s
Eroare medie de selectie ( s x )= =7,6
n

¿ 15,8544
Eroare maxima admisibila ( ∆ x ) = =7,92
2
2 2
¿ t ⋅s
n= 2 2
2,624 ⋅7,6
Δ ¿x̄2 ¿2
= 7,92❑¯ =133 persoane

B. Pentru variabila corespunzatoare numarului de cazuri covid-19 avem:

X =1221,667(media pentru numarul de cazuri covid−19)

Dispersia ( s2 )=¿223778,1 (calculată în fișierul Excel)


2
s
Eroare medie de selectie (s x )= =103,22838
n

¿ 215,33
Noua Eroare maximaadmisibila ( ∆ x )= =107,66
2
2 2
¿t ⋅s
n = ¿2 2,6242 ⋅ 223778
Δ x̄ ¿2
= 107,66❑¯ =134 persoane

6. Să se măsoare intensitatea legăturii dintre cele două variabile utilizând metode


grafice ( graficul Scatter), metode parametrice (funcția correlation din Excel,
Regresia, etc.) și metode neparametrice ( Spearman);
Intensitatea legăturii se poate calcula folosind mai multe metode precum:
1. Metoda grafică (Graficul Scatter) indică existența și sensul legăturii

2. Metode parametrice

 Metoda coeficientului de corelație ( funcția correlațion din Excel-


Corel)-indică sensul și intensitatea legăturii
 Metoda covarianței (Cov) indică existența și sensul unei legături
 Metoda Raportului de corelatie(din regresie)- indică intensitatea
legăturii dintre variabile.
 Metoda Regresiei arată modul în care o variabilă, numită variabilă
independentă/factorială influențează o altă variabilă
dependentă/rezultativă.
3. Metode neparametrice (Metoda de corelație a rangurilor Spearman,Kendall ).

1.Graficul Scatter

Interdependenta dintre Nr. de cazuri covid si nr.


oaspeti
2500

2000
Nr, cazuri covid

1500

1000

500

0
80 100 120 140 160 180 200 220 240 260 280
Nr.oaspeti

(sursa: raportul lunar Z al Tucano Coffee SRL și www.graphs.ro)

Graficul arată existența unei legaturi inverse foarte slabe. Anticipăm o scădere foarte mică a
numărului de oaspeți in funcție de numărul cazurilor de covid înregistrate.

2. Metode parametrice
Coeficientul de corelație = -0,02136 ( claculat in Excel- cu functia corell)
Acesta indică o corelație foarte slabă, inversă, intre cele doua variabile.
Raportul de corelatie R=0.02 (calculat din outputul Regresiei) Aceeași valoare
absolută ca și coeficientul de corelație.
Covarianta = -335,1428571( claculat in Excel- cu functia cov)
Indică existența unei legături inverse dintre variabile.

Metoda regresiei
SUMMARY OUTPUT

Regression Statistics
Multiple R 0,021357825
R Square 0,000456157
Adjusted R Square -0,052151414
Standard Error 35,7266699
Observations 21

ANOVA
df SS MS F Significance F
Regression 1 11,06753 11,06753 0,00867093 0,9267848
Residual 19 24251,5 1276,395
Total 20 24262,57

Coefficients Standard Errort Stat P-value Lower 95% Upper 95,0%


Intercept 195,0639765 22,05496 8,84445 3,6599E-08 148,90242 241,225533
Nr. de cazuri covid**-0,00157254 0,016888 -0,09312 0,92678484 -0,036919 0,033773677

Outputul Funcției de regresie indică, existența unei legături foarte slabe intre cele
două variabile:
 Multiple R =0.02 -Raportul de corelație – o legatură foarte slabă
 R Square = arată că nr Oaspetilor este influențat in proporție de 0,04% de
numărul cazurilor de covid.
 Ecuația de regresie:
Yi= 1277,69 - 0,29 Xi
 La creșterea nr de cazuri covid cu 1 unitate, nr oapetilor scade cu 0,029 !!!!
 modelul este seminficativ statistic : F=0,008 <0,05
 Concluzie: nr oaspeților este influentat într-un procent foarte mic de nr
cazurilor de covid înregistrate in zona în care este situată unitatea comercială
analizată.

Analiza arată că există și alți factori care influentează semnificativ numărul


cliențiolor din unitatea respectivă mai mult decât nr cazurilor de covid inregistrate .

3.Metode neparametrice

Metoda rangurilor Spearman

Folosind funcția RANK din Excel, se calculează rangurile celor doua variabile, in coloana diff
se notează iferența dintre Rx si Ry iar diff^2, ridicarea la puterea a doua a coloanei diff cu
rezultatele:

Nr. Nr. de
Rx Ry Diff diff^2
oaspeti cazuri
covid*
*
*
185 986 14 15 -1 1
194 1627 9 6 3 9
219 1588 6 7 -1 1
158 1828 20 4 16 256
189 1946 11 1 10 100
182 1946 15 2 13 169
173 1762 17 5 12 144
228 1867 4 3 1 1
236 1156 2 9 -7 49
267 1142 1 11 -10 100
167 556 18 20 -2 4
188 1143 12 10 2 4
163 1127 19 12 7 49
186 903 13 17 -4 16
203 1088 7 14 -7 49
220 1167 5 8 -3 9
232 600 3 19 -16 256
192 341 10 21 -11 121
200 819 8 18 -10 100
175 967 16 16 0 0
99 1096 21 13 8 64

(sursa: raportul lunar Z al Tucano Coffee SRL și www.graphs.ro)

2
6  di
CS  1 
nn 2  1
= - 0,02

Concluzie: legatură inversă foarte slabă (același rezultat obținut prin toate metodele
utilizate)

7. Pentru fiecare variabilă in parte din seriile cronologice supuse studiului, să se


determine și să se interpreteze indicatorii absoluți, relativi și medii;
A. Indicatorii absoluti

 Valoarea absolută(Yt)( in tabel)


 Modificare absolută cu bază fixă se calculează prin diferența între valoarea
variabilei în momentul t şi valoarea variabilei corespunzătoare unui moment
fix, considerat bază de comparație. De obicei baza de comparație este primul
termen al seriei.
 t / 1  yt  y1
Nr. Nr. de
oaspeti cazuri
* covid**(Y
( Yt) Δ t/1 t) Δ t/1
185 0 986 0
194 9 1627 641
219 34 1588 602
158 -27 1828 842
189 4 1946 960
182 -3 1946 960
173 -12 1762 776
228 43 1867 881
236 51 1156 170
267 82 1142 156
167 -18 556 -430
188 3 1143 157
163 -22 1127 141
186 1 903 -83
203 18 1088 102
220 35 1167 181
232 47 600 -386
192 7 341 -645
200 15 819 -167
175 -10 967 -19
99 -86 1096 110
(sursa: raportul lunar Z al Tucano Coffee SRL și www.graphs.ro)

Recomandare: Interpretati cel putin o valoare a indicatorului pentru fiecare serie

 Modificare absolută cu baza mobilă (in lanț) se calculează prin diferența intre
valoarea variabilei în momentul t și valoarea variabilei în momentul precedent t-1.

 t / t 1  yt  yt 1

Nr. Nr. de
oaspeti
 t / t 1   yt  yt 1 cazuri
 
 t / t 1  yt  yt 1
* covid**

185 - 986 -
194 9 1627 641
219 25 1588 -39
158 -61 1828 240
189 31 1946 118
182 -7 1946 0
173 -9 1762 -184
228 55 1867 105
236 8 1156 -711
267 31 1142 -14
167 -100 556 -586
188 21 1143 587
163 -25 1127 -16
186 23 903 -224
203 17 1088 185
220 17 1167 79
232 12 600 -567
192 -40 341 -259
200 8 819 478
175 -25 967 148
99 -76 1096 129
(sursa: raportul lunar Z al Tucano Coffee SRL și www.graphs.ro)

Recomandare: Interpretati cel putin o valoare a indicatorului pentru fiecare serie

B. Indicatori relativi

 Indici (de dinamică) cu bază fixă se calculează prin raportarea valoarii variabilei in
momentul t la valoarea variabilei corespunzătoare unui moment fixat, considerat bază
de comparaţie. De obicei baza de comparaţie este primul termen al seriei.

yt
I t /1 
y1
Nr. de
Nr.
cazuri
oaspeti It/1 It/1
covid*
*
*
185 1 986 1
1,0486 1,65010
194 1627
5 1
1,1837 1,61054
219 1588
8 8
0,8540 1,85395
158 1828
5 5
1,0216 1,97363
189 1946
2 1
0,9837 1,97363
182 1946
8 1
173 0,9351 1762 1,78701
4 8
1,2324 1,89350
228 1867
3 9
1,2756 1,17241
236 1156
8 4
1,4432 1,15821
267 1142
4 5
0,56389
167 0,9027 556
5
1,0162 1,15922
188 1143
2 9
0,8810 1,14300
163 1127
8 2
1,0054 0,91582
186 903
1 2
1,10344
203 1,0973 1088
8
1,1891
220 1167 1,18357
9
1,2540 0,60851
232 600
5 9
1,0378 0,34584
192 341
4 2
1,0810 0,83062
200 819
8 9
0,9459
175 967 0,98073
5
0,5351 1,11156
99 1096
4 2
(sursa: raportul lunar Z al Tucano Coffee SRL și www.graphs.ro)

Recomandare: Interpretati cel putin o valoare a indicatorului pentru fiecare serie

 Indici (de dinamică) cu baza mobilă (in lant) se calculează prin raportarea valoarii
variabilei in momentul t la valoarea variabilei din momentul precedent t-1.

yt
I t / t 1 
yt 1
Nr. de
Nr. cazuri
It/t-1 It/t-1 (sursa: raportul lunar Z al Tucano Coffee SRL și
oaspeti* covid*
* www.graphs.ro)
185 - 986 -
1,0486 1,65010 Recomandare: Interpretati cel putin o valoare a
194 1627
5 1 indicatorului pentru fiecare serie
1,1288
219 1588 0,97603
7  Ritmul (de dinamică) cu bază fixă(%)
0,7214 1,15113
158 1828
6 4 Δt / 1 y − y1
1,06455 Rt /1 = ⋅100= t 100=( I t/ 1 −1 )⋅100 ;
189 1,1962 1946 y1 y1
1
0,9629
182 1946 1
6
0,9505 0,90544
173 1762
5 7
1,3179 1,05959
228 1867
2 1
1,0350 0,61917
236 1156
9 5
1,1313 0,98788
267 1142
6 9
0,6254 0,48686
167 556
7 5
1,1257 2,05575
188 1143
5 5
0,8670 0,98600
163 1127
2 2
0,80124
186 1,1411 903
2
1,20487
203 1,0914 1088
3
1,0837
220 1167 1,07261
4
1,0545 0,51413
232 600
5 9
0,8275 0,56833
192 341
9 3
1,0416
200 819 2,40176
7
1,18070
175 0,875 967
8
0,5657 1,13340
99 1096
1 2
Nr. de
Nr. cazuri
Rt/1(%) Rt/1(%)
oaspeti* covid*
*
185 1 986 1
194 4,86 1627 65,01
219 18,37 1588 61,05
158 -14,59 1828 85,39
189 2,16 1946 97,36
182 -1,62 1946 97,36
173 -6,48 1762 78,70
228 23,24 1867 89,35
236 27,56 1156 17,24
267 44,32 1142 15,82
167 -9,72 556 -43,61
188 1,62 1143 15,92
163 -11,89 1127 14,30
186 0,54 903 -8,41
203 9,72 1088 10,34
220 18,91 1167 18,35
232 25,40 600 -39,14
192 3,78 341 -65,41
200 8,10 819 -16,93
175 -5,40 967 -1,92
99 -46,48 1096 11,15
Recomandare: Interpretati cel putin o valoare a indicatorului pentru fiecare serie

 Ritmul (de dinamică) cu bază în lanţ ( Rt /t−1 )


Δ y −y
Rt /t−1 = t /t −1⋅100= t t−1⋅100=( I t / t−1 −1 )⋅100 .
y t −1 y t−1
Nr. de
Nr. Rt/t- Rt/t-
cazuri
oaspeti* 1(%) 1(%)
covid**
185 - 986 -
194 4,86 1627 65,01
219 12,88 1588 -2,39
158 -27,85 1828 15,11
189 19,62 1946 6,45
182 -3,70 1946 0
173 -4,94 1762 -9,45
228 31,79 1867 5,95
236 3,50 1156 -38,08
267 13,13 1142 -1,21
167 -37,45 556 -51,31
188 12,57 1143 105,57
163 -13,29 1127 -1,39
186 14,11 903 -19,87
203 9,13 1088 20,48
220 8,37 1167 7,26
232 5,45 600 -48,58
192 -17,24 341 -43,16
200 4,16 819 140,17
175 -12,5 967 18,07
99 -43,42 1096 13,34

Recomandare: Interpretati cel putin o valoare a indicatorului pentru fiecare serie

C. Indicatori medii

 Nivelul mediu al seriei reprezintă valoarea medie a indicatorului sau fenomenului


corespunzătoare întregului orizont de timp analizat.

y 
 yt
n =193 oaspeti
=1222 cazuri covid

Recomandare: Interpretati valoarea indicatorului pentru fiecare serie

 -Modificarea medie absoluta reprezinta media aritmetica a modificarilor absolute cu


baza in lant

 t / t 1  n /1 y  y1
  t 2   n
n 1 n 1 n 1
=-4,3 oaspeti

=5,5 nr cazuri

Recomandare: Interpretati valoarea indicatorului pentru fiecare serie

 Indicele mediu de dinamică reprezintă media geometrică a indicilor cu bază în lanţ.

Ι= √∏ Ι t /t −1=n−1√ Ι n /1
n−1

=0.96

=1

Recomandare: Interpretati valoarea indicatorului pentru fiecare serie

 Ritmul mediu reprezintă rata (ritmul) asociat indicelui mediu de dinamică.

=(0,96-1) *100 = - 4 %

Recomandare: Interpretati valoarea indicatorului pentru fiecare serie

8. Concluzii (Rog completeti)


9. Bibliografie (Rog completeti)

S-ar putea să vă placă și