Sunteți pe pagina 1din 80

STATISTICĂ

MARKETING
2019

PRADA ELENA, Asist. Univ. Dr.


Departamentul de Statistică și Econometrie
elena.prada@csie.ase.ro
Condiții

TC valorează 40% și va fi compus din 4 teme pentru fiecare parte din


curs, fiecare temă va fi notată cu note de la 1 la 10 si va avea termen
prestabilit de rezolvate. Dupa expirarea termenului limita tema va fi
considerata neefectuata.

Standard minim de performanță: Pentru a putea intra în examen este


obligatorie parcurgerea tuturor celor 4 teme și obținerea unei notei
medii de 3 (echivalentul a 1,2 puncte din nota finală).

Examenul se notează cu note la 1 la 10 și valoarează 60% din nota


finală.
Partea I
Noțiuni introductive, concepte de bază, tipuri de date, sistematizarea și descrierea
grafica a datelor stastistice
Concepte de bază în Statistică

1. Populația
2. Eșantionul
3. Unitatea statistică
4. Variabila statistică
1. Populația (se notează cu N)

• Reprezintă totalitatea de elemente care au trăsături (caracteristici)


generale comune.

• Exemple: oamenii, animale, plante, produse (telefoane mobile,


scaune etc), diviziuni geografice (țări, orașe, regiuni, județe etc),
instituții, companii, firme.
• Populația poate fi: finită (cunoscându-se numărul de elemente ce o
compun) și infinită (numărul de elemente este greu de numărat cu
exactitate)
2. Eșantionul (se notează cu n)

• Reprezintă un subset de elemente din populația statistică care are


caracteristicile generale comune ale populației statistice.
• Eșantionul are un număr finit de elemente care este cunoscut

• Exemple: 100 de angajați, 500 de gospodării, 150 de iepuri, 3000 de


telefoane mobile, 30 de companii IT
3. Unitatea statistică

• Reprezintă elementul constitutiv al eșantionului, respectiv al


populației statistice.

• Exemplu: angajatul, gospodăria, compania IT


4. Variabila statistică
• Reprezintă caracteristica generală comună unităților statistice ce
compun un eșantion, respectiv o populație, și care variază ca nivel,
valoare sau variantă de la o unitate statistică la alta.

Exemplu

Valoare Venitul, Profitul, Vârsta, Greutatea etc Exprimate prin numere

Variantă Genul, Culoarea, Profesia, Marca etc. Exprimate prin cuvinte

Nivel Educație, Nivelul de cunoștinte ale unei limbi străine, Exprimate atât prin cuvinte
Nivelul cotelor apelor etc. cât și prin numere
Tipuri de variabile statistice

Așadar după modul ce exprimare al variabilelor:


• cele exprimate prin numere se numesc
Numerice – cantitative
• cele exprimate prin cuvinte se numesc
Nenumerice – calitative

• Prin urmare variabilele sunt: cantitative și calitative


Scale de măsurarea ale variabilelor statistice
• Pentru variabilele cantitative

Scala interval Scala raport

Nu conține zero absolut, valoarea zero nu arată Conține valoarea zero absolut.
inexistența
Exemplu: temperatura Exemplu: venituri, greutate etc

• Pentru variabilele calitative

Scala nominală Ordinală

Variantele variabilei sunt enumerate fără o Variantele variabilei sunt intr-o anumită ordine
ordine anume ierarhică
Exemplu: Exemplu:
Profesia dumneavostră este: Nivel de cunoștințe al limbii engleze:
- Medic - Începător
- Inginer - Intermediar
- Profesor - Avansat
- programator
Exercițiu
• Pentru următoarele situații determinați: populația statistică, eșantionul,
unitatea statistică, variabila statistică, tipul variabilei și scala de
măsurare:
a. Venitul a 1000 de angajați din domeniul IT
b. Numărul de copii din 2000 de familii
c. Profesiile a 300 de salariați
d. Absenteismul angajaților exprimat în zile
e. Numărul de angajați a 100 de firme
f. Gradul de satisfacție al utilizării unei aplicații pentru 30 de utilizatori
Rezolvare
Situația populația
Situația populația eșantion
eșantion unitate
unitate variabila
variabila tipul
tipul scala
scaladede
statistică
statistică statistică
statistică statistică
statistică variabilei
variabilei măsurare
măsurare

a. a. Angajatul din 1000 de Angajatul din Venitul cantitativă raport


domeniul IT angajați din domeniul IT
domeniul IT

b. b. Familiile 2000 de familii Familia Numărul de Cantitativă Raport


copii

c. c. Salariații 300 de Salariatul Profesia Calitativă Nominală


salariați

d. d. Angajații Nu este Angajatul Numărul de Cantitativă Raport


specificat zile în care a
absentat

e. e. Firmele 100 de firme Firma Numărul Cantitativă Raport


salariaților

f. f. Utilizatorii 30 de Utilizatorul Gradul de Calitativă Ordinală


utilizatori satisfacție
Sistematizarea seriilor de date statistice

• Serii simple de date - valoarea, varianta sau nivelul


variabilei stastice este înregistrată la nivelul fiecărei
unități statistice.
• Serii de date grupate - presupune grupare seriei de date simple în
funcție de frecvența de apariție a unei variante sau valori pe categorii
de variante/valori sau pe intervale de variație.

• Frecvența de apariție reprezintă numărul de apariții ale unei valori,


variante sau al unui nivel într-o serie simplă de date.
Serii simple de date
Nivelul de
Numărul de Fastfoodul lamentație în Numărul de
Obs. Genul cafele pe zi preferat sesiune țigări pe zi
1F 2 KFC 1 0
2M 0 McDonalds 5 0
3F 1 KFC 2 4
4F 0 Dristor 1 7
5F 3 Niciunul 1 8
6M 1 Niciunul 5 11
7M 3 McDonalds 5 12
8M 0 PizzaHut 4 0
9F 1 McDonalds 5 20
10 M 2 Dristor 2 0
11 F 1 KFC 2 0
12 F 1 KFC 1 18
13 M 3 McDonalds 4 22
14 F 0 Niciunul 4 0
15 F 5 Dristor 2 0

Aceasta este o baza de date cu 5 variabile statistice compusă din 15 observații


statistice (unități statistice).
Numărul total de observații statistice se numește volumul eșationului și se
notează cu n. Putem spune deci că volumul eșantionul este de 15 observații,
adică n=15.
Gruparea datelor statistice (1)

• gruparea variabilelor calitative


• pe variante (serii de date cu distribuții de frecvențe pe variante)

Fastfoodul
preferat
ni ni* ni*(%) Nivelul de ni ni* ni*(%)
KFC 4 0.267 26.67% lamentație
McDonalds 4 0.267 26.67% în sesiune
Dristor 3 0.200 20.00% 1 4 0.267 26.67%
PizzaHut 1 0.067 6.67% 2 4 0.267 26.67%
Niciunul 3 0.200 20.00% 3 0 0.000 0.00%
Total 15 1.000 100.00% 4 3 0.200 20.00%
5 4 0.267 26.67%
Total 15 1.000 100.00%
Gruparea datelor statistice (2)

• gruparea variabilelor cantitative


• pe variante (serii de date cu distribuții de frecvențe pe variante) se
face numai dacă numărul de grupe nu este mai mare de 10.
De exemplu pentru cazul numerelor întregi acest lucru presupune ca
diferența dintre valoarea maximă a variabilei si valoare minimă a
variabilei să nu depășească valoarea 9.
Numărul
de cafele ni ni* ni*(%)
pe zi
0 4 0.267 26.67%
1 5 0.333 33.33%
2 2 0.133 13.33%
3 3 0.200 20.00%
4 0 0.000 0.00%
5 1 0.067 6.67%
Total 15 1.000 100.00%
Gruparea datelor statistice (3)

• gruparea variabilelor cantitative


• pe intervale de variație (serii de date cu distribuții de frecvențe pe
intervale de variație) se face numai dacă numărul de grupe este mai
mare de 10.
De exemplu pentru cazul numerelor întregi presupune ca diferența
dintre valoarea maximă a variabilei si valoare minimă a variabilei să
depășească valoarea 10.

Numărul
de țigări ni ni* ni*(%)
pe zi
0-5 8 0.533 53.33%
5-10 2 0.133 13.33%
10-15 2 0.133 13.33%
15-20 1 0.067 6.67%
20-25 2 0.133 13.33%
Total 15 1.000 100.00%
Reprezentarea grafică a datelor statistice

•Grafic linie
•Grafic tip coloane (bar chart)
•Histogramă
•Scatter plot (nor de puncte)
Grafic linie

• Arată evoluția în timp a unei variabile


Grafic tip coloane (bar chart)

• Se utilizează pentru distribuții de frecvențe pe variante


Histograma

• Se utilizează pentru distribuții de frecvențe pe intervale de variație


Sccatter plot
• Arată relația dintre două variabile
PARTEA II
Indicatori statistici, descrierea seriilor de date, sondajul statistic simplu
Indicatorii statistici

1. Indicatorii tendinței centrale


• Media aritmetică simplă și ponderată
• Media geometrică
• Mediana
• Modul
2. Indicatori de poziție
• Quartile
3. Indicatorii variabilității
• Amplitudinea
• Abaterea individuală
• Abaterea medie liniară
• Dispersia
• Abaterea medie pătratică
• Coeficientul de variație
1. Indicatorii tendinței centrale

• Media aritmetică simplă și ponderată


• Media geometrică
• Mediana
• Modul

Se calculează diferit în funcție de tipul de seriilor de date.


Media aritmetică(1)

• Se poate calcula doar pentru variabile cantitative


• Se mai numeşte momentul de ordin 1
• pentru un şir simplu de valori – media simplă
x
 x i

n
• Pentru o serie de frecvenţe sau de date grupate pe intervale de grupare –
media ponderată

xsup  xinf
x
 xi ni x i
n i
2
Media aritmetică(2)

x
 x i

23
 1,53cafele / zi
n 15
Media artimetică(3)

• Distribuții de frecvențe pe variante


Numărul
de cafele ni xi ni
pe zi(x i)
0 4 0
1 5 5
2 2 4
3 3 9
4 0 0
5 1 5
Total 15 23

x
 xn
i i

23
 1,53cafele / zi
n i 15

În medie un student consumă aproximativ 2 cafele pe zi.


Media aritmetică(4)

• Distribuții de frecvențe pe intervale de variație

Numărul
de țigări ni xi xi ni
pe zi
0-5 8 2.5 20
5-10 2 7.5 15
10-15 2 12.5 25
15-20 1 17.5 17.5
20-25 2 22.5 45
Total 15 - 122.5

x
 xn i i

122,5
 8,17tigari / zi
n i 15

În medie un student consumă aproximativ 8 țigări pe zi.


Media geometrică

• Se foloseşte pentru calculul unor medii în cazul mărimilor relative de


dinamică
• pentru un şir simplu de valori
xg  n x i

• Pentru o serie de frecvenţe sau de date grupate pe intervale de grupare


xg  ni
 xi
ni

Observaţie: MRD trebuie să fie exprimate sub formă de indici (nu ritmuri) şi
coeficienţi (nu procente)
Valoarea modală (Mo) (1)

• Definiţie: Valoarea modală este valoarea cu frecvenţă maximă de


apariţie
• Avantaje:
• Poate fi calculată pentru variabile calitative (exprimate prin cuvinte) (de ex.:
culoarea ochilor, culoarea părului, starea civilă etc.)
• Şansele ca rezultatul să fie o valoare existentă în realitate sunt mult mai mari
decât la medii
Valoarea modală (Mo) (2)

Serie de date unimodală


Nota
stude
nților ni
1 5
50 2 7
45
40 3 12
35
4 20
Studenti

30
25
20
5 38
15
6 46
10
5 7 37
0
1 2 3 4 5 6 7 8 9 10 8 20
Nota Mo 9 10
10 5
Total 200
Valoarea modală (Mo) (3)

Serie de date bimodală


Nota
studenț
45 ilor ni
40
1 5
35
30 2 13
Studenti

25 3 22
20
4 35
15
10 5 14
5 6 7
0
7 25
1 2 3 4 5 6 7 8 9 10
8 41
Mo1 Nota Mo2
9 27
10 11
20
Total 0
Valoarea modală (Mo) (4)

• Pentru o serie de date grupate pe intervale:


1. Se alege intervalul modal ca fiind intervalul cu frecvenţa maximă
2. În interiorul intervalului modal, valoarea modală se determină cu
ajutorul formulei:
1
Mo  x0  k
1   2
1  nmo  nmo 1
k  xsup Mo  xinf Mo
 2  nmo  nmo 1
Valoarea modală (Mo) (5)

Starea civilă ni
Casătorit 70
Valoarea modală este varianta:
Necăsătorit 55 “căsătorit”
Divorţat 12
Văduv 13

Total 150
Problemă rezolvată

• Determinați modul pentru urmatoarea distributie:

Numărul
de țigări ni xi xi ni
pe zi
0-5 8 2.5 20
5-10 2 7.5 15
10-15 2 12.5 25
15-20 1 17.5 17.5
20-25 2 22.5 45
Total 15 - 122.5
1 Intervalul modal => nmo 8 [0;5]
Mo  x0  k
1   2
x0  0

Numărul 1  nmo  nmo1


de țigări ni xi xi ni
pe zi
0-5 8 2.5 20nmo  8
nmo 1  0
5-10 2 7.5 15
10-15 2 12.5 251  nmo  nmo 1  8  0 8
15-20 1 17.5 17.5
20-25 2 22.5 45  2  nmo  nmo1
Total 15 - 122.5
nmo  8
2  8  2  6
nmo 1  2
1
Mo  x0  k
1   2

x0  0 1  8 2  6 k  50  5

8
Mo  0  5
86

M o  2.86tigari / zi

Cei mai multi dintre studenti fumeaza aproximativ 3 tigari pe zi.


Mediana (Me) (1)

• Avantaj: Spre deosebire de medii, Me nu este aşa de


influenţată de apariţia valorilor extreme
• Mod de calcul pentru o serie simplă de date:
1. Se ordonează crescător seria de date
2. Se calculează poziţia (locul) Medianei
n 1
1

locMe  ( ni )  1 
2 2

3. În funcţie de forma datelor disponibile vom avea următoarele
moduri de calcul:
Mediana (Me) (2)

• Pentru un şir simplu de valori:


• cu un număr impar de termeni
• Me este valoarea de rang locMe din şirul obţinut la pasul 2
• cu un număr par de termeni
• Nu există un termen central. Me se calculează ca o medie aritmetică simplă a
termenilor centrali
Mediana (Me) (3)

• Pentru o serie de frecvenţe:


3. Se calculează frecvenţe cumulate crescător (Fi) :
• Fi oferă răspunsul la întrebarea: “Câte cazuri ale variabilei xi sunt cel mult egale cu
varianta curentă?”
4. Mediana este prima variantă pentru care este adevărată relaţia:

Fi  locMe
Mediana (Me) (4)

• Pentru o serie de date grupate pe intervale:


3. Se calculează frecvenţe cumulate crescător (Fi) :
• Fi oferă răspunsul la întrebarea: “Câte cazuri ale variabilei xi sunt cel
mult egale cu limita superioară a intervalului curent?”
4. Se alege intervalul ce conţine mediana ca fiind primul interval
pentru care este valabilă relaţia:

Fi  locMe
5. În interiorul intervalului ce conţine mediana, formula de calcul este:

locMe  Fi 1
Me  x0  k
nMe
Mediana (5)

• Mediana face parte din indicatorii cuantilici


• Alţi indicatori cuantilici sunt:
• Cuartilele sau quartilele (împart o serie de date în 4)
• decilele (împart o serie de date în 10)
• percentilele (procentilele) (împart o serie de date în 100)
2. Indicatori de poziție

• Cuantilele
• Cuartilele sunt valorile variabilei care impart o serie de date în patru
părți egale fiecare reprezentând cate 25% sau o pătrime din volumul
eșationului.
Cuartilele (1)

• Mod de calcul pentru o serie simplă de date:


1. Se ordonează crescător seria de date
2. Se calculează poziţia (locul) cuartilelor

n 1 2(n  1) 3(n  1)
locQ1  locQ 2  locQ3 
4 4 4

3. În funcţie de forma datelor disponibile vom avea următoarele


moduri de calcul:
Cuartilele(2)

• Pentru un şir simplu de valori:


• cu un număr impar de termeni
• Q este valoarea de rang locQ din şirul obţinut la pasul 2
• cu un număr par de termeni
• Nu există un termen central. Q se calculează ca o medie aritmetică simplă a
termenilor centrali
Cuartilele(3)

• Pentru o serie de frecvenţe:


3. Se calculează frecvenţe cumulate crescător (Fi) :
4. Cuartila este prima variantă pentru care este adevărată relaţia:

Fi  locQ
Cuartilele(4)

• Pentru o serie de date grupate pe intervale:


3. Se calculează frecvenţe cumulate crescător (Fi) :
4. Se alege intervalul ce conţine cuartila ca fiind primul interval pentru
care este valabilă relaţia:

Fi  locQ
5. În interiorul intervalului ce conţine cuartila, formula de calcul este:

locQ  Fi 1
Q  x0  k
nQ
Problemă propusa spre rezolvare

• Determinați Q1 și Q3 pentru următoarea distribuție:

Numărul
de țigări ni xi xi ni
pe zi
0-5 8 2.5 20
5-10 2 7.5 15
10-15 2 12.5 25
15-20 1 17.5 17.5
20-25 2 22.5 45
Total 15 - 122.5
3. Indicatorii variabilității

• Amplitudinea variației – diferența de la valoarea maximă a variabilei


la valoarea minimă a variabilei
A  x max  x min

• Abaterea individuală

d i  xi  x
Indicatorii sintetici ai variaţiei (1)
Abaterea medie liniară
Definiţie: Media aritmetică a abaterilor individuale faţă de medie (di)
luate în valoare absolută

Pentru o serie cu repartiții de frecvenţe


Pentru o serie simplă de date: (au serie de date grupate) pe variante
sau pe intervale de grupare:

d
 x i x
n
d
 x  x n
i i

n i

Abaterea medie liniară are ca unitate de măsură, unitatea de măsură a


variabilei analizate.
Indicatorii sintetici ai variaţiei (2)

Dispersia sau momentul centrat de ordin 2

Definiţie: Media aritmetică a pătratelor abaterilor individuale faţă de


medie (di)

Pentru o serie de frecvenţe sau pentru o


Pentru un şir simplu de valori: serie de date grupate pe intervale de
grupare:

 xi  x 2
 x  x 2
 ni
s 
2
s 2
 i
n n i

Dispersia nu are unitate de măsură, ea fiind o mărime algebrică ce ajută


în determinarea abaterii medii pătratice (sau abaterea standard sau
deviația standard).
Indicatorii sintetici ai variaţiei (3)

Abaterea standard sau abaterea medie pătratică


Definiţie: este rădăcina pătrată a dispersiei.
s  s2
Proprietate: De obicei, între abaterea medie pătratică şi abaterea medie
liniară există următoarea relaţie:
4
d  s
5
Abaterea medie pătratică are ca unitate de măsură, unitatea de măsură
a variabilei analizate.
Indicatorii sintetici ai variaţiei (4)

Coeficientul de variaţie sau de omogenitate

Definiţie: Este o exprimare în cifre relative (vezi indicatorii simpli ai


împrăştierii) a abaterii standard

CV  100
s
Proprietăţi: x
• de obicei CV ia valori în intervalul [0;100]
• valori mici (apropiate de limita inferioară) ale indicatorului indică o serie
omogenă (media, mediana, valoarea modală sunt reprezentative)
• valori mari (apropiate de limita superioară) ale indicatorului arată o serie
eterogenă (neomogenă) (media, mediana, valoarea modală sunt
nereprezentative)
• pentru a considera o serie omogenă, teoria recomandă, ca valoarea
CV sa fie cel mult 30-35%
Sondajul statistic
Distribuția normală. Scorurile Z
Distribuția normală presupune ca o variabilă să aibă forma clopotului lui
Gauss (vezi figura de mai jos)
Scorurile Z reprezintă acele valori care determină probabilitatea cu care
găsim o valoare într-un interval de valori. Scorurile Z se determină asupra
unei variabile care are media egală cu 0 si dispersia constanta egală cu 1
Relații de calcul pentru sondajul statistic

SONDAJUL STATISTIC ALEATOR SIMPLU


VARIABILE CU DISTRIBUTII DE FRECVENTE
SONDAJUL STATISTIC CU REVENIRE SONDAJUL STATISTIC FARA REVENIRE
1) EROAREA MEDIE PROBABILA DE SELECȚIE(ABATEREA MEDIE PATRATICA A MEDIEI)
𝑠𝑥 𝑠𝑥 𝑛
𝑠𝑥 = 𝑠 = × 1 −
𝑛 𝑥
𝑛 𝑁
2) EROAREA MAXIMA(LIMITA) ADMISIBILA garatanta cu o probabilitate de 100(1-α)%
𝑠𝑥 𝑠𝑥 𝑛
∆𝑥 = 𝑧 × 𝑠𝑥 = 𝑧 × ∆ = 𝑧 × 𝑠 = 𝑧 × × 1 −
𝑛 𝑥 𝑥
𝑛 𝑁
3) INTERVALUL DE INCREDRE PENTRU MEDIA COLECTIVITATII GENERALE
- Pentru media colectivitatii totale
𝑥 − ∆𝑥 ≤ 𝜇 ≤ 𝑥 + ∆𝑥
- Pentru nivelul total al variabilei analizate
𝑁(𝑥 − ∆𝑥 ) ≤ 𝜇 ≤ 𝑁(𝑥 + ∆𝑥 )
Intervalul de incredere este garantat cu nivelul de incredere ales(100(1-α)%)
Problema rezolvată
• În scopul analizei capacității de cazare turistică dintr-o zonă montană, o
firmă efectuează un sondaj simplu aleator de volum 10% din populația
totală, obținând următoarele date sistematizate:

Capaciatea de cazare Număr de unități de cazare


Sub 40 5
40-60 8
60-120 20
120-140 15
140-180 12
180 si peste 10
Total 70
Cerințe
A. Să se determine capacitea medie de cazare în eșantion și să se
precizeze dacă valoarea medie obținută este reprezentativă pentru
populația totală
B. Să se estimeze limitele în care se va situa capacitatea medie de cazare
în colectivitatea generală cu probabilitate de 95% (z=1,96) în ipoteza
sondajului:B1. cu revenire; B2. fără revenire
Cerințe
A. Să se determine capacitea medie de cazare în eșantion și să se
precizeze dacă valoarea medie obținută este reprezentativă pentru
populația totală
Rezolvare A

Indicatorul pe care trebuie sa il determinam este coeficientul


CV  100
de variatie. s
x
Pentru a determina media trebuie sa determina valoarea
minima si maxima a variabilei.
Astfel, pentru primul interval ”Sub 40” vom calcula mai intai
marimea intervalului imediat apropiat lui ”40-60” fiind 60-
40=20. Marimea intervalului este 20 si vom scadea din limita
superioară a intervalului ”Sub 40” rezultand o limită inferioare
de 20.
La se procedează și cu ultimul interval se determina mărimea
intervalului imediat apropiat 180-140=40 si va adauga limitei
inferioare 180+40=220. Deci ultimul interval va fi 180-220.
Rezolvare A

Astfel vom putea calcula media = 117,43 locuri de


cazare/unitate turistică

Xinf Xsup Xi ni xi*ni


20 40 30 5 150
40 60 50 8 400
60 120 90 20 1800
120 140 130 15 1950
140 180 160 12 1920
180 220 200 10 2000
8220
• Pentru a determinat abaterea medie patratică trebuie sa determinam
dispersia

Xi ni Xi- x (Xi- x )2 *ni


77.5 5 -87.43 38218.78
204 8 -67.43 36372.9
910 20 -27.43 15046.53
982.5 15 12.57 2370.612
966 12 42.57 21747.92
1005 10 82.57 68180.41
Total 70 181937.1

 x  x  2
 ni 181937,1
s 2
 i
  2599,1
n i 70
Asadar media este 117,43 locuri de cazare/unitate turistică,
iar abaterea medie patratica este radical din dispersie deci 50,98
locuri/unitate de cazare

CV  100  100  0,434 *100  43,4%


s 50,98
x 117,43

Coeficientul de variație este de 43,4% si deci mai marea ca 30%


media nu este reprezentativă pentru populația generală.
Cerințe
A. Să se determine capacitea medie de cazare în eșantion și să se
precizeze dacă valoarea medie obținută este reprezentativă pentru
populația totală
B. Să se estimeze limitele în care se va situa capacitatea medie de cazare
în colectivitatea generală cu probabilitate de 95% (z=1,96) în ipoteza
sondajului:B1. cu revenire; B2. fără revenire
Rezolvare B1.

• Pentru aceasta trebuie determinat intervalul de incredere


𝑥 − ∆𝑥 ≤ 𝜇 ≤ 𝑥 + ∆𝑥

𝑠 50,98
∆𝑥 = 𝑧 ∗ 𝑠𝑥 = 𝑧 ∗ = 1,96 ∗ = 11,94 loc/unit de cazare
𝑛 70

• 117,43-11,94=105,49 și 117,43+11,94=129,37
• Media populatiei va fi intre 105,49 locuri de cazari si 129,37 locuri de
cazare garantat cu 95% probabilitate.
Rezolvare B2.

• Pentru aceasta trebuie determinat intervalul de incredere

𝑥 − ∆𝑥 ≤ 𝜇 ≤ 𝑥 + ∆𝑥

𝑠 𝑛 50,98
∆𝑥 = 𝑧 ∗ 𝑠𝑥 = 𝑧 ∗ 1 − = 1,96 ∗ 1 − 0,1
𝑛 𝑁 70
= 11,94 ∗ 0,95 = 11,343

• 117,43-11,343=106,087 și 117,43+11,343=128,773
• Media populatiei va fi intre 106,087 locuri de cazari si 128,773 locuri de
cazare garantat cu 95% probabilitate.
PARTEA III
Legatura dintre variabile
Coeficientul de corelatie

• Arata cat directia si intensitatea legaturii dintre doua variabile


• Intotdeauna ia valori intre [-1;1]
• Exista mai multe tipuri de coeficienti de corelatie in functie de tipul
de legatura dintre variabile: a) coeficient de corelatie parametrica
(coeficientul al lui Pearson) si b) coeficient de corelatie
neparametrica (coeficientul lui Kendall)
Coeficient de corelatie parametrica
Coeficientul lui Pearson
PARTEA IV
Serii de timp
Serii de timp

• O serie de timp este acea variabila care este inregistrata in timp (an,
luna, zi, ora, minut, trimestru etc)
• Seria de timp se reprezinta grafic cu ajutorul graficului linie
• Se noteaza cu 𝑦𝑡 unde t reprezinta timpul

Evolutia cursului de schimb EURO-Leu
Indicatori individuali

Indicatori absoluti
Valoarea absoluta a unui procent
Modificarea absoluta
din ritm

𝑦𝑡 𝑦𝑡−1
∆𝑡Τ1 = 𝑦𝑡 − 𝑦1 ∆𝑡Τ𝑡−1 = 𝑦𝑡 − 𝑦𝑡−1 𝐴 𝑡 Τ1 = 𝐴𝑡Τ𝑡−1 =
𝑦1 100

Indicatori relativi
Ritmul
Indicele
R=(I-1)x100

𝐼𝑡Τ1 𝐼𝑡Τ𝑡−1
𝑅𝑡Τ1 𝑅𝑡Τ𝑡−1
𝑦𝑡 𝑦𝑡
= = = (𝐼𝑡Τ1 −1) × 100 = (𝐼𝑡Τ𝑡−1 −1) × 100
𝑦1 𝑦𝑡−1
Indicatorii seriilor de timp
• Indicatori individuali – arata modificarile de la un an la altul
• Indicatori medii – arata modificarile intr- o perioada de timp
O companie a produs in anul 2016 in lunile ianuarie-septembrie urmatoarele cantitati:

Luna Cantitatea produsa

1 110
2 106
3 120
4 119
5 145

a) Sa se reprezinte grafic seria cronologica.


b) Sa se determine indicatorii seriei cronologice.
Rezolvare

a) Indicatorii seriei de timp (absoluti : modificarea absoluta,valoarea absoluta a unui procent din ritm; relativi:indicele, ritmul; medii: nivelul mediu,
modificarea medie absoluta, indicele mediu, ritmul mediu)
(mii bucati)
Cantitatea
produsa
Luna

Valoarea absoluta a unui procent Ritmul (%)


Modificarea absoluta Indicele
din ritm R=(I-1)x100

(0) (1) (2) (3) (4) (5) (6) (7) (8) (9)

𝐴𝑡 Τ1 𝑦𝑡−1 𝑦𝑡 𝑦𝑡
𝑡 𝑦𝑡 ∆𝑡 Τ1 = 𝑦𝑡 − 𝑦1 ∆𝑡 Τ𝑡−1 = 𝑦𝑡 − 𝑦𝑡−1 𝑦1 𝐴𝑡 Τ𝑡−1 = 𝐼𝑡 Τ1 = 𝐼𝑡 Τ𝑡−1 = 𝑅𝑡 Τ1 = (𝐼𝑡 Τ1 − 1) × 100 𝑅𝑡 Τ𝑡−1 = (𝐼𝑡 Τ𝑡−1 − 1) × 100
= 100 𝑦1 𝑦𝑡−1
100
Fixa Lant Fixa Lant Fixa Lant Fixa Lant
1 110 0 - 1.1 - 1 - 0 -
2 106 -4 -4 1.1 1.1 0.96 0.96 -4 -4
3 120 10 14 1.1 1.06 1.09 1.13 9 13
4 119 9 -1 1.1 1.2 1.08 0.99 8 -1
5 145 35 26 1.1 1.19 1.32 1.22 32 22
Spor la invatat!

S-ar putea să vă placă și