Documente Academic
Documente Profesional
Documente Cultură
curs 13-14
Analiza descriptiva a seriilor
cronologice (SCR)
Terminologie şi clasificări
Dacă datele statistice sunt longitudinale, adică dacă variabila
este măsurată în timp, în ordine secvenţială, atunci, în urma
sistematizării, se obţine o serie de timp, numită şi serie
cronologică de tipul:
1 2 ... 𝑡 ... 𝑛 𝒕
= 𝒚 , 𝑡 = 𝟏, 𝒏,
𝑦1 𝑦2 ... 𝑦𝑡 ... 𝑦𝑛 𝒕
Unde:
● ● ● ● ● ● ● ● ● ●
t
● ● ● ● ● ● ● ● ● ●
t
Terminologie şi clasificări
b) În raport cu distanţa dintre termenii SCR
1. SCR de perioade egal distanţate
5
Indicatorii SCR
• Pentru caracterizarea unei serii de timp, se calculează, pe
baza termenilor acesteia, un sistem de indicatori statistici,
analitici şi sintetici care, după modul de calcul şi exprimare,
pot fi structuraţi astfel:
A. Absoluti
B. Relativi
C. Medii
• Indicatorii pot fi primari sau derivaţi; indicatorii derivaţi
se calculează, de regulă, prin comparare, sub formă de
diferenţă sau de raport.
• Atunci când compararea se face cu primul termen al
seriei (y1), vom vorbi de indicatori cu bază fixă, iar atunci
când compararea unui termen (yt) se face cu termenul
imediat anterior (yt-1), vom vorbi de indicatori cu bază în
lanţ (mobilă).
n
yt
Indicatorii SCR – Indicatori absoluți
t =1
.
𝑦𝑡 , 𝑡 = 1, 𝑛
reprezentaţi valorile individuale ale variabilei, în expresie
absolută. Acest indicator redă nivelul fenomenului analizat
la fiecare unitate de timp considerată.
2) Nivelul agregat al seriei (doar pentru SCR de flux)
𝑛
𝑦𝑡
𝑡=1
𝛥𝑡/1 = 𝑦𝑡 − 𝑦1 (𝑡 = 1, 𝑛)
- nivelul imediat anterior (yt-1) şi se obţin modificări
absolute cu bază în lanţ
𝛥𝑡/𝑡−1 = 𝑦𝑡 − 𝑦𝑡−1 (𝑡 = 2, 𝑛)
• are unitatea de măsură a variabilei şi arată cu câte
unităţi s-a modificat termenul comparat faţă de termenul
bază de comparaţie.
• dacă 𝛥 > 0, atunci a avut loc o creştere, iar dacă 𝛥 < 0,
atunci a avut loc o descreştere.
8
Indicatorii SCR – Indicatori absoluți
Astfel:
• Suma modificărilor absolute cu bază în lanţ este egală
cu modificarea absolută cu bază fixă a ultimului termen
σ𝑛𝑡=2 𝛥𝑡/𝑡−1 = 𝑦2 − 𝑦1 + 𝑦3 − 𝑦2 +. . . + 𝑦𝑛 − 𝑦𝑛−1 =
= 𝑦𝑛 − 𝑦1 = 𝛥𝑛/1
9
Indicatorii SCR – Indicatori relativi
1. Indicele de dinamică (numit şi indice de
creştere/descreştere)
11
Indicatorii SCR – Indicatori relativi
2. Ritm de dinamică (modificarea relativă)
• arată cu câte procente s-a modificat variabila, faţă de
nivelul bază de comparaţie.
- dacă nivelul ales bază de comparaţie este primul
termen al seriei se obţine ritmul de modificare cu
bază fixă:
%
𝛥𝑡/1 𝑦𝑡 − 𝑦1
𝑅𝑡/1 = ∙ 100 = ∙ 100 = (𝐼𝑡/1 − 1) ∙ 100
𝑦1 𝑦1
- dacă nivelul bază de comparaţie este cel al perioadei
imediat anterioară, obţinem ritmul de modificare cu
bază în lanţ:
%
𝛥𝑡/𝑡−1 𝑦𝑡 − 𝑦𝑡−1
𝑅𝑡/𝑡−1 = ∙ 100 = ∙ 100 = (𝐼𝑡/𝑡−1 − 1) ∙ 100
𝑦𝑡−1 𝑦𝑡−1
• Indicatorul se exprimă întotdeauna procentual şi poate fi
pozitiv, negativ sau egal cu zero.
• Dacă ritmul de dinamică are valori pozitive atunci a avut
loc o creştere a fenomenului, iar dacă el are valori
negative s-a înregistrat o scădere a fenomenului. 12
Indicatorii SCR - INDICATORI MEDII
1. Nivelul mediu al seriei
𝑛−1 𝑛−1
𝐼= ς𝑛𝑡=2 𝐼𝑡/𝑡−1 = 𝑛−1
𝐼𝑛/1 = 𝑦𝑛 /𝑦1
!!! Pentru ca indicele mediu de dinamică să fie reprezentativ, este necesar ca toţi
termenii din care se calculează să fie omogeni, adică indicii de dinamică cu bază în
lanţ să aibă valori apropiate, cerinţă cu atât mai necesară cu cât se observă că
indicatorul se poate calcula doar cu ajutorul termenilor extremi ai seriei.
15
Indicatorii SCR - INDICATORI MEDII
16
Exemplul 1
Producţia de ouă a unei microferme avicole ecologice, în
perioada 2014-2022:
Volumul producţiei
Anul
(mii bucăţi)
2014 80
2015 95
2016 100
2017 115
2018 128
2019 120
2020 125
2021 130
2022 132
PENTRU
ATENTIE
STATISTICĂ
curs 11-12
Prezentarea şi caracterizarea
descriptivă a datelor statistice bivariate
Prezentarea datelor bivariate
Seriile statistice de date bivariate sunt formate prin
considerarea concomitentă a două variabile
numerice sau nenumerice (X şi Y).
Variabila X Variabila Y
x1 y1
x2 y2
… …
xi yi
…. ….
xn yn
Prezentarea datelor bivariate
Cel mai frecvent aceste tipuri de date se sistematizează într-un
tabel de contingenţă (crosstab), sub forma unei serii de distribuţie
bidimensională:
Intervale/variante
pentru
Y y1 y2 ... yj ... ym Total
Intervale/
variante pentru X
x1 n11 n12 ... n1j ... n1m n1.
x2 n21 n22 ... n2j ... n2m n2.
. ................... ...
. ................... ...
xi ni1 ni2 ... nij ... nim n i.
. .................... ...
. ................... ...
xr nr1 nr2 ... nrj ... nrm n r.
Total n.1 n.2 .... n.j ... n.m n
3
Prezentarea datelor bivariate
• xi, 𝑖 = 1, 𝑟reprezintă valorile, variantele sau centrele de interval
stabilite prin sistematizarea datelor după variabila X
𝑛𝑖⋅ = σ𝑚
𝑗=1 𝑛𝑖𝑗
5
Prezentarea datelor bivariate
Clasele lui Y
Clasele lui X TOTAL
Y (y1) nonY (y2)
X (x1) n11 n12 n1. = n11 + n12
nonX (x2) n21 n22 n2. = n21 + n22
TOTAL n.1 = n11 + n21 n.2 = n12 + n22 n.. = n11 + n12+n21+n22
6
Prezentarea datelor bivariate
Exemplu
• Distribuţia asiguraţilor unei companii de asigurări în funcţie de
gen şi şi statutul marital, în anul 2008 a fost:
7
Reprezentarea grafică a datelor bivariate
8
Reprezentarea grafică a datelor bivariate
Înălţimea (cm) 168 175 155 180 165 160 185 172 150 145
Nr. purtat la
36 38 35 39 36 35 38 39 35 34
încălţăminte
40
39
Nr. purtat la încălţăminte
38
37
36
35
34
33
140 145 150 155 160 165 170 175 180 185 190
Înălţimea (cm) 9
Reprezentarea grafică a datelor bivariate
Forma de distribuire a punctelor pe grafic oferă informaţii
privind:
a) b) c)
a) existenţa; b) c) inexistenţa legăturii
10
Reprezentarea grafică a datelor bivariate
11
Reprezentarea grafică a datelor bivariate
Legătură neliniară
12
Tipuri de legături statistice
13
Tipuri de legături statistice
• Dacă două variabile se modifică similar se spune
despre ele că sunt corelate.
• Nu întodeauna între cele două variabile corelate
există o relaţie de tip cauză-efect.
• Este posibil ca o relaţie de cauzalitate să existe,
dar este posibil ca ambele variabile să se modifice
în pas cu o a treia variabilă.
Exemplu
Vânzările de ochelari de soare şi numărul vizitatorilor unui oraş
turistic în luna iulie cresc, amândouă, foarte accentuat. Creşterea
vânzărilor de ochelari de soare nu determină un număr mai mare de
turişti şi nici viceversa (să ne gândim de pildă la ce s-ar întâmpla în
luna noiembrie, când turiştii şi-ar cumpăra umbrele de ploaie). În
schimb, amândouă variabilele sunt corelate cu vremea însorită din
luna iulie. 14
Tipuri de legături statistice
15
Tipuri de legături statistice
16
Metode de analiză a legăturilor statistice
B. Metode neparametrice
3. Coeficientul de asociere Yule (pentru variabile binare)
4. Coeficientul de corelaţie al rangurilor Spearman
5. Coeficientul de corelaţie al rangurilor Kendall
19
COVARIANȚA
20
COVARIANŢA
21
COVARIANŢA
22
COVARIANŢA
n n n n
(x - x )(y - y ) n x y − x y
i =1
i i
i =1
i i
i =1
i
i =1
i
cov(x,y) = s xy = = 2
n n
• Covarianţa este pozitivă dacă legătura dintre variabile
este directă şi negativă, dacă legătura dintre variabile
este inversă.
• Dacă covarianţa este zero, acest lucru implică lipsa
legăturii între variabile, sau, cel puţin, lipsa legăturii
liniare.
• Covarianţa poate lua valori oricât de mari, fiind greu de
interpretat şi comparat.
• Covarianţa arată sensul legăturii, nu şi intensitatea ei.23
2. Coeficientul de corelaţie
cov(x, y ) s xy ( x − x)( y − y)
i i
rxy = = = i =1
sx s y sx s y n n
2
i − i −
2
( x x ) ( y y )
i=1 i=1
n
n n
n xi yi − xi yi
rxy = i =1 i =1 i =1
n 2 n n 2 n
2
2
n xi − xi n yi − yi
i =1 i =1 i =1 i =1
25
2. Coeficientul de corelaţie
26
Exemplu
Un producător din industria uşoară doreşte să afle dacă numărul
purtat la încălţăminte de femei şi înălţimea acestora există o legătură.
Pentru aceasta, au fost înregistrate date referitoare la cele două
variabile pentru un eşantion de 10 femei
(x
n
cov( 𝑥, 𝑦) 19,35
𝑟𝑥𝑦 = = = 0,806
𝑠𝑥 𝑠𝑦 13,041 ∗ 1,841
28
Exemple
33
Exemplu
34
Corelaţia rangurilor
6 σ𝑛𝑖=1 𝑑𝑖2
𝑟𝑆 = 1 − 2
, 𝑟𝑆 ∈ −1,1
𝑛 𝑛 −1
36
6. Coeficientul de corelaţie al rangurilor Kendall
unde:
S = P – Q, P = Σpi, Q =Σqi
37
Exemplu
Pentru 6 salariaţi care au urmat un curs de perfecţionare au fost
înregistrate date privind calificativul obţinut şi productivitatea
muncii (buc/h):
Calificativ Calificativ
(X) (Y)
Forte bine 15
Bine 16
Foarte bine 14
Suficient 13
Insuficient 12
Bine 13
38
Exemplu
Pentru 6 salariaţi care au urmat un curs de perfecţionare au
fost înregistrate date privind calificativul obţinut şi
productivitatea muncii (buc/h):
Rx Ry Di qi
1,5 2 -0,5 0,25
3,5 1 2,5 6,25
1,5 3 -1,5 2,25
5 4,5 0,5 0,25
6 6 0 0
3,5 4,5 -1 1
0 10
rs=1-(6*10)/(6*35)=0, 71
39
Exemplu
Rx Ry pi qi
1,5 2 4 1
1,5 3 3 1
3,5 1 3 0
3,5 4,5 1 0
5 4,5 1 0
6 6 0 0
P=12 Q=2
rK=2(12-2)/(6*5)=0,667
40
1. Pentru un eșantion de 432 de familii, pentru care s-au înregistrat și prelucrat datele privind veniturile
(mii lei), s-au obținut rezultatele: venitul mediu=5,6 mii lei și dispersia=2,8. Pentru o probabilitate de
95% (z=1,96), limita inferioară a intervalului de încredere pentru venitul mediu în întreaga colectivitate
din care a fost extras eșantionul este:
Rezolvare:
Răspuns:
Eroarea maximă admisă (eroarea limită, eroarea de estimație): ∆𝑥̅ = 0,37
3. Doriți să estimați durata de viață a unui tip de baterii pe un interval de încredere de 114 de ore
(𝐿 = 2 ∙ ∆𝑥̅ = 114 → ∆𝑥̅ = 57), cu o probabilitate de 95% (z= 1,96). Studiile anterioare indică o abatere
standard pentru durata de funcționare de 271 de ore. Eșantionul trebuie să conțină: n=?
Răspuns:
𝑧𝛼2⁄2 ∙ 𝑠2
𝑛=
∆2𝑥̅
𝑛 = 86 baterii
4. În urma unui studiu efectuat pe n = 600 din cei 2400 de studenți ai unei facultăți din ASE a rezultat că
84 dintre ei provin din licee cu profil economic. În ipoteza unei selecții cu revenire, pentru o probabilitate
de 95%, limita superioară a intervalului de încredere pentru proporția studenților din întreaga facultate care
au absolvit licee economice este:
a. 0,0123
b. 0,0142
c. 0,0278
d. 0,1258
e. 0,1678
Rezolvare:
(variabilă alternativă)
N=2400 studenți
n=600 studenți
𝑚 84
𝑓= = = 0,14 (media în eșantion)
𝑛 600
𝑃 = 95% → 𝛼 = 5% → 𝑧𝛼 = 1,96
2
Selecție cu revenire
Eroarea standard (eroarea medie probabilă):
𝑓 ∙ (1 − 𝑓 ) 0,14 ∙ 0,86
𝑠𝑓 = √ =√ = 0,0142
𝑛 600
Eroarea maximă admisă (eroarea limită, eroarea de estimație):
∆𝑓 = 𝑠𝑓 ∙ 𝑧𝛼 = 1,96 ∙ 0,0142 = 0,0278
2
Intervalul de încredere:
𝑓 − ∆𝑓 ≤ 𝑝 ≤ 𝑓 + ∆𝑓 ↔ 0,14 − 0,0278 ≤ 𝑝 ≤ 0,14 + 0,0278 ↔ 0,1122 ≤ 𝑝 ≤ 0,1678 ↔ (11,22% ÷ 16,78%)
curs 10
Estimarea parametrilor pe interval de încredere
SONDAJUL STATISTIC
1. Sondajul statistic
Cercetarea statistică se poate desfăşura în 2
modalităţi:
• cercetare statistică totală;
Când realizam o cercetare statistică totală descriem
colectivitatea printr-un sistem de indicatori statistici
numiţi parametrii. Aceştia sunt obţinuţi cu o
probabilitate de 100%.
• cercetare statistică parţială – a unui eşantion
reprezentativ;
Când apelăm la un eşantion parcurgem două etape:
➢ etapa descriptivă;
➢ etapa inferenţială.
Cercetare statistică parţială
σ 𝑥𝑖 −𝜇 2
𝜎2 = , dispersia
𝑁
σ 𝑥𝑖 −𝑥ҧ 2
𝑠2 = , dispersia
𝑛−1
!!! Un indicator obţinut pentru un eşantion este o estimaţie a
parametrului.
Modelul de bază folosit în sondajul statistic – selecţia
aleatoare simplă → numărul eşantioanelor diferite ce se
pot extrage dintr-o colectivitate de volum N este 𝑵𝒏 .
Cercetarea statistică prin sondaj - avantaje
Avantaje:
➢ costuri mai mici
➢ erori de observare reduse
➢ un plan al cercetării care poate fi mai amplu
➢ posibilitatea utilizării atunci când cercetarea conduce
la distrugerea obiectului cercetat.
Dezavantaje:
Principalul dezavantaj este că întotdeauna vom avea erori
de reprezentativitate. Asta înseamnă că un eşantion nu
poate imita perfect situaţia din colectivitatea generală decât
în mod cu totul întâmplător. Însă dacă vom cunoaşte
distribuţia variabilei aleatoare, media de selecţie, vom
putea măsura erorile de reprezentativitate, le vom putea
diminua şi ţine sub control.
Inferența statistică
6
Inferența statistică
• Inferenţa statistică este procesul prin care
formulăm concluzii despre populaţia statistică, pe
baza indicatorilor calculaţi în eşantion
𝑠𝑥2
• 𝑠𝑥2 =
𝑛
9
Inferența statistică
𝑠𝑥2 𝑠𝑥
𝑠𝑥 = =
𝑛 𝑛
10
Inferența statistică
2. Eroarea maximă admisă
𝑠𝑥
𝛥𝑥 = 𝑧𝛼/2 ∙ 𝑠𝑥 = 𝑧𝛼/2 ∙
𝑛
11
Inferența statistică
• Intervalul de încredere pentru media 𝝁
𝑠
𝑥 ± 𝑧𝛼/2 ∙
𝑛
15
ALEGEREA VOLUMULUI EŞANTIONULUI
Volumul eşantionului pentru sondaj aleator simplu repetat
16
ALEGEREA VOLUMULUI EŞANTIONULUI
𝑠𝑥 𝑠𝑥 𝐿
• 𝑧𝛼/2 ⋅ = 𝛥𝑥 sau 𝑧𝛼/2 ⋅ = .
𝑛 𝑛 2
17
ALEGEREA VOLUMULUI
EŞANTIONULUI
(z / 2 ) 2 s 2x 4(z / 2 ) 2 s 2x
n= n=
2x sau L2
• sx2 se foloseşte ca o estimaţie a lui x , în general necunoscută.
2
s x Ax / 4
(pentru o distribuţie cu tendinţă de normalitate aproximativ 95% din observaţii se
încadrează într-un interval de 4 ori abaterea standard, iar aproximativ 99,73% din
observaţii sunt cuprinse într-un interval de 6 ori abaterea standard)
18
Exemplu
Vacanţa de iarnă este perioada cea mai importantă pentru
activitatea de schi, deoarece mulţi copii, studenţi şi adulţi sunt
dispuşi să-şi petreacă un timp considerabil la munte, practicând
acest sport. Pentru a-şi dimensiona activitatea, managerul unei staţii
de telecabine doreşte să estimeze timpul mediu de aşteptare la
staţie pentru clienţi, de la sosire până la servire. Dintr-o cercetare
anterioară, el ştie că timpul de aşteptare are o distribuţie
aproximativ normală, cu o abatere medie pătratică 𝑠𝑥 =18 min.
Câţi clienţi trebuie să selecteze pentru a estima timpul mediu de
aşteptare, cu o probabilitate de 95%, pe un interval de încredere cu
o lungime de 10 minute (±5 minute)?
19
Cercetarea statistică prin sondaj
Paşii pentru determinarea intervalului de încredere pentru
medie sunt următorii (selecţie aleatoare simplă repetată,
variabilă numerică):
1. Pentru eşantionul cu care lucrăm calculăm: 𝑥,ҧ 𝑠 2
2. Determinăm eroarea medie probabilă de
𝑠2
reprezentativitate: 𝑠𝑥ҧ = 𝑠𝑥2ҧ =
𝑛
3. În funcţie de probabilitatea dorită vom determina
eroarea maximă admisibilă: Δ𝑥ҧ = 𝑧𝛼Τ2 𝑠𝑥ҧ , unde
𝑧=argumentul funcţiei de repartiţie;
4. Parametrul 𝜇 necunoscut se situează pentru
probabilitatea dorită în următorul interval:
𝑥ҧ − Δ𝑥ҧ ≤ 𝜇 ≤ 𝑥ҧ + Δ𝑥ҧ
5. Nivelul total al variabilei va fi cuprins între
𝑁(𝑥ҧ − Δ𝑥ҧ ) ≤ 𝜇 ≤ 𝑁(𝑥ҧ + Δ𝑥ҧ )
☺ Temă
Un analist doreşte să estimeze cheltuiala medie şi
totală pe familie, făcută într-o localitate pentru
procurarea unui produs lunar.
În acest scop din cele 14.520 familii selectează un
eşantion de 100 familii pentru care calculează
𝑥 ҧ = 430 𝑙𝑒𝑖 și 𝑣 = 36%.
Pentru o 𝑃 = 95% să se determine intervalul de
încredere pentru cheltuiala medie a familiei.
STATISTICĂ
curs 8-9
Analiza descriptiva a seriilor de date univariate
1. Media si dispersia unei variabile alternative
2. Regula de compunere a variabilității totale
3. Regula empirică a lui Cebîșev
4. Scoruri z
5. Forma distribuției
Media şi dispersia unei variabile de tip alternativ
2
Media şi dispersia unei variabile de tip alternativ
x n
i =1
i i
1 m + 0(n − m ) m
x= = = = f
n n n
• Dispersia este:
s 2
= s 2f =
(1 − f )2 m + (0 − f )2 (n − m)
= (1 − f )2 f + f 2 (1 − f ) = f (1 − f )(1 − f + f )
n
s 2f = f (1 − f )
3
Regula de compunere a variabilităţii
Pentru adecvarea promoţiilor la cadourile de sărbători, un
magazin realizează un studiu referitor la veniturile
clienţilor, nivelul sumelor pe alocate pentru cadouri,
categoria socio-profesională.
Datele referitoare la cheltuielile pentru cadouri, înregistrate
pentru 14 clienţi, sunt:
6,5 2,5 3 3,2 2,2 2,3 3 5 4 5,5 6,5 8 2 7
media 4,34
dispersia 4,17
abaterea standard 2,04
Coeficientul de variatie 47%
4
Regula de compunere a variabilităţii
Deoarece seria are un grad redus de omogenitate, clienţii
au fost împărţiţi în 2 grupe, în funcţie de categoria
socio-profesională astfel:
Dacă o serie statistică de volum n este alcatuita din m grupe, pentru fiecare grupă de
m
volum ni , i = 1, m ( n = ni ) se pot determina mediile ( x i ) şi dispersiile ( si ) astfel:
2
i =1
n1 j =1
Grupa 2 x21 , x22 , , x2 n2 ( )
n2
n2 1 1 n2
x x2 j − x 2
2
x2 = s = 2
n2 − 1 j =1
2j 2
n2 j =1
Grupa i xi1 , xi 2 , , xini 1 ni
( )
ni
ni xi =
1
xij s = 2
xij − xi
2
ni − 1 j =1
i
ni j =1
Grupa m xm1 , xm 2 ,, xmnm 1 nm
( )
nm
nm 1
xmj − x m
x
2
xm = s = 2
nm − 1 j =1
mj m
nm j =1
7
Regula de compunere a variabilităţii
( ) (
xij − x = xij − x i + x i − x )
unde:
1 m ni 1 m
x = xij = x i ni
n i =1 j =1 n i =1 este media totală a seriei.
(x ) ( ) ( )
m ni m ni m
= xij − x i + x i − x ni
2 2 2
−xij
i =1 j =1 i =1 j =1 i =1
variatia totala variatia din interiorul grupelor variatia dintre grupe
8
Regula de compunere a variabilităţii
Se notează:
(x )
m ni
2
ij −x
SST= i =1 j =1 variatia totala sau variabilitatea totala, adica
suma patratelor abaterilor individuale de la media totala a seriei
(sum of total squares).
( )
m ni
2
x ij − xi
SSW= i =1 j =1 variatia din interiorul grupelor , adica
suma patratelor abaterilor individuale de la mediile de grupă (sum of
squares within groups).
(x − x ) n
m
SSB=
2
i
i =1
i
variatia dintre grupe , adica suma patratelor
abaterilor mediilor de grupă de la media totală (sum of squares
between groups).
9
Regula de compunere a variabilităţii
SSB
R2 = *100
SST
10
Regula de compunere a variabilităţii
SSW
K =
2
= 1− R2 K %2 =
SSW
100 = 100 − R%2
SST SST
11
Exemplu
(x ) = (x ) ( )
2 ni 6 8 2
− x1 + x2 j − x 2 = si2 (ni − 1) =
2 2 2
ij − xi 1j
i =1 j =1 j =1 j =1 i =1
SSW=
= si2 (ni − 1) = s12 (n1 − 1) + s22 (n2 − 1) = 1.11 + 18.97 = 20.08
şi
(x − x) n = (2.5 − 4.34)
2
SSB=
2
i i
2
6 + (5.69 − 4.34) 2 8 = 34.11
i =1
SST=54,19
SSB
R2 = 100 = 63%
SST
12
Exemplu
Pensionari Salariati
x1 j (x 1j − x1 )
2
x2 j (x 2j − x2 )
2
2 0,28 3 7,22
2,5 0,00 5 0,47
3 0,22 4 2,85
3,2 0,44 5,5 0,04
2,2 0,11 6,5 0,66
2,3 0,05 8 5,35
6,5 0,66
7 1,72
(x ) (x )
6 8
2 2
Total 1j − x1 = 1,11 2j − x2 = 18,97
j =1 j =1
13
Regula empirică lui Cebîşev
Abaterea standard oferă şi informaţii privind modul de
distribuţie şi de împrăştiere a valorilor într-o serie de
distribuţie de frecvenţe aproximativ normală
Regula empirică lui Cebâşev, evidenţiată în cazul
distribuţiilor cu tendinţă de normalitate (moderat
asimetrice), afirmă că:
• aproximativ 68% din valori se situează în intervalul 𝜇 ± 𝜎,
adică la cel mult o abatere standard faţă de medie
𝜇 − 𝜎, 𝜇 + 𝜎 ;
• aproximativ 95% din valori se situează în intervalul 𝜇 ±
2𝜎, adică la cel mult două abateri standard faţă de medie
𝜇 − 2𝜎, 𝜇 + 2𝜎 ;
• aproximativ 99,8% din valori se situează în intervalul𝜇 ±
3𝜎, adică la cel mult trei abateri standard faţă de
medie 𝜇 − 3𝜎, 𝜇 + 3𝜎 .
Exemplu
Proprietarul unui restaurant ştie că distribuţia
încasărilor este aproximativ normal distribuită, în medie
de 20 Euro pentru un client şi o abatere standard de 7
Euro.
Dacă într-o lună restaurantul a avut 850 de clienţi, el
se aşteaptă ca:
• de la un număr aproximativ de 578 de clienţi
(0,68·850) să încaseze între 13 Euro (20 - 7) şi 27
Euro (20 + 7);
• de la un număr aproximativ de 807 clienţi (0,95·850),
să încaseze între 6 Euro (20 - 2·7) şi 34 Euro (20
+2·7);
• de la un număr aproximativ de 21 clienţi (0.025·850)
să încaseze mai puţin de 6 Euro, iar de la un număr
aproximativ de 21 clienţi să încaseze mai mult de 34
Euro.
Scorurile z
• Pentru compara variabile cu unităţi de măsură diferite se
recurge la transformarea datelor, operaţie numită
standardizarea variabilelor (calcularea scorurilor z).
• Scorul z reprezintă o modalitate de a exprima semnificaţia
unei anumite valori dintr-o serie de date în relaţie cu
parametrii distribuţiei (medie şi abatere standard).
• Scorul z reprezintă distanţa dintre o anumită valoare şi
medie, în unităţi ale abaterii standard:
xi − x xi −
z= z=
s
• Se obţine astfel o nouă variabilă, numită variabilă
standardizată, care are media zero şi dispersia unu.
• Dacă pentru o anumită unitate statistică scorul z are semnul ”-”
înseamnă că individul respectiv înregistrează o performanţă sub
medie, iar dacă scorul z are semnul „+” atunci individul are o
performanţă peste medie. 16
Regula empirică a lui Cebîşev
Frecvenţe relative
34% 34%
13,5% 13,5%
2,5% 2,5%
− 3 − 2 − + + 2 + 3
amplitudinea ≈ 4s
-3 -2 -1 0 1 2 3
scoruri z
17
Regula empirică a lui Cebîşev
• aproximativ 68% dintre observaţii înregistrează pentru
scorurile z valori cuprinse între -1 şi 1.
19
ASIMETRIA
• Asimetria (skewness, în engl.) unei serii de distribuţie de frecvenţe
se observă din reprezentarea grafică prin histogramă sau poligonul
frecvenţelor, prin modalitatea în care sunt situaţi, unul faţă de celălalt,
indicatorii tendinţei centrale.
• Relaţia existentă între valorile indicatorilor tendinţei centrale permite,
de asemenea, formularea unor aprecieri asupra oblicităţii distribuţiei.
20
ASIMETRIA
Pentru aprecierea intensităţii şi a sensului oblicităţii
unei variabile în eşantionul studiat se utilizează o
serie de indicatori/coeficienţi (notaţi CAS) specifici,
absoluţi şi relativi, bazaţi pe relaţia dintre indicatorii
tendinţei centrale, dintre indicatorii medii de poziţie,
precum şi pe indicatori ai variabilităţii:
𝑥−𝑀0 3 𝑥−𝑀𝑒
𝐶𝐴𝑆 = sau 𝐶𝐴𝑆 = ,
𝑠 𝑠
𝑄3 − 𝑀𝑒 − 𝑀𝑒 − 𝑄1 𝑄3 + 𝑄1 − 2𝑀𝑒
CAS𝑄 = =
𝑄3 − 𝑀𝑒 + 𝑀𝑒 − 𝑄1 𝑄3 − 𝑄1
𝑛 σ𝑛
𝑖=1 𝑥𝑖 −𝑥lj
3
• 𝐶𝐴𝑆 =
𝑛−1 𝑛−2 𝑠3
σ𝑛
𝑖=1 𝑥𝑖 −𝑥lj
2
unde 𝑠 = , coeficient implementat de cele
𝑛−1
distribuţie leptocurtică
distribuţie platicurtică
24
BOLTIREA/APLATIZAREA
• Coeficientul de boltire sau aplatizare (kurtosis) este o
măsură a împrăştierii fiecărei observaţii în jurul unei valori
centrale şi se determină, pe eşantion, cu formula:
𝑛 𝑛+1 σ𝑛𝑖=1 𝑥𝑖 − 𝑥lj 4 3 𝑛−1 2
𝐶𝐵𝐴 = −
𝑛−1 𝑛−2 𝑛−3 𝑠4 𝑛−2 𝑛−3
σ𝑛
𝑖=1 𝑥𝑖 −𝑥lj
2
unde 𝑠 = .
𝑛−1
25
EAM 2022-2023
STATISTICĂ curs 6 & 7
Măsuri statistice descriptive pentru date univariate
Măsurarea variabilității
1. Indicatori simpli
2. Indicatori sintetici ai variabilităţii
Variabilitatea
Pentru analiza variabilităţii unei serii de date numerice
se utilizează:
𝑑 = 𝑥𝑖 − 𝑥ҧ = 0
𝑖=1 𝑖 𝑖=1
1.2 Abaterea individuală absolută (𝑑𝑖 )
Dispersia (varianţa) 𝜎 2 ;
σ𝑁
𝑖=1 𝑥𝑖 −𝜇
2
𝜎2 =
𝑁
𝑛 2 𝑛 2 𝑛 2
2
σ𝑖=1 𝑥𝑖 2 σ𝑖=1 𝑥𝑖 σ𝑖=1 𝑥𝑖
𝑠 = −𝑥 = −
𝑛 𝑛 𝑛
2.2 Dispersia
Exemplul 1
Distribuţia celor 120 de salariaţi ai firmei Papirus în funcţie de numărul
copiilor minori în întreţinere:
Număr copii
Număr
minori în 𝑑𝑖 = (𝑥𝑖 − 𝑥) ⋅ 𝑛𝑖
salariaţi Fci 𝑥𝑖 − 𝑥 ⋅ 𝑛𝑖 (𝑥𝑖 − 𝑥)2 ⋅ 𝑛𝑖
întreţinere
(𝑛𝑖 )
(𝑥𝑖 )
0 (0-2,25)*10 = -22,5 10 22,5
10
50.625
1 (1-2,25)*20 = -25 30 25
20
31.25
2 (2-2,25)*35 = -8,75 65 8,75
35
2.1875
3 (3-2,25)*40 = 30 105 30
40
22.5
4 (4-2,25)*15 =26,25 120 26,25
15
45.9375
Total 120 0 - 112,5 152,5
Exemplul 1
Indicatorii variabilităţii determinaţi sunt:
1. Amplitudinea absolută
• Ax = xmax — xmin = 4 - 0 = 4 copii
3. Abaterea intercuartilică
• 𝐴𝐼 = 𝑄3 − 𝑄1 = 3-2 = 1
1 3
• 𝐿𝑜𝑐𝑄1 = 𝑛 + 1 = 30.25, 𝐿𝑜𝑐𝑄3 = 𝑛 + 1 = 90.75
4 4
σ 𝑟
𝑥𝑖 −𝑥 𝑛𝑖 112.5
𝑑ҧ = 𝑖=1
σ𝑟
= = 0.94 ≅ 1copil
𝑖=1 𝑛𝑖 120
5. Dispersia
2
σ𝑟𝑖=1 𝑥𝑖 − 𝑥 2 𝑛𝑖 152.5
𝑠 = = = 1.29
𝑛−1 119
6. Abaterea standard
PAS 3:
• Dacă seria este simplă (date nesistematizate) se
identifică valoarea cuartilei în serie pe baza rangului
determinat la pasul 2.
• Dacă datele sunt sistematizate pe variante, atunci
cuartila este prima variantă a cărei frecvenţă
cumulată este superioară rangului cuartilei.
• Dacă datele sunt sistematizate pe intevale de
variaţie, atunci se determină intervalul cuartilic, ca
fiind primul interval a cărui frecvenţă cumulată este
mai mare decât poziţia cuartilei; se trece apoi la
pasul 4.
PAS 4: Se estimează valoarea cuartilei ca fiind
mijlocul intervalului cuartilic determinat.
Indicatori medii de pozitie – CUANTILE
Indicatori medii de pozitie – CUANTILE
Indicatorii de poziţie oferă informaţii pertinente
privind forma distribuţiei, astfel:
▪ de exemplu, dacă prima decilă (decila inferioară)
este mai apropiată (ca valoare) de mediană, în timp
ce decila a noua (decila superioară) este relativ mai
depărtată de mediană, vom concluziona că
distribuţia este pozitiv înclinată către valorile mari
ale variabilei (predomină valorile mici ale
distribuției);
▪ dacă prima şi cea de-a treia cuartilă sunt situate
aproximativ la aceeaşi distanţă de mediană, vom
concluziona că distribuţia variabilei este aproximativ
simetrică.
Indicatori medii de pozitie – CUANTILE
Principalii indicatori medii de poziţie pot rezuma grafic
(diagrama Box-Plot), pe de o parte tendinţa centrală,
variabilitate datelor şi forma distribuţiei variabilei
studiate, iar pe de altă parte valorile extreme şi cele
aberante:
▪ valoarea minimă: 𝐱𝐦𝐢𝐧 (numită şi percentila 0);
▪ cuartila inferioară: 𝑸𝟏 (delimitează cele mai mici
25% din valori);
▪ Mediana: Me (delimitează 50% din valori);
▪ cuartila superioară: 𝑸𝟑 (delimitează cele mai mari
25% din valori);
▪ valoarea maximă: 𝐱𝐦𝐚𝐱 (numită şi percentila 100)
Cele cinci valori se reprezintă grafic prin intermediul
diagramei Box-Plot
Indicatori medii de pozitie – CUANTILE
▪ În cadrul diagramei Box-Plot, cutia este delimitată de
cuartilele Q1 şi Q3 şi cuprinde 50% dintre valorile
variabilei, situate în centrul distribuţiei.
▪ Linia din interiorul cutiei reprezintă valoarea mediană,
iar liniile inferioară, respectiv superioară sunt date de
valorile extreme ale seriei (xmin şi xmax).
▪ Diagrama Boxplot este utilă şi pentru identificarea
valorilor extreme şi a celor aberante (outliers)
Indicatori medii de pozitie – CUANTILE
▪ Valorile extreme ale setului de date sunt fixate la o
limită maximă egală cu 1,5*lungimea cutiei (lungimea
cutiei este Q3-Q1).
▪ Valorile aberante (de tip outlier) sunt considerate toate
observaţiile situate la stânga sau la dreapta valorilor
extreme (dacă este cazul) şi reprezentate în
diagramă.
EAM 2022-2023
STATISTICĂ
Curs 4
Măsuri statistice descriptive pentru serii de
date univariate (I)
Indicatorii tendinţei centrale
1. Noţiuni generale privind indicatorii
tendinţei centrale
Indicatorul statistic reprezintă expresia numerică
concretă sau dimensiunea unei colectivităţi sau
fenomen. Poate fi definit ca „rezultat numeric al unei
numărări, al unei măsuri statistice a fenomenelor şi
proceselor de masă sau al unui model de calcul
statistic pe baza datelor înregistrate”.
Pentru o variabilă numerică, folosind indicatorii
statistici, putem analiza trei proprietăţi majore:
➢ tendinţa centrală
➢ variabilitatea
➢ forma distribuţiei
Precizări
σ𝑛1 𝑥𝑖
𝑥ҧ =
𝑛
• pentru colectivitatea generală – parametru:
σ𝑁
1 𝑥𝑖
𝑥ҧ =
𝑁
Unde:
• 𝑥𝑖 reprezintă valorile variabilei X.
2. Media aritmetică 𝑥ҧ
☺ Exemplul nr. 1
Pentru 5 sucursale ale unei bănci comerciale au fost
înregistrate valorile creditelor în luna decembrie 2021
şi anume: 250.000 Euro; 300.000 Euro; 150.000 Euro;
200.000 Euro; 250.000 Euro. Care este valoarea
medie a creditelor acordate în luna decembrie 2021?
σ𝑛1 𝑥𝑖
𝑥ҧ = =
𝑛
250.000+300.000+150.000+200.000+250.000
= =
5
=230.000 𝐸𝑢𝑟𝑜Τ𝑠𝑢𝑐𝑢𝑟𝑠𝑎𝑙ă
2. Media aritmetică 𝑥ҧ
Media aritmetică este afectată de orice valoare sau
valori extreme.
☺ Exemplul nr. 2
Datele pentru vechimea în muncă a 10 salariaţi sunt:
5, 4, 5, 5, 6, 6, 4, 6, 5 şi 20, atunci vechimea medie
este:
Media aritmetică este afectată de orice valoare sau
valori extreme.
σ𝑛
1 𝑥𝑖 5+4+5+5+6+6+4+6+5+20 66
𝑥ҧ = = = = 6,6 𝑎𝑛𝑖
𝑛 10 10
σ𝑛
1 𝑥𝑖 5+4+5+5+6+6+4+6+5 46
𝑥ҧ = = = = 5,1 𝑎𝑛𝑖
𝑛 9 9
2. Media aritmetică 𝑥ҧ
Într-o colectivitate statistică se întâlnesc foarte rar
cazuri în care numărul valorilor caracteristicii coincide
cu numărul unităţilor. În general se înregistrează de
mai multe ori aceeaşi valoare a caracteristicii pentru
mai multe unităţi şi în acest caz media se va calcula ca
o medie aritmetică ponderată:
σr1 𝑥𝑖 ∙ 𝑛𝑖
𝑥ҧ =
𝑛𝑖
Unde,
• 𝑥𝑖 , 𝑖 = 1, 𝑟 – reprezintă valorile variabilei 𝑋 sau
centrele intervalelor de variaţie (calculate ca medie
a capetelor de interval);
• 𝑟 – numărul de variante / intervale (grupele);
• σ𝑟1 𝑥𝑖 – valoarea centralizată (nivelul totalizat) al
caracteristicii.
2. Media aritmetică 𝑥ҧ
☺ Exemplul nr. 3
Se cunoaşte distribuţia de frecvenţe a 50 de firme
referitor la valoarea alocată cheltuielilor cu cercetarea-
dezvoltarea (mii lei):
Intervalul de variatie
pentru Centrul de
Grupa Valoarea cheltuită cu Nr firme interval
xi ni Fci
cercetarea-dezvoltarea
(mii lei) ni xi
1 sub 6,25 4 5,70 22,8 4
2 6,25 - 7,35 12 6,80 81,6 16
3 7,35 - 8,45 14 7,90 110,6 30
4 8,45 - 9,55 7 9,00 63 37
5 9,55 - 10,65 7 10,10 70,7 44
6 10,65 - 11,75 3 11,20 33,6 47
7 11,75 - 12,85 0 12,30 0 47
8 12,85 şi peste 3 13,40 40,2 50
Total 50 - 422,5
2. Media aritmetică 𝑥ҧ
σ𝑘
1 𝑥𝑖 ∙𝑛𝑖 422,5
• Media va fi 𝑥ҧ = = = 8,45 mii lei
𝑛𝑖 50
2. Media aritmetică 𝑥ҧ
𝑥 − 𝑥ҧ 𝑛𝑖 = 𝑥𝑖 𝑛𝑖 − 𝑥ҧ 𝑛𝑖 =
𝑖=1 𝑖=1 𝑖=1
σ𝑟𝑖=1 𝑥𝑖 𝑛𝑖
= σ𝑟𝑖=1 𝑥𝑖 𝑛𝑖 − σ𝑟𝑖=1 𝑛𝑖 =0;
σ𝑟𝑖=1 𝑛𝑖
𝑥𝑖 (valori ordonate): 1 3 4 5 7 9
Rangul valorii 𝑥𝑖 : 𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6
6+1 7 𝑥3 + 𝑥4 9
𝐿𝑜𝑐𝑀𝑒 = = = 3,5 ⇒ 𝑀𝑒 = = = 4,5
2 2 2 2
• pentru o serie de distribuţie de frecvenţe pe
variante calculul medianei comportă următoarele
etape:
xi
xi
Mo Mo1 Mo2
ni
c)
xi
Mo1 Mo2 Mo3
5. Modulul
Determinarea modului pentru o variabilă nenumerică:
☺ Exemplul nr. 9
Distribuţia celor 130 de salariaţi ai unei firme în funcţie de
nivelul ultimelor studii absolvite este:
Nivelul Număr 50
Distribuția salariaților în funcție de nivelul studiilor
46
studiilor salariaţi 45
40
Gimnaziale 7 35 33
Număr salaiați
Liceale 25 30
25
25
Postliceale 33 20
19
Universitare 46 15
10 7
Postuniversitare 19 5
0
Total 130
Nivel studii
Mo=„universitare”
5. Modulul
Determinarea modului pentru o variabilă
numerică
Unde:
• x0 = limita inferioară a intervalului modal;
• h = mărimea intervalului modal;
• 1 = diferenţa dintre frecvenţa intervalului modal şi a
celui anterior;
• 2 = diferenţa dintre frecvenţa intervalului modal şi a
celui următor.
• Intervalul modal este intervalul căruia îi corespunde
frecvenţa absolută maximă.
Obs. MODUL POATE FI ESTIMAT CA FIIND
CENTRUL INTERVALULUI MODAL
☺ Exemplul nr. 10
80 de apartamente dintr-un bloc au fost
sistematizate după numărul de camere rezultând
următoarea distribuţie de frecvenţe:
Nr. camere (xi) Nr. apartamente(ni)
1 13
2 25
Mo=3 28
4 14
☺ Exemplul nr. 2
Pentru uşurarea procesului de prelucrare a datelor,
variantele/categoriile nominative se pot codifica
numeric, sub forma: (0 = masculin, 1 = feminin); (1
= inginer, 2 = economist, 3 = arhitect etc.). Aceste
numere nu sunt purtătoare ale vreunei informaţii
cantitative, ci doar separă subiecţii în
clase/categorii distincte din punctul de vedere al
statutului civil, al sexului, al profesiei etc. Cu aceste
coduri numerice nu se pot determina medii sau alţi
indicatori statistici, nu se pot efectua comparaţii.
Putem însă să determinăm frecvenţele de apariţie
ale ficărei categorii.
b. Scala ordinală (categorială)
☺ Exemplul nr. 3
Nu putem afirma cu câte grade Celsius diferă
temperatura „scăzută” de cea „normală”, sau cu
câte kilograme este mai grea o persoană din
categoria „peste greutatea normală” decât una din
categoria „cu greutatea normală”.
c. Scala de raport (proporţională)
Caracteristici:
☺ Exemplul nr. 8
Deşi pe scala de raport valoarea zero a unei
variabile înseamnă „absenţă”, nu este necesar ca
această valoare să se fi înregistrat, în practică, la
una din unităţile statistice. De exemplu, vârsta se
măsoară cu scala de raport, deşi nu există nici o
persoană care să aibă 0 ani (adică 0 ani, 0 luni, 0
zile etc.). Timpul după care participanţii la un
concurs de atletism parcurg distanţa de 400 m se
măsoară pe scala de raport, deşi nu există nici o
persoană care să străbată această distanţă în 0,00
minute.
1. Scale de măsurare a datelor statistice
Relaţie de ordine
Diferenţe (intervale)
semnificative Vârsta, greutatea corporală,
RAPORT
Origine fixă, valoarea 0 salariul, profitul, cifra de
(PROPORŢIONALĂ)
înseamnă absenţă afaceri, număr de angajaţi
Operaţii de multiplicare /
divizare
TEST 1
1. Precizaţi care din următoarele asocieri între
variabilele statistice şi scalele de măsurare nu este
adevărată:
a) marca de calculator cumpărat cel mai de curând de
către 20 de oameni de afaceri – scală nominală.
b) salariul mediu pe ramuri ale economiei naţionale –
scală de raport.
c) luna din anul 2000 în care 41 de firme selectate
aleator au realizat cele mai mari vânzări – scală
nominală.
d) punctajul obţinut de către 10 concurenţi la un
concurs de cultură generală – scală nominală.
e) afilierea la un partid politic a 50 de directori
executivi selectaţi aleator – scală nominală.
TEST 1
2. O companie de produse alimentare doreşte să
comercializeze un nou produs de snack-food. Pentru a
vedea cum reacţionează cumpărătorii la acest produs,
compania organizează o testare a gusturilor pentru
100 de cumpărători selectaţi întâmplător la un
magazin suburban. Cumpărătorii sunt rugaţi să guste
produsul şi apoi să completeze un chestionar cu
următoarele întrebări:
a) nominală;
b) ordinală
c) raport.
2. Surse de date statistice
În scopul aplicării metodelor statistice de analiză a
fenomenelor și proceselor social-economice este
necesar să avem la dispoziție date statistice. Datele
necesare se pot obţine din diferite surse:
▪ din investigaţii statistice special organizate, atunci
când datele nu există iniţial sub forma necesară –
acestea sunt datele primare (de exemplu prin
recensământ statistic sau sondaj statistic);
▪ din sistemul informaţional existent (de exemplu: din
evidenţele curente ale agenţilor economici, bănci şi
baze de date pe suport de hârtie sau electronic al
unor instituţii ale administraţiei centrale şi locale etc.)
şi se numesc date secundare.
Clasificarea datelor statistice
5.5 Monografia
• Structura cursului;
• Bibliografia cursului;
Modul de evaluare
• Examen,5 puncte credit
• 70% examen
Bibliografie
• Voineagu V., Țițan E., Ghiță S., Boboc C., Todose D.,
Statistica. Baze teoretice și aplicații, Economică,
București, 2007
Ce este statistica?
☺ Exemplul nr. 2
Populaţia tuturor absolvenţilor unei instituţii de
învăţământ superior economic este infinită,
deoarece ea poate include absolvenţii din trecut,
prezent şi viitor; dacă facem însă nişte precizări,
nişte delimitări, circumscrieri în timp, în spaţiu şi ca
organizare, populaţiile infinite pot căpăta caracter
finit (populaţia absolvenţilor din București, din anul
universitar 2021-2022, de la Facultatea de
Economie Agroalimentară și a Mediului - ASE).
Eşantionul reprezintă un subset de elemente
selectate dintr-o colectivitate statistică.
4. Concepte de bază utilizate în statistică
b. Unitatea statistică
Este elementul, entitatea de sine stătătoare a unei
populaţii statistice, care posedă o serie de trăsături
caracteristice ce-i conferă apartenenţa la populaţia
studiată.
☺ Exemplul nr. 4
Numărul de bolnavi internaţi într-un spital la
31.12.2021, numărul şcolilor generale existenteîntr-un
oraş – sunt variabile discrete, deoarece pot lua doar
valori întregi, în timp ce greutatea şi înălţimea unor
persoane, media generală cu care au promovat anul I
studenţii unei facultăţi etc. – sunt variabile continue,
întrucât pot lua şi valori fracţionare.
4. Concepte de bază utilizate în statistică
IV. după numărul de variante pe care-l poate avea o
variabilă, întâlnim:
• variabile alternative, binare sau dihotomice, de
tipul variabilelor logice („adevărat/fals”), care pot
avea doar două variante de răspuns
• variabile nealternative, sunt cele care pot avea cel
puţin trei variante de răspuns, de manifestare.
Variabilele nealternative se pot transforma în variabile
alternative printr-un proces de dihotomizare (prin
impunerea unei limite, a unui prag – în cazul
variabilelor numerice, sau prin regrupări ale
variantelor – în cazul variabilelor nenumerice).
Exemplu: salariul: mai mic sau egal cu 3500 RON şi
mai mare de 3500 RON; profesia: economist şi alte
profesii).
4. Concepte de bază utilizate în statistică
V. după modul de obţinere, pot exista:
• variabile primare;
• variabile derivate.
a) Descrieţi populaţia;
b) Descrieţi eşantionul;
c) Descrieţi inferenţa care interesează;
TEST 1
3. Deseori, locuitorii unui oraş preferă să achiziţioneze
produse şi servicii din afara ariei lor comerciale locale.
Acest fenomen afectează îndeosebi localităţile mici,
întrucât dacă el ia amploare, poate influenţa negativ
prosperitatea localităţii. Pentru a reduce dimensiunea
unui astfel de fenomen şi a determina motivele care îi
fac pe unii localnici să cumpere produse şi servicii din
afara localităţii lor, un grup de cercetători au făcut un
studiu pe 200 de locuitori ai unei aşezări.