Documente Academic
Documente Profesional
Documente Cultură
Indicatorii
variaţiei
Analiza variabilelor numerice
Descrierea datelor
Media Amplitudine
Modul Dispersie
Deviatia standard
Coeficient de variatie
I. Indicatori simpli ai variației
A xmax xmin
• se exprimă în unitatea de măsură a variablei X.
• pentru date grupate se calculează ca diferenţă între
limita superioară a ultimei grupe şi limita inferioară a
primei grupe.
Advantaje: uşor de calculat şi interpretat.
Dezavantaje:
1. ignoră modul în care sunt distribuite datele.
7 8 9 10 11 12 7 8 9 10 11 12
A = 12 - 7 = 5 A = 12 - 7 = 5
A = 120 - 1 = 119
• Amplitudinea relativă permite comparaţii între
variabile diferite:
A
A% 100
x - media aritmetică.
x
2. Abaterile individuale de la medie măsoară
distanţa fiecărei unităţi statistice faţă de media
colectivităţii.
d i xi x
• Abaterile individuale relative (di%)
di
d i (%) 100
x
3. Abaterea intercuartilică
AQ = Q3 −Q1
Exemplu:
Mediana
X Q1 (Q2) Q3 X maxim
minim
25% 25% 25% 25%
12 30 45 57 70
AQ= 57 – 30 = 27
II.Indicatori sintetici ai variaţiei
• arată împrăştierea tuturor valorilor variabilei →
sintetizează într-un număr toate abaterile individuale
absolute.
• măsoară variatia faţă de o valoare reprezentativă
(media).
1. Abaterea medie liniară este media aritmetică a
tuturor abaterilor individuale absolute di (indiferent de
semn):
n
x
- date negrupate:
i x
d i 1
n
• date grupate, frecvenţe absolute
k
x i x ni
d i 1
k
n
i 1
i
2 i 1
n
• date grupate, frecvenţe absolute :
k _
(x i x ) ni 2
2 i 1
k
n
i 1
i
k
xi x n
2 2 *
i
i 1
Formule de calcul simplificat (I)
xi a
k 2
i 1 h
ni _
2
k
h 2
( x a ) 2
ni
i 1
Formule de calcul simplificat (II)
• date negrupate n
x
2
i
2 i 1
x 2
x ni
• date grupate 2
i
(pe variante sau 2
intervale de variatie)
2 i 1
k
x
n
i 1
i
3. Abaterea medie pătratică
(deviația sau abaterea standard): n _
• date negrupate :
(x i x) 2
i 1
n
k _
n
i 1
i
Date (xi) : 10 12 14 15 17 18 18 24
n=8 Media= x = 16
Abaterea medie de la x = 16
126
4.24
8
Teorema lui Cebîșev
68%
X 1σ
Regula empirică
2. aproximativ 3. aproximativ
95%din valori 99,7%din valori
se situează în se situează în
intervalul X 2σ intervalul X 3σ
95% 99,7%
X 2σ X 3σ
4. Coeficientul de variaţie :
d
v _
100 sau v _
100
x x
• măsoară variaţia relativă => permite compararea
variaţiei unor variabile diferite.
• Are valori între 0 şi 100%.
• Bunul A:
– Preț mediu= 50
– Deviatie standard = 5
5
VA 100% 10%
50 Ambele bunuri
• Bunul B: au aceeași
deviație
– Preț mediu= 100 standard, dar B
variază mai
– Deviatie standard = 5 puțin relativ la
preț.
5
VB 100% 5%
100
Descriptive Statistics cu Microsoft® Excel
1
1. data
3
2. data analysis
3. descriptive
4
statistics
4.Se selectează
datele
5.Se bifează
summary
statistics
6.Click OK
7. Excel output
Dispersia variabilei alternative:
Varianta Valoare (xi) Frecv. Frecv.
absolute relative
(ni) (ni*)
afirmativă 1 m w
negativă 0 n-m 1-w
Total - n 1
2
x i w ni*
2 2
w
i 1
1 w w 0 w 1 w w 1 w
2 2
Măsurarea variaţiei pentru grupări
bidimensionale
Atunci când o colectivitate este grupată simultan
după două variabile (x şi y) se obţin două
distribuţii marginale independente:
1.valorile variabilei independente xi cu
frecvenţele ni
2. valorile variabilei independente yj cu
frecvenţele nj
şi o distributie combinată în funcţie de ambele
variabile (valorile xi şi yj cu frecvenţele comune
nij).
Grupe Subgrupe după y Total pt. Medii pt. Dispersii
după x x grupele pt. grupele
y1 ... yj ... ym (ni. ) lui x lui x
x1 n11 ... n1j ... n1m n1. y1 2
1
ni1… nij … nim
xi ni. yi 2
i
nr1…nrj … nrm
xr nr. yr 2
r
r m
n
Total n.1 ... n.j ... n.m
pt. y (n.j) ij y
i 1 j 1
Categorii de variatii:
1. Variaţia totală:
y j y
2. Variaţia în interiorul grupelor stabilite după X:
y j yi
3. Variaţia între grupe:
y i y
Pentru fiecare unitate i:
y j y y j yi yi y
Media generală: r
y
i 1
i ni .
y r
y j y n. j
m 2
j 1
2
y m
• yj – valorile variabilei y; n. j
j 1
• y - media generală;
• n.j – frecvenţele grupelor după y.
y j y i nij
m 2
2. Dispersiile grupelor :
i = 1,2,…,r j 1
2
i m
nij
j 1
Media dispersiilor grupelor :
r
Surprinde influenţa
factorilor aleatori asupra 2
2
i ni .
variaţiei lui y. 2
y/r i 1
r
ni .
i 1
3.Dispersia dintre grupe este calculată pe baza
abaterilor mediilor de grupă de la media generală:
yi y ni .
r 2
2
y/ x
2 i 1
r
ni .
i 1
Măsoară influenţa factorului x asupra variabilei y.
• Regula adunării dispersiilor:
2
y
2 2
R
2
100
2
y
→Factorul x influenţează decisiv variaţia variabilei
dependente y dacă R2 > 50 %.
• Raportul de nedeterminaţie exprimă variaţia lui y datorată
factorilor aleatori:
2
N 2 100
2
y
R N 100%
2 2
Nivelul de omogenitate este măsurat cu coeficienţii de
variaţie.
Pentru fiecare grupă i:
i
vi 100 unde i 2
i
yi
y
j 1
j nij
yi m yj – centrele de
nj 1
ij
interval: 5, 30, 150, 350.
1. administraţie publică:
5 20407 30 9452 150 3232 350 345
y1 30
33436
2. administraţie privată:
y i ni .
30 33436 5 2333
y i 1
r
20
n .
56669
i
i 1
angajaţi.
Dispersiile de grupă
y y i nij
m
2
j
j 1
2
i m
n j 1
ij
2 5 30 2
20407 30 30 2
9452 150 30 2
3232
1
33436
350 302 345
2829,98
33436
Grupa 2. administraţie privată:
22
5 5 2
23152 30 5 47 150 5 26 350 5 8
2 2 2
23233
65,78
y
r
2
y ni .
2 i 1
i
30 20
2
33436 5 20 23233
2
r
n .
56669
i
i 1
151,25
Dispersia totală:
y
m
2
y n. j
2 j 1
j
5 20 43559 30 20 9499
2 2
y m
56669
n.
j 1
j
150 20 3258 350 20 353
2 2
1848,03
56669
• Regula de adunare a dispersiilor:
2
1848.03 151.25 1696.73
2
y
2
• Raportul de determinaţie
2 151.25
R 2 100
2
8.18%
y 1848.03