Documente Academic
Documente Profesional
Documente Cultură
Powered by Turturean
Analiza unei distribuţii (serii) statistice
unidimensionale
5. Grafice de structura: █, ■, ●.
1. VOLUMUL COLECTIVITATII (n)
– reprezintă numărul unităților statistice incluse într-o colectivitate.
2. FRECVENTELE ABSOLUTE (ni )
– reprezintă numărul unităților statistice care iau o aceeași valoare
xi (cazul unei variabile discrete) sau iau valori din același interval de
variație (xi-1, xi] (cazul variabilelor continue).
Obs: Variabilele nominale si cele ordinale sunt de obicei tratate ca
variabile discrete.
La nivelul unei colectivitati suma frecvențelor absolute este
întotdeauna egală cu volumul colectivitatii:
k
n
i 1
i n
,k numărul de valori distincte xi ale variabilei observate
(X-variabila discretă) sau numărul distinct de intervale de variație
(xi-1, xi] a variabilei observate (X- variabila continuă).
3. FRECVENȚA RELATIVĂ (fi sau f%i )
- reprezinta ponderea unităților statistice, care iau o aceeași valoare
xi (cazul unei variabile discrete) sau iau valori din același interval de
variație (xi-1, xi] (cazul variabilelor continue), în totalul populației n.
n m
fi
(%)
fi i ( x100), i 1, k și (%)
1( x100)
n i 1
i i
N i n h Fi f h
Crescator h 1 h 1
(↓)
Ni↓= Ni-1↓+ni ; N1↓= n1 Fi↓= Fi-1↓+fi ; F1↓= f1
m m
N i n h Fi f h
Descrescator h i h i
(↑)
Ni↑= Ni+1 ↑ +ni ; N1 ↑= nm Fi ↑ = Fi+1 ↑ +fi ; F1 ↑ = fm
6.-7. Quantilele
Quantilele de ordin r, notate Qj(r) cu j=1,…r-1, sunt valori
ale variabilei observate care impart colectivitatea în r părți
egale. Ele sunt in numar de r-1.
r
, unde n - volumul colectivității, r- ordinul
quantilei , j – numărul quantilei de ordinul r
P2: Ordonăm crescător seria (de aici și restricția calculului
quantilelor pentru variabile nominale pe care nu este definită
relația de ordine).
P3: Identificam locul valorii lui Qj(r) in cadrul seriei.
1. locul lui Qj(r) cade exact peste o valoare reala situatie in
care Qj(r) ia valoarea peste care cade.
2. locul lui Qj(r) cade intre doua valori reale situatie in care
Qj(r) este calculat ca medie a celor doua valori.
Qj Dj
Cum calculam U , U , U ?
Me
xi
X: , când n1≠n2≠ … ≠ni.
ni
10. Graficele care reprezinta distributia variabilelor
ordinale:
a. Diagrama prin benzi -> Poligonul Frecvențelor ->
Curba Frecvențelor
b. Poligonul Frecvențelor cumulate -> Curba
Frecvențelor cumulate
c. Diagrama Box & Wiskers (D1 - |Q1 - Me – Q3 | - D9)
10. Graficele care reprezintă distribuția
variabilelor ordinale
Obs: Desi pentru variabilele ordinale avem definită relația
de ordine (care constituie o prima condiție în obținerea unei
distribuții “stabile”) totuși există un mare neajuns reprezentat
de faptul că distanța dintre două valori succesive nu poate fi
definită și prin urmare ea nu este constantă. De multe ori
aceasta distanță este convențională. Datorita acestui fapt vom
accepta ideea de distribuție dar în sens foarte larg. Ea poate fi
numită mai curând pseudo-distribuție.
a. Diagrama prin benzi -> Poligonul Frecvențelor
-> Curba Frecvențelor
b. Poligonul frecvențelor cumulate↑ și ↓
-> Curba frecvențelor cumulate
x 2
i
x n 2
i i k
- ponderata: x p i 1
k sau xp i fi
x 2
n
i 1
i
i 1
n ni
i
5. Intervalul interquartilic
IQ=Q3-Q1 - cuprinde 50% din volumul eşantionului.
Asimetria
- reprezintă o deviere de la forma simetrică a unei distribuţii.
Asimetria poate fi apreciată:
- pe cale grafică: curba frecvenţelor, diagrama box-plot.
- pe cale numerică: - prin compararea marimilor medii
centrale: Me, Mo si x .
- prin calculul indicatorilor de asimetrie
(Skewness).
Me ocupa este intotdeauna cuprinsa intre x si Mo si
anume este situata la 1/3 de x si 2/3 de Mo.
Daca x<Me<Mo => exista asimetrie la stanga.
Daca x >Me>Mo => exista asimetrie la dreapta.
Daca x = Me=Mo => seria este simetrica.
32
a. Coeficientul de asimetrie Pearson 1
23
3
b. Coeficientul de asimetrie Fisher 1 3
s
Boltirea
- este definită prin compararea distribuţiei empirice cu
distribuţia normală din punctul de vedere al variaţiei variabilei
X şi a frecvenţei ni.
Boltirea poate fi apreciată:
- pe cale grafică: curba frecvenţelor.
- numeric: prin calculul indicatorilor boltirii.
4 4
a. Coeficientul de boltire Pearson: 2
22 s4
i ni
( x x ) r
n
i 1
i
OBS: Pentru distributiile simetrice momentele centrate de
ordin impar sunt nule de unde si β1=0
Variabilă cantitativă continuă
1. Prezentarea seriei statistice - gruparea unităţilor statistice
este realizată pe intervale de variaţie.
Obs.: Gruparea pe intervale de variaţie duce la pierderea unei
părţi a informaţiei iniţiale.