Documente Academic
Documente Profesional
Documente Cultură
Ex: o cercetare care vizeaz numrul orelor de somn la studeni, n timpul semestrului,
comparativ cu perioada de sesiune:
2
STATISTICA DESCRIPTIV
Statistica descriptiv reprezint forma cea mai simpl de analiz a caracteristicilor
unei populaii. Ea include colectarea de date, prezentarea lor sub form de tabele,
ntocmirea unor reprezentri grafice i stabilirea indicatorilor statistici.
Clasificarea rezultatelor obinute i prezentarea lor sub o form facil, accesibil,
care d o descriere a fenomenului pe ct de fidel posibil.
3
Fi n
i 1
fr
F
n
ri
i 1
f = f 100
p
pi
100
i 1
k = 1 + 3.322 * ln(n)
= [ ( )]
Dac dimensiunea eantionului este mai mic dect 25, atunci nu se aplic mprirea pe
clase.
n practic numrul intervalelor de clas este bine s fie cuprins ntre 10 i 20.
REPREZENTRI GRAFICE
Cerine generale
focalizarea pe coninutul i nu pe forma graficului
este esenial s fie evitate distorsiunile induse de forma graficului
este recomandabil s fie utilizate grafice care favorizeaz comparaii ntre
variabile i nu doar reprezentri individuale, statice, ale acestora
fiecare grafic trebuie s serveasc un singur scop, exprimat clar i evident
se evit graficele redundante
orice grafic va fi nsoit de informaii statistice i descrierile necesare pentru a fi
uor i corect neles
orice grafic trebuie s aib un titlu, iar axele vor explicit etichetate
un grafic trebuie s scoat n eviden datele i nu abilitile tehnice de editare
ale celui care l-a creat
Forme uzuale
graficul de tip bar
histograma
poligonul de frecvene
graficul frecvenei cumulate
graficul circular
graficul de tip stem and leaf (tulpin i frunze)
Graficul de tip bar
Axa orizontal (Ox)
valorile distribuiei
Axa vertical (Oy)
frecvenele fiecrei valori,
Exigene
- Barele trebuie sa aib aceeai lime
- ntre bare se las un spaiu
- Barele pot fi puse n orice ordine
- Ordonarea barelor, descresctor sau cresctor (grafic Pareto)
17
16
No. of obs.
14
12
11
10
10
9
8
6
4
4
2
0
-1
CK 12h
4.6055
0.677008
CK 48h
0.605519
CK 72h
CK 4h
CK 24h
.2039963
.129605
CK 7 zile .0289275
p=.05
t-Value (for Coefficient;Absolute Value)
histograma
Histogram: GN
Kolmogorov-Smirnov d=.08153, p> .20; Lilliefors p> .20
Expected Normal
30
25
25
20
No. of obs.
18
15
13
10
5
3
1
0
500
1000
1
1500
2000
2500
3000
3500
4000
4500
5000
poligonul de frecvene
10
11
DIAGRAMA TUKEY Stem and Leaf: permite reconstituirea datelor i evaluarea densitii
datelor n fiecare clas. Se folosete n general pentru a reprezenta variabile care au drept
valori numere reale, grupate n intervale de clas.
12
B. INDICATORI STATISTICI
Indicatorii care definesc o variabil (serie) sunt:
Variabile cantitative
msura tendinei centrale (media, mediana,modul)
msura dispersiei (deviaia standard,varianta)
distribuia normala
Indicatori ai tendinei centrale: valori tipice, reprezentative, care descriu distribuia n
ntregul ei
MEDIA ARITMETIC:
Se aplic datelor care au valori numerice; fiind date observaiile x1 , x2 , , xn media
aritmetic se va calcula cu formula:
n
i 1
Notaii uzuale:
- media populaiei
- m media eantionului
MEDIA ARITMETIC PONDERAT:
Fiind date observaiile x1 , x2 , , xn pentru care se cunosc frecvenele absolute F1, F2,
Fn, media aritmetic ponderat se va calcula cu formula:
n
F x F2 x2 ... Fn xn
x 1 1
F x
i 1
13
MC
x1 / 2 x2 ... xn 1 xn / 2
n 1
MEDIANA, ME:
Se calculeaz pentru datele care au valori numerice; se ordoneaz valorile cresctor sau
descresctor. Corespunde valorii de 50% pe coloana frc%.
n cazul n care irul are un numr IMPAR de valori: mediana va fi valoarea care mparte
irul de valori n dou pri egale.
n cazul n care irul are un numr PAR de valori: mediana se calculeaz fcnd media
aritmetic a celor dou valori din mijlocul irului.
Valori nedeterminate i clase deschise
Valorile nedeterminate
valori a cror mrime nu decurge din procesul de msurare, n acelai mod n care rezult
oricare valoare a seriei
Exemplu: testul de asociere verbal (10 sec)
Clase (categorii) deschise
categorii care au una dintre limite liber
Exemplu: Cte igri fumezi zilnic? (30 sau mai mult).
n astfel de cazuri se utilizeaz mediana.
MODULUL (dominanta), MO:
Este valoarea care are frecvena cea mai mare dintr-un ir de observaii.
- distribuii unimodale (583254 Mo=5)
- distribuii bimodale (5832254 Mo=5; =2)
- distribuii multimodale (58832254 Mo=5; =2; =8)
VALOAREA CENTRAL, Xc:
Reprezint media aritmetic a valorilor extreme din irul de date studiat.
x xmax
X C min
2
14
(S 2 ) 2
( x x)
i 1
15
( x x)
i 1
n 1
( xi x)
i 1
AMPLITUDINEA:
Se definete ca diferena ntre cea mai mic i cea mai mare valoare dintr-un ir de valori.
==
Amplitudinea relativ (R%)
raportul procentual dintre amplitudine i medie
util cnd cunoatem plaja teoretic de variaie a valorilor
CUARTILELE:
Sunt 3 valori, notate Q1, Q2 i Q3, care mpart irul de date n 4 pri de dimensiune egal.
Diferena dintre Q3 i Q1 se numete interval cuartilic, Iq = Q3 Q1.
16
Q1 se numete cuartila inferioar sau mic, Q3 se numete cuartila superioar sau mare, iar
Q2 este aceeai cu mediana irului.
COEFICIENTUL DE VARIAIE, CX:
Este raportul ntre deviaia standard i media aritmetic a valorilor seriei, utilizat pentru a
exprima mai sugestiv gradul de mprtiere a acestora.
2
n
Interpretare:
Dac Sk = 0 sau =_, distribuie simetric.
Dac Sk > 0 sau >_, asimetrie pozitiv (la dreapta).
Dac Sk < 0 sau <_, asimetrie negativ (la stnga).
n cazul unei distribuii simetrice, media aritmetic, mediana i modulul sunt egale.
BOLTIREA (KURTOSIS):
Compar distribuia dat cu cea normal, sau gaussian, d.p.d.v. al nlimii curbelor.
Coeficientul de boltire:
2 =
Coeficientul Fisher:
4
4
=1( )2
2 =
3
4
18
Interpretare:
Dac 2 = 3 sau 2 = 0, repartiie mezocurtic (normal).
Dac 2 > 3 sau 2 > 0, repartiie leptocurtic (ascuit).
Dac 2 < 3 sau 2 < 0, repartiie platicurtic (aplatizat).
19
20