Sunteți pe pagina 1din 19

Noiuni de

statistic descriptiv
Statistica are ca obiect de studiu fenomenele
aleatoare. Etape n analiza datelor statistice:

Culegerea i nregistrarea datelor statistice


relative la fenomenul studiat
Prelucrarea statistic: sistematizarea datelor i
calculul indicatorilor statistici care caracterizeaz
fenomenul studiat.
Analiza, interpretarea i prezentarea final a
rezultatelor (verificarea ipotezelor, formularea
unor predicii privind comportarea viitoare).
Colectivitate (populaie) statistic: totalitatea elementelor
care au caracteristici comune i care formeaz obiectul
analizei statistice (populaia unei localiti, cazurile de
grip la nivel naional etc).

Unitate statistic sau individ: element al unei colectiviti


(populaii) statistice (persoana, caz nou de boal, familia,
secia de spital etc).

Caracteristica statistic sau variabila: trstura comun


tuturor unitilor (indivizilor) unei populaii care ne
intereseaz n cadrul analizei statistice.
Tipuri de variabile

Variabile

Calitative Categoriale Numerice Cantitative

Nominale Ordinale Discrete Continue

Categoriile sunt mutual Categoriile sunt Pot fi numrate Iau valori ntr-un interval
disjuncte (se exclud mutual disjuncte (se (mulime cel mult
reciproc) exclud reciproc) numrabil de valori) Exemple: greutatea (kg),
i neordonate i ordonate nlimea (m), vrsta (ani,
Exemple: numrul de luni, ore, minute ...),
Exemple: sex, grupa de Exemple: stadiul copii dintr-o familie, cantitatea de calciu din
snge, culoarea unei boli, nivelul de numrul de zile de boal corpul unui pacient cu
ochilor, stare civil, educaie pe parcursul unui an, osteoporoz, tensiunea
regiunea de reziden, numr de locuitori, arterial
profesia numr de decese

Valorile unei variabile calitative pot fi cuantificate numeric, cea mai simpl form fiind
etichetarea valorilor.
Variabila: X Valoarea variabilei: x

Cum putem descrie (caracteriza) eantioane (selecii) de valori ale


variabilelor ?

Prin reprezentri numerice i grafice adecvate.


Gruparea i reprezentarea datelor
Presupunem c s-a msurat nlimea a 80 de persoane; datele
obinute (cm) sunt prezentate n tabelul de mai jos.
176 173 161 171 165 176 173 182
181 172 163 174 162 159 179 179
186 190 173 173 158 163 178 185
162 170 176 177 156 164 168 171
170 176 178 164 162 168 185 187
174 171 175 170 161 168 175 170
188 173 172 174 167 167 181 165
183 174 179 167 165 165 152 167
168 179 177 177 151 162 167 163
162 177 173 170 158 181 163 190

Max = 190; Min = 151


Analiza statistic a unui fenomen n raport cu o singur caracteristic ne conduce la o serie
de perechi de valori (valoarea caracteristicii; numrul de uniti statistice corespunztoare
valorii respective): serie statistic.
O posibil rearanjare a datelor din tabel

151 1 161 2 171 3 181 3


152 1 162 5 172 2 182 1
153 0 163 4 173 6 183 1
154 0 164 2 174 4 184 0
155 0 165 3 175 3 185 2
156 1 166 0 176 4 186 1
157 0 167 5 177 4 187 1
158 2 168 4 178 2 188 1
159 1 169 0 179 4 189 0
160 0 170 5 180 0 190 2

Frecvena absolut a unei valori x a caracteristicii (variabilei statistice):


numrul de uniti ale populaiei corespunztoare acelei valori.
151 1 0,0125 161 2 0,0250 171 3 0,0375 181 3 0,0375
152 1 0,0125 162 5 0,0625 172 2 0,0250 182 1 0,0125
153 0 0,0000 163 4 0,0500 173 6 0,0750 183 1 0,0125
154 0 0,0000 164 2 0,0250 174 4 0,0500 184 0 0,0000
155 0 0,0000 165 3 0,0375 175 3 0,0375 185 2 0,0250
156 1 0,0125 166 0 0,0000 176 4 0,0500 186 1 0,0125
157 0 0,0000 167 5 0,0625 177 4 0,0500 187 1 0,0125
158 2 0,0250 168 4 0,0500 178 2 0,0250 188 1 0,0125
159 1 0,0125 169 0 0,0000 179 4 0,0500 189 0 0,0000
160 0 0,0000 170 5 0,0625 180 0 0,0000 190 2 0,0250

Frecvena relativ Valori Frecvene


raportul dintre frecvena absolut a
valorii x i efectivul total al
populaiei.
... ...
Suma frecvenelor relative ale
valorilor variabilei este egal cu 1.

Distribuia sau repartiia statistic a variabilei


O posibil rearanjare a datelor din tabel

151 1 161 8 171 39 181 71


152 2 162 13 172 41 182 72
153 2 163 17 173 47 183 73
154 2 164 19 174 51 184 73
155 2 165 22 175 54 185 75
156 3 166 22 176 58 186 76
157 3 167 27 177 62 187 77
158 5 168 31 178 64 188 78
159 6 169 31 179 68 189 78
160 6 170 36 180 68 190 80

Frecvena absolut cumulat (cresctoare) a unei valori x a variabilei: suma


frecvenelor absolute ale valorilor variabilei mai mici sau egale cu x.

Frecvena relativ cumulat (cresctoare) a unei valori x a variabilei: suma


frecvenelor valorilor variabilei mai mici sau egale cu x.
Clase de Frecvena
valori Frecvena cumulat 20
<150 0 0
15
151-155 2 2

Frecventa
156-160 4 6 10

161-165 16 22 5
166-170 14 36
0
171-175 18 54 150 155 160 165 170 175 180 185 190 More
176-180 14 68 Inaltimea in cm

181-185 7 75
186-190 5 80

Frecvena relativ cumulat a clasei 176-180 este 68/80 = 85%.


Prin urmare, 85% din persoanele msurate au nlimea sub 180 cm.
Analiza statistic se poate face dup dou caracteristici:

Culoarea ochilor
negri cprui verzi albatri Total
Culoarea prului
negru 145 285 30 11 471
castaniu 62 434 87 67 647
blond 33 36 185 128 382
Total 240 752 302 206 1500

Culoarea ochilor
negri cprui verzi albatri Total
Culoarea prului
negru 0.0967 0.1900 0.0200 0.0073 0.3140
castaniu 0.0413 0.2873 0.0580 0.0447 0.4313
blond 0.0220 0.0240 0.1233 0.0853 0.2547
Total 0.1600 0.5013 0.2013 0.1373 1.0000
Serii cronologice

Prezint evoluia n timp a unor mrimi.

Data sau intervale de timp Valorile variabilei


Reprezentarea grafic a datelor
Tabelul de mai jos red grupa de snge pentru 55 de femei diagnosticate cu
tromboembolie (thromboembolic disease) i pentru 145 de femei sntoase.

Femei cu
Grupa de tromboembolie Femei
Total
sange (thromboembolic sanatoase
disease)

A 32 51 83
B 8 19 27
AB 6 5 11
O 9 70 79
Total 55 145 200

- Reprezentai printr-o diagram cu bare (bar chart) frecvena cazurilor


de boal n funcie de grupa de snge.
- Reprezentai pe aceeai diagram grupele de snge pentru cele dou
grupuri analizate. Concluzii?
Frecventa cazurilor de boala in functie de grupa de sange
Femei cu 35
Grupa de tromboembolie
sange (thromboembolic 30
disease)
25
A 32

Frecventa
B 8 20

AB 6 15
O 9
10
Total 55
5

0
A B AB O
Grupa de sange

Frecventa cazurilor de boala in functie de grupa de sange

16%

A
11% B
AB
58% O
15%
Compararea celor doua grupuri in functie
de grupa de sange
70%

60%

50%

40%
Femei bolnave (n=55)

30% Femei sanatoase (n=145)

20%

10%

0%
A B AB O

Femei cu Procent cazuri


Grupa de tromboembolie Femei de boala pe Procent femei
Total
sange (thromboembolic sanatoase grupe de sanatoase pe
disease) sange grupe de
sange
A 32 51 83 0,581818 0,351724
B 8 19 27 0,145455 0,131034
AB 6 5 11 0,109091 0,034483
O 9 70 79 0,163636 0,482759
Total 55 145 200 1 1
Elemente caracteristice ale unei serii statistice

Modul (dominanta seriei)


Valoare din serie cu frecvena maxim (care se repet cel mai des). Se determin
prin simpla examinare a valorilor seriei. Pot exista mai multe valori modale.

Mediana
Valoarea central a unei serii statistice (se gsete exact n centrul seriei
de observaii), ordonate n mod cresctor sau descresctor.
Un numr Me pentru care exist tot attea uniti statistice corespunztoare
valorilor < Me ct i pentru cele corespunztoare valorilor > Me.
Calcul (serie simpl)
n impar - poziia medianei:
n par : la mijlocul seriei se vor gsi dou valori se face media lor.
Indicaii asupra tendinei centrale a valorilor. Mediana nu este influenat de
valorile extreme ale seriei.

Vezi funciile MODE, MEDIAN.


Elemente caracteristice ale unei serii statistice

Media aritmetic x1 x2 ... xn


x
n
x1 f1 x2 f 2 ... xn f n
x
f1 f 2 ... f n
xi valorile variabilei fi frecvenele absolute

Dispersia
( x x ) 2
( x x ) 2
... ( x x ) 2
1
2 2 n
n
Cuantile: reprezint valori ce mpart seria n pri egale
Cuartile (cuantile de ordin patru): mpart seria n patru pri egale;
delimiteaz cte 25% din observaii; Q1 - cuartila inferioar, Q2 - egal cu
mediana, Q3 - cuartila superioar; Q0 - min; Q4 - max.
Decile: delimiteaz cte 10% din observaii; D5 = Me
Centile: delimiteaza cte 1% din observatii

8 26 33 46 58 8 min
11 26 34 46 59
11 27 35 46 61 27 cuartila inf
15 27 35 47 65
17 28 36 47 66 36.5 mediana
22 29 37 51 66
24 29 40 51 69 51 cuartila sup
25 30 40 51 70
26 31 43 55 73 79 max
26 33 45 56 79

Vezi funciile QUARTILE, MIN, MAX.


Tabelul de mai jos red vrsta (ani) pentru 20 de bicicliti decedai n accidente rutiere.

52 24 15 16 20 64 21 24 31 32
18 16 41 24 24 33 28 44 71 20

- Reprezentai grafic datele respective.


- Calculai media, mediana i modul.

Nr deHistogram
cazuri pe varste
10
10
8
8
Frequency
Frequency

6
6
4
2
0
19 29 39 49 59 69 79 More

S-ar putea să vă placă și