Sunteți pe pagina 1din 7

Facultate de Farmacie

Disciplina Matematic i Biostatistic


Lucrare Practic 3

Reprezentarea distribuiilor statistice unidimensionale


1. Noiuni fundamentale ale statisticii

Colectivitatea statistic reprezint o asociaie de elemente unite ntre ele printr-o


trstur esenial comun numit omogenitate. Se mai utilizeaz de asemenea, denumirea de

e
populaie, mulime, univers statistic. Elementele unei colectiviti statistice pot fi fiine,
lucruri precum i fapte, precum i evenimente referitoare la acestea.

i
Unitate statistic reprezint elementul component al unei colectiviti statistice (de ex. n

ac
cazul populaiei unei ri, unitile statistice sunt indivizii). Unitile statistice sunt elementele
de observare, msurare i nregistrare, adic prin ele se observ, msoar i nregistreaz o
populaie.
Variabile statistice reprezint iruri de valori reale nregistrate la nivelul unitilor

rm
statistice ale unei colectiviti bine definite. Valorile unei variabile statistice se numesc
variante ale variabilei i se obin prin observarea unitilor unei colectiviti statistice la un
moment dat ntr-un interval de timp. Variantele unei variabile statistice pot diferi de la o unitate
statistic la alta sau de la un grup de uniti statistice la altul.

Fa
Dup modul de exprimare, variabilele statistice pot fi clasificate:

A. CANTITATIVE (numerice), exprimate n cifre: nlime, greutate, tensiune arterial,


puls, temperatur, etc.
1. discrete (numrabile)- pot lua numai valori ntregi: numrul de copii, numr
de
de vizite, flux de pacieni / zi ntr-o farmacie, etc;
2. continue (msurabile)- pot lua orice valoare din scara lor de variaie: greutatea
unei persoane, nlimea, temperatura, etc.;
B. CALITATIVE
1. nominale - exprimate n cuvinte: profesie, culoarea prului, culoarea
a

tegumentelor, starea la externare a unui bolnav, grupa de aciune


farmacologic (antiinflamator, antipiretic, antireumatic), etc.;
te

2. ordinale - sunt date calitative nominale, n care caracteristicile sau categoriile


sunt ordonate: Graduarea unei afectiuni (Incipient, Moderat, Sever, Stare
critic)
lta

2. Sistematizarea datelor statistice

Statistica opereaz cu volume mari de date. Dac aceste date sunt prezentate ntr-o
cu

form aleatoare neregulat, este dificil, investignd vizual setul de date, s-l caracterizm prin
trsturile sale eseniale, prin valorile extreme, tendina central sau gradul de dispersare. De
aceea, putem nti supune setul de date unor operaii de prezentare sistematic, de organizare,
Fa

de ordonare a acestor date dup unul sau mai multe criterii, ntr-un cuvnt de sistematizare.
Aceast operaie face trecerea de la observarea statistic (n urma creia s-au obinut
datele necesare realizrii obiectivelor investigaiei statistice, verificate sub aspectul volumului
si calitii) si prelucrarea propriuzis.
Sistematizarea este parte a prelucrrii primare a datelor statistice.
Sistematizarea datelor se realizeaz prin gruparea si clasificarea datelor statistice.
Gruparea/clasificarea datelor statistice presupune mprirea unitilor populaiei
statistice observate n grupe sau clase distincte omogene, dup unul sau mai multe criterii.
Atunci cnd criteriul (caracteristica) dup care se realizeaz aceast operaie este unul
1
Facultate de Farmacie
Disciplina Matematic i Biostatistic
numeric, cantitativ, ea se numeste grupare, iar cnd operaia se realizeaz dup un criteriu
(caracteristic) calitativ, nenumeric, ea se numeste clasificare.
Rezultatul sistematizrii datelor prin grupare/clasificare se prezint sub form de:
- serii statistice;
- tabele statistice;
- grafice statistice.

SERII UNIDIMENSIONALE CU VARIABILA EXPRIMAT NUMERIC

e
(CANTITATIV)

i
Considerm o colectivitate P pentru care definim o variabil statistic X ale crei

ac
valori (variante) sunt:
{x1, ... ,xn}
n funcie de tipul variabilei de grupare (discret sau continu) si de plaja valorilor pe
care le poate caracteristica, gruparea se poate face:

rm
- pe variante xi, crora asociem frecvena de apariie corespunztoare ni, unde i=1,k n cazul
unei variabile discrete
- pe intervale Ji=(xi-1, xi), la care asociem frecvena de apariie corespunztoare ni, unde
i=1,k n cazul unei variabile continue

Fa
A.1 Variabile discrete. Gruparea variabilelor statistice pe variante

n acest caz, se va forma un numr de grupe egal cu numrul de variante. Prin


numrarea unitilor incluse n fiecare grup se obine frecvena grupei (numit si frecven
absolut).
de
Exemplu: Considerm o colectivitate statistic (P) formata din 19 pacienti (nou nascui)
pentru care definim si urmrim experimental variabila scor apgar:
VSA = Variabila scor Apgar = {1,2,...,10}
a

n excel ni=COUNTIF(range,criteria)
range - cuprinde valorile pe care dorim s le grupm (Valorile din Coloana F
te

Scor Apgar) ;
criteria - valorea unic dup care dorim s facem gruparea ;
lta
cu
Fa

2
Facultate de Farmacie
Disciplina Matematic i Biostatistic
Tabele de frecven

Frecvena Frecvena Frecvena Frecvena relativ


Varianta
absolut relativ absolut cumulat cumulat
( ( ( (

x1 n1 N1= n1 F1= f1

e
x2 n2 N2= N1 + n2 F2=F 1 + f2

i
ac
... ... ... ...

xi ni Ni= Ni-1 + ni Fi=Fi-1 + fi

rm
... ... ... ...

xk nk Nk= Nk-1 + nk= n Fk= Fk-1 + fk= 1

Total n 1

Fa
Frecvena absolut (ni) reprezint un indicator care ne arat numrul valorilor xi care
se gsesc n intervalul J i (x i1 , x i ) i care proprietatea c:
k
ni n
- -
de
i 1
Frecven relativ (fi) este considerat un indicator sub form de coeficient, sau sub
form procentual, ce arat de cte ori sau ct la sut reprezint partea considerat dintr-
un ntreg.
ni k ni k
fi , unde f i 1 sau f i 100 , unde f i 100%
a

k k
i 1 i 1
ni ni
i 1 i 1
te

Frecvena cumulat absolut (Ni) sau relativ (Fi), exprim numrul unitilor,
respectiv al ponderilor lor fa de total, cumulate pn la () sau peste () nivelul
considerat al caracteristicii (valori < xi, respectiv valori > xi).
lta

N1 n1 , ... , N i N i1 n i , ..., N k N k 1 n k n
F1 f1 , ... , Fi Fi1 f i , ..., Fk Fk 1 f k 1

Reprezentri grafice n Excel


cu

- Graficul (diagrama) prin coloane sau benzi (bare)


7 10
6 6 5
Fa

6 9 6
5
8 6
5
7 1
4 6 1
3 5 0
4 0
2 3 0
1 1
1 2 0
0 0 0 0 0 1 0
0
1 2 3 4 5 6 7 8 9 10 0 2 4 6 8
Scor

Scor

Grafic coloan Grafic Bar


3
Facultate de Farmacie
Disciplina Matematic i Biostatistic
- Diagrama de structur (Grafic Pie) - este folosit pentru a reprezenta grafic structura
unei colectiviti, sistematizate dup valorile unei variabile cantitative sau calitative

0.00%
5.26%
26.32%
5.26%

31.58%

e
31.58%

i
ac
1 2 3 4 5 6 7 8 9 10

rm
- Poligonul frecvenelor (graphic line) - este utilizat pentru reprezentarea grafic a
distribuiilor de frecvene absolute sau relative, atunci cnd sistematizarea datelor s-a
fcut dup o caracteristic numeric continu sau discontinu

7
6
5
4
Fa 6 6
5
de
3
2
1 1 1
0 0 0 0 0 0
1 2 3 4 5 6 7 8 9 10
a
te

A.2 Variabile continue. Gruparea pe intervale de variaie

Pentru gruparea datelor statistice pe intervale egale de variaie se parcurg urmtorii pai:
lta

Calcularea amplitudinii variaiei ca diferen ntre valoarea maxima (xmax) i valoarea


minima (xmin) nregistrat de variabila anlizat:
cu

A=xmax-xmin
Determinarea mrimii (L) fiecrui interval de grupare:
Fa

unde:
A= amplitudinea absolut a variaiei
k= numrul de grupe/interval de variaie
k=1+3.32lgn (Huntsbergers)
n- numrul total de observaii
Dup ce se afl mrimea i numrul intervalelor de grupare, se trece la stabilirea
limitelor fiecrei grupe, pornind de la valoarea minima a carecteristicii nregistrate
(xmin). La ea se adaug pentru fiecare din cele k interval n parete mrimea
grupei/intervalului L
4
Facultate de Farmacie
Disciplina Matematic i Biostatistic
Ji
(x1=xmin,x2= x1+L]
(x2,x3= x2+L]
(x3, x4= x3+L]
.
.

Exemplu: Considerm o colectivitate statistic formata din 19 de nou nascuti, pentru care

e
definim variabila statistic Greutate (Kg). Variantele acestei variabile sunt date n coloana A
(domeniul A2:A20).

i
ac
n Excel ni=FREQUENCY(data_array, bins_array)
data_array- un vector care cuprinde valorile pe care dorim s le grupm pe
intervale (Valorile din coloana Grautate);
bins_arrray- un vector care cuprinde capetele superioare intervalelor de

rm
grupare (valorile din coloana Xi)
Obs. Funcia trebuie introdus ca o formul matrice.

Fa
de
a
te

Tabele de frecven

Frecvena Frecvena Frecvena Frecvena relativ


lta

Varianta
absolut relativ absolut cumulat cumulat
( ( ( (
(x -x ] n1 N1= n1 F1= f1
cu

0 1

(x -x ] n2 N2= N1 + n2 F2=F 1 + f2
1 2
Fa

... ... ... ...


(x -x ] ni Ni= Ni-1 + ni Fi=Fi-1 + fi
i-1 i

... ... ... ...


(x -x ] nk Nk= Nk-1 + nk= n Fk= Fk-1 + fk= 1
k-1 k

Total n 1 - -
5
Facultate de Farmacie
Disciplina Matematic i Biostatistic
Reprezentri grafice n Excel

- Histograma - Histograma conine o succesiune de dreptunghiuri, cu bazele


corespunztoare lungimii intervalelor si nlimile egale cu numrul de observaii din
fiecare interval (sau cu ponderealor). Dac intervalele au mrime egal, atunci si
coloanele vor avea lime egal. Permite vizualizarea distribuiei de frecvene
absolute sau relative, dup o variabil numeric continu (pe intervale).
7

e
6
6

i
5
4 4

ac
4

3
2 2
2
1

rm
1

0
(3,3-3,7](3,7-4,1](4,1-4,5](4,5-4,9](4,9-5,3](5,3-5,7]

- Diagrama de structur (Grafic Pie)

11% 5% 10%
Fa 21%
(3,3-3,7]
(3,7-4,1]
(4,1-4,5]
de
(4,5-4,9]
21%
32% (4,9-5,3]
(5,3-5,7]
a

- Poligonul frecvenelor - Poligonul frecvenelor se poate suprapune peste histogram


te

n cadrul aceluiasi grafic, sau se poate trasa ntr-un grafic separate


7 120.00%
6 100.00%
lta

5
80.00%
Frequency

4
60.00%
3 Frequency
cu

40.00%
2 Cumulative %
1 20.00%
0 0.00%
Fa

6
Facultate de Farmacie
Disciplina Matematic i Biostatistic
B. SERII UNIDIMENSIONALE CU VARIABILA EXPRIMAT NENUMERIC
(CALITATIV)

Sistematizarea datelor efectuat dup o variabil nenumeric se numeste clasificare.


Ea presupune mprirea unitilor n clasele/categoriile variabilei nenumerice considerate.
Se construieste un numr de clase egal cu numrul categoriilor existente, iar prin
numrarea unitilor statistice incluse n fiecare clas obinem frecvena acelei clase (volumul
ei).

e
Exemplu: Considerm o colectivitate statistic (P) formata din 19 pacienti (nou nascui)

i
pentru care definim si urmrim experimental variabila malformaii:

ac
VM = Variabila Malformaii = {Da,Nu}
ni=COUNTIF(range, criteria)

rm
Fa
de
a

Obdervaie: Gruparea n funcie de o caracteristic nominativ (calitativ sau nenumeric),


tebelele de frecven i graficele seamn cu gruparea variabilelor statistice pe variante
te

(variabile discrete).
lta
cu
Fa

S-ar putea să vă placă și