Documente Academic
Documente Profesional
Documente Cultură
parţiale.
BIOSTATISTICĂ.
Noţiuni de bază. Definiţii
CURS 6
Concepte specifice:
Provocare:
Conceptele statistice pot părea intimidante și dificile.
Planificare Design
STATISTICI INFERENȚIALE
Estimări
Estimări punctuale
Estimări de interval
TESTAREA IPOTEZELOR
Analiză univariată
Analiză multivariată
Concepte specifice:
•STUDIUL •PARAMETRUL
•REZUMATUL •VARIABILA
•EXPERIMENTUL •POPULAŢIA DE OBSERVAŢII
•UNITATEA •EŞANTIONUL DE OBSERVAŢII
•POPULAŢIA •STATISTICA
•EŞANTIONUL DE UNITĂŢI
Fi n
i 1
3. EXPRIMAREA FRECVENŢELOR ŞI SUB ALTE FORME:
FRECVENŢA CUMULATĂ:
Se defineşte ca fiind suma frecvenţei proprii a unei valori
observate cu frecvenţele tuturor valorilor inferioare.
4. REALIZAREA TABELULUI DISTRIBUŢIEI DE FRECVENŢE:
Exemplu: Se consideră un lot format din 370 pacienţi care s-au prezentat la
tratament în Policlinica Stomatologică, prezentând următoarele diagnostice de
urgenţă:
1 – hiperemie pulpară;
2 – pulpită acută seroasă; 5 – fractură odonto-parodontală;
3 – pulpită acută purulentă; 6 – luxaţie ATM;
4 – parodontită apicală acută; 7 – insuficienţă funcţională fizionomică.
DG.URG. F f fp Fc fc fpc
0 10 0,03 3% 10 0,03 3%
1 76 0,21 21% 86 0,24 24%
2 41 0,11 11% 127 0,35 35%
3 53 0,14 14% 180 0,49 49%
4 54 0,15 15% 234 0,64 64%
5 57 0,15 15% 291 0,79 79%
6 45 0,12 12% 336 0,91 91%
7 34 0,09 9% 370 1,00 100%
TOTAL 370 1,00 100%
Elemente recomandate într-un tabel
HISTOGRAMA
FRECVENŢE: 25 23 22
Frecvenţe absolute
20
1. DIAGRAME SIMETRICE: 14
15 13
10 11
10 7 7
5 2 3 2
0
0
0 1 2 3 4 5 6 7 8 9 10 11 12
Diagrama asimetrică
2. DIAGRAME ASIMETRICE: 40 34
35
Frecvenţa absolută
30 26
25 22
20
15 11
10 4 6 5 3 1
5
0
19 20 21 22 23 24 25 26 27
Valorile diametrului
Diagramă hiperbolică
Frecvenţa absolută
300
3. DIAGRAME HIPERBOLICE: 250
195
200
150
100
40 39 42
50 23 22 24 23 21 20 35 36 34 37 32
0
5 10 15 20 25 30 35 40 45 50 55 60 65 70 65 70 75 80
Vârstă
Diagrama bimodala
4. DIAGRAME BIMODALE: 30
Frecventa absoluta
25
20
15
10
5
0
10 20 30 40 50 60 70 80
Varsta
5. GRUPAREA DATELOR ÎN CLASE:
Când valorile studiate variază continuu, cum este cazul greutăţii şi al înălţimii
etc., distribuţia de frecvenţe este foarte dispersată şi nu oferă o interpretare
semnificativă a mulţimii de valori. De aceea, se recurge la reducerea numărului de
valori posibile, grupând valorile vecine. Mai precis, se împarte domeniul de variaţii
posibile într-un număr de intervale sau clase în interiorul cărora se grupează
toate valorile care cad în intervalul corespunzător.
Intervalele de clasă trebuie să fie CONTIGUE şi FĂRĂ SUPRAPUNERI.
40 44 45 49 50 54 55 59
Măsuri
limită
Puncte mediane: 42 47 52 57
+ lungimea intervalului
Formule de calcul pentru numărul intervalelor de
clasă pentru un eşantion dat:
k = 1 + 3.322 *
Relaţia lui H.A. Sturgers: ln(n)
[ ]
1
Relaţia H.B. Mann şi A. Wald 1 5
(pentru n >100): 𝑘=4 ∙ ∙(𝑛 −1)
4
VÂRSTA F f fp Fc fc fpc
1 – 10 ani 29 0,08 8% 29 0,08 8%
11 – 20 ani 124 0,33 33% 153 0,41 41%
21 – 30 ani 111 0,30 30% 264 0,71 71%
31 – 40 ani 43 0,11 11% 307 0,82 82%
41 – 50 ani 30 0,08 8% 337 0,90 90%
51 – 60 ani 18 0,05 5% 355 0,95 95%
61 – 70 ani 3 0,01 1% 358 0,96 96%
71 – 80 ani 1 0,01 1% 359 0,97 97%
81 – 90 ani 7 0,02 2% 366 0,99 99%
91 – 100 ani 4 0,01 1% 370 1,00 100%
TOTAL 370 1,00 100%
POLIGONUL DE FRECVENŢĂ:
20%
gimnaziale; 60
10% liceale
40.5%
fara; 20
0%
Series1
DIAGRAMA TUKEY – Stem and Leaf:
permite reconstituirea datelor şi evaluarea densităţii datelor în fiecare clasă
+ VARIABILE DE STRATIFICARE
DIAGRAMA DE TIP PIRAMIDĂ:
Parametri uzuali de statistică descriptivă.
CLASIFICAREA DATELOR
DATE
DATE
CANTITATIV
CALITATIVE
E
Date
Date
nominal Scala de tip
continue INTERVAL
e
Date
ordinale
REPREZENTAREA DATELOR
Distribuţia de frecvenţe: STUDII
DATE
64
CALITATIVE 70
61
53
60
50
40
30 15
9
Tabelele 20
10
distribuţiei 0
c at
ud
ii
tar
e
ed
ii
ar
e
ifi st io
de frecvenţe n esp
ec
fă
ră
ie
le
m
en
st
u d ii
m
ii
s u per
u di u d
st st
47%
53%
Tabele cu
măsurile valorii
centrale şi
împrăştierii
Histograma
– Poligon de
frecvenţă
Box &
Whisker
Plot
MĂSURILE VALORII CENTRALE
MEDIA ARITMETICĂ:
Se aplică datelor care au valori numerice; fiind date observaţiile x1 , x2 , … , xn
n
media aritmetică se va calcula cu formula:
x
i 1
i
x
MEDIA ARITMETICĂ PONDERATĂ: n
Fiind date observaţiile x1 , x2 , … , xn pentru care se cunosc frecvenţele
absolute F1, F2, … Fn, media aritmetică ponderată se va calcula cu formula:
n
F x F2 x2 ... Fn xn F x i i
x 1 1 i 1
n n
MEDIA CRONOLOGICĂ, MC:
Se foloseşte în cazul seriilor care au variaţii în timp (lunare, semestriale sau
anuale):
x1 / 2 x2 ... xn 1 xn / 2
MC
n 1
MEDIANA, ME:
Se calculează pentru datele care au valori numerice; se ordonează valorile
crescător sau descrescător.
În cazul în care şirul are un număr IMPAR de valori: mediana va fi valoarea
care împarte şirul de valori în două părţi egale.
În cazul în care şirul are un număr PAR de valori: mediana se calculează
făcând media aritmetică a celor două valori din mijlocul şirului.
x M E MO
În cazul distribuţiilor asimetrice:
MĂSURILE ÎMPRĂŞTIERII
VARIANŢA (DISPERSIA):
Este media pătratelor deviaţiilor (abaterilor) de la medie. Fiind dată o serie de
valori x1 , x2 , … , xn , n >30, se calculează cu formula: n
( xi x) 2
( S 2 ) 2 i 1
n
Dacă n < 30, se aplică 0 corecţie a formulei de
calcul: n
( xi x ) 2
DEVIAŢIA STANDARD: n 2
Se defineşte ca fiind rădăcina pătrată a varianţei: ( xi x)
i 1
n
AMPLITUDINEA:
Se defineşte ca diferenţa între cea mai mică şi cea mai mare valoare dintr-un şir
de valori.
𝑊 = 𝐴=𝑥 𝑚𝑎𝑥 − 𝑥 𝑚𝑖𝑛
CUARTILELE:
Sunt 3 valori, notate Q1, Q2 şi Q3, care împart şirul de date în 4 părţi de
dimensiune egală.
Diferenţa dintre Q3 şi Q1 se numeşte interval cuartilic, Iq = Q3 – Q1.
Q1 se numeşte cuartila inferioară sau mică, Q3 se numeşte cuartila superioară
sau mare, iar Q2 este aceeaşi cu mediana şirului.
( )
2
𝑛
𝑥𝑖 − 𝑥
pentru n suficient de mare: ∑ 𝜎
𝑖=1
𝑆 𝑘=
𝑛
( )
2
𝑛
𝑥𝑖 − 𝑥
∑ 𝜎
pentru n < 30: 𝑆 𝑘=
𝑖=1
𝑛 −1
𝑥=𝑀 𝑂= 𝑀 𝐸
distribuţie simetrică
𝑀𝑂 𝑀𝐸 𝑥
asimetrie la dreapta
𝑥 𝑀𝐸 𝑀𝑂
asimetrie la stânga
BOLTIREA (KURTOSIS):
Compară distribuţia dată cu cea normală, sau gaussiană, d.p.d.v. al înălţimii
curbelor.
𝑥4
Coeficientul de boltire: 𝛽 2= 4 Karl Pearson
𝜎
𝑛
∑ ( 𝑥 𝑖 − 𝑥 )2
Coeficientul Fisher: 𝛾 2 = 𝑖 =1 −3
𝑛 − 𝜎4