Sunteți pe pagina 1din 43

INFORMATICA MEDICALA

Curs 30 martie 2020


2. PARAMETRII
STATISTICI

2
• 2.1. EXEMPLU:
– studiul dezvoltarii copiilor
• populatia: copii de 10 ani, din Galati,
in 2004
• dimensiunea: 400 copii
• date colectate : inaltimea, in cm
• acuratetea : 1 cm
– tabel de date si histograma

3
TABEL şi HISTOGRAMA

4
Concluzii:

– valori extreme - rare


– valori centrale - mai des
• INDICATORI AI TENDINTEI
CENTRALE
– variabilitatea
• INDICATORI DE DISPERSIE

5
2.2. INDICATORII
TENDINTEI CENTRALE

A) Media aritmetică
B) Mediana
C) Moda

6
– a) MEDIA ARITMETICA (MEAN):

( )
N
X̄ = ∑ X i /N
i=1

7
• b) MEDIANA (MEDIAN)
– VALOAREA CARE IMPARTE ESANTIONUL IN
DOUA PARTI EGALE
• Ex: pentru un numar par sau impar de elemente
• Recomandata pentru variable ordinale
• c) MODA (MODE)
– VALOAREA CEA MAI FRECVENTA
– CLASE MODALE
– DISTRIBUTII UNI~, BI~, MULTIMODALE
• recomandate pentru variable nominale

8
• d) POZITIA RELATIVA
– DISTRIBUTII SIMETRICE :
– X = Me = Mo
– DISTRIBUTII ASIMETRICE (skew):
– X = cea mai sensibila valoare
– Mo = cea mai robusta (putin sensibila)

9
2.3. INDICATORI DE
DISPERSIE

A) Pentru variabile numerice


B) Pentru variabile ordinale
C) Pentru proporţii

10
A) Variabile numerice
a) DEVIAŢIA STANDARD (s)
b) VARIANŢA (s2)
c) COEFICIENTUL DE VARIAŢIE (cv)

√ ∑ ( xi −x )
2
s=
n−1
cv=s/ x
11
d) DISTRIBUTIA NORMALA (GAUSS)
REPREZENTARE GRAFICA

12
e) Intervale definite cu “s”
x i ∈( x−s, x +s);p= 68%
x i ∈( x−2 s, x +2 s );p= 95%
x i ∈( x−3 s, x +3 s );p= 99. 7%
• p = proportia indivizilor care au marimea in
intervalul respectiv
• p = probabilitatea ca un individ sa aiba marimea in
intervalul respectiv

EX: studiu inaltimea copiilor: n = 25 copii


m = 137 cm (ac=1)
s = 5 cm
13
f) Curba Gauss - Proprietăţi
2
( x−m )

1 2 s2 x−μ
f ( x )=y= e z=
√2 ps σ
• Depinde de doi parametri:
– μ = media (populaţiei)
– σ = deviaţia standard (a populaţiei)
• Curba normalizată (funcţie de z)
– are media μ=0 si deviaţia standard σ=1

EX: studiu inaltimea copiilor: n = 25 copii


m = 137 cm (ac=1)
s = 5 cm

14
g) DISTRIBUTIA GAUSS
NORMALIZATA

15
B) Variabile ordinale (rang)
• QUANTILE– impartirea in “n” intervale
• CAZURI PARTICULARE
– MEDIANA n=2
– QUARTILE n=4
– DECILE n = 10
– CENTILE n = 100
– PROMILE n = 1000
• Calcul: dupa ordonare!

16
C) Variabile calitative (nominale)

• Proporţia Clasei:
pi = Ni / N (procentul … 100)
• Deviatia standard a proporţiei:
s p = √ pi q i / N
q i=1− pi
• pi – probabilitatea de a aparţine clasei
• qi – probabilitatea de a nu aparţine clasei
17
ESTIMAREA
STATISTICA

18
Reluare exemplu: studiu privind dezvoltarea
somatică a copiilor de 10 ani din Galati
• EX: studiu inaltimea copiilor: n=25 copii
m=137 cm
s=5 cm

• p = proportia indivizilor care au marimea in intervalul respectiv


• p = probabilitatea ca un individ sa aiba marimea in intervalul respectiv

x i ∈( x−s, x +s) ;p= 68%


x i ∈( x−2 s, x +2 s ) ;p= 95%
x i ∈( x−3 s, x +3 s ) ;p= 99. 7%

19
DISTRIBUTIA NORMALA (GAUSS)
REPREZENTARE GRAFICA
[Valori individuale]

20
1.1. Conceptul de estimator
Ex.
• Pentru POPULATIE
• Ex: “Care este inaltimea medie a copiilor din
Galati?”
• Caracteristicile populatiei –
– prin “inferenta statistica”
• Variaţia mediilor eşantioanelor –
– “variabilitate de eşantionare”

21
1.2. Distributia mediilor esantioanelor
Reprezentare grafica

22
1.3. Eroarea standard a mediei: sx = s /√ n

μ ∈( x−s x , x +s x );p= 68%


μ ∈( x−2 s x , x +2 s x );p= 95%
μ ∈( x−3 s x , x +3 s x );p= 99. 7%
• p = probabilitatea ca media populatiei ( μ ) sa fie
situata in intervalul respectiv
(se alege conventional p = 95 %)

• în exemplu: sx = 5 / √ 25 = 1 cm
• interpretare 23
1.4. DEFINITII

– a) DEVIATIA STANDARD =
• INDICATOR DE DISPERSIE CARE ARATA
IMPRASTIEREA VALORILOR INDIVIDUALE
IN JURUL MEDIEI ESANTIONULUI

– b) EROAREA STANDARD A MEDIEI =


• INDICATOR DE DISPERSIE CARE ARATA
IMPRASTIEREA MEDIILOR
ESANTIOANELOR IN JURUL MEDIEI
POPULATIEI

24
1.5. Conceptul de estimator
- comentarii -
Elemente centrale:

• Valoarea reală a mediei populaţiei rămâne


necunoscută – de aici termenul de “estimaţie”
• NU “ce valoare”, ci “în ce interval”
• INTOTDEAUNA avem un nivel limitat de
incredere (exprimat probabilistic – convenţional 95
%)

25
EXERCITIU
• Pentru un grup de N = 36 pacienti cardiaci am gasit
media tensiunii sistolice de 150 mm Hg cu o deviatie
standard de 12mm.
• a) In ce interval sunt situate 68% din valorile
tensiunii sistolice ale pacientilor?
• b) In ce interval gasim valoarea medie a tensiunii
sistolice cu o probabilitate de 95% ?
• c) Cati pacienti (in %) au tensiunea sistolica peste
162 mm?

26
1.6. INDICATORI DE DISPERSIE
PENTRU VARIABILE NOMINALE

• Proporţia Clasei:
pi = Ni / N (procentul … 100)
• Eroarea standard a proporţiei:
s p = √ pi q i / N
q i=1− pi
• pi – probabilitatea de a aparţine clasei
• qi – probabilitatea de a nu aparţine clasei
27
1.7. Generalizare
TIPURI DE ESTIMARE
STATISTICA

• PENTRU
– MEDII
– PROPORTII
– DIFERENTE (intre medii, proportii)

28
A. ESTIMAREA MEDIEI
– a) ESANTIOANE MARI N > 30
– X = ARE DISTRIBUTIE NORMALA
• (INDIFERENT DE DISTRIBUTIA INDIVIDUALA)
•1–α - z α/2
• 68% - 1
• 90% - 1.65


95%
95.4%
-
-
1.96
2 X^ ∈ ( X̄±z α /2 . s x )
• 99% - 2.58
• 99.7% - 3

29
b) ESANTIOANE MICI N < 30
– X - ARE DISTRIBUTIE “t”
– GRADE DE LIBERTATE

B. PENTRU PROPORTII

P^ ∈ ( P± z α /2 .s p )
Ex: Intr-un studiu privind distributia grupelor
sanguine efectuat pe 400 persoane, 144 au avut
grupa sanguina A. In ce interval se gaseste
procentul celor de grupa A, cu incredere de 95%30 ?
1.5. Dimensiunea esantionului
• se alege “precizia” incadrarii mediei pop. si nivelul de
incredere
– se estimeaza eroarea standard “sx”
• deviatia standard trebuie cunoscuta:
– din studii anterioare
– studiu peliminar
– metoda celor 6s intre Max si min
• se calculeaza “n”:

n = ( s / sx ) 2
• Exemplu:
– Inaltimea medie a copiilor cu precizie ±2 cm, 1- = 95%
– Acelasi caz, cu precizie ±1 cm 31
2. TESTE STATISTICE

32
2.1. DIFERENTE SEMNIFICATIVE SI
NESEMNIFICATIVE
a) Exemplu:
BAIETI FETE FETE
n = 25 n = 25 n = 25
X = 137 cm X = 138.5 cm X = 139.5 cm
s = 5 cm s = 5 cm s = 5 cm
sx = 1 cm sx = 1 cm sx = 1 cm
(135, 139) ...95% D.nesemnificative D.semnificative

33
b) DEFINITII

• DIFERENTE NESEMNIFICATIVE
• Au probabilitate mare sa apara din intamplare
• Cauza: Variabilitatea de esantionare
• Cele doua esantioane apartin aceleeasi populatii

• DIFERENTE SEMNIFICATIVE
• Au probabilitate mica sa apara din intamplare
• Trebuie atribuite altei cauze

34
35
36
2.2. TESTE STATISTICE
a) Definitie
Procedeu statistic de evaluare a gradului de
semnificaţie a diferenţelor între parametrii
statistici ai seriilor experimentale

b) Pasi de aplicare
A. IPOTEZE STATISTICE
B. PRAG DE SEMNIFICAŢIE
C. CALCULUL LUI “p”
D. DECIZIA TESTULUI
37
2.2.A. IPOTEZE STATISTICE
• a) IPOTEZA DE NUL (DE ZERO)
– H0 : X1 = X2
• (semnul = nu este MATEMATIC ci STATISTIC)
– Nu sunt diferente semnificative intre cele
doua valori (esantioane)

• b) IPOTEZE ALTERNATIVE
– H1 : X1  X2 (bilaterala) – cea mai uzuală
X1 > X2 , X1 < X2 (unilaterala)
38
2.2.B. PRAG DE SEMNIFICATIE
– a) DEFINITIE:
• valoarea probabilitatii sub care incepem sa
consideram diferentele ca semnificative
– b) VALOARE UZUALA:
•  = 0.05 = 5 %
– c) NIVEL DE INCREDERE (confidenta)
• 1 -  = 0.95 = 95 %

2.2.C. COEFICIENTUL “P”


P = probabilitatea ca diferentele observate sa
fi aparut din intamplare
39
2.2.D. DECIZIA

• Daca p > 0.05 => Diferente


Nesemnificative, (N) , H0 este acceptata
• Daca p < 0.05 => Diferente Semnificative,
(S), H0 este respinsa
– Daca p < 0.01 => Diferente Foarte
Semnificative, (F), H0 respinsa
– Daca p < 0.001 => Diferente Extrem de
Semnificative, (E), H0 respinsa

40
2.3. CARACTERISTICILE
TESTELOR STATISTICE
• 2.3.1. ERORI
– TIP I: H0 = ADEVARATA, DAR RESPINSA
– TIP II: H0 = FALSA, DAR ACCEPTATA
• 2.3.2. Increderea (confidenta) testului = 1 - 
• 2.3.3. Puterea testului = 1 - 
(Ele variaza invers proportional)
41
2.4. Clasificarea testelor
• 2.4.1. Teste Parametrice si Neparametrice
– Parametrice - pt. variabile distribuite normal
– Neparametrice - pentru alte distributii
• 2.4.2. Teste Pereche şi Nepereche
• 2.4.3. Teste Unilaterale si Bilaterale (dupa Ha)
• 2.4.4. Clase de Teste
– Teste de semnificatie – ind. tendintei centrale
– Teste de omogenitate – ind. dispersie
– Teste de concordanta - distributii
– Teste de independenta
– Teste pentru coeficientul corelatie 42
Va multumesc!

S-ar putea să vă placă și