Documente Academic
Documente Profesional
Documente Cultură
Curs 3 Informatica Medicala 1aprilie 2020
Curs 3 Informatica Medicala 1aprilie 2020
2
• 2.1. EXEMPLU:
– studiul dezvoltarii copiilor
• populatia: copii de 10 ani, din Galati,
in 2004
• dimensiunea: 400 copii
• date colectate : inaltimea, in cm
• acuratetea : 1 cm
– tabel de date si histograma
3
TABEL şi HISTOGRAMA
4
Concluzii:
5
2.2. INDICATORII
TENDINTEI CENTRALE
A) Media aritmetică
B) Mediana
C) Moda
6
– a) MEDIA ARITMETICA (MEAN):
( )
N
X̄ = ∑ X i /N
i=1
7
• b) MEDIANA (MEDIAN)
– VALOAREA CARE IMPARTE ESANTIONUL IN
DOUA PARTI EGALE
• Ex: pentru un numar par sau impar de elemente
• Recomandata pentru variable ordinale
• c) MODA (MODE)
– VALOAREA CEA MAI FRECVENTA
– CLASE MODALE
– DISTRIBUTII UNI~, BI~, MULTIMODALE
• recomandate pentru variable nominale
8
• d) POZITIA RELATIVA
– DISTRIBUTII SIMETRICE :
– X = Me = Mo
– DISTRIBUTII ASIMETRICE (skew):
– X = cea mai sensibila valoare
– Mo = cea mai robusta (putin sensibila)
9
2.3. INDICATORI DE
DISPERSIE
10
A) Variabile numerice
a) DEVIAŢIA STANDARD (s)
b) VARIANŢA (s2)
c) COEFICIENTUL DE VARIAŢIE (cv)
√ ∑ ( xi −x )
2
s=
n−1
cv=s/ x
11
d) DISTRIBUTIA NORMALA (GAUSS)
REPREZENTARE GRAFICA
12
e) Intervale definite cu “s”
x i ∈( x−s, x +s);p= 68%
x i ∈( x−2 s, x +2 s );p= 95%
x i ∈( x−3 s, x +3 s );p= 99. 7%
• p = proportia indivizilor care au marimea in
intervalul respectiv
• p = probabilitatea ca un individ sa aiba marimea in
intervalul respectiv
14
g) DISTRIBUTIA GAUSS
NORMALIZATA
15
B) Variabile ordinale (rang)
• QUANTILE– impartirea in “n” intervale
• CAZURI PARTICULARE
– MEDIANA n=2
– QUARTILE n=4
– DECILE n = 10
– CENTILE n = 100
– PROMILE n = 1000
• Calcul: dupa ordonare!
16
C) Variabile calitative (nominale)
• Proporţia Clasei:
pi = Ni / N (procentul … 100)
• Deviatia standard a proporţiei:
s p = √ pi q i / N
q i=1− pi
• pi – probabilitatea de a aparţine clasei
• qi – probabilitatea de a nu aparţine clasei
17
ESTIMAREA
STATISTICA
18
Reluare exemplu: studiu privind dezvoltarea
somatică a copiilor de 10 ani din Galati
• EX: studiu inaltimea copiilor: n=25 copii
m=137 cm
s=5 cm
19
DISTRIBUTIA NORMALA (GAUSS)
REPREZENTARE GRAFICA
[Valori individuale]
20
1.1. Conceptul de estimator
Ex.
• Pentru POPULATIE
• Ex: “Care este inaltimea medie a copiilor din
Galati?”
• Caracteristicile populatiei –
– prin “inferenta statistica”
• Variaţia mediilor eşantioanelor –
– “variabilitate de eşantionare”
21
1.2. Distributia mediilor esantioanelor
Reprezentare grafica
22
1.3. Eroarea standard a mediei: sx = s /√ n
• în exemplu: sx = 5 / √ 25 = 1 cm
• interpretare 23
1.4. DEFINITII
– a) DEVIATIA STANDARD =
• INDICATOR DE DISPERSIE CARE ARATA
IMPRASTIEREA VALORILOR INDIVIDUALE
IN JURUL MEDIEI ESANTIONULUI
24
1.5. Conceptul de estimator
- comentarii -
Elemente centrale:
25
EXERCITIU
• Pentru un grup de N = 36 pacienti cardiaci am gasit
media tensiunii sistolice de 150 mm Hg cu o deviatie
standard de 12mm.
• a) In ce interval sunt situate 68% din valorile
tensiunii sistolice ale pacientilor?
• b) In ce interval gasim valoarea medie a tensiunii
sistolice cu o probabilitate de 95% ?
• c) Cati pacienti (in %) au tensiunea sistolica peste
162 mm?
26
1.6. INDICATORI DE DISPERSIE
PENTRU VARIABILE NOMINALE
• Proporţia Clasei:
pi = Ni / N (procentul … 100)
• Eroarea standard a proporţiei:
s p = √ pi q i / N
q i=1− pi
• pi – probabilitatea de a aparţine clasei
• qi – probabilitatea de a nu aparţine clasei
27
1.7. Generalizare
TIPURI DE ESTIMARE
STATISTICA
• PENTRU
– MEDII
– PROPORTII
– DIFERENTE (intre medii, proportii)
28
A. ESTIMAREA MEDIEI
– a) ESANTIOANE MARI N > 30
– X = ARE DISTRIBUTIE NORMALA
• (INDIFERENT DE DISTRIBUTIA INDIVIDUALA)
•1–α - z α/2
• 68% - 1
• 90% - 1.65
•
•
95%
95.4%
-
-
1.96
2 X^ ∈ ( X̄±z α /2 . s x )
• 99% - 2.58
• 99.7% - 3
29
b) ESANTIOANE MICI N < 30
– X - ARE DISTRIBUTIE “t”
– GRADE DE LIBERTATE
B. PENTRU PROPORTII
P^ ∈ ( P± z α /2 .s p )
Ex: Intr-un studiu privind distributia grupelor
sanguine efectuat pe 400 persoane, 144 au avut
grupa sanguina A. In ce interval se gaseste
procentul celor de grupa A, cu incredere de 95%30 ?
1.5. Dimensiunea esantionului
• se alege “precizia” incadrarii mediei pop. si nivelul de
incredere
– se estimeaza eroarea standard “sx”
• deviatia standard trebuie cunoscuta:
– din studii anterioare
– studiu peliminar
– metoda celor 6s intre Max si min
• se calculeaza “n”:
n = ( s / sx ) 2
• Exemplu:
– Inaltimea medie a copiilor cu precizie ±2 cm, 1- = 95%
– Acelasi caz, cu precizie ±1 cm 31
2. TESTE STATISTICE
32
2.1. DIFERENTE SEMNIFICATIVE SI
NESEMNIFICATIVE
a) Exemplu:
BAIETI FETE FETE
n = 25 n = 25 n = 25
X = 137 cm X = 138.5 cm X = 139.5 cm
s = 5 cm s = 5 cm s = 5 cm
sx = 1 cm sx = 1 cm sx = 1 cm
(135, 139) ...95% D.nesemnificative D.semnificative
33
b) DEFINITII
• DIFERENTE NESEMNIFICATIVE
• Au probabilitate mare sa apara din intamplare
• Cauza: Variabilitatea de esantionare
• Cele doua esantioane apartin aceleeasi populatii
• DIFERENTE SEMNIFICATIVE
• Au probabilitate mica sa apara din intamplare
• Trebuie atribuite altei cauze
34
35
36
2.2. TESTE STATISTICE
a) Definitie
Procedeu statistic de evaluare a gradului de
semnificaţie a diferenţelor între parametrii
statistici ai seriilor experimentale
b) Pasi de aplicare
A. IPOTEZE STATISTICE
B. PRAG DE SEMNIFICAŢIE
C. CALCULUL LUI “p”
D. DECIZIA TESTULUI
37
2.2.A. IPOTEZE STATISTICE
• a) IPOTEZA DE NUL (DE ZERO)
– H0 : X1 = X2
• (semnul = nu este MATEMATIC ci STATISTIC)
– Nu sunt diferente semnificative intre cele
doua valori (esantioane)
• b) IPOTEZE ALTERNATIVE
– H1 : X1 X2 (bilaterala) – cea mai uzuală
X1 > X2 , X1 < X2 (unilaterala)
38
2.2.B. PRAG DE SEMNIFICATIE
– a) DEFINITIE:
• valoarea probabilitatii sub care incepem sa
consideram diferentele ca semnificative
– b) VALOARE UZUALA:
• = 0.05 = 5 %
– c) NIVEL DE INCREDERE (confidenta)
• 1 - = 0.95 = 95 %
40
2.3. CARACTERISTICILE
TESTELOR STATISTICE
• 2.3.1. ERORI
– TIP I: H0 = ADEVARATA, DAR RESPINSA
– TIP II: H0 = FALSA, DAR ACCEPTATA
• 2.3.2. Increderea (confidenta) testului = 1 -
• 2.3.3. Puterea testului = 1 -
(Ele variaza invers proportional)
41
2.4. Clasificarea testelor
• 2.4.1. Teste Parametrice si Neparametrice
– Parametrice - pt. variabile distribuite normal
– Neparametrice - pentru alte distributii
• 2.4.2. Teste Pereche şi Nepereche
• 2.4.3. Teste Unilaterale si Bilaterale (dupa Ha)
• 2.4.4. Clase de Teste
– Teste de semnificatie – ind. tendintei centrale
– Teste de omogenitate – ind. dispersie
– Teste de concordanta - distributii
– Teste de independenta
– Teste pentru coeficientul corelatie 42
Va multumesc!