Documente Academic
Documente Profesional
Documente Cultură
Statistica pe scurt
aa
Ne gândim la ce putem calcula
Numărăm
Tabel de
cazurile pe Frecvențe
frecvențe
fiecare categorie
Tabel de
Rapoarte Proporții
contingență
Ne gândim la cum să reprezentăm grafic variabila
• o variabilă calitativă
• Grafic pie/ column/ bar
! Denumire fictivă
Frecvența în populație
Populație P
Obiectiv: studiul parametrului unei variabile calitative în populație
• Frecvențe π1 , π2 , ...
• Se calculează indicatorii
• Frecvențe f1, f2
2.
Cum? • Prin test statistic
• se testează ipoteza cum că nu avem două populații diferite, ci
aceeasi populație din p. de v. al frecvențelor variabilei testate
• Obținem probabilitatea p – probabilitatea găsirii unor diferențe egale
3. sau mai mari (extreme) decât cea găsită pe eșantionul aflat în studiu
dacă repetăm studiul pe alte eșantioane cu selecție întâmplătoare (se
datorează întâmplării)
Ipoteza nulă H0 - presupune negarea obiectivului pe
care dorim sa îl investigăm
Ipoteza cum că nu • Nu există o diferență semnificativă statistic între grupuri în cee
avem două a ce privește frecvența
populații diferite, • Nu există o asociere semnificativă statistic între 2 variabile:
• Factor de risc - boală
ci aceeași populație Ipoteza alternativă H1 (negarea lui H0): se refera la obiectivul pe
din p. de v. al care dorim sa îl investigăm
distribuției • Există o diferență semnificativă statistic între grupuri în ceea ce
privește frecvența
frecvențelor • Există o asociere semnificativă statistic între 2 variabile:
variabilei studiate • Factor de risc - boală
Testul statistic --> alegem între cele două posibilități H0 sau H1
Ipoteza nulă H0: Ipoteza alternativă H1:
1
Test McNemar
O frecvență? Da Două frecvențe? Da
Test Z pentru o
proporție
Test Hi-pătrat Test Hi-pătrat cu Test Fisher
corecția Yates exact
Scenariu: În unele cazuri,
imediat după transplantul de
rinichi apare respingerea
grefei.
Exemplu
Ipoteză: Persoanele obeze
sunt mai dispuse să prezinte
respingerea grefei imediat
după transplantul de rinichi
Identificăm variabilele de interes și populațiile
• Variabile • Populație
• Factor de risc – Obezitatea • Persoane care au suferit transplant de rinichi
• Variabilă calitativă dihotomială
A. Sub-populații
• Boală – Respingerea grefei
• Persoanele obeze care au suferit transplant de
• Variabilă calitativă dihotomială
rinichi
• Persoane ne-obeze care au suferit transplant
de rinichi
B. Sub-populații
• Persoanele care au avut respingerea grefei
după transplant de rinichi
• Persoanele care nu au avut respingerea grefei
după transplant de rinichi
Transformăm întrebarea medicală în
ipoteze statistice testabile
Frecvența respingerii grefei după transpla Frecvența obezității diferă
nt de rinichi (până la o lună) diferă • la persoanele care au
• la persoanele obeze respingerea grefei după (până la o lună)
• la persoanele ne-obeze transplant de rinichi
• la persoanele care nu au avut respinger
ea grefei după (până la o lună)
transplant de rinichi
Alegem această ipoteză
df = (2 linii-1) x (2 coloane-1) = 1
Calculăm talia eșantioanelor
Frecvența respingerii grefei • Considerăm de importanță medicală
Frecvențe pe linii
Culegerea datelor Respingere Respingere Total
de grefă+ de grefă- (%)
(%)
Pe eșantion am găsit o Obez+ (%) 3,33 100
diferență între frecvențe de Obez- (%) 4,13 100
3,33-4,13 = -0,8%
Alegerea
testului
Tabel de contingență df=1? Da df = (2 linii-1) x (2 coloane-1) = 1
Test Hi-pătrat cu
corecția Yates
Formularea ipotezelor
Ipoteza nulă H0 Ipoteza alternativă H1
• Nu există o diferență semnificativă st • Există o diferență semnificativă stati
atistic între obezi și ne- stic între obezi și ne-
obezi în ceea ce privește frecvența obezi în ceea ce privește frecvența r
respingerii grefei după (până la espingerii grefei după (până la o lun
o lună) transplant de rinichi ă) transplant de rinichi
• Nu există o asociere semnificativă st • Există o asociere semnificativă statis
atistic între obezitate și respingerea tic între obezitate și respingerea gre
grefei după (până la fei după (până la o lună) transplant
o lună) transplant de rinichi de rinichi
Parametrul testului statistic
• exprimă diferenţa dintre indicatorii/parametrii (ex. frecvențe, tabel
de contingență observat și teoretic) comparați
• cel puţin unul este o statistică (frecvență) pe eşantion
Eşantionul /eşantioanele - aleator extras/e din populaţie
- o variabilă aleatoare
• urmează o anumită lege de probabilitate
• Ex. Legea Hi-pătrat etc.
Alegerea regiunii critice
• Ce decidem? ipoteza nulă sau alternativă,
• decidem în funcţie de valoarea parametrului calculat al testului
• Alegerea dimensiunii regiunii critice
• în funcție de mărimea riscului de eroare pe care îl acceptăm
• Nivelul de semnificaţie α = mărimea riscului pe care suntem dispuşi
să ni-l asumăm la respingerea ipotezei nule H0 în cazul în care aceasta
este adevărată
• De obicei se alege un nivel de semnificaţie de 1% sau 5%.
Alegerea nivelului de semnificație și stabilirea
regiunii critice
• Alegem semnificația statistică α=5%
• Regiunea critică (3,84; +∞)
• Regiunea de respingere
diferență
p = 0,248 > 0,05 p = aria de
sub curbă
Concluzia: Nu există o asociere semnificativă statistic între obezitate și respingerea grefei în prima
lună după transplant de rinichi
B. Decizia testului în funcție de probabilitatea p – probabilitatea de a găsi o diferență
egală sau mai mică decât cea găsită dacă repetăm studiul:
• Dacă p < 0,05
• avem suficiente dovezi să respingem H0, deci acceptăm H1
• Dacă p ≥ 0,05
• NU avem suficiente dovezi să respingem H0, deci suntem în favoarea lui H0
• Concluzia: Nu există o asociere semnificativă statistic între obezitate și respingerea grefei după (
până la o lună) transplant de rinichi, adică probabilitatea de a găsi o diferență egală cu 1,33%
sau mai mică decât cea găsită dacă repetăm studiul
Nu am reușit să arătăm că avem două
sub-populații diferite obezi și ne-obezi)
din punctul de vedere al frecvenței
Decizia respingerii grefei, ci aceeași populație
RR –
riscul
relativ
RIE – rata
îmbolnăv
irii la
cei expuși
Media Deviația
Mediana Modul
aritmetică standard
Coeficient de Coeficient de
Asimetrie Boltire
corelație determinare
Grafice
• Histogramă
- o variabilă cantitativă
• Cutie cu mustăți Mike Yi. Data
tutorial. https://chartio.com/learn/charts/histogram-
complete-guide/
• - o variabilă cantitativă
pe un grup
pe grupuri
testări repetate
• XY Scatter
- două variabile cantitative
Distribuția normală
SUNT DATELE NORMAL DISTRIBUITE?
Indicatori
Media, modulul și mediana aproape egale
Asimetria aproape de 0, între [-1; 1]
Boltirea aproape de 0, între [-1; 1]
Metoda grafică
Histograma sub formă de clopot
Cum să răspundeți la întrebări medicale?
Răspundem la o anumită întrebare de cercetare (ipoteza de studiu)
• prin realizarea de studii medicale
1. Pregătirea studiilor (protocolul de cercetare)
2. Identificăm variabilele de interes și populațiile
3. Transformăm întrebările medicale în ipoteze statistice testabile
4. Alegem testul statistic adecvat ipotezei sau metoda intervalului de încredere
5. Calculăm talia necesară a eșantioanelor
6. Realizăm studiul
7. Culegem datele
8. Executăm analiza datelor
9. Răspundem la întrebarea medicală prin analiza rezultatelor
Aceeași pași
MEDIA în populație Girafa iubitoare
Populație P
Obiectiv: studiul parametrului unei variabile CANTITATIVE în populație
• Se calculează indicatorul
Limita Limita
inferioară Intervalul de încredere superioară
• Se calculează indicatorii
2. • Medie m1, m2
ci aceeași populați
Ipoteza alternativă H1 (negarea lui H0):
e din p. de v. al se refera la obiectivul pe care dorim sa îl investigăm
distribuției • Există o diferență semnificativă statistic între grupuri în
mediilor variabilei ceea ce privește media
studiate
Testul statistic --> alegem între cele două posibilități H0
sau H1
Scenariu: La unii pacienți
imediat după transplantul de
rinichi apare diabetul.
Exemplu
Ipoteză: Persoanele obeze
sunt mai dispuse să prezinte
diabet imediat după
transplantul de rinichi
Identificăm variabilele de interes și populațiile
• Variabile • Populație
• Factor de risc – Obezitatea • Persoane care au suferit transplant de rinichi
• Variabilă calitativă dihotomială
A. Sub-populații
• Boală – Diabet
• Persoanele obeze care au suferit transplant de
• Variabilă calitativă dihotomială
rinichi
• Persoane ne-obeze care au suferit transplant
de rinichi
B. Sub-populații
• Persoanele care au avut diabet
după transplant de rinichi
• Persoanele care nu au avut diabet
după transplant de rinichi
Transformăm întrebarea medicală în ipoteze
statistice testabile
Media glicemiei după transplant de rinichi Media greutății diferă
(la o lună) diferă • la persoanele care au avut
• la persoanele obeze diabet după (la o lună)
• la persoanele ne-obeze transplant de rinichi
• la persoanele care nu au avut diabet du
pă (la o lună) transplant de rinichi
Obez + Obez-
(n=15) (n=15)
Glicemia (mg/dl) 160±20 95±10
Media±Deviația standard
Pe eșantion am găsit
o diferență între medii de 65
distribuție normală a glicemiei pe ambele eșantioane
Testarea varianțelor - aplicăm testul Fisher
Obez + Obez-
(n=15) (n=15)
Glicemia (mg/dl) 160±20 95±10
Media±Deviația standard
Testăm dacă în populație
varianțele, adică s12=202
Pe eșantion am găsit cu s22=102 sunt egale?
o diferență între medii de 65
distribuție normală a glicemiei pe ambele eșantioane
Test Fisher --> p<0,05
Testarea varianțelor
Formularea ipotezelor
Ipoteza nulă H0 Ipoteza alternativă H1
• Nu există o diferență semnificativă • Există o diferență semnificativă statistic într
statistic între obezi și ne- e obezi și neobezi în ceea ce privește media
obezi în ceea ce privește media glicemiei lao lună după transplant de rinichi
glicemiei la o lună după transplant
de rinichi
Distribuția normală versus diverse distributii t
• distribuția Student depinde de
gradele de libertate
• df = numărul de grade de
libertate
• df=n1+n2-2
• df=15+15-2=28 Normal distribution t distribution (df=1)
t distribution (df=3) t distribution (df=20)
Regiunea de respingere
(-∞,-1,7] ∪[1,7; +∞)
Regiunea de acceptare
(-1,7; 1,7) -1,7 1,7
p = 1-α =95%
aria de sub curbă
p = α/2 =2,5% p = α/2 =2,5%
aria de sub curbă aria de sub curbă
• Dacă p ≥ 0,05
• NU avem suficiente dovezi să respingem H0, deci suntem în favoarea lui H0
• Coeficientul de corelație
Important