Sunteți pe pagina 1din 14

Metodologia cercetrii

1
Analiza datelor Analiza datelor II II
Interpretarea rezultatelor Interpretarea rezultatelor
"To consult the statistician after an experiment is finished is often
merely to ask hin to conduct a post mortem examination. He can perhaps
say what the experiment died of.
Presidential Address to the First Indian Statistical Congress, 1938
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor
Inferena statistic
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
Definiie, aplicabilitate
Ipoteza statistic vs. ipoteza clinic
Testarea unei ipoteze statistice:
Etapele unui test statistic
Teste statistice (utilitate, aplicabilitate)
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
Definiie, aplicabilitate
Un test statistic este conceput i utilizat pentru verificarea unei
ipoteze statistice.
De regul, ipoteza care trebuie testat (H
0
, ipoteza nul) se poate
formula ca fiind una n care nu exist nici o schimbare:
Nu exist nici o diferen ntre mediile a dou populaii (media
taliei la o populaie de nou-nscui la termen i respectiv nscui
prematur)
Nu exist diferen semnificativ ntre mediile a dou eantioane
extrase din aceste populaii.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
Termeni
Ipoteza nul (H
0
): ipoteza care urmeaz a fi testat
Ipoteza alternativ (H
1
): opusul ipotezei nule
Prag de semnificaie:
Probabilitatea de eroare acceptat de cercettor
De obicei este de 5% (0,05)
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
Testul statistic
Metod de comparaie a dou sau mai multe populaii, prin
intermediul unor variabile observate ale lor.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
Ipoteza statistic vs ipoteza clinic
Scopul unui test statistic este de a defini realitatea.
Definirea ntrebrii de cercetare (ipoteza clinic):
Tratamentul cu Nebivolol este la fel de eficient ca i
cel cu Valsartan n tratamentul hipertensiunii arteriale?
Transpunerea ntrebrii de cercetare n termeni
statistici (ipoteza statistic):
Media tensiunii arteriale a pacienilor tratai cu
Valsartan nu difer semnificativ de media tensiunii
arteriale a pacienilor tratai cu Nebivolol
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
Etapele unui test statistic
1. Formularea problemei n termenii ipotezelor statistice.
2. Alegerea i calcularea parametrului statistic al testului.
3. Regiunea critic.
4. Concluzia testului.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
1. Formularea problemei n termenii ipotezelor statistice
Ipoteza nul: ipoteza care trebuie testat, testul efectundu-se
sub prezumia c ipoteza nul ar fi adevrat
Ipoteza alternativ: acea ipotez care ntr-un sens sau altul
contrazice ipoteza nul. Aceast ipotez se mai numete i
ipoteza de lucru
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
1. Formularea problemei n termenii ipotezelor statistice
Ipoteza nul: tipuri
O coad (one-tailed sau one-side):
Media este mai mare
Media este mai mic
Dou cozi (one-tailed sau one-side):
Media este egal
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
2. Alegerea i calcularea parametrului statistic al testului
Parametrul statistic al testului exprim ntr-o anumit form,
diferena dintre elementele comparate.
innd seama de faptul c eantionul sau eantioanele utilizate
sunt aleator extrase din populaiile care fac obiectul testului,
parametrul statistic este o variabil aleatoare de selecie, care
urmeaz o anumit lege de probabilitate.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
2. Alegerea i calcularea parametrului statistic al testului
Un parametru statistic al testului bun trebuie s ndeplineasc
dou condiii:
Trebuie s se comporte diferit atunci cnd ipoteza nul H
0
este
adevrat fa de situaia n care ipoteza alternativ H
1
este
adevrat.
Distribuia de probabilitate a parametrului statistic al testului sub
prezumia c H
0
este adevrat, este cunoscut.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
3. Regiunea critic
Trebuie s fim capabili s decidem n funcie de valoarea
parametrului statistic calculat care dintre ipoteze, cea nul sau cea
alternativ, este adevrat.
Dac valoarea parametrului statistic aparine regiunii critice,
ipoteza nul H
0
va fi respins i va fi acceptat ipoteza alternativ
H
1
.
Dac valoarea parametrului statistic nu aparine regiunii critice,
ipoteza nul H
0
va fi acceptat.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
3. Regiunea critic
Decidem mrimea regiunii critice.
Pentru aceasta trebuie s specificm mrimea riscului de eroare pe
care l acceptm.
Pe scurt, definim nivelul de semnificaie, notat cu , sau mrimea
riscului pe care suntem dispui s ni-l asumm n respingerea
ipotezei nule H
0
n cazul n care aceasta este adevrat. De obicei se
alege un nivel de semnificaie ntre 1% i 5%.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
3. Regiunea critic
Decidem mrimea regiunii critice.
Probabilitatea unei erori de tipul I:
probabilitatea de respingere a ipotezei nule H
0
n favoarea ipotezei
alternative H
1
, n condiiile n care H
0
este adevrat.
probabilitatea unei erori de tipul I se noteaz cu i se mai numete
nivel de semnificaie al testului.
Probabilitatea unei erori de tipul II:
probabilitatea acceptrii ipotezei nule n condiiile n care ipoteza
alternativ H
1
este adevrat.
aceast probabilitate se noteaz cu .
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
3. Regiunea critic
Unilateral la dreapta valoarea parametrului statistic al testului este mai
mare sau egal cu valoarea din dreapta a intervalului critic;
Unilateral la stnga valoarea parametrului statistic al testului este mai
mic sau egal cu valoarea din stnga a intervalului critic;
Bilateral valoarea parametrului statistic al testului este mai mic sau egal
cu valoarea extrem din stnga regiunii critice sau mai mare sau egal cu
valoarea extrem din dreapta regiunii critice, valorile extreme ale regiunii
critice avnd nivele egale de semnificaie.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
4. Concluzia testului
Ipoteza nul H
0
este respins dac valoarea parametrului statistic
aparine regiunii critice.
Regiunea critic trebuie astfel aleas nct dac ipoteza alternativ
H
1
este adevrat, probabilitatea de respingere a ipotezei nule H
0
este mai mare dect n cazul n care ipoteza nul H
0
ar fi
adevrat.
Acceptarea ipotezei nule H
0
atunci cnd ipoteza alternativ H
1

este adevrat, este cunoscut ca i eroarea de tipul II.
probabilitatea ei se noteaz cu
msoar nivelul de eroare
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
4. Concluzia testului
n testarea oricrei ipoteze statistice, exist patru situaii care
determin dac decizia noastr este corect sau nu
decizie corect eroare de tipul I H
0
se respinge
eroare de tipul II decizie corect H
0
se accept Concluzie
H
0
este fals H
0
este adevrat
Cazuri
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
Luarea deciziei pe baza valorii probabilitii p de semnificaie
a testului
n momentul n care prelucrm statistic o serie de date dorim s
tim dac rezultatele obinute sunt sau nu semnificative statistic.
Rspunsul la aceast ntrebare este dat de valoarea lui p calculat
de orice program statistic la prelucrarea unor date.
n cazul testelor statistice, ipoteza nul este respins dac nivelul
de semnificaie este mai mic dect 0,05 iar programele de
prelucrare statistic a datelor vor afia o stelu (*) n tabelul
rezultatelor.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
Luarea deciziei pe baza valorii probabilitii p de semnificaie
a testului
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
Luarea deciziei pe baza valorii probabilitii p de semnificaie
a testului
Dac p 0,05: respingem ipoteza nul i acceptm ipoteza
alternativ (am obinut semnificaia statistic)
Dac p > 0,05: acceptm ipoteza nul (nu am obinut
semnificaia statistic)
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
Luarea deciziei pe baza valorii probabilitii p de semnificaie
a testului
p = 0,02
Respingem ipoteza nul
Risc de eroare de tip I
= 0,05
p = 0,13
NU respingem ipoteza nul
Risc de eroare de tip II
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
Semnificaia lui p
Criteriu de luare a deciziei cu privire la o ipotez statistic nul
Cuantific ansa ca o decizie de respingere a ipotezei nule s fie
greit
Msur a semnificaiei statistice i NU CLINIC
Semnificaia lui p (reguli empirice):
0,01 p < 0,05: rezultatul e semnificativ statistic
0,001 p < 0,01: rezultatul e nalt semnificativ statistic
p < 0,001: rezultatul e foarte nalt semnificativ statistic
p 0,05: rezultatul e considerat nesemnificativ statistic
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
Limite ale valorii p
Valoarea p NU ne d informaii despre:
ansa de beneficiu a unui pacient individual
Procentul de pacieni care vor avea un beneficiu n urma
instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
Puterea unui test statistic
Este capacitatea de a detecta o diferen acolo unde exist
Creterea volumului eantionului determin creterea puterii
testului statistic aplicat
Valoarea este n relaie direct cu eroarea de tip II:
Puterea = 1
Cea mai utilizat modalitate de cretere a puterii unui test statistic
este de a crete volumul eantionului
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Sumarizarea i analiza datelor: statistic inferenial
Tipul scalei de msur testul statistic
Mai mult de 2 grupuri, date
perechi
1 1 Msurtori repetate
(ANOVA)
Eantioane perechi 1 1 Student perechi
2 sau mai multe grupuri 1 1 ANOVA
Doar 2 grupuri 1 1 Student
2 0
2
Exist o relaie liniar? 0 2 Corelaie Pearson
Observaii Nominal Interval Denumire test
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Tabela de contingen 22
Riscuri i raii
Testul
2
(testarea asocierii n tabela de contingen)
Testul Fisher
Testul z pentru proporii
Testul McNemar
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Tabela de contingen 22
Scale de tip nominal (dicotomiale: tabela de contingen de 22) sau ordinal
(tabela de contingen de rc)
Frecvena absolut (numrul de evenimente per categorie)
Tabela de contingen de 22: 4 categorii
AP = adevrat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevrat negativ
29 =5+16=21 =1+7=8 Total
= 7+16 = 23 AN = 16 FN = 7 Recuren -
= 1+5 = 6 FP = 5 AP = 1 Recuren +
Total Ulcer
vindecat
Ulcer
deschis
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Riscuri i raii: Mrimi ale asocierii
=AP/(AP+FP)-FN/(FN+AN) Riscul atribuabil
=(APAN)/(FNFP) Rata ansei
=AP(FP+AN)/FN(AP+FP) Riscul relativ
Probabilitatea ca un test negativ s fie corect =AN/(AN+FN) Valoarea predictiv negativ
Probabilitatea ca un test pozitiv s fie corect =AP/(AP+FP) Valoarea predictiv pozitiv
Probabilitatea general a unei decizii corecte =(AP+AN)/n Acuratee
Probabilitatea unui test real (1- ) =AN/(AN+FP) Specificitate
Probabilitatea unui test real + (1- ) =AP/(AP+FN) Sensibilitate
Probabilitatea unui test fals () =FN/(FN+AP) Rata falilor negativi
Probabilitatea unui test fals + () =FP/(FP+AN) Rata falilor pozitivi
Definiie Formula Denumire
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Riscuri i raii: Mrimi ale asocierii
= 1/(1+5)-7/(7+16) = 0,1667-0,3043=-0,1376 Riscul atribuabil
= (116)/(75) = 0,4571 Rata ansei
= 1(5+16)/7(1+5) = 21/42 = 0,50 Riscul relativ
= 16/(16+7) = 0,6957 Valoarea predictiv negativ
= 1/(1+5) = 0,1667 Valoarea predictiv pozitiv
= (1+16)/29 = 0,5862 Acuratee
= 16/(16+5) = 0,7619 Specificitate
= 1/(1+7) = 0,1250 Sensibilitate
= 7/(7+16) = 0,3043 Rata falilor negativi
= 5/(5+1) = 0,8334 Rata falilor pozitivi
Formula Denumire
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Testarea asocierii n tabela de contingen
Testul
2
Nu trebuie utilizat pentru eantioane de volum mic.
Testul este valid doar dac valoarea expectat (ateptat)
pentru fiecare celul este cel puin egal cu 1 i frecvena
absolut observat este de minim 5.
Dac aceste condiii nu sunt ndeplinite se aplic testul
exact al lui Fisher (Fishers Exact Test)
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Testul
2
Indic dac cele dou variabile sunt sau nu independente DAR
NU cuantific puterea asocierii dintre ele.
Problema: S-a investigat ntr-un studiu asocierea dintre
obezitatea (ca factor de risc) i bolile cardio-vasculare la
persoanele n etate (> 60 ani). Din totalul de 620 persoane
investigate s-au identificat 150 persoane cu obezitate i boal
cardio-vascular, 230 persoane fr obezitate i fr boal
cardio-vascular i 60 persoane fr obezitate dar cu boal
cardio-vascular. Exist o asociere ntre obezitate i boala
cardio-vascular? (df=1; =0,05;
2
critic
= 3,84).
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Testul
2
: exemplu
H
0
:
Nu exist asociere ntre obezitate i bolile cardio-vasculare.
Obezitatea i bolile cardio-vasculare sunt independente.
H
1
:
Exist asociere ntre obezitate i bolile cardio-vasculare.
Obezitatea i bolile cardio-vasculare sunt asociate.
= 0,05 pragul de semnificaie al testului

=
c r
1 i
t
i
2 t
i
0
i 2
f
) f f (
urmeaz o lege cu (r-1)(c-1) grade de
libertate

2
= parametrul testului
2
f
i
o
= frecvena observat
f
i
t
= frecvena teoretic
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Testul
2
: exemplu
Regiunea critic este [

2
, ).
Pentru = 0,05,

2
= 3,84.
620 410 210 Total
290 AN = 230 FN = 60 Obezitate -
330 FP = 180 AP = 150 Obezitate +
Total BCV- BCV+ OBSERVAT OBSERVAT
620 410 210 Total
290 = 290410/620 = 290210/620 Obezitate -
330 = 330410/620 = 330210/620 Obezitate +
Total BCV- BCV+ TEORETIC TEORETIC
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Testul
2
: exemplu
230 60 Obezitate -
180 150 Obezitate +
BCV- BCV+ OBSERVAT OBSERVAT
= 192 = 98 Obezitate -
= 218 = 112 Obezitate +
BCV- BCV+ TEORETIC TEORETIC
192
) 192 230 (
98
) 98 60 (
218
) 218 180 (
112
) 112 150 (
2 2 2 2
2

+

=
192
) 38 (
98
) 38 (
218
) 38 (
112
38
2 2 2 2
2
+

+ =
77 , 41 52 , 7 73 , 14 63 , 6 89 , 12
192
1444
98
1444
218
1444
112
1444
2
= + + + = + + + =
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Testul
2
: exemplu
Dac
2
[3,84, ) se respinge H
0
cu un risc de eroare de
tip I ().
Dac
2
[3,84, ) se accept H
0
cu un risc de eroare de
tip II ().
Deoarece 41,77[3,84, ) se respinge H
0
cu un risc de
eroare de 5%.
Exist Exist asociere asociere ntre obezitate ntre obezitate i bolile cardio i bolile cardio- -
vasculare vasculare. .
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Testul Fisher
Corecie a testului
2
;
Valoarea p asociat parametrului ne d probabilitatea ca
valoarea observat de independen s fie atribuit doar
ansei.
O valoare p mic indic c exist alte cauze dect ansa
influeneaz rezultatul i astfel cele dou variabile
investigate nu sunt independente.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Testul z pentru proporii
1. Compararea unei frecvene observate cu o frecven
teoretic.
2. Testarea egalitii a dou frecvene.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Testul z: 1. Compararea unei frecvene observate cu o
frecven teoretic
Scop: Investigarea semnificaiei diferenei ntre o frecven teoretic
p (ntr-o populaie) i o frecven observat f pe un eantion
reprezentativ (variabil calitativ (binare)).
Condiii de aplicare: Testul este corect aplicat dac numrul n al
observaiilor eantionului este suficient de mare (np, n(1-p)>10.
Parametrul:
n = volumul eantionului
n
) p 1 ( p
p f
z

=
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Testul z: 1. Compararea unei frecvene observate cu o
frecven teoretic
Suntem interesai de investigarea prevalenei hepatitei B la personalul care
lucreaz n laboratoarele clinicilor de boli infecioase din Transilvania. Se
tie din studii anterioare c prevalena hepatitei B n populaia general din
Transilvania este de 9%. S-a luat n studiu un eantion de 100 persoane i s-
a obinut o prevalen a hepatitei B de 6%. Exist diferen semnificativ
ntre frecvena hepatitei B la personalul care lucreaz n laboratoarele
spitalelor de boli infecioase din Transilvania fa de populaia general?
f = 0,06, p = 0,09, n = 100
Ipoteza nul: Nu exist diferen semnificativ ntre frecvena hepatitei
B la eantionul studiat fa de frecvena hepatitei B n populaia
general.
Ipoteza alternativ, test bilateral: Exist diferen semnificativ ntre
frecvena hepatitei B la nivelul eantionului i prevalena hepatitei B n
populaia general.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Testul z: 1. Compararea unei frecvene observate cu o frecven
teoretic
f = 0,06; p = 0,09; n = 100
Pragul de semnificaie: = 0,05.
Regiunea critic test bilateral: (-; -1,96 ][1,96; )
Concluzia testului:
Deoarece parametrul statistic calculat al testului nu aparine regiunii critice,
se accept ipoteza nul. Nu exist diferen semnificativ ntre frecvena
hepatitei B la eantionul studiat fa de frecvena hepatitei B n populaia
general.
05 . 1
029 , 0
03 , 0
000819 , 0
03 , 0
100
0819 , 0
03 , 0
100
91 , 0 09 , 0
03 , 0
100
) 09 , 0 1 ( 09 , 0
09 , 0 06 , 0
) 1 (
=

=
z
n
p p
p f
z
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Testul z: 2. Testarea egalitii a dou frecvene
Scop: Investigarea semnificaiei diferenei ntre frecvenele relative i
respectiv ale unei valori a unei variabile calitative pe dou eantioane
randomizate independente extrase din dou populaii diferite.
Condiii de aplicare: Testul este aproximativ i se presupune c numrul
observaiilor eantioanelor este suficient de mare (n
1
, n
2
> 30) pentru a
justifica aproximarea distribuiei binomiale prin una normal.

=
2 1
2 1
n
1
n
1
) p 1 ( p
) p p (
z
2 1
2 2 1 1
n n
n p n p
p
+
+
=
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Testul z: 2. Testarea egalitii a dou frecvene: Exemplu
S-a studiat statutul HIV pe un eantion de 170 femei cu vrste cuprinse ntre 18 i
40 de ani din Moldova, i respectiv un eantion de 89 femei cu vrste cuprinse
ntre 18 i 40 de ani din Transilvania. Pentru eantionul din Moldova, Frecvena
testelor HIV+ a fost de 10% n eantionul din Moldova i 2,7% n eantionul din
Transilvania.
Frecvena infeciei cu HIV la femeile cu vrste cuprinse ntre 18 i 40 de ani din
Moldova este diferit fa de frecvena infeciei la femeile de aceeai vrst din
Transilvania?
Datele problemei:
p
1
= 0,10; p
2
= 0,027; n
1
= 170; n
2
= 89.
Ipoteza nul:
Nu exist o diferen semnificativ ntre frecvena infeciei HIV la
femeile din Moldova fa de frecvena infeciei HIV la femeile din
Transilvania.
Ipoteza alternativ, test bilateral:
Exist o diferen semnificativ ntre frecvena infeciei HIV la femeile
din Moldova fa de frecvena infeciei HIV la femeile din Transilvania.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Testul z: 2. Testarea egalitii a dou frecvene: Exemplu
Pragul de semnificaie: = 0,05.
Regiunea critic:
Testul bilateral: (-; -1,96 ] [1,96; )
Testul unilateral: [1,645, )
118 , 2
034 , 0
073 , 0
001 , 0
073 , 0
) 011 , 0 006 , 0 ( 925 , 0 075 , 0
073 , 0
z
89
1
170
1
) 075 , 0 1 ( 075 , 0
027 , 0 10 , 0
n
1
n
1
) p 1 ( p
) p p (
z
2 1
1 1
= = =
+
=

=
Concluzie (Test bilateral):
Deoarece parametrul statistic calculat al testului aparine regiunii
critice se respinge ipoteza nul i se accept ipoteza alternativ.
Exist diferen semnificativ ntre frecvena infeciei HIV la
femeile din Moldova fa de frecvena infeciei HIV la femeile din
Transilvania.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Testul McNemar
Evaluarea dependenei variabilelor calitative perechi (dorim s
determinm dac o anumit caracteristic este sau nu asociat cu
o anumit patologie):
Identificm n pacieni care prezint patologia de interes (e.g.
Cancer bronho-pulmonar) i n pacieni cu aceleai caracteristici ca
i primul grup dar care nu o prezint.
d c Caz = nu
b a Caz = da
Martor = nu Martor = da
( )
c b
1 | c b |
2
2
df 1
+

=
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date calitative
Testul McNemar: fumat vs cancer
d = 3 c = 0 Cancer = nu
b = 5 a = 2 Cancer = da
Martor = nu Martor = da
( )
2 , 3
5
16
5
4
0 5
1 | 0 5 |
2 2
2
df 1
= = =
+

=

2
critic(=0,05)
=3,84
3,2 <3,84 acceptmipoteza nul
Fumatul nu este n relaie cu apariia
cancerului bronho-pulmonar.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Variabile cantitative continue:
Testul z i Student (t) (o medie sau medii perechi)
Testul z i Student (t) (testarea a dou medii)
ANOVA ( 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care
nu ndeplinesc condiia de normalitate):
Testul sumei rangurilor: Wilcoxon
Kruskal-Wallis ( 3 eantioane independente)
Friedman ( 3 eantioane dependente)
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Teste de normalitate: variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dac datele urmeaz o distribuie normal: aplicm un test
parametric
Dac datele nu urmeaz o distribuie normal: aplicm un test
de comparare al rangurilor
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Testul Z de comparare a mediei unui eantion cu media unei
populaii
Scopul testului: compararea mediei unei variabile cantitative
continue pe un eantion reprezentativ extras dintr-o populaie
cu o medie cunoscut. Se presupune c cele dou populaii au
aceiai variaie
2
care se cunoate.
Condiii de aplicare:
1. Este necesar s cunoatem variaia populaiei (dac nu o
cunoatem, aplicm testul Student pentru compararea mediei
unui eantion cu media unei populaii).
2. Testul este corect aplicat dac populaia este normal distribuit.
Dac populaia nu este normal distribuit iar talia eantionului
este mic (< 30) testul d o valoare orientativ.
3. Talia eantionului este mare ( 30).
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Testul Z de comparare a mediei unui eantion cu media unei
populaii
Ipoteze:
Ipoteza nul: nu exist
diferen semnificativ ntre
media eantionului i media
populaiei.
Ipoteza alternativ pentru
testul bilateral: exist diferen
semnificativ ntre media
eantionului i media
populaiei.
Pragul de semnificaie: = 0,05.
Regiunea critic pentru testul bilateral
este
(- , -1,96 ] [1,96 , )
Parametrul testului:
n = volumul eantionului
= media eantionului
= deviaia standard a
populaiei.
n
X
Z
0


=
X
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Testul Student (t) de comparare a unei medii cu o medie
cunoscut (variaii necunoscute)
Scopul testului este investigarea semnificaiei diferenei dintre media unui
eantion i o medie standard cunoscut.
Ipoteza nul: nu exist diferen semnificativ ntre media eantionului i
media standard.
Ipoteza alternativ pentru testul bilateral: exist diferen semnificativ ntre
media eantionului i media standard.
Condiii de aplicare
Testul se poate aplica atunci cnd variaia
2
nu este cunoscut iar
estimarea s
2
a acesteia se realizeaz pentru un eantion mic (n < 30) care
respect o distribuie normal. Dac aceast condiie de normalitate nu
este satisfcut atunci testul i pierde validitatea.
Dac se cunoate variaia populaiei
2
, i n 30 se aplic testul Z care
este un test mult mai puternic.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Testul Student (t) de comparare a unei medii cu o medie
cunoscut (variaii necunoscute)
Numrul de grade de libertate
(df): df = n-1
Pragul de semnificaie: =
0,05.
Regiunea critic pentru testul
bilateral este:
Parametrul testului:
n = volumul eantionului

0
= media standard
= media eantionului
s = deviaia standard a eantionului.
) ; t [ ] t ; (
2
, 1 n
2
, 1 n
+

) ; t [ ] t ; (
025 , 0 ; 1 n 025 , 0 ; 1 n
+

n
s
X
t
0

=
X
1 n
) X x (
s s
n
1 i
2
i
2

= =

=
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Testul Z de comparare a mediilor a dou populaii (variaii
cunoscute i inegale)
Scopul testului: compararea mediile pentru o variabil cantitativ
continu n dou populaii, cunoscnd variaia n fiecare dintre
aceste populaii.
Condiii de utilizare:
Populaiile trebuie s aib variaii cunoscute. Dac variaiile nu sunt
cunoscute, se aplic un test de tip Student pentru compararea mediilor a
dou populaii.
Testul este corect numai dac populaiile sunt normal distribuite. Dac
populaiile nu sunt normal distribuite, testul d doar o valoare orientativ.
Ipoteza nul: diferena mediilor celor dou populaii este egal cu
zero.
Ipoteza alternativ pentru testul bilateral: diferena mediilor celor
dou populaii este diferit de zero.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Testul Z de comparare a mediilor a dou populaii (variaii
cunoscute i inegale)
Pragul de semnificaie considerat
este = 0,05.
Regiunea critic pentru testul
bilateral: (-; -1,96 ] [1,96; )
Parametrul testului:
= media primului eantionului;
n
1
= volumul primului eantion;
s
1
2
= variaia primului eantion;
= media celui de-al doilea
eantion;
n
2
= volumul celui de-al doilea
eantion;
s
2
2
= variaia celui de-al doilea
eantion.
2
2
2
1
2
1
2 1
n
s
n
s
X X
z
+

=
1 X
2 X
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Testul Student (t) de comparare a dou medii (variaii
necunoscute i egale)
Ipoteza nul: Diferena mediilor celor dou populaii este egal
cu zero.
Ipoteza alternativ pentru testul bilateral: Diferena mediilor
celor dou populaii este diferit de zero.
Condiii de aplicare
Variabila de analizat n cele dou populaii este normal
distribuit i variaiile celor dou populaii sunt egale.
Dac aceste condiii nu sunt satisfcute atunci testul i pierde
validitatea.
Dac se cunoate variaia populaiei
2
, se aplic testul Z care
este un test mult mai puternic.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Testul Student (t) de comparare a dou medii (variaii
necunoscute i egale)
Numrul de grade de
libertate (df):
df = n
1
+ n
2
- 2
Pragul de semnificaie: =
0,05.
Regiunea critic pentru testul
bilateral
Parametrul statistic al testului
) ; t [ ] t ; (
2
; 2 n n
2
; 2 n n
2 1 2 1
+

+

=
2 1
2 1
n
1
n
1
s
X X
t
2 2
1 1 2 2
1 2
( 1) ( 1)
2
n s n s
s
n n
+
=
+
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Testul Student (t) de comparare a mediilor a dou eantioane
perechi
Scopul testului: compararea pentru o variabil cantitativ continu
media ei aritmetic pentru dou eantioane perechi (observaii ale
aceleiai variabile cantitative realizate pe elementele unui eantion
nainte i dup aciunea unui factor ).
Condiii de aplicare: fiecrei observaii din primul eantion i
corespunde o observaie pereche din al doilea eantion iar diferenele
dintre valorile perechi sunt normal distribuite.
Ipoteza nul: Media diferenei valorilor perechi din eantioanele
perechi nu este semnificativ diferit de zero.
Ipoteza alternativ pentru testul bilateral: Media diferenei valorilor
perechi din eantioanele perechi este semnificativ diferit de zero.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Testul Student (t) de comparare a mediilor a dou eantioane
perechi
Numrul de grade de libertate (df): df =
n 1.
Pragul de semnificaie este: = 0,05.
Regiunea critic:
Parametrul statistic al testului
s = deviaia standard a diferenelor
n = volumul eantionului
) ; t [ ] t ; (
2
; 1 n
2
; 1 n
+

n
s
d
t =
( )
n
d ... d d
d
n 2 1
+ + +
=
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Testul ANOVA: compararea mediilor a mai multe eantioane
H
0
= toate mediile sunt egale.
H
1
= nu toate mediile sunt egale.
Condiii de aplicare:
1. Datele sunt independente unele fa de celelalte.
2. Datele fiecrui grup sunt normal distribuite.
3. Deviaia standard este aceeai pentru toate grupurile.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Testul ANOVA: compararea mediilor a mai multe eantioane
7 6 11 9 8 7 Media
35 30 55 45 40 35 Suma
6 7 9 10 10 9 5
5 4 12 11 9 8 4
7 6 13 9 7 7 3
8 8 11 8 8 6 2
9 5 10 7 6 5 1
F E D C B A
Medicament Id
m=(7+8+9+11+6+7)/6
m=8
(7-8)
2
+(8-8)
2
+(9-8)
2
+
(11-8)
2
+(6-8)
2
+(7-8)
2
=
(-1)
2
+0
2
+1
2
+3
2
+(-2)
2
+
(-1)
2
=1 +0 +1 +9 +4 =
16
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Testul ANOVA: compararea mediilor a mai multe eantioane
m=(7+8+9+11+6+7)/6
m=8
(7-8)
2
+ (8-8)
2
+ (9-8)
2
+ (11-8)
2
+ (6-8)
2
+ (7-8)
2
=
= (-1)
2
+ 0
2
+ 1
2
+ 3
2
+ (-2)
2
+ (-1)
2
= 1 + 0 + 1 + 9 + 4 = 16
Suma ptratelor (ntre) = (media grupului media
general)
2
N(numrul de grupuri)
Suma ptratelor (n) = (valoarea individual media grupului)
2
F = (suma ptratelor(ntre))/(suma ptratelor(n))
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Testul ANOVA: compararea mediilor a mai multe eantioane
Suma ptratelor (ntre) = 165 = 80
Suma ptratelor (n) = (5-7)
2
+(6-7)
2
+(7-7)
2
+(8-7)
2
+(9-
7)
2
+....+(9-7)
2
+(8-7)
2
+(7-7)
2
+(5-7)
2
+(6-7)
2
= 60
Cu ct diferena dintre suma ptratelor ntre grupuri este mai
mare comparativ cu suma ptratelor n interiorul fiecrui grup cu
att diferena ntre grupurile investigate e mai mare.
- 29 140 Total
= 60/24 = 2,5 24 60 n
= 16/2,5 = 6,4 = 80/5 = 16 5 80 ntre
F = MP
ntre
/MP
n
Media ptratelor df SP
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Testul sumei rangurilor: Wilcoxon
Aplicat pentru:
Un set de observaii provenite dintr-o valoare ipotetic comun
Perechi de observaii pe aceiai indivizi (nainte i dup)
Utilizat i pentru a verifica dac distribuia diferenelor are
mediana egal sau nu cu zero
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Testul sumei rangurilor: Wilcoxon
Medicaia intraocular determin modificarea semnificativ a btilor
cardiace?
7 15 74 89
8 19 59 78
6 9 67 76
1 -3 75 72
4 6 65 71
3 -1 68 67
5 8 58 66
2 -2 66 64
Rang Diferena Dup nainte
Suma rangurilor pentru
diferenele negative = 2+3+1 = 6
Suma rangurilor pentru
diferenele pozitive =
5+4+6+8+7 = 30
Probabilitatea asociat interseciei
dintre suma rangurilor negative
egal cu 6 cu volumul
eantionului egal cu 8 = 0.109
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Kruskal-Wallis ( 3 eantioane independente)
Test de ranguri aplicate pe mai mult de 3 eantioane
H = parametrul testului
n = suma volumelor eantioanelor studiate (n
1
, n
2
, n
3
..., n
k
)
T
k
= suma rangurilor
) 1 n ( 3
n
T
...
n
T
n
T
) 1 n ( n
12
H
k
2
k
2
2
2
1
2
1
+

+ +
+
=
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Kruskal-Wallis ( 3 eantioane independente)
Valoarea antigenului prostatic este diferit la pacienii cu hipertrofie
prostatic benign, biopsie pozitiv pentru cancer prostatic, biopsie
negativ la pacieni indemni.
53 , 8 69 53 , 77 69 28 , 3269 03 , 0 H
69 ) 13 , 325 78 , 1968 38 , 975 ( 02 , 0 H
23 3
8
00 , 2601
8
25 , 15750
6
25 , 5852
506
12
H
) 1 22 ( 3
8
51
8
5 , 125
6
5 , 76
) 1 22 ( 22
12
H
2 2
= = =
+ + =

+ + =
+

+ +
+
=
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Kruskal-Wallis ( 3 eantioane independente)
df = k-1 (k = numrul de eantioane)
df = 3-1 = 2
H
critic(=0,05)
= 5,99
H = 8,53 > 5,99 nivelul PSA este diferit la pacieni cu
hipertrofie prostatic benign, biopsie pozitiv i respectiv
biopsie negativ
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Friedman ( 3 eantioane dependente)
Design randomizat de tip bloc: trei sau mai multe tratamente sunt
aplicate aceluiai eantion (extensie a tipului de studiu pe eantioane
perechi)
1. Definirea numrului de tratamente k
2. Obinerea rangurilor pentru fiecare tratament
3. Sumarea rangurilor fiecrui tratament
4. Calcularea parametrului FRIEDMAN (urmeaz o distribuie
2
)
5. Dac Fr > Fr
critic
respingem H
0
( ) ) 1 k ( n 3 T ... T T
) 1 k ( k n
12
Fr
2
k
2
2
2
1
+ + + +
+
=
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Friedman ( 3 eantioane dependente)
Antigenul prostatic rmne neschimbat post-terapeutic n cancerul de
prostat? PSA a fost msurat trei ani consecutiv dup tratamentul
cancerului de prostat la un eantion de 9 pacieni.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Inferena statistic pe date cantitative
Friedman ( 3 eantioane dependente)
n = 9; k = 3; T
1
2
= 225; T
2
2
= 380,25; T
3
2
= 380,25
Fr
critic
= 5,99
Fr < Frcritic nivelul PSA nu crete n primii 3 ani dup
intervenia asupra cancerului de prostat
( )
5 , 1 108 50 , 985
108
12
Fr
) 1 3 ( 9 3 25 , 380 25 , 342 225
) 1 3 ( 3 9
12
Fr
= =
+ + +
+
=
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
De reinut! Inferena statistic!
Atenie la condiiile de aplicare ale fiecrui test!
Dac variabilele sunt cantitative continue se verific iniial
normalitatea distribuiei.
Teste de normalitate: Shapiro-Wilk; Kolmogorov-Smirnov;
Shapiro-Wilk; Chi-Square Goodness-of-Fit.
Compararea mediei unui eantion cu media unei populaii ():
testul Z
Compararea mediei unui eantion cu media o medie cunoscut
(s): testul t
Compararea mediilor a 3 sau mai multe eantioane: ANOVA
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
De reinut! Inferena statistic!
Compararea mediilor a dou populaii (): testul Z
Compararea mediilor a dou eantioane (s): testul t
Compararea mediilor a dou eantioane perechi (s): testul t
ATENIE! Parametrul testului pentru compararea mediilor a
dou eantioane nu este acelai cu cel pentru compararea a
dou eantioane perechi!
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
De reinut! Inferena statistic!
Ranguri
Distribuia datelor nu are importan!
Un eantion sau eantioane perechi: testul sumei rangurilor
(Wilcoxon)
Trei sau mai multe eantioane: Kruskal-Wallis
Trei sau mai multe eantioane perechi: Friedman
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
De reinut! Inferena statistic!
Aplicarea unui test statistic trebuie fcut n conformitate cu
condiiile acestuia.
Pe variabile calitative se aplic teste non-parametrice (nu necesit
asumpia distribuiei normale a datelor).
Variabile nominale:
Un singur eantion sau eantioane perechi:
Tabelul de contingen cu parametrii de tip raii i rapoarte
Eantioane perechi: testul Mc Nemar
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
De reinut! Inferena statistic!
Variabile nominale:
Dou eantioane: realizarea tabelului de contingen 22 i
aplicarea testului Fisher sau
2
n analiza proporiilor exist teste diferite pentru:
Compararea unei frecvene cu o frecven cunoscut
Compararea a dou frecvene
Atenie la calcularea riscurilor i raiilor pe tabela de
contingen!
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Interpretarea rezultatelor
Interpretarea statistica interpretarea clinic
Interpretarea statistic ne spune doar dac ipoteza
statistic testat este acceptat sau respins
Interpretarea clinic ne permite s specificm
semnificaia clinic a rezultatelor statistice obinute pe
eantionul studiat
Odat cu interpretarea rezultatelor pot aprea noi ipoteze
de cercetare
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Interpretarea rezultatelor
Ce interpretm? Rezultatele
personale obinute n urma studiului
care au fost prezentate n seciunea Rezultate
Explicm rezultatele obinute.
Referim rezultate obinute de ali cercettori i le
comparm cu rezultatele personale.
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
Interpretarea rezultatelor
Trebuie s se realizeze n:
lumina limitelor studiului
contextul cultural, social i educaional al locului unde s-a
realizat cercetarea
contextul a ceea ce se cunoate din literatura de
specialitate
Metodologia cercet Metodologia cercet r rii ii
. Sorana Sorana D. D. BOLBOAC BOLBOAC Curs Curs 5 5: : Analiza datelor Analiza datelor II II & & Interpretarea rezultatelor Interpretarea rezultatelor. .
De reinut! Interpretarea rezultatelor
Interpretm doar rezultatele personale obinute n urma
studiului.
Interpretarea statistic nu este tot una cu interpretarea
clinic!
Interpretarea statistic este important.
Interpretarea clinic este foarte important.

S-ar putea să vă placă și