Documente Academic
Documente Profesional
Documente Cultură
Curs6 2018 PDF
Curs6 2018 PDF
Acceptarea testului HIV în funcție de grupele stării civile (Meadows et al., 1994)
• Totalurile rândurilor şi coloanelor sunt numite totaluri marginale, iar numărul total de observaţii
din tabel se numeşte total general
• Ne vom referi adesea la un tabel folosind dimensiunea tabelului.
• Tabel de tip ”4x2” deoarece are patru rânduri şi două coloane. Uneori se folosește termenul
general de tabel de tip ”rxc” unde r indică numărul de rânduri şi c numărul de coloane
TESTUL HI-PĂTRAT
Testarea ipotezei nule - nu există nici o relaţie între două variabile.
Vom folosi termenul de "asociere" pentru o relaţie între două
variabile categorice.
Dacă eșantionul este mare putem să folosim testul hi-pătrat.
Dacă eșantionul este mic, vom folosi testul Fisher exact
Ipoteza nulă stabilește că nu există nici o asociere între cele două
variabile (pentru care este construit tabelul de contingenţă).
Ipoteza alternativă se referă la faptul că există o asociere de un
anumit tip.
Testul hi-pătrat se bazează pe calculul frecvenţelor pe care ne-am
aştepta să le obținem în celule, în cazul în care nu există absolut
nici o asociere (frecvențe estimate sau frecvenţe aşteptate).
• Proporţia de femei care au acceptat testul HIV este de 134/788. Deci, din 486 de femei căsătorite ne
aşteptăm ca 486 × 134/788 = 82.6 să accepte testul HIV, dacă ipoteza nulă (referitoare la asociere) este
adevărată.
• În mod similar, proporţia de femei care au refuzat testul este = 654/788. Deci din 486 de femei căsătorite,
ne aşteptăm ca 486 × 654/788 = 403.4 să refuze testul, dacă ipoteza nulă este adevărată.
• Se observă că 82.6 + 403.4 = 486. Deci suma frecvenţelor estimate (aşteptate) este aceeași ca şi suma
frecvenţelor observate.
• În acelaşi mod, pentru 222 femei necasătorite care au un partener ne aşteptăm ca 222 × 134/788 = 37.8
să accepte testul HIV, dacă ipoteza nulă este adevărată, și 222 × 654/788 = 184.2 să refuze testul. Din nou
se observă că 37.8 + 184.2 = 222, numărul total din al doilea rând.
• În mod similar se obțin frecvenţele estimate sau aşteptate pentru toate celulele din tabel. Se observă că
82.6 + 37.8 + 8.5 + 5.1 = 134.0 şi 403.4 + 184.2 + 41.5 + 24.9 = 654.0. Frecvenţele observate şi cele estimate
au aceleași totaluri pe rânduri şi pe coloane. Se poate vedea, de asemenea, că pentru fiecare celulă
din Tabelul 1, am calculat o frecvenţă la care ne așteptăm (frecvență estimată) în Tabelul 2, cu ajutorul
formulei
• În mod similar se obțin frecvenţele estimate sau aşteptate pentru toate celulele din tabel. Se observă că
82.6 + 37.8 + 8.5 + 5.1 = 134.0 şi 403.4 + 184.2 + 41.5 + 24.9 = 654.0.
• Frecvenţele observate şi cele estimate au aceleași totaluri pe rânduri şi pe coloane. Pentru fiecare celulă
din frecvențelor observate, am calculat o frecvenţă la care ne așteptăm (frecvență estimată) în cel de-
al doilea tabel, cu ajutorul formulei
TESTUL HI-PĂTRAT
Testul hi-pătrat pentru tabele de contingenţă foloseşte diferenţele dintre
frecvenţele observate şi cele aşteptate (estimate). Cu cât sunt mai mari aceste
diferenţe cu atât aceasta reprezintă o dovadă mai puternică a faptului că cele
două variabile sunt asociate. Nu se poate face doar o însumare a acestor
diferenţe pentru că suma lor este întotdeauna zero.
Vom proceda în acelaşi fel ca atunci când am calculat abaterea standard și
anume, le vom ridica la pătrat.
Cu cât sunt mai mari frecvenţele, cu atât este mai mare și valoarea posibilă a
diferenţei dintre frecvenţele observate şi cele estimate.
Eșantioanele mari produc diferenţe mai mari decât eșantioanele de mici
dimensiuni.
Această problemă se poate corecta prin împărţirea pătratului diferenţei dintre
frecvenţa observată și cea aşteptată la valorile estimate (aşteptate) - motivele
exacte pentru această alegere sunt mai degrabă abstracte şi matematice
Vom calcula acest raport (observat - aşteptat)2/aşteptat pentru fiecare celulă
din tabel şi apoi vom însuma toate rapoartele
TESTUL HI-PĂTRAT
În exemplul nostru această sumă este de 9.15
Suma rapoartelor (observat - aşteptat)2/aşteptat este numită statistica hi-
pătrat și uneori este scrisă ca X2.
Aceasta reprezintă statistica testului. Din formularea clasică a unui test de
semnificaţie, această statistică ar trebui să urmeze o anumită distribuţie,
în cazul în care ipoteza nulă este adevărată. Pentru acest test, distribuția
este distribuţia hi-pătrat.
"Hi-pătrat", de cele mai multe ori apare scris ca fiind 2, unde este litera
grecească "chi", pronunţat "ki".
Distribuţia hi-pătrat este asemănătoare cu distribuția t, de care este strâns
legată.
Există o întreagă familie de distribuţii, iar un membru special al acestei
familii este definit printr-un singur parametru numit grade de libertate
TESTUL HI-PĂTRAT
Statistica testului chi-pătrat pentru datele noastre este 9.15, valoare care se află între cele
două puncte, astfel încât probabilitatea testului este între 5% şi 1%. Vom scrie acest lucru ca p
<5% sau p <0.05. Dacă folosim un program de analiză statistică, am obţine valoarea mai
exactă de p = 0.027 pe care o puteam rotunji la o cifră semnificativă şi astfel p = 0.03
Condiții care trebuiesc îndeplinite referitor la datele
observate pentru ca testul hi-pătrat să fie valid:
Exemple de FR:
• Fumatul
• Medicamente administrate
• Caracteristici individuale (grupa
sanguină), etc.
mai uşor să luăm prevalente, mai ales în cazul bolilor rare, unde
pentru a găsi incidente trebuie să aşteptăm destul de mult
Datele obţinute într-un studiu caz – martor se introduc într-un tabel de contingenţă „2x2”
SAU
a – persoanele ce fac boala dintre cei expuşi ; b - persoanele ce nu fac boala dintre cei expuşi.
c - persoanele ce fac boala dintre cei nonexpuşi ; d - persoanele ce nu fac boala dintre cei nonexpuşi.
a+b – totalul expuşilor. c+d – totalul nonexpuşilor. a+c – totalul bolnavilor. b+d - totalul nonbolnavilor
Pentru măsurarea forţei asociaţiei epidemiologice în anchetele de tip caz –
control se utilizează odds ratio (raportul cotelor, OR)
𝑃𝑟𝑜𝑏
Odds=1/5 Odds=
1−𝑃𝑟𝑜𝑏
În cazul unei anchete
epidemiologice raportul
cotelor (OR) se defineşte:
În cazul bolilor rare (ex: bolile cronice cu prevalență <10%), impactul acţiunii factorului de risc în
populaţie se măsoară cu riscul atribuit (RA) în populaţie:
Identificăm
Dacă diabetul este mai frecvent la cazuri decât la martori, este posibil
ca acesta să fie factor de risc.
Care sunt cotele (odds) diabetului zaharat (în acest caz factor de risc) la cazuri,
respectiv la martori (aşadar, cotele factorului de risc la bolnavi şi la sănătoşi?
Dacă avem mai mulți martori pentru 1 caz, puterea studiului va crește. Numărul cazurilor este de
obicei limitat (boala este rară de cele mai multe ori), dar martorii ar putea fi oricâți. Creșterea
puterii statistice a studiului nu mai e la fel de spectaculoasă atunci când se depășește un nr. de 4
martori/1caz
cota diabetului la cei cu infarct miocardic este
ORIMA/DZ=20/80=0,25 ; ORMARTORI=40/360=0,111
Pentru valori OR mai mari decat 1 si IC include valoarea 1 se poate concluziona ca factorul
de risc studiat este indiferent (oricat de mare ar fi valoarea lui calculata)
interpretare:
dacă p<0,05 se respinge ipoteza nulă (nonexistenţa legăturii) şi se
consideră ca fiind adevărată ipoteza alternativă (existenţa legăturii)
dacă p>0,05 nu se poate respinge ipoteza nulă
p este probabilitatea de a obţine un rezultat ca cel găsit din cauza
întâmplării în situaţia în care în realitate nu există legătură între parametrii
urmăriţi
NUMĂRUL NECESAR DE PACIENȚI CARE TREBUIESC TRATAȚI