MG LP07 PDF

MG - Lucrarea practică 7 2014/2015 UMF “Carol Davila” – Informatică Medicală şi Biostatistică
Lucrarea practică 7
Indicaţii generale:
Afirmaţii de tipul „fumatul este asociat cu decesul timpuriu, după un prim atac de
cord”, făcute în urma comparării unor proporţii calculate cu date obţinute din eşantioane
„reprezentative”, pot fi confirmate statistic prin teste hi pătrat (care în asemenea situaţii
sunt considerate ca teste de semnificaţie statistică, şi nu ca teste de bonitate).
Aplicaţiile statistice (SPSS, Epi Info, …) au evident implementate module pentru
efectuarea directă a calculelor necesare. Dar rezultatele pot fi obţinute şi cu ajutorul
aplicaţiei Excel, controlând în mod corespunzător desfăşurarea calculelor.
În această lucrare practică:

a) veţi exersa modul de obţinere a tabelelor de contingenţă din datele primare,
atât în Excel, cât şi în FoxPro;
b) veţi aplica teste Z şi hi pătrat pe tabele de contingenţă simple;
c) veţi învăţa să lucraţi cu comanda TABLES din acest modul, comandă dedicată
obţinerii tabelelor de contingenţă şi a rezultatelor conexe.
d) veţi exploata funcţia RAND pentru a obţine un eşantion „aleator”,
e) veţi folosi Excel pentru a obţine o „curbă ROC”.
Teme
32: tabele de contingenţă în Excel
33: testul hi pătrat în Excel
34: comanda TABLES în Epi Info
35: extragerea eşantioanelor aleatoare
specială: obţinerea curbei ROC în Excel
Softul ce va fi utilizat în lucrarea practică:

Epi Info
116
UMF “Carol Davila” – Informatică Medicală şi Biostatistică MG - Lucrarea practică 7 2014/2015
Tema 32: tabele de contingenţă în Excel
Riscul apariţiei unei maladii (sau riscul de deces) este raportul între numărul de
„evenimente” ce apar întro perioadă de timp specificată (de obicei un an) şi numărul de
indivizi luaţi în considerare (respectiv aflaţi în viaţă) la începutul perioadei.
Tabelul următor, întocmit pentru compararea riscurilor, conţine date privind mortalitatea
la doi ani după primul atac de cord suferit de fumători. (Sursa: Daly, Bourke and McGilvray,
pag. 184.)
Supravieţuirea la 2 ani Total
decedaţi în viaţă
au continuat să fumeze 19 135 154
n-au mai fumat 15 199 214
Total 34 334 368
Acesta este un exemplu tipic de tabel de contingenţă (de tipul 2 2, adică două linii, două
coloane), bordat cu o linie şi o coloană a totalurilor.
Datele primare nu se prezintă însă în acest fel. Preluaţi fişierul LP07_1.xls pentru a vedea
cum sunt înregistrate datele primare. Dacă deschidem fişierul cu Excel, atunci vom folosi de
patru ori (pe patru coloane) însumarea rezultatelor date de funcţia logică IF, condiţiile
logice fiind de forma AND(C2=FALSE,D2=TRUE) şi analoagele.
Preluaţi cele 368 de înregistrări pe o primă foaie de calcul a fişierului nume_CALCULE,
foaie pe care o veţi denumi „Primare”.
Creaţi tabelul de mai sus pe a doua foaie de calcul, de exemplu în domeniul A1:D5
(având grijă să denumiţi această foaie de calcul „Conting”)
Calculaţi în coloana E rata deceselor. (Astfel, pentru întreg lotul de pacienţi, în celula E5
vom plasa formula „=B5/D5” şi vom obţine rata de 9.24%; pentru cei ce au continuat să
fumeze, în celula E3 vom plasa formula „=B3/D3” şi vom obţine rata de 12.34%, iar pentru
cei ce n-au mai fumat, în celula E4 vom obţine rata 7.01%. Evident, ar fi de dorit să plasaţi
în celula E2 un text explicativ, ca de exemplu „Rata deceselor”)
Se va observa o creştere a ratei deceselor în cazul celor ce au continuat să fumeze,
comparativ cu cazul celor care n-au mai fumat. Oare această creştere este „semnificativă”?
Pentru a răspunde la întrebări de acest fel va fi obligatoriu să precizăm „nivelul de
semnificaţie”, altfel răspunsurile sunt lipsite de conţinut.
Să alegem nivelul de semnificaţie uzual 0.05 . Afirmaţia că „fumatul este ASOCIAT
CU decesul timpuriu, după un prim atac de cord” poate fi confirmată (dar nu respinsă!) cu
ajutorul unui test de semnificaţie bazat pe acest nivel de semnificaţie şi pe o anumită
distribuţie hi-pătrat (anume cea cu un singur grad de libertate). Pragul ce trebuie depăşit
pentru a putea confirma afirmaţia este obţinut în Excel cu ajutorul formulei
=CHIINV(0.05, 1)
şi va avea valoarea aproximativ 3.84. Oare este el depăşit?
Atenţie, apelând funcţia CHIINV ni se oferă explicaţii detaliate în caseta de folosire a
funcţiei. (Întrebare: este confirmată afirmaţia?)
Afirmaţia că „fumatul este O CAUZĂ A decesului timpuriu, după un prim atac de cord”
poate fi confirmată cu ajutorul unui alt test de semnificaţie bazat pe nivelul de semnificaţie
ales şi pe o anumită distribuţie, normală standard de data aceasta. Pragul ce trebuie depăşit
pentru a putea confirma afirmaţia este obţinut în Excel cu ajutorul formulei
=NORMSINV(1–0.05)
şi va avea valoarea aproximativ 1.64. Oare este el depăşit?
117
Vom încerca să confirmăm ultima afirmaţie („este cauză”) prin efectuarea unui test de
semnificaţie. Compararea celor două populaţii, anume a celor care „n-au mai fumat”,
respectiv a celor care „au continuat să fumeze” se va face la nivelul proporţiilor riscurilor de
deces.
„Ipoteza nulă”, pe care încercăm să o „respingem” în urma efectuării testului de
semnificaţie, este următoarea
1 2
şi ea exprimă faptul că cele două proporţii „nu diferă semnificativ” una de alta. Ipoteza
alternativă, pe care o vom accepta dacă vom reuşi respingerea ipotezei nule, este următoarea:
1 2.
Evident, ea exprimă faptul că riscul de deces este mai mare pentru cei care „continuă să
fumeze”.
Proporţiile riscurilor de deces sunt estimate prin frecvenţele relative observate,
p1 0.1234 , p2 0.0701, calculate pe baza datelor din eşantioane. Ele sunt în concordanţă
cu ipoteza alternativă!
(Este important să facem această observaţie! Căci în cazul în care frecvenţele relative
observate nu erau în concordanţă cu ipoteza alternativă, am fi confirmat o altă afirmaţie!)
Avem nevoie şi de riscul de deces pentru întreaga populaţie, uşor de calculat
34
p 9.24% . De asemenea, trebuie să reţinem şi „volumele eşantioanelor”, n1 154 ,
368
n2 214 .
p2 p1
Statistica pe care o folosim este z iar valoarea obţinută o vom
1 1
p(1 p)
n1 n2
compara cu valoarea prag z corespunzătoare nivelului de semnificaţie ales. Mai precis,
vom putea respinge ipoteza nulă doar dacă vom constata că z z .
Să ne alegem un nivel de semnificaţie 0.01. Valoarea prag z va fi obţinută în Excel
prin formula
=NORMSINV(0.99)
plasată întro celulă oarecare. (Atenţie, 0.99 este 1 .) Ar trebui să o găsim 2.326.
Copiaţi întreaga foaie de calcul „Conting” întro foaie nouă, denumită „ZTest”. Plasaţi aici
în celula E2 inscripţia „Frecvenţe relative” iar dedesubt afişaţi conţinutul celulelor cu 4
zecimale (numeric, nu în procente).
Plasaţi în celula A7 inscripţia „Nivelul de semnificaţie”, iar în celula B7 numărul 0.01. În
continuare, plasaţi în celula C7 inscripţia „Valoarea prag”, iar în celula D7 formula
=NORMSINV(1-B7)
De asemenea, plasaţi în celula E7 inscripţia „Valoarea statisticii”, iar în celula F7
formula de calcul:
=(E3-E4)/SQRT(E5*(1-E5)*(1/D3+1/D4))
În sfârşit, în celula A8 plasaţi, aliniată la stânga, formula logică:
=IF(F7>D7,"respingem H0","nu putem respinge H0")
Care este rezultatul?
Modificaţi acum nivelul de semnificaţie, în celula B7, la 0.05. Ce se întâmplă?
Ar trebui, cu nivelul de semnificaţie de 5%, să trageţi concluzia că fumatul în continuare
are efect negativ asupra ratei de supravieţuire a pacienţilor ce au suferit un atac de cord.
118
Totuşi, cu nivelul de semnificaţie mai mic, de doar 1%, această concluzie nu mai este
susţinută de datele din eşantioane.
Putem afla oare nivelul de semnificaţie „limită” pentru care concluzia este susţinută de
datele din eşantioane?
Plasaţi în celula A9 inscripţia „Valoarea p (riscul acceptării ipotezei alternative)”, iar în
celula B9 formula
=1-NORMSDIST(F7)
Ar trebui să obţineţi 4.08%.
Copiaţi acum întreg conţinutul foii de calcul „ZTest” în altă foaie de calcul, pe care o veţi
redenumi „Gripa”.
Modificaţi aici conţinutul tabelului din A2:D5, aşa încât să apară astfel:
S-au îmbolnăvit de gripă Nu s-au îmbolnăvit de gripă Total
Vaccinaţi 80 420 ?
Nevaccinaţi 150 535 ?
Total ? ? ?
Este vorba despre rezultatul unui studiu organizat de o companie farmaceutică, pentru a
testa eficacitatea unui vaccin nou împotriva gripei. În acest studiu, au fost selectaţi în mod
aleatoriu o serie de locuitori ai unui oraş mare (câţi anume?), care au fost urmăriţi din
noiembrie până în februarie. Dintre aceştia, unii (câţi anume?) au fost vaccinaţi, ceilalţi nu.
Se poate afirma că vaccinul este eficient în combaterea gripei? (Se va alege ca nivel de
semnificaţie 0.05 .) Care este „valoarea p” a acestei afirmaţii?
Tema 33: testul hi pătrat în Excel
Să reluăm afirmaţia „fumatul este ASOCIAT CU decesul timpuriu, după un prim atac de
cord”. Ea poate fi confirmată cu ajutorul unui test hi-pătrat DE SEMNIFICAŢIE.
În Excel calculele necesare confirmării vor exploata tabelul de contingenţă (din domeniul
B3:C4 (care, reamintim, conţine „datele observate”). Acest tabel are două rânduri şi două
coloane. Prin urmare, numărul gradelor de libertate este (2–1) (2–1) = 1.
Copiați tabelul de pe foaia „ZTest” pe o foaie nouă, unica foaie de calcul din fişierul
nume_HIPATRAT.xls. Redenumiți „ChisqTest” această foaie.
Preluaţi, de asemenea, o copie a rândurilor 7:8 de pe foaia „ZTest” pe foaia „ChisqTest”.
Aceste rânduri conţin nivelul de semnificaţie, valoarea prag, valoarea statisticii, precum şi
formula de „calcul” a deciziei de a respinge sau nu ipoteza nulă.
Formula de calcul a valorii prag, din celula B9, a fost pregătită pentru testul Z; ea trebuie
adaptată pentru testul hi pătrat. Aşadar, o veţi modifica în
=CHIINV(B7, 1)
Rămâne doar să adaptăm statistica pe care o folosim şi care de data aceasta este cea a lui
2
2 N Nr N c
Pearson X N rc , unde N r sunt totalurile pe linii, N c sunt
r c Nr N c N
totalurile pe coloane, iar N este totalul general. Aceste totaluri au fost calculate pe coloana
D şi pe rândul 5.
119
Formula pe care ar trebui să o plasăm în celula F9 este destul de complicată. Ar fi de

N N c
preferat calculul preliminar al expresiilor r , pe care l-am putea efectua de exemplu în
N
domeniul F3:G4, prin formula
=$D3*B$5/$D$5
şi analoagele ei.
2
N Nr N c
Ar urma calculul preliminar al termenilor N rc , pe care l-am putea
Nr N c N
efectua de exemplu în domeniul I3:J4, prin formula
=1/F3*(B3-F3)^2
şi analoagele ei.
Acestea fiind calculate, formula din celula B9 devine o simplă însumare:
=SUM(I3:J4)
iar concluzia privind confirmarea afirmaţiei (prin respingerea ipotezei nule) apare automat în
celula A8.
Ar fi interesant să plasaţi în celula A9 inscripţia „Valoarea p (riscul acceptării ipotezei
alternative)”, iar în celula B9 formula de calcul, care în cazul acestui test hi pătrat devine
=CHITEST(B3:C4,F3:G4)
Ar trebui să obţineţi o valoare dublă faţă de valoarea pe care aţi obţinut-o (pentru acelaşi
nivel de semnificaţie ales), în celula A9 de pe foaia „ZTest”. Aveţi o explicaţie pentru
această „coincidenţă”?
Tema 34: comanda TABLES în Epi Info
Vom folosi acum modulul Analyze Data al aplicaţiei EpiInfo pentru a „analiza” datele
primare din fişierul LP07_1.xls.
Înainte de toate este necesar să preluăm acest fişier, care nu a fost creat cu aplicaţia
EpiInfo! Pentru aceasta vom folosi comanda Read (Import) din gruparea de comenzi Data.
În caseta de dialog READ va trebui să alegem „Excel 8.0” în lista Data Formats, apoi să
identificăm fişierul în caseta Data Source.
Comenzile date, exprimate în limbajul aplicaţiei, vor fi afişate în fereastra Program
Editor. Ele vor putea fi reluate (eventual după modificări) cu butonul Run din această
fereastră.
120
Apelaţi comanda List pentru a „vedea” conţinutul fişierului. Observaţi cum sunt
identificate datele, pe linii şi pe coloane. (Este un exemplu simplificat de tabel conţinând
date primare.)
Apelaţi comanda Tables pentru a crea tabelul de contingenţă între variabilele Cont_smok
şi Deceased. Alegeţi aceste variabile în casetele listă Exposure Variable respectiv Outcome
Variable (ca în figura de mai sus).
Observaţi rezultatele afişate. În tabelul de contingenţă, pe lângă numerele cu care ne-am
obişnuit, sunt afişate şi procentajele pe linii (Row%) şi pe coloane (Col%). Pentru a „scăpa”
de ele, reluaţi comanda, apăsaţi butonul Settings (vezi figura) şi renunţaţi la Show Percents.
Observaţi restul rezultatelor afişate în special în ultima parte. Ce puteţi identifica?
STATISTICAL TESTS Chi-square 1-tailed p 2-tailed p
Chi square - uncorrected 3,0321 0,0816356755
Chi square - Mantel-Haenszel 3,0238 0,0820513166
Chi square - corrected (Yates) 2,4299 0,1190395582
Mid-p exact 0,0441211064
Fisher exact 0,0603417435
Tema 35: extragerea eşantioanelor aleatoare.
Teoria statisticii se bazează pe presupunerea că eşantionul a fost ales aleator în populaţie.

Veţi exersa acum tehnica extragerii unui eşantion aleator de pacienţi.
Să admitem că dorim extragerea unui număr determinat (prin calcule statistice anterioare)
de pacienţi, în condiţiile în care fiecărui pacient trebuie să i se acorde şanse egale de a fi ales.
(Atenţie, atunci când afirmăm că „extragem la întâmplare”, de fapt subînţelegem că şansa de
a fi ales este aceeaşi pentru fiecare candidat potenţial.)
Probabil că dintre aplicaţiile larg utilizate cea mai dotată pentru simulări „aleatoare” este
Excel. Ea dispune de funcţia RAND, precum şi de un modul de generare de numere
„aleatoare” distribuite Bernoulli, binomial, Poisson, normal etc. Cea mai adecvată scopului
nostru este funcţia RAND, care returnează UN număr distribuit uniform între 0 şi 1 – ceea ce
înseamnă, în principiu, că orice număr dintre 0 şi 1 are aceleaşi şanse de a fi returnat de către
funcţie. (Atenţie, funcţia RAND dă un rezultat volatil, care se modifică la orice schimbare
efectuată pe foaia de calcul!)
Soluţia de alegere „la întâmplare” a unui număr de indivizi este bazată pe exploatarea
funcţiei RAND.
Pentru exemplificare, să folosim datele celor 368 pacienţi stocate în foaia de calcul
LP07_2.xls, presupunând că aceştia au fost toţi pacienţii examinaţi de medicul A.B. în
decursul unui an. Vom selecta „la întâmplare” un eşantion format din 20 de pacienţi.
Observăm că sunt „ocupate” doar coloanele A-E. Coloana A, sub titulatura „id” conţine
coduri-numere de ordine. Atunci când efectuaţi selecţii, asiguraţi-vă că fiecare înregistrare
(pacient) are un identificator unic, de acest tip.
Vom efectua operaţiunea de selecţie exploatând celulele din coloana F. Mai precis, în
celula F1 vom plasa textul „selectia”, iar în celula F2 vom plasa conţinutul =RAND() (ar fi
de preferat s-o faceţi prin intermediul comenzii Inserare→Funcţie.)
Odată plasat acest conţinut, îl veţi extinde pe verticală – prin tragere de mânerul celulei –
la domeniul F2:F369.
(Ar trebui să observaţi că în urma extinderii conţinutul din F2 se schimbă; motivul este
volatilitatea funcţiei RAND.)
121
Selectaţi acum datele din celulele A-F (prin tragere deasupra butoanelor-indicator de
coloană). Sortaţi aceste date, după valorile coloanei F. Folosiţi comanda Date→Sortare.
Acum, primele 21 de rânduri vor conţine datele celor 20 de indivizi selectaţi în eşantion.
Copiaţi aceste prime 21 rânduri întro foaie nouă, pe care o denumiţi „Eşantion1”. Repetaţi
procedura de selecţie prin sortarea după datele din coloana F, preluând o copie a primelor 21
rânduri în altă foaie, pe care o denumiţi „Eşantion2”. Redenumind „Originale” foaia iniţială
a fişierului, salvaţi-l cu denumirea nume_SELECTII.xls (dar şi ca pagină Web!).
Tema specială: obţinerea curbei ROC în Excel.
Veţi efectua acum calculele necesare pentru a obţine o curbă ROC.

Curbele ROC (receiver-operating characteristic) sunt diagrame de evaluare a
performanţelor realizate de un test (biologic) în clasificarea în două clase (sănătos/ bolnav).
Se construiesc prin reprezentarea grafică a senzitivităţii în raport cu valoarea 1–
specificitatea, pentru diverse praguri alese în domeniul valorilor testului.
Pentru a le defini, să facem următoarele precizări. Să presupunem că valori „mari” la test
ne îndeamnă să diagnosticăm boala (dar nu cu certitudine absolută!). Subiecţii „pozitivi”
sunt cei pentru care a fost certificată boala, ceilalţi sunt „negativi”. Odată fixat un prag ,
senzitivitatea asociată pragului este proporţia subiecţilor „pozitivi” pentru care valoarea la
test depăşeşte pragul . Specificitatea asociată pragului este proporţia subiecţilor „negativi”
(adică sănătoşi) pentru care valoarea la test nu depăşeşte pragul .
Concret, senzitivitatea se obţine împărţind numărul de subiecţi „true positives” la numărul
total de subiecţi „pozitivi” (bolnavi), iar specificitatea se obţine împărţind numărul de
subiecţi „true negatives” la numărul total de subiecţi „negativi”.
Preluaţi foaia de calcul din fişierul LP07_3.xls în foaia – pe care o veţi denumi „Datele” –
din cartea de calcul pe care o veţi denumi nume_ROC.xls. Veţi găsi valorile testului pentru
32 de subiecţi, împreună cu clasificarea lor, certificată clinic.
Un prim calcul ce trebuie realizat, după sortarea „înregistrărilor” în ordinea crescătoare a
valorilor testului, este cel al valorilor extreme ale testului. Plasaţi în celula C1 textul
„Extreme”, apoi în celulele din domeniul C2:C3 inseraţi formulele de calcul
corespunzătoare. (În C2 formula de obţinere a valorii minime =MIN(A2:A33), iar în C3
formula pentru valoarea maximă =MAX(A2:A33).)
Inseraţi în cartea de calcul nume_ROC.xls o foaie nouă, denumind-o „Calcule”. Veţi
efectua aici următoarele operaţiuni, în ordine:
a) preluaţi din foaia „Datele” coloanele A şi B;
b) plasaţi în coloana C valorile-prag pentru care calculăm senzitivitatea şi specificitatea.
Plasaţi în celula C1 textul „Praguri”, în C2 formula primului prag (care este cu 1 mai mic
decât valoarea minimă) =Datele!C2–1, iar în C3 formula primului prag intermediar (care
este media aritmetică a primelor două valori) =(A3+A2)/2. Extindeţi formula din C3 la
domeniul C3:C33 iar dedesubt plasaţi formula ultimului prag =Datele!C3+1;
c) este obligatoriu să identificăm pragurile intermediare care coincid cu valori ale testului,
pentru a fi eliminate. În acest scop veţi compara coloana C cu coloana A a valorilor testului,
iar rezultatele comparării le veţi trece pe coloana D. Aşadar, în celula D1 plasaţi textul
„Elimin rândul?”, iar în D2 formula =IF(C2=A2,”da”,”nu”) pe care o extindeţi la
domeniul D2:D34;
d) urmează stabilirea numărului de subiecţi „true negatives”, „false negatives”, „true
positives” şi „false positives” pentru fiecare prag. Veţi rezerva în acest scop coloanele E:H,
în care:
122
– pe rândul 1 veţi plasa texte de identificare, de exemplu „True neg” în celula E1, „False
neg” în celula F1, „False pos” în celula G1 şi „True pos” în celula H1;
– pe rândul 2 veţi plasa valori de iniţializare, de exemplu „0” în celulele E2 şi F2, apoi
=COUNTIF($B$2:$B$33,"sanatos")–E2 în celula G2, iar în celula H2 formula
=COUNTIF($B$2:$B$33,"bolnav")–F2;
– pe rândul 3 veţi plasa alte valori de iniţializare în celulele E3 şi F3, apoi le veţi extinde
pe rândurile următoare, până la 34. Formulele sunt
=COUNTIF($B$2:$B3,"sanatos") resp. =COUNTIF(...,"bolnav")
(Aţi identificat rolul acestor formule?)
e) în sfârşit, coloanele I şi J vor servi pentru calcularea senzitivităţilor respectiv
specificităţilor. Plasaţi în celula I1 textul „1 – Specif” iar în J1 textul „Senzit”, inseraţi
dedesubt formulele de calcul, =1–E2/(E2+G2) în celula I2 şi =F2/(F2+H2) în celula
J2 după care extindeţi formulele la domeniul I2:J34.
Inseraţi în cartea de calcul nume_ROC.xls a treia foaie, denumind-o „Grafica”. Veţi
aduce aici datele de care avem nevoie pentru a efectua reprezentarea grafică dorită. Mai
precis, preluaţi în domeniul A1:C34 prin Copiere/Lipire specială (Valori), una după alta,
coloanele identificate de textele „Elimin rândul?”, „1 – Specif” şi „Senzit” din foaia
„Calcule”.
Selectaţi domeniul A1:C34 şi sortaţi-l după valorile din coloana „Elimin rândul?”. După
sortare eliminaţi toate rândurile care au valoarea „da” în această coloană.
Cu datele rămase în coloanele B şi C veţi construi reprezentarea grafică. După selectarea
lor inseraţi diagrama de tipul X-Y (cu marcatori
uniţi prin segmente). Introduceţi prin tastare
titlurile „1 – Specificitatea” pe axa X şi
„Senzitivitatea” pe axa Y. Eliminaţi legenda şi
toate liniile de ghidare.
Modificaţi scalarea pe ambele axe aşa încât
valorile extreme să fie 0 ş 1.
Folosind instrumentele de desenare, plasaţi pe
diagonală un segment de dreaptă, iar apoi textul
„aria = 0.675” întro casetă text.
Preluaţi diagrama obţinută în documentul
nume_CURBA_ROC.doc plasând-o ca
exemplu după paragrafele pe fond gri anterioare.
123

MG LP07 PDF

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

MG LP07 PDF

Încărcat de

Drepturi de autor:

Formate disponibile

MG - Lucrarea practică 7 2014/2015 UMF “Carol Davila” – Informatică Medicală şi Biostatistică

În această lucrare practică:

Softul ce va fi utilizat în lucrarea practică:

Tema 32: tabele de contingenţă în Excel

Tema 33: testul hi pătrat în Excel

Formula pe care ar trebui să o plasăm în celula F9 este destul de complicată. Ar fi de

Tema 34: comanda TABLES în Epi Info

Tema 35: extragerea eşantioanelor aleatoare.

Teoria statisticii se bazează pe presupunerea că eşantionul a fost ales aleator în populaţie.

Tema specială: obţinerea curbei ROC în Excel.

Veţi efectua acum calculele necesare pentru a obţine o curbă ROC.

S-ar putea să vă placă și