Sunteți pe pagina 1din 148

P.S.

ACEST DOCUMENT NU CONTINE CURSURILE 1,2 DEOARECE ACESTEA


AU CARACTER INTRODUCTIV SI CONTIN PREA MULTE PROSTII SI DETALII
TEHNICE INUTILE. MULTUMESC ANTICIPAT PENTRU INTELEGERE SI SPOR
LA INVATAT

CURSUL III

STRUCTURA SISTEMELOR DE CALCUL

ARHITECTURA UNUI CALCUL NUMERIC


Un sistem de calcul este alctuit din dou componente distincte ca i
natur ns strns legate: hardware-ul i software-ul.
Totalitatea dispozitivelor electronice i fizice care alctuiesc un sistem de
calcul reprezint hardware-ul sistemului.
Pe lng hardware (sau hard) un sistem de calcul posed i o colecie de
programe numit software (sau soft) care permit utilizarea sa eficient.

STRUCTURA HARDWARE

Unitatea central
unitatea central de comand i prelucrare, numit i procesor
central,
unitatea de memorie operativ sau intern.
Procesorul este compus la rndul su din dou componente:
unitatea aritmetic i logic
unitatea de comand i control.

1
2
Unitatea central are legturi multiple cu toate unitile periferice, crora le
transmite comenzi i (sau) date i de la care primete date sau programe .
Unitatea de comand i control, coordoneaz activitatea sistemului de
calcul executnd comenzile pe care le primete.
Unitatea aritmetic i logic realizeaz cu viteze foarte mari operaiile
aritmetice curente precum i operaiile logice. Aceast unitate execut
aceste operaii conform regulilor aritmeticii binare i logicii bivalente.
Memoria intern
Unitatea de memorie operativ (intern sau central) este o
component a calculatorului n care n timpul funcionrii sale
acesta pstreaz instruciunile necesare execuiei unor programe i
(sau) date (rezultate) de regul frecvent accesate pe parcursul
rulrii lor.
Ea se caracterizeaz printr-o vitez mare de accesare n raport cu
memoria extern.
DISPOZITIVE PERIFERICE
Unitile periferice se mpart n dou categorii care nu sunt disjuncte:
uniti de intrare care "citesc" datele de pe diferite suporturi, le
transform n semnale electrice i le transmit unitii centrale;
uniti de ieire, care primesc rezultatele prelucrrilor intermediare
sau finale i le nregistreaz pe diferite suporturi (magnetic, hrtie,
ecrane electronice, etc.).
UNITATI PERIFERICE DE INTRARE

3
tastatura, pentru introducerea de date (text, numere) i pentru dialogul
utilizator - calculator
scanner-ul, pentru achiziia de imagini (fotografii, radiografii, etc.)
mouse-ul, pentru dialogul utilizator calculator,
joystick-ul, pentru dialogul utilizator calculator,
ecranul sensibil (touch screen), pentru dialogul utilizator calculator,
placa de captur video, pentru achiziia de imagini video,
placa de sunet, pentru achiziia de semnale sonore,
modem, pentru comunicarea n reea.
UN ITATI PERIFERICE DE IESIRE

imprimantele (cu ace, cu laser, cu jet de cerneal), pentru tiprirea pe


hrtie a rezultatelor obinute n urma prelucrrilor,
plottere, pentru tiprirea unor elemente grafice de dimensiuni extinse
(diagrame, grafice, imagini, etc.).
placa video, pentru furnizarea (unei camere video) de imagini,
placa de sunet, pentru furnizarea de semnale sonore,
modem, pentru comunicarea n reea.
memorii externe de stocare

DISPOZITIVE PERIFERICE MIXTE


Memorii externe:
discul magnetic fix, pentru stocarea software-ului, a datelor sub form de
fiiere, care cer un volum mare de stocare,
discul mobil (discheta), pentru stocarea fiierelor, care nu cer un volum
mare de memorie i care urmeaz s fie transferate pe alte sisteme de
calcul,
discuri optice, pentru stocarea de volume mari de date.
banda magnetic sau streamer-ul, pentru salvarea periodic a discurilor
discul compact, pentru stocarea de volume mari de date sau a software-
ului.
DISPOPZITIVE PERIFERICE

Accesul sau, mai explicit, localizarea unei anumite zone (adrese)


pentru scriere sau citire poate s aib loc secvenial (serial) sau direct.
In cazul unitilor cu acces secvenial, cum ar fi banda magnetic,
dispozitivul de acces parcurge secvenial suportul pn la gsirea
zonei (adresei) cutate.
In cazul unitilor cu acces direct, cum ar fi, de exemplu, discurile
magnetice, optice sau discul compact, dispozitivul de acces se
poziioneaz direct la adresa cerut. Memoria intern ns este, de
regul, mult mai redus ca volum fa de memoria extern, ns
accesul la memoria extern este mult mai rapid dect la cea extern.
STRUCTURA SOFTWARE A UNUI CALCULATOR NUMERIC

4
Pe lng hardware (sau hard) un sistem de calcul posed i o colecie de
programe numit software (sau soft) care permit utilizarea sa eficient.
Un program este un set de instruciuni, care permit calculatorului s
efectueze o anumit sarcin sau prelucrare de date.
STRUCTURA SOFTWARE
Software:
De baza:
Sistemul de operare
Limbajele de programare
Auxiliar:
Programe utilitare
Aplicatii de birotica: procesare de text, calcul tabelar, bsze
de date
Apicatii de management, de proces, de control

- In cadrul software-ului un rol esenial l are sistemul de operare care


gestioneaz resursele sistemului de calcul i permite dialogul cu utilizatorul.
Pe lng sistemul de operare o component important a software-ului
este alctuit din limbajele de programare (compilatoare, link-editoare,
interpretoare) care permit dezvoltarea de aplicaii i scrierea de programe.
Acestea mpreun cu sistemul de operare alctuiesc software-ul de baz
al unui sistem de calcul.
Celelalte programe sau colecii de programe destinate unor aplicaii
specifice alctuiesc software-ul aplicativ

STRUCTURA SOFTWARE A UNUI CALCULATOR NUMERIC


- La comanda de rulare (execuie) a unui program (executabil), care este o
succesiune de instruciuni, pentru realizarea diferitelor operaii (operaii
aritmetice, logice, de intrare de date, de ieire de date, etc.) necesare prelucrrii
unor informaii,
se aduce n memoria operativ programul sau o parte a sa,
se transfer n unitatea de comand i control prima instruciune a
sa,
este descompus prima instruciune n prile sale componente,
se comand unitii aritmetice sau logice, ori altei uniti a
sistemului de calcul, executarea operaiilor corespunztoare
(identificarea adreselor datelor care particip la operaie,
asigurarea transferrii acestor date dac e cazul, n unitatea
aritmetic i logic, transferarea rezultatelor n memorie etc.).

STRUCTURA SOFTWARE
- In final, se verific dac instruciunea a fost corect executat i n caz
afirmativ se trece la alt instruciune, de regul instruciunea urmtoare.
Dac la verificare se constat erori, programul este ntrerupt i se
comand operaii de detectare a erorii.

5
SISTEMUL DE OPERARE
Sistemul de operare (SO) este o colecie de programe, permind
funcionarea unui calculator i avnd urmtoarele funciuni principale:
Gestiunea memoriei interne centrale
Gestiunea perifericelor i fiierelor,
Execuia programelor,
nlnuirea programelor,
Comunicarea ntre componentele calculatorului,
Comunicarea cu exteriorul (utilizatori, alte calculatoare, etc.)
CONCEPTUL DE FISIER
Fiierul este un concept de baz n informatic definit ca o colecie de sine
stttoare de nregistrri cu o anumit structur.
Acestea pot fi stocate pe un suport magnetic cum ar fi discurile n vederea
regsirii i citirii ulterioare a coninutului lor.
FISIERELE POT CONTINE
programe executabile, adic secvene de instruciuni n codul procesorului
i atunci se numesc fiiere executabile,
programe surs, adic secvene de instruciuni sau comenzi scrise ntr-un
limbaj de programare (Pascal, Basic, FORTRAN, C++, etc.) i atunci se
numesc fiiere surs,
secvene de comenzi ale sistemului de operare fiiere de comenzi,
colecii de date (text, numere, imagini, grafic, etc.) i atunci se numesc
fiiere de date.

ORGANIZAREA FISIERELOR
Modul de organizare pe un disc a fiierelor este gruparea lor n directoare
sau cataloage care sunt dispuse ntr-un arbore de directoare, adic ntr-o
structur ierarhic n care un director-printe poate s conin mai multe
directoare-fiu.
Cataloagele sau directoarele sunt o modalitate simpl de grupare a
fiierelor de acelai tip sau prezint o modalitate comod pentru
partajarea fiierelor ntre membrii unui grup de utilizatori care lucreaz pe
acelai sistem de calcul sau ntr-o reea de calculatoare (sharing).
SOFTWARE DE BAZA
Pe lng sistemul de operare o component important a software-ului
este alctuit din limbajele de programare sau mediile de programare
ce conin compilatoare, linkeditoare i interpretoare care permit
dezvoltarea de aplicaii i scrierea de programe.
Un limbaj de programare este o colecie de reguli (sintaxa limbajului)
care utilizeaz un set de cuvinte cheie (n englez) cu ajutorul crora
se pot descrie prin secvene de instruciuni scrise n acest limbaj
metodele de rezolvare (algoritmul) unor probleme de prelucrare de
date.
Acestea mpreun cu sistemul de operare alctuiesc software-ul de
baz al unui sistem de calcul.

6
Dintre limbajele cele mai cunoscute menionm:
FORTRAN, PASCAL, BASIC folosite de obicei pentru dezvoltarea
unor aplicaii bazate pe proceduri algoritmice implicnd calcule
bazate pe proceduri matematice,
C++, Java folosite pentru dezvoltarea de aplicaii bazate pe
programare obiectual;
SQL folosit pentru dezvoltarea de aplicaii n baze de date.
Medii de programare:
Borland Delphi, Microsoft Studio Net
Tot n software-ul de baz intr i driverele unitilor periferice (programe
care coordoneaz buna funcionare a unitilor periferice).
SOFTWARE APLICATIV
Programele sau coleciile de programe destinate unor aplicaii specifice
alctuiesc software-ul aplicativ:
editoarele de texte, (WORD, Latex, etc.)
tabelele de calcul, (EXCEL, LOTUS, etc.)
sistemele de gestiune a bazelor de date, (DBASE, FOXPRO,
ACCESS, Delphi)
editoarele grafice, (Paint, Corel Draw)
programele statistice, (EPIINFO, SPSS, STATISTICA)
programe pentru calcule matematice, (Mathematica, Mathlab)
programele de inteligen artificial (sistemele expert medicale),
(Internist, Cadiag)
sistemele de documentare automat, (Medline)
programele de prelucrare a imaginilor medicale (tomografice,
ecografice) etc.

CURSUL IV

STRUCTURA SOFTWARE A UNUI CALCULATOR NUMERIC


Pe lng hardware (sau hard) un sistem de calcul posed i o
colecie de programe numit software (sau soft) care permit
utilizarea sa eficient.
Un program este un set de instruciuni, care permit calculatorului
s efectueze o anumit sarcin sau prelucrare de date.
Software:
De baza:
Sistemul de operare
Limbajele de programare
Auxiliar:
Programe utilitare
Aplicatii de birotica: procesare de text, calcul tabelar,
bsze de date
Apicatii de management, de proces, de control

7
In cadrul software-ului un rol esenial l are sistemul de operare care
gestioneaz resursele sistemului de calcul i permite dialogul cu
utilizatorul.
Pe lng sistemul de operare o component important a software-
ului este alctuit din limbajele de programare (compilatoare, link-
editoare, interpretoare) care permit dezvoltarea de aplicaii i
scrierea de programe. Acestea mpreun cu sistemul de operare
alctuiesc software-ul de baz al unui sistem de calcul.
Celelalte programe sau colecii de programe destinate unor aplicaii
specifice alctuiesc software-ul aplicativ
La comanda de rulare (execuie) a unui program (executabil), care
este o succesiune de instruciuni, pentru realizarea diferitelor
operaii (operaii aritmetice, logice, de intrare de date, de ieire de
date, etc.) necesare prelucrrii unor informaii,
se aduce n memoria operativ programul sau o parte a sa,
se transfer n unitatea de comand i control prima
instruciune a sa,
este descompus prima instruciune n prile sale
componente,
se comand unitii aritmetice sau logice, ori altei uniti a
sistemului de calcul, executarea operaiilor corespunztoare
(identificarea adreselor datelor care particip la operaie,
asigurarea transferrii acestor date dac e cazul, n unitatea
aritmetic i logic, transferarea rezultatelor n memorie etc.).
In final, se verific dac instruciunea a fost corect executat i n
caz afirmativ se trece la alt instruciune, de regul instruciunea
urmtoare.
Dac la verificare se constat erori, programul este ntrerupt i se
comand operaii de detectare a erorii.
SISTEMUL DE OPERARE

Sistemul de operare (SO) este o colecie de programe, permind


funcionarea unui calculator i avnd urmtoarele funciuni
principale:
Gestiunea memoriei interne centrale
Gestiunea perifericelor i fiierelor,
Execuia programelor,
nlnuirea programelor,
Comunicarea ntre componentele calculatorului,
Comunicarea cu exteriorul (utilizatori, alte calculatoare, etc.)
CONCEPTUL DE FISIER
Fiierul este un concept de baz n informatic definit ca o colecie
de sine stttoare de nregistrri cu o anumit structur.
Acestea pot fi stocate pe un suport magnetic cum ar fi discurile n
vederea regsirii i citirii ulterioare a coninutului lor.
FISIERELE POT CONTINE

8
programe executabile, adic secvene de instruciuni n codul
procesorului i atunci se numesc fiiere executabile,
programe surs, adic secvene de instruciuni sau comenzi scrise
ntr-un limbaj de programare (Pascal, Basic, FORTRAN, C++, etc.) i
atunci se numesc fiiere surs,
secvene de comenzi ale sistemului de operare fiiere de comenzi,
colecii de date (text, numere, imagini, grafic, etc.) i atunci se
numesc fiiere de date.
ORGANIZAREA FISIERELOR
Modul de organizare pe un disc a fiierelor este gruparea lor n
directoare sau cataloage care sunt dispuse ntr-un arbore de
directoare, adic ntr-o structur ierarhic n care un director-printe
poate s conin mai multe directoare-fiu.
Cataloagele sau directoarele sunt o modalitate simpl de grupare a
fiierelor de acelai tip sau prezint o modalitate comod pentru
partajarea fiierelor ntre membrii unui grup de utilizatori care
lucreaz pe acelai sistem de calcul sau ntr-o reea de calculatoare
(sharing).
SOFTWARE DE BAZA
Pe lng sistemul de operare o component important a software-
ului este alctuit din limbajele de programare sau mediile de
programare ce conin compilatoare, linkeditoare i interpretoare care
permit dezvoltarea de aplicaii i scrierea de programe.
Un limbaj de programare este o colecie de reguli (sintaxa limbajului)
care utilizeaz un set de cuvinte cheie (n englez) cu ajutorul crora
se pot descrie prin secvene de instruciuni scrise n acest limbaj
metodele de rezolvare (algoritmul) unor probleme de prelucrare de
date.
date.
Acestea mpreun cu sistemul de operare alctuiesc software-ul de
baz al unui sistem de calcul.
Dintre limbajele cele mai cunoscute menionm:
FORTRAN, PASCAL, BASIC folosite de obicei pentru
dezvoltarea unor aplicaii bazate pe proceduri algoritmice
implicnd calcule bazate pe proceduri matematice,
C++, Java folosite pentru dezvoltarea de aplicaii bazate pe
programare obiectual;
SQL folosit pentru dezvoltarea de aplicaii n baze de date.
Medii de programare:
programare:
Borland Delphi, Microsoft Studio Net
Tot n software-ul de baz intr i driverele unitilor periferice
(programe care coordoneaz buna funcionare a unitilor periferice).
SOFTWARE APLICATIV
Programele sau coleciile de programe destinate unor aplicaii
specifice alctuiesc software-ul aplicativ:
aplicativ:
editoarele de texte, (WORD, Latex, etc.)
tabelele de calcul, (EXCEL, LOTUS, etc.)

9
sistemele de gestiune a bazelor de date, (DBASE, FOXPRO,
ACCESS, Delphi)
editoarele grafice, (Paint, Corel Draw)
programele statistice, (EPIINFO, SPSS, STATISTICA)
STATISTICA)
programe pentru calcule matematice, (Mathematica, Mathlab)
programele de inteligen artificial (sistemele expert
medicale), (Internist, Cadiag)
sistemele de documentare automat, (Medline)
programele de prelucrare a imaginilor medicale (tomografice,
(tomografice,
ecografice) etc.

CURSUL V
APLICATII DE BIROTICA SI BAZE DE DATE MEDICALE
Microsoft Word XP
WORD
3.1. Deschiderea unui document nou
Document nou
Document blanc
Template
Document vechi

10
3.2. Introducerea textelor
Cursor
Cuvint,
Linie,
Paragraf,
Pagina

11
3.3. Deplasarea n document
Cu mouse
Cu taste sageti
Cu Find si Goto din EDIT
Cu barele de deplasare
3.4. Prezentarea ferestrei n Word (Meniul View)
3.4.1. Forme de prezentare a unui document Word n fereastra de document
3.4.2.
3.4.2. Resetarea prezentrii ferestrei de document
3.5. Selectarea unei zone n document
cu mouse
cu Shift + taste de deplasare
cu Select All din EDIT
selectarea unei linii
selectarea unui paragraf
selectarea unui cuvint
3.6. Operaii de editare
3.6.1. Editarea punctual
inserari
stergeri
3.6.2. Editarea de zon
copieri
stergeri
3.6.3. Inserarea de obiecte
ecuatii
imagini
paginare
3.7. Operaii de prelucrare
3.7.1. Operaii de cutare i nlocuire
Find (EDIT)
Replace (EDIT)
3.7.2. Utilizarea referinelor ncruciate pentru realizarea unei bibliografii
3.7.3. Verificarea ortografic, gramatical i cutarea de sinonime
Spelling and Grammar (TOOLS)
Language - Thesaurus (TOOLS)
3.8. Formatarea documentelor de tip text 3.8.1. Formatarea caracterelor
Stil
Font
Dimensiune
3.8.2. Formatarea paragrafelor
alinierea
spatierea
indentarea
3.8.3. Formatarea paginii
3.8.4. Formatarea global a documentul ui
3.8.5. Formatarea figurilor i desenelor

12
3.9. Lucrul cu tabele n Word
Meniul
Meniul Table
Inserarea unui Tabel
Editarea
Formatarea
3.10. Meniul Windows
Arrange All
Split
Fereastra noua
Lista de documente
WORD APLICATII BIOMEDICALE
Corespondenta medicala
Publicatii medicale (brosuri, carti, articole)
Documente medicale sablon (retete, bilete de internare, externare)

Spreadsheet-ul EXCEL
EXCEL
Aplicaia Excel
Funciunile unei aplicaii de tip spreadsheet
Documentele Excel
Structura unui tabel de calcul
Lucrul cu agende si foi de calcul
Structura ferestrei Excel
Selectarea in foaia de calcul
Introducerea datelor
Editarea datelor
Legaturi intre agende
Formatarea
Diagrame
Sortare
Analiza datelor
Tiparirea
Funciunile unei aplicaii de tip spreadsheet
organizarea datelor in tabele
prelucrarea datelor
calcule cu datele din tabele
analiza datelor
reprezentarea grafica a datelor
DOCUMENTELE EXCEL

Structura documentului
Volume sau Agende (Workbook)
Foi de lucru (sheet)

13
Foi de calcul (Worksheet)
Foi de diagrame
Foi de rezultate

Crearea i deschiderea documentelor


Deschiderea unui document anterior creat
Salvarea unui document
Inchiderea unui document

STRUCTURA UNUI TABEL DE CALCUL

Foaia de calcul (Worksheet)


Linii
Coloane
Celule
Structura standard a unei foi de calcul
titlu
antete de coloane si linii
corpul tabelului (date brute)
linii si coloane de sinteza

14
OPERATII IN AGENDE

Deplasarea in agenda
Trecerea la alta foaie
Deplasarea intr-o foaie
verticala si orizontala
cu tastele de deplasare
cu mouse-ul
cu barele de deplasare
Redenumirea foilor
Redenumirea agendelor

FEREASTRA APLICATIEI EXCEL

Structura ferestrei Excel


Aria de lucru
Referinte de celule
relative A1 , B3
absolute $B$3, $B2, C$5
Referinte de tabel A1:E5
Linia de formule
Bara butoanelor cu referinele coloanelor respectiv a liniilor

15
SELECTAREA IN FOAIA DE CALCUL

Tipuri de selectare
celula
zona conexa
zona neconexa
linie, coloana,
foaie
Tehnici de selectare
cu mouse
cu tasta Shift + taste de deplasare
cu butoane de selectie de coloana si linie
cu Select All din EDIT
prin comenzile Goto si Find din EDIT
prin numele simbolic al celulei sau zonei
INTRODUCEREA DATELOR
Date numerice
Date text
Date calendaristice
Formule
Umplerea unei zone cu acelasi continut
Umplerea unei zone cu o serie de valori

16
FORMULE
Sintaxa
Expresia
operatori aritmetici
operatori relationali
paranteze
operanzi
constante
referinte de celule
nume simbolice
nume de functii predefinite
FUNCTII PREDEFINITE
Referinta de functie
Clase de functii
statistice : AVERAGE, CORREL, COVAR, FREQUENCY, VAR,
STDEV, TTEST, ZTEST, MODE, MEDIAN, KURT, GEOMEAN,
HARMEAN, CONFIDENCE, PERCENTILE, SKEW
matematice:
matematice: SUM, ABS, RAND, LOG, LOG10, LN, EXP, SQRT,
SIN, COS, TAN, ATAN, ASIN, ACOS, COMBIN, FACT,
MDETERM, MINVERSE
logice:
financiare
tehnice
EDITAREA
Copierea
inserarea
stergerea
verificarea ortografica
cautarea si inlocuirea
FORMATAREA
Caracterelor
numerelor
redimensionari de linii, coloane
alinieri, borduri, colorari si hasuri
Autoformatare
DIAGRAME IN EXCEL
Tipuri
Cu coloane
cu bare
Pie
Line
Scatter (xy)
in 3-D
Variante

17
18
19
Elemente constitutive
Seria de date
Trendul
Bare de eroare
Etichete de date
Legenda
Casete de text
Axe
Aria de reprezentare
Aria diagramei
Fete laterale
Marcaje de date
Sageti si obiecte grafice

20
Crearea
Editarea
adaugarea de curbe de trend (liniare, logaritmice, exponentiale,
putere)
adaugarea de bare de eroare
Formatarea

21
ANALIZA DATELOR

Solver
Goal Seek
Data Analysis
ANOVA
Descriptive Statistics
T-test
Z-test
Correlation
Regression
Histogram
SORTAREA SI REGASIREA DATELOR

Meniul Table, SORT


Optiuni de sortare
chei de sortare
tipul sortarii (crescator, descrescator)
Filtrarea
Meniul Table, Filter
TIPARIREA
Pregatirea tiparirii
setarea foii (Page Setup din meniul FILE)
vizionarea prelabila (Print Preview)
Tiparirea
unei foi
unui domeniu
unei agende
antetelor
titlului pe mai multe pagini
diagramelor
APLICATII BIOMEDICALE
Analiza datelor statistice biomedicale
Reprezentarea grafica a datelor medicale
Simularea de situatii in managementul medical
Gestiune medicala

DOSARUL MEDICAL INFORMATIZAT (DMI)

22
Funciile dosarului medical informatizat:
comunicare
individual permite luare de decizii
utilizate n grup permit: evaluarea, cercetarea i planificarea
Diferitele persoane din sistemul de ngrijire a sntii particip direct i
sunt interesate ca dosarul informatizat s fie adus n mod constant la zi
pentru a se putea lua decizii pe baza datelor coninute.
Pacientul nsui este interesat de calitatea datelor din dosar deoarece
acestea se propag n sistemul sanitar i l nsoesc n tot cursul ngrijirii
sale.

23
24
VIZIUNI DIFERITE ASUPRA DMI

FUNCTIILE DMI

Stocarea i comunicarea informaiilor


integrarea datelor (date multimedia)
creterea lizibilitii i accesibilitii dosarului
luarea n considerare a ansamblului problemelor
problemelor unui pacient
creterea completitudinii
disponibilizarea informaiei
evidena corect a episoadelor de intervenie medical
nlnuirea dosarelor distribuite
Ajutor n tratament i decizia medical
nivel crescut de abstractizare a datelor
conine alarme
sugestii diagnostice i terapeutice
procesarea datelor multimedia

Centralizarea datelor
evaluarea global a strii de sntate

25
ajutor n cercetarea clinic i epidemiologic
controlul gestiunii, planificare
Formarea i educarea
facilitatea utilizrii
structurarea demersului medical
legturi cu bazele de cunotine i de documentare medical
Securitate i protecie
securitatea crescut a informaiei
confidenialitate
DIFICULTATI DE IMPLEMENTARE A DMI
Informatizarea impune modelarea complex a datelor i cunotinelor
medicale, modelele iniiale care au copiat foile de observaie sau dovedit
inoperante.
Implic standardizarea limbajului medical.
Problemele umane n general au fost subestimate n toate abordrile unor
astfel de sisteme.
Costul crescut al materialului, soft-ului de gestiune a bazelor de date i de
lucru n reea.
Personalul care ar trebui s opereze, proiecteze i s realizeze astfel de
sisteme este insuficient

ORGANIZAREA PORNIND DE LA SURSA

ORIENTAREA SPRE SURSA DE INFORMAII


datele:
datele:
anamnez,
examen clinic,
examinri complementare
diagnostic
tratament
duce la influenarea structurii dosarului de cea a specificului serviciului
respectiv
De obicei se neglijeaza problemele care nu intra in specialitatea serviciului
respectiv
ORGANIZAREA PORNIND DE LA PROBLEME
orientarea pe probleme structureaz ierarhic dosarul pornind de la o
rdcin care este o list de probleme (problemele sunt o noiune mai
larg dect cea de diagnostic i cuprind o condiie de natur diagnostic
sau terapeutic care necesit o ngrijire particular;
o problem poate fi la fel de bine un simptom i nu un diagnostic).
Exemplu: tomograful evidentiaza o masa intra-cerebrala. Cefaleele sunt
retrase din lista de probleme si locul este luat de problema cauza, tumora
cerebrala.
Problemele pot fi grupate n probleme active si inactive. Cele active
necesita un plan de colectarea a informatiilor subiective si obiective,
prescriptii terapeutice, supraveghere. Aceasta abordare evidentiaza

26
importanta fiecarei probleme (pozitia n ierarhie) si forteaza utilizatorul sa
adopte un demers sistematizat pe probleme.
probleme.
BAZE DE DATE
Funciunile unei aplicaii de tip baza de date
Ce este o baz de date?
Proiectarea unei baze de date ACCESS
Aplicatii n domeniul medical
CE ESTE O BAZA DE DATE?

Colectie structurata si partajata de informatii legate de un anumit subiect, scop sau


organizatie
fisele medicale ale pacientilor
informatiile despre medicamentele din farmacia unui
spital.
ETAPE IN CONSTRUIREA UNEI BAZE DE DATE
1. Studiul de fezabilitate
2. Cercetarea sistemului
3. Analiza sistemului
4. Proiectarea sistemului
5. Dezvoltarea sistemului
6. Implementarea sistemului
7. Revizuire si intretinere
CALITATILE UNEI BAZE DE DATE
Corectitudine
Consistenta
Distribuire
Flexibilitate

CRITERII DE CLASIFICARE

Validare structurala
Simplitate
Neredondanta
Distribuire
Extensibilitate
Integritate

ACCESS-FUNCTIUNI
- Organizarea informatiilor ntr-un fiier baz de date (cu extensia .MDB )
Crearea unor uniti de memorare numite tabele. tabele.
Relaii intre tabele
Datele din tabele diferite pot fi regrupate, prezentate, editate i actualizate
prin anumite machete (forme(forme).).
- Cutarea i regsirea informaiilor se realizeaz cu ajutorul unor filtre.
filtre. Cu
ajutorul filtrelor se pot actualiza articolele bazei de date i se pot efectua calcule.

27
Analiza datelor, prezentarea i tiprirea lor n anumite structuri se
realizeaz cu ajutorul rapoartelor.
rapoartelor.

ACCESS
Obiecte (entiti) cu care lucreaz Access
tabele
filtre
rapoarte
machete
macrouri
module
evenimente
DATABASE WINDOW
In ACCESS pentru lucrul cu obiectele unei baze de date
date ACCESS se
poate utiliza Database Window,
Window, astfel:
Tables pentru tabelele existente,
Queries pentru filtre,
Forms pentru machete,
Reports pentru rapoarte,
Macros pentru macrouri,
Modules pentru module

In Database Window cu:


Open - se pot deschide obiecte existente (tabele, filtre,
machete, etc.)
Design - se pot modifica obiecte existente
New - se pot crea obiecte noi.

MOD DESIGN/ MOD IMPLEMENTARE

28
CREAREA UNEI BAZE DE DATE

ACCESS ofer dou metode pentru a crea o baz de date:


i) Creeaz o baz de date blanc la care se adaug tabele, forme,
filtre, rapoarte i alte obiecte.
ii) Creeaz o baz de date cu Database Wizard alegnd un anumit
tip standard de baz de date.

PROIECTAREA UNEI BAZE DE DATE ACCESS

. Determinarea scopului bazei de date


Determinarea tabelelor
Determinarea cmpurilor
Identificarea cmpurilor cu valori unice
Definirea relaiilor ntre tabele
Rafinarea proiectului de baza de date
Introducerea datelor i crearea altor obiecte ale bazei de date
Utilizarea instrumentelor de analiz a structurii bazei de date Access
DETERMINAREA SCOPULUI BAZEI DE DATE

Ce informaii sunt dorite din baza de date?


Ce subiecte (tabele) trebuie vizate i ce fapte trebuie
trebuie stocate
la fiecare subiect (cmpurile tabelului)?
O discuie ampl asupra problemelor la care trebuie s
rspund baza de date.
Trebuie schiate rapoartele care ar trebui produse.
Ce formulare, machete sunt utilizate curent pentru culegerea
datelor.
datelor.
Trebuie examinate baze de date similare bine proiectate.
CREAREA TABELELOR
Un tabel este o colecie de date despre un subiect specific, cum ar fi de
exemplu:
pacienii (identificare, antecedente colaterale)
consultaiile (data consult
consultatiei, semne, simptome, etc.)

29
personalul medical care le realizeaz ntr-o unitate medical
investigaii
Utilizarea unui tabel separat pentru fiecare subiect permite ca datele s
poat fi memorate o singur dat, cu avantajele:
economie de spaiu de memorare
eficienta sporita in ncrcarea bazei, cutarea si regsirea
informaiilor
reducerea erorilor de introducere a datelor.
Tabelele organizeaz datele n:
coloane (numite cmpuri)
cmpuri) - cel mult 256
linii numite articole sau nregistrri
REGULI PENTRU TABELE

Un tabel nu trebuie s conin informaii duplicate i informaia nu trebuie


duplicat ntre tabele.
Dac fiecare poriune de informaie este plasat numai ntr-un tabel atunci
actualizarea se face ntr-un singur loc.
Fiecare tabel trebuie s conin informaii despre un singur subiect.

CAMPURILE UNUI TABEL


Fiecare cmp trebuie s fie direct n legtur cu subiectul tabelului
Intr-un tabel nu trebuie incluse date derivate sau calculate.
Se recomand includerea n tabele a tuturor informaiilor necesare
aplicaiilor vizate.
Stocai informaiile n cele mai mici segmente logice ale lor (Nume i
Prenume n loc de Nume Prenume, Tensiune arterial sistolic i
Tensiune arterial diastolic n loc de Tensiune arterial).
Cmpurile pot s fie de urmtoarele tipuri:
numeric,
date/time,
currency,
logic (yes/no),
text,
memo,
OLE object.
IDENTIFICAREA CAMPURILOR CU VALORI UNICE

Pentru a conecta informaiile plasate n tabele diferite, fiecare tabel trebuie


s includ un cmp -cheie
-cheie primar - sau un set de cmpuri care identific
n mod univoc fiecare articol individual al tabelului.
Aceast cheie primar permite aplicaiei ACCESS s previn duplicarea
sau valorile nule care ar putea fi introduse n cmpurile cheie primar.
Exist trei tipuri de chei primare
primare n ACCESS:
auto-
auto-numr;
single-field,
multiple-field

30
RELATII INTRE TABELE

Dup ce informaiile au fost divizate n tabele prin relaia dintre tabele


aceste informaii pot fi puse mpreun.
O relaie este o asociere stabilit ntre cmpuri comune din dou tabele.
O relaie poate fi de unul dintre tipurile:
biunivoc,
unul cu mai muli,
mai muli cu mai muli
MACHETE

Proiectul unei machete poate fi realizat n Design View prin introducerea


urmtoarelor elemente ale machetei:
- etichete ce reprezint i conin descrieri ale coninutului
machetei,
- casete de text pentru afiarea datelor din anumite cmpuri
din tabele,
- casete de text pentru formule de calcul.
FILTRE (QUERIES)

- vizualizeaz, actualizeaz i analizeaz datele,


- adun date din diverse tabele i le aranjeaz ntr-o anumit ordine,
- efectue
efectueaz calcule asupra unor grupuri de articole,
- realizeaz calcule de sintez
- Filtre acceptate de ACCESS:
- Selection Query (de selecie ),
- Action Query (de aciune),
- Crosstab Query (de grupare),
- Parameter Query (cu parametri),
- SQL Query.

RAPOARTE

Un raport reprezint o cale de prezentare a unor date i informaii extrase


dintr-o baz de date ntr-un format tiprit.
Seciunile unui raport sunt:
- Report Header
- Page Header
- Detail
- Page Footer
- Report Footer
Report Header are rolul de a include n raport o informaie iniial care
apare la nceputul raportului tiprit, cum ar fi de exemplu titlul raportului.
Page Header are rolul de a include n raport o informaie care apare la
nceputul fiecrei pagini tiprite, cum ar fi antetul unui tabel, cuprinznd
capetele coloanelor tabelului, ce se poate ntinde pe mai multe pagini.

31
Detail cuprinde elemente care definesc liniile tabelului ce vor alctui
corpul tabelului, cum ar fi cmpuri din tabele, sau formule de calcul.
Aceste linii se repeta pentru fiecare nregistrare activ din baza de date.
Page Footer permite includerea n raport a numrului de pagin.
Report Footer permite includerea n raport a unor informaii de sintez la
nivelul raportului. Informaia definit n aceast seciune va apare pe
ultima pagin a raportului nainte de tiprirea seciunii Page Footer.
ACCESS APLICATII

Un macro este un set de una sau mai multe instruciuni care


fiecare efectuiaz o anumit operaie, cum ar fi deschiderea unei
machete sau tiprirea unui raport.
Macrourile pot ajuta la automatizarea unor operatii in baza de
date.
- Un modul este o colecie de declaraii i proceduri Visual Basic,
care sunt memorate mpreun i constituie o unitate de program, care
serveste la realizarea unei aplicaii.
Evenimentul este o aciune specific care i se ntmpl unui obiect
sau este asociat unui obiect (de exemplu: click de mouse,
deschiderea sau nchiderea unei machete). Evenimentele sunt de
obicei rezultatul aciunilor utilizatorului.
ANALIZA UNEI BAZE DE DATE ACCESS

Instrumente de rafinare i analiz a unei baze de date:


Table Analyzer Wizard poate analiza structura unui tabel i poate
propune structuri noi de tabele i relaii ntre ele.
Performance Analyzer
Analyzer poate analiza baza de date n ansamblu i
poate face recomandri i sugestii de restructurare a ei.
APLICATII BIOMEDICALE ALE BAZELOR DE DATE

Gestiunea dosarelor medicale


Gestiunea farmaciei
Gestiunea personalului medical
Evaluarea activitatii medicale
Managementul medical

CURSUL VI
INFORMATICA MEDICALA

RETELE DE CALCULATOARE

O reea de calculatoare este un grup de mai multe calculatoare,


conectate mpreun prin intermediul unei configuraii hardware i
software.

32
Avantajul interconectrii const n partajarea datelor, fiierelor, a
programelor si a operaiilor.
Structura hardware presupune conectarea fizic a calculatoarelor
i este constituit din plci de reea, cabluri de fibr optic sau
linii telefonice precum i echipamente de interconectare: hub-uri.
Daca reeaua este de larg rspndire (WAN) sunt necesare i
alte componente: modemuri, repetoare, bridges, routere etc.
RETELE EXTINSE WAN

WAN (Wide Area Network) acoper o arie geografic extins


(ar, continent). Reeaua conine o mulime de calculatoare
numite gazd pe care ruleaz aplicaiile utilizatorilor.
Calculatoarele sunt conectate la o reea local care corespund de
exemplu birourilor, slilor sau campus-ului, iar aceasta la rndul ei
este conectat la o subreea de comunicaie format din linii de
transmisie si elemente de comutare.
Aceste elemente de comutare sunt numite routere i sunt maini
specializate, care funcioneaz la nivel transport (OSI) cu rol de
dirijare a datelor sub form de pachete prin reea i detectare a
erorilor. Un exemplu de transmitere/reconstituire pachete printr-o
subreea avnd routere este prezentat mai jos:
INTRANET

Pentru o reea organizat i structurat n jurul protocolului TCPIP


i care deservete o anumit instituie asigurnd pe lng
partajarea fiierelor i a resurselor hardware i comunicaii prin
e-mail i/sau videoconferin n prezent se accept denumirea de
Intranet.
Reeaua care alctuiete un Intranet poate fi local n cazul
instituiilor cu o structur unitar, poate avea extindere
metropolitan sau chiar naional sau mondial.
O universitate i unete reelele locale de calculatoare ntr-un
Intranet metropolitan n timp ce marile firme i pot reuni practic
reelele i calculatoarele ce pot fi rspndite n ntreaga lume.
ELEMENTE INTRODUCTIVE IN INTERNET

Reelele de calculatoare sunt interoperabile, ceea ce nseamn c


diverse tipuri de sisteme de calcul, utiliznd sisteme de operare

33
diferite, pot fi conectate, pot comunica i schimba informaii,
atta vreme ct respect protocolul.
FTP: Un program FTP al clientului contacteaz un server FTP i
solicit transferul unui fiier; serverul FTP rspunde expediind
clientului fiierul.
WWW: In acest caz software-ul clientului este un browser;
acesta solicit serverului coninutul unei pagini web, pe care-l
afieaz pe monitorul clientului
E-MAIL: Programul e-mail al clientului permite clientului
conectarea cu un server, in vederea accesrii - citirii sau
trimiterii - unui mesaj prin pot electronic.
TELNET

Telnet este un protocol (un set de reguli) care permite conectarea


unui calculator de un altul.
Calculatorul care iniiaz comunicarea este considerat cel local, iar
cel ce urmeaz a fi conectat, (cel care accept conectarea) este
calculatorul remote (gazd).
Acesta din urm poate fi localizat ntr-o camer alturat, n alt
ora, n alt ar sau pe alt continent.
O dat comunicarea stabilit, calculatorul local emuleaz
calculatorul gazd, respectiv dac utilizatorul (local) formuleaz o
comand, aceasta este executat de gazd; monitorul utilizatorului
afieaz ceea ce s-a ntmplat pe remote n timpul sesiunii Telnet.
Modul de conectare cu calculatorul gazd depinde de accesul la
Internet. De cele mai multe ori computerul remote solicit la
conectare un nume utilizator i o parol.
DESPRE INTERNET
Internet este reeaua reelelor, o reea care cuprinde att largi
reele internaionale ct i mici reele locale (LAN=Local Area
Network) i care fie utilizeaz protocolul TCP/IP, fie poate
interaciona cu acesta prin intermediul unui gateway o poart de
acces un sistem care permite comunicarea ntre dou reele
incompatibile n mod direct.
Internetul ofer acces la toate categoriile de date printr-o
varietate de servicii i instrumente de comunicare ca Telnet, FTP,
e-mail, network news, WWW.
ISP

34
Furnizorul de servicii Internet (ISP) este o instituie care ofer
acces la Internet. Clienii si pot fi instituii, organizaii sau
persoane private. Acetia se pot lega la furnizor prin modem
(sistem shell) sau prin linii telefonice (sistem Point to Point
Protocol=PPP). n primul caz, cel conectat acceseaz Internetul
prin calculatorul gazd, care furnizeaz n ntregime software-ul
necesar, iar la o conectare PPP, utilizatorul trebuie s aib
instalat pe propriul calculator tot software ul necesar.
Un ISP mai poate oferi gzduirea unei pagini web i servicii legate
de denumiri de domenii. Taxele pentru astfel de servicii sunt
dependente de tipul conectrii i nivelul serviciilor oferite (de
exemplu cuantumul transferului de informaie).
ADRESE INTERNET

Termenul de Adrese Internet se refer la modalitatea de a


identifica persoane, calculatoare, reele, resurse pe Internet.
Adresa IP este adresa unic a unui calculator. O adres e-mail se
utilizeaz pentru identificarea unei persoane, cu care s se
realizeze un schimb de mesaje cu ajutorul calculatoarelor. Un
exemplu de adres e-mail este: lchirila@umfcluj.ro unde:
lchirila este numele de utilizator al persoanei care utilizeaz cutia
potal i se definete ca adres utilizator.
Umfcluj este parte a denumirii de domeniu a organizaiei.
Ro este tot parte a domeniului i de obicei definete ara sau tipul
organizaiei/instituiei.
ADRESELE URL

Adresele URL se utilizeaz pentru identificarea specific a


siturilor pe WWW
Gsirea adreselor pe Internet est o sarcin dificil deoarece nu
exist o eviden centralizat a acestora. Exist totui o serie de
instrumente care uureaz o astfel de cutare:
FINGER

Finger este un program destinat gsirii unui utilizator i poate fi


folosit pe dou ci: interogare despre utilizator cunoscnd adresa
calculatorului sau interogare despre alte informaii localizate pe
acelai sistem de calcul.
Pentru acestea finger trebuie s ruleze i pe maina interogat.

35
WHOIS
WHOIS este o baz de date interogabil despre informaii privind
reele, domenii situri. WHOIS ofer mijloace de identificare a
unor adrese e-mail cutate, eventual cu adresa potal, telefon,
fax legate de aceasta.
Baza de date poate fi accesat prin WWW sau prin adres e-
mail.

MOTOARELE DE CAUTARE

Motoarele de cutare pe WWW pot oferi de asemenea informaii


Internet despre utilizatori.
Netiquette reprezint o colecie general acceptat de reguli,
definind comportamentul utilizatorilor Internet. Modul de
comunicare i difuzare a ideilor se aplic n special aplicaiilor de
pot electronic i grupurilor de tiri, dar se aplic i pentru
FTP.
DENUMIREA UNUI DOMENIU

Denumirea unui domeniu este o cale de a identifica i localiza un


calculatoarele conectate la Internet. Dou organizaii nu pot avea
aceeai denumire. Denumirea domeniului conine ntotdeauna dou
sau mai multe componente, separate de puncte de exemplu:
internic.net, nasa.gov sau reston.va.us.
O dat stabilit numele de domeniu i se pot defini subdomenii.
Numele de domeniu poate s dea relaii asupra tipului de
organizaie i anume:
COM instituii comerciale
EDU instituii educaionale
NET organizaii direct implicate n prestaii Internet
ORG organizaii diverse care nu se ncadreaz n alte categorii, de
exemplu organizaii non-profit
GOV - organizaii guvernamentale
MIL instituii militare
Codul de ar este o abreviere de dou litere pentru fiecare ar,
de exemplu RO sau UK.
Fiecare denumire de domeniu corespunde la o adres numeric IP
(Internet Protocol).

36
O adres IP este o grupare de patru numere (fiecare ntre 0 i
255) separate prin puncte.
Reeaua Internet utilizeaz adresele numerice pentru transmisia
de date.
Un sistem de eviden internaional urmrete att corespondena
ntre denumirile de domenii i adresele IP, ct i unicitatea
acestor adrese.
DESPRE WORLD WIDE WEB ( WWW)

WWW este un sistem hypertext prin care utilizatorii se pot


deplasa n Internet datorit legturilor existente ntre documente,
urmnd o rut stabilit.
Pagina de web este o informaie (un document) disponibil n World
Wide Web. O pagin de Web se realizeaz utiliznd HTML, care
definete coninutul paginii: text, imagine, legturi hypertext,
fiiere video sau audio, etc. Fiierele HTML sunt fiiere text care
au fost salvate cu extensia html.
HTML
HTML nsemnnd Hypertext Markup Language reprezint un sistem
de codificare standardizat utilizat pentru definirea structurii
informaiilor dintr-o pagin de web.
HTML se poate compara cu un editor de texte n care documentul
se poate formata n diferite moduri, dar are n plus capacitatea
de a defini amplasarea graficelor , a hyperlink-urilor (legturi
ntre dou documente sau resurse aflate la distan).
Un document realizat utiliznd HTML, poate fi vizualizat de o
varietate de browsere web (instrumente de cutare n web) ca
Netscape, Internet Explorer sau Lynx.
Browser-ul interpreteaz regulile din fiierul , prezentndu-l ca un
document formatat, lizibil. In plus, documentele HTML pot fi
citite de orice tip de sisteme de calcul, PC, Macintosh sau UNIX.
PAGINILE WEB

Paginile Web sunt expediate i recepionate prin HTTP, o metod


client/server utilizat pentru transferul fiierelor hypertext prin
Internet.

37
Software-ul de cutare client, permite utilizatorilor s solicite
pagini Web de la un server HTTP i s vizualizeze aceste pagini
pe propriul calculator.
ADRESA IP

Adresa IP este un numr unic, standardizat de identificare a unui


calculator sau a unei reele anumite n Internet.
Dac se intenioneaz conectarea cu un alt calculator, (pentru a
transfera fiiere sau a trimite un e-mail) mai nti trebuie
cunoscut adresa acestuia.
O asemenea adres const din 4 grupuri de cifre separate ntre
ele prin puncte; fiecare grup reprezint un numr de la 1 la 255.
(Exemplu: 198.41.0.52)
URL

Un URL, respectiv Uniform Resource Locator este un identificator


pentru o anumit resurs Internet, cum ar fi o pagin de Web, o
bibliotec de documente electronice, o imagine se bazeaz pe o
schem standardizat de adrese al resurselor Internet i ajut
utilizatorii la localizarea acestora.
Orice resurs Internet are un URL unic alctuit din litere, cifre i
semne de punctuaie.
Structura adresei este ierarhic cu ierarhizare de la stnga la
dreapta respectiv domenii, subdomenii etc. (Exemplu
http://www.umfcluj.ro)
Oricrei aplicaii Internet i este asociat un numr unic; astfel
numrul asociat aplicaiilor Web este 80. (port)
Dac uneori este un numr diferit, acesta trebuie s fie specificat
n adresa URL; Dac nu se face nici o specificaie nseamn c se
subnelege c e 80.
PROTOCOL

Un protocol este un set standardizat de reguli i reglementri


asupra modului de comunicare a calculatoarelor ntr-o reea. Un
protocol descrie:
Formatul unui mesaj ntr-o comunicare.
Modul de schimb a mesajelor ntre calculatoare.

38
Exemplificnd cu mesajele de pot electronic, protocolul trebuie
s stabileasc att formatul mesajului ct i modul de transmitere
prin reea. Protocolul asigur c mesajul de pot electronic este
corect formatat i corect transmis de la calculatorul de origine la
destinatar.
Pentru diverse tipuri de servicii n reea exist diferite
protocoale. De exemplu Internetul, se bazeaz pe familia de
protocoale TCP/IP. Cteva din acestea sunt:
Simple Mail Transfer Protocol (SMTP) pentru a trimite i a primi
pot electronic
File Transfer Protocol (FTP) pentru a transfera fiiere ntre
calculatoare
Hypertext Transfer Protocol (HTTP) pentru transfer de
informaie pe WWW
Network News Transfer Protocol (NNTP) pentru a transmite
nouti de reea.
Protocoalele permit diferitelor tipuri de calculatoare (Macintosh,
PC, UNIX, VMS, etc.) s comunice ntre ele n pofida diferenelor
datorit formatului standard al comunicrii.
FTP

FTP Protocolul de transfer al fiierelor este parte a familiei de


protocoale TCP/IP i statueaz regulile care permit transferul de
fiiere ntre calculatoare n conformitate cu principiile sistemului
client/server.
Programul client permite utilizatorului contactarea serverului n
sensul accesului de informaii i servicii de pe server.
Fiierele ce urmeaz a fi transferate sunt stocate pe un server
special, numit server FTP.
Pentru accesarea acestor fiiere utilizatorii folosesc un software
client FTP.
Acesta permite localizarea fiierelor ce se doresc a fi transferate
i iniiaz procesul de transfer. Fiierele pe serverul FTP sunt
adesea arhivate pentru a crete capacitatea de stocare i pentru
a crete viteza de transfer.
PACHETE

39
Pachetul este o unitate de date grupate, trimis ntr-o reea.
Datele se fragmenteaz n pachete nainte de a fi expediate prin
Internet. Tipurile de date care sunt transmise prin sistemul de
pachete sunt:
Mesaje e-mail
Fiiere transmise prin FTP (File Transfer Protocol)
Pagini web transmise prin WWW (World Wide Web)
TCP/IP

Transmission Control Protocol/Internet Protocol (TCP/IP) este un


set de reguli care stabilesc modul de transmitere a datelor ntr-o
reea i n Internet.
TCP/IP utilizeaz sistemul de pachete pentru transmitere de date.
IP-ul segmenteaz datele n pachete, adaug adresa de expediie
i destinaie i stabilete cuantumul de informaie ce se va putea
expedia ntr-un pachet.
TCP-ul, trimite pachetele ntr-o secven care s asigure sosirea
lor la destinaie n ordinea corect, asigurnd totodat
retransmisia fiecrui pachet alterat n cursul transmisiei.
WEB INDEX

Un web index este un instrument destinat s ghideze utilizatorii


pentru localizarea informaiilor pe WWW. Un web index utilizeaz
hipertextul pentru a prezenta lista de resurse care poate facilita
cutarea pe web.
Indexul este alctuit pe subiecte, i organizat ierarhic. Multe
indexe dup identificarea informaiei, realizeaz i legtura cu
sursa de informaie (de exemplu o baz de date).
Dintre cele mai cunoscute indexe sunt: Yahoo, WWW Virtual
Library, TradeWave Galaxy, Yanoffs Internet Services List,
Argus Clearinghouse, Clearinghouse for Subject-Oriented Internet
Resource Guides at the University of Michigan, Magellan, Point.
Un motor de cutare Web este un instrument interactiv care ajut
la localizarea informaiilor disponibile prin WWW. Mai precis ele
sunt baze de date care conin referine ale miilor de resurse
disponibile.

40
Utilizatorul supune interogrii baza de date adresnd ntrebri
formulate n sensul dac baza de date conine informaii care s
ndeplineasc criteriile specificate.
Aadar interfaa unui motor de cutare permite utilizatorului
scrierea ntr-un spaiu special a criteriilor de cutare. Motorul
retransmite utilizatorului o list a resurselor ce ndeplinesc
criteriile.
ntruct bazele de date ale diverselor motoare de cutare pot s
aib diferite surse de informaii, aceleai cerine de cutare
adresate diverselor motoare pot furniza rezultate diferite. Uneori
exist legturi automate ntre bazele de date ale diverselor
motoare de cutare.
BROWSER

Un browser (sistem de cutare) este un software client care


lucreaz ca o interfa ntre utilizator i Internet n special
pentru WWW.
Browserul contacteaz serverul web i trimite o solicitare pentru o
informaie, primete informaia i o vizualizeaz pe sistemul de
calcul al utilizatorului in format text sau grafic.
Un browser grafic ofer ntreaga gam a facilitilor navigrii pe
resursele Internet: text, hipertext, sunet, imagine, animaie, etc.
Cteva exemple de browsere sunt: Netscape Navigator, Microsoft
Internet Explorer, NetManage WebSurfer, Spry Mosaic.
Microsoft Internet Explorer i Netscape Navigator sunt browsere
grafice pentru web, uor utilizabile, care permit utilizatorilor
accesul pe WWW, cu toate facilitile oferite de acesta: culoare,
sunet, animaie. De asemenea acestea permit accesul la FTP,
grupuri de tiri i e-mail.

NEWS

41
Network News (Noutile de reea) reprezint o modalitate de
informare pe categorii de subiecte denumite newsgroups (grup de
tiri).
Informaiile constituind tirile, sunt furnizate de persoane
interesate de subiect i sunt disponibilizate pentru a putea fi
citite i comentate.
Categoriile de grupe de tiri sunt organizate i structurate
ierarhic de la general la specific.
Comunicaiile n newsgroup se realizeaz prin protocolul NNTP,
(Network News Transfer Protocol) parte a familiei de protocoale
TCP/IP.
Acesta permite ca tirile dintr-un grup s circule prin Internet.
Principiul de lucru n newsgroup este client/server, respectiv
programul clientului permite conectarea serverului pentru accesarea
informaiilor i serviciilor.
Un server de tiri e un calculator dedicat stocrii articolelor unui
newsgroup.
Pentru a putea accesa serverul, calculatorul utilizatorului trebuie
s dispun de un program de citire, newsreader; acesta este o
interfa care permite utilizatorului s selecteze i s deschid
un anumit articol de pe server apoi eventual s rspund sau s
fac comentarii.
EMAIL

Electronic Mail (Pota electronic) sau e-mail-ul permite trimiterea


de informaii ntre calculatoare prin Internet, fiind facilitatea cea
mai frecvent utilizat a acestei reele.
O informaie poate fi trimis prin e-mail la unul sau mai muli
destinatari.
O adres e-mail identific o persoan i un calculator.
Structura de baz a unei adrese e-mail este: nume utilizator
urmat de semnul @ apoi nume de subdomeniu urmat de punct,
domeniu de nivel doi urmat de punct, domeniu de nivel unu de
exemplu: anca@infomed.umfcluj.ro .
Pota electronic ruleaz n Internet datorit protocolului SMTP
(Simple Mail Transfer Protocol), parte a protocolului TCP/IP.
Datorit acestui protocol schimbul de mesaje se poate realiza i
ntre calculatoare de diferite tipuri: UNIX, PC sau Macintosh.

42
Modul de comunicare este de tip client/server, deci programul
client permite utilizatorului s contacteze serverul, s acceseze
informaia i serviciile de pe server.
Pentru a citi i a trimite scrisori, utilizatorul trebuie s acceseze
serverul pe care scrisorile sunt stocate.
Aplicaia client, este interfaa care permite utilizatorului s
citeasc, s rspund, s redirecioneze, s compun i s trimit
noi mesaje.
Un mesaj e-mail nu este limitat numai la text; i alte tipuri de
fiiere se pot ataa unui e-mail prin agrafare.
Fiierele agrafate (ataate) pot fi binare (numai text) sau pot fi
grafice.
Un protocol denumit MIME (Multipurpose Internet Mail Extensions)
permite calculatorului expeditor codificarea fiierelor non-text,
apoi decodarea lor de calculatorul receptor (destinatar).
MAILING LIST

Mailing list (lista de coresponden) este un mijloc de a distribui


informaia prin intermediul potei electronice la mai multe persoane
concomitent, de obicei privind un subiect specific.
Prezena pe o list de coresponden se realizeaz de obicei prin
subscriere.
Distribuia informaiei la toi subscriii se realizeaz de la o
adres unic numit reflector. Avnd originea n mediul academic
majoritatea listelor de coresponden trateaz subiecte de
nvmnt sau cercetare.
Deoarece exist numeroase activiti administrative legate de o
list de coresponden (evidena de participani, redirecionri)
mai nou se utilizeaz software-uri automate care pot ndeplini
aceste funcii.
Anumite liste sunt moderate (se verific dac mesajele sunt n
concordan cu subiectul propus nainte de a fi redirecionate),
altele sunt restricionate (subscripia nu este pentru un public
larg).

CURSUL VII
INTRODUCERE IN BIOSTATISTICA

ELEMENTE DE BIOSTATISTICA

43
OBIECTIVELE STATISTICII

Statistica este un domeniu tiinific care permite studiul fenomenelor de


masa a cror proprietate fundamental este variabilitatea.
Obiectivul principal al statisticii este studiul unei colecii de observaii
efectuate asupra unor entiti (persoane, obiecte, etc.) de aceiai natur,
denumite uniti statistice, dup una sau mai multe caracteristici variabile.

Statistica descriptiv se ocup cu:


culegerea datelor statistice,
prezentarea datelor statistice,
reprezentarea (grafica)
(grafica) datelor statistice,
determinarea unor caracteristici numerice sintetice ale datelor
statistice.
Obinerea de concluzii (inferene) asupra unei populaii, pornind de la o fraciune
(eantion) a ei, constituie problematica principal a statisticii inductive sau
infereniale.
infereniale.

MULTIMI STATISTICE

Populatia statistica - o multime de entitati ce au cel putin o caracteristica


comuna
volumul (talia) populatiei - numarul elementelor populatiei
unitate statistica
criterii de incluziune
criterii de excludere
excludere
ESANTION

=selectie
= o submultime finita a unei populatii statistice
Caracteristici
talia esantionului
esantion reprezentativ (prelevare aleatoare, cu o talie suficient de
mare)
esantion nereprezentativ sau cu bias
MOTIVELE FOLOSIRII ESANTIOANELOR

i. Talia populaiei poate fi foarte mare sau chiar infinit


ii. Eantioanele pot fi studiate mai rapid dect populaiile,
iii. Studiul caracterului pe ntreaga populaie este frecvent imposibil,
deoarece poate distruge populaia.
iv.In anumite situaii nu se mai pot obine informaii dect despre o parte a
populaiei.
v. Rezultatele observaiilor pe eantioane adesea sunt mai precise dect
rezultatele bazate pe observarea populaiei n totalitate,

44
vi. Costul i resursele necesare (umane, materiale, etc.) pentru
observarea exhaustiv a unei populaii pot de asemenea s fie un motiv
pentru utilizarea eantioanelor.
VARIABILE
Caracteristica (variabila) - un atribut al unei populatii
Tipuri de variabile
calitative (sexul, tipul rasial)
cantitative
discrete
discrete
continue
semicantitative

METODE DE PREZENTARE SI INTERPRETARE A DATELOR STATISTICE

Date statistice brute


De exemplu, valorile succesive ale greutii a 120 de indivizi luai la
ntmplare reprezint o colecie de date brute.
Serie statistic dupa
dupa numarul de variabile este:
univariata
bivariata
multivariata

Serie statistic daca variabilele sunt masurabile poate fi:


unidimensionala
bidimensionala
multidimensionala
Printr-o serie statistic unidimensional de talie n: X1, X2,..., Xn se nelege un
ir de n valori numerice ale unei variabile de masurare definite pe o populaie
statistic.
O serie statistic este de regul asociat unui eantion de talie n, cum ar
fi, de exemplu:
- valorile taliei pentru n indivizi;
- concentraia unei enzime msurate la n persoane;
- tensiunea arterial sistolic determinat la n indivizi,
- glicemia determinat pentru n subieci, etc.

45
Inconveniente ale seriei statistice:
Ansamblul informaiei cuprinse n seria statistica este, n
general, cu att mai neclar cu ct numrul datelor este mai
mare. Este frecvent preferabil organizarea acestor date i
reprezentarea lor ntr-o form mai concis.
Ansamblul datelor seriei se preteaz destul de greu la la
comparri directe, n acest scop fiind necesar o
transformare a lor.
Aceste inconveniente parial pot fi remediate, n dou moduri:
i) organiznd i reprezentnd datele
ii) calculnd anumii indicatori statistici sintetici ai seriei (sau distribuiei) de
date brute

i) Organizarea i reprezentarea datelor se poate face prin:


serii ordonate
distribuii de efective (frecvente)
tabele de clase de frecvene
histograme i poligoane de frecvene
ii) Calcularea unor indicatori statistici sintetici ai seriei (sau distribuiei) de date
cum sunt:
indicatori
indicatori de centralitate
indicatori de dispersie
indicatori de localizare
msuri de asimetrie (skewness),
msuri de boltire (kurtosis).
Serii ordonate (crescator, descrescator)
Tabelele se clasifica dupa:
i) continut
cu distributii de frecvente
de clase
clase de frecvente
de contingenta
ii) structura

46
cu doua coloane
cu subclasificari
master

Principii generale pentru construirea tabelelor:


A. Tabelele trebuie s fie ct mai simple posibil.
Sunt preferate dou sau trei tabele mici unui singur tabel
mare care s conin multe detalii sau variabile.
Pot fi citite cu uurin valorile a maximum trei variabile.
B. Tabelele trebuie s se explice singure.
Codurile, abrevierile sau simbolurile utilizate trebuie
explicate clar n nota de subsol
Fiecare rnd i fiecare coloan a tabelului trebuie etichetat
concis i clar.
Trebuie menionate unitile de msur pentru datele incluse n tabel

47
Titlul tabelului trebuie s fie clar, concis i la subiect. El trebuie s
rspund la ntrebrile: ce ? cnd cnd ? unde ?
Totalul trebuie s apar n orice tabel (sau linii ori coloane de sintez ).
Titlul este de obicei separat de corpul tabelului prin linii i spaii.
Dac datele nu sunt originale trebuie s se menioneze sursa lor ntr-o
not de subsol.
Tabele ce conin distribuii de frecvene
O modalitate comod de a prezenta o mulime de date brute este:
i) se ordoneaza datele in ordine crescatoare,
ii) se determine frecvena fiecrei valori,
iii) se includ valorile distincte si frecventele intr-un tabel pe dou coloane.
TAD n mm Hg Nr. bolnavi (frecvena absolut)
40 2
50 3
60 5
70 8
80 13
90 17
100 20
110 13
120 15
130 4
Total 100

FRECVENTE
FRECVENTE
Frecventa absoluta u(x) a unei valori x
Frecvena relativ f(x) a unei valori x este raportul dintre frecvena
absolut u(x) i efectivul total al seriei n: f(x) = u(x)/n.
Frecvena relativ se prezint uneori n procente.
Alte tipuri de frecvene:
frecvene:
frecvena absolut cumulat cresctoare asociat unei valori
x - suma frecvenelor absolute ale tuturor valorilor seriei care
sunt mai mici sau egale dect x (FACC)
frecvena absolut cumulat descresctoare asociat unei
valori x - suma frecvenelor absolute ale tuturor valorilor
seriei care sunt mai mari sau egale dect x. (FACD)
Analog se definesc i frecvenele relative cumulate. (FRACC, FRACD)
Se pot alctui tabele de frecvene cu mai multe coloane care s cuprind:
valorile distincte
frecventele
frecventele absolute
frecvenele relative
frecvenele relative cumulate.
Programul statistic EPIINFO, prin comanda FREQ din componenta
ANALYSIS.
Programul Excel, functia FREQUENCY
Tabelul claselor de frecvene

48
se descompune seria n clase prin mprirea ntinderii ei n
intervale de clas
se determina numrul de valori care intr n fiecare clas

Tabelul frecvenelor permite o apreciere global asupra seriei statistice ct


i realizarea unor seciuni n seria statistic, respectiv gsirea rapid a
unor rspunsuri la ntrebri de genul:
Care este cea mai numeroas clas?
Ce populaie se afl n toate clasele care preced o clasa
data sau care urmeaz dup o clasa data ?
Tabelul frecvenelor absolute ofer o distribuie a efectivelor claselor,
denumit i distribuie de frecvene.

CURSUL VIII
INFORMATICA MEDICALA

STATISTICA DESCRIPTIVA

METODE DESCRIPTIVE

Date de tip calitativ


Proportii
Rate
Rapoarte
PROPORTIA CELOR EXPUSI

Proportia celor expusi in grupul de control=


45/315=14,3%
Proportia celor expusi in grupul de risc=
84/397=21,2%

49
PREVALENTA

=numar de bolnavi / numar de persoane examinate

SENSIBILITATEA = PERSOANE BOLNAVE DIAGNOSTICATE

50
Sensibilitatea = persoane bolnave diagnosticate pozitiv / numar total de
persoane bolnave = 154/379 = 40,6%
Specificitatea = persoane sanatoase dignosticate negativ / numar de persoane
sanatoase = 23362 / 23724 = 98,5%

51
RATE
Nu se suprapune notiunea cu cea de proportie
Rata poate trece de 100%
Rata schimbarii = (valoare noua-valoare veche)/valoare veche x 100
REPREZENTARI GRAFICE

MORBIDITATE, MORTALITATE

Mortalitate, rata deceselor = numar decese / populatie x 1000


Morbiditate = prevalenta

52
Incidenta = numar de persoane care fac o anumita afectiune intr-o perioada
de timp / numar de persoane neafectate la inceputul studiului care au fost
urmarite pe perioada respectiva
RAPOARTE

Riscul relativ = incidenta in grupul 1 / incidenta in grupul 2


RR > 1 efect nociv
RR < 1 efect protector
ODDS Ratio
MASURI DE TENDINTA CENTRALA, DE DISPERSIE, LOCALIZARE,
SIMETRIE

Media aritmetica, Mediana, Modul, Media geometrica, Media armonica,


Valoarea centrala
Dispersia, Abaterea standard, Coeficientul de variatie, Eroarea standard,
Amplitudinea
Cvartile, Percentile
Asimetria
Boltirea

MEDIA
Media aritmetic este o msur a valorii centrale a setului de date n jurul
creia fluctueaz datele setului. Media nu d nici o indicaie asupra gradului
de fluctuaie (de abatere) de la medie, adic asupra a ceea ce se numete
frecvent dispersia datelor.
Media aritmetic a seriei de date (reprezentnd o statistic)
X1, X2, ..., Xn
asociate unui eantion se determin prin formula:

Media unei populaii (reprezentnd un parametru al populaiei) se calculeaz printr-o


formul similar:

unde N este talia populaiei iar suma cuprinde toate elementele populaiei.

In cazul cnd rezultatele sunt prezentate n tabele de frecvene media va fi estimat


prin aa numita medie grupat:

53
unde prin Fi, Ci s-au notat frecvena respectiv centrul clasei Ki (i=1,2,...,m).

Proprieti ale mediei aritmetice:


Orice valoare a seriei este luat n considerare n calculul
mediei.
Valorile extreme pot influena media aritmetic distrugndu-i
reprezentativitatea.
Media aritmetic se situiaz printre valorile seriei de date.
Suma diferenelor dintre valorile individuale din serie i medie
este zero.

Proprieti ale mediei aritmetice:


Schimbarea originii scalei de msur a variabilei X din care
provine seria de date are influen asupra mediei. . Fie X = X +
C, unde C este o constant. Atunci, fiindc Xi = Xi + C, se
obine imediat c:

Transformarea scalei de msur a variabilei X influeneaz media aritmetic. Astfel


dac se ia X = h X, h fiind o constant real, atunci Xi = h Xi, i rezult uor c:

EXEMPLU 1

Intr-o epidemie de hepatit A, un eantion de 6 persoane au simptome clinice dup


un numr de zile de la expunere, dup cum urmeaz: 24, 25, 29, 29, 30, 31.

54
EXEMPLU 2

Intr-o epidemie de hepatit A, un eantion de 6 persoane au simptome clinice dup


un numr de zile de la expunere, dup cum urmeaz: 24, 25, 29, 29, 30, 131.

CONCLUZIE

media aritmetic este puternic afectat de valorile extreme.

MEDIANA
Mediana este o valoare astfel nct jumtate dintre observaii i sunt
inferioare (sau egale) i cealalt jumtate superioare (sau egale).
Procedura de calcul a medianei urmeaz urmtorii pai:
Se ordoneaz datele seriei n ordine cresctoare.
Se localizeaz poziia medianei n acest ir i se determin valoarea ei.
Dac volumul n al seriei este impar, atunci mediana este dat prin
formula

EXEMPLU

Lista de mai jos se prezint pentru 17 sortimente de hot-dog coninutul n


calorii:
107, 135, 136, 138, 139, 140, 146, 147, 153, 172, 173, 175, 179, 182,
190, 191, 195
Media =158.7
Mediana = 153 .

Rangul medianei n seria de date este =

55
MODULUL
Modul (sau valoarea modal) sau dominanta unei serii statistice este o
valoare care are cea mai mare frecven din serie.
Dac seria statistic este prezentat sub forma unei tabele de clase
frecvene, modul corespunde centrului clasei de frecven maxim.
Se vorbete de o distribuie de frecvene unimodal dac tabela de frecvene
are un singur maxim i de o distribuie de frecvene multimodal dac are
mai multe maxime.
Din punct de vedere grafic modul reprezint abscisa creia i corespunde
ordonata maxim.

MASURI ALE TENDINTEI CENTRALE

INDICATORI DE LOCALIZARE SAU AMPLASARE

Ca msuri sau indicatori de localizare sau amplasare se utilizeaz cvartilele


unei serii de date, decilele i percentilele (fractilele).
Astfel prima cvartil sau cvartila de 25% este o valoare avnd proprietatea ca
25% dintre datele seriei sunt mai mici sau egale cu ea iar 75% mai mari sau
egale cu prima cvartil.
A doua cvartil sau cvartila de 50% este reprezentat de median.
A treia cvartil sau cvartila de 75% este o valoare avnd proprietatea ca 75%
dintre datele seriei sunt mai mici sau egale cu ea iar 25% mai mari sau egale
cu a treia cvartil.

56
Notnd cu a valoarea din seria de date cu proprietatea c o proporie egal
cu a din date sunt mai mici sau egale a iar celelalte sunt mai mari,
atunci a reprezint percentila de ordinul a.
cvartilele sunt percentilele 0.25 , 0.5 , 0.75
decilele sunt percentilele 0.1 , 0.2 ,...,0.9 .

MASURI DE DISPERSIE
descriu variabilitatea (fluctuaia) sau dispersia datelor seriei i joac un rol
important din urmtoarele puncte de vedere:
Msurile de dispersie ofer informaii privind extinderea mprtierii
datelor sau, reciproc, a gradului lor de aglomerare (ngrmdire sau
apropiere).
Msurile de dispersie sunt utile n stabilirea reprezentativitii
msurilor de centralitate. Semnificaia unei medii ca i valoare
reprezentativ pentru un set de date depinde de gradul de dispersie a
valorilor individuale n jurul ei.
Msurile de dispersie joac un rol important n estimarea parametrilor
statistici i n inferena statistic.

57
AMPLITUDINEA

=diferena ntre valoarea maxim i valoarea minim a datelor:


A = Xmax - Xmin.
Xmax=max{X1,,Xn}
Xmin= min {X1,,Xn}
Dezavantajul major al amplitudinii ca msur de dispersie este c se bazeaz
doar pe valorile extreme ale seriei. Astfel ea nu ofer nici o informaie despre
ct de aglomerate sunt datele distribuite ntre extreme
EXEMPLU
7, 16, 3, 12, 8, 3
amplitudinea= 16-3=13
2,3, 10, 16
amplitudinea= 16-2=14
MEDIA DEVIATIEI

58
VARIATIA

reprezint cel mai utilizat mod de exprimare al dispersiei datelor n jurul


mediei aritmetice.
Astfel variaia este media aritmetic a ptratelor abaterilor de la media seriei,
adic:

Variaia se exprim n ptratul unitilor de msur al valorilor observate.


Dac datele sunt prezentate n tabele de clase frecvene variaia poate fi estimat
prin formula:

unde prin Fi, Ci s-au notat frecvena respectiv centrul clasei Ki (i=1,2,...,m).

In inferena statistic se utilizeaz variaia (de eantionare

59
ABATEREA STANDARD

sau ecartul tip S este rdcina ptrat a variaiei:

Spre deosebire de variaie, ecartul tip are aceeai unitate de msur ca i


media i datele seriei. Din punct de vedere geometric abaterea standard sau
ecartul tip poate fi interpretat ca o distan euclidian a seriei la media ei
aritmetic.
In inferena statistic abaterea standard sau deviaia standard (de
eantionare) se definete analog:

COEFICIENTUL DE VARIATIE

=CV este, pentru datele de tip raie, o msur relativ a dispersiei datelor. El este
egal cu raportul dintre ecartul tip i media seriei:

Coeficientul de variaie prezint o evaluare a abaterii standard n raport cu valoarea


medie i are avantajul de a fi un indicator independent de unitile de msur

=Exprimat n procente, coeficientul de variaie exprim procentul reprezentat


de valoarea abaterii standard din valoarea mediei aritmetice a seriei de date.
Coeficientul de variaie furnizeaz un procedeu de a compara dispersiile
relative pentru distribuii de frecvene ale unor fenomene diferite. Astfel se
poate compara dispersia relativ a unui tip de date cu dispersia relativ a
altui tip de date.
Observaie: Coeficientul de variaie nu are semnificaie dect dac este
calculat pentru datele de tip raie.
EXEMPLU
In exemplul urmtor datele care se compar sunt exprimate cu uniti de msur
diferite. In grupul A media greutii a fost de 65.7 kg cu o deviaie standard de 3.2
kg. In grupul B media nlimii a fost de 1.70 m cu o deviaie standard de 0.13 m. S
se compare variabilitatea nlimii cu cea a greutii.

60
In utilizarea coeficientului de variaie la studiul omogenitii unor populaii se
pot utiliza urmtoarele reguli empirice:
dac CV este sub 10% atunci populaia poate fi considerat omogen;
dac CV este ntre 10%-20% atunci populaia poate fi considerat
relativ omogen;
dac CV este ntre 20%-30% atunci populaia poate fi considerat
relativ heterogen;
dac CV este peste 30% atunci populaia poate fi considerat
heterogen.
EROAREA STANDARD

In inferena statistic se utilizeaz un indicator al dispersiei datelor numit eroarea


standard:

Eroarea standard intervine n estimarea statistic n determinarea intervalelor de


ncredere pentru medie.
ASIMETRIA SKEWNESS

Msura de asimetrie (sau skewness) este destinat s indice pentru o serie


sau distribuie de date:
extinderea asimetriei adic abaterea de la aspectul simetric
direcia asimetriei (pozitiv sau negativ).
Ca o msur a asimetriei unei distribuii este utilizat momentul de ordinul trei
al abaterii de la medie reprezentat prin media aritmetic a cuburilor abaterilor
valorilor distribuiei de la media aritmetic, adic:

momentul de ordinul trei M3 are dou dezavantaje:

61
Momentul de ordinul trei se exprim cu ajutorul unitilor de msur
ale datelor ceea ce permite greu compararea a ordinelor de mrime a
asimetriei pentru dou distribuii.
Variaia unei distribuii date ridic, de asemenea, o problem deoarece
pentru dou distribuii avnd aceiai form, ordinul de mrime al
momentului de ordinul trei M3 crete odat cu variaia.
Pentru a elimina aceste dezavantaje momentul de ordinul trei este
standardizat prin mprirea cu cubul abaterii standard

3 poate fi interpretat i ca media cuburilor deviaiilor standardizate de la medie:

acest coeficient reprezentnd msura de asimetrie cea mai convenabil pentru o


distribuie.

BOLTIREA KURTOSIS

Excesul sau boltirea (n englez kurtosis) este o msur a formei unei serii sau
distribuii de date, care msoar nlimea aplatizrii/boltirii unei distribuii n
comparaie cu o distribuie normal. Aceast msur este definit prin:

62
Excesul 4 este zero pentru o serie de date avnd o distribuie normal,
este pozitiv pentru o serie de date avnd trena mai nalt dect cea a unei
distribuii normale (cu media i variaia S2)
este negativ pentru o serie de date a crei tren este mai cobort dect cea
a unei distribuii normale
trena se apropie mai ncet (4 >0) sau mai rapid (4 <0) de zero dect cea a
distribuiei normale).

CURSUL IX
INFORMATICA MEDICALA

INTRODUCERE IN CALCULUL PROBABILITATILOR

PREAMBUL

Medicii cu experien ncep procesul de a pune un diagnostic de la prima de


stabilire a contactului vizual cu un pacient.
Dar procesul de diagnosticare poate ncepe chiar nainte de stabilirea
contactului vizual cu un pacient.
Oare nu se poate diagnostica pacientul care nu a fost nc vzut, care este nc
n camera de ateptare. Dar noi putem cunoatem foarte multe despre pacient i
putem face unele deducii.
De exemplu, am putea deja s tii c pacienta are 34 de ani i este trimis de
medicul de familie, din cauza durerilor de cap.
Oare ce determin, de obicei, la alte femei n jur de treizeci de ani dureri de cap
? Aproximativ o treime (33%) au migrene, o alt treilea au dureri de cap date de

63
abuzul de medicamente (n care tratamentul a devenit o problem n loc de
soluie sale), i a rmne o treime se ncadreaz ntr-un "totul altceva", care
include manifestrile HTA, probleme la nivelul articulaiilor cervical sau la nivelul
maxilarului, afectiuni ale sinusurilor, tumori, etc.
Deci, nainte de a vedea cu pacientul suntem deja capabili s identificm cele
mai probabile dou diagnostice i s atribuim o probabilitate iniial pentru
fiecare.
n momentele ulterioare, n funcie de anamnez, de examinare i testele
suplimentare (dac este necesar) fiecare dintre probabiliti va suferi o serie de
modificri n jos sau n sus. Medicul individualizeaz ntrebrile puse i
elementele examinate n aa fel nct rezultatul fiecare interogri foreaz un
diagnostic sau altul de a fi mai probabil. Astfel, diagnoza este un proces dinamic
i secvential.
S presupunem c la un anumit moment am finalizat procesul de diagnosticare
pentru un pacient. Pn la sfritul procesului de diagnosticare medicul ar trebui
s aib un diagnostic 100% probabil, dar n multe cazuri, diagnosticul de lucru
(alegerea numarul unu) poate avea probabilitatea de doar 70% - 80%.
Cnd un diagnostic nu este 100% probabil, la momentul iniial de evaluare, se
urmrete evoluia simptomatologiei pacientului n timp pentru revizuirea
probabiliti de diagnostic. n cazurile care implic incertitudine chiar i
elaborarea listei de diagnostice probabile cu un numr mic de alternative
concrete permite medicului evaluarea opiunilor rezonabile s aleag
diagnosticul corect.
Una din teoriile moderne asupra etiologiei cancerului mamar stipuleaz c
femeile care nasc dup 30 de ani au un risc crescut de a dezvolta aceast
maladie comparativ cu cele care nasc nainte de 20 de ani.
Deoarece femeile din clasele superioare ale societii tind s aib copii aceast
teorie explic de ce aceast form de cancer este mai rspdit printre ele.
Pentru a testa aceast ipotez putem imagina un stidiu n care din 2000 de
femei cu vrste cuprinse ntre 45 i 54 de ani 1000 au avut primul copil nainte de
20 de ani iar restul peste 30 de ani. Urmrim lotul timp de 5 ani i observm c
din primul grup 4 dezvolt cancer de sn iar din al doilea grup 5.
Avem suficiente dovezi ca s susinem teoria de mai sus ? Nu prea
Dar dac am fi pornit studiul cu 20000 de femei si am fi avut 40 de cazuri n
primul grup i 50 de cazuri n al doilea grup ? Aparent sunt mai multe cazuri dar
parc proporiile sunt aceleai.

64
65
OBIECTIVELE CURSULUI

Definiii:
Experiment aleator
Definiia clasic a probabilitii
Spaiul fundamental de evenimente
Definiia axiomatic a probabilitii
Probabiliti condiionate:
Definiii
Prevalenta
Sensibilitate, specificitate
VPP, VPN
Curba ROC
Teorema lui Bayes
Independena a dou evenimente

EXPERIMENT ALEATOR
Teoria probabilitilor are ca obiect de studiu legile care se manifest n
domeniul fenomenelor ntmpltoare cu caracter de mas care pot apare
n diverse arii de interes (natur, societate, biologie, medicin etc.).
Teoria probabilitilor folosete o serie de concepte fundamentale cum
sunt: experimentul,
experimentul, proba, evenimentul i probabilitatea.
probabilitatea.
Prin experiment aleator se nelege realizarea practic a unui complex de
condiii corespunztoare unui criteriu de cercetare al diferitelor colectiviti
(populaii), care aplicat unei entiti a colectivitii are un rezultat
ntmpltor.

66
Un experiment poate fi definit i ca un proces de colectare a datelor dintr-
o populaie.

EXPERIMENT ALEATOR EXEMPLE

Determinarea statusului de a fi seronegativ sau seropozitiv.


Determinarea grupei sangvine.
Determinarea prezenei sau absenei
absenei unui factor de risc (fumat, obezitate,
stres, etc.).
EXPERIMENT ALEATOR

Aplicarea experimentului asupra unui element al colectivitii se numete


prob.
prob.
Rezultatul unei probe constituie un eveniment.
eveniment.
Evenimentul ce apare ca rezultat al unei singure probe (sau ncercri) se
numete eveniment elementar.
elementar.
DEFINITIA CLASICA A PROBABILITATII

Presupunndu-se c toate probele posibile ale unui experiment sunt la fel de


verosimile, probabilitatea de apariie a unei probe (sau a unui grup de probe) prin
efectuarea experimentului este egal cu raportul dintre numrul de moduri n
care aceast prob (sau grup de probe) se poate ntmpla la numrul total de
probe pe care experimentul le poate genera.
Astfel, dac un eveniment A se poate realiza n s probe dintr-un total de n
ncercri (probe) echiprobabile pe care experimentul le poate produce, atunci
probabilitatea evenimentului A se poate defini prin formula:

Aceast definiie st la baza calculrii probabilitii empirice a unui


eveniment pe baza unor date statistice
statistice privind evenimentul respectiv.
S presupunem c suntem interesai n cunoaterea probabilitii naterii
unui biat la o natere oarecare dintr-o ar.
Ne ateptm ca aceast probabilitate s fie 0.5 .
Se poate investiga aceast experiment cu ajutorul
ajutorul unui tabel de date
statistice.

Dei definiia clasic poate fi adesea util ea nu este satisfctoare pentru c:


- cere probe (ncercri) echiprobabile
- aceast cerin limiteaz utilizarea sa.

67
Astfel, dac ncercrile constau n determinarea grupei sangvine,
rezultatele posibile fiind: A, B, AB, O, acestea nu sunt echiprobabile.

Acesta este motivul pentru care este necesar o abordare mai general a
noiunii de probabilitate printr-o introducere axiomatic a acestei noiuni.

WIKI.......

Cuvntul axiom este un cuvnt provenit din limba greac veche n care
(axioma
(axioma),
), nseamn: "care este socotit demn sau convenabil" sau
"care este considerat evident prin sine nsui/de la sine",
sine", opinie,
opinie, tez
admis.
admis. Iniial, axiomele au fost propoziii (enunuri) al cror adevr era
socotit evident, adevr care i avea originea n practic. Pentru unii
filosofi greci din antichitate,
antichitate, reprezenta o afirmaie considerat ca fiind
evident, i care nu mai trebuia dovedit. Cuvntul provine din
(axioein),
axioein), care nseamn "a considera demn", demn", care, la rndul su, provine
din (axios
(axios),
), care nseamn "demn".
"demn".
O dat cu evoluia tiinelor,
tiinelor, termenul axiom a ncetat s mai evoce
ideea de adevr evident din punct de vedere intuitiv, devenind o
propoziie,
propoziie, care mpreun cu alte propoziii fixate ale unui sistem
axiomatic,
axiomatic, permite deducerea teoremelor unei anumite teorii. teorii.
Astzi, se accept n general urmtoarele interpretri ale noiunii:
O propoziie,
propoziie, regul,
regul, lege,
lege, principiu ori maxim care este general
acceptat/ fie datorit valorii coninute n formularea sa, merit intrinsec al
coninutului su ori datorit evidenei sale necondiionate. Astfel, n
viziunea unor gnditori, precum Francisc Bacon i Immanuel Kant, se pot
detaa vizibile nuane de interpretare.
n viziunea lui Bacon (Francisc
(Francisc Bacon),
Bacon), axioma este o regul
empiric i/sau o generalizare bazat pe experien.
n viziunea lui Kant (Immanuel
(Immanuel Kant),
Kant), axioma este o propoziie
intermediar sintetic (n sensul de a fi sinteza mai multor opinii),
ce trebuie s fie considerat a priori discursului referitor la o
anumit tem.
n sens mult mai larg tiinific, axioma este o afirmaie de sine
stttoare referitoare la nite termeni iniiali sau la nite concepte de
baz, ce nu sunt i/sau nu pot fi definibili/e.
SPATIUL FUNDAMENTAL DE EVENIMENTE

Fie H un experiment aleator dat pentru care E reprezint mulimea tuturor


rezultatelor posibile. E se numete mulime fundamental sau spaiu

68
fundamental (spaiul evenimentelor elementare). Spaiul fundamental
poate s fie finit sau infinit.
Astfel c, o submulime A a lui E se numete eveniment,
eveniment, iar dac A are un
singur element din E el este un eveniment elementar.
Orice eveniment a crui realizare depinde de cel puin dou evenimente
evenimente
elementare este un eveniment compus.
compus.
Mulimea vid i mulimea fundamental E sunt i ele evenimente, i
anume, evenimentul imposibil () i respectiv evenimentul cert (E).
Evenimentul sigur se produce cu certitudine la orice efectuare a
experimentului, iar evenimentul imposibil este nerealizabil n urma
efecturii experimentului.
In mod asemntor cu operaiile de reuniune i intersecie cu mulimi se
definesc operaii similare cu evenimente. Astfel fiind date dou
evenimente A i B, reuniunea lor C=AB este un eveniment care are loc
dac cel puin unul dintre evenimentele A sau B are loc, i intersecia
D=AB este evenimentul care are loc numai cnd A i B au loc simultan.
Prin contrarul (complementarul) unui eveniment A se nelege un
eveniment care se realizeaz ori de cte ori nu se realizeaz A. Acesta se
noteaz prin non A (sau C(A) ori ).
Dac dou evenimente A i B sunt disjuncte ( A B = ), adic dac nu
se pot realiza simultan, se spune c ele sunt incompatibile. Dou
evenimente A i B care se pot realiza simultan se numesc compatibile.
compatibile.
Evenimentul A implic evenimentul B i se noteaz prin AB, dac
evenimentul B se produce ori de cte ori se produce A.

SPATIUL FUNDAMENTAL ESTE FINIT

Experimentul H const n aruncarea unui zar.


Spaiul fundamental n acest caz este mulimea tuturor rezultatelor
posibile la aruncarea zarului: E = {1, 2, 3, 4, 5,6}. In acest caz
spaiul fundamental E este finit.
finit.
Printre evenimentele posibile (submulimi ale lui E) se pot
considera:
A = {2, 4, 6} (obinerea unei fee pare)
B = {1, 3, 5} (obinerea unei fee impare)
C = { 3} ( eveniment elementar).
In acest caz, evenimentele A i B sunt incompatibile. Evenimentele
elementare sunt echiprobabile.

69
Experimentul H const n determinarea grupei sangvine.
In acest caz spaiul fundamental este E = {A, B, AB, 0}. E este
evident finit
Astfel, dac ncercrile constau n determinarea grupei sangvine,
rezultatele posibile fiind: A, B, AB, O, acestea nu sunt echiprobabile.

SPATIUL FUNDAMENTAL ESTE INFINIT SI NUMARABIL

Experimentul H const n aruncarea succesiv a unui zar pn ce se


obine faa 5.
Spaiul fundamental n acest caz este alctuit din numrul
aruncrilor necesare, care variaz de la 1 la infinit:
E = {1, 2, 3,...,n,...}.
Spaiul
Spaiul fundamental E este infinit, ns elementele sale fiind
ordonate ntr-un ir, E este un exemplu de spaiu fundamental
numrabil.
Experimentul H const n numrarea internrilor ntr-un spital ntr-un
interval de timp dat (sptmn, lun, an etc.)
Spaiul fundamental E variaz de la 0 la infinit, adic
E = {0,1, 2, 3,...,n,...}.
In acest caz, E este o mulime infinit i numrabil.

SPATIUL FUNDAMENTAL ESTE INFINIT SI NENUMARABIL

Experimentul H const n aruncarea unei bile sferice ntr-o cutie


dreptunghiular.
In urma unei ncercri dup oprirea bilei ea are un punct de contact
cu baza cutiei.
Spaiul fundamental E, n acest caz, este alctuit din punctele de
contact.
Aici E este o mulime infinit i nenumrabil.
Experimentul H const n msurarea temperaturii corporale.
Spaiul fundamental E este alctuit din toate valorile posibile ale
temperaturii corporale, astfel putem considera c n E intr toate
valorile din intervalul [35, 41], sau c
E = [35,41].

70
In acest caz, spaiul fundamental este o mulime infinit i
nenumrabil.
Experimentul H const n msurarea tensiunii arteriale sistolice
(TAS).
Spaiul fundamental E este alctuit din toate valorile posibile ale
TAS, astfel putem considera c E este inclus n intervalul [0, ).
In acest caz, de asemenea, spaiul fundamental este o mulime
infinit i nenumrabil.
DEFINITIA AXIOMATICA

Fie E un spaiu fundamental asociat unui experiment H i mulimea


tuturor evenimentelor, adic mulimea prilor lui E:
= Pr(E)
Pr(E) .
Se spune c funcia Pr:R
R este o funcie de probabilitate, iar prin Pr(A)
se noteaz probabilitatea evenimentului A, dac satisface urmtoarele
axiome:
M1. 0 Pr(A) 1, A
M2. Pr(E) = 1
M3. Dac A i B sunt incompatibile (adic nu pot avea loc
simultan) atunci Pr(AB) = Pr(A) + Pr(B).

EXEMPLU

Exemplu 1: (Hipertensiune
(Hipertensiune))
Fie A evenimentul ca o persoan s aib tensiune arterial
diastolic normal (TAD) adic TAD <90.
Fie B evenimentul ca o persoan s aib TAD la limit, adic 90
TAD < 95.
Presupunem c Pr(A) = 0.7, Pr(B) = 0.1 .
Fie C evenimentul c o persoan are TAD < 100.
Evident C=AB i AB=.

71
Pr(C) =Pr(A) + Pr(B) = 0,8
Exemplu 2: (Hipertensiune
(Hipertensiune))
Fie C evenimentul ca o persoan s aib tensiune arterial
diastolic crescuta (TAD) adic TAD >= 90
Fie D evenimentul ca o persoan s aib TAD normala sau la
limit, adic 70 TAD < 95.
Evenimentele C si D nu sunt mutual exclusive
DEFINITIA AXIOMATICA

O modalitate de a defini n mod concret funcia de probabilitate este cu ajutorul unei msuri
definite pe spaiul fundamental E, adic:

unde m:P(E) [0,) este o funcie msur. In particular , cnd spaiul fundamental este finit,
pentru un eveniment A, m(A) se poate defini ca fiind numrul elementelor lui A. In acest caz
definiia precedent a probabilitii coincide cu cea introdus n seciunea 2.

DEFINITIA AXIOMATICA PROPRIETATI

T1. Dac A1, A2, ..., An sunt evenimente incompatibile dou cte dou atunci:

Proprietatea T1 poate fi demonstrat uor prin inducie prin utilizarea axiomei


M3.
T2. Pr() = 0.
Intr-adevr, deoarece oricare ar fi evenimentul A, el este
incompatibil cu , n baza axiomei M3, rezult c
Pr(A) = Pr(A)
) = Pr(A) + Pr().
T3. Pr(non A) = 1 - Pr(A).
Intr-adevr, din M3 rezult uor c:
Pr(A non A) = Pr(A) + Pr(non A),
iar din M2 avem:
Pr(A non A) = Pr(E) = 1.
T4. Dac AB atunci Pr(A) Pr(B).
Intr-adevr, pentru c B = A (B -A) iar mulimile A i B - A sunt
disjuncte, aplicnd axiomele M3 i M1 rezult imediat c:
Pr(B) = Pr(A) + Pr(B-A) Pr(A).
T5. Pentru orice evenimente A i B are loc egalitatea:
(1) Pr(AB) = Pr(A) + Pr(B) - Pr(AB) .
Deoarece, AB = (A-B) B, iar mulimile A-B i B sunt disjuncte,
n baza axiomei M3, rezult c:

72
(2) Pr(AB) = Pr(B-A) + Pr(B).

Pe de alt parte, fiindc A= (A-B) (A B), iar mulimile (A-B)


i (A B) sunt disjuncte, prin M3 se obine egalitatea:
Pr(A) = Pr(A-B) + Pr(A B)
de unde rezult:
Pr(A-B) = Pr(A) - Pr(A B).
Ins, nlocuind Pr(A-B) astfel obinut n (2), rezult egalitatea
(1) care trebuia demonstrat.
PROBABILITATI CONDITIONATE

Obiectivele cursului

Experiment aleator
Definiia clasic a probabilitii
Spaiul fundamental de evenimente
Definiia axiomatic a probabilitii
Probabiliti condiionate
Prevalenta
Sensibilitate, specificitate
VPP, VPN
Curba ROC
Teorema lui Bayes
Independena a dou evenimente

INDEPENDENTA A DOUA EVENIMENTE

Dou evenimente A i B se numesc independente dac i numai dac


Pr(AB) = Pr(A) x Pr(B).
Aceast proprietate se mai numete i legea de nmulire a
probabilitilor.
probabilitilor.
Dou evenimente A i B sunt dependente dac

73
Pr(AB) Pr(A) x Pr(B).
Au loc urmtoarele proprieti privind probabilitile condiionate:
Dac A i B sunt evenimente independente, atunci Pr(B|A) =Pr(B)
Dac A i B sunt evenimente dependente, atunci Pr(B|A) Pr(B) i
Pr(AB)Pr(A) x Pr(B).
MULTIPLICAREA PROBABILITATILOR

Doua evenimente sunt independente daca si numai daca: Pr(A


B) =Pr(A) x Pr(B)
Doua evenimente sunt dependente daca : Pr(A B) Pr(A) x
Pr(B)
Exemplul 1:
Pentru studiul agregarii familiale a HTA s-a determinat
probabilitatea HTA la barbati P(A)=0,2 si la femei P(B)=0,1
Care este probabilitatea de a avea o familie de hipertensivi?
Pr(A B) = ?
Exemplul 2:
Pentru studiul agregarii familiale a HTA s-a determinat
probabilitatea HTA la mama P(A)=0,1, la primul copil P(B)=0,2 si
frecventa aparitiei HTA la copiii cu mama afectata de HTA Pr(AB)
= 0,5
Exista o relatie de cauzalitate intre HTA la mama si cea de la copil?
INDEPENDENTA A DOUA EVENIMENTE

Intr-adevr, egalitile Pr(B/A) = Pr(B) i Pr(A/B) = Pr(A), exprim bine


independena celor dou evenimente prin faptul c probabilitatea
evenimentului B (respectiv A) nu depinde de realizarea evenimentului A
(respectiv B).
Urmtoarea proprietate se mai numete i legea de adunare a
evenimentelor independente.
independente.
Dac A i B sunt dou evenimente independente, atunci Pr( A B ) =
Pr(A) + Pr(B) (1 Pr(A)).
PROBLEMA

Doua laboratoare testeaza suspectii de HIV:


Laboratorul A diagnosticheaza pozitiv 10% din pacienti
Laboratorul B diagnosticheaza pozitiv 17% din pacienti
8% din pacienti sunt diagnosticati pozitiv de ambele laboratoare
Exista vreo legatura intre evenimentele reprezentate de rezultatele
testelor diagnostice?
PROBABILITATE CONDITIONATA

Dac A i B sunt dou evenimente arbitrare, prin probabilitatea


condiionat a lui A de ctre B, notat prin Pr(AB), se nelege

74
probabilitatea de a se realiza evenimentul A dac n prealabil s-a realizat
evenimentul B.
Prin definiie:

sau raportul dintre numrul elementelor din B care sunt i n A la numrul


elementelor lui B.
Are loc urmtoarea regul de calcul a probabilitii interseciei a dou
evenimente:

Sau

Aceste formule sunt cunoscute i sub numele de regula general de nmulire a


probabilitilor. Mai general au loc urmtoarele reguli de nmulire a
probabilitilor:

Respectiv

RISCUL RELATIV

= raportul dintre probabilitatea conditionata de B a avea evenimentul A si


probabilitatea conditionata de B a nu avea evenimentul A
EXEMPLUL 1

Se recomanda femeilor peste 50 de ani sa isi faca o mamografie odata la


1-2 ani; testul de aur pentru cancerul de san este biopsia dar este prea
invaziv
Din 100000 de femei cu mamografii negative 20 vor dezvolta cancer de
san in urmatorii 2 ani

75
Din 10 femei cu mamografii pozitive 1 va dezvolta cancer de san in
urmatorii 2 ani Care este RR de a dezvolta cancer de san in urmatorii 2
ani dupa o mamografie pozitiva?
RR = Pr(BA) / Pr(Bnon A) = 0,1 / 0,0002 = 500
EXEMPLUL 2

Doua laboratoare testeaza suspectii de HIV:


Laboratorul A diagnosticheaza pozitiv 10% din pacienti
Laboratorul B diagnosticheaza pozitiv 17% din pacienti
8% din pacienti sunt diagnosticati pozitiv de ambele laboratoare
Exista vreo legatura intre evenimentele reprezentate de rezultatele
testelor diagnostice?
Care este probabilitatea ca laboratorul B sa puna un diagnostic pozitiv
daca laboratorul A a pus un diagnostic pozitiv?
Care este probabilitatea conditionata ca laboratorul B sa puna un
diagnostic pozitiv daca laboratorul A a pus un diagnostic negativ?
Care este riscul relativ B la A?

EXEMPLUL 2
Doua laboratoare testeaza suspectii de HIV:
Laboratorul A diagnosticheaza pozitiv 10% din pacienti
Laboratorul B diagnosticheaza pozitiv 17% din pacienti
8% din pacienti sunt diagnosticati pozitiv de ambele laboratoare
Care este probabilitatea ca laboratorul B sa puna un diagnostic pozitiv
daca laboratorul A a pus un diagnostic pozitiv?
Pr(BA) = Pr (B A) / Pr (A)
Pr(BA) = 0,08 / 0,1 = 0,8

EXEMPLUL 2
Doua laboratoare testeaza suspectii de HIV:
Laboratorul A diagnosticheaza pozitiv 10% din pacienti
Laboratorul B diagnosticheaza pozitiv 17% din pacienti
8% din pacienti sunt diagnosticati pozitiv de ambele laboratoare
Care este probabilitatea conditionata ca laboratorul B sa puna un
diagnostic pozitiv daca laboratorul A a pus un diagnostic negativ?
Pr(Bnon A) = Pr (B non A) / Pr (non A)
Pr (non A) = 1 - Pr (A) = 1 0,1= 0,9
Pr (B) = Pr (B non A) + Pr (B A) (laboratorul 2 diagnosticheaza pozitiv
si din cei diagnosticati pozitiv si din cei negativi de la A)
Pr (B non A) = Pr (B) - Pr (B A) = 0,17- 0,08 = 0,09
Pr(Bnon A) = 0,09 / 0,9 = 0,1
EXEMPLUL 2

Doua laboratoare testeaza suspectii de HIV:


Laboratorul A diagnosticheaza pozitiv 10% din pacienti
Laboratorul B diagnosticheaza pozitiv 17% din pacienti

76
8% din pacienti sunt diagnosticati pozitiv de ambele laboratoare
Care este riscul relativ B la A? Interpretati.
RR = Pr(BA) / Pr(Bnon A)
RR = 0,8 / 0,1 = 8
Un pacient diagnosticat pozitiv de laboratorul A are de 8 ori mai multe
sanse sa fie diagnosticat pozitiv de laboratorul B decat unul care a fost
diagnosticat negativ de laboratorul A
EXEMPLUL 1

Se recomanda femeilor peste 50 de ani sa isi faca o mamografie odata la


1-2 ani; testul de aur pentru cancerul de san este biopsia dar este prea
invaziv
Din 100000 de femei cu mamografii negative 20 vor dezvolta cancer de
san in urmatorii 2 ani
Din 10 femei cu mamografii pozitive 1 va dezvolta cancer de san in
urmatorii 2 ani
Care este RR de a dezvolta cancer de san in urmatorii 2 ani dupa o
mamografie pozitiva?
RR = Pr(BA) / Pr(Bnon A) = 0,1 / 0,0002 = 500
Care este probabilitatea cancerului de san la femeile de peste 50 de ani
daca 7% din mamografii sunt pozitive?
Pr(cancer) = Pr(cancer M+) + Pr(cancer M-)
Pr(cancerM+) = Pr(cancer M+) / Pr( M+)
Pr(cancerM-) = Pr(cancer M-) / Pr( M-)
Pr(cancer)= Pr(cancerM+) x Pr( M+) + Pr(cancerM-) x Pr( M-)
Pr(cancer)= 0,1 x 0,07+ 0,0002*0,93 = 719/100000=0,719%
PROBABILITATE CONDITIONATA APLICATII

S considerm urmtoarele evenimente n legtur cu aplicarea unui test


diagnostic:
A - evenimentul ca o persoan luat la ntmplare dintr-o populaie
s aib o anumit afeciune A (de exemplu, TBC , HIV etc.),
B - evenimentul de obinere a unui test pozitiv n cazul aplicrii unui
test diagnostic B pentru detectarea afeciunii A la o persoan.
Prin non(A) (persoan fr afeciunea A) i non(B) (test negativ)
notm evenimentele complementare evenimentelor A i respectiv
B.

In general, din cauza imperfeciunii testului, nu orice persoan avnd


afeciunea A este detectat la aplicarea testului A ca pozitiv (fals negativ)
i nu toate persoanele cu rspuns pozitiv la testul B au neaprat
afeciunea (fals pozitiv).
Astfel, de regul, prin aplicarea unui test diagnostic rezult fali pozitivi i
fali negativi.
Ambele rezultate eronate ce rezult prin aplicarea testului sunt
periculoase i de nedorit.

77
S presupunem c populaia creia i s-a aplicat testul are n persoane i s-au
obinut urmtoarele rezultate:

PREVALENTA AFECTIUNII

Extrgnd la ntmplare o persoan din populaie, cu ajutorul rezultatelor


prezentate n tabelul precedent se pot determina probabilitile diverselor
evenimente ce pot avea loc.
Astfel avem:

Pr(A) se numete prevalena afeciunii A.

SENSIBILITATEA TESTULUI

Probabilitatea, notat cu Se, de a obine un test pozitiv, tiind c testul este


aplicat unei persoane care posed afeciunea, se numete sensibilitatea
testului se exprim cu ajutorul unei probabiliti condiionate:

78
SPECIFICITATEA TESTULUI

Pentru caracterizarea unui test diagnostic se utilizeaz i specificitatea testului


care se definete prin probabilitatea de a obine un test negativ pentru o
persoan care nu posed afeciunea (probabilitate condiionat):

VALOAREA POZITIVA PREDICTIVA VPP

este probabilitatea ca un test pozitiv s indice o persoan cu afeciunea A:

79
VALOAREA PREDICTIVA NEGATIVA VPN

este probabilitatea ca un test negativ s indice o persoan fr afeciune:

RAPORTUL DE ASEMANARE

Likehood ratio (LR)


LR = Se / (1-Sp)
Un semn (test) diagnostic este cu att mai bun cu ct are o Se i Sp mai
apropiat de 1
EXEMPLU

80
Se msoar GOT la 94 de pacieni cu dureri toracice. Ne intereseaz
numrul de infarcturi miocardice aprute la acest eantion
Se=25/48=52,1%
Sp=42/46=91,3%
EXEMPLU

Se msoar GOT la 94 de pacieni cu dureri toracice. Ne intereseaz


numrul de infarcturi miocardice aprute la acest eantion
Se=40/48=83,3%
Sp=43/46=93,5%

CURBA ROC
Receiving-Operating Characteristic = reprezentarea grafic a valorii
informaionale a unui test fa de un diagnostic n domeniul [Se, 1-Sp] atunci
cnd variaz pragul ales

81
CURBA ROC GENERALIZATA

Un test A este mai bun ca un test B dac:


Se(A)>Se(B) i Sp(A)>=Sp(B)
Sau: Sp(A)>Sp(B) i Se(A)>=Se(B)
Nu se pot clasifica cele doua teste dac
Se(C)>Se(B) i Sp(C)<Sp(B)
Se(C)<Se(B) i Sp(C)>Sp(B)

FORMULA LUI BAYES

S considerm dou evenimente A i B care nu sunt independente (A =


afectiunea, B = semnul). Atunci din formulele:

82
i se deduce formula lui BAYES:

Dar fiindc
Pr(B) = Pr((BnonA) (BA)) =Pr(BnonA) + Pr(BA),
aplicnd formula probabilitilor condiionate se obine:
Pr(B)=Pr(B|A) Pr(A) + Pr(B|nonA) Pr(nonA).
De aici rezult urmtoarea form a formulei lui Bayes:

Formula lui Bayes poate fi util n stabilirea unui diagnostic medical.


Fie A o maladie i B un semn. In acest caz, se pot considera urmtoarele
probabiliti:
Pr(A/B) - probabilitatea ca maladia A s fie prezent atunci cnd la
un bolnav s-a constatat semnul B. Aceast probabilitate se
numete probabilitate a posteriori a lui A.
Pr(A) - probabilitatea lui A dac nu exist nici o informaie. Este de
fapt frecvena maladiei A n ansamblul populaiei (prevalena lui A).
Aceast probabilitate se numete probabilitate a priori.
Pr(B/A)/Pr(B) este frecvena semnului B n cazul maladiei A
raportat la frecvena sa n ansamblul populaiei (care are sau nu
maladia A). Aceast probabilitate se numete valoarea diagnostica
a lui B pentru A (care va fi cu att mai bun cu ct B va fi mai
frecvent n cazul maladiei A n raport cu prezena sa la alte
maladii).
Fie A o maladie i B un semn:

83
EXEMPLUL 1

Se tie c 60% din populaia dintr-o ar triete n mediul urban, 20% din
populaie este alergic i 55% dintre alergici triesc n mediul urban. Care
este probabilitatea ca alegnd la ntmplare un locuitor din mediul urban
el s fie alergic?
Fie A evenimentul ca o persoan s fie alergic, iar U evenimentul ca o
persoan s locuiasc n mediul urban. Atunci probabilitatea cutat este:

EXEMPLUL 2

In farmacii s-au introdus sisteme automate de determinare a TA. Un astfel


de sistem clasifica 84% din hipertensivi si 23% din normotensivi ca avand
HTA.
Daca 20% din populatia adulta are HTA care sunt VPP si VPN ale acestei
masini?
Sensibilitatea = 0,84
Specificitatea = 1 0,23 = 0,77
VPP=0,84x0,2/(0,84x0,2+0,23x0,8)=0,168/0,352=0,48
VPN=0,77x0,8/(0,77x0,8+0,16*0,2)=0,616/0,648=0,95
CURSUL X
INFORMATICA MEDICALA

VARIABILE ALEATOARE

DEFINITIE
Se numete variabil aleatoare pe un spaiu fundamental E i se
noteaz prin X, o funcie definit pe E cu valori n mulimea
numerelor reale.
Unei variabile aleatoare X i se pot asocia diferite probabiliti cu care
aceast variabil aleatoare poate lua anumite valori, ca de exemplu:
Pr( X = a) - probabilitatea ca X s ia valoarea a;
Pr( a X b ) - probabilitatea ca X s ia o valoare n intervalul
[a,b].

O variabil aleatoare se numete discret dac ea poate lua un numr finit sau
cel mult numrabil de valori.

84
EXEMPLE
Numrul de internri ntr-un spital ntr-un interval de timp dat
X{=0,1,2,...,n,...
{=0,1,2,...,n,...}. Aceasta este o variabil aleatoare discret infinit.
Numrul de bacterii ntr-un mililitru de ap X{=0,1,2,...,n,...
{=0,1,2,...,n,...}.
Numrul de indivizi cu RH-negativ dintr-un grup de n persoane luate la
ntmplare X{=0,1,2,...,n
{=0,1,2,...,n}. Aceasta este o variabil aleatoare discret
finit
Numrul de prezentari la medic pentru otita in primii doi ani de viata.
Aceasta este o variabil aleatoare discret infinit care poate avea valorile
0,1,2,...
DEFINITIE
O variabil aleatoare este continu atunci cnd variaz n mod continuu ntr-un
interval i poate lua o mulime nenumrabil de valori.

EXEMPLE
temperatura corporal,
concentraia unei substane n snge,
capacitatea pulmonar, etc.

LEGEA DE PROBABILITATE A UNEI VARIABILE ALEATOARE FINITE


Fie X o variabil aleatoare pe un spaiu fundamental E finit, adic
X {=x1
{=x1 , x2, ..., xi, ..., xn }.
Mulimea de probabiliti
p(x1 ), p(x2 ), ..., p(xi), ..., p(xn )
asociate valorilor:
x1 , x2, ..., xi, ..., xn
se numete distribuia sau legea de probabilitate a variabilei aleatoare X.
Distribuia unei variabile aleatoare finite X se mai noteaz prin urmtorul tabel:

Probabilitile care apar n distribuia unei variabile aleatoare finite X verific


urmtoarea condiie:

EXEMPLE
Probabilitatea de apariie a uneia dintre feele {1,2,3,4,5,6} ale unui zar este 1/6.
In acest caz avem variabila aleatoare:

85
Pentru c probabilitatea p(x) este constant oricare ar fi x se spune c distribuia
lui X1 este uniform

EXEMPLU
Probabilitatea ca tratamentul antihipertensiv sa aduca sub control un numar de
pacienti din 4 are distributia din tabelul de mai jos:

EXEMPLU
Intr-un studiu s-a urmarit frecventa cu care un tratament antihipertensiv aduce
sub control un numar de pacienti din 4 pentru 100 de medici

MEDIA SAU SPERANTA MATEMATICA

Valoarea M(X) se mai numete i valoarea ateptat a variabilei aleatoare


X.
Observaii:
Dac legea de probabilitate a lui X este uniform, adic p(xi) = 1/n ,
pentru orice i= 1,2,...,n, atunci M(X) este media aritmetic a
numerelor x1 , x2, ..., xi, ..., xn.
EXEMPLU

86
M(X)=0x0,008+1x0,076+2x0,265+3x0,411+4x0,240
M(X)=2,8
Ne vom astepta la o medie de 2,8 din cei 4 hipertensivi a caror afectiune sa
poata fi controlata

EXEMPLU

Numarul de episoade de otita in primii doi ani de viata:

M(X)=0x0,129+1x0,264+2x0,271+3x0,185+4x0, 095+5x0,039+6x0,017
M(X)=2,038
Ne vom astepta la o medie de 2,038 episoade de otita la un copil in primii doi ani
de viata

VARIATIA SI ABATEREA STANDARD

Variaia variabilei aleatoare X se definete prin


V(X) = M( [X- M(X)]2)
Sau

Prin definiie abaterea standard este:

EXEMPLU
Numarul de episoade de otita in primii doi ani de viata:

87
V(X)=6,12
=1,402
Aproximativ 95% din distributia de probabilitate este cuprinsa in medie +/- 2
(1,96 ) Numarul de episoade de otita in primii doi ani de viata: 2,038 2,8
(corectat 0-4)

DISTRIBUTIA CUMULATA

VARIABILE ALEATOARE CENTRATE REDUSE

Unei variabile aleatoare X cu media M(X) i abaterea standard (X) i se poate


asocia o variabil aleatoare Y numit variabil aleatoare centrat redus definit
prin:

88
In baza proprietilor mediei i abaterii standard, se poate arta uor c variabila
aleatoare centrat redus are media M(Y) =0 i abaterea standard (Y)=1.

VARIABILE ALEATOARE DEFINITE PE UN SPATIU FUNDAMENTAL FINIT

CAZUL DISCRET

Noiunile i proprietile prezentate anterior pentru variabilele aleatoare finite se


pot introduce n mod analog pentru cazul variabilelor aleatoare discrete avnd o
mulime infinit de valori, prin nlocuirea sumei finite cu una infinit

CAZUL CONTINUU

In cazul unei variabile aleatoare continue X, se consider o funcie f:RR numit


densitate de probabilitate,
probabilitate, care are proprietile:

f(x) 0, xR

In acest caz funcia de repartiie F asociat variabilei aleatoare X este definit


prin:

De asemenea, media lui X este definit prin :

89
iar variaia lui X

LEGI DE DISTRIBUTIE
(Principalele distributii de probabilitate)
INTRODUCERE

In general distribuiile variabilelor definite pe o populaie, care face


obiectul unui studiu, nu se cunosc.
Din punct de vedere practic se ncearc ncadrarea acestor distribuii n
unele legi teoretice care constituie modele pentru aceste variabile
statistice

PRINCIPALELE LEGI DE DISTRIBUTIE

legea normal sau legea LAPLACE-GAUSS


variabile aleatoare continue
legea BINOMIAL (BERNOULLI)
variabile aleatoare finite
legea POISSON
variabile aleatoare discrete infinite
legea STUDENT (t)
legea 2 a lui PEARSON
legea F a lui FISHER.
LEGEA NORMALA

Aceast lege de probabilitate a crei funcie de probabilitate are o alur


tipic de clopot numit curba normal sau curba lui Gauss este un model
pentru multe variabile aleatoare continue
Aceast distribuie depinde de doi parametri:
media m
abaterea standard
i are densitatea de probabilitate urmtoare:

90
EXEMPLE

Distributia greutatii corporale sau a TAS intr-un grup de pacientii cu varste


cuprinse intre 35 si 44 de ani

Dac X satisface o lege normal de medie m i abatere standard atunci


se spune c X este de tipul N(m, ).
Pentru variabila normal X au loc:
M(X) = m
Var(X) = .

91
LEGEA NORMALA REDUSA

Este evident c exist o gam infinit de legi normale, care corespund


cte unei perechi de parametri (m, ).
Toate aceste distribuii normale se pot reduce la una singur, avnd
media 0 i abaterea standard 1, cu ajutorul unei schimbri de variabil:

Aceasta este legea normal redus cu densitatea de probabilitate:

Acestei legi de probabilitate i sunt asociate un anumit numr de tabele


care permit utilizarea practic a acestei legi.
Unul dintre aceste tabele este Tabelul p(u) care conine pentru fiecare
valoare u probabilitatea ca variabila Z s fie n exteriorul intervalului [-u,u].
De asemenea, un alt tabel asociat legii normale reduse este Tabelul
abaterii standard.
standard.
Au loc relaiile
p(u) =Pr( Z < -u sau Z> u)
Pr(-u Z u) =1 - p(u).
Astfel din tabelul ecartului redus p(1) = 0.32 i deci 1- p(1)
p(1) = 0.68, iar
p(1.96) =0.05 i deci 1- p(1) =0.95

92
LEGEA BINOMIALA SAU DISTRIBUTIA LUI BERNOULLI

Variabile aleatoare finite


Modelul legii binomiale este urmtorul:
Un experiment este alctuit din repetarea unei ncercri elementare
de n ori, n fiind un numr natural dat.
Rezultatele posibile ale fiecrei ncercri elementare sunt doar
dou evenimente numite de obicei: succes (S) i eec (E).
Probabilitile p de succes i q = 1 - p de eec sunt constante de la
o ncercare la alta.
Cele n ncercri repetate sunt independente una de cealalt
Numrul de succese obinute din cele n ncercri repetate este o variabil
aleatoare de tip binomial care depinde de parametrii n i p i este de obicei
notat prin Bi(n,p). Aceast variabil aleatoare X poate s ia valorile 0, 1, 2, ..., n
i are urmtorul tabel de distribuie:

sperana matematic a legii binomiale este:


M(X) = n p,
iar variaia:
Var(X) =n p q,
i deci abaterea standard:

93
COMPORTAREA LA LIMITA A LEGII BINOMIALE CAND n ESTE MARE
Se poate arta c atunci cnd np 10 i nq 10, distribuia variabilei binomiale
X (frecvena absolut a succeselor) tinde s se apropie de o lege normal

EXEMPLE

Presupunem c de regul un anumit vaccin contra pojarului produce o


reacie (febr) cu o probabilitate p=0.15 . Care este probabilitatea ca din 6
copii vaccinai 4 s aib o reacie n urma vaccinrii?
Rspuns: In acest caz avem n = 6, k = 4, p =0.15, q = 1-p = 0.85 . Atunci

Aceast probabilitate fiind mai mic de 1% se poate considera c aceast


situaie apare cu o ans foarte mic.

Vaccinul contra cancerului de col uterin produce moartea cu o


probabilitate p=10/20.000.000 . Care este probabilitatea ca din 1 copil
vaccinat din Romania s moara n urma vaccinrii?
Rspuns: In acest caz avem n = 200000, k = 1, p =1/2000000,
1/2000000.
...
Presupunem c de regul un anumit vaccin contra pojarului produce o reacie
(febr) cu o probabilitate p=0.5 . Care este probabilitatea ca din 600 copii
vaccinai cel putin 4 s aib o reacie n urma vaccinrii?

LEGEA LUI POISSON

Variabila aleatoare POISSON este o variabil discret care ia o infinitate


numrabil de valori: 0,1,2,...,k,... , care reprezint numrul de realizri
ntr-un interval dat de timp sau spaiu ale unui eveniment
de exemplu
numrul de internri pe an ntr-un spital,
numrul de bacterii ntr-un mililitru de ap,
numrul de dezintegrri ale unei substane radioactive ntr-un
interval de timp T dat

94
Modelul acestei variabile aleatoare presupune c sunt ndeplinite
urmtoarele condiii:
numrul de realizri ale evenimentului ntr-un interval este
independent de numrul de realizri n orice alt interval (repartiie
aleatoare n timp sau spaiu),
numrul ateptat de realizri ntr-un interval este proporional cu
dimensiunea sa i nu depinde de poziia sa n timp sau spaiu,
ntr-un interval suficient de mic probabilitatea de a observa mai mult
de o realizare a evenimentului este neglijabil n raport cu
probabilitatea de a observa una singur (nesimultaneitatea
realizrii a dou evenimente n timp sau spaiu).
Aceast variabil aleatoare X este caracterizat de un parametru care
reprezint numrul mediu teoretic (ateptat) de realizri ale evenimentului n
intervalul considerat i are urmtoarea lege de distribuie:

Despre variabila aleatoare de tip Poisson X se mai spune c este de tipul


Po().
Sperana matematic i variaia n cazul legii lui Poisson sunt egale
ambele cu , adic :
M(X) = Var(X) = .

EXEMPLE
Rata de mortalitate pentru o anumit boal este de 7 la 1000 de cazuri.
Care este probabilitatea ca ntr-un grup de 400 de persoane aceast
boal s cauzeze 5 decese?
Rspuns: Avem p =7/1000=0.007, m = np = 400 x 0.007= 2.8

Rata de mortalitate pentru o vaccinul pentru cancerul de col uterin este de


10 la 20000000 de cazuri. Care este probabilitatea ca ntr-un grup de
200000 de persoane aceast boal s cauzeze 1 deces?
Rspuns: Avem p =10/ 20000000, m = np = 200000 x 10/ 20000000 = 0,1
P(X)=0,104

95
Rata de mortalitate pentru o anumit boal este de 10 la 1000 de cazuri.
Care este probabilitatea de a avea mai puin de 7 decese ntr-un grup de
500 persoane? Care este probabilitatea de a avea 7 sau mai multe
decese ntr-un grup de 500 persoane?
Rspuns: Avem
p =10/1000=0.01, m = np = 500 x 0.01= 5
Probabilitatea de a avea mai puin de 7 decese este:

Probabilitatea de a avea 7 sau mai multe decese este:


Pr(X7) = 1- Pr(X<7) = 0.2378

LEGEA STUDENT T

96
Variabila aleatoare Student t este o variabil aleatoare continu care ia
valori n intervalul (- , + ), a crei funcie densitate de probabilitate
depinde de un singur parametru, numrul de grade de libertate.
Fie X0, X1, , Xn variabile aleatoare independente care toate urmeaz
legea normal centrat redus. Atunci variabila aleatoare

urmeaz o lege de probabilitate Student cu n grade de libertate.

Densitatea de probabilitate a variabilei aleatoare Student Tn este:

unde este funcia Gamma definit astfel:

Distribuia acestei variabile aleatoare este simetric n raport cu originea i


are o form de clopot:
Pr[ Tk < -x ] = Pr[ Tk > x].
Atunci cnd k tinde la , distribuia Student tinde ctre o distribuie
normal redus.
Dac n>30 legea lui Student i legea normal sunt foarte apropiate.
Aceast variabil aleatoare este utilizat, n anumite condiii de
normalitate, n testul de comparaie a mediilor numit i testul Student sau
testul t.
LEGEA HI PATRAT (PEARSON)

Distribuia 2 descrie comportarea unei sume de ptrate a unor variabile


independente normal distribuite, fiecare avnd o medie egal cu zero i abatere
standard egal cu 1. Astfel variabila X, definit prin egalitatea

Unde Xi2 reprezint ptratul unei observaii selectate aleator dintr-o


populaie normal distribuit avnd media zero i deviaia standard 1, este
2 distribuit cu n grade de libertate.

97
Densitatea de probabilitate a legii 2 este

Forma acestei distribuii depinde de numrul de termeni Xi2 independeni


din sum. Numrul de termeni Xi2 independeni se numete numrul de
grade de libertate .
Fiecrui nivel d al gradelor de libertate i se asociaz o distribuie 2
distinct. Media i variaia unei distribuii 2 sunt :
M(2) = d, Var(2 ) = 2 d,
unde d este numrul de grade de libertate.

LEGEA F (FISHER)
Distribuia F introdus de R. A. Fisher, este definit pe intervalul [0,+) i
descrie comportarea ctului a dou variabile cu distribuie Hi-ptrat,
fiecare fiind mprit prin numrul gradelor sale de libertate.
Un membru al acestei clase de distribuii este determinat prin numrul de
grade de libertate ale numrtorului dn i respectiv numrul de grade de
libertate ale numitorului dm, distribuiile F distincte fiind determinate de
perechi (dn, dm) distincte.
In general, pentru dn i dm > 2 distribuia F este unimodal i pozitiv
asimetric. Atunci cnd numrul gradelor de libertate crete distribuia F
se apropie pe domeniul su de definiie de o distribuie normal.
Aceast distribuie este utilizat n testele de comparaie a variaiilor i ca
aplicaie a acestora n testele ANOVA.

CURSUL XI
INFORMATICA MEDICALA

ESTIMARI , FLUCTUATII

ESTIMAREA PARAMETRILOR STATISTICI

PROBABILITATI

= ansa ca un eveniment s aib loc considernd toate rezultatele posibile


Valoarea predictiv a probabilitii:
Reflect ce ar trebui s se ntmple i nu ce o s se ntmple
efectiv
Pentru un pacient supus unei operaii cu o rat de succes de 75%
rezultatul nu poate fi 75% succes

98
Probabilitatea poate fi privit ca o msur a capacitii eantionului
analizat de a estima caracteristica unei populaii
EXEMPLU : DISTRIBUTIA GREUTATII

Media = 69, s = 3
68,26% = 66-72 (168-183)
p=0,68
Mai mare de 78 (198)
P=0,0013

PRINCIPII GENERALE

In studiul ntr-o populaie P a parametrilor a unei caracteristici oarecare


(cantitative sau calitative) adesea este necesar s se urmeze procedeul:
1. Se extrage un eantion reprezentativ al acestei populaii.
2. Prin mijloacele statisticii descriptive se descrie distribuia
caracteristicii pe eantionul extras la etapa 1, fiindc talia acestuia
permite o investigare exhaustiv a sa. Astfel se poate determina
frecvena observat, dac este vorba de o caracteristic calitativ,
sau se calculeaz media i variaia, n cazul unei caracteristici
cantitative.
3. Prin mijloacele statisticii infereniale sau inductive se extind la
ntreaga populaie rezultatele observate pe eantion. Adica, pornind
de la parametrii observai (frecvena, media, variaia, etc) pe
eantion se ncearc s se estimeze parametrii teoretici ai ntregii
populaii.

99
Cazul unei variabile X calitative
Frecvena teoretic p a variabilei X n populaia P este necunoscut.
Din populaia P se extrage la ntmplare eantionul E reprezentativ.
In eantionul E pentru variabila X se observ o frecven f.
Se ncearc s se estimeze valoarea necunoscut a lui p cu ajutorul lui f
observat.
observat.

Cazul unei variabile X cantitative


Media teoretic a variabilei X ca i variaia sa teoretic 2
n populaia P sunt necunoscute.

100
Din populaia P se extrage la ntmplare eantionul E
reprezentativ.
In eantionul E pentru variabila X se observ o medie m i o
variaie s2.
Se ncearc s se estimeze valorile necunoscute ale lui i
2 cu ajutorul lui m i s2 observate.

DEFINITIA UNUI ESTIMATOR

101
Estimatorul unui parametru este o funcie depinznd de observaiile efectuate pe
un eantion extras la ntmplare care furnizeaz o valoare aleatoare numit
estimarea punctual a parametrului.
Dac eantionul E are valorile x1,...,xn pentru caracteristica studiat, estimatorul
mediei aritmetice a unei populaii P este m = (x1+x2+...+xn)/n

ESTIMAREA PUNCTUALA

Calitile unui estimator:


corectitudinea estimrii obinute,
precizia acesteia.
Cele dou noiuni sunt distincte cum va rezult i din prezentarea care urmeaz.
PRINCIPII GENERALE

ESTIMATOR FARA BIAS

Fie T estimarea punctual a unui parametru teoretic al unei populaii.


T este o variabila aleatoare valorile ei varind ntmpltor odat cu eantionul pe baza
cruia se calculeaz.
Estimatorul T se spune c este fr bias dac sperana matematic a lui T este egal cu
valoarea adevrat (teoretic) a parametrului estimat adic M(T) = .
Se spune n acest caz c estimarea dat de T este corect.
ESTIMAREA PUNCTUALA
Proprieti ale estimatorilor medie si frecventa:

P1. Sperana matematic a mediilor observate, m, pe eantioane extrase aleator este egal
cu media teoretic a populaiei din care sau extras eantioanele, medie considerat
pentru valorile unei variabile cantitative luat n studiu: M(m) = .

102
P2. Sperana matematic a frecvenelor observate, f, pe eantioane extrase aleator este
egal cu frecvena teoretic p a populaiei din care sau extras eantioanele, frecven
considerat pentru valorile unei variabile calitative luat n studiu: M(f) = p.

Din P1 i P2 rezult c m i f sunt estimatori fr bias i c estimrile realizate cu ajutorul


lor sunt corecte.
corecte.
P3. Sperana matematic a variaiilor descriptive observate s2 pe eantioane de
talie n, extrase aleator este diferit de variaia teoretic 2 a populaiei din care
sau extras eantioanele, variaie considerat pentru valorile unei variabile
cantitative luat n studiu:

P4. Variaia punctual de eantionare este un estimator fr bias pentru 2:

CONCLUZIE
Media, frecvena i variaia de eantionare observate pe eantioane corect
extrase (reprezentative) dintr-o populaie P sunt estimatori fr bias ale mediei,
frecvenei i respectiv variaiei teoretice ale populaiei P

ESTIMAREA CU INTERVALE DE INCREDERE

103
Un estimator c este cu att mai eficace cu ct variaia sa este mai mic,
sau precizia sa depinde de mrimea variaiei sale.
Estimarea punctual a unui parametru teoretic furnizeaz o valoare pentru
parametrul teoretic estimat.
Valoarea sa este tributar fluctuaiilor de eantionare i poate fi la o mare
distan de valoarea real a parametrului estimat.
Este recomandabil s se estimeze un parametru teoretic nu printr-o
singur valoare ci printr-un interval, numit interval de ncredere,
ncredere, n care s
se poat afirma c parametrul estimat se gsete cu o probabilitate
ridicat.

ESTIMAREA CU AJUTORUL INTERVALULUI DE INCREDERE

Intervalul de ncredere este un interval mrginit de valori (limitele poart


numele de limite de ncredere) care include media caracteristicii studiate.
Cu ct intervalul este mai larg cu att suntem mai siguri c media
caracteristicii studiate se va regsi n acel interval.
Mrimea ncrederii, confidena, este dat de probabilitatea ca valoarea
(valorile) studiate s se gseasc n acel interval.
ESTIMAREA UNEI MEDII
Fie P o populaie n care variabila X are o media teoretic necunoscut. Din
populaia P se extrage la ntmplare eantionul E reprezentativ. In eantionul E
pentru variabila X se observ o medie m i se calculeaz o variaie punctual
estimat

Se ncearc s se determine pentru valoarea necunoscut a mediei


teoretice un interval de ncredere cu pragul , (cu ajutorul lui m i S2
observate), adic s se determine un interval [a,b] n care probabilitatea
ca media teoretic s se afle este 1-:
Pr(a b) = 1 - .

ESTIMAREA UNEI MEDII; ESANTIOANE MARI

N>=30
media de eantionare m este o variabil aleatoare normal

Atunci variabila aleatoare centrat redus este o variabil aleatoare


N(0,1).

104
Pentru un prag de semnificaie se determin (de exemplu, din tabela
ecartului redus) valoarea Z pentru care probabilitatea ca variabila
aleatoare Z s fie n intervalul [-Z,Z] este 1-, adic:
Pr(-Z Z Z) = 1 - .

Deci cu o probabilitate 1- se poate afirma c are loc:

de unde rezult :

Prin urmare, intervalul de ncredere pentru media cu pragul de semnificaie


este

Atunci cnd nu se cunoate, ea poate fi estimata corect prin s i n acest caz


intervalul de ncredere cu pragul de semnificaie pentru media este

Cel mai frecvent se utilizeaz un prag de semnificaie = 0.05. Atunci Z=1.96


i deci intervalul de ncredere cel mai utilizat n cazul eantioanelor mari este

EXEMPLU

ntr-o populaie de 50 cunoatem media greutii la natere a noilor


nscui: 3400g i abaterea standard: 142
Pe un eantion aleator de 10 nou nscui:
media=3275g, abaterea standard=854
Eantionul este sau nu caracteristic pentru populaie?
3275+/-1,96*854/3= 3275+/-558
3400 +/-1,96*142/1000= 3275+/-39,36

105
Eantionarea aleatoare implic dreptul fiecrui membru al populaiei de
a fi ales dar nu garanteaz reprezentativitatea proporional a tuturor
prilor unei populaii
Alt eantion alt medie, alt abatere
A distribuia de eantionare a mediei pentru n=10
B distribuia de eantionare a mediei pentru n=50
Pe msur ce crete n eroarea de eantionare scade i eantioanele
devin mai reprezentative, media lor este mai apropiat de cea a populaiei

Deviaia standard a distribuiei de eantionare este un indicator al erorii de


eantionare

DEVIATIA STANDARD A DISTRIBUTIEI DE ESANTIONARE

106
n practic este imposibil s construim distribuia de eantionare estimarea
deviaiei standard a mediei pe baza deviaiei standard i a dimensiunii
eantionului:

EXEMPLU CONTINUARE

A = media=115, abaterea standard=30


Sx=9,5
B = media=115, abaterea standard=30
Sx=4,2
Pe msur ce crete n scade eroarea standard a mediei
Aproximarea distribuiei populaiei

ESTIMAREA UNEI MEDII ; ESANTIOANE MICI


se poate determina intervalul de ncredere al mediei doar dac variabila
studiat X este o variabil aleatoare normal.
Daca se cunoaste variatia:

Nu se cunosate variatia si n<30

107
ESTIMAREA UNEI FRECVENTE

Esantioane mari np, nq>=10

F este frecventa observata


EROAREA DE ESANTIONARE A MEDIEI

Sx= diferena dintre media valorilor eantionului i media caracteristici


populaiei din care a fost extras eantionul
Creterea erorii de eantionare =>
Scderea acurateii mediei eantionului de a estima caracteristica
unei populaii
Scderea erorii de eantionare =>
Creterea acurateii mediei eantionului de a estima caracteristica
unei populaii
EXEMPLU
Studiul Fitzgerald al mobilitii prin extensie a coloanei lombare la indivizi
de vrste cuprinse ntre 30 i 39 de ani
n=42, media=40
media=40 i s=8,8
Media populaiei
populaiei poate fi estimat la 40
Care este acurateea
acurateea acestei estimri?
Cum estimm intervalul de ncredere?

INTERVALE DE INCREDERE

= este un interval mrginit de valori (limitele poart numele de limite de


ncredere) care include media caracteristicii studiate
Cu ct intervalul este mai larg cu att suntem mai siguri c media
caracteristicii studiate se va regsi n acel interval
Mrimea ncrederii probabilitate
ncrederea (confidena) 95%
EXEMPLU (CONTINUARE)
n=42, media=40,
media=40, s=8,8 Sx=1,36
95,45% din distribuie
distribuie este cuprins ntre 2Sx sau 2Z

108
EXEMPLU CONTINUARE
Estimarea zonei de 95%
Este mrginit de un scor Z de 1,96
Interval de ncredere de 95%

INTERVALE DE INCREDERE
Formula de determinare a limitelor intervalului de ncredere:

Pentru intervale de ncredere de 95% Z= 1,96

EXEMPLU CONTINUARE

95% II = 40,0
40,0 (1,96)(1,36)
95% II = 40,02,67
40,02,67
95% II = 37,33 pn la 42,67

EXEMPLU 99%

Z = 2,576
99% II = 40,0
40,0 (2,576)(1,36)
99% II = 40,03,50
40,03,50
99% II = 36,5 pn la 43,5

109
INTERVALE DE INCREDERE CU ESANTIOANE MICI

n<30
Cu ct eantioanele sunt mai mici cu att distribuia de eantionare este
mai dispersat fa de distribuia normal
Se folosete o alt distribuie: distribuia t sau Student
Diferena major dintre distribuia t i cea normal const n faptul c
prima i schimb forma odat cu schimbarea dimensiunii eantionului

CALCULUL INTERVALULUI DE INCREDERE

df = n-1
df = grade de libertate

110
GRADE DE LIBERTATE

df
Direciile disponibile pentru micare ntr-un spaiu dat
Numrul de componente care pot varia ntr-un set de date
n-1
GRADE DE LIBERTATE EXEMPLU

5 msurtori, avem o sum de 30 i o medie de 6


Dup ce face primele 4: 8,9,10,11 a cincea poate fi calculat i setul de
date are numai 4 grade de libertate
CALCULUL INTERVALULUI DE INCREDERE

n=6 df = 5
II95% t= 2,571
n=10 df = 9
II95% t= 2,262
n=30
II95% t= 2,042
Creterea
Creterea lui n determin ca valoarea lui t s se apropie de 1,96 curba
tinde spre distribuia normal

APLICATII ALE INTERVALELOR DE INCREDERE

Studiul Fitzgerald a stabilit cu o precizie de 95% intervalul de ncredere pentru


extensia lombar la diferite grupe de vrst

111
Interpretare:
1. Intervalul de ncredere al extensiei lombare scade cu vrsta
2. Variabilitatea este mai sczut la tineri
3. Intervalele de ncredere se ntreptrund

CURSUL XII
INFORMATICA MEDICALA

TESTE STATISTICE. INTRODUCERE PASI ERORI

NOTIUNI

Testarea ipotezelor statistice


Ipoteza nul
Concepte
Erori n testarea ipotezelor statistice
Regiunea critic, direcional-nondirecional
Teste parametrice-nonparametrice
TESTAREA IPOTEZELOR STATISTICE

Formularea de noi ipoteze (sau model sau teorie) este una dintre
cele mai importante aspecte ale cercetrii tiinifice.
Aceste ipoteze experimentale ncerc s descrie sau s explice
anumite fenomene reale.
In multe cazuri exist ipoteze anterioare (descrieri sau explicaii)
pe care oamenii de tiin doresc s le nlocuiasc cu altele noi.
Este ns insuficient s se formuleze sau s fie prezentat numai
o nou ipotez.
O ipotez nou trebuie testat pentru a vedea c are temei (n
concordan cu observaiile) i pentru a justifica c este mai
bun dect alte ipoteze alternative.
Aceasta conduce la scheme de experimente, eantioane i de
observaii n scopul obinerii dovezii pentru susinerea (sau
respingerea) unei noi ipoteze.
METODE PENTRU TESTAREA IPOTEZELOR

112
Compararea a dou ipoteze sau teorii concurente
Aceste dou teorii trebuie prima dat formulate ca modele.
Aceste dou modele n continuare vor fi denumite prin ipoteza
nul i ipoteza alternativ.
Ipoteza nul H0, reprezint modelul pe care
experimentatorul ar dori s-l nlocuiasc.
Ipoteza alternativ H1 este noul model care de regul
reprezint o negaie a ipotezei nule.
Ipoteza nul H0, reprezint modelul pe care experimentatorul ar
dori s-l nlocuiasc.
Ipoteza alternativ H1 este noul model care de regul reprezint
o negaie a ipotezei nule.
Indiferent cum este formulat protocolul experimentului scopul
cercettorului este de a testa ipoteza nul (de cele mai multe ori
pentru a o rejecta)
Ca n justiie: inculpatul este inocent pn se dovedete vinovat
Ipoteza nul nu trebuie probat ci anulat
Inferen negativ
Inferen negativ
Scopul testului statistic este de a dovedi c ipoteza nul H0 este
fals
nu putem niciodat afirma acceptm ipoteza nul
O putem nega sau nu o putem nega
Ca la un proces, rezultatul este vinovat sau nevinovat i nu
inocent
Nevinovat = nu suficient de vinovat pentru a fi acuzat
Prin respingerea ipotezei nule cercettorul afirm c rezultatele
observate nu sunt datorate ntmplrii
= efect semnificativ
Cnd ipoteza nul nu este rejectat cercettorul afirm c
diferenele observate sunt datorate ntmplrii i rezultatele nu
sunt semnificative
PASII UNUI TEST STATISTIC (1)

Formularea problemei n termenii ipotezelor statistice.


Pentru aceasta se stabilesc: ipoteza nul H0 i respectiv ipoteza
alternativ H1, reprezentnd o negare a ipotezei nule.
Ipoteza nul H0, este ipoteza care trebuie testat, testul
efectundu-se sub prezumia c ipoteza nul ar fi adevrat.
Ipoteza alternativ H1, este acea ipotez care ntr-un sens sau
altul contrazice ipoteza nul. Aceast ipotez se mai numete i
ipoteza de lucru.

113
Ipoteza nul
Media valorilor n populaia A nu este diferit de media valorilor
n populaia B

Ipoteza alternativ
Media valorilor n populaia A este diferit de media valorilor n
populaia B
Uneori se urmrete tocmai respingerea ipotezei alternative
(comparaia unui tratament cu un standard)
Ipotezele anterioare stipulau diferena fr a o enuna: ipoteze
non-direcionale

Ipoteze direcionale

PASII UNUI TEST STATISTIC (2)

Alegerea i calcularea parametrului statistic al testului.


Parametrul statistic al testului exprim ntr-o anumit form,
diferena dintre elementele comparate, dintre care cel puin unul
intervine sub forma unei statistici a unui eantion.
innd seama de faptul c eantionul sau eantioanele utilizate
sunt aleator extrase din populaiile care fac obiectul testului,
parametrul statistic este o variabil aleatoare de selecie, care
urmeaz o anumit lege de probabilitate.
Un bun parametru statistic al testului trebuie s ndeplineasc
dou condiii:
a. Trebuie s se comporte diferit atunci cnd ipoteza nul
H0 este adevrat fa de situaia n care ipoteza
alternativ H1 este adevrat.
b. Distribuia de probabilitate a parametrului statistic al
testului sub prezumia c H0 este adevrat, este
cunoscut.
PASII UNUI TEST STATISTIC (3)
Alegerea regiunii critice.
Trebuie s fim capabili s decidem n funcie de valoarea
parametrului statistic calculat care dintre ipoteze, cea nul sau
cea alternativ, este adevrat.

114
Dac valoarea parametrului statistic aparine regiunii critice,
ipoteza nul H0 va fi respins i va fi acceptat ipoteza
alternativ H1.
Dac valoarea parametrului statistic nu aparine regiunii critice,
ipoteza nul H0 va fi acceptat.

PASII UNUI TEST STATISTIC (4)

Alegerea dimensiunii regiunii critice.


Pentru aceasta trebuie s specificm mrimea riscului de eroare
pe care l acceptm.
Pe scurt, definim nivelul de semnificaie, notat cu , sau mrimea
riscului pe care suntem dispui s ni-l asumm n respingerea
ipotezei nule H0 n cazul n care aceasta este adevrat.
De obicei se alege un nivel de semnificaie ntre 1% i 5%.
PASII UNUI TEST STATISTIC (5)
Concluzia testului.
Ipoteza nul H0 este respins dac valoarea parametrului
statistic aparine regiunii critice.
Regiunea critic trebuie astfel aleas nct dac ipoteza
alternativ H1 este adevrat, probabilitatea de respingere a
ipotezei nule H0 este mai mare dect n cazul n care ipoteza nul
H0 ar fi adevrat.
n realitate, probabilitatea unei respingeri adevrate a ipotezei
nule H0 trebuie s fie mai mare dect probabilitatea unei
respingeri false

Depinznd de ipoteza alternativ, se poate alege una din


urmtoarele trei regiuni critice:
Regiunea critic unilateral la dreapta valoarea
parametrului statistic al testului este mai mare sau egal
cu valoarea din dreapta a intervalului critic;
Regiunea critic unilateral la stnga valoarea
parametrului statistic al testului este mai mic sau egal cu
valoarea din stnga a intervalului critic;
Regiunea critic bilateral valoarea parametrului statistic
al testului este mai mic sau egal cu valoarea extrem din
stnga regiunii critice sau mai mare sau egal cu valoarea
extrem din dreapta regiunii critice, valorile extreme ale
regiunii critice avnd nivele egale de semnificaie.
DECIZIA

Stabilirea semnificaiei testului pe baza valorii lui p se face


frecvent cu urmtoarea regul empiric:

115
1. Dac 0,01 <= p<0,05 , rezultatele sunt considerate
semnificative.
2. Dac 0,001 <= p<0,01, rezultatele sunt considerate
nalt semnificative.
3. Dac p<0,001, rezultatele sunt considerate foarte nalt
semnificative.
4. Dac p>=0,05, rezultatele sunt considerate
nesemnificative statistic.
5. Dac 0,05 <= p<0,1, se noteaz o oarecare tendin
spre considerarea unei semnificaii statistice.
Valoarea p nu este probabilitatea ca ipoteza nul s fie fals. O
valoare mic a lui p nu nseamn c exist o probabilitate mic ca
ipoteza nul s fie adevrat.
Ipoteza de lucru nu poate fi inversat i de exemplu pentru un p
= 0,02 nu se poate spune c avem o probabilitate de 98% ca
diferena s existe.
Valoare lui p nu este un indicator al validitii ipotezei statistice.
P se utilizeaz doar pentru a face decizia semnificativ sau nu.
ERORI IN TESTAREA IPOTEZELOR STATISTICE

EROAREA DE TIP I

= H0 este respins dei este adevrat


Am concluzionat c exist reale diferene dei acestea sunt
datorate ansei
Concluzionm c un tratament este eficient pe baza unei
interpretri greite

116
EROAREA DE TIP II
= H0 este nu este respins dei este fals
Am concluzionat c exist diferenele observate sunt datorate
ansei atunci cnd acestea apar datorit diferenelor dintre
eantioane
Am putea abandona un tratament pe care tocmai l testm sau o
direcie de cercetare

EROAREA DE TIP I SI NIVELUL DE SEMNIFICATIE


Probabilitatea comiterii unei erori de tip I = nivelul de
semnificaie, (alfa)
Probabilitatea este de determinat prin teste statistice
Nivelul alfa (riscul maxim acceptabil) 5% exist o ans de
5% de a respinge incorect ipoteza nul
p= 0,18 ipoteza nul nu se poate respinge
p= 0,04 ipoteza nul se poate respinge cu un risc acceptabil de
4% de a comite o eroare de tipul I
EROAREA DE TIP II
= H0 este nu este respins dei este fals
Am concluzionat c diferenele observate sunt datorate ansei
atunci cnd acestea apar datorit diferenelor obiective dintre
eantioane
Probabilitatea de a nu rejecta o ipotez nul fals = ,
probabilitatea de a face o eroare de tipul II
1- = complementul lui , puterea unui test
Puterea = probabilitatea ca un test s resping ipoteza nul sau
s obin semnificaie statistic
REGIUNEA CRITICA
= regiunea de respingere, aria mrginit de Z=1,96

REGIUNEA CRITICA EXEMPLU

Media eantionului=105

117
s=16
n=30
=100
Sx=2,9
Z=1.72
Testul nu este semnificativ i nu se poate respinge ipoteza nul

TEST NONDIRECTIONAL CU DOUA COZI

Nu s-a evaluat direcia diferenei dintre cele dou medii


Un test cu un nivel de semnificaie are o probabilitate de /2
pentru fiecare coad
TEST DIRECTIONAL CU O COADA
Nu mai ncercm localizarea regiunii critice n ambele cozi
Media eantionului=105
s=16
n=30
=100
Sx=2,9
Z=1,645
Testul este semnificativ se respinge ipoteza nul

STATISTICI PARAMETRICE SI NON PARAMETRICE


Statisticile utilizate pentru a estima parametrii unei populaii
sunt statistici parametrice
Sunt bazate pe extragerea randomizat de eantioane
dintr-o populaie normal distribuit
Eantioanele reprezint parametrii populaiei
Dac nu se respect aceste condiii sunt necesare altfel de teste
statistice: teste nonparametrice:
Nu fac supoziii asupra populaiei
Pot fi folosite atunci cnd criteriile de normalitate i
omogenitate nu sunt ndeplinite

118
TESTE STATISTICE

CE
Cea mai simpl comparaie statistic este cea ntre dou grupuri aleator
alese
Acest mod de distribuire permite cercettorului s presupun c
diferenele individuale sunt egal distribuite ntre grupuri la nceputul
experimentului i c cele dou grupuri sunt echivalente
D.p.d.v statistic cele dou grupuri sunt eantioane extrase din aceiai
populaie deci diferenele dintre ele sunt rezultatul erorii de eantionare
sau al ntmplrii
Dup aplicarea unui tratament cercettorul verific dac cele dou
eantioane mai fac sau nu parte din aceiai populaie
Pentru aceasta se aplic un test statistic
COMPARAREA A DOUA MEDII

Compararea mediilor eantioanelor pentru determinarea statistic a


diferenelor se face prin dou caracteristici:
Media diferena mediilor ntre grupuri caracterizeaz nivelul de
separare ntre grupuri
Variana caracterizeaz variabilitatea n interiorul grupurilor
Ambele caracteristici sunt o surs de variabilitate utilizabil pentru a
descrie efectele tratamentului
Se consider dou eantioane aleator extrase, unul experimental i unul
de control
Dac tratamentul a fost eficient tot grupul supus experimentului va atinge
acelai nivel al parametrului studiat
Exist diferene ntre grupuri
Nu exist diferene n interiorul grupurilor

Situaia real
Exist diferene ntre grupuri
Exist diferene n interiorul grupurilor
Trebuie demonstrat dac diferenele observate ntre mediile parametrului
studiat sunt datorate experimentului i nu ntmplrii

119
TESTUL STUDENT
W.S. Gossett, 1908 Student
Testul t
Subtipuri:
Testul t pentru eantioane independente:
Variane egale
O coad
Dou cozi
Variane inegale
Testul t pentru eantioane perechi

TESTUL T PENTRU ESANTIOANE INDEPENDENTE

Utilizat pentru compararea a dou eantioane independente


Eantioanele sunt considerate independente deoarece sunt compuse din
seturi independente de subieci ntre care nu exist nici o relaie derivat
din studiu
PREZUMTIA DE EGALITATE A VARIANELOR
Testul t pentru eantioane independente se bazeaz pe aceast
prezumie

120
Se mai numete i omogenitatea varianelor
n mod normal omogenitatea varianelor se testeaz statistic
Testul Levene sau testul Barlett
Bazate pe statistica F
Dac varianele nu sunt semnificativ statistic diferite (p>0,05) atunci pot fi
considerate egale
Dac sunt diferite se aplic alt formul de calcul a lui t
TESTUL T: EGALITATEA VARIANELOR

Numrtorul diferena mediilor eantioanelor


Numitorul eroarea standard a diferenei dintre medii, o msur a
variabilitii n interiorul eantioanelor
Estimarea SX1+X2 se face prin variabila Sp, (variana comun) care
utilizeaz varianele i dimensiunile eantioanelor

Eroarea standard a diferenei mediilor eantioanelor este:

Grade de libertate:
df =(n1-1)+(n2-1)=(n1+n2-2)
df =N-2 unde N este dimensiunea combinat a eantioanelor
EXEMPLU

Testm ipoteza c un nou model de atel mbuntete funcia de


prindere a minii la pacienii cu artrit reumatoid
Ne intereseaz doar testarea ipotezei direcionale, deoarece dorim
obinerea unei ameliorri:
H1=1 > 2
Avem un eantion aleator selectat de 20 de pacieni cu artrit reumatoid
avnd niveluri similare de diformitate la nivelul minii i la nivelul
articulaiilor minii
Aleator pacienii sunt mprii n dou grupuri:
n1 10 persoane sunt grupul pentru experiment
n2 10 persoane sunt grupul de control
La cei din grupul experimental se monteaz atela

121
Toi pacienii au un program motor similar timp de o sptmn
Se msoar puterea de strngere cu mna n zilele 1 i 8 ale testului iar
diferena este cea care se folosete n continuare la calcule

122
TESTUL T
Pentru ca valoarea calculat a lui t s implice o diferen semnificativ, ea
trebuie s fie mai mare sau egal cu valoarea critic
Dac testul este unidirecional atunci i semnul lui t trebuie s fie
corespunztor

Deoarece t=2,718 i este mai mare dect valoarea critic pentru =0,05
1,734 i este pozitiv atunci media valorilor diferenei forei minii a celor
din grupul experimental este mai mare dect la cei din grupul de control
Putem rejecta H0
Tratamentul are un rol pozitiv

123
TESTUL T PENTRU VARIANE INEGALE
Literatura de specialitate arat c atunci cnd eantioanele comparate au
un numr egal de cazuri violarea regulii egalitii varianelor nu duce la
compromiterea testului Student
Dac numrul de cazuri difer ntre eantioane atunci statistica t trebuie
calculat conform formulei, iar gradele de libertate se ajusteaz n funcie
de varian:

EXEMPLU

124
Dac eantioanele mai mari au i varian mai mare testul t devine mai
puin puternic
Se obin mai puine diferene semnificative statistic
dac eantionul mai mic are variana mai mare (de peste 2 ori) crete
ansa unei erori de tipul I

TESTUL T PENTRU ESANTIOANE PERECHE

Se folosete n protocoale de cercetare care implic msurtori repetate


asupra acelorai indivizi sau asupra unor indivizi cu caracteristici
asemntoare (chiar gemeni)
Datele sunt considerate mperecheate deoarece pentru fiecare valoare
exist o valoare pereche
Testul evalueaz scorul de diferen din cadrul fiecrei perechi astfel nct
subiecii sunt comparai numai cu ei nii sau cu perechea lor
D este diferena dintre scoruri

125
Se testeaz utilizarea unei perne de suport lombar pentru mbuntirea
unghiului de repaus al pelvisului

TESTUL CHI-PTRAT

Analiza frecvenelor pentru variabile msurabile pe o scar nominal sau


ordinal
Test neparametric care verific dac distribuia observat difer de cea
ateptat (teoretic)
STATISTICA CHI-PTRAT

n aplicare testului Chi-ptrat ntotdeauna:


Frecvenele sunt date de numrul de cazuri i nu reprezint
procente sau ranguri
Categoriile sunt exhaustive i mutual exclusive: orice subiect poate
aparine unei categorii dar numai uneia

126
O frecvena observat i E frecvena ateptat

EXEMPLU

Aruncm o moned de 100 de ori i obinem de 47 de ori stema dei


teoretic ar fi trebuit s obinem stema de 50 de ori
Nu putem rejecta ipoteza nul, aruncarea cu banul a fost corect

TESTE DE TIP HI PTRAT

servete la compararea a dou distribuii, urmnd dou modele, care


constau n:
compararea unei distribuii observate (sau empirice) pe un
eantion cu o distribuie teoretic. In acest caz, se caut s se
determine dac un eantion se aseamn cu un anumit model
teoretic, fiind astfel vorba de un test Hi-ptrat de ajustare.
compararea a dou distribuii observate n scopul stabilirii fie a
independenei dintre dou criterii sau omogenitatea dintr-un
tabel de contingen. Este vorba n acest caz de un test Hi-ptrat
de omogenitate sau de independen.
TESTUL HI PTRAT DE INDEPENDEN
Astfel vom presupune c se caut efectul fumatului asupra aparitiei
cancerului buzei inferioare (M). Pentru aceasta se observ un eantion
de 400 de subieci dintre care:
160 au afectiunea M prezent ( i 240 nu au boala prezent)
130 sunt fumtori T ( i 270 nu sunt fumtori).

Se caut s se stabileasc dac fumatul influeneaz apariia maladiei M


sau dac apariia acesteia este independent de fumat.

127
Tabelul de contingen prezentat se numete tabel de contingen
observat, iar frecvenele pe care le conine se numesc frecvene
observate.
Se face ipoteza de independen ntre cele dou caractere M i T (adic
ipoteza nul H0 , n acest caz) atunci
Se calculeaza un tabel de contingen teoretic care satisface aceast
ipotez de independen.
Se determin apoi abaterea (ecartul) dintre cele dou tabele de
contingen observat i teoretic.
Dac aceast abatere este mic atunci ea este explicat doar prin
ntmplare (hazard) i ipoteza de independen este acceptat.
Dac aceast abatere este foarte important pentru ca doar
ntmplarea s o explice atunci ipoteza de independen trebuie
s fie respins.
Problema este urmtoarea: dispunnd de un eantion de n = 400 de subieci
dintre care 160 au maladia M iar 130 sunt fumtori, s se determine cum sunt
repartizai subiecii n funcie de cele dou caractere (M i T) dac se
presupune c acestea sunt independente

ECARTUL DINTRE CELE DOUA TABELE DE CONTINGENA

128
ETAPA 1
DEFINIREA IPOTEZEI NULE HO
H0: caracterele A i B sunt independente.
H0: fumatul nu are influen asupra apariiei maladiei M.

ETAPA 2 DEFINIREA UNUI PARAMETRU

ETAPA 3 PRAGUL DE SEMNIFICAIE

Fie pragul de semnificaie al testului.


S-a ales pragul de semnificaie = 0.05
ETAPA 4 DEFINIREA REGIUNII CRITICE

Regiunea critic este [X2 ,).


Pentru pragul =0.05 i cu 1 grad de libertate valoarea = 3.84, astfel
c n acest caz regiunea critic este intervalul [3.84 , ).
ETAPA 5 CALCULAREA VALORII OBSERVATE A PARAMETRULUI

129
ETAPA 6 DECIZIA

Dac X2 [3.84, ) se respinge H0 cu un risc de eroare de prima spe


.
Dac X2 [3.84, ) atunci H0 nu se respinge, acceptndu-se H0 cu un
risc de eroare de spea a doua
X2 =37,22 >> 3.84 aa c ipoteza nul H0 se respinge cu un risc inferior
lui 5%.In concluzie, fumatul se asociaz cu maladia M favoriznd-o.

CURSUL XIII
INFORMATICA MEDICALA

TESTE ANOVA, REGRESII

ANALIZA DE VARIAN ANOVA

Este un test destinat analizei cercetrilor multinivel i/sau


multifactoriale
Este utilizat atunci cnd trebuiesc cercetate 3 sau mai multe condiii
sau eantioane
Bazat pe statistica F i pe prezumia c eantioanele sunt extrase
aleator dintr-o populaie normal distribuit (n practic se verific
ntotdeauna)
ANOVA UNIVARIAT PENTRU EANTIOANE INDEPENDENTE
Univariat analiza se aplic asupra unui experiment cu un singur
factor, care produce cel puin trei grupuri independente
Ipoteza statistic:
H0: 1 = 2 = 3 ... = n
Testul statistic utilizat este testul F (propus de Sir Ronald Fischer
EXEMPLU
Studiu ipotetic asupra efectului utilizrii bastonului sau crjelor la
persoanele cu amputaie unilateral, msurndu-se lungimea pasului
Variana total SSt
Variana intergrup SSb
Variana intragrup SSe= SSt - SSb

130
Media ptratic intergrup MSb
Media ptratic intragrup MSe

Dac nu putem rejecta ipoteza nul, nici un tratament nu este util


Dac putem rejecta ipoteza nul atunci cel puin un tratament este
util i trebuiesc fcute comparaii multiple pentru a arta care este
tratamentul corect

131
ANALIZA BIVARIAT ANOVA EXEMPLU

Util n studii care permit investigarea efectelor simultane a 2 sau


mai multe variabile independente
Se studiaz efectul ntinderilor rapide fa de cele de prelungi asupra
articulaiei genunchiului aflata n flexie sau n extensie
Rezult un cadru 3x2, fiecare cu 10 pacieni

132
Ce se investigheaz?
Efectul variabilei A independent de B
Efectul variabilei B independent de A
Efectul cumulat al celor dou variabile

EFECTELE PRINCIPALE
Efectele datorate aplicrii uneia din cele 2 variabile se msoar prin media
pentru nivelurile rezultate din efectele principale i se numete medie
marginal

EFECTELE SIMPLE

133
INTERACIUNEA NTRE VARIABILE

134
TESTAREA IPOTEZEI STATISTICE

Ipoteza ntr-un design 3x2 este de genul:


H0: A1 = A2 = a3
H0: B1 = B2
H0: A1B1 = A1B2 = A2B1 = A2B2 = A3B1 = A3B2

REGRESII LEGATURA NTRE MAI MULTE VARIABILE CANTITATIVE

STATISTICI DESCRIPTIVE N DOU DIMENSIUNI


Varsta X: X1, X2,..., Xn
TAS Y: Y1, Y2,..., Yn.
S se stabileasc dac exist o legtur ntre variabilele X i Y i s
se determine o modalitate de a msura intensitatea acestei legturi.
Coeficientul de corelatie
S se stabileasc dac Y depinde de X i dac da n ce form se
realizeaz aceast dependen.
Functia de regresie
DIAGRAMA DE DISPERSIE

Diagrama de dispersie asociat unei tabel de date bidimensional:


X: X1, X2,..., Xn

135
Y: Y1, Y2,..., Yn
se obine reprezentnd grafic punctele de coordonate (Xi,Yi)
i=1,2,...,n.

Orientarea i dispersia norului de puncte poate da o prim idee despre


relaia ntre cele dou variabile aflate n studiu.

O idee ceva mai precis privind relaia ntre cele dou caracteristici se
obine mprind diagrama de dispersie n patru cadrane prin dou drepte
perpendiculare care trec prin punctul (Xmediu,Ymediu), avnd
coordonatele egale cu mediile celor dou variabile.

136
INDICI DE CORELAIE SUMA PRODUSELOR ECART

O msur a intensitii relaiei dintre variabilele X i Y este dat de suma:

Un dezavantaj evident al SPE este faptul c acest coeficient depinde de


numrul de puncte din seria statistic i de unitile de msur ale
variabilelor

137
Pentru a descrie "intensitatea" relaiei dintre cele dou variabile X i Y se
utilizeaz observaia c dac punctul (Xi,Yi) se afl n cadranele I sau III ale
diagramei de dispersie atunci produsul este pozitiv iar atunci cnd este
situat n cadranele II i IV este negativ.

SPE va fi cu att mai mare n valoare absolut cu ct norul de puncte este


mai apropiat de o alur general cresctoare (SPE > 0 ) sau descresctoare
(SPE < 0).
INDICI DE CORELAIE COVARIAIA COV ( X,Y)

COEFICIENTUL DE CORELAIE PEARSON

Pentru a obine un indicator independent i de unitile de msur ale celor


dou variabile se utilizeaz coeficientul de corelaie sau coeficientul
Bravais-Pearson:

unde SX i SY reprezint abaterile standard pentru seriile X i respectiv Y:

unde s este variatia.


INTERPRETAREA COEFICIENTULUI DE CORELAIE

138
Coeficientul de corelaie msoar intensitatea relaiei dintre
variabilele X i Y i valoarea sa r este totodat cuprins ntre -1 i 1.
Dac r=1 punctele sunt situate pe o dreapt de pant pozitiv
(cresctoare).
Dac 0 < r < 1, norul de puncte poate fi nlocuit (ajustat) printr-o
dreapt de pant pozitiv .

Dispersia punctelor n jurul dreptei de regresie va fi cu att mai mare cu ct


r se apropie de 0 i cu att mai mic cu ct r se apropie de 1.

Dac -1 < r < 0 atunci norul de puncte poate fi aproximat cu o dreapt


de pant negativ. Dispersia punctelor fa de dreapt va fi cu att
mai mic cu ct r este mai apropiat de -1.
Dac r=-1 atunci toate punctele sunt situate pe o dreapt de pant
negativ.

ALURA NORULUI DE PUNCTE

139
Cnd r este pozitiv relaia ntre variabilele X i Y este "pozitiv",
adic o cretere a lui X determin n general o cretere a lui X.
Cnd r < 0 relaia ntre cele dou variabile este "negativ" adic o
cretere a lui X are n general ca i consecin o diminuare a lui Y.

REGULILE EMPIRICE COLTON (1974)

un coeficient de corelaie de la -0.25 la 0,25 nseamn o corelaie


slab sau nul,
un coeficient de corelaie de la 0.25 la 0.50 (sau de la -0.25 la -0.50)
nseamn un grad de asociere acceptabil
un coeficient de corelaie de la 0.5 la 0.75 (sau de la -0.5 la -0.75)
nseamn o corelaie moderat spre bun
un coeficient de corelaie mai mare dect 0.75 (sau mai mic dect
-0.75) nseamn o foarte bun asociere sau corelaie
TESTUL DE SEMNIFICAIE PENTRU COEFICIENTUL DE CORELAIE
PEARSON

Semnificaia coeficientului de corelaie Pearson poate fi evaluat


dac valoarea observat a aprut datorit ntmplrii (dac este
semnificativ diferit de zero).
Valorile critice ale lui r pot fi regsite n Anexa 6 pentru n-2 grade de
libertate n cazul aplicrii testului unilateral sau bilateral.
Interpretarea este c datele experimentale nu ne permit enunarea
existenei unei relaii ntre variabilele luate n calcul
INTERPRETAREA R,P

140
Atentie:
Variabilele corelate trebuie sa fie cantitative
Intre variabilele pentru care se calculeaza corelatie trebuie sa
existe o relatie de cauzalitate

CORELAREA RANGURILOR : COEFICIENTUL DE CORELAIE SPEARMAN

Coeficientul de corelaie Spearman, notat rs, este analogul nonparametric


al coeficientul de corelaie Pearson, calculat pentru a fi utilizat cu date
ordinale.

Unde n este numrul de perechi de variabile

TESTUL DE SEMNIFICAIE PENTRU COEFICIENTUL DE CORELAIE


SPEARMAN
Semnificaia coeficientului de corelaie Spearman poate fi evaluat
dac valoarea observat a aprut datorit ntmplrii (dac este
semnificativ diferit de zero).
Valorile critice ale lui r pot fi regsite n Anexa 7 pentru n grade de
libertate n cazul aplicrii testului unilateral sau bilateral.

141
Valorile obinute pentru rs trebuie s fie mai mari sau egale dect
valorile critice din tabel pentru ca s fie semnificative

COEFICIENTUL DE DETERMINARE

este ptratul coeficientului de corelaie r, adic d = r*r.


Prin definiie, coeficientul de determinare reprezint partea din
variaia total a lui Y explicat prin relaia liniar existent ntre X i
Y.
In caz extrem, dac toate punctele se afl pe o dreapt care nu e
paralel cu axa Ox (adic nu are panta nul), orice variaie a lui Y
este exprimat prin relaia liniar i coeficientul de determinare este
1. Din contr, dac X i Y sunt independente, adic ntre cele dou
variabile nu exist o relaie liniar, coeficientul de determinare va fi
zero.
Acest coeficient, n procente (adic nmulit cu 100) exprim
procentajul n care variaia lui Y este dat prin relaia liniar ntre cele
dou variabile.

CURSUL XIV
INFORMATICA MEDICALA

TESTE STATISTICE III

TESTUL Z DE COMPARAIE A MEDIEI UNUI EANTION CU MEDIA UNEI


POPULAII ( VARIAIA CUNOSCUT)

Obiectivul testului este de a compara media unei variabile cantitative


continue pe un eantion reprezentativ extras dintr-o populaie cu media

142
cu o medie cunoscut 0 a unei populaii standard. Se presupune c cele
dou populaii au aceiai variaie 2 care se cunoate.
Condiii de aplicare
Este necesar s cunoatem variaia populaiei (dac nu o
cunoatem, aplicm testul Student pentru compararea mediei
unui eantion cu media unei populaii).
Testul este corect aplicat dac populaia este normal
distribuit. Dac populaia nu este normal distribuit sau talia
eantionului este mic (<30) testul d o valoare orientativ.
Testul este, de asemenea, corect aplicat atunci cnd talia
eantionului este mare ( 30).
Ipotezele testului
1. Test bilateral: H0: = 0 versus H1: 0
2. Test unilateral: H0: = 0 versus H1: > 0
unde = media popolaiei din care este extras eantionul i 0 =
media populaiei standard.
Intr-o alt form ipotezele testului se pot formula n modul urmtor:
Ipoteza nul: nu exist diferen semnificativ ntre media
eantionului i media populaiei.
Ipoteza alternativ pentru testul bilateral: exist diferen
semnificativ ntre media eantionului i media populaiei.
Ipoteza nul pentru testul unilateral: media eantionului este
semnificativ mai mare dect media populaiei.
PARAMETRUL STATISTIC AL TESTULUI

Pragul de semnificaie = 0,05

REGIUNEA CRITIC
Regiunea critic pentru testul bilateral este (- , -1,96 ] [1,96 , ) (

Regiunea critic pentru testul unilateral este [1.645, )

143
EXEMPLU

O arie actual de interes este studierea agregrii familiale a bolilor


cardiovasculare (prevalena bolii printre membrii unei familii este
mai mare dect n rndul populaiei generale), prin studiul legturii
dintre nivelul lipidic sanguin i aceste boli.
Se tie c nivelul mediu al colesterolului sanguin la copii este de 175
mg/dL.
La un eantion de 10 copii, provenii din familii n care tatl a decedat
n urma unei boli cardiovasculare, media colesterolului sanguin este
de 200 mg/dL iar deviaia standard este de 50 mg/dL.
Nivelul mediu al colesterolului la aceast populaie de copii este mai
mare dect cel al populaiei generale?
Este nivelul colesterolului obinut la acest eantion semnificativ
diferit fa de cel al populaiei generale?
Datele problemei: 0 = 175, = 200, n = 10, s = 50.
Ipotezele testului sunt:
1. Test bilateral: H0: = 0 = 175 versus H1: <>0<>175
2. Test unilateral: H0: = 0 = 175 versus H1: > 0 > 175
De asemenea, avem:
Ipoteza nul: nu exist diferen semnificativ ntre media
colesterolului pentru eantion fa de media populaiei.
Ipoteza alternativ pentru testul bilateral: exist diferen
semnificativ ntre media colesterolului la eantion i
respectiv la populaia general.
Ipoteza alternativ pentru testul unilateral: media
colesterolului pentru eantion este mai mare dect media
colesterolului la populaia general.
Prag de semnificaie = 0,05
1. Regiunea critic pentru testul bilateral este: (- , -1,96 ] [1,96 , )
(vezi anexa 1).
2. Regiunea critic pentru testul unilateral este: [1.645, ) ( vezi anexa
1).
Parametrul statistic calculat al testului:

144
1. Pentru testul bilateral: Deoarece parametrul statistic calculat al
testului nu aparine regiunii critice respingem ipoteza nul; exist o
diferen semnificativ ntre media colesterolului la eantionul ales
i populaia general.
2. Pentru testul unilateral: Deoarece parametrul statistic calculat al
testului z este mai mic dect 1,645 nu putem nega ipoteza nul, adic
nu exist diferen semnificativ ntre media colesterolului la
eantion i media colesterolului populaiei generale.
TESTUL Z DE COMPARARE A MEDIILOR A DOU POPULAII ( VARIAII
CUNOSCUTE I EGALE)

Obiectivul testului este de a compara mediile unei variabile


cantitative continue ntre dou populaii, care satisfac condiia au
aceeai variaie 2 i c ea este cunoscut.
Pentru aplicarea testului se utilizeaz dou eantioane
reprezentative independente extrase din cele dou populaii
Condiii de aplicare
1. Populaiile trebuie s aib variaii cunoscute i egale. Dac
variaiile nu sunt cunoscute, se aplic testul Student pentru
compararea mediilor a dou populaii.
2. Testul este corect aplicat dac populaiile sunt normal distribuite
sau dac eantioanele utilizate au talie mare (30). Dac populaiile
nu sunt normal distribuite sau dac cel puin un eantion are talie
mic (<30), testul d o valoare orientativ.
Algoritm
Considerm dou populaii cu mediile i respectiv .
Ipotezele testului:
1. Test bilateral: H0: = 0 versus H1: 0
2. Test unilateral: H0: = 0 versus H1: > 0
Sub prezumia c ipoteza nul este adevrat (1 - 2 = 0), parametrul
statistic al testului este dat de formula:

EXEMPLU

145
Dorim s studiem dac exist diferen semnificativ ntre cantitatea
de acid uric sangvin la brbaii din mediul urban fa de cei din
mediul rural, cunoscndu-se c variaia acidului uric este egal cu 2,1
mg/100ml.
Din prima populaie (mediul urban) s-a extras un eantion de 10
persoane cu vrste cuprinse ntre 45 i 60 de ani i s-a obinut o medie
a acidului uric de 5,6 mg/100ml.
S-a determinat media acidului uric la un eantion de 16 brbai,
extras din a doua populaie (mediul rural), cu vrste cuprinse ntre 45
i 60 de ani din mediul rural i s-a constata o valoare medie de 4,1
mg/100ml.
Ipoteza testului:
1. Test bilateral: H0: = 0 versus H1: 0
2. Test unilateral: H0: = 0 versus H1: > 0
Ipoteza nul: Media acidului uric la prima populaie nu difer
semnificativ fa de media acidului uric la cea de-a doua populaie.
Ipoteza alternativ, test bilateral: Media acidului uric la cei din
mediul urban difer semnificativ fa de media acidului uric la cei
din mediul rural.
Ipoteza alternativ, test unilateral: Media acidului uric la cei din
mediul urban este semnificativ mai mare fa de media acidului uric
la cei din mediul rural.
Parametrul statistic calculat al testului:
Pragul de semnificaie: = 0,05.
Regiunea critic:

1. Regiunea critic pentru testul bilateral: (- , -1,96 ] [1,96 , ) (vezi


anexa 1).
2. Regiunea critic pentru testul unilateral: [1.645, ) ( vezi anexa 1).
Concluzie:
1. Test bilateral: Deoarece statistica calculat a testului nu aparine
regiunii critice nu se poate nega ipoteza nul. Media acidului uric la
prima populaie nu difer semnificativ fa de media acidului uric la
cea de-a doua populaie.
2. Test unilateral: Deoarece statistica calculat a testului aparine
regiunii critice, se accept ipoteza alternativ c media acidului uric
n prima populaie este mai mare dect media n cea de a doua
populaie.
TESTUL Z DE COMPARARE A UNEI FRECVENTE OBSERVATE CU O
FRECVEN TEORETIC ( DISTRIBUIA BINOMIAL)

146
Scopul acestui test este investigarea semnificaiei diferenei ntre o
frecven teoretic p (ntr-o populaie) i o frecven observat f pe un
eantion reprezentativ a unei valori a unei variabile calitative (binare).

Condiii de aplicare:
Testul este corect aplicat dac numrul n al observaiilor
eantionului este suficient de mare (np, n(1-p)>10), pentru a justifica
utilizarea unei aproximri cu o distribuie normal redus (a
distribuiei frecvenei de selecie).
Algoritm
Un eantion randomizat de volum n este extras dintr-o populaie
pentru care cunoatem frecvena teoretic p a unei variabile
calitative. Pentru aceeai variabil se calculeaz frecvena ei n
eantion f. Parametrul testului este:

EXEMPLU
Suntem interesai de investigarea prevalenei hepatitei B la
personalul care lucreaz n laboratoarele unor clinici de boli
infecioase din Transilvania.
Se tie din studii anterioare c prevalena hepatitei B n populaia
general din Transilvania este de 9%.
Un eantion de 100 de persoane care lucreaz n laboratoarele unor
spitale de boli infecioase din Transilvania s-a luat n studiu i s-a
obinut o prevalen a hepatitei B de 6%.
Exist diferen semnificativ ntre frecvena hepatitei B la
personalul care lucreaz n laboratoarele unor spitale de boli
infecioase din Transilvania fa de populaia general?

Soluie
Datele problemei: f = 0,06, p = 0,09, . Fie p0 prevalena (necunoscut)
a hepatitei B n populaia alctuit de personalul laboratoarelor
spitalelor de boli infecioase.
Ipotezele testului:
1. Test bilateral: H0: p0=p1 versus H1:p0<>p1
2. Test unilateral: H0: p0=p1 versus H1:p0>p1
Ipoteza nul: Nu exist diferen semnificativ ntre frecvena
hepatitei B la eantionul studiat fa de frecvena hepatitei B n
populaia general.

147
Ipoteza alternativ, test bilateral: Exist diferen semnificativ ntre
frecvena hepatitei B la nivelul eantionului i prevalena hepatitei B
n populaia general.
Ipoteza alternativ, test unilateral: Frecvena hepatitei B la nivelul
eantionului studiat este semnificativ mai mare fa de frecvena
hepatitei B n populaia general.
Statistica testului:

Pragul de semnificaie: = 0,05.


Regiunea critic:
1. Regiunea critic, test bilateral: (- , -1,96 ] [1,96 , ) (vezi anexa
1).
2. Regiunea critic, test unilateral: [1.645, ) ( vezi anexa 1).
Concluzie
1. Test bilateral: Deoarece parametrul statistic calculat al testului nu
aparine regiunii critice nu se poate nega ipoteza nul. Nu exist
diferen semnificativ ntre frecvena hepatitei B la eantionul
studiat fa de frecvena hepatitei B n populaia general.
2. Test unilateral: Deoarece parametrul statistic calculat al testului
nu aparine regiunii critice, nu se poate nega ipoteza nul. Nu exist
diferen semnificativ ntre frecvena hepatitei B la eantionul
studiat fa de frecvena hepatitei B n populaia general.

148

S-ar putea să vă placă și