Documente Academic
Documente Profesional
Documente Cultură
CURSUL III
STRUCTURA HARDWARE
Unitatea central
unitatea central de comand i prelucrare, numit i procesor
central,
unitatea de memorie operativ sau intern.
Procesorul este compus la rndul su din dou componente:
unitatea aritmetic i logic
unitatea de comand i control.
1
2
Unitatea central are legturi multiple cu toate unitile periferice, crora le
transmite comenzi i (sau) date i de la care primete date sau programe .
Unitatea de comand i control, coordoneaz activitatea sistemului de
calcul executnd comenzile pe care le primete.
Unitatea aritmetic i logic realizeaz cu viteze foarte mari operaiile
aritmetice curente precum i operaiile logice. Aceast unitate execut
aceste operaii conform regulilor aritmeticii binare i logicii bivalente.
Memoria intern
Unitatea de memorie operativ (intern sau central) este o
component a calculatorului n care n timpul funcionrii sale
acesta pstreaz instruciunile necesare execuiei unor programe i
(sau) date (rezultate) de regul frecvent accesate pe parcursul
rulrii lor.
Ea se caracterizeaz printr-o vitez mare de accesare n raport cu
memoria extern.
DISPOZITIVE PERIFERICE
Unitile periferice se mpart n dou categorii care nu sunt disjuncte:
uniti de intrare care "citesc" datele de pe diferite suporturi, le
transform n semnale electrice i le transmit unitii centrale;
uniti de ieire, care primesc rezultatele prelucrrilor intermediare
sau finale i le nregistreaz pe diferite suporturi (magnetic, hrtie,
ecrane electronice, etc.).
UNITATI PERIFERICE DE INTRARE
3
tastatura, pentru introducerea de date (text, numere) i pentru dialogul
utilizator - calculator
scanner-ul, pentru achiziia de imagini (fotografii, radiografii, etc.)
mouse-ul, pentru dialogul utilizator calculator,
joystick-ul, pentru dialogul utilizator calculator,
ecranul sensibil (touch screen), pentru dialogul utilizator calculator,
placa de captur video, pentru achiziia de imagini video,
placa de sunet, pentru achiziia de semnale sonore,
modem, pentru comunicarea n reea.
UN ITATI PERIFERICE DE IESIRE
4
Pe lng hardware (sau hard) un sistem de calcul posed i o colecie de
programe numit software (sau soft) care permit utilizarea sa eficient.
Un program este un set de instruciuni, care permit calculatorului s
efectueze o anumit sarcin sau prelucrare de date.
STRUCTURA SOFTWARE
Software:
De baza:
Sistemul de operare
Limbajele de programare
Auxiliar:
Programe utilitare
Aplicatii de birotica: procesare de text, calcul tabelar, bsze
de date
Apicatii de management, de proces, de control
STRUCTURA SOFTWARE
- In final, se verific dac instruciunea a fost corect executat i n caz
afirmativ se trece la alt instruciune, de regul instruciunea urmtoare.
Dac la verificare se constat erori, programul este ntrerupt i se
comand operaii de detectare a erorii.
5
SISTEMUL DE OPERARE
Sistemul de operare (SO) este o colecie de programe, permind
funcionarea unui calculator i avnd urmtoarele funciuni principale:
Gestiunea memoriei interne centrale
Gestiunea perifericelor i fiierelor,
Execuia programelor,
nlnuirea programelor,
Comunicarea ntre componentele calculatorului,
Comunicarea cu exteriorul (utilizatori, alte calculatoare, etc.)
CONCEPTUL DE FISIER
Fiierul este un concept de baz n informatic definit ca o colecie de sine
stttoare de nregistrri cu o anumit structur.
Acestea pot fi stocate pe un suport magnetic cum ar fi discurile n vederea
regsirii i citirii ulterioare a coninutului lor.
FISIERELE POT CONTINE
programe executabile, adic secvene de instruciuni n codul procesorului
i atunci se numesc fiiere executabile,
programe surs, adic secvene de instruciuni sau comenzi scrise ntr-un
limbaj de programare (Pascal, Basic, FORTRAN, C++, etc.) i atunci se
numesc fiiere surs,
secvene de comenzi ale sistemului de operare fiiere de comenzi,
colecii de date (text, numere, imagini, grafic, etc.) i atunci se numesc
fiiere de date.
ORGANIZAREA FISIERELOR
Modul de organizare pe un disc a fiierelor este gruparea lor n directoare
sau cataloage care sunt dispuse ntr-un arbore de directoare, adic ntr-o
structur ierarhic n care un director-printe poate s conin mai multe
directoare-fiu.
Cataloagele sau directoarele sunt o modalitate simpl de grupare a
fiierelor de acelai tip sau prezint o modalitate comod pentru
partajarea fiierelor ntre membrii unui grup de utilizatori care lucreaz pe
acelai sistem de calcul sau ntr-o reea de calculatoare (sharing).
SOFTWARE DE BAZA
Pe lng sistemul de operare o component important a software-ului
este alctuit din limbajele de programare sau mediile de programare
ce conin compilatoare, linkeditoare i interpretoare care permit
dezvoltarea de aplicaii i scrierea de programe.
Un limbaj de programare este o colecie de reguli (sintaxa limbajului)
care utilizeaz un set de cuvinte cheie (n englez) cu ajutorul crora
se pot descrie prin secvene de instruciuni scrise n acest limbaj
metodele de rezolvare (algoritmul) unor probleme de prelucrare de
date.
Acestea mpreun cu sistemul de operare alctuiesc software-ul de
baz al unui sistem de calcul.
6
Dintre limbajele cele mai cunoscute menionm:
FORTRAN, PASCAL, BASIC folosite de obicei pentru dezvoltarea
unor aplicaii bazate pe proceduri algoritmice implicnd calcule
bazate pe proceduri matematice,
C++, Java folosite pentru dezvoltarea de aplicaii bazate pe
programare obiectual;
SQL folosit pentru dezvoltarea de aplicaii n baze de date.
Medii de programare:
Borland Delphi, Microsoft Studio Net
Tot n software-ul de baz intr i driverele unitilor periferice (programe
care coordoneaz buna funcionare a unitilor periferice).
SOFTWARE APLICATIV
Programele sau coleciile de programe destinate unor aplicaii specifice
alctuiesc software-ul aplicativ:
editoarele de texte, (WORD, Latex, etc.)
tabelele de calcul, (EXCEL, LOTUS, etc.)
sistemele de gestiune a bazelor de date, (DBASE, FOXPRO,
ACCESS, Delphi)
editoarele grafice, (Paint, Corel Draw)
programele statistice, (EPIINFO, SPSS, STATISTICA)
programe pentru calcule matematice, (Mathematica, Mathlab)
programele de inteligen artificial (sistemele expert medicale),
(Internist, Cadiag)
sistemele de documentare automat, (Medline)
programele de prelucrare a imaginilor medicale (tomografice,
ecografice) etc.
CURSUL IV
7
In cadrul software-ului un rol esenial l are sistemul de operare care
gestioneaz resursele sistemului de calcul i permite dialogul cu
utilizatorul.
Pe lng sistemul de operare o component important a software-
ului este alctuit din limbajele de programare (compilatoare, link-
editoare, interpretoare) care permit dezvoltarea de aplicaii i
scrierea de programe. Acestea mpreun cu sistemul de operare
alctuiesc software-ul de baz al unui sistem de calcul.
Celelalte programe sau colecii de programe destinate unor aplicaii
specifice alctuiesc software-ul aplicativ
La comanda de rulare (execuie) a unui program (executabil), care
este o succesiune de instruciuni, pentru realizarea diferitelor
operaii (operaii aritmetice, logice, de intrare de date, de ieire de
date, etc.) necesare prelucrrii unor informaii,
se aduce n memoria operativ programul sau o parte a sa,
se transfer n unitatea de comand i control prima
instruciune a sa,
este descompus prima instruciune n prile sale
componente,
se comand unitii aritmetice sau logice, ori altei uniti a
sistemului de calcul, executarea operaiilor corespunztoare
(identificarea adreselor datelor care particip la operaie,
asigurarea transferrii acestor date dac e cazul, n unitatea
aritmetic i logic, transferarea rezultatelor n memorie etc.).
In final, se verific dac instruciunea a fost corect executat i n
caz afirmativ se trece la alt instruciune, de regul instruciunea
urmtoare.
Dac la verificare se constat erori, programul este ntrerupt i se
comand operaii de detectare a erorii.
SISTEMUL DE OPERARE
8
programe executabile, adic secvene de instruciuni n codul
procesorului i atunci se numesc fiiere executabile,
programe surs, adic secvene de instruciuni sau comenzi scrise
ntr-un limbaj de programare (Pascal, Basic, FORTRAN, C++, etc.) i
atunci se numesc fiiere surs,
secvene de comenzi ale sistemului de operare fiiere de comenzi,
colecii de date (text, numere, imagini, grafic, etc.) i atunci se
numesc fiiere de date.
ORGANIZAREA FISIERELOR
Modul de organizare pe un disc a fiierelor este gruparea lor n
directoare sau cataloage care sunt dispuse ntr-un arbore de
directoare, adic ntr-o structur ierarhic n care un director-printe
poate s conin mai multe directoare-fiu.
Cataloagele sau directoarele sunt o modalitate simpl de grupare a
fiierelor de acelai tip sau prezint o modalitate comod pentru
partajarea fiierelor ntre membrii unui grup de utilizatori care
lucreaz pe acelai sistem de calcul sau ntr-o reea de calculatoare
(sharing).
SOFTWARE DE BAZA
Pe lng sistemul de operare o component important a software-
ului este alctuit din limbajele de programare sau mediile de
programare ce conin compilatoare, linkeditoare i interpretoare care
permit dezvoltarea de aplicaii i scrierea de programe.
Un limbaj de programare este o colecie de reguli (sintaxa limbajului)
care utilizeaz un set de cuvinte cheie (n englez) cu ajutorul crora
se pot descrie prin secvene de instruciuni scrise n acest limbaj
metodele de rezolvare (algoritmul) unor probleme de prelucrare de
date.
date.
Acestea mpreun cu sistemul de operare alctuiesc software-ul de
baz al unui sistem de calcul.
Dintre limbajele cele mai cunoscute menionm:
FORTRAN, PASCAL, BASIC folosite de obicei pentru
dezvoltarea unor aplicaii bazate pe proceduri algoritmice
implicnd calcule bazate pe proceduri matematice,
C++, Java folosite pentru dezvoltarea de aplicaii bazate pe
programare obiectual;
SQL folosit pentru dezvoltarea de aplicaii n baze de date.
Medii de programare:
programare:
Borland Delphi, Microsoft Studio Net
Tot n software-ul de baz intr i driverele unitilor periferice
(programe care coordoneaz buna funcionare a unitilor periferice).
SOFTWARE APLICATIV
Programele sau coleciile de programe destinate unor aplicaii
specifice alctuiesc software-ul aplicativ:
aplicativ:
editoarele de texte, (WORD, Latex, etc.)
tabelele de calcul, (EXCEL, LOTUS, etc.)
9
sistemele de gestiune a bazelor de date, (DBASE, FOXPRO,
ACCESS, Delphi)
editoarele grafice, (Paint, Corel Draw)
programele statistice, (EPIINFO, SPSS, STATISTICA)
STATISTICA)
programe pentru calcule matematice, (Mathematica, Mathlab)
programele de inteligen artificial (sistemele expert
medicale), (Internist, Cadiag)
sistemele de documentare automat, (Medline)
programele de prelucrare a imaginilor medicale (tomografice,
(tomografice,
ecografice) etc.
CURSUL V
APLICATII DE BIROTICA SI BAZE DE DATE MEDICALE
Microsoft Word XP
WORD
3.1. Deschiderea unui document nou
Document nou
Document blanc
Template
Document vechi
10
3.2. Introducerea textelor
Cursor
Cuvint,
Linie,
Paragraf,
Pagina
11
3.3. Deplasarea n document
Cu mouse
Cu taste sageti
Cu Find si Goto din EDIT
Cu barele de deplasare
3.4. Prezentarea ferestrei n Word (Meniul View)
3.4.1. Forme de prezentare a unui document Word n fereastra de document
3.4.2.
3.4.2. Resetarea prezentrii ferestrei de document
3.5. Selectarea unei zone n document
cu mouse
cu Shift + taste de deplasare
cu Select All din EDIT
selectarea unei linii
selectarea unui paragraf
selectarea unui cuvint
3.6. Operaii de editare
3.6.1. Editarea punctual
inserari
stergeri
3.6.2. Editarea de zon
copieri
stergeri
3.6.3. Inserarea de obiecte
ecuatii
imagini
paginare
3.7. Operaii de prelucrare
3.7.1. Operaii de cutare i nlocuire
Find (EDIT)
Replace (EDIT)
3.7.2. Utilizarea referinelor ncruciate pentru realizarea unei bibliografii
3.7.3. Verificarea ortografic, gramatical i cutarea de sinonime
Spelling and Grammar (TOOLS)
Language - Thesaurus (TOOLS)
3.8. Formatarea documentelor de tip text 3.8.1. Formatarea caracterelor
Stil
Font
Dimensiune
3.8.2. Formatarea paragrafelor
alinierea
spatierea
indentarea
3.8.3. Formatarea paginii
3.8.4. Formatarea global a documentul ui
3.8.5. Formatarea figurilor i desenelor
12
3.9. Lucrul cu tabele n Word
Meniul
Meniul Table
Inserarea unui Tabel
Editarea
Formatarea
3.10. Meniul Windows
Arrange All
Split
Fereastra noua
Lista de documente
WORD APLICATII BIOMEDICALE
Corespondenta medicala
Publicatii medicale (brosuri, carti, articole)
Documente medicale sablon (retete, bilete de internare, externare)
Spreadsheet-ul EXCEL
EXCEL
Aplicaia Excel
Funciunile unei aplicaii de tip spreadsheet
Documentele Excel
Structura unui tabel de calcul
Lucrul cu agende si foi de calcul
Structura ferestrei Excel
Selectarea in foaia de calcul
Introducerea datelor
Editarea datelor
Legaturi intre agende
Formatarea
Diagrame
Sortare
Analiza datelor
Tiparirea
Funciunile unei aplicaii de tip spreadsheet
organizarea datelor in tabele
prelucrarea datelor
calcule cu datele din tabele
analiza datelor
reprezentarea grafica a datelor
DOCUMENTELE EXCEL
Structura documentului
Volume sau Agende (Workbook)
Foi de lucru (sheet)
13
Foi de calcul (Worksheet)
Foi de diagrame
Foi de rezultate
14
OPERATII IN AGENDE
Deplasarea in agenda
Trecerea la alta foaie
Deplasarea intr-o foaie
verticala si orizontala
cu tastele de deplasare
cu mouse-ul
cu barele de deplasare
Redenumirea foilor
Redenumirea agendelor
15
SELECTAREA IN FOAIA DE CALCUL
Tipuri de selectare
celula
zona conexa
zona neconexa
linie, coloana,
foaie
Tehnici de selectare
cu mouse
cu tasta Shift + taste de deplasare
cu butoane de selectie de coloana si linie
cu Select All din EDIT
prin comenzile Goto si Find din EDIT
prin numele simbolic al celulei sau zonei
INTRODUCEREA DATELOR
Date numerice
Date text
Date calendaristice
Formule
Umplerea unei zone cu acelasi continut
Umplerea unei zone cu o serie de valori
16
FORMULE
Sintaxa
Expresia
operatori aritmetici
operatori relationali
paranteze
operanzi
constante
referinte de celule
nume simbolice
nume de functii predefinite
FUNCTII PREDEFINITE
Referinta de functie
Clase de functii
statistice : AVERAGE, CORREL, COVAR, FREQUENCY, VAR,
STDEV, TTEST, ZTEST, MODE, MEDIAN, KURT, GEOMEAN,
HARMEAN, CONFIDENCE, PERCENTILE, SKEW
matematice:
matematice: SUM, ABS, RAND, LOG, LOG10, LN, EXP, SQRT,
SIN, COS, TAN, ATAN, ASIN, ACOS, COMBIN, FACT,
MDETERM, MINVERSE
logice:
financiare
tehnice
EDITAREA
Copierea
inserarea
stergerea
verificarea ortografica
cautarea si inlocuirea
FORMATAREA
Caracterelor
numerelor
redimensionari de linii, coloane
alinieri, borduri, colorari si hasuri
Autoformatare
DIAGRAME IN EXCEL
Tipuri
Cu coloane
cu bare
Pie
Line
Scatter (xy)
in 3-D
Variante
17
18
19
Elemente constitutive
Seria de date
Trendul
Bare de eroare
Etichete de date
Legenda
Casete de text
Axe
Aria de reprezentare
Aria diagramei
Fete laterale
Marcaje de date
Sageti si obiecte grafice
20
Crearea
Editarea
adaugarea de curbe de trend (liniare, logaritmice, exponentiale,
putere)
adaugarea de bare de eroare
Formatarea
21
ANALIZA DATELOR
Solver
Goal Seek
Data Analysis
ANOVA
Descriptive Statistics
T-test
Z-test
Correlation
Regression
Histogram
SORTAREA SI REGASIREA DATELOR
22
Funciile dosarului medical informatizat:
comunicare
individual permite luare de decizii
utilizate n grup permit: evaluarea, cercetarea i planificarea
Diferitele persoane din sistemul de ngrijire a sntii particip direct i
sunt interesate ca dosarul informatizat s fie adus n mod constant la zi
pentru a se putea lua decizii pe baza datelor coninute.
Pacientul nsui este interesat de calitatea datelor din dosar deoarece
acestea se propag n sistemul sanitar i l nsoesc n tot cursul ngrijirii
sale.
23
24
VIZIUNI DIFERITE ASUPRA DMI
FUNCTIILE DMI
Centralizarea datelor
evaluarea global a strii de sntate
25
ajutor n cercetarea clinic i epidemiologic
controlul gestiunii, planificare
Formarea i educarea
facilitatea utilizrii
structurarea demersului medical
legturi cu bazele de cunotine i de documentare medical
Securitate i protecie
securitatea crescut a informaiei
confidenialitate
DIFICULTATI DE IMPLEMENTARE A DMI
Informatizarea impune modelarea complex a datelor i cunotinelor
medicale, modelele iniiale care au copiat foile de observaie sau dovedit
inoperante.
Implic standardizarea limbajului medical.
Problemele umane n general au fost subestimate n toate abordrile unor
astfel de sisteme.
Costul crescut al materialului, soft-ului de gestiune a bazelor de date i de
lucru n reea.
Personalul care ar trebui s opereze, proiecteze i s realizeze astfel de
sisteme este insuficient
26
importanta fiecarei probleme (pozitia n ierarhie) si forteaza utilizatorul sa
adopte un demers sistematizat pe probleme.
probleme.
BAZE DE DATE
Funciunile unei aplicaii de tip baza de date
Ce este o baz de date?
Proiectarea unei baze de date ACCESS
Aplicatii n domeniul medical
CE ESTE O BAZA DE DATE?
CRITERII DE CLASIFICARE
Validare structurala
Simplitate
Neredondanta
Distribuire
Extensibilitate
Integritate
ACCESS-FUNCTIUNI
- Organizarea informatiilor ntr-un fiier baz de date (cu extensia .MDB )
Crearea unor uniti de memorare numite tabele. tabele.
Relaii intre tabele
Datele din tabele diferite pot fi regrupate, prezentate, editate i actualizate
prin anumite machete (forme(forme).).
- Cutarea i regsirea informaiilor se realizeaz cu ajutorul unor filtre.
filtre. Cu
ajutorul filtrelor se pot actualiza articolele bazei de date i se pot efectua calcule.
27
Analiza datelor, prezentarea i tiprirea lor n anumite structuri se
realizeaz cu ajutorul rapoartelor.
rapoartelor.
ACCESS
Obiecte (entiti) cu care lucreaz Access
tabele
filtre
rapoarte
machete
macrouri
module
evenimente
DATABASE WINDOW
In ACCESS pentru lucrul cu obiectele unei baze de date
date ACCESS se
poate utiliza Database Window,
Window, astfel:
Tables pentru tabelele existente,
Queries pentru filtre,
Forms pentru machete,
Reports pentru rapoarte,
Macros pentru macrouri,
Modules pentru module
28
CREAREA UNEI BAZE DE DATE
29
personalul medical care le realizeaz ntr-o unitate medical
investigaii
Utilizarea unui tabel separat pentru fiecare subiect permite ca datele s
poat fi memorate o singur dat, cu avantajele:
economie de spaiu de memorare
eficienta sporita in ncrcarea bazei, cutarea si regsirea
informaiilor
reducerea erorilor de introducere a datelor.
Tabelele organizeaz datele n:
coloane (numite cmpuri)
cmpuri) - cel mult 256
linii numite articole sau nregistrri
REGULI PENTRU TABELE
30
RELATII INTRE TABELE
RAPOARTE
31
Detail cuprinde elemente care definesc liniile tabelului ce vor alctui
corpul tabelului, cum ar fi cmpuri din tabele, sau formule de calcul.
Aceste linii se repeta pentru fiecare nregistrare activ din baza de date.
Page Footer permite includerea n raport a numrului de pagin.
Report Footer permite includerea n raport a unor informaii de sintez la
nivelul raportului. Informaia definit n aceast seciune va apare pe
ultima pagin a raportului nainte de tiprirea seciunii Page Footer.
ACCESS APLICATII
CURSUL VI
INFORMATICA MEDICALA
RETELE DE CALCULATOARE
32
Avantajul interconectrii const n partajarea datelor, fiierelor, a
programelor si a operaiilor.
Structura hardware presupune conectarea fizic a calculatoarelor
i este constituit din plci de reea, cabluri de fibr optic sau
linii telefonice precum i echipamente de interconectare: hub-uri.
Daca reeaua este de larg rspndire (WAN) sunt necesare i
alte componente: modemuri, repetoare, bridges, routere etc.
RETELE EXTINSE WAN
33
diferite, pot fi conectate, pot comunica i schimba informaii,
atta vreme ct respect protocolul.
FTP: Un program FTP al clientului contacteaz un server FTP i
solicit transferul unui fiier; serverul FTP rspunde expediind
clientului fiierul.
WWW: In acest caz software-ul clientului este un browser;
acesta solicit serverului coninutul unei pagini web, pe care-l
afieaz pe monitorul clientului
E-MAIL: Programul e-mail al clientului permite clientului
conectarea cu un server, in vederea accesrii - citirii sau
trimiterii - unui mesaj prin pot electronic.
TELNET
34
Furnizorul de servicii Internet (ISP) este o instituie care ofer
acces la Internet. Clienii si pot fi instituii, organizaii sau
persoane private. Acetia se pot lega la furnizor prin modem
(sistem shell) sau prin linii telefonice (sistem Point to Point
Protocol=PPP). n primul caz, cel conectat acceseaz Internetul
prin calculatorul gazd, care furnizeaz n ntregime software-ul
necesar, iar la o conectare PPP, utilizatorul trebuie s aib
instalat pe propriul calculator tot software ul necesar.
Un ISP mai poate oferi gzduirea unei pagini web i servicii legate
de denumiri de domenii. Taxele pentru astfel de servicii sunt
dependente de tipul conectrii i nivelul serviciilor oferite (de
exemplu cuantumul transferului de informaie).
ADRESE INTERNET
35
WHOIS
WHOIS este o baz de date interogabil despre informaii privind
reele, domenii situri. WHOIS ofer mijloace de identificare a
unor adrese e-mail cutate, eventual cu adresa potal, telefon,
fax legate de aceasta.
Baza de date poate fi accesat prin WWW sau prin adres e-
mail.
MOTOARELE DE CAUTARE
36
O adres IP este o grupare de patru numere (fiecare ntre 0 i
255) separate prin puncte.
Reeaua Internet utilizeaz adresele numerice pentru transmisia
de date.
Un sistem de eviden internaional urmrete att corespondena
ntre denumirile de domenii i adresele IP, ct i unicitatea
acestor adrese.
DESPRE WORLD WIDE WEB ( WWW)
37
Software-ul de cutare client, permite utilizatorilor s solicite
pagini Web de la un server HTTP i s vizualizeze aceste pagini
pe propriul calculator.
ADRESA IP
38
Exemplificnd cu mesajele de pot electronic, protocolul trebuie
s stabileasc att formatul mesajului ct i modul de transmitere
prin reea. Protocolul asigur c mesajul de pot electronic este
corect formatat i corect transmis de la calculatorul de origine la
destinatar.
Pentru diverse tipuri de servicii n reea exist diferite
protocoale. De exemplu Internetul, se bazeaz pe familia de
protocoale TCP/IP. Cteva din acestea sunt:
Simple Mail Transfer Protocol (SMTP) pentru a trimite i a primi
pot electronic
File Transfer Protocol (FTP) pentru a transfera fiiere ntre
calculatoare
Hypertext Transfer Protocol (HTTP) pentru transfer de
informaie pe WWW
Network News Transfer Protocol (NNTP) pentru a transmite
nouti de reea.
Protocoalele permit diferitelor tipuri de calculatoare (Macintosh,
PC, UNIX, VMS, etc.) s comunice ntre ele n pofida diferenelor
datorit formatului standard al comunicrii.
FTP
39
Pachetul este o unitate de date grupate, trimis ntr-o reea.
Datele se fragmenteaz n pachete nainte de a fi expediate prin
Internet. Tipurile de date care sunt transmise prin sistemul de
pachete sunt:
Mesaje e-mail
Fiiere transmise prin FTP (File Transfer Protocol)
Pagini web transmise prin WWW (World Wide Web)
TCP/IP
40
Utilizatorul supune interogrii baza de date adresnd ntrebri
formulate n sensul dac baza de date conine informaii care s
ndeplineasc criteriile specificate.
Aadar interfaa unui motor de cutare permite utilizatorului
scrierea ntr-un spaiu special a criteriilor de cutare. Motorul
retransmite utilizatorului o list a resurselor ce ndeplinesc
criteriile.
ntruct bazele de date ale diverselor motoare de cutare pot s
aib diferite surse de informaii, aceleai cerine de cutare
adresate diverselor motoare pot furniza rezultate diferite. Uneori
exist legturi automate ntre bazele de date ale diverselor
motoare de cutare.
BROWSER
NEWS
41
Network News (Noutile de reea) reprezint o modalitate de
informare pe categorii de subiecte denumite newsgroups (grup de
tiri).
Informaiile constituind tirile, sunt furnizate de persoane
interesate de subiect i sunt disponibilizate pentru a putea fi
citite i comentate.
Categoriile de grupe de tiri sunt organizate i structurate
ierarhic de la general la specific.
Comunicaiile n newsgroup se realizeaz prin protocolul NNTP,
(Network News Transfer Protocol) parte a familiei de protocoale
TCP/IP.
Acesta permite ca tirile dintr-un grup s circule prin Internet.
Principiul de lucru n newsgroup este client/server, respectiv
programul clientului permite conectarea serverului pentru accesarea
informaiilor i serviciilor.
Un server de tiri e un calculator dedicat stocrii articolelor unui
newsgroup.
Pentru a putea accesa serverul, calculatorul utilizatorului trebuie
s dispun de un program de citire, newsreader; acesta este o
interfa care permite utilizatorului s selecteze i s deschid
un anumit articol de pe server apoi eventual s rspund sau s
fac comentarii.
EMAIL
42
Modul de comunicare este de tip client/server, deci programul
client permite utilizatorului s contacteze serverul, s acceseze
informaia i serviciile de pe server.
Pentru a citi i a trimite scrisori, utilizatorul trebuie s acceseze
serverul pe care scrisorile sunt stocate.
Aplicaia client, este interfaa care permite utilizatorului s
citeasc, s rspund, s redirecioneze, s compun i s trimit
noi mesaje.
Un mesaj e-mail nu este limitat numai la text; i alte tipuri de
fiiere se pot ataa unui e-mail prin agrafare.
Fiierele agrafate (ataate) pot fi binare (numai text) sau pot fi
grafice.
Un protocol denumit MIME (Multipurpose Internet Mail Extensions)
permite calculatorului expeditor codificarea fiierelor non-text,
apoi decodarea lor de calculatorul receptor (destinatar).
MAILING LIST
CURSUL VII
INTRODUCERE IN BIOSTATISTICA
ELEMENTE DE BIOSTATISTICA
43
OBIECTIVELE STATISTICII
MULTIMI STATISTICE
=selectie
= o submultime finita a unei populatii statistice
Caracteristici
talia esantionului
esantion reprezentativ (prelevare aleatoare, cu o talie suficient de
mare)
esantion nereprezentativ sau cu bias
MOTIVELE FOLOSIRII ESANTIOANELOR
44
vi. Costul i resursele necesare (umane, materiale, etc.) pentru
observarea exhaustiv a unei populaii pot de asemenea s fie un motiv
pentru utilizarea eantioanelor.
VARIABILE
Caracteristica (variabila) - un atribut al unei populatii
Tipuri de variabile
calitative (sexul, tipul rasial)
cantitative
discrete
discrete
continue
semicantitative
45
Inconveniente ale seriei statistice:
Ansamblul informaiei cuprinse n seria statistica este, n
general, cu att mai neclar cu ct numrul datelor este mai
mare. Este frecvent preferabil organizarea acestor date i
reprezentarea lor ntr-o form mai concis.
Ansamblul datelor seriei se preteaz destul de greu la la
comparri directe, n acest scop fiind necesar o
transformare a lor.
Aceste inconveniente parial pot fi remediate, n dou moduri:
i) organiznd i reprezentnd datele
ii) calculnd anumii indicatori statistici sintetici ai seriei (sau distribuiei) de
date brute
46
cu doua coloane
cu subclasificari
master
47
Titlul tabelului trebuie s fie clar, concis i la subiect. El trebuie s
rspund la ntrebrile: ce ? cnd cnd ? unde ?
Totalul trebuie s apar n orice tabel (sau linii ori coloane de sintez ).
Titlul este de obicei separat de corpul tabelului prin linii i spaii.
Dac datele nu sunt originale trebuie s se menioneze sursa lor ntr-o
not de subsol.
Tabele ce conin distribuii de frecvene
O modalitate comod de a prezenta o mulime de date brute este:
i) se ordoneaza datele in ordine crescatoare,
ii) se determine frecvena fiecrei valori,
iii) se includ valorile distincte si frecventele intr-un tabel pe dou coloane.
TAD n mm Hg Nr. bolnavi (frecvena absolut)
40 2
50 3
60 5
70 8
80 13
90 17
100 20
110 13
120 15
130 4
Total 100
FRECVENTE
FRECVENTE
Frecventa absoluta u(x) a unei valori x
Frecvena relativ f(x) a unei valori x este raportul dintre frecvena
absolut u(x) i efectivul total al seriei n: f(x) = u(x)/n.
Frecvena relativ se prezint uneori n procente.
Alte tipuri de frecvene:
frecvene:
frecvena absolut cumulat cresctoare asociat unei valori
x - suma frecvenelor absolute ale tuturor valorilor seriei care
sunt mai mici sau egale dect x (FACC)
frecvena absolut cumulat descresctoare asociat unei
valori x - suma frecvenelor absolute ale tuturor valorilor
seriei care sunt mai mari sau egale dect x. (FACD)
Analog se definesc i frecvenele relative cumulate. (FRACC, FRACD)
Se pot alctui tabele de frecvene cu mai multe coloane care s cuprind:
valorile distincte
frecventele
frecventele absolute
frecvenele relative
frecvenele relative cumulate.
Programul statistic EPIINFO, prin comanda FREQ din componenta
ANALYSIS.
Programul Excel, functia FREQUENCY
Tabelul claselor de frecvene
48
se descompune seria n clase prin mprirea ntinderii ei n
intervale de clas
se determina numrul de valori care intr n fiecare clas
CURSUL VIII
INFORMATICA MEDICALA
STATISTICA DESCRIPTIVA
METODE DESCRIPTIVE
49
PREVALENTA
50
Sensibilitatea = persoane bolnave diagnosticate pozitiv / numar total de
persoane bolnave = 154/379 = 40,6%
Specificitatea = persoane sanatoase dignosticate negativ / numar de persoane
sanatoase = 23362 / 23724 = 98,5%
51
RATE
Nu se suprapune notiunea cu cea de proportie
Rata poate trece de 100%
Rata schimbarii = (valoare noua-valoare veche)/valoare veche x 100
REPREZENTARI GRAFICE
MORBIDITATE, MORTALITATE
52
Incidenta = numar de persoane care fac o anumita afectiune intr-o perioada
de timp / numar de persoane neafectate la inceputul studiului care au fost
urmarite pe perioada respectiva
RAPOARTE
MEDIA
Media aritmetic este o msur a valorii centrale a setului de date n jurul
creia fluctueaz datele setului. Media nu d nici o indicaie asupra gradului
de fluctuaie (de abatere) de la medie, adic asupra a ceea ce se numete
frecvent dispersia datelor.
Media aritmetic a seriei de date (reprezentnd o statistic)
X1, X2, ..., Xn
asociate unui eantion se determin prin formula:
unde N este talia populaiei iar suma cuprinde toate elementele populaiei.
53
unde prin Fi, Ci s-au notat frecvena respectiv centrul clasei Ki (i=1,2,...,m).
EXEMPLU 1
54
EXEMPLU 2
CONCLUZIE
MEDIANA
Mediana este o valoare astfel nct jumtate dintre observaii i sunt
inferioare (sau egale) i cealalt jumtate superioare (sau egale).
Procedura de calcul a medianei urmeaz urmtorii pai:
Se ordoneaz datele seriei n ordine cresctoare.
Se localizeaz poziia medianei n acest ir i se determin valoarea ei.
Dac volumul n al seriei este impar, atunci mediana este dat prin
formula
EXEMPLU
55
MODULUL
Modul (sau valoarea modal) sau dominanta unei serii statistice este o
valoare care are cea mai mare frecven din serie.
Dac seria statistic este prezentat sub forma unei tabele de clase
frecvene, modul corespunde centrului clasei de frecven maxim.
Se vorbete de o distribuie de frecvene unimodal dac tabela de frecvene
are un singur maxim i de o distribuie de frecvene multimodal dac are
mai multe maxime.
Din punct de vedere grafic modul reprezint abscisa creia i corespunde
ordonata maxim.
56
Notnd cu a valoarea din seria de date cu proprietatea c o proporie egal
cu a din date sunt mai mici sau egale a iar celelalte sunt mai mari,
atunci a reprezint percentila de ordinul a.
cvartilele sunt percentilele 0.25 , 0.5 , 0.75
decilele sunt percentilele 0.1 , 0.2 ,...,0.9 .
MASURI DE DISPERSIE
descriu variabilitatea (fluctuaia) sau dispersia datelor seriei i joac un rol
important din urmtoarele puncte de vedere:
Msurile de dispersie ofer informaii privind extinderea mprtierii
datelor sau, reciproc, a gradului lor de aglomerare (ngrmdire sau
apropiere).
Msurile de dispersie sunt utile n stabilirea reprezentativitii
msurilor de centralitate. Semnificaia unei medii ca i valoare
reprezentativ pentru un set de date depinde de gradul de dispersie a
valorilor individuale n jurul ei.
Msurile de dispersie joac un rol important n estimarea parametrilor
statistici i n inferena statistic.
57
AMPLITUDINEA
58
VARIATIA
unde prin Fi, Ci s-au notat frecvena respectiv centrul clasei Ki (i=1,2,...,m).
59
ABATEREA STANDARD
COEFICIENTUL DE VARIATIE
=CV este, pentru datele de tip raie, o msur relativ a dispersiei datelor. El este
egal cu raportul dintre ecartul tip i media seriei:
60
In utilizarea coeficientului de variaie la studiul omogenitii unor populaii se
pot utiliza urmtoarele reguli empirice:
dac CV este sub 10% atunci populaia poate fi considerat omogen;
dac CV este ntre 10%-20% atunci populaia poate fi considerat
relativ omogen;
dac CV este ntre 20%-30% atunci populaia poate fi considerat
relativ heterogen;
dac CV este peste 30% atunci populaia poate fi considerat
heterogen.
EROAREA STANDARD
61
Momentul de ordinul trei se exprim cu ajutorul unitilor de msur
ale datelor ceea ce permite greu compararea a ordinelor de mrime a
asimetriei pentru dou distribuii.
Variaia unei distribuii date ridic, de asemenea, o problem deoarece
pentru dou distribuii avnd aceiai form, ordinul de mrime al
momentului de ordinul trei M3 crete odat cu variaia.
Pentru a elimina aceste dezavantaje momentul de ordinul trei este
standardizat prin mprirea cu cubul abaterii standard
BOLTIREA KURTOSIS
Excesul sau boltirea (n englez kurtosis) este o msur a formei unei serii sau
distribuii de date, care msoar nlimea aplatizrii/boltirii unei distribuii n
comparaie cu o distribuie normal. Aceast msur este definit prin:
62
Excesul 4 este zero pentru o serie de date avnd o distribuie normal,
este pozitiv pentru o serie de date avnd trena mai nalt dect cea a unei
distribuii normale (cu media i variaia S2)
este negativ pentru o serie de date a crei tren este mai cobort dect cea
a unei distribuii normale
trena se apropie mai ncet (4 >0) sau mai rapid (4 <0) de zero dect cea a
distribuiei normale).
CURSUL IX
INFORMATICA MEDICALA
PREAMBUL
63
abuzul de medicamente (n care tratamentul a devenit o problem n loc de
soluie sale), i a rmne o treime se ncadreaz ntr-un "totul altceva", care
include manifestrile HTA, probleme la nivelul articulaiilor cervical sau la nivelul
maxilarului, afectiuni ale sinusurilor, tumori, etc.
Deci, nainte de a vedea cu pacientul suntem deja capabili s identificm cele
mai probabile dou diagnostice i s atribuim o probabilitate iniial pentru
fiecare.
n momentele ulterioare, n funcie de anamnez, de examinare i testele
suplimentare (dac este necesar) fiecare dintre probabiliti va suferi o serie de
modificri n jos sau n sus. Medicul individualizeaz ntrebrile puse i
elementele examinate n aa fel nct rezultatul fiecare interogri foreaz un
diagnostic sau altul de a fi mai probabil. Astfel, diagnoza este un proces dinamic
i secvential.
S presupunem c la un anumit moment am finalizat procesul de diagnosticare
pentru un pacient. Pn la sfritul procesului de diagnosticare medicul ar trebui
s aib un diagnostic 100% probabil, dar n multe cazuri, diagnosticul de lucru
(alegerea numarul unu) poate avea probabilitatea de doar 70% - 80%.
Cnd un diagnostic nu este 100% probabil, la momentul iniial de evaluare, se
urmrete evoluia simptomatologiei pacientului n timp pentru revizuirea
probabiliti de diagnostic. n cazurile care implic incertitudine chiar i
elaborarea listei de diagnostice probabile cu un numr mic de alternative
concrete permite medicului evaluarea opiunilor rezonabile s aleag
diagnosticul corect.
Una din teoriile moderne asupra etiologiei cancerului mamar stipuleaz c
femeile care nasc dup 30 de ani au un risc crescut de a dezvolta aceast
maladie comparativ cu cele care nasc nainte de 20 de ani.
Deoarece femeile din clasele superioare ale societii tind s aib copii aceast
teorie explic de ce aceast form de cancer este mai rspdit printre ele.
Pentru a testa aceast ipotez putem imagina un stidiu n care din 2000 de
femei cu vrste cuprinse ntre 45 i 54 de ani 1000 au avut primul copil nainte de
20 de ani iar restul peste 30 de ani. Urmrim lotul timp de 5 ani i observm c
din primul grup 4 dezvolt cancer de sn iar din al doilea grup 5.
Avem suficiente dovezi ca s susinem teoria de mai sus ? Nu prea
Dar dac am fi pornit studiul cu 20000 de femei si am fi avut 40 de cazuri n
primul grup i 50 de cazuri n al doilea grup ? Aparent sunt mai multe cazuri dar
parc proporiile sunt aceleai.
64
65
OBIECTIVELE CURSULUI
Definiii:
Experiment aleator
Definiia clasic a probabilitii
Spaiul fundamental de evenimente
Definiia axiomatic a probabilitii
Probabiliti condiionate:
Definiii
Prevalenta
Sensibilitate, specificitate
VPP, VPN
Curba ROC
Teorema lui Bayes
Independena a dou evenimente
EXPERIMENT ALEATOR
Teoria probabilitilor are ca obiect de studiu legile care se manifest n
domeniul fenomenelor ntmpltoare cu caracter de mas care pot apare
n diverse arii de interes (natur, societate, biologie, medicin etc.).
Teoria probabilitilor folosete o serie de concepte fundamentale cum
sunt: experimentul,
experimentul, proba, evenimentul i probabilitatea.
probabilitatea.
Prin experiment aleator se nelege realizarea practic a unui complex de
condiii corespunztoare unui criteriu de cercetare al diferitelor colectiviti
(populaii), care aplicat unei entiti a colectivitii are un rezultat
ntmpltor.
66
Un experiment poate fi definit i ca un proces de colectare a datelor dintr-
o populaie.
67
Astfel, dac ncercrile constau n determinarea grupei sangvine,
rezultatele posibile fiind: A, B, AB, O, acestea nu sunt echiprobabile.
Acesta este motivul pentru care este necesar o abordare mai general a
noiunii de probabilitate printr-o introducere axiomatic a acestei noiuni.
WIKI.......
Cuvntul axiom este un cuvnt provenit din limba greac veche n care
(axioma
(axioma),
), nseamn: "care este socotit demn sau convenabil" sau
"care este considerat evident prin sine nsui/de la sine",
sine", opinie,
opinie, tez
admis.
admis. Iniial, axiomele au fost propoziii (enunuri) al cror adevr era
socotit evident, adevr care i avea originea n practic. Pentru unii
filosofi greci din antichitate,
antichitate, reprezenta o afirmaie considerat ca fiind
evident, i care nu mai trebuia dovedit. Cuvntul provine din
(axioein),
axioein), care nseamn "a considera demn", demn", care, la rndul su, provine
din (axios
(axios),
), care nseamn "demn".
"demn".
O dat cu evoluia tiinelor,
tiinelor, termenul axiom a ncetat s mai evoce
ideea de adevr evident din punct de vedere intuitiv, devenind o
propoziie,
propoziie, care mpreun cu alte propoziii fixate ale unui sistem
axiomatic,
axiomatic, permite deducerea teoremelor unei anumite teorii. teorii.
Astzi, se accept n general urmtoarele interpretri ale noiunii:
O propoziie,
propoziie, regul,
regul, lege,
lege, principiu ori maxim care este general
acceptat/ fie datorit valorii coninute n formularea sa, merit intrinsec al
coninutului su ori datorit evidenei sale necondiionate. Astfel, n
viziunea unor gnditori, precum Francisc Bacon i Immanuel Kant, se pot
detaa vizibile nuane de interpretare.
n viziunea lui Bacon (Francisc
(Francisc Bacon),
Bacon), axioma este o regul
empiric i/sau o generalizare bazat pe experien.
n viziunea lui Kant (Immanuel
(Immanuel Kant),
Kant), axioma este o propoziie
intermediar sintetic (n sensul de a fi sinteza mai multor opinii),
ce trebuie s fie considerat a priori discursului referitor la o
anumit tem.
n sens mult mai larg tiinific, axioma este o afirmaie de sine
stttoare referitoare la nite termeni iniiali sau la nite concepte de
baz, ce nu sunt i/sau nu pot fi definibili/e.
SPATIUL FUNDAMENTAL DE EVENIMENTE
68
fundamental (spaiul evenimentelor elementare). Spaiul fundamental
poate s fie finit sau infinit.
Astfel c, o submulime A a lui E se numete eveniment,
eveniment, iar dac A are un
singur element din E el este un eveniment elementar.
Orice eveniment a crui realizare depinde de cel puin dou evenimente
evenimente
elementare este un eveniment compus.
compus.
Mulimea vid i mulimea fundamental E sunt i ele evenimente, i
anume, evenimentul imposibil () i respectiv evenimentul cert (E).
Evenimentul sigur se produce cu certitudine la orice efectuare a
experimentului, iar evenimentul imposibil este nerealizabil n urma
efecturii experimentului.
In mod asemntor cu operaiile de reuniune i intersecie cu mulimi se
definesc operaii similare cu evenimente. Astfel fiind date dou
evenimente A i B, reuniunea lor C=AB este un eveniment care are loc
dac cel puin unul dintre evenimentele A sau B are loc, i intersecia
D=AB este evenimentul care are loc numai cnd A i B au loc simultan.
Prin contrarul (complementarul) unui eveniment A se nelege un
eveniment care se realizeaz ori de cte ori nu se realizeaz A. Acesta se
noteaz prin non A (sau C(A) ori ).
Dac dou evenimente A i B sunt disjuncte ( A B = ), adic dac nu
se pot realiza simultan, se spune c ele sunt incompatibile. Dou
evenimente A i B care se pot realiza simultan se numesc compatibile.
compatibile.
Evenimentul A implic evenimentul B i se noteaz prin AB, dac
evenimentul B se produce ori de cte ori se produce A.
69
Experimentul H const n determinarea grupei sangvine.
In acest caz spaiul fundamental este E = {A, B, AB, 0}. E este
evident finit
Astfel, dac ncercrile constau n determinarea grupei sangvine,
rezultatele posibile fiind: A, B, AB, O, acestea nu sunt echiprobabile.
70
In acest caz, spaiul fundamental este o mulime infinit i
nenumrabil.
Experimentul H const n msurarea tensiunii arteriale sistolice
(TAS).
Spaiul fundamental E este alctuit din toate valorile posibile ale
TAS, astfel putem considera c E este inclus n intervalul [0, ).
In acest caz, de asemenea, spaiul fundamental este o mulime
infinit i nenumrabil.
DEFINITIA AXIOMATICA
EXEMPLU
Exemplu 1: (Hipertensiune
(Hipertensiune))
Fie A evenimentul ca o persoan s aib tensiune arterial
diastolic normal (TAD) adic TAD <90.
Fie B evenimentul ca o persoan s aib TAD la limit, adic 90
TAD < 95.
Presupunem c Pr(A) = 0.7, Pr(B) = 0.1 .
Fie C evenimentul c o persoan are TAD < 100.
Evident C=AB i AB=.
71
Pr(C) =Pr(A) + Pr(B) = 0,8
Exemplu 2: (Hipertensiune
(Hipertensiune))
Fie C evenimentul ca o persoan s aib tensiune arterial
diastolic crescuta (TAD) adic TAD >= 90
Fie D evenimentul ca o persoan s aib TAD normala sau la
limit, adic 70 TAD < 95.
Evenimentele C si D nu sunt mutual exclusive
DEFINITIA AXIOMATICA
O modalitate de a defini n mod concret funcia de probabilitate este cu ajutorul unei msuri
definite pe spaiul fundamental E, adic:
unde m:P(E) [0,) este o funcie msur. In particular , cnd spaiul fundamental este finit,
pentru un eveniment A, m(A) se poate defini ca fiind numrul elementelor lui A. In acest caz
definiia precedent a probabilitii coincide cu cea introdus n seciunea 2.
T1. Dac A1, A2, ..., An sunt evenimente incompatibile dou cte dou atunci:
72
(2) Pr(AB) = Pr(B-A) + Pr(B).
Obiectivele cursului
Experiment aleator
Definiia clasic a probabilitii
Spaiul fundamental de evenimente
Definiia axiomatic a probabilitii
Probabiliti condiionate
Prevalenta
Sensibilitate, specificitate
VPP, VPN
Curba ROC
Teorema lui Bayes
Independena a dou evenimente
73
Pr(AB) Pr(A) x Pr(B).
Au loc urmtoarele proprieti privind probabilitile condiionate:
Dac A i B sunt evenimente independente, atunci Pr(B|A) =Pr(B)
Dac A i B sunt evenimente dependente, atunci Pr(B|A) Pr(B) i
Pr(AB)Pr(A) x Pr(B).
MULTIPLICAREA PROBABILITATILOR
74
probabilitatea de a se realiza evenimentul A dac n prealabil s-a realizat
evenimentul B.
Prin definiie:
Sau
Respectiv
RISCUL RELATIV
75
Din 10 femei cu mamografii pozitive 1 va dezvolta cancer de san in
urmatorii 2 ani Care este RR de a dezvolta cancer de san in urmatorii 2
ani dupa o mamografie pozitiva?
RR = Pr(BA) / Pr(Bnon A) = 0,1 / 0,0002 = 500
EXEMPLUL 2
EXEMPLUL 2
Doua laboratoare testeaza suspectii de HIV:
Laboratorul A diagnosticheaza pozitiv 10% din pacienti
Laboratorul B diagnosticheaza pozitiv 17% din pacienti
8% din pacienti sunt diagnosticati pozitiv de ambele laboratoare
Care este probabilitatea ca laboratorul B sa puna un diagnostic pozitiv
daca laboratorul A a pus un diagnostic pozitiv?
Pr(BA) = Pr (B A) / Pr (A)
Pr(BA) = 0,08 / 0,1 = 0,8
EXEMPLUL 2
Doua laboratoare testeaza suspectii de HIV:
Laboratorul A diagnosticheaza pozitiv 10% din pacienti
Laboratorul B diagnosticheaza pozitiv 17% din pacienti
8% din pacienti sunt diagnosticati pozitiv de ambele laboratoare
Care este probabilitatea conditionata ca laboratorul B sa puna un
diagnostic pozitiv daca laboratorul A a pus un diagnostic negativ?
Pr(Bnon A) = Pr (B non A) / Pr (non A)
Pr (non A) = 1 - Pr (A) = 1 0,1= 0,9
Pr (B) = Pr (B non A) + Pr (B A) (laboratorul 2 diagnosticheaza pozitiv
si din cei diagnosticati pozitiv si din cei negativi de la A)
Pr (B non A) = Pr (B) - Pr (B A) = 0,17- 0,08 = 0,09
Pr(Bnon A) = 0,09 / 0,9 = 0,1
EXEMPLUL 2
76
8% din pacienti sunt diagnosticati pozitiv de ambele laboratoare
Care este riscul relativ B la A? Interpretati.
RR = Pr(BA) / Pr(Bnon A)
RR = 0,8 / 0,1 = 8
Un pacient diagnosticat pozitiv de laboratorul A are de 8 ori mai multe
sanse sa fie diagnosticat pozitiv de laboratorul B decat unul care a fost
diagnosticat negativ de laboratorul A
EXEMPLUL 1
77
S presupunem c populaia creia i s-a aplicat testul are n persoane i s-au
obinut urmtoarele rezultate:
PREVALENTA AFECTIUNII
SENSIBILITATEA TESTULUI
78
SPECIFICITATEA TESTULUI
79
VALOAREA PREDICTIVA NEGATIVA VPN
RAPORTUL DE ASEMANARE
80
Se msoar GOT la 94 de pacieni cu dureri toracice. Ne intereseaz
numrul de infarcturi miocardice aprute la acest eantion
Se=25/48=52,1%
Sp=42/46=91,3%
EXEMPLU
CURBA ROC
Receiving-Operating Characteristic = reprezentarea grafic a valorii
informaionale a unui test fa de un diagnostic n domeniul [Se, 1-Sp] atunci
cnd variaz pragul ales
81
CURBA ROC GENERALIZATA
82
i se deduce formula lui BAYES:
Dar fiindc
Pr(B) = Pr((BnonA) (BA)) =Pr(BnonA) + Pr(BA),
aplicnd formula probabilitilor condiionate se obine:
Pr(B)=Pr(B|A) Pr(A) + Pr(B|nonA) Pr(nonA).
De aici rezult urmtoarea form a formulei lui Bayes:
83
EXEMPLUL 1
Se tie c 60% din populaia dintr-o ar triete n mediul urban, 20% din
populaie este alergic i 55% dintre alergici triesc n mediul urban. Care
este probabilitatea ca alegnd la ntmplare un locuitor din mediul urban
el s fie alergic?
Fie A evenimentul ca o persoan s fie alergic, iar U evenimentul ca o
persoan s locuiasc n mediul urban. Atunci probabilitatea cutat este:
EXEMPLUL 2
VARIABILE ALEATOARE
DEFINITIE
Se numete variabil aleatoare pe un spaiu fundamental E i se
noteaz prin X, o funcie definit pe E cu valori n mulimea
numerelor reale.
Unei variabile aleatoare X i se pot asocia diferite probabiliti cu care
aceast variabil aleatoare poate lua anumite valori, ca de exemplu:
Pr( X = a) - probabilitatea ca X s ia valoarea a;
Pr( a X b ) - probabilitatea ca X s ia o valoare n intervalul
[a,b].
O variabil aleatoare se numete discret dac ea poate lua un numr finit sau
cel mult numrabil de valori.
84
EXEMPLE
Numrul de internri ntr-un spital ntr-un interval de timp dat
X{=0,1,2,...,n,...
{=0,1,2,...,n,...}. Aceasta este o variabil aleatoare discret infinit.
Numrul de bacterii ntr-un mililitru de ap X{=0,1,2,...,n,...
{=0,1,2,...,n,...}.
Numrul de indivizi cu RH-negativ dintr-un grup de n persoane luate la
ntmplare X{=0,1,2,...,n
{=0,1,2,...,n}. Aceasta este o variabil aleatoare discret
finit
Numrul de prezentari la medic pentru otita in primii doi ani de viata.
Aceasta este o variabil aleatoare discret infinit care poate avea valorile
0,1,2,...
DEFINITIE
O variabil aleatoare este continu atunci cnd variaz n mod continuu ntr-un
interval i poate lua o mulime nenumrabil de valori.
EXEMPLE
temperatura corporal,
concentraia unei substane n snge,
capacitatea pulmonar, etc.
EXEMPLE
Probabilitatea de apariie a uneia dintre feele {1,2,3,4,5,6} ale unui zar este 1/6.
In acest caz avem variabila aleatoare:
85
Pentru c probabilitatea p(x) este constant oricare ar fi x se spune c distribuia
lui X1 este uniform
EXEMPLU
Probabilitatea ca tratamentul antihipertensiv sa aduca sub control un numar de
pacienti din 4 are distributia din tabelul de mai jos:
EXEMPLU
Intr-un studiu s-a urmarit frecventa cu care un tratament antihipertensiv aduce
sub control un numar de pacienti din 4 pentru 100 de medici
86
M(X)=0x0,008+1x0,076+2x0,265+3x0,411+4x0,240
M(X)=2,8
Ne vom astepta la o medie de 2,8 din cei 4 hipertensivi a caror afectiune sa
poata fi controlata
EXEMPLU
M(X)=0x0,129+1x0,264+2x0,271+3x0,185+4x0, 095+5x0,039+6x0,017
M(X)=2,038
Ne vom astepta la o medie de 2,038 episoade de otita la un copil in primii doi ani
de viata
EXEMPLU
Numarul de episoade de otita in primii doi ani de viata:
87
V(X)=6,12
=1,402
Aproximativ 95% din distributia de probabilitate este cuprinsa in medie +/- 2
(1,96 ) Numarul de episoade de otita in primii doi ani de viata: 2,038 2,8
(corectat 0-4)
DISTRIBUTIA CUMULATA
88
In baza proprietilor mediei i abaterii standard, se poate arta uor c variabila
aleatoare centrat redus are media M(Y) =0 i abaterea standard (Y)=1.
CAZUL DISCRET
CAZUL CONTINUU
f(x) 0, xR
89
iar variaia lui X
LEGI DE DISTRIBUTIE
(Principalele distributii de probabilitate)
INTRODUCERE
90
EXEMPLE
91
LEGEA NORMALA REDUSA
92
LEGEA BINOMIALA SAU DISTRIBUTIA LUI BERNOULLI
93
COMPORTAREA LA LIMITA A LEGII BINOMIALE CAND n ESTE MARE
Se poate arta c atunci cnd np 10 i nq 10, distribuia variabilei binomiale
X (frecvena absolut a succeselor) tinde s se apropie de o lege normal
EXEMPLE
94
Modelul acestei variabile aleatoare presupune c sunt ndeplinite
urmtoarele condiii:
numrul de realizri ale evenimentului ntr-un interval este
independent de numrul de realizri n orice alt interval (repartiie
aleatoare n timp sau spaiu),
numrul ateptat de realizri ntr-un interval este proporional cu
dimensiunea sa i nu depinde de poziia sa n timp sau spaiu,
ntr-un interval suficient de mic probabilitatea de a observa mai mult
de o realizare a evenimentului este neglijabil n raport cu
probabilitatea de a observa una singur (nesimultaneitatea
realizrii a dou evenimente n timp sau spaiu).
Aceast variabil aleatoare X este caracterizat de un parametru care
reprezint numrul mediu teoretic (ateptat) de realizri ale evenimentului n
intervalul considerat i are urmtoarea lege de distribuie:
EXEMPLE
Rata de mortalitate pentru o anumit boal este de 7 la 1000 de cazuri.
Care este probabilitatea ca ntr-un grup de 400 de persoane aceast
boal s cauzeze 5 decese?
Rspuns: Avem p =7/1000=0.007, m = np = 400 x 0.007= 2.8
95
Rata de mortalitate pentru o anumit boal este de 10 la 1000 de cazuri.
Care este probabilitatea de a avea mai puin de 7 decese ntr-un grup de
500 persoane? Care este probabilitatea de a avea 7 sau mai multe
decese ntr-un grup de 500 persoane?
Rspuns: Avem
p =10/1000=0.01, m = np = 500 x 0.01= 5
Probabilitatea de a avea mai puin de 7 decese este:
LEGEA STUDENT T
96
Variabila aleatoare Student t este o variabil aleatoare continu care ia
valori n intervalul (- , + ), a crei funcie densitate de probabilitate
depinde de un singur parametru, numrul de grade de libertate.
Fie X0, X1, , Xn variabile aleatoare independente care toate urmeaz
legea normal centrat redus. Atunci variabila aleatoare
97
Densitatea de probabilitate a legii 2 este
LEGEA F (FISHER)
Distribuia F introdus de R. A. Fisher, este definit pe intervalul [0,+) i
descrie comportarea ctului a dou variabile cu distribuie Hi-ptrat,
fiecare fiind mprit prin numrul gradelor sale de libertate.
Un membru al acestei clase de distribuii este determinat prin numrul de
grade de libertate ale numrtorului dn i respectiv numrul de grade de
libertate ale numitorului dm, distribuiile F distincte fiind determinate de
perechi (dn, dm) distincte.
In general, pentru dn i dm > 2 distribuia F este unimodal i pozitiv
asimetric. Atunci cnd numrul gradelor de libertate crete distribuia F
se apropie pe domeniul su de definiie de o distribuie normal.
Aceast distribuie este utilizat n testele de comparaie a variaiilor i ca
aplicaie a acestora n testele ANOVA.
CURSUL XI
INFORMATICA MEDICALA
ESTIMARI , FLUCTUATII
PROBABILITATI
98
Probabilitatea poate fi privit ca o msur a capacitii eantionului
analizat de a estima caracteristica unei populaii
EXEMPLU : DISTRIBUTIA GREUTATII
Media = 69, s = 3
68,26% = 66-72 (168-183)
p=0,68
Mai mare de 78 (198)
P=0,0013
PRINCIPII GENERALE
99
Cazul unei variabile X calitative
Frecvena teoretic p a variabilei X n populaia P este necunoscut.
Din populaia P se extrage la ntmplare eantionul E reprezentativ.
In eantionul E pentru variabila X se observ o frecven f.
Se ncearc s se estimeze valoarea necunoscut a lui p cu ajutorul lui f
observat.
observat.
100
Din populaia P se extrage la ntmplare eantionul E
reprezentativ.
In eantionul E pentru variabila X se observ o medie m i o
variaie s2.
Se ncearc s se estimeze valorile necunoscute ale lui i
2 cu ajutorul lui m i s2 observate.
101
Estimatorul unui parametru este o funcie depinznd de observaiile efectuate pe
un eantion extras la ntmplare care furnizeaz o valoare aleatoare numit
estimarea punctual a parametrului.
Dac eantionul E are valorile x1,...,xn pentru caracteristica studiat, estimatorul
mediei aritmetice a unei populaii P este m = (x1+x2+...+xn)/n
ESTIMAREA PUNCTUALA
P1. Sperana matematic a mediilor observate, m, pe eantioane extrase aleator este egal
cu media teoretic a populaiei din care sau extras eantioanele, medie considerat
pentru valorile unei variabile cantitative luat n studiu: M(m) = .
102
P2. Sperana matematic a frecvenelor observate, f, pe eantioane extrase aleator este
egal cu frecvena teoretic p a populaiei din care sau extras eantioanele, frecven
considerat pentru valorile unei variabile calitative luat n studiu: M(f) = p.
CONCLUZIE
Media, frecvena i variaia de eantionare observate pe eantioane corect
extrase (reprezentative) dintr-o populaie P sunt estimatori fr bias ale mediei,
frecvenei i respectiv variaiei teoretice ale populaiei P
103
Un estimator c este cu att mai eficace cu ct variaia sa este mai mic,
sau precizia sa depinde de mrimea variaiei sale.
Estimarea punctual a unui parametru teoretic furnizeaz o valoare pentru
parametrul teoretic estimat.
Valoarea sa este tributar fluctuaiilor de eantionare i poate fi la o mare
distan de valoarea real a parametrului estimat.
Este recomandabil s se estimeze un parametru teoretic nu printr-o
singur valoare ci printr-un interval, numit interval de ncredere,
ncredere, n care s
se poat afirma c parametrul estimat se gsete cu o probabilitate
ridicat.
N>=30
media de eantionare m este o variabil aleatoare normal
104
Pentru un prag de semnificaie se determin (de exemplu, din tabela
ecartului redus) valoarea Z pentru care probabilitatea ca variabila
aleatoare Z s fie n intervalul [-Z,Z] este 1-, adic:
Pr(-Z Z Z) = 1 - .
de unde rezult :
EXEMPLU
105
Eantionarea aleatoare implic dreptul fiecrui membru al populaiei de
a fi ales dar nu garanteaz reprezentativitatea proporional a tuturor
prilor unei populaii
Alt eantion alt medie, alt abatere
A distribuia de eantionare a mediei pentru n=10
B distribuia de eantionare a mediei pentru n=50
Pe msur ce crete n eroarea de eantionare scade i eantioanele
devin mai reprezentative, media lor este mai apropiat de cea a populaiei
106
n practic este imposibil s construim distribuia de eantionare estimarea
deviaiei standard a mediei pe baza deviaiei standard i a dimensiunii
eantionului:
EXEMPLU CONTINUARE
107
ESTIMAREA UNEI FRECVENTE
INTERVALE DE INCREDERE
108
EXEMPLU CONTINUARE
Estimarea zonei de 95%
Este mrginit de un scor Z de 1,96
Interval de ncredere de 95%
INTERVALE DE INCREDERE
Formula de determinare a limitelor intervalului de ncredere:
EXEMPLU CONTINUARE
95% II = 40,0
40,0 (1,96)(1,36)
95% II = 40,02,67
40,02,67
95% II = 37,33 pn la 42,67
EXEMPLU 99%
Z = 2,576
99% II = 40,0
40,0 (2,576)(1,36)
99% II = 40,03,50
40,03,50
99% II = 36,5 pn la 43,5
109
INTERVALE DE INCREDERE CU ESANTIOANE MICI
n<30
Cu ct eantioanele sunt mai mici cu att distribuia de eantionare este
mai dispersat fa de distribuia normal
Se folosete o alt distribuie: distribuia t sau Student
Diferena major dintre distribuia t i cea normal const n faptul c
prima i schimb forma odat cu schimbarea dimensiunii eantionului
df = n-1
df = grade de libertate
110
GRADE DE LIBERTATE
df
Direciile disponibile pentru micare ntr-un spaiu dat
Numrul de componente care pot varia ntr-un set de date
n-1
GRADE DE LIBERTATE EXEMPLU
n=6 df = 5
II95% t= 2,571
n=10 df = 9
II95% t= 2,262
n=30
II95% t= 2,042
Creterea
Creterea lui n determin ca valoarea lui t s se apropie de 1,96 curba
tinde spre distribuia normal
111
Interpretare:
1. Intervalul de ncredere al extensiei lombare scade cu vrsta
2. Variabilitatea este mai sczut la tineri
3. Intervalele de ncredere se ntreptrund
CURSUL XII
INFORMATICA MEDICALA
NOTIUNI
Formularea de noi ipoteze (sau model sau teorie) este una dintre
cele mai importante aspecte ale cercetrii tiinifice.
Aceste ipoteze experimentale ncerc s descrie sau s explice
anumite fenomene reale.
In multe cazuri exist ipoteze anterioare (descrieri sau explicaii)
pe care oamenii de tiin doresc s le nlocuiasc cu altele noi.
Este ns insuficient s se formuleze sau s fie prezentat numai
o nou ipotez.
O ipotez nou trebuie testat pentru a vedea c are temei (n
concordan cu observaiile) i pentru a justifica c este mai
bun dect alte ipoteze alternative.
Aceasta conduce la scheme de experimente, eantioane i de
observaii n scopul obinerii dovezii pentru susinerea (sau
respingerea) unei noi ipoteze.
METODE PENTRU TESTAREA IPOTEZELOR
112
Compararea a dou ipoteze sau teorii concurente
Aceste dou teorii trebuie prima dat formulate ca modele.
Aceste dou modele n continuare vor fi denumite prin ipoteza
nul i ipoteza alternativ.
Ipoteza nul H0, reprezint modelul pe care
experimentatorul ar dori s-l nlocuiasc.
Ipoteza alternativ H1 este noul model care de regul
reprezint o negaie a ipotezei nule.
Ipoteza nul H0, reprezint modelul pe care experimentatorul ar
dori s-l nlocuiasc.
Ipoteza alternativ H1 este noul model care de regul reprezint
o negaie a ipotezei nule.
Indiferent cum este formulat protocolul experimentului scopul
cercettorului este de a testa ipoteza nul (de cele mai multe ori
pentru a o rejecta)
Ca n justiie: inculpatul este inocent pn se dovedete vinovat
Ipoteza nul nu trebuie probat ci anulat
Inferen negativ
Inferen negativ
Scopul testului statistic este de a dovedi c ipoteza nul H0 este
fals
nu putem niciodat afirma acceptm ipoteza nul
O putem nega sau nu o putem nega
Ca la un proces, rezultatul este vinovat sau nevinovat i nu
inocent
Nevinovat = nu suficient de vinovat pentru a fi acuzat
Prin respingerea ipotezei nule cercettorul afirm c rezultatele
observate nu sunt datorate ntmplrii
= efect semnificativ
Cnd ipoteza nul nu este rejectat cercettorul afirm c
diferenele observate sunt datorate ntmplrii i rezultatele nu
sunt semnificative
PASII UNUI TEST STATISTIC (1)
113
Ipoteza nul
Media valorilor n populaia A nu este diferit de media valorilor
n populaia B
Ipoteza alternativ
Media valorilor n populaia A este diferit de media valorilor n
populaia B
Uneori se urmrete tocmai respingerea ipotezei alternative
(comparaia unui tratament cu un standard)
Ipotezele anterioare stipulau diferena fr a o enuna: ipoteze
non-direcionale
Ipoteze direcionale
114
Dac valoarea parametrului statistic aparine regiunii critice,
ipoteza nul H0 va fi respins i va fi acceptat ipoteza
alternativ H1.
Dac valoarea parametrului statistic nu aparine regiunii critice,
ipoteza nul H0 va fi acceptat.
115
1. Dac 0,01 <= p<0,05 , rezultatele sunt considerate
semnificative.
2. Dac 0,001 <= p<0,01, rezultatele sunt considerate
nalt semnificative.
3. Dac p<0,001, rezultatele sunt considerate foarte nalt
semnificative.
4. Dac p>=0,05, rezultatele sunt considerate
nesemnificative statistic.
5. Dac 0,05 <= p<0,1, se noteaz o oarecare tendin
spre considerarea unei semnificaii statistice.
Valoarea p nu este probabilitatea ca ipoteza nul s fie fals. O
valoare mic a lui p nu nseamn c exist o probabilitate mic ca
ipoteza nul s fie adevrat.
Ipoteza de lucru nu poate fi inversat i de exemplu pentru un p
= 0,02 nu se poate spune c avem o probabilitate de 98% ca
diferena s existe.
Valoare lui p nu este un indicator al validitii ipotezei statistice.
P se utilizeaz doar pentru a face decizia semnificativ sau nu.
ERORI IN TESTAREA IPOTEZELOR STATISTICE
EROAREA DE TIP I
116
EROAREA DE TIP II
= H0 este nu este respins dei este fals
Am concluzionat c exist diferenele observate sunt datorate
ansei atunci cnd acestea apar datorit diferenelor dintre
eantioane
Am putea abandona un tratament pe care tocmai l testm sau o
direcie de cercetare
Media eantionului=105
117
s=16
n=30
=100
Sx=2,9
Z=1.72
Testul nu este semnificativ i nu se poate respinge ipoteza nul
118
TESTE STATISTICE
CE
Cea mai simpl comparaie statistic este cea ntre dou grupuri aleator
alese
Acest mod de distribuire permite cercettorului s presupun c
diferenele individuale sunt egal distribuite ntre grupuri la nceputul
experimentului i c cele dou grupuri sunt echivalente
D.p.d.v statistic cele dou grupuri sunt eantioane extrase din aceiai
populaie deci diferenele dintre ele sunt rezultatul erorii de eantionare
sau al ntmplrii
Dup aplicarea unui tratament cercettorul verific dac cele dou
eantioane mai fac sau nu parte din aceiai populaie
Pentru aceasta se aplic un test statistic
COMPARAREA A DOUA MEDII
Situaia real
Exist diferene ntre grupuri
Exist diferene n interiorul grupurilor
Trebuie demonstrat dac diferenele observate ntre mediile parametrului
studiat sunt datorate experimentului i nu ntmplrii
119
TESTUL STUDENT
W.S. Gossett, 1908 Student
Testul t
Subtipuri:
Testul t pentru eantioane independente:
Variane egale
O coad
Dou cozi
Variane inegale
Testul t pentru eantioane perechi
120
Se mai numete i omogenitatea varianelor
n mod normal omogenitatea varianelor se testeaz statistic
Testul Levene sau testul Barlett
Bazate pe statistica F
Dac varianele nu sunt semnificativ statistic diferite (p>0,05) atunci pot fi
considerate egale
Dac sunt diferite se aplic alt formul de calcul a lui t
TESTUL T: EGALITATEA VARIANELOR
Grade de libertate:
df =(n1-1)+(n2-1)=(n1+n2-2)
df =N-2 unde N este dimensiunea combinat a eantioanelor
EXEMPLU
121
Toi pacienii au un program motor similar timp de o sptmn
Se msoar puterea de strngere cu mna n zilele 1 i 8 ale testului iar
diferena este cea care se folosete n continuare la calcule
122
TESTUL T
Pentru ca valoarea calculat a lui t s implice o diferen semnificativ, ea
trebuie s fie mai mare sau egal cu valoarea critic
Dac testul este unidirecional atunci i semnul lui t trebuie s fie
corespunztor
Deoarece t=2,718 i este mai mare dect valoarea critic pentru =0,05
1,734 i este pozitiv atunci media valorilor diferenei forei minii a celor
din grupul experimental este mai mare dect la cei din grupul de control
Putem rejecta H0
Tratamentul are un rol pozitiv
123
TESTUL T PENTRU VARIANE INEGALE
Literatura de specialitate arat c atunci cnd eantioanele comparate au
un numr egal de cazuri violarea regulii egalitii varianelor nu duce la
compromiterea testului Student
Dac numrul de cazuri difer ntre eantioane atunci statistica t trebuie
calculat conform formulei, iar gradele de libertate se ajusteaz n funcie
de varian:
EXEMPLU
124
Dac eantioanele mai mari au i varian mai mare testul t devine mai
puin puternic
Se obin mai puine diferene semnificative statistic
dac eantionul mai mic are variana mai mare (de peste 2 ori) crete
ansa unei erori de tipul I
125
Se testeaz utilizarea unei perne de suport lombar pentru mbuntirea
unghiului de repaus al pelvisului
TESTUL CHI-PTRAT
126
O frecvena observat i E frecvena ateptat
EXEMPLU
127
Tabelul de contingen prezentat se numete tabel de contingen
observat, iar frecvenele pe care le conine se numesc frecvene
observate.
Se face ipoteza de independen ntre cele dou caractere M i T (adic
ipoteza nul H0 , n acest caz) atunci
Se calculeaza un tabel de contingen teoretic care satisface aceast
ipotez de independen.
Se determin apoi abaterea (ecartul) dintre cele dou tabele de
contingen observat i teoretic.
Dac aceast abatere este mic atunci ea este explicat doar prin
ntmplare (hazard) i ipoteza de independen este acceptat.
Dac aceast abatere este foarte important pentru ca doar
ntmplarea s o explice atunci ipoteza de independen trebuie
s fie respins.
Problema este urmtoarea: dispunnd de un eantion de n = 400 de subieci
dintre care 160 au maladia M iar 130 sunt fumtori, s se determine cum sunt
repartizai subiecii n funcie de cele dou caractere (M i T) dac se
presupune c acestea sunt independente
128
ETAPA 1
DEFINIREA IPOTEZEI NULE HO
H0: caracterele A i B sunt independente.
H0: fumatul nu are influen asupra apariiei maladiei M.
129
ETAPA 6 DECIZIA
CURSUL XIII
INFORMATICA MEDICALA
130
Media ptratic intergrup MSb
Media ptratic intragrup MSe
131
ANALIZA BIVARIAT ANOVA EXEMPLU
132
Ce se investigheaz?
Efectul variabilei A independent de B
Efectul variabilei B independent de A
Efectul cumulat al celor dou variabile
EFECTELE PRINCIPALE
Efectele datorate aplicrii uneia din cele 2 variabile se msoar prin media
pentru nivelurile rezultate din efectele principale i se numete medie
marginal
EFECTELE SIMPLE
133
INTERACIUNEA NTRE VARIABILE
134
TESTAREA IPOTEZEI STATISTICE
135
Y: Y1, Y2,..., Yn
se obine reprezentnd grafic punctele de coordonate (Xi,Yi)
i=1,2,...,n.
O idee ceva mai precis privind relaia ntre cele dou caracteristici se
obine mprind diagrama de dispersie n patru cadrane prin dou drepte
perpendiculare care trec prin punctul (Xmediu,Ymediu), avnd
coordonatele egale cu mediile celor dou variabile.
136
INDICI DE CORELAIE SUMA PRODUSELOR ECART
137
Pentru a descrie "intensitatea" relaiei dintre cele dou variabile X i Y se
utilizeaz observaia c dac punctul (Xi,Yi) se afl n cadranele I sau III ale
diagramei de dispersie atunci produsul este pozitiv iar atunci cnd este
situat n cadranele II i IV este negativ.
138
Coeficientul de corelaie msoar intensitatea relaiei dintre
variabilele X i Y i valoarea sa r este totodat cuprins ntre -1 i 1.
Dac r=1 punctele sunt situate pe o dreapt de pant pozitiv
(cresctoare).
Dac 0 < r < 1, norul de puncte poate fi nlocuit (ajustat) printr-o
dreapt de pant pozitiv .
139
Cnd r este pozitiv relaia ntre variabilele X i Y este "pozitiv",
adic o cretere a lui X determin n general o cretere a lui X.
Cnd r < 0 relaia ntre cele dou variabile este "negativ" adic o
cretere a lui X are n general ca i consecin o diminuare a lui Y.
140
Atentie:
Variabilele corelate trebuie sa fie cantitative
Intre variabilele pentru care se calculeaza corelatie trebuie sa
existe o relatie de cauzalitate
141
Valorile obinute pentru rs trebuie s fie mai mari sau egale dect
valorile critice din tabel pentru ca s fie semnificative
COEFICIENTUL DE DETERMINARE
CURSUL XIV
INFORMATICA MEDICALA
142
cu o medie cunoscut 0 a unei populaii standard. Se presupune c cele
dou populaii au aceiai variaie 2 care se cunoate.
Condiii de aplicare
Este necesar s cunoatem variaia populaiei (dac nu o
cunoatem, aplicm testul Student pentru compararea mediei
unui eantion cu media unei populaii).
Testul este corect aplicat dac populaia este normal
distribuit. Dac populaia nu este normal distribuit sau talia
eantionului este mic (<30) testul d o valoare orientativ.
Testul este, de asemenea, corect aplicat atunci cnd talia
eantionului este mare ( 30).
Ipotezele testului
1. Test bilateral: H0: = 0 versus H1: 0
2. Test unilateral: H0: = 0 versus H1: > 0
unde = media popolaiei din care este extras eantionul i 0 =
media populaiei standard.
Intr-o alt form ipotezele testului se pot formula n modul urmtor:
Ipoteza nul: nu exist diferen semnificativ ntre media
eantionului i media populaiei.
Ipoteza alternativ pentru testul bilateral: exist diferen
semnificativ ntre media eantionului i media populaiei.
Ipoteza nul pentru testul unilateral: media eantionului este
semnificativ mai mare dect media populaiei.
PARAMETRUL STATISTIC AL TESTULUI
REGIUNEA CRITIC
Regiunea critic pentru testul bilateral este (- , -1,96 ] [1,96 , ) (
143
EXEMPLU
144
1. Pentru testul bilateral: Deoarece parametrul statistic calculat al
testului nu aparine regiunii critice respingem ipoteza nul; exist o
diferen semnificativ ntre media colesterolului la eantionul ales
i populaia general.
2. Pentru testul unilateral: Deoarece parametrul statistic calculat al
testului z este mai mic dect 1,645 nu putem nega ipoteza nul, adic
nu exist diferen semnificativ ntre media colesterolului la
eantion i media colesterolului populaiei generale.
TESTUL Z DE COMPARARE A MEDIILOR A DOU POPULAII ( VARIAII
CUNOSCUTE I EGALE)
EXEMPLU
145
Dorim s studiem dac exist diferen semnificativ ntre cantitatea
de acid uric sangvin la brbaii din mediul urban fa de cei din
mediul rural, cunoscndu-se c variaia acidului uric este egal cu 2,1
mg/100ml.
Din prima populaie (mediul urban) s-a extras un eantion de 10
persoane cu vrste cuprinse ntre 45 i 60 de ani i s-a obinut o medie
a acidului uric de 5,6 mg/100ml.
S-a determinat media acidului uric la un eantion de 16 brbai,
extras din a doua populaie (mediul rural), cu vrste cuprinse ntre 45
i 60 de ani din mediul rural i s-a constata o valoare medie de 4,1
mg/100ml.
Ipoteza testului:
1. Test bilateral: H0: = 0 versus H1: 0
2. Test unilateral: H0: = 0 versus H1: > 0
Ipoteza nul: Media acidului uric la prima populaie nu difer
semnificativ fa de media acidului uric la cea de-a doua populaie.
Ipoteza alternativ, test bilateral: Media acidului uric la cei din
mediul urban difer semnificativ fa de media acidului uric la cei
din mediul rural.
Ipoteza alternativ, test unilateral: Media acidului uric la cei din
mediul urban este semnificativ mai mare fa de media acidului uric
la cei din mediul rural.
Parametrul statistic calculat al testului:
Pragul de semnificaie: = 0,05.
Regiunea critic:
146
Scopul acestui test este investigarea semnificaiei diferenei ntre o
frecven teoretic p (ntr-o populaie) i o frecven observat f pe un
eantion reprezentativ a unei valori a unei variabile calitative (binare).
Condiii de aplicare:
Testul este corect aplicat dac numrul n al observaiilor
eantionului este suficient de mare (np, n(1-p)>10), pentru a justifica
utilizarea unei aproximri cu o distribuie normal redus (a
distribuiei frecvenei de selecie).
Algoritm
Un eantion randomizat de volum n este extras dintr-o populaie
pentru care cunoatem frecvena teoretic p a unei variabile
calitative. Pentru aceeai variabil se calculeaz frecvena ei n
eantion f. Parametrul testului este:
EXEMPLU
Suntem interesai de investigarea prevalenei hepatitei B la
personalul care lucreaz n laboratoarele unor clinici de boli
infecioase din Transilvania.
Se tie din studii anterioare c prevalena hepatitei B n populaia
general din Transilvania este de 9%.
Un eantion de 100 de persoane care lucreaz n laboratoarele unor
spitale de boli infecioase din Transilvania s-a luat n studiu i s-a
obinut o prevalen a hepatitei B de 6%.
Exist diferen semnificativ ntre frecvena hepatitei B la
personalul care lucreaz n laboratoarele unor spitale de boli
infecioase din Transilvania fa de populaia general?
Soluie
Datele problemei: f = 0,06, p = 0,09, . Fie p0 prevalena (necunoscut)
a hepatitei B n populaia alctuit de personalul laboratoarelor
spitalelor de boli infecioase.
Ipotezele testului:
1. Test bilateral: H0: p0=p1 versus H1:p0<>p1
2. Test unilateral: H0: p0=p1 versus H1:p0>p1
Ipoteza nul: Nu exist diferen semnificativ ntre frecvena
hepatitei B la eantionul studiat fa de frecvena hepatitei B n
populaia general.
147
Ipoteza alternativ, test bilateral: Exist diferen semnificativ ntre
frecvena hepatitei B la nivelul eantionului i prevalena hepatitei B
n populaia general.
Ipoteza alternativ, test unilateral: Frecvena hepatitei B la nivelul
eantionului studiat este semnificativ mai mare fa de frecvena
hepatitei B n populaia general.
Statistica testului:
148