i biostatisticCurs II Informaticmedical.i biostatisticCurs II
UMF Carol Davila
Informatica Medicala & Biostatistica Notiuni de statistica Tipuri de date Distribu.ii de frecven. Histograme .i alte reprezentri grafice Simetrie .i asimetrie Scale de masura Informatica medicala Cuprins UMF Carol Davila Informatica Medicala & Biostatistica Notiuni de statistica Tipuri de date Distribu.ii de frecven. Histograme .i alte reprezentri grafice Simetrie .i asimetrie Scale de masura Informatica medicala Cuprins
Notiuni de statistica Notiuni de statistica
UMF Carol Davila
Informatica Medicala & Biostatistica Ce este statistica? Statistica este un domeniu tiinific care permite studiul fenomenelor de masa a cror proprietate fundamentaleste variabilitatea. Statistica este stiinta colectarii, clasificarii, prezentarii, interpretarii datelor numerice si a folosirii acestora pentru a formula concluzii si a lua decizii. UMF Carol Davila Informatica Medicala & Biostatistica Ce este statistica? Statistica este un domeniu tiinific care permite studiul fenomenelor de masa a cror proprietate fundamentaleste variabilitatea. Statistica este stiinta colectarii, clasificarii, prezentarii, interpretarii datelor numerice si a folosirii acestora pentru a formula concluzii si a lua decizii.
UMF Carol Davila
Informatica Medicala & Biostatistica De ce avem nevoie de statistic? Vrem sa tragem concluzii ct mai valide din cantiti limitate de date. Diferene importante sunt deseori mascate de variabilitatea biologici/sau imprecizia experimental re i relaii, dar tinde sgeneralizeze n exces UMF Carol Davila Informatica Medicala & Biostatistica De ce avem nevoie de statistic? Vrem sa tragem concluzii ct mai valide din cantiti limitate de date. Diferene importante sunt deseori mascate de variabilitatea biologici/sau imprecizia experimental re i relaii, dar tinde sgeneralizeze n exces
Mintea umanexceleazn gsirea de t
Mintea umanexceleazn gsirea de t
UMF Carol Davila
Informatica Medicala & Biostatistica De ce avem nevoie de statistic? Statistica a aparut din nevoia sociala de a cunoaste in expresie numerica diferite fenomene si procese ale activitatii umane Indiferent de semnificatia data termenului de statistica obiectul de studiu al acesteia il reprezinta fenomenele de masa, care sunt fenomene complexe, atipice, rezultate din actiunea combinata si repetata a unui numar mare de factori de influenta Definindu-se ca stiinta fenomenelor de masa, statistica privilegiaza rationamentele de tip inductiv (generalizari rezultate din observatii individuale) UMF Carol Davila Informatica Medicala & Biostatistica De ce avem nevoie de statistic? Statistica a aparut din nevoia sociala de a cunoaste in expresie numerica diferite fenomene si procese ale activitatii umane Indiferent de semnificatia data termenului de statistica obiectul de studiu al acesteia il reprezinta fenomenele de masa, care sunt fenomene complexe, atipice, rezultate din actiunea combinata si repetata a unui numar mare de factori de influenta Definindu-se ca stiinta fenomenelor de masa, statistica privilegiaza rationamentele de tip inductiv (generalizari rezultate din observatii individuale)
UMF Carol Davila
Informatica Medicala & Biostatistica Intrebari la care statistica poate da un raspuns Exprimnd caracteristicile unui numar de indivizi ai unei populatii prin variabile (unele numerice, altele nu), admitem cprin msurare sau evaluare vom obine seturi de date cu care vom construi tabele de date. ntrebrile eseniale care se pun de obicei sunt urmtoarele: cum putem sdescriem sintetic datele pe care le-am obinut? cum putem stransmitem altora informaiile pertinente despre ansamblul indivizilor, frns a le transmite toate datele obinute? UMF Carol Davila Informatica Medicala & Biostatistica Intrebari la care statistica poate da un raspuns Exprimnd caracteristicile unui numar de indivizi ai unei populatii prin variabile (unele numerice, altele nu), admitem cprin msurare sau evaluare vom obine seturi de date cu care vom construi tabele de date. ntrebrile eseniale care se pun de obicei sunt urmtoarele: cum putem sdescriem sintetic datele pe care le-am obinut? cum putem stransmitem altora informaiile pertinente despre ansamblul indivizilor, frns a le transmite toate datele obinute?
UMF Carol Davila
Informatica Medicala & Biostatistica Statistiva vs biostatistica Statistica = tiina care se ocupcu studiul datelor obinute din grupuri mici de indivizi i extinderea rezultatelor la populaii mari . Variabilitatea Incertitudine caracteristica proceselor legi care modeleazbiologice incertitudinea Biostatistica = domeniu particular al statisticii (aplicarea metodelor statisticii n problemele biologice/medicale - probleme ce afecteazcalitatea fizici mentala oamenilor) UMF Carol Davila Informatica Medicala & Biostatistica Statistiva vs biostatistica Statistica = tiina care se ocupcu studiul datelor obinute din grupuri mici de indivizi i extinderea rezultatelor la populaii mari . Variabilitatea Incertitudine caracteristica proceselor legi care modeleazbiologice incertitudinea Biostatistica = domeniu particular al statisticii (aplicarea metodelor statisticii n problemele biologice/medicale - probleme ce afecteazcalitatea fizici mentala oamenilor)
UMF Carol Davila
Informatica Medicala & Biostatistica Statistica Statistica descriptivpoate fi definitca totalitatea metodelor de culegere, prezentare i caracterizare a unui set de date numerice, n scopul de a descrie diferitele trsturi principale ale acestui set de date Statistica inferenialse ocupa cu interpretarea datelor oferite de statistica descriptiva si cu folosirea acestora pentru a formula concluzii si a lua decizii. Statistica inferenialpoate fi definitca totalitatea metodelor ce fac posibilestimarea caracteristicilor unei populaii sau luarea unor decizii privind o populaie, pe baza rezultatelor obinute pe un eantion UMF Carol Davila Informatica Medicala & Biostatistica Statistica Statistica descriptivpoate fi definitca totalitatea metodelor de culegere, prezentare i caracterizare a unui set de date numerice, n scopul de a descrie diferitele trsturi principale ale acestui set de date Statistica inferenialse ocupa cu interpretarea datelor oferite de statistica descriptiva si cu folosirea acestora pentru a formula concluzii si a lua decizii. Statistica inferenialpoate fi definitca totalitatea metodelor ce fac posibilestimarea caracteristicilor unei populaii sau luarea unor decizii privind o populaie, pe baza rezultatelor obinute pe un eantion
UMF Carol Davila
Informatica Medicala & Biostatistica Statistica Statistica inferentiala Extinderea proprietilor determinate pe un eantion la ntreaga populaie Statistica descriptiva -culegerea datelor statistice -prezentarea (descrierea) datelor statistice, -reprezentarea (grafica) datelor statistice, -determinarea unor caracteristici numerice sintetice ale datelor statistice
UMF Carol Davila
Informatica Medicala & Biostatistica Aplicatii utilizate in statistica Minitab Biomed (aplicatie specifica domeniului biomedical) SAS (sistem de analiza statistica) SPSS Statistica EpiInfo MS Office Excel IBM Scientific subroutine packages UMF Carol Davila Informatica Medicala & Biostatistica Aplicatii utilizate in statistica Minitab Biomed (aplicatie specifica domeniului biomedical) SAS (sistem de analiza statistica) SPSS Statistica EpiInfo MS Office Excel IBM Scientific subroutine packages
UMF Carol Davila
Informatica Medicala & Biostatistica Cercetarea statistica Faze - in functie de obiectivul urmarit, gradul de generalitate al concluziilor si de mijloacele utilizate: Faza descriptiva (exploratorie) Faza inferentiala (decizionala) Obiectul activitatii de cercetare statistica presupune: proiectare si organizare culegere prelucrare analiza interpretarea datelor statistice UMF Carol Davila Informatica Medicala & Biostatistica Cercetarea statistica Faze - in functie de obiectivul urmarit, gradul de generalitate al concluziilor si de mijloacele utilizate: Faza descriptiva (exploratorie) Faza inferentiala (decizionala) Obiectul activitatii de cercetare statistica presupune: proiectare si organizare culegere prelucrare analiza interpretarea datelor statistice
UMF Carol Davila
Informatica Medicala & Biostatistica Faza descriptiva (exploratorie) Are rol de sintetizare si structurare cit mai direct si intuitiv a datelor de observatie si a informatiei continuta de acestea prin ipotezele emise a priori sau formulate utilizeaza: tabele, grafice, indicatori numerici nu isi asuma rolul de a verifica valoare de adevar a acestor ipoteze UMF Carol Davila Informatica Medicala & Biostatistica Faza descriptiva (exploratorie) Are rol de sintetizare si structurare cit mai direct si intuitiv a datelor de observatie si a informatiei continuta de acestea prin ipotezele emise a priori sau formulate utilizeaza: tabele, grafice, indicatori numerici nu isi asuma rolul de a verifica valoare de adevar a acestor ipoteze
UMF Carol Davila
Informatica Medicala & Biostatistica Faza inferentiala (decizionala) Are rolul de: a extinde rezultatele obtinute pe baza datelor din esantion la nivelul populatiei generale A confirma sau a invalida ipotezele emise a priori sau formulate dupa faza exploratorie .Metodologia statisticii inferentiale se bazeaza pe teoria probabilitatilor UMF Carol Davila Informatica Medicala & Biostatistica Faza inferentiala (decizionala) Are rolul de: a extinde rezultatele obtinute pe baza datelor din esantion la nivelul populatiei generale A confirma sau a invalida ipotezele emise a priori sau formulate dupa faza exploratorie .Metodologia statisticii inferentiale se bazeaza pe teoria probabilitatilor
UMF Carol Davila
Informatica Medicala & Biostatistica Faza inferentiala (decizionala) Caracteristici: Generalizarea concluziilor de la esantion la populatia statistica totala, prin marje specifice de incertitudine Caracterul aleator al esantionarii Recunoasterea explicita a nesigurantei predictiilor UMF Carol Davila Informatica Medicala & Biostatistica Faza inferentiala (decizionala) Caracteristici: Generalizarea concluziilor de la esantion la populatia statistica totala, prin marje specifice de incertitudine Caracterul aleator al esantionarii Recunoasterea explicita a nesigurantei predictiilor
UMF Carol Davila
Informatica Medicala & Biostatistica Fenomenele de masa Fenomenele de masa - fenomene complexe, atipice, rezultate din actiunea combinata si repetata a unui numar mare de factori de influenta Elemente specifice: E nevoie de un numar mare de cazuri individuale Se caracterizeaza prin variabilitate (indivizi aparent asemanatori prezinta numeroase trasaturi diferite) Sunt fenomene deterministe, de tip stohastic (se produc intimplator), produse in conditii de incertitudine Forma individuala de manifestare e diferita; legitatea de manifestare a fenomenelor de masa nu poate fi cunoscuta si verificata pentru fiecare caz in parte ci numai la nivelul intregului ansamblu de cazuri individuale UMF Carol Davila Informatica Medicala & Biostatistica Fenomenele de masa Fenomenele de masa - fenomene complexe, atipice, rezultate din actiunea combinata si repetata a unui numar mare de factori de influenta Elemente specifice: E nevoie de un numar mare de cazuri individuale Se caracterizeaza prin variabilitate (indivizi aparent asemanatori prezinta numeroase trasaturi diferite) Sunt fenomene deterministe, de tip stohastic (se produc intimplator), produse in conditii de incertitudine Forma individuala de manifestare e diferita; legitatea de manifestare a fenomenelor de masa nu poate fi cunoscuta si verificata pentru fiecare caz in parte ci numai la nivelul intregului ansamblu de cazuri individuale
UMF Carol Davila
Informatica Medicala & Biostatistica Concepte statistice esentiale in analiza datelor Variabila Cazurile Tipuri de variabile Un sistem de clasificare alternativ Importanta identificarii tipurilor de variabile implicate Diferenta dintre statistica descriptiva si cea interferentiala Metode relationate si cele nerelationate Metode succinte de realizare a rapoartelor statistice Intervale de incredere si statisticile punctuale UMF Carol Davila Informatica Medicala & Biostatistica Concepte statistice esentiale in analiza datelor Variabila Cazurile Tipuri de variabile Un sistem de clasificare alternativ Importanta identificarii tipurilor de variabile implicate Diferenta dintre statistica descriptiva si cea interferentiala Metode relationate si cele nerelationate Metode succinte de realizare a rapoartelor statistice Intervale de incredere si statisticile punctuale
Tipuri de date, frecven.e, distribu.ii Tipuri de date, frecven.e, distribu.ii
UMF Carol Davila
Informatica Medicala & Biostatistica Tipuri de date Popula.ie - nr mare de indivizi - caracter dinamic - este bine definitla un moment de timp dat E.antion este o parte mic din populaie (se poate extrage suficientinformaie pentru a se face inferene asupra caracteristicilor studiate la nivelul populaiei) Variabilele sunt calit.i sau cantit.i care pot saibvalori diferite de la un membru al unui grup (e.antion) la altul. O statisticeste o formula crei valoare se ob.ine cu ajutorul datelor dintr-un e.antion. O statistica este o caracteristica numerica a unui esantion UMF Carol Davila Informatica Medicala & Biostatistica Tipuri de date Popula.ie - nr mare de indivizi - caracter dinamic - este bine definitla un moment de timp dat E.antion este o parte mic din populaie (se poate extrage suficientinformaie pentru a se face inferene asupra caracteristicilor studiate la nivelul populaiei) Variabilele sunt calit.i sau cantit.i care pot saibvalori diferite de la un membru al unui grup (e.antion) la altul. O statisticeste o formula crei valoare se ob.ine cu ajutorul datelor dintr-un e.antion. O statistica este o caracteristica numerica a unui esantion
UMF Carol Davila
Informatica Medicala & Biostatistica Variabile Variabilele pot lua multiple valori (ex de variabile: marimea, forma, greutatea, tipul unui mar) In contrast, constanta are o singura valoare (ex: forta gravitationala este o constanta)
UMF Carol Davila
Informatica Medicala & Biostatistica Variabila = o variabila de raspuns, simplu variabila, este o caracteristica, de obicei numerica, care prezinta interes in cazul fiecarui element (individ) al unei populatii. O caracteristicpoate fi reprezentatprin mai multe variabile. Data = data (la singular) este valoarea unei variabile de raspuns in cazul unui element al populatiei sau a esantionului. Exemplu: Popescu Nicolae are virsta de 19 ani , media 8.50, parul lui este castaniu , inaltimea lui este 1 m si 75 cm , iar greutatea lui este 65 kg . Aceste cinci valori ale celor cinci variabile de raspuns in cazul lui Popescu Nicolae sunt cinci date. Tipuri de date UMF Carol Davila Informatica Medicala & Biostatistica Variabila = o variabila de raspuns, simplu variabila, este o caracteristica, de obicei numerica, care prezinta interes in cazul fiecarui element (individ) al unei populatii. O caracteristicpoate fi reprezentatprin mai multe variabile. Data = data (la singular) este valoarea unei variabile de raspuns in cazul unui element al populatiei sau a esantionului. Exemplu: Popescu Nicolae are virsta de 19 ani , media 8.50, parul lui este castaniu , inaltimea lui este 1 m si 75 cm , iar greutatea lui este 65 kg . Aceste cinci valori ale celor cinci variabile de raspuns in cazul lui Popescu Nicolae sunt cinci date. Tipuri de date
UMF Carol Davila
Informatica Medicala & Biostatistica Valorile unei variabile de raspuns in cazul unei populatii sau a unui esantion constituie un set de date. Intr-un set de date aceeasi data apare de atatea ori de cate ori variabila are aceasta valoare . Ex: Cele 25 de inaltimi in cazul unui esantion de 25 de studenti reprezinta un set de 25 de date, nu neaparat diferite. Parametru este o caracteristica numerica a unei populatii. EX: Procentul de studenti de la UMF care au promovat toate examenele la sesiunea din iarna este un exemplu de parametru in cazul populatiei studentii de la UMF OBS: Parametrul este o valoare numerica care se refera la intreaga populatie. O statistica este o caracteristica numerica a unui esantion Ex: Inaltimea medie gasita folosind cele 25 de inaltimi in cazul unui esantion de 25 de studenti este un exemplu de statistica. OBS: O statistica este o valoare numerica care se refera la un esantion. Statisticile (de esantion) se noteaza cu literele alfabetului latin. UMF Carol Davila Informatica Medicala & Biostatistica Valorile unei variabile de raspuns in cazul unei populatii sau a unui esantion constituie un set de date. Intr-un set de date aceeasi data apare de atatea ori de cate ori variabila are aceasta valoare . Ex: Cele 25 de inaltimi in cazul unui esantion de 25 de studenti reprezinta un set de 25 de date, nu neaparat diferite. Parametru este o caracteristica numerica a unei populatii. EX: Procentul de studenti de la UMF care au promovat toate examenele la sesiunea din iarna este un exemplu de parametru in cazul populatiei studentii de la UMF OBS: Parametrul este o valoare numerica care se refera la intreaga populatie. O statistica este o caracteristica numerica a unui esantion Ex: Inaltimea medie gasita folosind cele 25 de inaltimi in cazul unui esantion de 25 de studenti este un exemplu de statistica. OBS: O statistica este o valoare numerica care se refera la un esantion. Statisticile (de esantion) se noteaza cu literele alfabetului latin.
Informatica Medicala & Biostatistica Tipuri de variabile Variabile nominale le utilizez pentru a asigna cazuri individuale, ce nu pot fi Tipuri de variabile Variabile nominale le utilizez pentru a asigna cazuri individuale, ce nu pot fi ordonate, la categorii Ex: Studentii de la Medicina vin din diferite orase Orasul din care provin este o variabila nominala Ex: grupa sanguin, rasa, culoarea ochilor, diagnosticul Nominal variables: Independent variables in experimental research For example, treatment to prevent polio (vaccine, placebo) Quasi-independent variables in correlational research For example, gender (female, male) variabile dihotomiale - variabila de decizie (binare, bimodale): variabile ce nu pot lua dect douvalori Ex: fumtor/nefumtor, prezent/absent, normal/anormal, DA/NU
UMF Carol Davila
Informatica Medicala & Biostatistica Tipuri de variabile Variabile ordinale le utilizez pentru a clasifica cazurile Ex: tarile pot fi clasificate in functie de populatie (foarte mari, mari, mici) Clasificarea este o variabila ordinala Variabile ordinale variabile ce sunt clasificate n mai mult