Sunteți pe pagina 1din 27

Prelucrarea statistica

Etape

• Obiectivul fundamental al statisticii este de a rezuma şi analiza


datele statistice prin parcurgerea următoarelor etape:
• observarea statistică, în care se culeg date şi informaţii statistice
privind toate caracteristicile urmărite într-o colectivitate definite;
• prelucrarea statistică, în care datele sunt sistematizate şi se
calculează indicatorii statistici ce caracterizează fenomenul studiat;
• analiza, interpretarea şi prezentarea finală a rezultatelor, în care
sunt verificate ipotezele, formulate concluziile şi fundamentate
procesele decizionale.
Definitii

• Datele statistice reprezintă caracterizarea


numerică pe care statistica o face în
legătură cu fenomenul studiat.
• Biostatistica este un domeniu al statisticii
specializat în studierea fenomenelor
biologice şi medicale.
Definitii
Colectivitatea statistică
• este reprezentată de totalitatea
elementelor care au caracteristici comune
şi care formează obiectul analizei statistice
(populaţia unui oraş, bolnavii internaţi în
spitalele din Iaşi, cazurile de SIDA la nivel
naţional, spitalele judeţene din România,
etc.).
Definitii
Colectivitatea statistică
• este reprezentată de totalitatea
elementelor care au caracteristici comune
şi care formează obiectul analizei statistice
(populaţia unui oraş, bolnavii internaţi în
spitalele din Iaşi, cazurile de SIDA la nivel
naţional, spitalele judeţene din România,
etc.).
Definitii
• Unitatea statistică este elementul component al
unei colectivitati statistice supuse observării şi
cercetării. Unitati statistice pot fi: persoana,
născutul viu, decesul, cazul nou de boală,
familia, centrul de sănătate, secţia de spital,
animalul de experienta, etc.
• Caracteristica statistică sau “vanabila” reprezintă
trăsătura, proprietatea sau însuşirea comună
tuturor unitatilor unei colectivitati şi care variază
de la o unitate la alta.
Variabile

• Variabilele pot fi cantitative sau calitative şi


respectiv, continue sau discrete.
• Variabilele cantitative sunt însuşiri ale unitatii
statistice care pot fi exprimate numeric sau
printr-o unitate de măsură (talie, greutate,
vârstă, hemoglobină, tensiune arterială, etc.).
• Variabilele calitative sunt însuşirile care nu se
pot exprima prin unitati de măsură, ci prin
atribute (sex, rasă, religie, stadiul de evoluţie al
bolii, culoarea ochilor, etc.).
Variabile
Aceste variabile pot fi cu:
• două variante de expresie, numite şi variabile alternative,
ca de exemplu, sexul (masculin/feminin), grupa sanguină
Rh (Rh pozitiv / Rh negativ), statusul HIV (HIV+/HIV-);
• trei variante de expresie, de exemplu, împărţirea
populaţiei în copii, adulţi şi vârstnici;
• patru variante de expresie, de exemplu, grupele
sanguine în sistem ABO sau statusul marital în România
(căsătorit, necăsătorit, divorţat, văduv) ;
• cinci sau mai multe variante de expresie, de exemplu,
starea pacienţilor la externare (vindecat, ameliorat,
staţionar, agravat, decedat).
Variabile
• Variabilele continue sunt cele pentru care există
un număr nelimitat de valori posibile (de
exemplu, greutatile a doi copii sunt de 20, 325 şi
respectiv, 20,155 kg, fiind raportate ca 20 kg).
• Variabilele discontinue sau discrete sunt datele
cu un număr limitat de valori posibile
reprezentate prin numere întregi (de exemplu,
cazurile de SIDA din judeţ, numărul de locuitori
ai municipiului Iaşi, etc.).
• Varianta sau valoarea reprezintă nivelul concret
pe care îl poate lua o variabilă în cazul unei
unitati sau grup de unitati statistice.
Exprimarea datelor statistice
1. Mărimile absolute
• se utilizează pentru consemnarea ca atare a unor
evenimente sau cazuri.
• Numărul absolut este dependent de mărimea populaţiei
de referinta.
• Mărimile absolute se utilizează pentru a evidenţial
– numărul de locuitori dintr-o anumită regiune;
– incidenţa anumitor boli transmisibile deosebit de grave, cum ar fi
lepra, SIDA, pesta, tetanos neonatorum, etc.
• Cazurile se raportează şi apar în anuarele statistice ca
atare, fără a le exprima la 100, 1000 sau 100 000 de
locuitori.
Exprimarea datelor statistice
2. Mărimile relative rezultă prin calcul si
permit compararea fenomenelor, pentru că
baza de comparare sau populaţia de
referinta este aceeaşi.
3. Rata exprimă numărul de evenimente
care au loc într-o populaţie definită, pe
durata unui anumit interval de timp sau la
un anumit moment; se mai numesc şi
indicatori de intensitate.
Exprimarea datelor statistice
4. Indicatorii statistici reprezintă expresia
numerică a unor fenomene biomedicale, definite
în timp şi spaţiu.
– Au o formă generală de exprimare relativă, fiind în
majoritate reprezentaţi prin rate şi mult mai rar prin
rapoarte sau medii.
5. Indicele statistic este o mărime relativă care
constă dintr-un raport ce compară nivelul unui
fenomen sau o rată înregistrate în momente/
intervale de timp diferite sau în regiuni diferite.
Indicele nu are unitate de măsură.
Exprimarea datelor statistice
Caracteristici cantitative: se exprimă numeric, cifric:
• Greutatea, vârsta, TA, calcemia, durata bolii (în ore, zile,
ani), nr. zile de spitalizare, vârsta sarcinii, durata
expunerii la o noxă profesională etc.
Caracteristicile cantitative sunt de două categorii:
• A. de tip continuu: sunt acele însuşiri ce pot lua orice
formă numerică, inclusiv o fracţie zecimală (greutatea,
tensiunea arterială).
• B. de tip discontinuu sau discret: sunt acele însuşiri
măsurabile ce nu pot fi exprimate decât prin numere
întregi (nr. copii dintr-o familie, nr. decese, nr. naşteri,
etc.)
Exprimarea datelor statistice
Caracteristici calitative: care se exprimă printr-o
însuşire, o calitate a unitatii statistice: de
exemplu distribuţia populaţiei în funcţie de
caracteristica sex, tipul constituţional, modul de
alimentare, profesia, starea civilă, grupa
sanguină, starea la externarea din spital, mediul
de reşedinta (urban, rural) etc.
• Prin prelucrare, caracteristicile calitative se
transformă în frecvenţe.
Termeni definitorii in analiza statistica medicala
Frecventa bolilor

Morbiditatea este fenomenul îmbolnăvirilor


apărute într-o anumită populaţie şi într-un
interval defmit de timp. Evenimentul luat în
considerare sau unitatea statistică este cazul de
boală.
• Morbiditatea se poate măsura cu ajutorul
următorilor indicatori:
– incidenţa;
– prevalenţa;
– morbiditatea spitalicească;
– morbiditatea individuala;
– morbiditatea cu incapacitate de activitate.
Frecventa bolilor

Cunoaşterea frecvenţei bolilor într-o populaţie în


funcţie de vârsta de apariţie, sex, cauză, etc.,
este utilă în:
• instituirea unor activitati de prevenire şi
combatere a îmbolnăvirilor;
• evaluarea eficienţei şi eficacitatii măsurilor luate;
• planificarea adecvată a îngrijirilor de sănătate;
• evaluarea efectelor economice şi sociale ale
bolii;
• comparaţii naţionale şi internaţionale privind
îmbolnăvirile.
Frecventa bolilor

Incidenţa
• Măsoară frecvenţa cu care apar cazurile
noi de boală într-o anumită populaţie şi pe
parcursul unui interval definit de timp.
– Evenimentul studiat este cazul nou de boală.
• Rata de incidenta se utilizează cu
precădere în studiul morbiditatii prin boli
acute.
Frecventa bolilor

Prevalenţa
• Acest indicator măsoară numărul de cazuri existente de
boală dintr-o populaţie definite, la un moment dat sau pe
parcursul unui anumit interval de timp. Se descrie o
prevalenta generală şi o prevalenta specifică.
• Cazurile noi de boală sunt cunoscute sub denumirea de
cazuri incidente, iar cazurile existente ca şi cazuri
prevalente care includ cazurile noi şi vechi.
• De aceea, numărul cazurilor prevalente pentru un anumit
interval de timp va fi mai mare sau cel puţin egal cu cel
al cazurilor incidente.
Analiza si exprimarea datelor
statistice
Mediana (Me) este valoarea observaţiei care se găseşte
exact în centrul seriei de observaţii, cu condiţia ca
observaţiile să fie dispuse în ordine, crescătoare sau
descrescătoare în serie.
• Mediana este acel indiciu al tendinţei centrale, acea
valoare centrală care împarte un şir de date (ordonat în
sens crescător sau descrescător) în două grupe, egale
ca număr.
• Mediana se găseşte la mijlocul şirului, în sensul că
jumătate dintre valori sunt mai mari, iar jumătate dintre
ele sunt mai mici, în funcţie de modul de ordonare a
valorilor în serie.
Nu are formula de calcul; pentru a o stabili, se ordoneaza
toate valorile obtinute si se stabileste valoarea “centrala”
Analiza si exprimarea datelor
statistice
Modulul (Mo) sau dominanta (varianta dominantă) este
varianta cu frecvenţa cea mai mare dintr-o serie de
observaţii, valoarea care se repetă eel mai des într-un şir
de rezultate, deci el se poate stabili numai pentru seriile
grupate, pentru că numai acestea au variante şi
frecvenţe.
• Modulul poate fi determinat prin simpla examinare a
valorilor unei serii (fără a fi necesare operaţii de calcul).
Dupa sortarea datelor, se insumeaza numarul de repetari
ale valorilor si se identifica frecvanta cea mai mare
Analiza si exprimarea datelor
statistice
Media: reprezinta valoarea medie a unui sir
de masuratori,
Formula: media = (a1+a2+..an)/n
Unde:
a1..an sunt valorile masurate
n este numarul de evenimente
(masuratori)
Analiza si exprimarea datelor
statistice
Deviatia standard (stdev): reprezinta abaterea standard a unui esantion (sir de
valori),
• Formula: STDEV consideră că argumentele sale sunt un eşantion dintr-o
populaţie.
• Dacă datele dvs. reprezintă întreaga populaţie, atunci calculaţi abaterea
standard utilizând STDEVP.
• Abaterea standard este calculată utilizând metoda „nepreferenţială” sau „n-
1”.
• STDEV foloseşte formula următoare:

n xi2  ( xi ) 2
stdev 
n(n  1)
Unde:
n este numarul de evenimente (masuratori)
xi reprezinta evenimentele (masuratorile)
Analiza si exprimarea datelor
statistice
Distributii
Valorile masurate (statistice) se
incadreaza, de regula, intr-o
“distributie statistica”
Cel mai frecvent model de distributie a
valorilor in populatii se modeleaza
dupa distributia Gauss
Distributia Gauss (clopotul lui Gauss)
(v. figura), are urmatoarele
elemente:
µ: valoarea medianei (valoare cel mai
frecvent inregistrata)
: deviatia standard
Analiza si exprimarea datelor
statistice
De regula, la analiza statistica se utilizeaza teste statistice (sau teste de
semnificatie statistica), prin care se stabileste probabilitatea ca datele
obtinue sa indeplineasca anumite criterii de validare.

De exemplu, daca avem un numar oarecare de subiecti, pe care incercam


sa stabilim existenta sau absenta unei patologii, in functie de
determinarile anumitor substante in sange, vom avea:
- valori in grupul de control ((xi, stdev (xi))
- valori din grupul testat ((yi, stdev (yi))

Valorile celor doua grupuri se compara, si se calculeaza probabilitatea ca


grupul control si grupul testat sa reprezinte “aceeasi populatie);
Cu cat valoarea lui p este mai mica, cu atat este mai probabil ca cele doua
grupuri sa reprezinte populatii distincte (de ex, normali si bolnavi)
Analiza si exprimarea datelor
statistice
Exemplu
Se efectueaza determinari ale glicemiei la trei grupuri de subiecti;
Grupul 1 are:
- Media: 80,43 mg/dl
- Stdev: 7,02
Grupul 2 are
- Media: 122,43 mg/dl
- Stdev: 22,84
Grupul 3 are
- Media: 81,14 mg/dl
- Stdev: 6,36
Problema de rezolvat: reprezinta grupuri de subiecti subseturi distincte
sau apartin aceleiasi populatii?
Analiza si exprimarea datelor
statistice
Utilizam ceea ce se numeste “interval de incredere” sau “interval de
confidenta”, care reprezinta un set de valori intre care se va gasi
valoare medie a unui esantion (grup)
Se formuleaza ipotezele statistice,
Ipoteza H0 (ipoteza nula): datele comparate nu difera intre ele
Ipoteza H1 (ipoteza alternativa): datele comparate difera intre ele
Se testeaza “Ipoteza H0”
Se calculeaza valoarea p (cuprinsa intre 0 si 1), care reprezinta
probabilitatea de a comite o eroare daca respingem Ipoteza H0.
In analiza, utilizam o serie de praguri de semnificatie, de exemplu
5%, 1%, 0,05%.
Un prag de 5% inseamna ca cele doua populatii sunt diferite, cu o
probabilitate de 95%, sau ca probabilitatea de identitate este de
5%.
Analiza si exprimarea datelor
statistice
Compararea grupurilor 1 si 2,
rezulta: p = 0,00056

 Ceea ce inseamna ca probabilitatea ca grupurile


sa fie diferite este de 99,94%
Se valideaza “Ipoteza alternativa”, valorile
pentru Grupul 1 si cele pentru Grupul 2 sunt diferite
intre ele.
Comparatia 1 cu 3, p=0,845;
 probabilitatea ca grupurile sa difere este de
15,5%, ceea ce conduce la validarea “Ipotezei nule”
(adica Grupul 1 si Grupul 3 nu difera inre ele)