Sunteți pe pagina 1din 22

Universitatea Ștefan cel Mare din Suceava

Departamentul de Sănătate și Dezvoltare Umană

Informatică Medicală și
Biostatistică
C7 – Introducere în statistică. Descrierea şi reprezentarea grafică și
tabelară a datelor. Eșantionarea statistică și tipuri de date

Titular: Daniel Șterbuleac


An I, sem. I
Specializarea AMG
A. Introducere în statistică
• Statistica este un ansamblu de metode utilizate în proiectarea unui experiment și analiza datelor
cu scopul de a putea formula concluzii ce au un grad ridicat de certitudine.

• Se ocupă cu:
colectarea
prelucrarea
analiza
interpretarea
prezentarea
datelor obținute prin diferite metode.

• Vizează, de obicei, utilizarea unui volum mare de date numerice și are ca scop principal
inferența trăsăturilor unui întreg prin raportare la un set reprezentativ de părți (eșantion).
Alte definiții

• Statistica este știința care se ocupă cu realizarea de inferențe privind


anumite fenomene aleatorii folosind un mijloc limitat de resurse.

• Practic, problema de bază a statisticii constă în inferența (deducerea)


caracteristicilor unei populații pe baza datelor provenite de la
eșantioane.

• Statistica ca știință se poate diviza în:


-statistica matematică
-statistică aplicată
Există două tipuri/ramuri principale de statistică:

1. Statistica descriptivă
caracterizează un set de date limitat prin
 afișarea informațiilor sub formă grafică
 descrierea felului în care aceste date sunt distribuite
 caracterizarea modului de distribuție al acestor date
presupune utilizarea unor metode și concepte relativ simple

2. Statistica deductivă sau inferențială


utilizează un arsenal complex de metode specifice
în vederea deducerii (extrapolării) informațiilor despre un întreg (o populație)
folosind datele caracteristice unor eșantioane
vizează și are ca scop interpretarea datelor
• Metodele statistice presupun utilizarea calculatorului în scopul
efectuării calculelor complexe.

• Exemple de programe statistice:


• SPSS
• R
• SAS
• Stata
• MINITAB
• Excel (+module: Data analysis, XLStat etc.)
Concepte de bază utilizate în statistică:

populație statistică – un set unitar de date


toți pacienții cu diabet zaharat din România
eșantion – o porțiune reprezentativă selectată dintr-o populație dată în
vederea analizei
măsurarea statistică – desemnarea unor numere sau coduri, pe baza unor
criterii bine stabilite; astfel, se obțin valori
individ – un element al unei populații; unitatea asupra căreia se pot realiza
măsurători statistice. indivizii se pot denumi observații statistice
variabila – o caracteristică a membrilor unei populații; aceasta se poate
modifica de un individ la altul, de la o perioadă de timp la alta etc.
-vârsta, sex, glicemie, prenume, anul nașterii
datele – valori individuale ale variabilelor în populație
Observația 1
Observația 2
Formular de colectare a datelor

Observația 5
VARIABILE VALORI
Nume Stoica
Prenume Marian
Sex (M sau F) M
Vârstă 29
Nivel HDL colesterol 50
Nivel glicemie 100
Nivel predispoziție genetică
la boli cardiace 2
(1-scăzut, 2-moderat, 3-ridicat)
Biostatistica

-ramură distinctă a statisticii care presupune aplicarea metodelor


statistice în științele vieții, cum ar fi: biologie, biochimie, medicină ș.a.

-disciplina ce are ca scop tratarea și analiza datelor numerice obținute


din studii biologice, biomedicale, sau de sănătate.

-biostatisticianul este atât un detectiv al datelor, cât și un judecător.


Folosind metodele statistice, biostatisticianul caută să descopere modele
(engl. patterns) și indicii, iar ulterior să judece dacă se poate avea
încredere în dovezile găsite.
B. Descrierea şi reprezentarea grafică și tabelară a
datelor
• În urma unui studiu statistic, este necesară includerea datelor colectate
sub forma unor tabele de date.

• Se ține cont de următoarele aspecte:


• fiecare rând conține o singură observație
• fiecare coloană conține o singură variabilă
• fiecare celulă a tabelului conține o singură valoare.

• Prin sintetizarea datelor, se pot realiza grafice. Toate graficele trebuie să


fie ușor de citit și să aibă toate informațiile minime prezente.
Alte reguli de respectat la realizarea graficelor și a tabelelor

• Toate graficele și tabelele trebuie să aibă un titlu, obligatoriu!

• La tabele
• În celule se plasează date indivizibile ex: tensiunea arterială 17 cu 9 se va trece în
două coloane, sistolică și diastolică
• La grafice
• Axele sunt definite, se trece pe axe indicatorul măsurat
• Întotdeauna se precizează unitatea de măsură utilizată, pe axe sau chiar sub
formă de etichete aplicate pe anumite grafice.
Observația 1
Observația 2
Formular de colectare a datelor

Observația 5
VARIABILE VALORI
Nume Stoica
Prenume Marian
Sex (M sau F) M
Vârstă 29
Nivel HDL colesterol 50
Nivel glicemie 100
Nivel predispoziție genetică
la boli cardiace 2
(1-scăzut, 2-moderat, 3-ridicat)
Nr. crt Nume Prenume Sex Vârstă HDL Glicemie Predispoziție
1 Stoica Marian M 29 50 100 2
2 Viorel Marcel M 35 39 110 1
3 Murgescu Ionel M 50 50 95 3
4 Oancea Viorica F 35 65 85 1
5 Olănescu Ioana F 25 65 93 1
Distribuția de frecvență
• Statistica descriptivă include și prezentarea sub formă vizuală a datelor
• Luând următorul set de date: 1, 2, 3, 4, 6, 9, 9, 8, 5, 1, 1, 9, 9, 0, 6, 9

Ex. frecvența apariției numărului 9 este 5.


Rearanjând și grupând, obținem
Număr Frecvență 6

0 1
5
1 3
2 1 4
3 1
4 1 3

5 1
2
6 2
7 0 1
8 1
9 5 0
0 1 2 3 4 5 6 7 8 9
1. Grafice tip „bare” (bar chart, column chart)

Date tip interval


(histograme)

Date nominale
30000
25000
20000
15000
10000
5000
0
Mediul urban Mediul rural Nespecificat

Proveniența pacienților
Distribuții de frecvență

• Prezentarea, tabelară sau grafică, a frecvențelor de apariție a


variabilelor
Alt exemplu: (Distribuții de frecvență)
Valoarea TGO sanguin la 10 pacienți: 22, 20, 18, 23, 20, 25, 22, 20, 18, 20 mcg/ml
Valoare Frecvență
18 2
5
19 0 4

Frecvență
20 4 3
21 0 2
22 2 1
23 1 0
18 19 20 21 22 23 24 25
24 0
Valori individuale
25 1
8
6
Frecvență

Valoare Frecvență 4

15-19 2 2
20-24 7 0
15-19 20-24 25-29
25-29 1
Clasă de valori (interval)
Tipuri de (a)simetrie ale unei distribuții
2. Grafice tip liniar (line chart)

Utilizate preponderent pentru analiza evoluției temporale a unui


eveniment.
Cheltuielile cu sănătatea per persoană, în dolari, în Germania
3. Grafice tip „plăcintă” (pie chart)

• Rar folosite în prezent.


• Marchează părțile dintr-un întreg (100%)

35%

65%

Urban Rural
C. Eșantionarea statistică și tipuri de date

Eșantionarea

-Modalitatea de selectare a unui set reprezentativ de indivizi ai unei populații, în


vederea realizării unor analize/experimente și, ulterior, a inferenței rezultatelor
asupra populației.

-Are un rol extrem de important în obținerea unor date de calitate și a unor


rezultate cu un grad de acuratețe ridicat.

-Eșantionul trebuie să fie suficient de mare și se poate realiza prin diferite metode
cum ar fi: aleatorie, prin grupare, sistematică (al n-lea individ) etc.
Tipuri de date

• în funcție de calitatea lor, deosebim

-date calitative (non-numerice)


-date cantitative

• în funcție de tipul lor, deosebim

-date numerice: vârstă


-date ordinale: stadiul evolutiv al unei boli, gradul de rudenie; se utilizează de obicei
cifre romane
-date nominale: culoarea ochilor, a pielii; nu au ordine și nu pot fi numărate
-date alfanumerice: nume, prenume, locul de muncă
De reținut este următoarea structură a tipurilor de date frecvent utilizate în
analiza statistică:

• Date nominale (calitative)


• Nu au ordine și permit gruparea indivizilor în grupe
• Pot fi uneori create din variabile cantitative (ex: transformarea valorii TA în normotensivi și hipertensivi)
• Ex: Sex (M sau F), grupa sangvină (A, B, AB, 0)

• Date ordinale
• Variabile cu valori ce pot fi ordonate, fără a exista o diferență strict definită între diferitele valori
• Ex: stadiul unei boli (I, II sau III), scale de apreciere a opiniei (1-puternic de acord, 2-acord .....)

• Date numerice (cantitative)


• Observații ce pot fi plasate în mod bine definit pe o scală numerică
• Pot fi de tip
-discret, numărabile: vârsta (ani), număr repetări (ex. numărul de genuflexiuni)
-continue, nenumărabile ex: greutatea (50,15 kg)
Resurse suplimentare

Materialele suplimentare prezentate la curs vor fi postate pe Classroom.

S-ar putea să vă placă și