Sunteți pe pagina 1din 17

Universitatea Oradea

Facultatea de Medicina si Farmacie

Informatica Medicala si
Biostatistica

Dr. Olivia BACIU


Estimarea paramerilor statistici
Introducerea conceptului de estimare
De ce nu calculam direct parametrul?
- Dificultatea sau imposibilitatea utilizarii intregii populatii pentru calculul
parametrilor
- Utilizarea esantionului statistic => calculul statisticilor

Valoarea parametrului ramane necunoscuta

Reda statistica valoarea adevarata a parametrului?


- NU neaparat. Prin utilizarea unui set partial de valori ale observatiilor se
obtin statistici apropiate de valoarea parametrului. Pentru fiecare esantion
se poate obtine o alta valoare a statisticii

Cum facem legatura intre statistica si parametru?


- Pe baza statisticilor calculate, dorim extrapolarea rezultatelor la nivel de
populatie => inferenta statistica (se face legatura intre esantion si
populatia din care este extras)

Informatica Medicala si Biostatistica


Metode de “calcul” a parametrilor
„încercarea de a ajunge la o concluzie privind toţi membrii unei
clase prin observarea doar a câtorva membri” (Runes, 1959)

 Estimarea statistica
 Estimare punctuala => este calculata o singura valoare pentru
parametru
 Estimare prin intervale de incredere => se calculeaza un interval
din care face parte parametrul (cu o probabilitate stabilita)
 Intervale bilaterale
 Intervale unilaterale

 Testarea de ipoteze

Informatica Medicala si Biostatistica


Estimarea statistica
Def: Funcţia de probabilitate de densitate (pdf) a unei statistici se
numeşte distribuţie de eşantionare a statisticii.

Def: Se numeste estimator orice funcţie a observaţiilor efectuate pe


un eşantion
Obs! estimatorul este o funcţie a valorilor observate în timp ce estimarea
punctuală este valoarea funcţiei (valoarea realizată)

Calitatea estimatorului este data de acuratetea de estimare:


Spunem ca un estimator este fără bias dacă speranţa sa matematică este egală
cu valoarea teoretică a parametrului estimat.

Informatica Medicala si Biostatistica


Estimare punctuala

Estimatori fara bias (nedeplasati):

1. Speranta matematica a mediilor observate pe esantioane extrase aleator


este egala cu media teoretica a populatiei din care este extras esantionul.

2. Speranţa matematică a frecvenţelor observate pe eşantioane extrase


aleator este egală cu frecvenţa teoretică p.

3. Speranţa matematică a variaţiilor observate pe eşantioane extrase aleator,


de talie n, este diferita de variatia teoretica

Variatia punctuala este un estimator fara bias al variatiei teoretice.

Informatica Medicala si Biostatistica


Estimarea prin intervale de incredere
Estimarea mediei

Distribuţia de eşantionare a mediei


(Teorema limita centrala- CLT): Pentru o variabilă cantitativă X cu medie μ şi
abatere standard σ, dacă extragem eşantioane aleatoare de dimensiune n
(preferabil o valoare cât mai mare), atunci mediile de eşantionare obţinute
alcătuiesc o variabilă aleatoare care urmează o distribuţie normală (sau
aproape normală), .

Informatica Medicala si Biostatistica


Deviatia standard a distributiei de esantionare a mediei se numeste
eroare standard ( ).

Eroarea standard:
 Cresterea erorii standard duce la scaderea acuratetii valorii estimate fata de
caracteristica populatiei

 Scaderea erorii standard duce la cresterea acuratetii valorii estimate fata de


caracteristica populatiei

Informatica Medicala si Biostatistica


Despre media teoretica cunoastem deja ca apartine urmatoarelor
intervale, cu probabilitatile:

Informatica Medicala si Biostatistica


Intervale de incredere
Intervale bilaterale
1. n>30 si σ cunoscut

Informatica Medicala si Biostatistica


2. n>30, σ necunoscut

3. n<30, σ necunoscut

Informatica Medicala si Biostatistica


Distributia t-Student

Grade de libertate => numarul


de valori care pot varia intr-un
set de date in calculul unei
statistici

notatie: df
Intervale de incredere unilaterale:

 Se doreste aflarea limitei superioare (σ cunoscut):

 Se doreste aflarea limitei inferioare (σ cunoscut):

Informatica Medicala si Biostatistica


Exemplu:

Pentru persoanele diabetice cu vârstă cuprinsă între 40 şi 60 de ani,


distribuţia nivelului glicemiei are media μ şi abaterea σ=50 mmol/l. Pentru
un eşantion de 25 de observaţii, glicemia medie este 200 mmol/l.

Intervalul de încredere 95% este:

Interpretare: Valoarea medie a glicemiei pentru persoanele diabetice cu


vârstă cuprinsă între 40 şi 60 de ani se află cu o probabilitate de 95% în
intervalul (180.4, 219.6). In 5% dintre cazurile în care vom calcula glicemia
medie, aceasta nu va aparţine intervalului.

Informatica Medicala si Biostatistica


Estimarea frecvenţei

Pentru variabilele calitative, fiecare stare a variabilei este întâlnită în


populaţie cu o anumită frecvenţă relativă sau proporţie, p. Astfel, prin
calcularea proporţiilor pe eşantione extrase din populaţie, se obţin
frecvenţele relative pentru valoarea considerată .

Pentru această variabilă aleatoare au loc (in baza Teoremei Limita


Centrala):

Informatica Medicala si Biostatistica


Intervalul de incredere bilateral (σ cunoscut):

Intervalul de incredere unilateral (σ cunoscut):


 limita superioara

 limita inferioara

Informatica Medicala si Biostatistica


Exemplu

Se cunoaşte faptul că persoanele care au antecedente de demenţă în


familie au o predispoziţie către această afecţiune. În urma unui studiu
realizat aleator pe 5000 de persoane, s-a constatat că 100 dintre ele suferă
de demenţă.

Cea mai bună estimare a proporţiei/ frecvenţei bolii este:

Intervalul de încredere de 95% al proporţiei este:

=> Intervalul de incredere de 95% devine: [0.0161; 0.0239].

S-ar putea să vă placă și