Documente Academic
Documente Profesional
Documente Cultură
Intervale de ncredere
Distribuia normal
Distribuia normal!
Form de clopot
Greutatea la natere (g)
Distribuia normal
Distribuia normal!
nlimea (g)
Distribuia normal
Media = 3384 g
Variana = 201164 g2
SD = 449 g
Media = 162.2 cm
Variana = 49.7 cm2
SD = 7.1 cm
nlimea (g)
Distribuia normal
Media = 3384 g
Variana = 201164 g2
SD = 449 g
Curbe normale diferite!
Media = 162.2 cm
Variana = 49.7 cm2
SD = 7.1 cm
nlimea (g)
Distribuia normal
Distribuia normal i nu este doar o distribuie ci o
ntreag familie de distribuii!
Un anumit membru al acestei familii este definit prin
dou numere numite parametri.
Un parametru este un termen matematic adic un
numr care definete un membru al unei anumite
clase.
Parametrii distribuiei normale sunt media () i
variana (2).
Cele dou numere identific membrul familiei
distribuiei normale.
Distribuia normal
Parametrii distribuiei normale sunt media i variana.
Cele dou numere identific membrul familiei distribuiei
normale.
Membrul familiei cu
Densitate de frecven
relativ
media () = 0 i
variana (2) = 1
se numete
distribuia normal
standard.
Variabil normal
Distribuia normal
Parametrii distribuiei normale sunt media i variana.
Cele dou numere identific membrul familiei
distribuiei normale.
Densitate de frecven
relativ
Distribuiile sunt
aceleai n termenii
abaterii standard fa
de medie!
Variabil normal
Distribuia normal
Distribuia normal este important din dou motive:
1. Multe variabile naturale sunt foarte apropiate sau
destul de apropiate de aceast distribuie ceea ce
ne permite utilizarea n analiza lor a metodelor
statistice care cer distribuia normal.
Distribuia normal
Nu exist nici o formul simpl care s lege variabila de aria
de sub curb.
Astfel nu putem gsi o formul pentru a calcula frecvena
ntre dou valori alese ale variabilei i nici valoarea n cazul
n care s-ar depi un anumit procent de observaii.
Au dezvoltat mai multe metode numerice de calcul pentru
aceasta cu o precizie acceptabil folosite n obinerea de
tabele extinse de valorile distribuiei normale.
Software-ul statistic (i nu numai!) are implementate
metodele numerice de calcul a frecvenelor pentru
distribuia normal dar i pentru alte distribuii cunoscute.
Distribuia normal
Valori importante din tabela distribuiei normale:
1. Estimm c 68% din observaii se afl n intervalul de o
abatere standard de o parte i de alta a mediei
2. Estimm c 95% din observaii s afl n intervalul de
1.96 abateri standard de o parte i de alta a mediei
3. Estimm c 99.7% din observaii s afl n intervalul de
3 abateri standard de o parte i de alta a mediei
Regula celor 3 !
Aceste afirmaii sunt adevrate pentru orice distribuie
normal indiferent de medie, varian sau abatere
standard.
Eantionare
Cele mai multe date de cercetare provin de la subieci pe
care i vedem ca formnd un eantion prelevat dintr-o
populaie mai mare.
Eantioanele ne spun ceva referitor la populaia din care
sunt extrase.
Exemplu:
Mostr de snge (eantion) pentru estimarea concentraia de
glucoz.
O pictur de snge reprezin sngele din ntregul corp.
Obinem trei valori ale msurtorilor: 6.0, 5.9, i 5.8.
Care dintre acestea este corect?
Rspuns: nici una - valorile sunt toate estimri pentru aceeai
cantitate si nu tim dac vreuna dintre ele este cea adevrat!
Eantionare
Cele mai multe date de cercetare provin de la subieci pe
care i vedem ca formnd un eantion prelevat dintr-o
populaie mai mare.
Eantioanele ne spun ceva referitor la populaia din care
sunt extrase.
Exemplu:
Trei studii pentru compararea bandajul de compresie multistrat
elastic cu cel inelastic pentru ulcer venos .
Se obin urmtoarele diferene: 13%, 25% i 20% la pacieni cu
vindecare complet n favoarea bandajului elastic (Fletcher et al,
1997)
Toate estimrile n avantajul bandajului elastic!
Exist o variabilitate aleatorie natural ntre eantioane!
Fletcher A, Nicky Cullum N, Sheldon TA. (1997) A systematic review of compression treatment for venous leg ulcers. British
Medical Journal 315, 576-580.
Eantionare
Estimrile care se pot obine din toate eantioanele
posibile extrase n acelai mod dintr-o populaie au o
distribuie.
Aceast distribuie poart numele de distribuie de
eantionare.
Distribuii de eantionare
Exemplu: Un zar obinuit cu 6 fee.
Prin aruncarea zarului se va obine un scor care va juca
rolul msurtorilor originale care ar putea fi fcute.
Prin aruncarea unui zar se obine unul dintre cele ase
numere: 1, 2, 3, 4, 5, sau 6.
Obinerea fiecarui numr este posibil n aceeai
proporie i anume de 1/6.
Distribuii de eantionare
Proporiile aruncrilor care reprezint fiecare rezultat
posibil, toate fiind egale cu 1/6 sau 0.167.
SD=1.71
Proporia aruncrilor
Media=3.5
Distribuia rezultatelor
obinute prin aruncarea
unui singur zar!
Media=(1+2+3+4+5+6)/6
Media=3.5
SD=[(1-3.5)2+(2-3.5)2 +
+(3-3.5)2] +(4-3.5)2 +
+(5-3.5)2]/6=1.71
Distribuii de eantionare
Exemplu: Un zar obinuit cu 6 fee.
Prin aruncarea zarului se va obine un scor care va juca rolul
msurtorilor originale care ar putea fi fcute.
Prin aruncarea unui zar se obine unul dintre cele ase
numere: 1, 2, 3, 4, 5, sau 6.
Obinerea fiecarui numr este posibil n aceeai proporie
i anume de 1/6.
Acum, s presupunem c suntem n situaia de a nu
cunoate media valorilor.
Vom considera un eantion de rezultate provenite din
aruncarea (simultan) de zaruri care ne va permite
estimarea mediei.
Distribuii de eantionare
S considerm dou zaruri aruncate simultan i calculm media
celor dou valori obinute pentru a estima media populaiei
tuturor valorilor obinute prin aruncarea de dou zaruri.
SD=1.21
Proporia aruncrilor
Media=3.5
Media=1 :(1,1)
prop=1/36=0.0277
Media=1.5; (1,2), (2,1)
prop=2/36=0.0555
Media=2: (1,3), (3,1), (2,2),
prop=3/36=0.0833
Distribuii de eantionare
SD=1.71
Proporia aruncrilor
Media=3.5
SD=0.85
Proporia aruncrilor
Media=3.5
Media=3.5
SD=1.21
Proporia aruncrilor
Proporia aruncrilor
Media=3.5
SD=0.70
Distribuii de eantionare
Observaii (generale):
Distribuii de eantionare
Media=3.5
SD=1.71
Proporia aruncrilor
Proporia aruncrilor
Media=3.5
SD=0.85
Proporia aruncrilor
Proporia aruncrilor
Media=3.5
SD=1.21
Media=3.5
SD=0.70
Distribuii de eantionare
Pentru aproape toate observaiile pe care le putem face, dac se
consider un eantion format din cteva observaii i se
calculeaz media acestora, indiferent de distribuia populaiei
din care a fost extras eantionul:
1. Mediile acestor eantioane au o distribuie care are aceeai
medie ca media populaiei din care au fost extrase.
2. Distribuia mediilor acestor eantioane are o abatere
standard mai mic dect abaterea standard a populaiei din
care au fost extrase, i cu ct eantioanele au dimensiune
mai mare cu att abaterea standard ale mediilor
eantioanelor va fi mai mic.
3. Forma distribuiei mediilor eantioanelor se apropie de
forma distribuiei normale cnd dimensiunea eantioanelor
crete.
Orice statistic calculat pentru un eantion, precum media,
proporia, mediana sau abaterea standard, are o distribuie de
eantionare.
Eroarea standard
Eroarea standard se folosete pentru a descrie ct de
bun este o anumit estimaie.
Eroarea standard provine din distribuia de
eantionare.
Abaterea standard a distribuiei de eantionare ne
arat ct de bun este statistica calculat pe eantionul
studiat ca o estimare a valorii reale din populaie.
Aceast abatere standard este cunoscut sub numele
de eroare standard a estimrii.
Prin urmare, eroarea standard a mediei valorilor
obinute prin aruncarea a ase zaruri simultan este de
0.70.
Eroarea standard
Oamenii fac adesea confuzie ntre termenii de "eroare
standard" i "abatere standard".
Acest lucru nu este surprinztor: o eroare standard este
un fel de abatere standard!
Vom folosi termenul de "abatere standard" atunci cnd
vorbim despre distribuia unui eantion sau a unei
populaii.
Vom folosi termenul de "eroare standard" atunci cnd
vorbim despre o estimaie calculat pe baza datelor
dintr-un eantion (abatere standard a unei statistici).
Eroarea standard
n exemplu referitor la zaruri, cunoatem cu exactitate ce
distribuia are variabila original deoarece provine de la un
dispozitiv de randomizare foarte simplu (zarul).
n cele mai multe situaii practice acest lucru nu este cunoscut.
Studiul bandajelor elastice versus cele inelastice:
Diferena ntre cele dou procente de ulcere complet vindecate
este de de 13% .
Aceasta este o estimare a diferenei n populaia de pacieni cu
ulcer venos.
Care este eroarea sa standard?
n grupul cu bandaj elastic s-au vindecat 31 din 49 de pacieni iar
n grupul cu bandaj inelastic 26 din 52.
Cunoatem din punct de vedere teoretic din ce familie de
distribuii ar putea face parte diferena. n acest caz, aceasta este
aproximativ distribuia normal.
Eroarea standard
n exemplu referitor la zaruri, cunoatem cu exactitate ce
distribuia are variabila original deoarece provine de la un
dispozitiv de randomizare foarte simplu (zarul).
n cele mai multe situaii practice acest lucru nu este cunoscut.
Studiul bandajelor elastice versus cele inelastice:
Diferena ntre cele dou procente de ulcere complet vindecate
este de de 13% .
Aceasta este o estimare a diferenei n populaia de pacieni cu
ulcer venos.
Care este eroarea sa standard?
n grupul cu bandaj elastic s-au vindecat 31 din 49 de pacieni iar
n grupul cu bandaj inelastic 26 din 52.
Cunoatem din punct de vedere teoretic din ce familie de
distribuii ar putea face parte diferena. n acest caz, distribuia
este aproximativ normal.
Eroarea standard
Studiul bandajelor elastice versus cele inelastice:
ntrebarea este: de care membru al familiei de distribuii
normale depinde diferenia dintre proporia de pacieni din
ntreaga populaie care ar putea vindeca dac folosesc
bandaje elastice i proporia de pacieni din ntreaga
populatie care s-ar putea vindeca dac folosesc bandaje
inelastice?
Acest lucru nu este cunoscut i nu exist nici o modalitate
prin care s aflm.
Cu toate acestea, acestea se pot estima din date folosind
procentele obinute n eantioane i anume 63% (31/49) i
50% (26/52).
Vom calcula eroarea standard considernd cazul n care
procentele necunoscute populaiei ar fi, de fapt, egale cu
cele obinute n eantioane.
Eroarea standard
Studiul bandajelor elastice versus cele inelastice:
Vom calcula eroarea standard considernd cazul n care
procentele necunoscute populaiei ar fi, de fapt, egale cu
cele obinute n eantioane.
Aceast estimaie a erorii standard poate fi folosit pentru a
evalua precizia sau estimaia diferenei.
Eroare standard estimat "eroare standard ??
Pentru diferena ntre cele dou procente cu ulcere
vindecate care a fost de 13 (63-50) eroarea standard este de
10%.
Ex: p1=63%, n1=49, p2=50%, n2=52
SEp1 - p2 = sqrt{ [p1 * (1 - p1) / n1] + [p2 * (1 - p2) / n2] }
=> SEp1 - p2 = 9.77%~10%.
Eroarea standard
Studiul bandajelor elastice versus cele inelastice:
Vom calcula eroarea standard considernd cazul n care
procentele necunoscute populaiei ar fi, de fapt, egale cu
cele obinute n eantioane.
Aceast estimaie a erorii standard poate fi folosit pentru a
evalua precizia sau estimaia diferenei.
Eroare standard estimat "eroare standard ??
Pentru diferena ntre cele dou procente cu ulcere
vindecate care a fost de 13 (63-50) eroarea standard este de
10%.
Ceea ce ne poate induce n eroare este faptul c atunci cnd
se extrag mai multe eantioane dintr-o populaie se obine
mai mult de o eroare standard referitoare la valoarea din
populaie!
Eroarea standard
Eroarea standard a unei estimaii ne spune cum pot fi
obinute estimaiile variabilei n cazul am extrage alte
eantioane din populaie ntr-un mod similar cu eantionul
nostru.
Adesea lucrrile de cercetare includ intervalele de
ncredere i valorile p care derivate din utilizarea erorilor
standard.
Erorile standard estimate pot fi gsite pentru multe dintre
statisticile calculate pentru datele observate i sunt folosite
pentru a face estimri referitoare la populaia din care
eantionul a fost extras.
Notaie:
estimaie SE
Exemplu: Studiul bandajelor elastice versus cele inelastice
diferena = 13% 10%
Intervale de ncredere
Intervale de ncredere sunt un alt mod de a vedea ct
de apropiate sunt estimrile din eantioane fa de la
cantitatea care se dorete a se estima.
Unele (dar nu toate!) intervale de ncredere sunt
calculate cu ajutorul erorii standard.
Intervale de ncredere sunt numite de estimri de tip
interval, deoarece se estimeaz o limit inferioar i
una superioar ntre care sperm s se afle valoarea
real.
O estimare care este un singur numr (de exemplu
diferena observat ntr-un studiu) este numit
estimare punctual.
Intervale de ncredere
Nu este posibil s se calculeze estimri utile de tip
interval care s conin ntotdeauna valoarea
necunoscut din populaie!
Exist ntotdeauna o probabilitate foarte mic ca un
eantion s fie foarte extrem i s conin o mulime de
observaii fie foarte mici sau foarte mari, sau s avem
dou grupuri care difer foarte mult nainte i dup ce
tratamentul este aplicat.
Deci vom calcula un interval n aa fel nct cele mai
multe intervale care se pot calcula s conin valoarea
real din populaia (ceea ce dorim s estimm).
Intervale de ncredere
Vom calcula un interval de ncredere:
(serie de valori obinute pe baza
datelor din eantion) astfel c o
anumit proporie din intervalele pe
care le putem calcula pe baza datelor
din eantioane similare vor conine
valoarea din populaia real.
S considerm un interval de 95%
ncredere calculat pe baza datelor din
eantion, astfel 95% din intervale
calculate pe baza datelor din
eantioane similare vor conine
valoarea real din populaia.
Intervale de ncredere
De exemplu, pentru studiul referitor la bandajul pentru
ulcerul venos avem o valoarea estimat pentru diferen de
13% i o eroare standard de 10%.
Distribuia de eantionaj este de aproximativ normal cu
medie egal cu valoarea necunoscut din populaie pentru
diferen i abaterea standard egal cu eroarea standard,
estimat a fi de 10.
tim c 95% din observaiile din cadrul unei distribuii
normale se afl n intervalul de 1.96 x abaterea standard de
o parte i de alta a mediei (regula celor 3).
Prin urmare 95% din eantioanele posibile vor estima o
valoare pentru diferen, apropiat de valoarea necunoscut
a mediei din populaie, n limitele a 1.96 x 10%.
Intervale de ncredere
Dac am estima c valoarea necunoscut a populaiei
ar fi ntre valoarea observat n eantion minus 1.96 x
eroarea standard i valoarea observat n eantion plus
1.96 x eroarea standard, intervalul obinut ar include
valoarea real din populaia pentru 95% din
eantioanele posibile.
Astfel, intervalul de 95% ncredere este
de la 13 - 1.96 x 10 = -7% la 13 + 1.96 x 10 =33%.
Prin urmare, se estimeaz c diferena real n
populaia se afl ntre -7% i +33%.
Intervale de ncredere
Diferena ntre procentele
de vindecai
celelalte
50%
42%
33%
25%
20%
13%
9%
-7%
-10%
Numrul studiului
Intervale de ncredere
Diferena ntre procentele
de vindecai
celelalte
50%
42%
33%
25%
20%
13%
9%
-7%
-10%
Numrul studiului
Intervale de ncredere
Intervale de ncredere nu includ ntotdeauna valoarea
real a populaiei!
Dac 95% din intervale de 95% ncredere o includ
rezult c exist 5% care nu o includ.
n practic, nu putem spune dac intervalul de
ncredere calculat de noi este unul din cele 95% sau din
cele 5%.
de
pacieni pentru grupurile cu bandaj elastic i respectiv inelastic
i s-a presupus c n ntreaga populaie de pacieni procentul de
pacieni cu vindecare total va fi de 57% n grupul cu bandaj
elastic i 37 % n grupul cu bandaj inelastic.
Din cele 100 de simulri
de ase intervale de 95%
ncredere nu includ
diferena populaiei de
20%.
Estimm s obinem 5%
intervale care au valoarea
real a populaiei n afara
intervalului.
Numrul studiului
4.8
4.9
4.9
4.9
5.0
5.1
5.1
5.2
5.3
5.3
5.4
5.4
5.5
5.5
5.5
5.6
5.6
5.6
5.6
5.6
5.6
5.6
5.7
5.7
5.7
5.8
5.8
5.9
6.0
6.1
6.1
6.1
6.1
6.2
6.3
6.3
6.4
6.4
6.4
6.4
6.4
6.5
6.5
6.6
6.7
6.7
6.8
6.8
7.0
7.0
7.0
7.0
7.1
7.1
7.2
7.3
7.4
7.4
7.5
7.5
7.6
7.6
7.6
7.7
7.8
7.8
7.8
8.2
8.3
8.6
Statistica
Estimaie
Interval de 95% ncredere
Media
6.34
(6.06, 6.64) (metoda SE)
Mediana
6.15
(5.7, 6.5) (metoda binomial)
Se observ c media are o estimaie mai bun dect mediana!
8.7
8.9
9.3
9.5
10.2
10.4
4.8
4.9
4.9
4.9
5.0
5.1
5.1
5.2
5.3
5.3
5.4
5.4
5.5
5.5
5.5
5.6
5.6
5.6
5.6
5.6
5.6
5.6
5.7
5.7
5.7
5.8
5.8
5.9
6.0
6.1
6.1
6.1
6.1
6.2
6.3
6.3
6.4
6.4
6.4
6.4
6.4
6.5
6.5
6.6
6.7
6.7
6.8
6.8
7.0
7.0
7.0
7.0
7.1
7.1
7.2
7.3
7.4
7.4
7.5
7.5
7.6
7.6
7.6
7.7
7.8
7.8
7.8
8.2
8.3
8.6
8.7
8.9
9.3
9.5
10.2
10.4
Statistica
Estimaie
Interval de 95% ncredere
SD
1.3998
(1.1894, 1.6102) (metoda SE)
SD
1.3998
(1.1896, 1.6096) (metoda hi-ptrat)
Se observ c pot exista mai multe modaliti de calcul pentru CI!
Numrul studiului
Numrul studiului
8 intervale
n afar!
6 intervale
n afar!
2 intervale
n afar!
Numrul studiului
Numrul studiului