Documente Academic
Documente Profesional
Documente Cultură
ESTIMARE
Abaterea standard-exemplu
{1,2,3,4,5}
n=5/m= 3
Xi/n
12345
2 1 0 1 2 - - - - - - (2+1+0+1+2)/5=1.2 - - - - - - - -1.2 (distana medie fa de medie)
(Xi-m) /n
(1-3)+(2-3)+(3-3)+(4-3)+(5-3)=?
Dac se ignor semnele (pozitiv i negativ), considernd toate cifrele ca fiind pozitive (adic valori absolute- dificulti din punct
de vedere matematic (modulul nu are proprieti de continuitate si derivabilitate), ceea ce nu se dovedete a fi foarte util pentru
analiza statistic.
Exist ns i o alt posibilitate de a scpa de semne i anume folosind ptratul acestor abateri. Astfel, prin nsumarea ptratelor
abaterilor vom obine un numr pozitiv numit suma ptratelor abaterilor fa de medie.
(Xi-m)2 /n varian (dispersie)
Suma ptratelor abaterilor fa de medie depinde de dimensiunea eantionului, iar indicatorul statistic
pe care dorim s l obinem este o medie i nu o sum.
Cnd eantionul are o singur valoare observat (media va fi egal cu valoarea observat singular,
diferena dintre valoarea observat i aceast medie calculat va fi nul) - abaterea fa medie va fi
ntotdeauna zero pentru o singur observaie.
Astfel, pentru a estima variabilitatea este necesar ca eantionul s conin cel puin dou observaii.
La o dimensiune a eantionului de o observaie, suma de ptrate este ntotdeauna zero. Astfel, pentru
un calcul corect, suma ptratelor diferenelor fa de medie trebuie s fie proporional cu numrul de
observaii minus 1 i nu cu numrul de observaii
Numrul de observaii minus unu = grade de libertate pentru varian. Astfel, variana se estimeaz
ca media ptratelor abaterilor fa de medie, adic un raport ntre suma de ptrate mprit la
numrul de observaii minus unu (adic la numrul de grade de libertate pentru varian).
(Xi-m)2 /(n-1)
Distribuie normal
Prin ambele
n cazul n care o variabil nu urmeaz o distribuie normal, dac am extrage mai multe
eantioane de observaii, mediile calculate n aceste eantioane urmeaz o distribuie normal
(teorema limit central) miracolul lui Gauss
Distribuia normal
Distribuia normal are multe proprieti utile dar, din pcate, nu exist nici o formul simpl care s lege
variabila de aria de sub curb. Prin urmare, nu putem gsi o formul pentru a calcula frecvena ntre dou valori
alese ale variabilei i, pe de alt parte, nici valoarea respectiv n cazul n care s-ar depi un anumit procent de
observaii
n decursul timpului s-au dezvoltat mai multe metode numerice de calcul pentru toate aceste situaii, cu o
precizie acceptabil
S-au obinut tabele extinse de valori pentru distribuia normal, ale cror exemplificri pot fi gsite n multe cri
de statistic sau specializate n tabele
Pachetele de programe statistice (i nu numai) au implementate majoritatea metodelor numerice de calcul a
frecvenelor, att pentru distribuia normal ct i pentru alte distribuii cunoscute
Estimarea punctual
O valoare a parametrului teoretic estimat - m (media eantionului) este un estimator punctual al mediei
populaiei ( )
Este influenat de fluctuaiile de eantionare
Poate s fie foarte departe de valoarea real a parametrului estimat
EANTIONAREA
DISTRIBUII DE EANTIONARE
Estimrile care se pot obine de la toate eantioanele posibile (extrase n acelai mod
ca i eantionul studiat) au o distribuie care se numete distribuie de eantionare
1, 2, 3, 4, 5, sau 6
Obinerea fiecarui numr este posibil n aceeai
proporie i anume de 1/6 sau 0.167
Me=(1 +2 +3 +4 +5 +6) / 6 = 3.5 (valoarea medie
pe care ne ateptm s o obinem n cazul mai
multor aruncri)
Se poate, de asemenea, calcula i o abatere
standard a valorilor obinute. Aceasta este de
1.71 i reprezint deviaia standard a distribuiei
Source: http://www.mathsisfun.com/data/standard-deviation-calculator.html
Source: http://www.mathsisfun.com/data/standard-deviation-calculator.html
Putem enumera toate posibilitile de aruncare pentru cele dou zaruri i calcula mediile valorilor obinute, i n consecin i
proporiile de aruncri pentru fiecare valoare posibil a mediei
Media=1 (1,1). Prop.=1/36=0.0277
Media=1.5 (1,2), (2,1). Prop.=2/36=0.0555
Media=2 (1,3), (3,1), (2,2). Prop.=3/36=0.0833
Etc.
De asemenea, se poate calcula media i abaterea standard a tuturor acestor medii de valori posibile obinute prin aruncarea a dou
zaruri. Valoarea mediei va fi de 3.5, la fel n cazul aruncrii unui singur zar, dar abaterea standard nu va mai fi aceeai, ci doar
1.21, deci mai mic dect 1.71 care este valoarea obinut n cazul aruncrii unui singur zar
Pentru a estima media populaiei tuturor valorilor posibile ale zarurilor, aruncarea unui singur zar nu este att de concludent,
ntruct, aa cum am vzut, rezultatele pot fi extrem de variabile.
Prin aruncarea a dou zaruri i calculul mediei valorilor obinute din cele dou aruncri se obine o estimaie ceva mai bun.
Estimrile bune sunt considerate cele situate cel mai aproape de mijlocul distribuiei de valori posibile i nu de capetele
acesteia, i, prin urmare, vor fi mai aproape de media real.
Cu ct aruncm mai multe zaruri deodat, cu att estimarea mediei pentru populaie cu ajutorul mediei eantionului
studiat va fi mai exact
Observaii:
1. media distribuiei este ntotdeauna aceeai, i anume 3.5
2. variabilitatea distribuiilor este mult mai mic atunci cnd
numrul de zaruri aruncate crete - n aceast situaie exist mult
mai multe proporii mici de aruncri productoare de medii
apropiate de 1.0 sau 6.0 iar abaterile standard corespunztoare
devin mai mici
3. forma distribuiei se modific cnd numrul de zaruri aruncate
simultan este mai mare, aceasta tinznd s arate mult mai familiar
i fiind similar curbei care corespunde distribuiei normale
1. Dac se consider un eantion format din cteva observaii i se calculeaz media acestora, indiferent de distribuia
populaiei din care a fost extras eantionul, media eantionului va avea o distribuie care are aceeai medie cu media ntregii
populaii
2. Deviaia standard calculat pentru mediile eantioanelor va fi mai mic dect cea a ntregii populaii, i, cu ct eantionul va fi
mai mare ca dimensiune cu att vom avea o abatere standard mai mic pentru mediile eantioanelor
3. Forma distribuiei mediilor eantioanelor se apropie de o distribuie normal cnd numrul de observaii din eantion crete
4. Numim statistic orice numr care se poate calcula pe baza datelor care provin dintr-un eantion, de exemplu media,
proporia, mediana sau abaterea standard.
5. Orice statistic, care se calculeaz pe baza datelor care provin dintr-un eantion va avea asociat o distribuie de eantionare
Eroarea standard
- Utilizat la descrierea/raportarea unei estimri
- Provine de la distribuia de eantionare
- Abaterea standard a distribuiei de eantionare arat ct de potrivit este statistica calculat pe
eantionul studiat ca o estimare a valorii reale din populaie
- Este cunoscut sub numele de eroarea standard a estimrii
Termenii de "eroare standard" i "abatere standard" sunt adesea confundai.
Prin convenie:
"abatere standard" - cnd se vorbete despre distribuia unui eantion sau a unei populaii
"eroare standard" - cnd se vorbete despre o estimaie calculat pe baza datelor dintr-un eantion
(abatere standard a unei statistici)
Erorile standard sunt frecvent menionate n majoritatea lucrrilor publicate sau n rapoartele de cercetare
Eroarea standard asosciat unei estimaii exprim de fapt, cum pot fi estimaiile variabilei respective n cazul
n care am extrage alte eantioane din populaie ntr-un mod similar cu eantionul studiat (propriu)
Cel mai adesea lucrrile de cercetare includ intervalele de ncredere (mai jos) i valorile p (cursurile
urmtoare) care sunt derivate din utilizarea erorilor standard
Pentru majoritatea statisticilor calculate pentru datele observate sunt menionate erorile standard estimate,
care sunt folosite pentru a face estimri referitoare la populaia din care a fost extras eantionul
Intervale de ncredere
Un estimator este cu att mai eficace cu ct variaia sa este mai mic (precizia sa depinde de
mrimea variaiei sale).
Estimarea punctual a unui parametru teoretic furnizeaz o valoare pentru parametrul
teoretic estimat. Valoarea sa este tributar fluctuaiilor de eantionare i poate fi la o mare
distan de valoarea real a parametrului estimat.
Este recomandabil s se estimeze un parametru teoretic nu printr-o singur valoare ci printrun interval, numit interval de ncredere, n care s se poat afirma c parametrul estimat se
gsete cu o probabilitate ridicat.
Intervalele de ncredere reprezint o alt modalitate de a determina ct de apropiate sunt
estimrile din eantioane fa de cantitatea total pe care dorim s o estimm
Mai sunt denumite i estimri de tip interval, deoarece acestea estimeaz o limit inferioar
i una superioar ntre care sperm s se afle valoarea real
O estimare de tip interval este o estimare sub forma unei zone continue de valori posibile
O estimare care este reprezentat printr-un un singur numr este denumit estimare
punctual
Intervale de ncredere
Intervalul de ncredere este un interval mrginit de valori (limitele poart numele de limite de
ncredere); include media caracteristicii studiate.
Cu ct intervalul este mai larg cu att suntem mai siguri c media caracteristicii studiate se va
regsi n acel interval.
Mrimea ncrederii, confidena, este dat de probabilitatea ca valoarea (valorile) studiate s
se gseasc n acel interval.
Ex: Fie P o populaie n care variabila X are o medie teoretic necunoscut. Din populaia P se
extrage la ntmplare eantionul E reprezentativ. In eantionul E pentru variabila X se observ o
medie m i se calculeaz o variaie punctual estimat
Intervale de ncredere
Nu este posibil s se calculeze estimri utile de tip interval care s conin ntotdeauna
valoarea necunoscut din populaie (exist mereu o probabilitate foarte mic ca un eantion
s fie (foarte) extrem i s conin o mulime de observaii, fie foarte mici, fie foarte mari, sau
s existe dou grupuri care s difere foarte mult nainte i dup aplicarea tratamentului
Intervalul calculat final va rezulta din cele mai multe intervale calculate care conin valoarea
real din populaie, adic ceea ce dorim s estimm
Dac, considerm un interval de ncredere de 95% calculat pe baza datelor din eantion,
aceasta nseamn c 95% din intervalele calculate pe baza datelor din eantion vor conine
valoarea real din populaia global
Intervalele de ncredere nu includ ns ntotdeauna valoarea real a populaiei. Dac 95% din
intervalele de 95% ncredere o includ rezult c exist 5% care nu o includ
SAU
Eantion
Inferena
(Extrapolare)
"Atunci cnd este posibil, gsii cuantificri i prezentai-le cu indicatori adecvai de msurare a erorii sau
incertitudinii (cum ar fi intervale de ncredere). Evitai calculele bazate exclusiv pe testarea ipotezelor statistice, cum
ar fi utilizarea valorii p, care nu reuete s transmit informaii cantitative importante."
2. Autorii furnizeaz intervale de ncredere pentru mediile msurtorilor nainte i dup intervenie, n loc s
furnizeze valoarea intervalului pentru media diferenei
3. Calculul intervalului de ncredere pentru o estimaie obinut ntr-un eantion de dimensiuni reduse folosind o
metod conceput pentru eantioane mari