Sunteți pe pagina 1din 46

STATISTICA INFERENIAL

estimarea parametrilor
testarea ipotezelor.

Tipuri de distributii
Curba distribuiei poate fi:
unimodal
multimodal,
aplatizat
nalt,
simetric
asimetric
Tipuri de distributii (I)
Distributia binomiala este distributia rezultatelor
posibile dintr-o serie de date caracterizate prin 2
categorii mutuale exclusive
Distributia uniforma sau distributia rectangulara
este distributia in cadrul careia toate evenimentele
apar cu aceeasi frecventa
Tipuri de distributii (II)
Distributia normala sau distributia gaussiana este
o distributie continua, simetrica, poate fi definita
numai printr-un numar mare de masuratori
Distributia log-normala, este o distributie non-
normala cand pentru prezentarea grafica este folosita
scala aritmetica , dar este normala cand pentru
reprezentarea grafica este folosita scala logaritmica
Distributia Poisson sau legea evenimentelor rare este
folosita pentru descrierea aparitiei evenimentelor rare dintr-o
populatie numeroasa
Distributia normala (Gauss Laplace)
Este o distributie teoretica,
continua, simetrica, unimodala,
si poate, teoretic, sa varieze
intre infinit si +infinit.
Curba distributiei normale are
doua cozi simetrice si este
determinata prin media si
deviatia standard a populatiei .
Media, mediana si modulul unei
populatii distribuite normal sunt
egale.
Distributia normala
Corespunde reprezentrii grafice a unei caracteristici pentru care
exist un mare numr de msurri, tinznd spre infinit
Are form de clopot. Cea mai mare parte a valorilor se
concentreaz n zona central (medie)
Este perfect simetric pe ambele laturi ale sale
Linia curbei se apropie la infinit de axa X, fr a o atinge vreodat
n conformitate cu proprietatea 2, de fiecare parte a mediei se afl
exact jumtate dintre valorile distribuiei
Curba normal (clopotul lui
Gauss. )
2
2
2
) (
2
1
) (
o

[
=
x
e x f
Aria de sub curba normal vzut ca
probabilitate
Pe msur ce extragem mai multe valori,
curba de distribuie a acestora ia o form
care se apropie de forma curbei normale.
Extrgnd la infinit valori aleatoare, vom
obine o distribuie normal perfect,
exprimabil printr-o curb normal perfect.
Considerm c valorile de sub curba normal sunt
rezultatul unei ipotetice extrageri aleatoare
Probabilitate
Probabilitatea nseamn frecvena relativ a
apariiei unui eveniment.
Subiectiv, se traduce prin ct de siguri putem fi
c acel eveniment apare.
Probabilitatea reprezint raportul dintre
evenimentul favorabil i toate evenimentele
posibile.
Valoarea probabilitii variaz ntre 0 i 1.
Probabilitatea poate fi exprimat i n procente.
De exemplu, probabilitatea de 0.05 corespunde
unui procentaj de apariie de 5%
Frecvena relativ a apariiei unui eveniment=PROBABILITATE
HGB g/dL Frecventa
Frecvena
cumulat
Frecvena relativ
12 3 3 0,05
13,3 2 5 0,03
13,5 5 10 0,08
13,6 2 12 0,03
13,7 2 14 0,03
13,8 7 21 0,12
14,1 2 23 0,03
14,5 5 28 0,08
14,6 8 36 0,13
14,7 7 43 0,12
14,8 3 46 0,05
15 2 48 0,03
15,2 5 53 0,08
15,3 3 56 0,05
15,4 2 58 0,03
15,7 1 59 0,02
16,4 1 60 0,02
Aria de sub curba normal vzut ca
probabilitate
dac p<0.05
evenimentul are mai puin de 5% anse s
apar, n condiiile unei distribuii
corespunztoare curbei normale.
Procentajul ariilor de sub curba normal
poate fi citit, deci, i ca probabilitatea a
distribuiei.
Utiliznd simbolul p (de la probabilitate),
spunem c :
Distribuia mediei de eantionare
unde:
este media populaiei,
m
i
sunt mediile fiecrui eantion constituit,
k este numrul eantioanelor.
POPULAIE
eantion k eantion 3 eantion 2
eantion 1
Populaia Eantioane
Distribuia
mediei de
eantionare
1 1,2,3 M
1
=2.00
2 1,2,4 M
2
=2.33
3 3,4,1 M
3
=2.67
4 2,3,4 M
4
=3.00
=2.5
=1.29
Toate eantioanele posibile
pentru N=3
=10.00
m=10/4=2.5
Pentru exemplificare, se presupune o populaie
constituit din valorile 1,2,3,4
media mediilor eantioanelor extrase (denumit medie de eantionare)
este identic cu media populaiei (n cazul dat: m==2.5).
Media fiecrui eantion variaz n jurul mediei de
eantionare.
Media fiecrui eantion pot fi considerat
O ESTIMARE a mediei de eantionare.
Media distribuiei eantioanelor coincide cu
media m a populaiei din care extragem
eantioanele
mprtierea distribuiei de eantionare
(eroarea standard a mediei)
Distribuia de eantionare nu are aceeai
mprtiere ca i a distribuia valorilor
variabilei de origine.
Deviaia standard asociat
distribuiei mediilor de eantion,
cunoscuta i sub numele de
eroarea standard a mediei, este
definita prin:
n
M
o
o =
EROARE STANDARD A MEDIEI
N
s
m
o
=
abaterea standard a distribuiei de eantionare este o
fraciune din abaterea standard a populaiei, fiind
dependent de mrimea eantionului
Unde:
- s
m
este eroarea standard a mediei
de eantionare,
- o este abaterea standard a
populaiei
- N este volumul eantionului
Prin creterea volumului eantionului, media
eantionului se apropie tot mai mult de
media populaiei
Teorema limitei centrale
Cu ct numrul eantioanelor realizate dintr-
o populaie (tinznd spre infinit) este mai
mare, cu att media distribuiei de
eantionare se apropie de media populaiei.
Distribuia mediei de eantionare se supune
legilor curbei normale, cu condiia ca volumul
eantioanelor s fie suficient de mare.
Ct de mare trebuie s fie un
eantion pentru a putea fi
considerat suficient de mare?
Eantionul de referin trebuie s
cuprind cel puin 30 de subieci
Orice eantion avnd cel puin 30 de
valori este considerat eantion mare
Orice eantion cu mai puin de 30 de
valori este considerat eantion mic.
Estimarea intervalului de ncredere
pentru media populaiei
Teorema limitei centrale permite estimarea nivelului
de ncredere pentru media populaiei, pe baza
mediei unui eantion extras din acea populaie
Se poate determina cu o anumit probabilitate, care
este intervalul n care se afl media populaiei,
cunoscnd doar media unui eantion extras din
aceasta i deviaia standard a eantionului.
Estimarea mediei i dispersiei
populaiei
Prin estimaie se nelege operaia de
extindere, in limitele specificate de
incertitudinea exprimat n termeni
probabilistici, a rezultatelor obinute
n sondaj asupra ntregii populaii.
Curba normal - proprietate
n
96 . 1 m
o

n
96 . 1 m
o
+ m
95 . 0 aria =

Areun numr
bine definit de
valori pe un
interval simetric
n jurul mediei.
ESTIMAREA
se bazeaz pe
aceast
proprietate
Intervalul de ncredere pentru
medie cu probabilitatea de 95%
(

+
n
s
m
n
s
m 96 . 1 , 96 . 1
n
96 . 1 m
o

n
96 . 1 m
o
+ m
95 . 0 aria =

limita
inferioar
limita
superioar
z=1.96 se numete z critic deoarece reprezint
un prag limit, de o parte i de alta a mediei
Exemplu:
Se consider populaia valorilor
1,2,3,4,5,6,7,8,9,10, pentru care se calculeaz
=5.5 i o=3,0276.
Din aceast populaie se extrag cinci eantioane
aleatoare (pentru uurina calculelor, s-a ales
pentru fiecare eantion N=3).
Mediile i abaterile standard pentru cele cinci
eantioane selectate au valorile:
m
1
=5.00 m
2
=4.5 m
3
=4.0 m
4
=2.5 m
5
=5.5
s
1
=5.65 s
2
=4.94 s
3
=4.24 s
4
=2.12 s
5
=6.36
1,2,3,4,5,6,7,8,9,10,
=5.5 i o=3,0276.
se extrag cinci eantioane aleatoare (pentru uurina calculelor,
s-a ales pentru fiecare eantion N=3).
Mediile i abaterile standard pentru cele cinci eantioane
selectate au valorile:
375 . 5
4
5 4 3 2 1
=
+ + + +
=
m m m m m

mprtierea distribuiei de eantionare este, mai mic dect mprtierea


variabilei la nivelul ntregii populaii, deoarece o parte a mprtierii generale
se concentreaz, i se pierde, n media fiecrui eantion extras
0,957411
10
0276 , 3
= = =
N
S
m
o
Estimarea parametrilor

Prin estimaie se nelege operaia de extindere, in
limitele specificate de incertitudinea exprimat n
termeni probabilistici, a rezultatelor obinute n
sondaj asupra ntregii populaii.
Estimarea reprezint procesul utilizrii informaiilor
obinute de la un eantion ales la ntmplare n scopul
obinerii de concluzii referitoare la valori ale
parametrilor ce caracterizeaz populaia.
Necesitatea estimrii
Din raiuni economice i
de logistic, pentru
urmrirea de exemplu a
unui anumit efect
(terapeutic) nu se poate
lua in studiu o ntreaga
populaie.
Se poate realiza un
studiu pe un eantion
ales la ntmplare, pe o
perioada determinata de
timp.
Intervale de ncredere i limite
de ncredere
Estimatorii nu au o probabilitate asociat care s indice ct
de corect este valoarea lor.
Se poate asocia o probabilitate la estimarea unui interval.
Intervalele estimate sunt numite intervale de ncredere;
Extremitile intervalului de ncredere sunt numite limite de
ncredere.
Estimarea statistic se face
cu ajutorul intervalului de
ncredere (estimare)
Intervalul de ncredere are 2 limite:
limita inferioar
i

limita superioar
s
.

Intervale de ncredere
Intervale de ncredere se pot stabili
pentru orice parametru
Intervalele de ncredere sunt din ce n
ce mai utilizate in literatura medicala


Intervalul ( x , x + ) acoper parametrul media
x (media) cu o probabilitate dat P

P(x < m < x + ) =1o

1-o este nivelul de ncredere

o prag de semnificaie.

Interval de incredere pentru medie
Nivele de ncredere
1. 1-0,05=0,95 (95%)

2. 1-0,01=0,99 (99%)

3. 1-0,001=0,999 (99,9%)


o
Prag de semnificatie

Etape:
1. Stabilirea eantionului
2. Determinarea volumului eantionului (n)
3. Determinarea mediei eantionului (m)
4. Determinarea dispersiei eantionului (s)
5. Determinarea erorii standard a mediei
6. Determinarea argumentului z
o
7. Determinarea intervalului de ncredere

n
s
s
m
=
| |
o o
z s m z s m m
m m
+ e ;
Intervalul de ncredere al mediei cnd
se cunoate dispersia populaiei (o
2
)
n
u x
n
u x
o
+ < <
o

o o
o=0,05 sau o=5% u
o
=1,96
o=0,01 sau o=1% u
o
=2,58
o=0,001 sau o=0,1% u
o
=3,29
n este volumul seleciei extrase
X este media seleciei extrase
o
2
este dat i este dispersia populaiei

Intervalul de ncredere al mediei
cnd nu se cunoate dispersia
I. N>120
n
S
u x
n
S
u x + < <
o o
reprezint eroarea standard a mediei
n
S
II. N<120
n
S
t x
n
S
t x
1 n , 1 n ,
+ < <
o o
unde t
o,n-1
se citete din tabelul cu distribuia "t" la
nivelul o i n-1 grade de libertate
Exemple.
Fie dat o populaie cu repartiie normal avnd
media i dispersia o
2
=1296. S-a extras o selecie
de volum n=9 pe baza creia s-a calculat =195.
S se calculeze intervalul de ncredere ale mediei a
populaiei.
x
Rezolvare.
n
u x
n
u x
o
+ < <
o

o o
12
9
1296
n
= =
o
Pentru diferite nivele de ncredere se obine:
o=0,05 171,48<<218,52 (p= 95%)
o=0,01 64,04<<225,96 (p= 99%)
o=0,001 155,52<<234,48 (p= 99,9%)


Exemple.
Se consider repartiia procentual de grsime a
laptelui la rasa Roia. Pentru o selecie de n=93 s-a
obinut media X=3,95 i S
2
=0,07.
S se estimeze procentul mediu de grsime a laptelui
de vac la aceast ras de vac.
Rezolvare.
n<120
n
S
t x
n
S
t x
1 n , 1 n ,
+ < <
o o
t
0,05;93-1
= t
0,05,92
=1,986
t
0,01;92
=2,631;t
0,001;92
=3,402
Se estimeaz cu o probabilitate de 95 % c 3,905<<3,995
Se estimeaz cu o probabilitate de 99 % c 3,89<<4,01
Se estimeaz cu o probabilitate de 99,9 % c 3,87 <<4,03
Propunem spre rezolvare urmtoarea problem:

Pentru un lot format din 50 de vaci din rasa Blata romneasca
s-au obinut urmtoarele valori pentru producia de lapte:
7 27 23 7 16
18 10 9 16 11
11 6 29 12 15
19 8 26 22 17
29 29 7 27 14
29 19 23 16 24
28 24 11 21 8
19 13 25 7 18
Considernd ca acest caracter are o repartiie normala, sa se
estimeze cu probabilitatea de 95%, 99% i 99,9% intervalul de
ncredere al parametrului "producia medie zilnica de lapte" la
vacile din aceasta rasa.
Este necesar s se calculeze
Media eantionului
Eroarea standard a mediei
Determinarea valorii z
o
pentru nivelul de ncredere de
95%, 99% respectiv 99,9%.
Calculul efectiv a limitelor intervalelor de ncredere
Exprimarea corect este
urmtoarea:
Cu probabilitatea de 95%, intervalul de ncrede ncredere
al parametrului "producia medie zilnica de lapte" la vacile
din rasa Blat romneasca este cuprins ntre 15,08 i
19,91.
Cu probabilitatea de 99%, intervalul de ncrede ncredere
al parametrului "producia medie zilnica de lapte" la vacile
din rasa Blat romneasca este cuprins ntre 14,27 i
20,72
Cu probabilitatea de 99,9%, intervalul de ncrede
ncredere al parametrului "producia medie zilnica de
lapte" la vacile din rasa Blata romneasca este cuprins
ntre 13,25 i 21,741.
Interpretarea intervalului de
ncredere
Intervalul de ncredere al mediei estimeaz
intervalul care include producia medie
zilnica de lapte, necunoscut a populaiei
de vaci din rasa Blata romneasca, cu
un anumit nivel de ncredere.
Putem afirma c producia medie zilnica
de lapte a populaiei de vaci din rasa
Blata romneasca se gsete n
intervalul [15,08;19,91]cu o eroare de
0,05.
Determinarea volumului n al
eantionului
n
s
z m
n
s
z m + < <
o o

o erval int
n
s
z =
o
o 2 2
2
|
.
|

\
|
=
o
o
s
z n
o
Exemplu.

S se afle numrul de observaii ce trebuie
efectuate pentru a estima talia medie a
populaiei brbailor adulte dac se tie c S
2
=9
cm
2
i se cere o precizie o=1 cm, care s fie
asigurat cu probabilitatea 1-o= 0.95


o=0.05
S=3 cm
z
o
=1,96

35 574 , 35
1
3
96 , 1
2
~ =
|
.
|

\
|
= n
z
o
=1,96
pentru n=34
z
0,05;34
=2,033
37 197 , 37
1
3
033 . 2
2
~ =
|
.
|

\
|
= n
Sunt necesare 37 de observaii pentru estimarea taliei
medii cu precizia de 1 cm.

S-ar putea să vă placă și