Sunteți pe pagina 1din 15

Econometrie Semestrul al II-lea Facultatea de Informatica Manageriala Asist. univ.drd.

Ovidiu Solomon

Seminarul 4

1. Repartitia normala Este numita repartitie normala datorita urmatoarelor : - in multe cercetari experimentale, mai ales cand acestea privesc erorile de observatie, se da peste aceasta distributie - multe alte distributii, din punct de vedere practice sunt aproximate prin acesta distributie - in conditiile generale, sume de variabile aleatoare repartizate sau nu normal sunt aproximativ normal repartizate Notatie: X ~ (x; ,
2

densitatea de repartitie : fX(x)=


x

1 e 2
1 e 2

1 x 2

,x
2

functia de repartitie : FX(x) = E(X) =

1 t 2

dt

V(X) = Observatie: Functia fX(x) este simetrica fata de x= graficul de mai jos.

, este maxima in x=

si are puncte de inflexiune in x= f(x, , )

asa cum se observa in

1 2

0
Repartitia normala redusa -Z= X

~N(z; 0,1) s.n. variabila aleatoare normata(normala standard) de medie 0 si dispersie 1, unde z=

, Z are deci

densitatea de repartitie fZ(z) =

1 e 2
,

1 2 z 2

si functia de repartitie F(z) =

1 e 2

1 2 t 2

dt

- valorile de pe axa Ox, x-valorile :

2 ,

corespund valorilor de pe aza Oz, z-valorilor : 0, 1, 2, 3, unde z=

- intervale de 95% si 99% : P(Z < 1,96) = 0,975,deci P(0 < Z < 1,96) = 0,975-0,5 = 0,475 sau P(-1,96 < Z < 1,96) = 20,475 = 0.95; in mod similar : P(-2,576 < Z < 2,576) = 0.99 - din punct de vedere practic s-a constatat ca variabila X cu distributie normala in afara intervalului ( 3 , 3 ) ia putine valori (sub 3%). Proprietati
z

(z) =
0

1 e 2
(

1 2 t 2

dt s.n. functia integrala a lui Laplace


1 , 2

(-z) = (0) = 0 ;

(z) (simetria fata de origine) )= ( )=

1 2
1

F(z) = P(

1 2

( z ) , F(-z) = 1- F(z), iar F(x) =


)=

1 2

)
2

) , unde X~N(x; ,

fX(x) FX(x) fZ(z) FZ(z) Graficele densitatilor de reaptitie si functiilor de distributie pentru: distributia normala standard/ distributia normala normata 2. Repartitia
2

(hi patrat)

- este repartitia Gamma cu Notatie: X ~


2

, unde

este un intreg pozitiv(gradele de libertate), si

1 2

1 densitatea de repartitie: fX(x) = 2 ( ) 2

x2 e

1 x 2

, x

functia de repartitie : FX(x) =

2 0

1 2

t2 e

1 2

dt , x 0

( ) 2

E(X) = V(X)= 2 Observatii : 1) Daca X ~ Gamma( 2) Daca X1~


1
2
1

, ) atunci 2 X ~
2
2

2 2

si X2 ~

atunci cu

2
1

si

2
2

independente, atunci : F 1,
1 (cum

X1 / X2 /

1 2

este o repartitie Fisher(repartitia F) cu

grade de libertate.Mai mult, cand


2
1

2 este

mult mai mare decat

este in mod current in econometrie) atunci

X2 /

1 si

deci

F 1 , 2 se comporta ca

3) Daca o v.a. X ~ N(0,1) atunci v.a. Y = X2 are o repartitie are o repatitie 5) numarul 6) se noteaza cu
2

, cu

=1

4) Daca variabilele aleatoare independente X1, X2, , Xn ~ N(0,1), adica au o repartitie normala normata, atunci v.a. X= X 1+X2+ +Xn cu
2 ,

=n , - cuantila superioara a variabilei


2 2

se numeste numarul gradelor de libertate , fiind egal cu numarul variabilelor independente care-l genereaza pe X care se determina astfel incat P(
2

>

2 ,

)=

, unde

reprezinta

aria hasurata din tabelul repartitiei 3. Repartitia t (Student) Notatie: X~ t densitatea de repartitie:
f X (x)= 1

1 2 2 1 1
1

,x
2

x2

1
functia de repartitie :
x

FX (x) =
0

2 2 1

1
1

dt

E(X) = V(X)=

0
2
, unde reprezinta numarul gradelor de libertate ( >2)

Observatii 1) se noteaza cu t
,

- cuantila superioara a variabilei


2

t care se determina astfel incat P( t > t

)=

, unde

reprezinta aria

hasurata din tabelul repartitiei 2)pentru foarte mare(practic

. >30) repatitia Student poate fi aproximata cu repartitia noamla si avem ca t


,

z , unde z se

determina a.i. P(X > z ) =

, iar X~N(0,1)
2

3) daca X si Y sunt doua variabile aleatoare independente si X~N(0,1) si Y~ Inegalitatea Cebsev

, atunci v.a. t = X / Y /

~t

P [ | X - E(X) |

] 1

V (X )
2

Observatii - relatia de mai sus este valabila pentru orice tip de repartitie statistica - daca luam transforma in :

inegalitatea de mai sus devine : P [ | X - E(X) |

k ] 1

1 , k2

0 , iar pentru cazul k = 3, relatia se

P [ |X - E(X)| 3 ] 1

1 9

8 ceea ce insemna ca abaterile absolute ale variabilei aleatoare X fata de media sa E(X) 9
. )=2 si P(|X-E(X)|> ) = 1-2

sa nu depaseasca 3

este foarte mare, adica de cel putin 89%- lege cunoscuta si sub denumirea de regula celor 3 , ) : P(|X-E(X)|<

-pentru distributia normala N(x ;

(X )

(X )

-cu cat este mai mare dispersia unui sir de valori cu atat este mai mare valoarea abaterilor medii patratice si cu cat este mai mica abaterea medie patratica cu atat este mai mare uniformitatea Teorema Cebsev(legea numerelor mari) Daca X1, X2, ..,Xn sunt variabile aleatoare (discrete sau continue) independente, ale caror dispersii sunt mai mici decat o constanta C, atunci oricare ar fi un numar pozitiv :

lim P[|
n

X1

X 2 ...... X n n

E ( X 1 ) E ( X 2 ) ..... E ( X n ) | n

] 1

Observatia 1

X 2 ...... X n atunci inegalitatea Cebsev se scrie : P[| X n ] 1 sus se scrie : lim P[| X E ( X ) |
Daca notam :

X1

E( X ) |

] 1

V (X )
2

, iar teorema de mai

Observatia 2 Daca sirul de variabile considerat are aceeasi medie : E ( X 1 ) Cebsev se scrie : lim P[|
n

E ( X 2 ) ....

E( X n )

atunci expresia initiala a teoremei lui

X1

X 2 ...... X n n

] 1 . Acesta observatie explica de ce putem face afirmatii asupra unei

populatii pe baza selectiilor, deci teorema lui Cebsev sta la baza teoriei selectiilor.

Observatia 3 Exista o deosebire esentiala intre comportarea variabilelor aleatore care pot lua valori departate de mediile lor si mediile aritmetice ale unui numar sufiecient de mare de valori ale variabilelor aleatore care iau cu foarte mare probabilitate valori in apropierea constantei E(X), deci isi pierd oarecum caractereul aleator. Observatia 4 Esenta legii numerelor mari care rezulta din teorema lui Cebsev consta in faptul ca in cazul cand marimile atasate elementelor unei colectivitati de volum mare-pe care le masuram- contin in expresia lor individuala forme mai mari sau mai mici de abateri intamplatoare, ele devin neglijabile cand numarul lor este suficient de mare. Practic faptele se desfasoara ca si cand ne-am afla in fata unei singure valori posibile-media. Cum media isi pierde caracterul aleator ea reflecta caracterul legic si necesar al fenomenului studiat. Teorema lui Bernoulli1 Daca este un numar pozitiv arbitrar de mic, atunci :

lim P(|
n

p|

) 1
este

unde n reprezinta numarul de experiente independente care se fac, in fiecare experienta probabilitatea evenimentului A este p si numarul de realizari ale eveimentului A in cele n experiente. Teorema Daca o variabila aleatoare X are media m si dispersia
1 P(m t1 X m t2 ) 1 t2 2 t2 2 t1 t1
2

, atunci pentru oreice doua numere pozitive t1, t2 avem :

Teorema Moivre-Laplace Distributia binomiala in cazul in care volumul selectiei este mare este aproximata de distributia normala, adica avem :

lim C p q
n

x n

n x

1 e 2

1 x 2

, unde

= np si

npq

Observatie : avand la dispozitie tabela valorilor functiei densitate de repartitie ale variabilei normale normate, adica N(0,1) rezultatul anterior rezultatul anterior poate fi scris :

Cnx p x q n

fZ ( z)

, unde z=

= np si

npq

Teoremea limita centrala(pentru termeni identic repartizati) 1. Fie X1, X2, .,Xn un sir de variabile aletoare independente , identic repartizate astfel incat 0 < V(X 1) < .Atunci repartitia lui

X 1 ....

Xn

nE( X 1 )

V (X1) n
mare avem ca X

N (0,1) (converge slab catre N(0,1)).


si dispersie , atunci pentru n suficient de

2. Fie X1, X2, .,Xn un sir de variabile aletoare independente, identic repartizate cu medie

~ N (0,1), n / n 3.Daca variabilele aleataore Xk, k =1,2,,n sunt idependente si nu iau valori prea mari una in comparatie cu cealalta, iar n este suficient de
n

mare atunci X =
k 1

X k are ca repartitie asimptotica repatitia normala, oricare ar fi repartitiile variabilelor aleatoare X k, k =1,2,,n. Prin

urmare Teorema Limita Centrala da posibilitata folosirii repartitiei normale drept lege practica de aproximare. Observatie : distributia nomala poate fi folosita pentru aproximarea altor distributii care au aceeasi medie si variatie. De exemplu : Bin(n,p) ~N( Poisson( Gamma( = np, =
2

= np(1-p))
2

)~N(

=
2

, )~N( =

Formularea legii numerelor mari(Bernoulli)este urmatoarea: daca dintr-o colectivitate de volum mare se ia un numar

de probe si dintre acestea n sunt favorabile, atunci

se poate admite ca probabilitatea de a avea loc fenomenal cercetat privind intreaga colectivitate este data de frecuenta relativa corespunzatoare:P

I. Selectie si estimatie2 Definitia 1 O selectie simpla este o selectie in care fiecare element al colectivitatii are aceeasi sansa de a fi ales. Scop: estimarea mediei unor caractristici dintr-o populatie statistica generala sau estimarea frecventei relative a unitatilor din populatie Se da : populatie X caracteristica calitativa a obiectelor din populatie(este o v. a.) a carei lege teoretica de repartitie contine parametrul numerica nu este cunoscuta {x1,x2,,xn} valorile observate ale v.a. X care pot fi privite ca n exemplare ale v.a. Xi (i =1,2,,n), adica un sir de variabilei aleatoare independente din acelasi camp de probabilitate, fiecare din ele avand aceeasi repartitie ca si v.a. X fX(x1,x2,,xn) este o functie de sondaj sau o statistica n- volumul esantionului(selectiei) Se cere : Gasirea unei estimatii cat mai bune pentru doar pe baza datelor pe care le ofera observarea partiala(de sondaj) formata din n a carui valoare

experimente, in fiecare din aceste n date de observatii variabila aleatoare X a luat cate o valoare bine determinata Observatie 1 : elementele multimii {x1,x2,,xn}numite variabile de selectie au o dubla interpretare : 1.considerate dupa efectuarea selectiei reprezinta valori concrete care le folosim ca informatii asupra variabilei aleatoare X si le notam : X1= x1, X2=x2,..., Xn=xn 2.considerate inainte de efectuarea selectiei, variabilele X1,X2,,Xn pot fi privite ca variabile aleatoare independente si identic repartizate din punct de vedere probabilistic cu variabila aleatoare X Atunci E( X j ) = E( X ) = mr , j = 1,n E(( X j
r
r

m ) r ) = E(( X m )r) =

, j = 1,n

unde m = E(X), mr , r sunt media, momentul initial de ordin r respectiv momentul centrat de ordin r al variabilei aleatoare X. Se considera ca fiecare variabila aleatare Xj , j = 1,n se realizeaza cu aceeasi probabilitate 1/n. Atunci are loc : Definitia 2 Variabila aleatare de selectie are urmatoarea repartitie: X* :

X 1 X 2 ... X n 1 / n 1 / n .... 1 / n

in care P(X*=Xk) = 1/n, k = 1,n

Presupunand ca dupa efectuarea a n observatii am obtinut : de n1 ori a aparut X1 de n2 ori a aparut X2 , cu n1 + n2 + +nk= n de nk ori a aparut Xk Atunci :
X 2 ... X k X* : X 1 iar fi = ni/n se numeste frecventa de aparitie a lui Xi , fi 1 n1 / n n2 / n ....nk / n i 1 Definitia 3 Se considera o populatie cu caracteristica X si se face o se selectie de volum n ale carei valori sunt x1,x2,,xn ,. Fie nx o valoare care ne da numarul observatiilor in care a aparut o valoare a caracteristicii X , mai mica decat x in selectia { x1,x2,,xn }.Atunci functia de repartitie a selectiei este definita de :
k

F*(x) =

nx n

Teorema(Hincin) Notand prin F(x) functia teoretica de repartitie si prin Fn(x) functia empirica de selectie obtinuta intr-un esantion de volum n, atunci avem ca: P( [sup | F *( x) F ( x) 0 |] ) = 1
x

cand ne referim la o v.a. folosim X , iar cand ne referim la valorile acestei v.a folosim x ; in teoria etimatiei diferenta dintre variabile si valorile sale devine nesemnificativa; se vor utiliza in continuare litere mici exceptie facand cazurile cand vom face o afirmatie probabilistica

Observatie Se noteaza cu x =

1 n

xi
i 1

1 n

ni xi )-in cazul frecventelor de aparitie) media valorilor de selectie(media de selectie) si cu X


i 1

media selectiilor de volum n, cu X = X1 E( X ) =


2

X 2 ... X n n

V( X ) =

n n
,
2

(X )

Selectia dintr-o populatie repartizata normal Daca X1,X2,,Xn sunt selectii de volum n dintr-o populatie normala N( selectie de volum mare avem ca :

) atunci in baza Teoremei Limita Centrala pentru o

X / n

~ N (0,1) sau X ~ N ( ,

/ n) ,unde X =

X1

X 2 ... X n n
n

Teorema Daca X1,X2,,Xn sunt selectii de volum n dintr-o populatie normala N(0,1) atunci variabila aleatoare Repartitia dispersiei de selectie pentru selectii dintr-o populatie normala populatie { x1,x2,,xn}- valorile numerice ale unei selectii de volum n

Y
k 1

X k2 ~

2 n

x =

x1 x2 ... xn - media valorilor unei selectii de volum n n


a populatiei generale este cunoscuta atunci dispersia de selectie este :
2 s

-daca media

=
2

1 n

( xi
i 1

)2

n -daca media a populatiei generale nu este cunoscuta atunci dispersia de selectie este: S = 1 ( x x )2 iar atunci cand se apreciaza i ni1 n caracteristicile populatiei generale(populatiei) din care s-a facut selectia se foloseste3: s2 = 1 ( xi x ) 2 ; n 1i1 Teorema

Daca X1,X2,,Xn sunt selectii de volum n dintr-o populatie normala N( Proprietati

) atunci variabila aleatoare : X


s/ n

~ tn

N (0,1)
2 k

unde N(0,1) si

/k

2 k

sunt independente

distributia t este simetrica fata de 0 si tabelata Observatie Distributia F = X / m1 unde X si Y sunt variabile aleatoare independente repartizate
Y / m2
2

cu m1 si respectiv m2 grade de libertate. Daca se


2 1

face o selectie aleatoare de volum n1 si n2 dintr-o populatie repartizata normal de variatii

si

2 2

2 atunci : s1 / 2 s2 /

2 1 2 2

~ Fn1

1, n2 1

Se pune problema determinarii variatiei ce predomina in colectivitate a carei medii si disperiei sunt necunoscute. Avand o valoare individuala dispunem de o baza minima pentru estimarea mediei, insa un avem nici o informatie asupra imprastierii din colectivitatea generala. In cazul unei singure valori putem presupune ca toti termenii colectivitatii au aceeasi marime, iar atunci cand avem doua valori deja avem o baza pentru masurarea variatiei ce predomina in colectivitate, baza ce se marete o data cu cresterea numarului de valori observate. Doua valori observate dau un grad de libertate pentru estimarea variatiei ce predomina in colectivitate, n valori observate dau n-1 grade de libertate pentru estimarea variatiei, deoarece unul este folosit pentru calculul mediei aritmetice

Estimarea punctuala a valorilor teoretice Se da: o populatie de volum mare o caracteristica a unitatilor populatiei valorile caracteristicii la toate unitatile populatiei sunt distribuite dupa o variabila teoretica necunoscuta Se cere: cunoasterea in mod aproximativ a acestei variabile teoretice prin folosirea unei variabile de selectie Atunci cercetarea poate fi efectuata in doua directii: cunosterea tipului de repartitie teoretica precum si a parametrilor corespunzatori cunoasterea unor indicatori numerici ai variabilei teoretice ca media si dispersia, etc. Notatii: - variabila teoretica oarecare

- marimea care o estimeaza pe


Atunci : = f( X ), unde Definitie X1,X2,Xn selectii de volum n

X =(X1,X2,,Xn) , iar se numeste estimator al variabilei


p

se numeste estimator consistent daca n n


Definitie

, unde n reprezinta volumul selectiei sau

lim P(| n
n

) 1.

se numeste estimator corect al lui n E( )


n

daca pentru n avem ca :

V( n )0 Definitie

se numeste estimator absolut corect al lui n E( )=


n

daca pentru n avem ca :

V( n )0 Observatie Se observa ca deplasarea acestui estimator este nula , ceea ce face ca el sa se numeasca estimator nedeplasat Definitie

E ( n )
Definitie Un estimator

se numeste distorsiunea operatorului

sau deplasarea lui. n


daca depalsarea sa este nula si dispersia este minima.

se numeste estimator eficient al valorii teoretice n

Se vor folosi 2 metode pentru estimarea partametrilor: 1. METODA MOMENTELOR (METHOD OF MOMENTS) pentru cazul unui singur parametru : se egaleaza media populatiei cu cea a selectiei si se rezolva ecuatia pentru 2 parametrii : se egaleaza momentele de ordinul intai si doi ale populatiei cu cele ale selectiei si se rezolva sistemul 2. METODA VEROSIMILITATII MAXIME(METHOD OF MAXIMUM LIKELIHOOD)
n

scrie-l pe L ( unde L(

)=
i 1

f ( xi ; ) pentru o selctie aleatoare x1,x2,,xn din populatia initiala cu densitatea de reparitie f (x; ) ,

iar este parametrul pe care vrem sa-l estimam se efectueaza log L si simplifica cat se poate de mult relatia diferentiaza log L in raport cu fiecare parametru care trebuie estimat si egaleaza cu 0 se rezolva simultan ecuatiile se verifica daca valoarea rezultatelor este maxima

Intervale de ncredere Se dau: -populatia X - caracteristica populatiei f X ( x, ) repartitia a lui X X1,X2,,Xn- selectii de volum n n volumul selectiei Se cere: gasirea lui 1 ( X1,X2,,Xn) si 2 ( X1,X2,,Xn) a.i. P( 1 , unde este foarte mic 1 2) Observatii - deoarece estimatiile variaza in precizie, este important ca o estimatie sa fie insotita de o descriere a preciziei estimatiei, adica de o indicatie a cat de aproape poate fi estimatia de parametrul pe care trebuie sa-l estimeze. - daca numarul de masuratori efectuate asupra unei marimi fizice este mic, atunci nu se recomanda aplicarea metodei momentelor, deoarece in acest caz erorile de estimare a parametrului necunoscut sunt foarte mari Intervale de ncredere pentru parametrii repartitiei normale 1. Intervale de ncredere pentru media Se stie : cand este cunoscut

X ~ N( ,

/ n) unde X este media selectiilor de volum n.


- X va fi cuprinsa intre -1,96 < < si 1,96 adica:

Atunci, de exemplu, pentru 95% din cazuri -1,96 < - X <1,96

X -1,96

X +1,96

Notatie: z -cuantila de ordin atunci

a repartitie normale reduse(cuantilele indica o divizare a distributiei in parti egale)adica:P(Z> z ) =

z 0, 025 = - 1,96 si z 0,975 =1,96 si intervalul de ncredere 100(1- )% poate fi scris:


<
2

X- z

<

X +z
2

sau P( X - z
2

<

<

X +z
2

)=1-

care ne arata folosind esantioane diferite din

n n
,X +z
2

populatie, proportia de valori ale lui

X pentru care intervalul ( X - z


2

) include media populatiei

este 1-

2. Intervale de ncredere pentru media -se stie ca: s fiind o estimatie a lui

cand

nu este cunoscut insa in acest caz factorul 1,96 nu va mai asigura limitele de ncredere de 95%.

poate substitui pe

-va fi necesar sa studiem repartitia de selectie a statisticii unde s2 =

X X pentru a vedea cum difera de repartitia de selectie a statisticii , s/ n / n

1 n 1i

( xi
1

x)2 - dispersia de selectie


)% pentru este : corespunzatoare unei repartitii student cu n-1 grade de libertate

Atunci intervalulde ncredere 100(1-

X-t
2

s n s
2

<

<

X +t
2

s n s
2

, unde t este cuantila de ordin

sau P( X - t < <

X +t

) =1-

n
t
2

Observatie: pentru n > 30 avem

z
2

Observatia 1 Intervalele de ncredere pentru

in cazul in care

este necunoscut sunt ceva mai lungi .Deci se poate estima mai bine distanta dintre in cazul in care este cunoscut, insa in

X si

in cazul in care

este cunoscut. Acesta nu insemna ca X va cadea mai aproape de

aceste situatii avem o idee mai buna asupra locului in care x va cadea. Observatia 2 Intervalele de ncredere pentru cand este cunoscut sunt de lungime constanta. Cand se considera selectii successive, intervalele vor avea pozitii diferite, dar lungimea lor va ramane tot impul constanta egala cu : Observatia 3 Cand nu este cunoscut, intervalele formate folosindu-l pe lungime, lungimea lor depinzand de s. Observatia 4 In fiecare caz intervalele vor acoperi valoarea lui astfel de interval ce-l acopera pe este stabilit. 4. Intervale de ncredere pentru
2

2z
2

.
n

t vor varia in pozitie de la o selectie la alta si de asemenea vor varia in


2

cu o anumita probabilitate si astfel gradul de ncredere pe care-l avem in fiecare

Se cunoste ca :

(n 1)s 2
2

2 n 1,

unde s2 =

1 n 1i
2 1 2 ,n 1

( xi
1
2

x )2
(n 1) s 2 =12 2 ,n 1

Atunci : (n 1) s 2
2 1 2 ,n 1

(n 1) s 2 si deci
2 2 ,n 1

(n 1) s 2

Observatii -lungimea intervalelor de ncredere pentru estimarea mediei si a dispersiei pot fi utilizate pentru a compara intre ele diverse statistici. -statistica care conduce la cel mai scurt interval de ncredere poate fi considerata cea mai buna si o apreciere a oricarei alte statistici poate fi obtinuta prin compararea lungimii intervalului de ncredere la care conduce cu lungimea intervalului de ncredere al celei mai bune statistici. II. Verificarea ipotezelor statistice 1. Teste parametrice test statistic - procedeul de a folosi o selectie pentru a verifica daca o ipoteza este adevarata sau falsa H0 ipoteza nula H1 ipoteza alternativa eroare de ordinul 1 eroare care consta in respingerea ipotezei nule H 0 atunci cand ea e adevarata, probabilitatea acestei erori fiind , iar in practica se alege = 0,01sau = 0,05 sau = 0,1 eroare de ordinul 2 - eroare care consta inacceptarea ipotezei nule H 0 atunci cand ea e falsa, probabilitatea acestei erori fiind , iar in practica se alege = 0,10 sau = 0,05 sau =0,01 Observatii 1. desi analiza concreta o efectuam prin intermediul selectiei, ipoteza statistica o vom face intotdeauna asupra populatiei , adica asupra intregului si un asupra partii; de aceea presupunerea asupra unui aspect al populatiei este numita ipoteza statistica, deoarece ea se refera la o situatie care poate fi adevarata 2. nu exista nici o certitudine ca nu vom face o gresela sau o eroare, de aceea se considera cele 2 tipuri de erori de mai sus 3. frecventa cu care facem o greseala este foarte importante, iar aceasta frecventa poate fi controlata pana la un anumit grad 4. decizia daca ipoteza va fi acceptata sau respinsa se va baza pe informatia pe care o obtinem facand observatii si cu riscul pe care suntem dispusi sa-l acceptam in a lua o decizie gresita 5. dac de exemplu lum 0,05 aceasta nseamn c n 5 cazuri din 100 riscm s comitem eroarea de genul nti, adic s respingem o ipotez adevrat i deci n 95 din cazuri lum o decizie just adic acceptm o ipotez adevrat Se dau: -populatia X- caracteristica populatiei f X ( x, ) repartitia lui X care depinde de parametrul necunoscut X1,X2,,Xn- selectii de volum n n volumul selectiei Se cere: sa se verifice ipoteza H0 : 0 ca ipoteza nula fata de ipoteza alternativa H1: 0 1

Putem lua urmatoarele decizii: a)se respinge ipoteza H0 chiar daca ea este adevarata si-n acest caz spunem ca am facut o eroare de ordinul 1( b)se accepta ipoteza H0 chiar daca ea este falsa si-n acest caz spunem ca am facut o eroare de ordinul 2( ) Astfel: P(respinge H0 |H0 adevarata) = (foarte mic) P(accepta H0 |H0 falsa) =

P(respinge H0|H0 este falsa) = 1- (maxima)- puterea testului In general, pentru a verifica o anumita ipoteza statistica avem nevoie de: 1. o statistica(o functie de masurarile experimentale) a carei repartitie s-o cunostem, sau in cel mai rau caz s-o putem determina analitic 2. o valoare numita critica cu care sa se compare valoarea calculata a statisticii 3. o regula de decizie prin care sa se accepte (sau sa se rspinga) ipoteza H 0 (cand se respinge H0 automat se acepta H1 ); regula de decizie se exprima de obicei prin egalarea valorii calculate a statisticii cu valaorea critica sau in cele mai multe cazuri prin inegalitati de tipul:valoarea calculata a statisticii valoare critica , sau valoarea calculata a statisticii valoare critica, unde valoare critica este o valoare tabelata in functie de repartitia statisticii folosite, numarul de masuri avute la dispozitie(volumul esantionului n) si pragul de semnificatie ales 4. o valoare a riscului ales , in acest caz se mai numeste si pragul de semnificatie al testului Observatii -deoarece valoarea lui -numit si prag de semnificatie poate fi aleasa de experimentator si valoarea lui va determina in parte acceptare sau respingerea ipotezei, el va fi fixat inainte de inceperea experimentului. -daca exista interese puternice ca ipoteza sa nu poate fi respinsa cu usurinta cand ea este adevarata, pragul de semnificatie trebuie ales mic. -dimpotriva, daca exista interesul de a respinge ipoteza de indata ce exista un cat de mic dubiu fata de ea, vom alege mare. - in controlul statistic al calitatii se numeste riscul furnizorului-riscul de a-si vedea respinse la control loturi de produse de calitate corespunzatoare, iar se numeste riscul beneficiarului-riscul de a acepta loturi de produse de calitate necorespunzatoare -prin regiunea critic a ipotezei nule H 0 corespunztoare statisticii testului nelegem acea mulime de valori ale statisticii astfel nct dac valoarea observat a statisticii aparine acestei mulimi, atunci ipoteza H 0 se respinge. Definitie p-value este o probabilitate calculatata folosind testul statistic care masoara suportul (lipsa suportului) provenit din esantion pentru ipoteza nula. Observatii 1. p-value este folsita ca metoda de determinare respingerii ipotezei nule dandu-se un prag de semnificatie si ne arata cat de semnificative sunt rezutatele provenite din esantion 2. nu se interpreteaza p-value ca probabilitatea ca ipoteza nula sa fie adevarata 3. o valoare mica a p-value indica faptul ca rezultatul provenit din esantion este neobisnuit dandu-se ipoteza H0 4. valori mici ale lui p-value conduc la respingerea lui H0, iar valori mari conduc la faptul ca ipoteza nula un trebuie respinsa 5. doi pasi sunt necesari pentru calculul lui p-value: 5.1 trebuie utilizata valoarea testului statistic pentru calculul lui p-value, calculul pentru p-value depinzand de tipul testului: bilateral, unilateral stanga sau dreapta; spre exemplu pentru testul unilateral stanga, p-value este probabilitatea de a obtine o valoare pentru testul statistic cel putin egala cu cu cea provenita din esantion deci pentru a calcula p-value pentru testul unilateral stanga cand este cunoscut, trebuie sa gasim aria de sub curba normala standard aflata in stanga testului statistic 5.2 dupa ce este gasita p-value, atunci trebuie sa decidem daca este suficient de mica pentru a respinge ipoteza nula, acesta implicand compararea cu pragul de seminficatie 6. rejection rule: reject H0 if p-value Teste referitoare la parametrii repartitiei normale 1. Verificarea ipotezei asupra mediei m a unei populatii normale cu Se stie ca daca X ~ este cuantila de ordin 1.1. Test bilateral ( ,
2

cunoscut testul

z
, unde z

) atunci z =

X / n

(0,1), unde X este media selectiilor de volum n si ca P(z > z ) =

a repartitie normale reduse. =


1 n
n i 1

Verificarea ipotezei statistice : H0 : necunoscuta se efectueaza astfel: a) se calculeaza media de selectie x

cu alternativa H1:

unde caracteristica de calitate X~

( ,

), iar

este

xi unde x1, x2, ,xn sunt masuratorile asupra caracteristicii X

b) se calculeaza statistica testului zcalculat =

/ n
10

c)respingem ipoteza H0 daca zcalculat 1.2. Test unilateral stanga Verificarea ipotezei statistice : H0 : respingem ipoteza H0 daca zcalculat 1.3. Test unilateral dreapta Verificarea ipotezei statistice : H0 : respingem ipoteza H0 daca zcalculat

z sau zcalculat
2

z , unde valoarea z se ia din tabele


2 2

cu alternativa H1:

<

se face urmand aceeasi pasi ca la 1.1, dar decizia se ia astfel:

z , unde valoarea z se ia din tabele


=
0

cu alternativa H1:

>

se face urmand aceeasi pasi ca la 1.1, dar decizia se ia astfel:

z , unde valoarea z se ia din tabele

Observatie Sa calculam puterea testului pentru testul unilateral stanga:


P x
0

z |

x n

z n

P z

z n
2

2. Testul privind media unei populatii normale cand

necunoscut - testul si dispersie


2

t
si daca din populatia caracterizata de acesta variabila

Daca X este o variabila aleatoare repartizata normal de medie

consideram toate selectiile de volum n, media lor notand-o prin X atunci t


n

X este repartizata tn-1(Student cu n-1 grade de s/ n

libertate), unde s
n

1 n

( xi
i 1

x) 2

n 1

2.1. Test bilateral Verificarea ipotezei statistice : H0 : necunoscuta se efectueaza astfel: a) se calculeaza media de selectie caracteristicii X b) se calculeaza statistica testului tcalculat = c)respingem ipoteza H0 daca tcalculat 2.2. Test unilateral stanga Verificarea ipotezei statistice : H0 : respingem ipoteza H0 daca tcalculat < 2.3. Test unilateral dreapta Verificarea ipotezei statistice : H0 : respingem ipoteza H0 daca tcalculat > tn =
0

cu alternativa H1:

unde caracteristica de calitate X~

( ,

), iar

este

1 n

xi si dispersia de selectie s2 =
i 1

1 n 1i

( xi
1

x ) 2 , unde x1, x2, ,xn sunt masuratorile asupra

x 0 s/ n
n 1,

t
=

sau tcalculat
2

, unde valoarea
n 1, 2

se ia din tabele
n 1, 2

cu alternativa H1:

<

se face urmand aceeasi pasi ca la 2.1, dar decizia se ia astfel:

tn

1,

, unde valoarea
0

tn

1,

se ia din tabele >


0

=
1,

cu alternativa H1:

se face urmand aceeasi pasi ca la 2.1, dar decizia se ia astfel:


2

, unde valoarea

tn

1,

se ia din tabele

3. Verificare ipotezelor statistice asupra dispersiei unei populatii normale - testul Stiind ca statistica 3.1 Test bilateral Verificarea ipotezei H0 :
2 2 0

(hi patrat)

n 1
2 0

(Xi
i 1

X )2 ~

2 n 1

, atunci

cu alternativa H1 :

2
n

2 0

se face astfel:

a) se calculeaza media de selectie b) se evalueaza statistica

1 n

xi si apoi
i 1 i 1
2 n 1,1

( xi

x ) 2 ,unde x1, x2, ,xn sunt masuratorile asupra caracteristicii X

calculat data de formula de mai sus


calculat

c)respingem ipoteza H0 daca

sau
2

calculat

2 n 1,

unde valoarea
2

2 n 1,

se ia din tabele
2

11

3.2 Test unilateral stanga Verificarea ipotezei H0 : respingem ipoteza H0 daca 3.3 Test unilateral dreapta Verificarea ipotezei H0 : respingem ipoteza H0 daca
2 2 0

2 0

cu alternativa H1 :
2 n 1,1

2 0 se
2 n 1,1

face urmand pasii de la 3.1, iar decizia se ia astfel: se ia din tabele face urmand pasii de la 3.1, iar decizia se ia astfel:

calculat

<

, unde valoarea
2

cu alternativa H1 :
2 n 1,

2 0 se

calculat

>

, unde valoarea

2 n 1,

se ia din tabele

4. . Verificare ipotezelor statistice asupra dispersiilor unor populatii normale- testul F Problema : gasirii unei metode cu ajutorul careia sa decidem daca doua populatii au aceeasi dispersie. Avem urmatoarele cazuri: 4.1. Se considera doua populatii normale X~ N ( Verificarea ipotezei H0 :
2 1 2 2 1

2 1

) si Y~ N (
2 1 2 2

2 2

).

cu alternativa H1 :

se face astfel:
2 1

a) se calculeaza media de selectie

1 n1

n1 i 1

xi si dispersia de selctie s y 1 n2
n2 i 1

n1

n1 1 i

( xi
1 2 2

x )2 , unde x1, x2, , xn1 sunt masuratorile 1


n2

asupra caracteristicii X precum si media de selectie sunt masuratorile asupra caracteristicii Y

yi si dispersia de selctie s

n2 1 i

( yi
1

y )2 , unde y1, y2, , yn1

2 s2 2 2 b) se evalueaza statistica Fcalculat = 2 ( la numitor se pune valoarea cea mai mare a celor doua dispersii calculate: s2 > s1 ) s1

c)respingem ipoteza H0 daca 4.2 Verificarea ipotezei H0 : respingem ipoteza H0 daca

Fcalculat
2 1 2 2

F
n2 1, n1 1,1 2

, unde valoarea F
n2 1, n1 1,1
2 1 2 2 se

se ia din tabele
2

cu alternativa H1 :
1, n1 1,1

face urmand pasii de la 4.1, iar decizia se ia astfel: se ia din tabele

Fcalculat > Fn2


2 1 2 2

, unde valoarea Fn2


2 1

1, n1 1,

4.3 Verificarea ipotezei H0 : respingem ipoteza H0 daca

cu alternativa H1 :
1, n2 1,

2 2 se

face urmand pasii de la 4.1, iar decizia se ia astfel: se ia din tabele

Fcalculat > Fn1

, unde valoarea Fn2

1, n1 1,1

12

Probleme4 1)Fie X~N(x;25,36). Gasiti: a) P(X<28) b)P(X > 30) c)P(X<20) d)P(|X-25|<4) R: a) P(X<28) = P Z 28 25 = P(Z < 0,5) = 0,6915; b)P(X > 30) = P(Z > 0,833) = 1- P (Z < 0,833) = 1- 0,7974 = 0,2026 (interpolare : 3/10 0,7995 + 36
7/100,7967=0.7974).c) P(X < 20) = P(Z < - 0,8333) = 1- P(Z < 0,8333) = 0,2026;d) P(|X-25|<4) = P(-4 < X - 25 < 4 ) = P(21< X< 29) = P(X < 29) P(X < 21) = P(Z < 0,667) - P(Z < - 0,667) = P(Z < 0,667)- [ 1-P(Z < 0,667) =2P(Z < 0,667) 1 =2F(z) 1 = 20,7446 1 = 0,4893.

2) Fie X~N(

=2,

2). Sa se calculeze:

a) P(0 X 3 ) b)P(|X| 1 ) c)Sa se afle o limita inferioara a P(0<X<4) 3) Probabilitatea obtinerii unei piese rebut din productia unei masini automate este p = 0,005. Sa se determine probabilitatea ca din 10 000 de piese fabricate de acesta masina , numarul pieselor rebut sa fie : a) intre 60 si 70 b) cel mult 70 4) O variabila aleatoare X are media egala cu 30 si dispersia egala cu 2. Sa se gaseasca o limita inferioara pentru P(24 < X < 36). 5) Dintr-o colectivitate de studenti din anul I se face o selectie de 10 studenti pentru a vedea numarul de joburi la care au aplicat cei zece studenti in vacanta de vara. Datele sunt prezentate in tabelul de mai jos. Sa se calculeze media si dispersia de selectie. Nr. stud. 1 2 3 4 5 6 7 8 9 10 job 7 5 2 1 12 0 8 6 3 6 6) Repartitia valorilor defectiunilor unor aparate de masura si control a fost analizata pe baza a 100 observatii care au furnizat urmatoarele valori cu privire la numarul de porniri dupa care acestea se defecteaza: xi 1 3 6 8 10 ni 15 20 30 10 25 Stabiliti: a) Media si dispersia de selectie b)Functia de repartitie de selectie si valorile ei in punctele x=2 si x=7. 7) S-a stabilit ca productivitatea muncii unor lucratori care indeplinesc o anumita operatie in conditii tehnice asemanatoare are o repartitie normala. Intr-o inteprindere industriala s-a determinat cu ajutorul cronometrarii proceselor de munca durata de efectuare a operatiei aminitite la 9 muncitori luati intamplatori dintr-o serie de grupe care efectueaza acesta aplicatie. Se cere sa se determine probabilitatea ca media x observata la cei 9 muncitori sa se abata in valoare absoluta de la productivitatea medie generala cu mai mult de 2 bucati/om/ora stiind ca abaterea medie patratica a productivitatii muncii lucratorilor este de =3 bucati/om/ora.
R: P = 0,04550

8)Se efectueaza n = 10 observatii independente asupra variabilei aleatoare X repartizata N(0,1). Se cere probabilitatea ca suma patratelor rezultatealor observatiilor sa depaseasca 15.
R: P = 0,9644

9)Presupunand ca diametrul unor piese fabricate la un strung este repartizat normal N(

=2), care trebuie sa fie volumul n al selectiei

astfel incat P(| X - | < 1) = 0,99 R: n 27 10)Dintr- o populatie normala cu media = 12, probabilitatea ca media de selectie corespunzatoare unei selectii de volum n = 25 sa nu depasesca 16 este de 0,24. Care este probabilitatea ca o singura observatie din acesta selectie sa aiba o valoare mai mare deacat 16? R: P = 0,5 11) Dintr-o populatie normala se extrag toate selectiile posibile de volum n = 25. Daca 5% dintre ele au medii care difera de media populatiei cu cel putin 5 unitati in valoare absoluta, aflati abaterea patratica a populatiei. R: =12,76 12)Dintr-o populatie normala N( =16, =2) se extrage o selectie de volum n = 8 . Se cere probabilitatea ca dispersia de selectie sa fie cuprinsa in intervalul (1,6; 6,8). R:P = 0,8 13)* Pentru 2 selectii de volum 10 respectiv 16 din 2 populatii normale cu dispersii egale folositi tabelele lui F pentru a determina valorile si
2 astfel incat P s1 2

s2

s12 0,05 si P 2 s2

0,05 .

Problemele cu * sunt facultative

13

14)* Care este probabilitatea ca variatia unei selectii de volum 10 dintr-o populatie normala sa fie mai mare de 6 ori decat variatia unei selectii de 5 valori dintr-o populatie normala si independenta de prima dar cu aceeaceeasi variatie? R: P( s X / sY >6)= F(9,4>6) 15) Se considera un eveniment A de probabilitate p constatata in fiecare proba si fie X v.a. care reprezinta numarul de aparitii ale evenimentului A in n probe independente. Deci X reprezinta o suma X = X1 + X2++Xn unde variabila Xi :
2 2

1 0 . Sa se arate ca p 1 p

frecventa relativa in n probe independente este o estimatie nedepalsata a probabilitatii constante p. 16)* Se face o selectie aleatoare dintr-o populatie repartizata Poisson( ) din care rezulta urmatoarele date: 4, 2, 7, 3, 1, 2, 5, 4, 0, 2. Folosind metoda momentelor gasiti un estimator pentru .
R:

=3

17)* O selectie aleatoare de 8 valori dintr-o populatie repartizata Bin(n,p) conduce la urmatoarele valori: 4, 2, 7, 4, 1, 4, 5, 4. Folosind metoda momentelor estimati pe n si p si comentati rezultatele. 18) Media a 10 observatii independente si identic distribuite dintr-o distributie Poisson( ) este 2,4. Gasiti estimatorul de verosimilitate maxima

.
2

19)* Gasiti estimatorii de verosimilitate maxima pentru si pentru o selectie de observatii i.i.d. repartizate N( , ). 20) Sa se determine intervalul de incredere de 95% pentru media a unei populatii normale N( , 20) pe baza unei selectii de volum n = 16 in urma careia s-a obtinut media de selectie x = 100. 21)Fie X variabila aleatoare normala ce reprezinta greutatea unor oameni. O selectie de volum 100 a dat urmatoarele rezultate: Greutate (kg) Nr. observatiilor
2

35 2

40 5

45 7

50 10

55 13

60 27

65 16

70 11

75 8

80 1

Stiind ca dispersia lui X, = 49 , aflati un interval de incredere de 90% pentru media . 22)O selectie de volum 9 dintr-o populatie normala a dat urmatoarele rezultate: 1, 2, 5, 8, 12, 15, 22, 30, 39. Determinati un interval de incredere de 90% pentru media populatiei si un interal de incredere de 95% pentru dispersia populatiei. 23)Sa presupunem ca din 1000 de persoane intrebate , 400 sunt pentru fabricarea in serie a unui anumit produs. Care este intervalul de incredere de 95% pentru procentul de populatie care sunt pentru promovarea produsului respectiv? 24) Se face un studiu pentru a se afla daca se respecta cantitatea de suc dintr-o sticla de 3 litri inscriptionata pe eticheta sticlei. Pentru acesta , se selectioneaza la intamplare 36 de sticle si calculandu-se media esantionului se constata ca x =2,92 l. Se stie ca ponderea lichidului in aceste sticle urmeaza o distributie normala cu =0,18. In cadrul studiului se considera cele doua ipoteze astfel: H0: =
0

3(adica drepturile consumatorilor sunt respectate) si H1:

<

= 3 (drepturile consumatorilor nu sunt respectate). Sa se

cerceteze daca drepturile consumatorilor sunt respectate sau nu. Se alege


R: (I)prin p-value: testului zcalculat =

= 0,01.

=-2,67; p-value este probabilitatea ca testul statistic z este mai mic decat -2,67(adica aria de sub curba densitatii normale

/ n
normate din stanga testului statistic); utilizand tabelul distributiei nomalei normate gasim ca aria dintre medie si zcalculat =-2,67 este 0,4962 si atunci p-value = 0,5- 0,4962 = =0,0038; alegand pragaul de seminificatie = 0,01 insemana ca se doreste sa se accepte probabilitatea de 0,01 pentru a respinga ipoteza nula cand ea este adevarata (
0

3); rejection rule: reject H0 if p-value

si cum 0,0038 < 0,01 inseamna ca putem respinge ipoteza nula pentru orice valoare a lui

0,0038; (II) rejection

rule: reject H0 if respectate.

z calculat

, unde - z0,01 = -2,33; deoarece

z calculat = -2,67< - 2,33 putem respinge ipoteza nula si conculuziona ca drepturile consumatorilor un sunt

25)Pentru stabilirea rezistentei la rupere a unor fire s-au efectuat n = 64 masuratori si s-a stabilit media de selectie x = 400 kg. Stiind ca rezistenta la rupere este o variabila aleatoare normala cu =10 kg, sa se verifice ipoteza H0: = 395 kg fata de alternativele a)H1: 395; b) < 395 la un prag de semnificatie = 0,01. 26) Durata de functionare a unnui aparat electric poate fi considerata o variabila aleatoare normala X cu media =2000 ore si = 200 ore. Se face o selectie de volum 36 aparate si s-a constatat ca durata lor medie de functionare este de 1820 ore. La pragul de semnificatie = 0,01 sa se verifice ipoteza H0: = 1820 ore fata de ipoteza a)H1: 1820; b)H1: < 1820 ore. Care este puterea testului pentru = 1900 ore ? 1 27) Pentru fabricarea unei piese norma tehnica prevede o durata medie de 50 minute. Se cronometreaza timpul de executie a acelei piese la un numar de 25 muncitori gasindu-se o durata medie de executie de x = 55 minute si o abatere medie s = 4,3 minute. Pentru un prag de semnificatie = 0,01 respingem ipoteza conform careia durata medie reala de executie a unei piese este mai mare decat norma tehnica?. Calculati puterea testului daca H1: = 58 28)Pentru analiza preciziei unor masuratori s-au facut n = 15 observatii si s-a stabilit s = 0,6. Verificati ipoteza H0: alternativa a) H1:
2
2

= 0,4 fata de

>0,6 ;b)

0,6 la pragul de semnificatie

= 0,10 stiind ca populatia este normala.

14

29) Se masoara in mm o cota dimensionala a zece piese produse de o masina. Datele de observatie sunt urmatoarele: 2,060; 2,062; 2,062; 2,059; 2,063; 2,067; 2,060; 2,068; 2,063; 2,066. Se doreste sa se vada daca nivelul dispersiei asigurat de masina respectiva poate fi considerat 8,22 mm2. Se va alege =0,05
R: H0:
2

=8,22 mm2, H1:

8,22 mm2;

calculat

=10,5;

2 9;0,025 =19,023 si

2 9;0,975 =2,7

30) S-au efectuat experimente privind compararea a doua metode de analiza aplicate in controlul unor materiale elastice. In acest scop s-au trimis la beneficiar un numar de doua loturi X si Y de materiale elasitce de doua calitati diferite pentru a compara rezistenta lor la rupere. Se pune probelema daca dispersiile teoretice 12 , 22 difera seminifcativ una de alta. Din cele doua loturi s-au recoltat 15 probe, calculanduse mediile si dispersiile de selectie : x =12,17 s X =0,1316, y =12,486, sY =0,3456.
R: : H0:
2 1 22 , 2

H1:

2 1

2 , 2

Fcalculat = sY / s X =2,6261;

F
n2 1, n1 1,1 2

= F14;14; 0,975 = 2,978. Cum Fcalculat < Ftabelat se acepta ipoteza nula si deci loturile X si Y un difera

semnificativ in ceea ce privaste dispersia caracteristicii la rupere.

31) Se masoara diametrul exterior al unor piese cilindrice obtinute prin prelucrare de precizie mijlocie. Valorile obtinute (in cm) sunt urmatorele: 12,4; 11,9; 11,8; 12,3; 11,8; 12,2; 12,0; 12,1; 12,1; 12,1; 12,1; 12,4; 12,3; 11,9; 11,9. Presupunand o repartitie normala a diametrului exterior se cere sa se verifice ipoteza statistica: ipoteza H0: = 12 cm fata de ipoteza H1: 12 cm. Se alege =0,01.
R:

x = (12,4 +11,9+11,8+11,9)/15 = 12,1; s2=[(12,4-12,1)2 + (11,9-12,1)2 +(11,8-12,1)2+ (11,9-12,1)2]/14 = 0,0414; s

0,2; tcalculat = (12,1-12)/(0,2/ 15 ) =1,94;

t14;0,005 = 2,977. Deoarece tcalculat<ttabelat ipoteza H0 se accepta cu riscul nivelul de 12 cm

=0,01, asadar calitatea medie a diametrului exterior obtinut poate fi considerata ca fiind localizata la

32) Timpul in ore inregistrat vreme de 9 luni, timp in care un calculator de generatie mai veche este inoperant este urmatorul: 18; 5; 10; 9; 7; 2; 11; 6; 13. Presupunand o repartitie normala a timpilor de nefunctionare se cere sa se vada daca in medie ne putem astepta ca instalatia de calcul sa fie inoperante mai putin de 10 ore pe luna. Se recomanda riscul =0,025.
R: H0: = 10 ore fata de ipoteza H1: < 10 ore. Se calculeaza x =9 ore si s2= 22,5 si s 4,74 si ; tcalculat = tcalculat = (9-10)/(4,74/ 9 )=-0,63. deoarece t8;0,975 = -2,306 < tcalculat ipoteza H0 se acepta cu riscul respectiv si deci se poate considera ca timpul mediu cat calculatorul este indisponibil un este mai mic de 10 ore /saptamana

15

S-ar putea să vă placă și