Sunteți pe pagina 1din 8

Universitatea de tiine Agronomice i

Medicin Veterinar din Bucureti


Facultatea de Zootehnie

REFERAT:

INFERENTA STATISTICA
DISTRIBUTIA TEST-STUDENT

Paunescu C-tin Alexandru


Tehnologii speciale in industria alimentara
Anul I

CUPRINS:

1. Concepte de baz privind inferena statistic


2.Distributia test student
3. Aplicatie

1. Concepte de baz privind inferena statistic


Ori de cte ori dorim s observm sau s investigm un fenomen sau o variabil,
exist dou tipuri fundamentale de surse de date pe care ar trebui s le utilizm. n
primul rnd, ar trebui s avem acces la ntreaga populaie (colectivitate definit n sens
statistic). nelegem prin aceasta s avem acces la toate observaiile posibile, trecute,
prezente i viitoare, cu privire la variabila de interes. De exemplu, dac variabila noastr
ar fi ctigurile din luna martie 2005 realizate de un muncitor din industria siderurgic i
am avea acces la un studiu complet referitor la aceste ctiguri, am putea s emitem
ipoteze privind populaia ce face obiectul observaiilor referitoare la aceast variabil.
Din pcate, nu avem acces la populaie. Am avea nevoie de un studiu complet cu
privire la ctigurile din industria siderurgic dar nici acesta nu exist.
Eantionul reprezint cel de al doilea tip de surse de date de care am putea
dispune. Pe baza unui eantion, trebuie s deducem fapte n legtur cu populaia din care
s-a prelevat acesta. Procesul de extragere a datelor calculate pe baya eationrii la
ntreaga populaie este cunoscut sub denumirea de inferen statistic.
Cu acelai tipic de inferen statistic: s presupunem c n 2004, ctigurile n
industria siderurgic au fost complet monitorizate, astfel nct tim c media acestora a
fost de 600 RON Acum suntem n luna martie 2005 i dorim s stabilim dac media
ctigurilor a crescut fa de anul precedent. Nu avem acces la studiul pentru martie dar
avem timp s intervievm numai 100 de muncitori. Din calcule rezult c acest eantion
de 100 de muncitori a nregistrat ctiguri medii lunare de 650 RON. Putem oare deduce,
n baza dovezii dat de acest eantion, c media ctigurilor lunare a crescut pentru
ntreaga industrie, n ansamblu ?
Este clar c dac media ctigurilor eantionului ar fi fost de 650 RON, am fi
putut aprecia c s-a nregistrat o cretere a ctigurilor la nivelul acestei industrii. Dac
media eantionului ar fi fost de numai 600 RON, am fi concluzionat c respectivele
ctiguri nu au crescut. Dar am obinut o medie a eantionului de 650 RON Ce putem
deduce de aici ? Problema deduciei devine o problem de a decide cu ct trebuie s
depeasc media eantionului media din anul precedent a industriei sau a populaiei,
nainte de a putea afirma c se nregistreaz o cretere a ctigurilor.
n ansamblul tuturor problemelor legate de inferena statistic, una major este
cea denumit variabilitatea eantionrii. nelegem prin aceasta c diferitele eantioane
vor conduce la rezultate diferite. De exemplu, dac n martie 2005 am lua un al doilea
eantion de 100 de muncitori siderurgi, acesta ar putea nregistra o medie a ctigurilor
diferit de cea a primului eantion prelevat. De o manier similar, un al treilea eantion
ar putea conduce la o alt valoare a ctigurilor medii. Este clar c exist pericolul c
rspunsul la care ajungem cu privire la ctigurile respectivei industrii va depinde foarte
mult de eantionul pe care lucrm de fapt.

n realitate, cu condiia de a preleva eantionul de o anumit manier,


variabilitatea de selecie urmeaz un model sistematic. Aceste eantioane trebuie s fie
aleatorii.
Despre un eantion de mrimea n se spune c este aleatoriu, atunci cnd
orice combinaie de n uniti ale unei populaii are anse egale de a intra n
eantionul care este prelevat.
Prelevarea unui eantion aleatoriu este o problem esenial. De exemplu,
prelevarea unui eantion aleatoriu de 100 de muncitori din industria siderurgic implic,
n primul rnd, obinerea unei liste complete a muncitorilor din respectiva industrie.
Urmtorul pas const n alocarea unui numr fiecrui muncitor de pe list i, apoi,
stabilirea unui procedeu pentru a selecta 100 de numere din aceast list. Vom ignora,
totui, unele aspecte i vom presupune c toate eantioanele cu care lucrm au fost
extrase aleatoriu.

2.Distributia test student


Pn n prezent am introdus conceptele de inferen statistic aproape exclusiv n
contextul mediei populaiei. Totui, sunt frecvente ocaziile n care dorim s facem
deducii cu privire la ali parametri ai populaiei un exemplu evident este variaia
dispersiei 2. n plus, dup cum vom vedea, inferena statistic are un rol important n
analiza regresiilor. De asemenea, am limitat analiza la eantioane mari. n tiinele
economice trebuie s operm frecvent cu eantioane mai mici dect cele pe care le-am
avut n vedere pn acum.
Dac Z1, Z2, Z3......Zn sunt toate variabile de distribuiei normale standardizate
distribuite independent, atunci despre mrimea
Z0
t
n
se spune c prezint o distribuie t cu n grade de libertate.
Z i2 / n
i 1

Se poate observa c n interiorul rdcinii ptrate de la numitorul din (3.26) avem


l / n in1 Z i2 care reprezint o variabil 2 mprit la gradele sale de libertate. Prin
urmare, o definiie alternativ pentru t este ca aceasta reprezint raportul dintre o
variabil de distribuiei normale standardizate i rdcina ptrat a unei variabile
independente 2 care a fost mprit la gradele sale de libertate. A se reine faptil c
distribuia t i obine gradele de libertate din distribuia 2 care apare la numitorul su.
Forma precis a distribuiei t depinde de n, de gradele sale de libertate. Poate fi
demonstrat c pe msur ce n forma tinde spre cea a distribuiei distribuiei
normale standardizate. De fapt, pentru scopuri practice, pentru n > 50, diferenele dintre
cele dou distribuii pot fi ignorate.

Dei eantioanele sunt mici, distribuia de selecie a mediei X este n continuare


N(, ). Dac valoarea ar fi cunoscut, am putea n continuare s aplicm un test
statistic.
Deviaia standard a variabilei, , este, totui, cunoscut de regul i trebuie
nlocuit cu deviaia standard a lui s. n cazul eantioanelor mici, nu exist nici un motiv
pentru care X / n ar trebui s fie o variabil distribuiei normale standardizate.
2

Totui, vom demonstra acum c, cu condiia ca populaia s fie normal distribuit,

X
s/

are o distribuie t cu n 1 g.l.

3. Aplicatie
O societate comercial productoare de confecii de mbrcminte se
aprovizioneaz cu stof de la doi furnizori F1 i F2. Societatea a achiziionat n luna
septembrie 1500 metri liniari de stof, dup cum urmeaz:
600 de metri liniari de stof de la furnizorul F1;
900 metri liniari de stof de la furnizorul F2.
La recepia mrfurilor s-a constatat faptul c 195 metri liniari de stof nu
corespund din punct de vedere calitativ, stabilindu-se totodat c rebuturile provin de
ambii furnizori, dup cum urmeaz:
90 metri liniari de stof provin de la furnizorul F1;
105 metri liniari de stof provin de la furnizorul F2.
Pe baza datelor menionate, conducerea societii a decis s renune la colaborarea
cu furnizorul F1, motivnd aceast opiune prin slaba calitate a materialelor furnizate.
Rezolvare:
Analiza deciziei adoptate de ctre aceast societate poate fi realizat cu ajutorul
modelelor econometrice (ex: testul diferenei dintre dou medii, testul 2, metoda
coeficientului de asociere al lui Yulle).
Pentru fundamentarea econometric a deciziei adoptate de ctre conducerea
societii este necesar s se sistematizeze informaiile cunoscute ntr-un tabel de forma:
Furnizori
(xi)
F1
F2
Total (Nj)

Calitatea materialelor (yj)


Nesatisfctoare
Satisfctoare
90
510
105
795
195
1305 (nij)

Total
(Ni)
600
900
1500 (N)

X x i , i 1, k variabila independent;

x1 = furnizorul F1
x2 = furnizorul F2;
Y y j , j 1, m variabila dependent;
y1 = materiale nesatisfctoare din punct de vedere calitativ (rebuturi);
y2 = materiale satisfctoare din punct de vedere calitativ;
nij = frecvenele condiionate ale variabilei Y;

exemplu:
n11 = materiale nesatisfctoare trimise de furnizorul F1;
n22 = materiale bune trimise de furnizorul F2;
Ca urmare a sistematizrii datelor a rezultat o serie statistic bidimensional cu
dou variabile binare X i Y, rezultnd totodat dou distribuii marginale:
x 1 x 2 0

X : 1
900
600
y 1 y2 0

Y : 1
1305
195
i dou distribuii condiionate ale variabilei Y (calitatea produselor) n funcie de
furnizori:
y 1 y2 0
y 1 y2 0

YF1 : 1
YF 2 : 1
510
795
90
105
Ni = frecvenele marginale ale variabilei X;
Nj = frecvenele marginale ale variabilei Y;
N N i N j n ij = numrul observaiilor
i

Studiind modul de distribuire al frecvenelor nij se pot face urmtoarele observaii:


a) exist o independen total ntre cele dou variabile, dac:
N
n ij i = constant;
k
n ij

Nj
m

= constant;

b) exist o dependen strict ntre cele dou variabile dac frecvenele


condiionate nij se distribuie numai pe diagonala principal a tabelului (corelare pozitiv,
x1 cu y1 i x2 cu y2), pentru celelalte elemente ale tabelului aceste frecvene fiind egale cu
zero;
c) exist o dependen statistic dac frecvenele condiionate nij se distribuie
ntr-un mod diferit de cele dou cazuri amintite anterior (a i b); n aceast situaie,
analiza statistic va conduce la una dintre urmtoarele concluzii:
acceptarea variantei a (independen total ntre cele dou variabile);
acceptarea variantei c (dependen slab, medie sau puternic).
Analiznd datele din tabelul anterior se poate observa faptul c distribuia
frecvenelor condiionate nij se ncadreaz n varianta c. Astfel, pentru a analiza decizia
adoptat de ctre conducerea societii considerate este necesar s utilizm testul
diferenei dintre dou medii.
Aplicarea acestui test presupune parcurgerea urmtoarelor etape:
I.

determinarea procentului mediu al materialelor necorespunztoare din punct de


vedere calitativ pe fiecare furnizor n parte
n
90
f F1 11
0,15 sau 15%
N1 600

f F2

n 21 105

0,1167 sau 11,67%


N 2 900

II.

calculul dispersiilor pentru fiecare dintre cei doi furnizori


2F1 f F1 (1 f F1 ) 0,15 0,85 0,1275
2F 2 f F 2 (1 f F 2 ) 0,1167 0,8833 0,1031

III.

alegerea pragului de semnificaie i preluarea valorii acestuia din tabelul


distribuiei respective
= pragul de semnificaie (riscul) cu ajutorul cruia se alege decizia corect (de
regul, n economie se lucreaz cu un prag de semnificaie de 0,05 (5%) sau
cel mult de 0,01 (1%).
t = argumentul distribuiei normale, dac n 30 sau argumentul distribuiei
Student, dac n < 30;
Pentru exemplul considerat:
= 0,05 t = t0,05 = 1,96.

IV.

compararea valorii empirice a variabilei tc cu valoarea sa teoretic t0,05


tc

x1 x 2
2x1
n1 1

tc

2x1

variabilele dependente

n2 1

x1 x 2
n1 1

tc

2x 2

2x 2

variabilele independente

n2 1

f F1 f F 2
2F1
2F 2

N1 1 N 2 1

0,15 0,1167
0,1275 0,1031

599
899

1,84

tc = 1,84 < t0,05 = 1,96


V.

interpretarea rezultatelor testului


Deoarece tc = 1,84 < t0,05 = 1,96 putem afirma cu o probabilitate de 95% faptul
c ntre calitatea materialelor livrate de ctre cei doi furnizori F1 i F2 nu exist o
diferen semnificativ. n aceste condiii, decizia conducerii societii de a renuna la
colaborarea cu furnizorul F1 datorit unei caliti mai slabe a produselor livrate nu este
justificat.

BIBLIOGRAFIE:
Econometrie. Teorie, sinteze i studii de caz
Editura ARTIFEX, Bucuresti 2008

S-ar putea să vă placă și