Documente Academic
Documente Profesional
Documente Cultură
1.1. Ce este econometria? 1.2. Metodologia econometriei 1.3. Recapitularea unor noiuni de statistic descriptiv i inferenial
Ragnar Anton Kittil Frisch primul ctigtor al premiului Nobel n economie 1969
Goldberg1 definete econometria ca fiind tiina n care uneltele teoriilor economice, matematice i statistice sunt aplicate pentru analizarea unor fenomene economice. Samuelson, Koopmans i Stone2 spun c econometria const n aplicarea statisticii n datele economice pentru a adapta modelele empirice la modele construite cu ajutorul economiilor matematice cu scopul de a obine rezultate numerice.
n fapt, econometria, se bazeaz pe dezvoltarea metodelor statistice pentru estimarea legturilor ntre variabilele economice, pentru testarea teoriilor economice i pentru evaluarea i implementarea politicilor economice. Una dintre cele mai importante aplicaii ale econometriei const n previzionarea unor indicatori macroeconomici cum ar fi rata dobnzii, rata inflaiei, PIB.
1 2
Goldberg, A.S., Econometric Theory, Wiley, New-York, 1964, p. 1. Samuelson, P.A., Koopmans, T.C., Stone, J.R.N., Report of the Evaluative Committee for Econometrica, Econometrica, 22(2), 1954, pg. 141-146.
n fapt econometria a aprut ca instrument de testare a unor ipoteze formulate pornind de la anumite situaii ntlnite n practica economic. Spre exemplu pornim cu urmtoarea ntrebare:
66
RFM (y)
65
64
63 5 6 7 RS (x) 8 9 10
Din grafic reiese c ntre RFM i RS exist o relaie invers. Aceasta poate sugera spre exemplu c efectul discouraged-worker este mai puternic dect efectul addedworker.
Ca o prim aproximare putem scrie relaia dintre RFM i RS astfel: RFM=B0 + B1*RS B0, B1 se numesc parametrii modelului matematic. B1 ne arat cu ct se modific RFM atunci cnd RS se modific cu o unitate. B1 poate fi pozitiv caz n care n exemplul nostru efectul added-worker domin efectul discouraged-worker sau poate fi negativ caz n care efectul discouraged-worker este mai puternic dect efectul added-worker. Gaficul sugereaz, n cazul exemplului nostru, c B1<0. (1)
Modelul (2) este cunoscut sub numele de model regresional liniar care n forma sa general arat astfel: Y=B0 + B1*X + u unde: Y variabila dependent (explicat, output); X variabila independent (explicativ, input). Se observ c relaia (2) deriv din relaia (1) ceea ce demonstreaz complementaritatea matematicilor economice i a econometriei. Observaie n ecuaia (2) am stabilit c RFM este variabila dependent, iar RS este variabila independent. Se pune ntrebarea: sunt cele dou variabile relaionate cauzal? Este RS cauza i RFM efectul? Cu alte cuvinte implic regresia cauzalitate? (3)
Kendall i Stuart3 noteaz c o relaie statistic, orict de puternic i sugestiv nu poate stabili o relaie cauzal. Ideea de cauzalitate trebuie s vin din afara statisticii. Conform acestei teorii, n cazul exemplului nostru, teoria economic trebuie s stabileasc relaia de tip cauz-efect, dac exist, ntre cele dou variabile. Dac cauzalitatea nu poate fi stabilit, atunci ecuaia (2) o vom numi relaie predictiv, adic tiind RS putem previziona RFM.
Parametrii modelului, aa cum vom vedea mai trziu, se determin prin metoda celor mai mici ptrate. n acest caz vom avea: RFM= 97.9 0.446*RS 3.86*COM (6)
Aceast relaie ne arat urmtoarele: dac COM este constatat atunci RFM se modific cu 0.446 puncte procentuale la modificri cu o unitate ale RS;
Kendall, M.G., Stuart, A., The Advanced Theory of Statistics, Charles Griffin Publishers, New-York, 1961.
dac RS este constatat atunci RFM se modific cu 3.86 puncte procentuale la modificri cu o unitate ale COM.
Date calitative
etichete sau nume utilizate pentru identificarea unui atribut al fiecrui element. Pot fi numerice sau non-numerice
elemente (uniti) statistice entiti n funcie de care sunt colectate datele. populaie statistic ansamblul tuturor elementelor eantion subansamblul unei populaii variabil statistic caracteristic comun a unitilor unei populaii Clasificarea variabilelor statistice
Variabile calitative
sunt formate din date calitative
Discrete
iau doar anumite valori dintr-un interval
Continue
iau orice valoare dintr-un interval
Clasificarea II Variabile atributive exprim o nsuire esenial a elementelor; Variabile de timp exprim timpul n care au luat fiin elementele (data de expirare a unui produs); Variabile de spaiu exprim spaiul n care exist unitile (localizarea punctelor de distribuie a presei). Seria statistic grupare de valori rezultat ca urmare a analizrii unei populaii n raport cu una sau mai multe variabile. Clasificare 1. dup numrul variabilelor de la baza seriei: Serii statistice unidimensionale au la baz o singur variabil; Serii statistice multidimensionale au la baz dou sau mai multe variabile. 2. dup tipul variabilelor de la baza seriei: Serii calitative au la baz variabile calitative;
3.
4.
Serii cantitative au la baz variabile cantitative. dup natura variabilelor de la baza seriei: Serii atributive au la baz variabile atributive; Serii cronologice (de timp) au la baz variabile de timp; Serii teritoriale (de spaiu) au la baz variabile de spaiu; o clasificare general a seriilor statistice ar fi urmtoarea: Serii de repartiie redau distribuia populaiei n raport cu una sau mai multe variabile; Serii de variaie redau variaia unei mrimi n timp, spaiu sau de la o categorie la alta. Organizarea datelor Seria de repartiie (de distribuie) construcie ce arat frecvena (numrul de observri) fiecrei clase (grupe) ce apare n populaia studiat. Ea se prezint sub urmtoarea form: Clasa x1 ... xk ... xr Frecvena N1 ... Nk ... Nr
unde xk, k= 1, r , sunt strile variabilei X n raport cu care este studiat populaia, iar Nk, k= 1, r , reprezint numrul de uniti ale populaiei pentru care variabila X a nregistrat valoarea xk, k= 1, r , i poart numele de frecven absolut. frecvena relativ (fk)=
Frecvena absolut cumulat: N(xk)=N1+...+Nk, k= 1, r ; Frecvena relativ cumulat: F(xk)=f1+...+fk, k= 1, r . Exemplul 1 Distribuia studenilor dup nota obinut la statistic a fost urmtoarea: Nota 4 5 6 7 8 9 10 Total Frecvena absolut 10 20 25 40 35 15 5 Frecvena relativ Frecvena absolut cumulat Frecvena relativ cumulat
Organizarea datelor calitative n cazul unei serii ce are la baz o variabil calitativ, clasele se stabilesc n raport cu strile variabilei. Astfel, pentru fiecare stare a variabilei se va construi o clas.
Exemplul 2 Un productor de pine realizeaz cinci sortimente de pine pe care le pune n vnzare printr-un magazin propriu. Cele cinci sortimente de pine sunt: franzel (F), baghet (B), pine alb (PA), pine neagr (PN), pine integral (PI). Productorul iniiaz un studiu n vederea obinerii de informaii cu privire la sortimentul care se bucur de cel mai mare succes printre consumatori. Pentru aceasta productorul urmrete un lot de n=30 clieni pentru a vedea sortimentul pe care acetia l prefer. Rezultatele studiului sunt redate n tabelul urmtor: PA PA F B PA PI 1. 2. 3. 4. PI PN PA F F B B PI PN PN PA PI PA PA F B F PN PI PA PA F F B
Populaia studiat este format din_________________________ Volumul eantionului este n=_______ Variabila n raport cu care este studiat eantionul este__________, de tip_______, avnd strile_______________ Repartiia clienilor n raport cu sortimentul ales este: Sortiment (S) F B PA PN PI Total Organizarea datelor cantitative Frecvena absolut Frecvena relativ Frecvena absolut cumulata Frecvena relativ cumulata
n cazul n care seria are la baz o variabil cantitativ discret dar cu un numr relativ mic de stri, clasele se stabilesc ca i n cazul seriilor care au la baz variabile cu caracter calitativ adic fiecrei stri a variabilei i se asociaz o clas. Exemplul 3 Managerii unei firme (F) avnd 20 de angajai doresc s cunoasc date referitoare la acetia n vederea realizrii unor promovri. Referitor la vechimea angajailor n firm, datele culese au fost urmtoarele: Vechimea angajailor (V) 2 2 4 3 1. 2. 3. 4. 4 5 2 5 2 3 3 5 4 3 3 2 2 3 3 5
Populaia studiat este format din_________________________ Volumul eantionului este n=_______ Variabila n raport cu care este studiat eantionul este__________, de tip_______, avnd strile_______________ Repartiia angajailor n raport cu vechimea ales este: Vechime (V) 2 3 4 Frecvena absolut1 Frecvena relativ (%)2 Frecvena absolut cumulat3 Frecvena relativ cumulat (%)4
5 Total Ce se ntmpl dac la baza unei serii statistice st o variabil cantitativ continu sau discret dar cu un numr mare de stri? intervalele de variaie. Clasa xo x1 ... xk-1 xk ... xr-1 xr unde: Frecvena N1 ... Nk ... Nr
xo=xmin este cea mai mic valoare nregistrat de variabil; xr=xmax este (n general) cea mai mare valoare nregistrat de variabil; xk-1 - xk clasa, intervalul de variaie; xk=xk-1+l, unde l este lungimea intervalului de variaie, k= 1, r . Lungimea intervalului (l)=
Exemplul 4 Relativ la veniturile lunare ale angajailor firmei F, datele culese (sute RON) sunt urmtoarele: Veniturile angajailor (Vn) 12 15 20 22 1. 2. 3. 4. 14 14 15 27 21 18 19 18 22 32 16 18 17 23 28 13
Populaia studiat este format din_________________________ Volumul eantionului este n=_______ Variabila n raport cu care este studiat eantionul este__________, de tip_______, avnd strile_______________ Repartiia angajailor n raport cu venitul ales este (se vor folosi 5 calse): Venit (Vn) Frecvena absolut1 Frecvena relativ (%)2 Frecvena absolut cumulat3 Frecvena relativ cumulat (%)4
Total Distribuii bidimensionale X Y y1 y2 ... yi ... yI Total x1 N11 N21 Ni1 NI1 N1 x2 N12 N22 Ni2 NI2 N2 ... ... ... ... ... ... xj N1j N2j Nij NIj Nj ... ... ... ... ... ... xJ N1J N2J NiJ NIJ NJ Total
N1 N2
N i
N I
N
10
n acest tabel notaiile ce apar reprezint: Nij numrul de uniti pentru care variabila X a nregistrat starea xj, iar variabila Y a nregistrat starea yi; N i - numrul de uniti pentru care variabila Y a nregistrat starea yi indiferent de nivelul nregistrat de variabila X; Nj - numrul de uniti pentru care variabila X a nregistrat starea xj indiferent de nivelul nregistrat de variabila Y; N volumul populaiei studiate.
Exemplul 5 Relativ la angajaii firmei F, repartiia bidimensional n raport cu vechimea i veniturile salariale lunare va arta astfel: Venituri salariale (Vn) 20 24 24 28
16 20
28 32
Total
Parametrii tendinei centrale i de structur Cazul discret Valoarea medie (, x ) populaie eantion Valoarea median (Me) Modalitatea de calcul a valorii mediane n cazul discret implic urmtoarele etape: Determinarea rangului valorii mediane: rMe
xk N k
N
n
= xk f k , = xk f k
x=
x k nk
N ; 2
Dac rMe atunci Me = x[rMe ]+1 , unde [rMe] reprezint partea ntreag a rangului medianei; Dac
rMe atunci Me =
xrMe + xrMe +1 2
Valoarea modal este acea valoare a unei variabile pentru care s-a nregistrat cea mai mare frecven Quartilele Aa cum am vzut mpart populaia n 4 pri egale ceea ce implic faptul c vom avea de calculat p=3 valori. Modalitatea de calcul nu difer foarte mult de cea din cazul medianei. Astfel vom avea urmtoarele etape:
11
Determinarea rangului quartilei: rQ p = Dac rQ p atunci Qp = x r rangului quartilei; Dac rQ p atunci Qp = Cazul datelor grupate pe intervale de variaie Clasa [xo , x1] (x1 , x2] ... (xk-1, xk] ... (xr-1, xr] Valoarea medie (, x ) Frecvena absolut N1 N2 ... Nk ... Nr
qp
[ ]+1 , unde [r
p
p N ; 4
Qp]
x rq + x rq
p
+1
n cazul datelor grupate pe intervale de variaie modalitatea de calcul a valorii medii este urmtoarea: n cazul populaiei:
=
=
xk N k
N
= x k f k , unde x k = = x k f k , unde x k =
xk nk
n
(mijlocul intervalului de variaie) Valoarea median (Me) Determinarea rangului valorii mediane: rMe =
N ; 2
Determinarea intervalului valorii mediane se calculeaz frecvenele cumulate pn la acea frecven care adugat conduce la depirea rangului valorii mediane, cu alte cuvinte dac N1+...+Nk rMe, atunci Me(xk-1 , xk] interval cruia i corespunde frecvena Nk; Calcularea expresiei x =
cumulat pn la intervalul median; Calcularea valorii mediane: Me = xk-1 + x. Valoarea modal (Mo) Determinarea intervalului valorii modale - acel interval pentru care s-au nregistrat cele mai multe uniti statistice; Mo = xk-1 +
1 + 2
i frecvena intervalul precedent, iar 2 este diferena dintre frecvena intervalului modal i frecvena intervalul urmtor.
12
p N , p= 1, m 1 ; m
Determinarea intervalului quartilei se calculeaz frecvenele cumulate pn la acea frecven care adugat conduce la depirea rangului quartilei, cu alte cuvinte dac N1+...+Nk rq p , atunci qp (xk-1 , xk]; Calcularea expresiei x =
rq p N ( x k 1 ) Nk
cumulat pn la intervalul quartilei, iar lk este lungimea intervalului quartilei; Calcularea valorii quartile: qp = xk-1 + x, p= 1, m 1 . Parametrii variaiei Dispersia (2, s2). Abaterea medie ptratic (, s). Dispersia Populaie Caz discret date
2 negrupate x =
(xk )
(xk ) =
N
Nk
unde x k =
Eantion Caz discret
date negrupate
2 sx =
(xk x )
n 1
2
date grupate
2 sx =
(xk x ) nk .
n 1
2
(xk x ) nk ,
n 1
unde x k =
este frecvena clasei n eantion. Abaterea medie ptratic msoar gradul de reprezentativitate al valorii medii, dnd msura gradului de mprtiere a valorilor variabilei n jurul valorii medii. Populaie: x =
2 x
13
Eantion: sx =
2 sx .
x 100 ;
x 100 .
sx
Exemplul 6 Relum exemplul relativ la vechimea angajailor firmei F. Seria statistic obinut n acest caz a fost: Vechime (V) 2 3 4 5 Total Frecvena absolut 6 7 3 4 20
S se determine vechimea medie, median, modal, quartilele i parametrii variaiei. Exemplul 7 n cazul veniturilor angajailor firmei F avem: Clasa de venit [12,16] (16,20] (20,24] (24,28] (28,32] Centrul 14 18 22 26 30 Frecvena absolut 7 6 4 2 1
n x i2 ( x i )
n x i y i x i y i
2
n y i2 ( y i )
Valorile coeficientului de corelaie sunt cuprinse ntre -1 i 1. Astfel: dac r[0;0,3] legtur liniar pozitiv (direct) slab; dac r(0,3;0,7] legtur liniar pozitiv (direct) de intensitate medie; dac r (0,7;1] legtur liniar pozitiv (direct) puternic; dac r[-0,3;0] legtur liniar negativ (invers) slab; dac r[-0,7; -0,3) legtur liniar negativ (invers) de intensitate medie; dac r [-1; -0,7) legtur liniar negativ (invers) puternic.
14
Exemplul 8 Un eantion de 20 de angajai ai unei firme a furnizat urmtoarele date n ceea ce privete vechimea i venitul lunar: Vechimea (ani) 2 2 4 3 3 4 5 5 1 2 5 5 5 3 3 2 4 5 1 3 Venitul (mil. ROL) 15 16 20 17 16 19 22 21 12 14 22 21 21 16 18 14 19 21 10 17
x=
xi .
n
2 x
(xi x ) =
n 1
2 x
Estimatorul punctual al abaterii medii ptratice a populaiei x este abaterea medie ptratic de eantion sx=
2 sx
este
sx
unde:
sx =
sx n
p.
15
Exemplul 9 Datele urmtoare corespund unui eantion de 8 angajai ai unei companii studiai n raport cu salariul lunar exprimat n mii RON. 6, 8, 10, 7, 10, 12, 14, 5. Pe de alt parte se tie c 2 din cei 8 angajai au urmat un curs de calificare. S se estimeze punctual: 1. media populaiei; 2. abaterea medie ptratic a populaiei; 3. eroarea standard a mediei; 4. proporia populaiei.
Estimarea parametrilor prin intervale de ncredere Intervalul (1,2) se numete interval de ncredere pentru parametrul necunoscut dac P(1< < 2)= 1, unde (1) se numete coeficient (nivel) de ncredere iar se numete coeficient (nivel) de semnificaie.
Dac este un estimator punctual al parametrului necunoscut atunci intervalul de ncredere pentru parametrul va avea forma: (eroarea de eantion)
(eroarea de eantion)
Cazul eantioanelor de volum mare (n30) Dac se cunoate dispersia populaiei atunci:
x z 2 x x =
x z 2 s x
sx =
sx n
16
Nivel de semnificaie
Exemplul 10 Pentru a estima costul mediu al cazrii/noapte ntr-o anumit staiune este studiat un eantion de 64 de turiti. Datele obinute au artat un cost mediu de 32 euro. 1. Presupunnd c abaterea medie ptratic la nivel de populaie este =2,4 euro determinai un interval de ncredere pentru valoarea medie cu un coeficient de ncredere de 0,95. 2. Presupunnd c nu se cunoate dispersia populaiei dar c eantionul a furnizat o dispersie
2 s x =4,
ncredere de 0,95.
(x t 2;(n1) gl s x ), s x =
sx n
Exemplul 11 S se determine un interval de ncredere pentru salarul mediu al angajailor companiei de la Exemplul 9 cu un nivel de ncredere de 0,95.
Interval de ncredere pentru estimarea diferenei a dou valori medii Cazul eantioanelor independente o Eantioane independente de volum mare (n1 30, n2 30)
17
1 2 x1 x2 z 2 x x
1
),
x1 x2
12
n1
2 2
n2
Dac nu se cunosc dispersiile populaiilor atunci acestea se nlocuiesc cu estimatorii lor punctuali i anume dispersiile de eantion
2 2 s1 , s 2 ,
iar
x x
1
sx
1 x2
2 2 s1 s 2 = + n1 n 2
1 2 x1 x2 z 2 s x x
1
).
Exemplul 12 Se consider dou populaii originare studiate n raport cu aceeai variabil. Din prima populaie se extrage un eantion de volum n1=50 ce a furnizat o valoare medie
x1 =15
x2 =12
cu o abatere medie
s2=3. Cu un nivel de ncredere de 95% s se determine un interval de ncredere pentru diferena valorilor medii ale celor dou populaii.
1 2 x1 x 2 t 2 ; gl s x x
1
sx
1 x2
),
.
Exemplul 13 Din dou populaii originare avnd dispersii egale s-au extras urmtoarele dou eantioane: 2, 5, 5, 3, 4, 7, 4, 2, 5, 3; 2, 4, 5, 3, 1, 2, 3, 4. Cu un nivel de ncredere de 95% s se determine un interval de ncredere pentru diferena mediilor celor dou populaii.
18
d (d z 2 s d ) , d=x1 x2,
Valoarea medie: d =
2 Dispersia: sd
di , di = x1i x2i
n
2
(d d ) = i
n1
; ;
2 sd = sd
sd n
Exemplul 14 Datele de mai jos reprezint timpii realizai de o echip ce asambleaz manual anumite produse de artizanat nainte i dup parcurgerea unui stagiu de pregtire: Muncitor 1 2 3 4 5 6 7 8 9 10 nainte de stagiu 10 10 8 9 7 8 9 6 8 9 Dup stagiu 8 7 7 9 6 7 8 5 5 6
S se estimeze diferena dintre performanele muncitorilor nainte i dup parcurgerea stagiului de pregtire, cu un nivel de ncredere de 95%.
Verificarea ipotezelor statistice Teste de semnificaie Fie un parametru necunoscut al unei populaii. O ipotez formulat asupra acestui parametru se va numi ipotez nul Ho.
19
Ho: =o O alt ipotez ce se formuleaz este ipoteza alternativ H1 ce poate avea urmtoarea form: H1: o test bilateral; H1: >o test unilateral la dreapta; H1: <o test unilateral la stnga. Etapele derulrii unui test de semnificaie 1. Formularea ipotezei nule i a ipotezei alternative Teste unilaterale Ho: =o Ho: =o H1: >o H1: < o
Determinarea nivelului de semnificaie - probabilitatea comiterii unei erori prin respingerea ipotezei nule datorit erorii de eantionare, n cazul n care aceasta este de fapt adevrat; Colectarea datelor la nivel de eantion, alegerea i calcularea statisticii test ce va fi folosit pentru a decide acceptarea sau respingerea ipotezei nule; Determinarea valorilor critice ale statisticii; Luarea deciziei.
Figura 12.2.1.
Zon de respingere
valoarea critic
valoarea critic
valoarea critic
20
valoarea critic
Verificarea ipotezelor asupra valorii medii Test bilateral Test unilateral Formularea ipotezelor Formularea ipotezelor Ho: =o; H1: o Ho: =o; H1: >o Ho: =o; H1: <o Determinarea nivelului de semnificaie Determinarea nivelului de semnificaie Colectarea datelor la nivel de eantion, alegerea Colectarea datelor la nivel de eantion, alegerea i calcularea statisticii: i calcularea statisticii: a. z=
x o
sau z=
x o sx
a. z=
x o
sau z=
x o sx
b. t=
x o sx
b. t=
x o sx
a. z b. t ;(n 1)gl
Luarea deciziei Dac valorile calculate ale statisticilor se afl ntre valorile critice atunci ipoteza nul nu poate fi respins n caz contrar aceasta se respinge
Luarea deciziei Dac valorile calculate Dac valorile sunt mai mici dect cele calculate sunt mai critice ipoteza nul nu mari dect cele poate fi respins. critice ipoteza nul nu poate fi respins.
Exemplul 15 Un productor de baterii ofer o garanie de 20 de zile. Un eantion de 100 de baterii a furnizat o medie de 19,5 zile cu o abatere medie de dou zile. Cu un nivel de semnificaie =0,05 verificai dac garania oferit este corect.
21
Exemplul 16 Se studiaz timpul de ateptare ntre dou autobuze. Un eantion de volum n=10 a oferit urmtorii timpi exprimai n minute: 2, 5, 5, 3, 4, 7, 4, 2, 5, 3; S se verifice ipoteza c timpul mediu de ateptare este de 3 minute cu =0,05.
Verificarea ipotezelor asupra diferenei valorilor medii 1-2 Eantioane independente Test bilateral Test unilateral Formularea ipotezelor Formularea ipotezelor Ho: 1-2=0; H1: 1-20 Ho: 1-2=0; H1: 1-2 >0 Ho: 1-2=0; H1: 1-2<0 Determinarea nivelului de semnificaie Determinarea nivelului de semnificaie Colectarea datelor la nivel de eantion, alegerea Colectarea datelor la nivel de eantion, alegerea i i calcularea statisticii calcularea statisticii n130, n230 n130, n230 z=
(x x ) (
1 2
2 )
2 s2
sx
1 x2
z=
(x
1 x2
x 2 ( 1 2 ) , sx x
1 2
sx
=
2
2 s1
n1
2
n2
2
sx
1 x2
2 2 s1 s 2 + n1 n 2 2 2
n1<30, n2<30 ( 1 = 2 = ) t=
(x x ) (
1 2
2 )
n1<30, n2<30 ( 1 = 2 = )
2
sx
=s
t=
(x x ) (
1 2
2 )
1 x2
sx =s
1 x2
sx
1 x2
1 1 , + n1 n 2
sx
1 x2
1 1 , + n1 n 2
s2 =
s2 =
22
2 2 ;( n1 + n2 2 ) gl
sau
t ;( n1 + n2 2 ) gl
Luarea deciziei Dac valorile calculate Dac valorile calculate Dac valorile calculate ale statisticilor se afl sunt mai mici dect sunt mai mari dect cele ntre valorile critice atunci ipoteza nul se cele critice ipoteza nul critice ipoteza nul se accept n caz contrar aceasta se respinge se accept. accept. Eantioane perechi Test bilateral Test unilateral Formularea ipotezelor Formularea ipotezelor Ho: d=0; H1: d 0 Ho: d=0; H1: d>0 Ho: d=0; H1: d<0 Determinarea nivelului de semnificaie Determinarea nivelului de semnificaie Colectarea datelor la nivel de eantion, alegerea Colectarea datelor la nivel de eantion, alegerea i i calcularea statisticii calcularea statisticii n30 n30 z= n<30 t= Luarea deciziei
d d s , sd = d sd n
n<30
z=
d d s , sd = d sd n d d s , sd = d sd n
d d s , sd = d sd n
t=
Determinarea valorilor critice n30 z sau - z n<30 t ;( n 1 ) gl sau t ;( n 1 ) gl Luarea deciziei Dac valorile calculate Dac valorile calculate sunt mai mici dect cele sunt mai mari dect cele critice ipoteza nul se critice ipoteza nul se accept. accept.
Luarea deciziei Dac valorile calculate ale statisticilor se afl ntre valorile critice atunci ipoteza nul se accept n caz contrar aceasta se respinge
Exemplul 17 Se iniiaz un studiu n scopul de a estima diferena de vrst dintre angajaii a dou compartimente ale unei companii. n primul compartiment s-a extras un eantion de volum n1=36 care a furnizat o vrst medie
x1 =40
ani cu o abatere medie de s1=9 ani. Din cel de al doilea compartiment se extrage un
nivel de semnificaie =0,05 verificai dac: 1. vrstele medii n cele dou compartimente difer semnificativ; 2. este mai mare media de vrst din primul compartiment.
23
Exemplul 18 Se consider urmtoarele dou eantioane extrase din dou populaii ce au aceeai dispersie: Eantion 1 n1=15 x1 =8 s1=2 Eantion 2 n2=10 x2 =6 s2=1
Cu un nivel de semnificaie =0,05 verificai dac: 1. mediile celor dou populaii difer semnificativ; 2. este mai mare media primei populaii.
Exemplul 19 O companie deine cinci magazine de desfacere a produselor proprii. Compania a lansat pe pia un nou produs i a urmrit vnzrile n prima sptmn de dup lansare. Valorile nregistrate n cele cinci magazine au fost: 25, 28, 20, 23, 29. Companie recurge la o campanie promoional. Dup lansarea campaniei situaia vnzrilor n cele cinci magazine a fost: 28, 30, 25, 25, 32. Cu =0,05 verificai dac a avut efect asupra vnzrilor campania promoional.
24
1. Formularea ipotezelor;
Ho: 1=2=...=k; H1: nu toate mediile sunt egale. 2. Stabilirea nivelului de semnificaie ; 3. Calculul elementelor necesare determinrii valorii statisticii test 3.1. Calculul mediei i dispersiei fiecrui eantion 3.2. Calculul valorii medii totale
xi , si2 ,i = 1,k ;
x;
k 2 sb = i =1
k
ni xi x
k 1
2 sw =
(ni 1)si2
(n1 + ... + nk ) k
i =1
(ni 1)si2
=
i =1
nk
Tabelul ANOVA Tabelul ANOVA este un tabel n care se trec toate elementele calculate la punctul acesta avnd urmtoarea structur: Sursa ntre grupuri n grupuri Total Suma ptratelor SSB SSW SST=SSB+SSW Grade de libertate k1 nk n1 Media sumelor ptratelor
2 s w = SSW (n k ) 2 s b = SSB (k 1)
25
SSB
F=
SSW
(k 1) = sb2 (n k )
2 sw
5. Determinarea valorilor critice F; (k-1, n-k)gl; 6. Luarea deciziei: dac F> F; (k-1, n-k)gl ipoteza nul se respinge n caz contrar aceasta acceptnduse. Exemplul 20 Se iniiaz un studiu pentru a compara venitul mediu al populaiilor din dou zone diferite ale unei ri. Pentru aceasta din fiecare zon este extras cte un eantion de volum n=5, datele obinute fiind urmtoarele: Zona 1 7,2 8 6,3 5,4 7 Venitul Zona 2 6 7,5 6,4 7 8,6 Zona 3 5 4,2 5,3 6 4,8
26
Fi de lucru O companie hotelier deine hoteluri att n zona montan ct i pe litoral. ntr-unul din hotelurile aflate n zona montan se iniiaz un studiu cu scopul obinerii unor date referitoare la vrsta clienilor, perioada de edere, scopul ederii precum i sexul clienilor. Pentru aceasta este selectat un eantion de 50 de clieni datele obinute fiind urmtoarele: Vrsta 30 32 34 33 45 42 46 36 39 45 33 40 42 42 50 50 50 46 48 38 38 39 34 45 46 48 36 36 35 30 45 41 42 42 50 46 35 30 30 36 Perioada de edere (zile) 1 1 1 2 4 4 1 3 1 1 2 3 4 4 5 5 5 5 5 3 3 3 2 4 5 5 3 3 2 1 4 4 4 4 5 5 1 1 1 3 Scopul Tranzit Tranzit Afaceri Afaceri Odihn Odihn Afaceri Afaceri Tranzit Tranzit Afaceri Odihn Afaceri Odihn Odihn Odihn Afaceri Afaceri Afaceri Tranzit Afaceri Afaceri Afaceri Odihn Odihn Odihn Tranzit Tranzit Afaceri Tranzit Odihn Odihn Afaceri Afaceri Afaceri Odihn Tranzit Tranzit Afaceri Afaceri Sex Femeie Femeie Brbat Brbat Brbat Femeie Brbat Femeie Brbat Femeie Femeie Brbat Brbat Brbat Femeie Femeie Brbat Brbat Brbat Femeie Femeie Femeie Femeie Brbat Brbat Brbat Brbat Brbat Brbat Brbat Brbat Brbat Brbat Brbat Femeie Femeie Femeie Brbat Femeie Brbat
27
38 49 46 50 50 36 37 37 46 50 1.
Odihn Odihn Odihn Afaceri Afaceri Tranzit Tranzit Odihn Odihn Afaceri
Femeie Femeie Brbat Femeie Femeie Brbat Femeie Brbat Brbat Femeie
2. 3. 4. 5. 6.
Vrsta medie este de _______________ Abaterea de la vrsta medie este de _________ Vrsta median este ___________ Este vrsta medie acelor cazai la hotel mai mare de 39 de ani? Repartiia eantionului dup perioada de edere este: Numr zile 1 2 3 4 5 Frecvena
7. 8. 9. 10. 11.
Perioada medie de edere este________________ Abaterea de la perioada medie este __________ Perioada median este ____________ Este perioada medie mai mic de 4 zile? Distribuia eantionului n raport cu scopul ederii i vrsta este: 30 35 35 40 40 45 45 50 Total
Vrsta Scopul Afaceri Odihn Tranzit Total Perioada Scopul Afaceri Odihn Tranzit Total
12. Distribuia eantionului n raport cu scopul ederii i perioada de edere este: 1 2 3 4 5 Total
13. Distribuia eantionului n raport cu scopul ederii i sexul este: Scop Sex Brbai Femei Total Afaceri Odihn Tranzit Total
28
Acelai studiu efectuat ntr-un hotel de pe litoral pe un eantion de 40 de clieni a condus la urmtoarele date n ceea ce privete vrsta i perioada de edere: Vrsta 32 36 45 44 42 39 48 48 50 35 Perioada 3 3 5 5 4 2 5 5 3 3 Vrsta 35 36 38 48 47 42 46 31 31 39 Perioada 4 4 5 5 3 3 5 5 5 3 Vrsta 46 49 49 40 40 30 30 35 35 38 Perioada 4 4 4 5 3 3 4 5 5 3 Vrsta 37 49 46 46 45 47 50 35 32 39 Perioada 3 3 3 5 5 3 4 2 5 4
14. Difer semnificativ vrstele medii ale clienilor celor dou hoteluri? 15. Difer semnificativ perioadele medii de edere ale clienilor celor dou hoteluri? 16. Difer semnificativ proporia turitilor ce petrec 5 zile la mare de proporia turitilor ce petrec aceeai perioad la munte ? Dup analizarea rezultatelor studiului compania concepe un pachet turistic de 5 zile pus n vnzare prin propria agenie i iniiaz n acelai timp o campanie de promovare. Datele obinute n ceea ce privete vnzrile nainte i dup campania de promovare au fost urmtoarele: nainte de campanie 5 5 6 9 9 10 2 6 8 8 8 5 6 9 9 10 11 12 10 6 17. A avut campania de promovare efectul dorit? Dup campanie 6 6 6 11 8 8 5 6 7 9 9 10 6 10 12 10 11 12 10 8
29
Distribuia Student t Grade de libertate 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 t0.100 3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 1.372 1.363 1.356 1.350 1.345 1.341 1.337 1.333 1.330 1.328 1.325 1.323 1.321 1.319 1.318 1.316 1.315 1.314 1.313 1.311 1.310 1.303 1.296 1.289 t0.050 6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 1.796 1.782 1.771 1.761 1.753 1.746 1.740 1.734 1.729 1.725 1.721 1.717 1.714 1.711 1.708 1.706 1.703 1.701 1.699 1.697 1.684 1.671 1.658 t0.025 12.706 4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 2.201 2.179 2.160 2.145 2.131 2.120 2.110 2.101 2.093 2.086 2.080 2.074 2.069 2.064 2.060 2.056 2.052 2.048 2.045 2.042 2.021 2.000 1.980 t0.010 31.821 6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 2.764 2.718 2.681 2.650 2.624 2.602 2.583 2.567 2.552 2.539 2.528 2.518 2.508 2.500 2.492 2.485 2.479 2.473 2.467 2.462 2.457 2.423 2.390 2.358 t0.005 63.657 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 3.106 3.055 3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 2.831 2.819 2.808 2.797 2.787 2.779 2.771 2.763 2.756 2.750 2.704 2.660 2.617
30
Distribuia 2
gl 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50
0,250 1,32 2,77 4,11 5,39 6,63 7,84 9,04 10,2 11,4 12,5 13,7 14,8 16,0 17,1 18,2 19,4 20,5 21,6 22,7 23,8 24,9 26,0 27,1 28,2 29,3 30,4 31,5 32,6 33,7 34,8 45,6 56,3
0,100 2,71 4,61 6,25 7,78 9,24 10,6 12,0 13,4 14,7 16,0 17,3 18,5 19,8 21,1 22,3 23,5 24,8 26,0 27,2 28,4 29,6 30,8 32,0 33,2 34,3 35,6 36,7 37,9 39,1 40,3 51,8 63,2
0,050 3,84 5,99 7,81 9,49 11,1 12,6 14,1 15,5 16,9 18,3 19,7 21,0 22,4 23,7 25,0 26,3 27,6 28,9 30,1 31,4 32,7 33,9 35,2 36,4 37,7 38,9 40,1 41,3 42,6 43,8 55,8 67,5
0,025 5,02 7,38 9,35 11,1 12,8 14,4 16,0 17,5 19,0 20,5 21,9 23,3 24,7 26,1 27,5 28,8 30,2 31,5 32,9 34,2 35,5 36,8 38,1 39,4 40,6 41,9 43,2 44,5 45,7 47,0 59,3 71,4
0,010 6,63 9,21 11,3 13,3 15,1 16,8 18,5 20,3 21,7 23,2 24,7 26,2 27,7 29,1 30,6 32,0 33,4 34,8 36,2 37,6 38,9 40,3 41,6 43,0 44,3 45,6 47,0 48,3 49,6 50,9 63,7 76,2
0,005 7,88 10,6 12,8 14,9 16,7 18,5 20,3 22,0 23,6 25,2 26,8 28,3 29,8 31,3 32,8 34,3 35,7 37,2 38,6 40,0 41,4 42,8 44,2 45,6 46,9 48,3 49,6 51,0 52,3 53,7 66,8 79,5
0,001 10,8 13,8 16,3 18,5 20,5 22,5 24,3 26,1 27,9 29,6 31,3 32,9 34,5 36,1 37,7 39,3 40,8 42,3 43,8 45,3 46,8 48,3 49,7 51,2 52,6 54,1 55,5 56,9 58,3 59,7 73,4 86,7
31
Distribuia Fischer pentru un nivel de semnificaie de 5% (=0,5) k-1 n-k 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 Grade de libertate ale numrtorului 1 161.4 18.51 10.13 7.71 6.61 5.99 5.59 5.32 5.12 4.96 4.84 4.75 4.67 4.60 4.54 4.49 4.45 4.41 4.38 4.35 4.32 4.30 4.28 4.26 4.24 4.22 4.21 4.20 4.18 4.17 4.08 2 199.5 19.00 9.55 6.94 5.79 5.14 4.74 4.46 4.26 4.10 3.98 3.88 3.80 3.74 3.68 3.63 3.59 3.55 3.52 3.49 3.47 3.44 3.42 3.40 3.38 3.37 3.35 3.34 3.33 3.32 3.28 3 215.7 19.16 9.28 6.59 5.41 4.76 4.35 4.07 3.68 3.71 3.59 3.49 3.41 3.34 3.29 3.24 3.20 3.16 3.13 3.10 3.07 3.05 3.03 3.01 2.99 2.98 2.96 2.95 2.93 2.92 2.84 4 224.6 19.25 9.12 6.39 5.19 4.53 4.12 3.84 3.63 3.48 3.36 3.26 3.18 3.11 3.06 3.01 2.96 2.93 2.90 2.87 2.84 2.82 2.80 2.78 2.76 2.74 2.73 2.71 2.70 2.69 2.61 5 230.2 19.30 9.01 6.26 5.05 4.39 3.97 3.69 3.48 3.33 3.20 3.11 3.02 2.96 2.90 2.85 2.81 2.77 2.74 2.71 2.68 2.66 2.64 2.62 2.60 2.59 2.57 2.56 2.54 2.53 2.45 6 234.0 19.33 8.94 6.16 4.95 4.28 3.87 3.58 3.37 3.22 3.09 3.00 2.92 2.85 2.79 2.74 2.70 2.66 2.63 2.60 2.57 2.55 2.53 2.51 2.49 2.47 2.46 2.44 2.43 2.42 2.34 8 239.0 19.37 8.84 6.04 4.82 4.15 3.73 3.44 3.23 3.07 2.95 2.85 2.77 2.70 2.64 2.59 2.55 2.51 2.48 2.45 2.42 2.40 2.38 2.36 2.34 2.32 2.30 2.29 2.28 2.27 2.18 12 244.0 19.41 8.74 5.91 4.68 4.00 3.57 3.28 3.07 2.91 2.79 2.69 2.60 2.53 2.48 2.42 2.38 2.34 2.31 2.28 2.25 2.23 2.20 2.18 2.16 2.15 2.13 2.12 2.10 2.09 2.00 24 249.0 19.45 8.64 5.77 4.53 3.84 3.41 3.12 2.90 2.74 2.61 2.50 2.42 2.35 2.29 2.24 2.19 2.15 2.11 2.08 2.05 2.03 2.00 1.98 1.96 1.95 1.93 1.91 1.90 1.89 1.79
254.3 19.50 8.53 5.63 4.36 3.67 3.24 2.93 2.71 2.54 2.40 2.30 2.21 2.13 2.07 2.01 1.96 1.92 1.88 1.84 1.81 1.78 1.76 1.73 1.71 1.69 1.67 1.65 1.64 1.62 1.51
32