Sunteți pe pagina 1din 21

Problema 1

Un distribuitor de maini a raportat urmtoarea situaie.


Corelaia dintre greutatea i fiabilitatea unei maini este -0.30. Corelaia dintre greutatea i costul ntreinerii anuale este 0.20.

Care dintre urmtoarele afirmaii sunt corecte? I. Mainile mai grele tind s fie mai puin fiabile. II. Mainile mai grele tind s aib costuri mai mari de ntreinere. III. Greutatea mainii este relaionat mai puternic cu fiabilitatea dect cu costul ntreinerii. (A) Numai afirmaia I (B) Numai afirmaia II (C) Numai afirmaia III (D) Numai afirmaiile I i II (E) Toate trei afirmaiile Soluia Rspunsul corect este (E). Corelaia dintre greutate i fiabilitate este negativ. Acest lucru nseamn c fiabilitatea scade cu creterea greutii . Corelaia dintre greutate i costul ntreinerii este pozitiv. nseamn c cu ct greutatea mainii este mai mare cu att costul ntreinerii este mai mare. Legtura dintre cele dou variabile este indicat prin valoarea absolut a coeficientului de corelaie. Corelaia dintre greutatea mainii i fiabilitate are o valoare absolut de 0.30. Corelaia dintre greutatea mainii i costul ntreinerii , n valoare absolut este 0.20. De aceea legtura dintre fiabilitate i greutate este mai puternic dect legtura dintre greutate i costul ntreinerii. Punctaj = 1 punct

Problem 2
Un cercettor utilizeaz o ecuaie de regresie pentru ai previziona cheltuielile cu nclzirea locuinei ( n lei) pe baza suprafeei acestei locuine ( n metri) . Corelaia dintre cheltuieli i mrimea locuinei ( coeficientul de corelaie r ) este 0.70. Care este interpretarea corect a acestei situaii? (A) 70% din variaia total a cheltuielilor cu nclzirea poate fi explicat prin suprafaa locuinei. (B) 49% din variaia cheltuielilor cu nclzirea poate fi explicat prin suprafaa locuinei. (C) Pentru fiecare metru ptrat al suprafeei , cheltuielile cresc cu 70 de lei.

(D) Pentru fiecare metru ptrat adugat , cheltuielile cresc cu 49 lei. Soluie Rspunsul corect este (B). Coeficientul de determinare msoar proporia variaiei variabilei dependente care este previzionat prin variabila independent. Coeficientul de determinare este egal cu r2; n acest caz , ((0,70)2 sau 0.49. De aceea, 49% din variaia cheltuielilor de nclzire pot fi explicate prin suprafaa locuinei. Punctaj = 1 punct

Problema 3
Anul trecut , cinci studeni alei aleatoriu din total studeni ai unei faculti au participat la un test de verificare a aptitudinilor de matematic nainte de a fi primii la un curs de econometrie. Rezultatele obinute au la test au fost Xi i gradele asociate pentru participarea la cursul de econometrie au fost: Student xi 1 2 3 4 5 yi

95 85 85 95 80 70 70 65 60 70

Departamentul de statistic are de rspuns la trei ntrebri.


Ce ecuaie de regresie previzioneaz cel mai bine performana econometric , bazat pe notele obinute la testul de matematic? Dac un student obine 80 de puncte la testul de matematic care va fi gradul lui de performan la cursul de econometrie? Ct de bine estimeaz linia de regresie datele obinute?

Rezolvare Cum se obine ecuaia de regresie?

n tabelul de mai jos se calculeaz relaiile necesare pentru calculul ecuaiei de regresie. Ultimele dou coloane arat sumele i mediile care sunt utilizate n calculul ecuaiei de regresie. Student xi 1 2 3 4 5 Suma Media 95 85 80 70 60 78 yi 85 95 70 65 70 77 (xi - x) (yi - y) (xi - x)2 (yi - y)2 (xi - x)(yi - y) 17 7 2 -8 -18 8 18 -7 -12 -7 289 49 4 64 324 730 64 324 49 144 49 630 136 126 -14 96 126 470

390 385

Ecuaia de regresie este o ecuaie liniar de forma: y = b0 + b1x . Pentru a realiza analiza de regresie este nevoie s se calculeze parametrii modelului cu ajutorul relaiilor obinute prin metoda celor mai mici ptrate adic: b1 = [ (xi - x)(yi - y) ] / [ (xi - x)2] b1 = 470/730 = 0.644 b0 = y - b1 * x b0 = 77 - (0.644)(78) = 26.768

Rezult c ecuaia de regresie este y = 26.768 + 0.644x . Punctaj = 1 punct Cum se utilizeaz ecuaia de regresie Odat ce ecuaia de regresie este calculat utilizarea ei este simpl. Se alege o valoare pentru variabila independent (x), se introduce n ecuaia calculat i se obine valoarea lui (y). n problema noastr variabila independent este scorul obinut la testul de aptitudini. Variabila dependent este gradul acordat pentru participarea la cursul de econometrie. Dac un student obine 80 de puncte la testul de aptitudini scorul pentru participarea la cursul de econometrie este : y = 26.768 + 0.644x = 26.768 + 0.644 * 80 = 26.768 + 51.52 = 78.288 Punctaj = 1 punct Calculul coeficientului de determinare

Ori de cte ori se utilizeaz o ecuaie de regresie trebuie s ne ntrebm ct de bine estimeaz aceasta datele avute . O modalitate de a verifica acest fapt este calculul coeficientului de determinare , care poate fi calculat cu ajutorul formulei. r2 = { ( 1 / N ) * [ (xi - x) * (yi - y) ] / (x * y ) }2 unde N este numrul de observaii , este simbolul sumei , xi este valoarea lui x pentru fiecare observaie i, x este media lui x , yi valoarea lui y pentru fiecare observaie i, y este media valorilor lui y , x este deviaia standard a lui x, i y este deviaia standard a lui y. calculul pentru problema anterioar este. x = sqrt [ ( xi - x )2 / N ] x = sqrt( 730/5 ) = sqrt(146) = 12.083 y = sqrt [ ( yi - y )2 / N ] y = sqrt( 630/5 ) = sqrt(126) = 11.225

r2 = { ( 1 / N ) * [ (xi - x) * (yi - y) ] / (x * y ) }2 r2 = [ ( 1/5 ) * 470 / ( 12.083 * 11.225 ) ]2 = ( 94 / 135.632 )2 = ( 0.693 )2 = 0.48 Un coeficient de determinare egal cu 0.48 indic faptul c n jur de 48% din variaia variabilei dependente ( scorul de participare la cursul de econometrie) poate fi explicat prin nota obinut la testul de matematic. Acest lucru poate fi considerat o bun estimare a datelor n sensul c se poate prezice c studenii care vor participa la cursul de econometrie vor avea rezultate bune. Punctaj = 1 punct

Problem 4: Testarea ipotezelor


Un inventator dezvolt un motor nou mai eficient energetic . El susine c motorul va merge continuu 50 de ore (300 minute) cu numai 1 litru de benzin . Se presupune c sunt testate 50 de motoare alese aleatoriu dintrun lot mai mare. Motoarele testate funcioneaz continuu , n medie 295 minute, cu o deviaie standard de 20 minute. S se testeze ipoteza nule c timpul mediu de funcionare este de 300 minute fa de ipoteza alternativ c timpul mediu de funcionare nu este 300 minute. Se utilizeaz un nivel de semnificaie de 0.05 . (Se presupune c timpii de funcionare a motoarelor sunt distribuii dup o distribuie normal.) Soluie: Soluia acestei probleme se calculeaz n patru pai : (1) se formuleaz ipotezele, (2) se formuleaz un plan de analiz, (3) se analizeaz datele din eantion (4) interpreteaz rezultatele.

Formularea ipotezelor. Ipoteza nul: = 300 Ipoteza alternativ: <> 300 Se observ c aceast ipotez este un test bilateral. Ipoteza nul va fi respins dac media eantionului este prea mare sau prea mic.

Formularea planului de analiz. Pentru aceast analiz nivelul de semnificaie este 0.05. Metoda de testare este aplicarea unui test t -test Analiza datelor eantionului . Utiliznd datele se calculeaz eroarea standard (SE), Gradele de libertate (DF), i t-score test statistic (t). SE = s / sqrt(n) = 20 / sqrt(50) = 20/7.07 = 2.83 DF = n - 1 = 50 - 1 = 49 t = (x - ) / SE = (295 - 300)/2.83 = 1.77 Unde s este deviaia standard pentru eantion , x este media eantionului , este media ipotetic a populaiei, n este mrimea eantionului. Deoarece testul este bilateral P-value este probabilitatea ca t-score s aib 49 grade de libertate mai puin dect -1.77 sau mai mare ca 1.77. Se utilizeaz tabela pentru distribuia t ( vezi aanexa) i se gsete P(t < -1.77) = 0.04, i P(t > 1.75) = 0.04. Apoi P-value = 0.04 + 0.04 = 0.08.

Interpretarea rezultatelor . Deoarece P-value (0.08) este mai mare ca nivelul de semnificaie (0.05), nu se poate elimina ipoteza nul.

Punctaj = 2 puncte

Problem 5:
Un test unilateral O coal elementar are 300 elevi . Directorul colii spune c media nivelului de inteligen a elevilor colii IQ este cel puin 110. Pentru a verifica acest lucru el a adiminstrat un test IQ pentru 20 de elevi alei aleatoriu. Pentru elevii alei media IQ este 108 cu o deviaie standard 10. Pe baza rezultatelor obinute s-ar putea accepta sau rejecta ipoteza lui iniial? Se presupune un nivel de semnificaie de 0.01. Soluie:

Se formuleaz ipotezele.

Ipoteza nul: = 110 Ipoteza alternativ: < 110 Se reine c suntem n cazul unui test unilateral. Ipoteza nul va fi eliminat dac media eantionului va fi prea mic.

Se formuleaz planul de analiz. Pentru aceast analiz, nivelul de semnificaie este 0.01. Testul utilizat este un test t-test. Analiza datelor eantionului. Se calculeaz eroarea standard (SE), gradele de libertate (DF), i t-score test statistic (t). SE = s / sqrt(n) = 10 / sqrt(20) = 10/4.472 = 2.236 DF = n - 1 = 20 - 1 = 19 t = (x - ) / SE = (108 - 110)/2.236 = -0.894 unde s este deviaia standard a eantionului, x este media eantionului, este media populaiei, i n este mrimea eantionului. Deoarece pentru one-tailed test, P-value este probabilitatea ca t-score avnd 19 grade de libertate s fie mai mic ca -0.894. Utiliznd tabelul se gsete c P(t < -0.894) = 0.19. Apoi P-value is 0.19.

Interpretarea rezultatelor. Deoarece P-value (0.19) este mai mare ca nivelul de semnificaie (0.01), nu se poate rejecta ipoteza nul.

Punctaj = 2 puncte.

Problema 6. Intr-o ar taxele pltite de o firm , T, sunt detrminate conform ecuaiei T = 1.2 + 0.2P 0.1I Unde P este profitul i I este investiia . S reprezint vnzrile. Toate variabilele sunt msurate n milioane $ la o rat anual de schimb. S se calculeze Cov(S, T), Cov(S, P), i Cov(S, I) pentru eantiounul unor patru firme artat mai jos i verificai c: Cov(S, T) = 0.2Cov(S, P) 0.1Cov(S, I). Firm S 1 2 3 10 0 50 80 P 2 0 9 1 2 I 1 0 4 4 T 1. 8 0. 2 0. 8 6

70

1 5

1. 2

Raspuns: Cov(S, T) = Cov(S, [1.2 + 0.2P 0.1I]) = Cov(S, 1.2) + Cov(S, 0.2P) + Cov(S, 0.1I) = 0.2Cov(S, P) 0.1Cov(S, I) Mai nti se utilizeaz regula nr 1 a covarianei pentru a descompune covariana n trei componente . Apoi Cov(S, 1.2) este 0 n virtutea regulei nr 3, 1.2 fiind o constant, i Cov(S, 0.2P) i Cov(S, 0.1I) sunt egale cu 0.2Cov(S, P) i 0.1Cov(S, I),utiliznd regula nr 2. Tabelul ofer rezultatele calculelor. Din tabelul al doilea se poate verifica c: 0.2Cov(S, P) 0.1Cov(S, I) = 13.0 3.5 = 9.5 = Cov(S, T)

Punctaj = 2 puncte

Problema 7.
Utiliznd datele din exerciiul anterior s se calculeze Var(T), Var(P), Var(I) i Cov(P, I), i s se verifice c: Var(T) = 0.04Var(P) + 0.01Var(I) 0.04Cov(P, I), explicnd analitic de ce se ntmpl astfel

Rspuns: Var(T) = Var(1.2 + 0.2P 0.1I) = Var(0.2P 0.1I) = Var(0.2P) + Var( 0.1I) + 2Cov(0.2P, 0.1I) = 0.04Var(P) + 0.01Var( I) 0.04Cov(P, I) n a doua form a relaiei 1.2 a fost eliminat utiliznd regula varianei 4 deoarece ea este o constant aditiv. n cea de a treia form expresia a fost descompus utiliznd regula varianei nr. 1. n cea de a patra form Regula nr 2 a fost utilizat de dou ori i apoi regula covarianei nr.2 o dat. Din tabelul urmtor se poate verifica c 0.04Var(P) + 0.01Var( I) 0.04Cov(P, I) = 0.66 + 0.06 0.38 = 0.34 = Var(T).

Punctaj = 2 puncte

Problema nr. 8
Tabelul de mai jos arat rezultatele unei regresii cu privire la relaia care exist ntre numrul de copii dintr-o familie i numrul de ani de coal ai mamei , utiliznd date dintro anchet realizat de institutul de statistic . Realizai o interpretare a coeficienilor?.

Rspuns: Coeficientul pantei indic faptul c la fiecare an de coal suplimentar al mamei reduce numrul de copii cu 0.23. Coeficientul de intercepie sau constanta arat c o mam fr nici un an de coal ar avea 6.87 copii. Punctaj= 1 punct

Problema 9
O variabil aleatoare X este definit ca fiind numrul cel mai mare obinut din aruncarea a dou zaruri sau numrul numrul obinut cnd acesta este egal pentru cele dou zaruri . Gsii distribuia probabilitii pentru X. Rezolvare n tabelul urmtor se arat toate rezultatele obinute

STATISTICAL TABLES Cumulative normal distribution Critical values of the t distribution Critical values of the F distribution Critical values of the chi-squared distribution

Punctaj = 1 punct 10

Problema 10
Gii valoarea ateptat a lui X din exerciiul anterior. Rezolvare: Valoarea ateptat a unei variabile aleatoare, cunoscut ca media populaiei ei este media ponderat a valorilor ei posibile , ponderile fiind probabilitile associate cu valorile respective. E ( X ) = x1 p1 + ... + x n p n = xi p i
i =1 n

ezult c valoarea ateptat este egal cu 4,47 Punctaj = 1 punct

11

Problema 11
Gsii E(X2) pentru X definit ca in problema 9. Rezolvare

E(X2) = 21.97

E(X) = 4.47

[E(X)]2 = 19.98

Se reine c E(X2) nu este egal cu E(X), la patrat. S-a vzut c E(X) pentru acest exemplu este 4.47. Ptratul lui estes 19.98.

Punctaj = 2 puncte

Problema 12.
O companie primete furnizrile unei componente particulare de la trei vnztori diferii. Tabelul urmtor red numrul bunului i parile cu deficiene pentru fiecare vnztor ca proporie din total pri primite.

12

Component Bun Pari cu deficiene

Vnztor A 0,36 0,04

B 0,38 0,02

C 0,16 0,04

a) Dac o component este selectat aleatoriu din toate cele primite , care este probabilitatea ca acesta s fie una cu deficiene? b) Care este probabilitatea ca o component de la vnztorul A s fie cu deficiene? c) Calitatea componentei este independent de sursa ofertei? d) Care este probabilitatea ca o component selectat aleatoriu s fie de la vnztorul C? Soluie: Se noteaz cu D evenimentul alegerii unei componente cu deficiene. a) P(D) = 0,04+0,02+0,04=0,1 b) P(DA) = P(D,A)/P(A) =0,04/0,4 =0,1 c) Nu, deoarece P(D) P(DC) =0,2 d) P(C) = 0,16 +0,04 = 0,2 Punctaj = 1 punct

Problema 13.
Funcia de distribuie de probabilitate pentru vnzrile lunare ale mainilor de lux (X) de la un vnztor particulare este: x f(x) 0 0,1 1 0.3 2 0,25 3 0,2 4 0,15

a) Care este probabilitatea de vnzare a cel puin 2 maini n luna urmtoare? b) Gsii media vnzrilor lunare c) Gsii variana vnzrilor lunare d) Presupunnd c profitul lunar ( n mii dolari) este dat de : Profit = -5+8x Gsii media i deviaia standard a profitului lunar. Soluie: a) P(X 2) = P(X =2)+P(X=3)+P(X=4) = 0,25+0,2+0,15 =0,6 b) E(X) = x f(x) = 0x0,1+1x0,3+2x0,25+3x0,2+4x0,15 =2 c) Var(X) = E(X2) - [E(X)]2 E(X2) = x2 f(x) = 02x0,1+12x0,3+22x0,25+32-0,2+42x0,15= 5,5 Var (X) = 5,5 -22 = 1,5 d) E(Profit) = -5 +8E(X) = -5+16=11 Var (profit) = 82var(X) =64x1,5 =96 Sd (Profit) = 96 =9,798

13

Punctaj = 2 puncte

Problema 14.
Durata de via a cauciucurilor Drive-Easz are o distribuie normal cu media 40.000 km i deviaia standard 4.000 km. a) Gsii probabilitatea ca durata de via a cauciucului selectat aleatoriu fie: 1) mai mic dect 45.000 km: 2) mai mare dect 46.000 km: 3) ntre 36.000 i 43.000 km. Soluie Se noteaz cu X durata de via a cauciucului selectat aleatoriu n mii de km. Atunci, X ~N(40,42) . a) 1) P(X< 45) = P ( Z< (45-40)/4) = P(Z< 1,25) = 0,894 2) P(X>46) = P(Z > (46-40)/4) = P(Z> 1,5)= 0,0067 3) P(36<X<P (-1<Z<0,75) = 0,7734-0,1587 00,615 Punctaj = 1 punct

Problema 15
Datele privind salariile (Y) i anii de educaie (X) pentru 93 de angajai dintr-o banc sau utilizat pentru a estima relaia liniar dintre salarii i educaie. A fost estimat astfel, modelul de regresie liniar urmtor: Yi= b1+b2Xi +ei n tabelul urmtor vei gsi rezultatele acestei regresii: Variabila dependent :Y Metoda: celor mai mici ptrate Eantion: 1 93 Observaii incluse: 93 Variabil Coeficient Eroare std. t-statistic C 3818,560 377,4377 10,11706 X 128,0852 29,69671 4,313135 2 R 0,169732 Media variabilei R2 ajustat 0,160608 dependente Suma ptratelor 38460756 Devi.Standard a varb.dep rezidualelor Criteriul Sschwarz Log. Probabilitate -733,3248 Darbin Woatson stat. 0,379262 F-statistic Prob(F-statistic)

Prob. 0,0000 0,0000 5420,323 7095872 15,86790 18,60313 0,00041

14

a) Autorul studiului a sugerat c ar trebui s fie o relaie direct ntre numrul de ani de studii i salariu. Semnul coeficientului numrului de ani de educaie este cel ateptat? b) Testai dac coeficientul numrului de ani de educaie este statistic diferit de 0, la 5% nivel de semnificai. c) Ce interpretare se poate da coeficientului de intercepie i coeficientului numrului de ani de educaie ? d) Testai dac coeficientul de intercepie este statistic diferit de 4000 la un nivel de semnificaie de 1% . e) Predicionai salariul de nceput al unui individ cu 13 ani de educaie. f) Calculai intervalul estimat pentru coeficientul anilor de educaie , la un nivel de semnificaie de 10%. g) Dai un sumar scurt al rezultatelor acestui studiu. ( utilizai att interpretarea statistic, ct i cea economic) Soluie a) Semnul ateptat este pozitiv ( relaie direct) i se poate vedea c acesta este adevrat n rezult. b) Pentru acest test se utilizeaz t-statistic i probabilitatea raportat din tabelul anterior i se poate trage concluzia c t-statistic calculat este mai mare dect valoarea critic raportat n tabelul de distribuie t-distribution, de aceea se poate elimina ipoteza nul ( H0 : coeficientul anilor de educaie este egal cu 0) . c) Variabila de intercepie reprezint cel mai mic salariu , i ne arat care ar fi salariul dac X=0 ( zero ani de educaie) . Coeficientul nr anilor de educaie este panta curbei i arat c pentru fiecare an de educaie suplimentar salariul crete cu aproximativ 128 dolari. d) Pentru acest test trebuie calculat testul t-statistic dup cum urmeaz: 3818,56-4000 = -0,4807 377,4377 i se compar cu valoarea critic a lui tc =-2,632 ( care este valoare tabelata pentru alfa este egal cu 0,005 cu 90 grade de libertate ( se poate utiliza media lui tc pentru 100 grade de libertate i 90 grade de libertate, rezultatul nu se schimb). Deoarece t calculat este mai mare dect tc critic , nu se elimin ipoteza nul ( H0 : valoarea de intercepie =4000) e) Pentru a prediciona salariul de nceput se utilizeaz coeficienii estimai pentru X= 13. Predicia pentru salariu = 3818,56+128,0859 (13) = 5,483,6767 f) Mai nti se obine valoarea critic a lui t-statistic la 10% nivel de semnificaie pentru 91 (90) grade de libertate . tc =1.662. Se construiete astfel intervalul de coresponden. 128,0850-1,6662x29,69671 2 128,0859 +1,662x29,69671 g) Aceast ntrebare este deschis pentru interpretare. Fiecare are modul lui propriu de interpretare. Cu alte cuvinte, nu exist un rspuns unic. Vom discuta diferite rspunsuri n clas, dar n general punctele includ: t =

15

Punctaj = 3 puncte

Variabila dependent? Variabila independent? Care sunt coeficienii care spun ceva despre relaia dintre variabile? Sunt aceti coeficieni consisteni cu teoria? Sunt aceti coeficieni statistic semnificativi?

Problema 16
Un economist investigheaza relatia dintre fumatori, educatie si varsta acestora si defineste un fumator ca fiind cineva care fumeaza in fiecare zi un numar de tigari . El defineste o variabila dummy D care va fie gala cu 1 pentru fumatori si 0 pentru nefumatori. (i) [0,5 puncte] Descrieti problemele pe care le poate avea acest cercetator daca va face o regresie a lui D in functie de educatie si varsta , utilizand metoda celor mai mici patrate.

Raspuns Pentru individual i, Di = 1 + 2Ai + 3Si + ui unde A este varsta si S este educatia. Deoarece ui = 1 1 2Ai 3Si daca individual I este fumator , si ui = 0 1 2Ai 3Si daca individual i este nefumator. Acestea sunt singurele doua valori pe care le poate lua termenul de disturbanta pentru individual i. El nu este normal distribuit iar erorile standard si testele sunt invalide. Mai departe, varianta termenului de disturbanta va depinde de valorile lui A si S si astfel termenul de disturbanta este heterosdastic . Modelul de probabilitate liniara (LPM) poate contine predictii fara sens ale probabilitatii evenimentului care pate fi ma mare decat 1 sau mai mic decat zero. (ii) [0,5 puncte ] Explicati cum ar putea fi evitate aceste probleme daca va fi utilizata analiza probit. Raspuns: Modelul probit utilizeaza metoda verosimitatii maxime pentru estimarea parametrilor. 16

Reprezentarea probabilitatii prin distributia normal cumulativa utilizata in analiza probit, care este asimtotic tangentiala la liniile orizontale D = 0 si D = 1, elimina posibilitatea de nonsens a predictiilor . Ea ne permite ca senzitivitatea probabilitatii sa varieze pentru diferite valori ale variabilelor explicative. (iii) [1 punct] Explicati cum se poate estima efectul marginal al schimbarii educatiei si varstei asupra probabilitatii de a fuma. Nota: Functia de densitate a unei distributii standard normale este data de

Raspuns: Se noteaza probabilitatea unui individ i de a fi fumator p = F(Z) unde Z = 1 + 2A + 3S Si F(Z) este o distributie normal cumulativa. Atunci efectele marginale si sunt date prin

unde

. Ele variaza cu valorile lui A si S. O procedura standard este aceea de a evalua Z pentru individul reprezentativ utilizand media valorilor lui A si S in esantion. (iv) [1 punct] Cercetatorul face presupune ca efectele educatiei si varstei nu sunt independente unele fata de altele . El defineste un termen interactiv educatie varsta si include aceasta ca o variabila explicativa intr-o regresie probit. Explicati cum ar afecta aceasta estimarea efectului marginal al educatiei si varstei. Raspuns: Functia este acum: Z = 1 + 2A + 3S + 4AS 17

Astfel ca efectele marginale sunt

Si

Acum ambiifactori depend de valorile lui A si/sau S, dar din nou efectele marginal ear putea fi evaluate pentru un individ reprezentativ utilizand media valorilor lui A si S din esantion. Punctaj : 3 puncte

Problema 17
O variabila aleatoare X poate lua valori pozitive intregi 0, 1, 2, 3, Probabilitatea ei de a fie gala cu o valoare specifica x, p(x), este data prin

Unde este un parametru necunoscut si x! este produsul termenilor x(x1)(x2) (3)(2)(1). Intr-un esantion de trei observatii , valorile variabilei aleatoare sunt 2, 5 si 2. (i) Raspuns : Densitatea de uniune a celor trei observatii este [1 punct] Scrieti functia verosimilitatii pentru .

Reinterpretand acasta functie a lui , avand datele, verosimilitate pentru .

aceasta este functia de

(ii) [ 1 punct] Derivati estimarea verosimilitatii maxime a lui . Raspuns:

18

Log-verosimilitate este:

Conditia de ordinal intai pentru punctul anterior este:

Si astfel = 3 . Acesta este maxima deoarece derivate a doua este negativa 9/2 . Alternativa: Se poate maximize L direct. Conditia de prim ordin este

Implicand apoi = 3. Punctaj: 2 puncte

Problema 18
Un cercetator are date despre numarul de ani de scoala , S, veniturile saptamanale, W, numarul de ore lucrate pe saptaman, H, si veniturile orare, E (calculate ca W/H) pentru un esantion de 1755 barbati din Statele Unite in anul 2000. El calculeaza LW, LE, si LH ca logaritmii naturali ai lui W, E, and H, iar apoi realizeaza urmatoarele regresii, ale caror rezultate sunt redate in tabelul de mai jos (eroarea standard este prezentata intre paranteze; RSS = suma patratelor rezidualelor): Coloana 1: o regresi a lui LE fata de S. Coloana 2: o regresi a lui LW fata de S si LH, si Coloana 3: o regresie a lui LE fata de S si LH. Corelatia dintre S si LH a fost 0.06. (1) (2) (3) (4) (5) Respondentii Toti Toti Toti Toti Toti Variabila dependenta LE LW LE LW LW S 0.099 (0.006 ) 0.098 (0.006 ) 1.190 (0.065 ) 5.403 (0.254 0.098 (0.006 ) 0.190 (0.065 ) 5.403 (0.254 0.101 (0.006 ) 0.980 (0.088 ) 6.177 (0.345 0.030 (0.049 ) 0.885 (0.325 ) 7.002 (1.093 19

LH

constanta

6.111 (0.082

) RSS observatiii 741.5 1755

) 737.9 1755

) 737.9 1755

) 626.1 1669

) 100.1 86

(a) [0,5 puncte] Explicati de ce specificatia (1) este o versiune restrictionata a specificatiei (2), interpretand aceasta restrictie. (b) [0,5 puncte] Presupunand ca restrictia ar fi valida , explicati daca va asteptati ca coeficientul lui S si eroarea lui standard sa difere sau sa fie similare in specificatiile (1) si (2). (c) [0,5 puncte] Presupunand ca restrictia ar fi invalida, cum va asteptati sa fie coeficientii lui S si eroarile lui standard in specificatiile (1) si (2): sa fie similare sau sa difere? (d) [0,5 puncte ] Efectuati un test F al restrictiei. (e) [0,5 puncte] Efectuati un test t al restrictiei. (f) [0,5 puncte] Explicati daca testul F si testul t ar putea conduce la concluzii diferite. Raspuns (a) Se scrie specificatia (2) ca LW = 1 + 2S + 3LH + u Daca se impune restrictia 3 = 1, modelul devine specificatia (1): LW LH = 1 + 2S + u Restrictia implica ca veniturile saptamanale sunt proportionale cu orele lucrate. (b) daca restrictia este valida coeficientii ar trebui sa fie similari . Ambii vor fi nedeplasati , dar in (2) vor fi mai eficienti . Castigul in eficienta in (2) ar fi reflectat intr-o eroare standard mai mica . Totusi, castigul va fi mic, avand o corelatie mica. (c) Daca estimarea coeficientului lui S ar fi deplasata. Eroarea standard in (1) ar fi invalida si astfel, o comparatie cu eroarea standard din (2) ar fi ilegitima. Ipotezele nula si alternative sunt H0: 3 = 1 si H0: 3 1

(d)

Valoarea critica a lui F(1,1000) la nivel de 1% este 6.66. Valoarea critica a lui F(1,1752) ar trebui sa fie mai mica. Se respinge restrictia la nivel de 1% . (Valoarea critica la nivel de 0.1% este aproximativ 10.8.)

20

(e)

Restrictia Restrictia este asa de simpla incat ea poate fi testate fara nici o respecificare: un test simplu t asupra coeficientului lui LH in coloana (2), H0: 3 = 1. Testul trebuie sa conduca la aceiasi concluzie deoarece e F statistic este patratul lui t statistic si valoarea critica a lui F este patratul valorii critice a lui t.

(f)

21