Sunteți pe pagina 1din 8

Momentele distributiei trunchiate t si F

Distribuiile trunchiate Abstracte de obicei apar n economie i in servicii conexe, a se vedea, de exemplu, Lee (ECON Lett 3:165-169, 1979), Lien (ECON Lett 19:243-247, 1985; Econ Lett 20:45-47, 1986), Burdett (ECON Lett 52:263-267, 1996), Sercu (Asigurrilor: matematica i Econ 20:79-95, 1997), Abadir i Magdalinos (Econom Teoria 18:1276-1287, 2002), i Horrace (J Econom 126:335-354, 2005). n aceast not, considerm c cel mai frecvent ntlnite distribuii trunchiate cu coada grea: distribuia trunchiata t i distribuia trunchiata F . Pentru fiecare dintre aceste distributii, obinem expresii derivate pentrumomentele i procedurile de estimare prin metoda momentelor i metoda de risc maxim. O aplicatie este ilustrata ntr-un set de date populare stabilite n literatura de specialitate econometrica. Cuvinte cheie Momente - distribuia trunchiata F Regresie trunchiata - distribuia trunchiata t Clasificare JEL C1 1 Introducere Distribuii trunchiate cu cozi grele sunt frecvent ntlnite n economie i domenii conexe, a se vedea, de exemplu, Lee (1979); Lien (1985, 1986); Burdett (1996); Sercu (1997); Abadir i Magdalinos (2002) i Horrace (2005) i referintele de acolo. Cele mai cunoscute sunt versiunile trunchiate ale: 1.Student de distributie a t dat de functia de densitate de probabilitate (pdf): (1)

pentru - <x < i 1, n cazul n care B (, ) denot funcia Beta definita de

Funcia corespunztoare de distribuie cumulativ (CDF) este: (2)

unde 2F1 () este funcia lui Gauss hipergeometric definite de

pentru | x | <1, unde (z) k = z (z + 1) (z + k - 1) denot factorial cresctoare , a se vedea Prudnikov et al. (1986); Abadir (1999) i Gradshteyn iRyzhik (2000) pentru proprietile detaliate. 2.Distribuia F data de pdf: g(x) = (3)

pentru x> 0, 1> 0 i 2> 0. CDF corespunztor este: g(x) = (4)

Dac A i B sunt punctele de trunchiere cu - B <x <A , atunci pdf i CDF ale distribuiei trunchiate poate fi scrise ca f (x)=g(x)/D si f(x)=.. (6) (5)

respectiv, pentru - B <x <A , unde D = G (A) - G (B). Momentul asociat nth poate fi exprimat ca: E Xn = (7)

Scopul acestei note este de a studia versiunile trunchiate date de ec. 1 i 2 ec. 3 i 4. n seciunile 2 i 3, am derivat expresii pentru ecuaia 7 i constanta normalizatoare D. Procedurile de estimare prin metodele momentului maxim probabil sunt discutate n seciunea 4. n cele din urm, seciunea 5 descrie o aplicatie ntr-un set de date populare stabilite n literatura de specialitate econometrica. 2 Distribuitia trunchiata t Folosind ec. 1 si 5 , putem scrie distributia trunchiata a studentului asa cum este data de pdf: f (x) = (8)

pentru B < x < A, unde D = G(A) G(B). Cand = 1, ec. 8 se reduce la distributia trunchiata Cauchy (vezi Dahiya 2001). Folosind ec 2 putem exprima diferenta D = G(A) G(B) ca D =. In cazul simetric B = -A, ec 9 se reduce la D =. (10) (9)

Teorema 1 de mai jos ne ofera expresia explicita pentru E(Xn) d.p.d.v al unei functii Gauss hipergeometrica Teorema 1 Daca X are pdf ec. 8 atunci devine E (Xn) = (11)

Demonstratie : Folosind ec. 1 si 7 , putem scrie: E (Xn) = unde In(c) = . Din ecuaia. 3.194.1 Gradshteyn i Ryzhik (2000), se poate calcula In(c) ca In(c) = . (13) (12)

Rezultatul ec 11 se obtine combinand ec 12 si 13. Corolarii 1 i 2 prevd expresii simple pentru momente: corolarul 1 consider cazul simetric pentru B = - A , in timp ce corolarul 2 consider cazul pentru = 1 (Cauchy). Corolar 1 Dac X are pdf ecuaia. 8 cu B = - A atunci E (Xn) = (14)

Corolar 2 Dac X are pdf ecuaia. 8 cu v=1 atunci primele 4 momente sunt E (X) = E (X2) = E (X3) = E (X4) =

3 Distributia trunchiata F Folosind ec. 3 si 5 , putem scrie distributia trunchiata F asa cum este data de pdf: f (x) = (15)

pentru 0 B < x < A, unde D(A, B, 1, 2) = G(A) G(B). Folosind ec 4 putem exprima diferenta D(A, B, 1, 2) = G(A) G(B) ca D(A, B, 1, 2)= (16)

Teorema 2 de mai jos ne ofera expresia explicita pentru E(Xn) d.p.d.v al unei functii Gauss hipergeometrica Teorema 2 Daca X are pdf ec. 15 atunci devine E (Xn) = pentru n 1. Demonstratie : Folosind ec. 3 si 7 , putem scrie: E (Xn) = (18) (17)

unde Bx(, ) este functia incomplete beta definite de


Bx(a, b) =

Rezultatul teoremei rezulta din ec. 18 si folosind faptul ca


Bx(a, b) =

pentru |x| < 1, vezi Gradshteyn si Ryzhik (2000). 4 Estimarea Aici, am considerat estimarea distribuiei trunchiate din Seciunile 2i 3 prin metoda momentelor, precum i metoda probabilitatii maxime. 68 S. Nadarajah, S. Kotzen Dac X1, X2,. . . , Xn este un eantion aleatoriu din ecuaia. 8 atunci metoda estimarilor momentelor A, B i este solutia simultan a ecuaiilor. 1/ 2B(/2, 1/2) D. 1/ 3B(/2, 1/2) D.

1/ 4B(/2, 1/2) D. unde D este dat de ec. 9 si (x) = d log (x)/dx este diagrama functiei. Derivatele partiale ale lui D pot fi calculate folosind faptul ca / x 2F1 (a, b; c; (19) pentru |x| < 1, vezi Abadir (1999) si Gradshteyn si Ryzhik (2000). Dac X1, X2,. . . , Xn este un eantion aleatoriu din ecuaia. 15 atunci metoda estimarilor momentelor A, B i 1 si 2 este solutia simultan a ecuaiilor. 22/ 1 (2 + 1) DB(1/2, 2/2) x 222/ 1 (2 + 1) DB(1/2, 2/2) x 223/ 1 (2 + 1) DB(1/2, 2/2) x si 224/ 1 (2 + 1) DB(1/2, 2/2) x unde D este dat de ec. 16. Estimatorul maxim probabil pentru A, B, 1 si 2 este solutia simultan a ecuaiilor log X .. log X .. nD / D 1 = 0 si nD / D 2 = 0 unde D este dat de ec 16 . Derivatele partiale ale lui D pot fi calculate folosind ec. 19 si / a F1 () = xb/c.. si / c F1 () = xb/c.. vezi http://functions.wolfram.com/07.23.20.0002.01, care ofera de asemena definitia F212201 ( ).

5 Aplicatie n aceast seciune, vom utiliza un set de date populare multunita lui Fair (1978) pentru a ilustra utilizarea distribuiei trunchiata t. Setul de date a fost extras dintr-un sondaj de opinie cu 101 de intrebari privind sex-ul publicat n revista Psihologia Azi, n 1969 i 1970th. Din rezultatele sondajului, Fair (1978) a extras un eantion de 601 observaii cu privire la brbai i femei cstoriti pentru prima dat i a analizat rspunsurile la o ntrebare despre relatiile extraconjugale. Cele 601 observatii sunt incadrate in urmatoarele variabile: y = numarul de relatii din ultimul an: 0, 1, 2, 3, 410 codat in 7 si lunar, saptamanal sau zilnic codat in 12; z1 = sex: 0 pentru femei si 1 pentru barbati; z2 = varsta; z3 = numar de ani de casnicie; z4 = copii: 0 = nu si 1 = da; z5 = religios: 1 = anti, . . ., 5 = forte; z6 = educatie: 9 = generala, 12 = liceu, . . ., 20 = facultate si altele; z7 = ocupatia conform Scarii Hollingshead; z8 = autoevaluare a casniciei: 1 = foarte nefericita, . . ., 5 = foarte fericita. Acest set de date a fost subiectul a numeroase lucrri de economie, a se vedea cartea lui Greene (2003) ca referinta. Unele dintre modelele echipate cu aceaste date includ tobit, regresie trunchiat normal, probit i modele Poisson . Scopul nostru n aceast seciune este de a arata cum un model bazat pe distribuie trunchiata t ar putea fi mai buna dect celelalte modelule. Nu vom include variabilele z1 , z4 z6 n analiza noastr deoarece s-au gsit a fi nesemnificative statistic, a se vedea seciunea 22.3.6 din Greene (2003). Trebuie s subliniem ca modelele prevazute sunt doar cu scop ilustrativ fapt pentru care nu sunt realiste in nici un fel. Modelul care il propunem in continuare: y = a + b z2/100 + c z3/10 + d z5/10 + e z7 + f z8/10 + , unde se presupune ca are distributia trunchiata t data de ec. 8 cu A=, B = 0 si gradul de libertate al parametrului . A se lua in vedere ca acest fapt intarzie modelul regresiei trunchiate t cu observatia ca y=0 este exclus. Performana modelului de regresie trunchiate t este comparat cu modelul de regresie trunchiat normal: y = a + b z2/100 + c z3/10 +d z5/10 + e z7 + f z8/10 + , unde se presupune ca are distributie standard normala cu medie zero i unitatea de deviaie standard. Ambele modele au fost montate la date cu metoda de probabilitatea maxim. Procedura descrisa n seciunea 4 a fost folosita pentru a potrivi modelul de regresie trunchiata t. Urmatoarele estimri au fost obinute de la modelul de regresie trunchiata t:

Fig. 1 Rezultate reziduale pentru modelul de regresie trunchiat t

Fig. 2 Rezultate reziduale pentru modelul de regresie normala

a = 3.727(1.363), b = 4.596(3.144), c = 1.418(0.564), d = 2.392(1.678), e = 0.021(0.107), f = 2.905(1.351), = 0.494(0.059) cu NLLH (Negative Log Likelihood) = 463.4. Urmatoarele stimrile au fost obinute de la modelul de regresie trunchiata normal: a = 8.581(0.497), b = 3.788(1.502),c = 2.646(0.256),d = 7.116(0.728)e = 0.073(0.047),f 6.642(0.695) cu NLLH (Negative Log Likelihood) = 1288.4. Numere din paranteze sunt erori standard calculate prin inversarea matricei de informaii observate. Diferenta intre numarul de parametrii este 1 si X21.095=3.841. Astfel, este foarte clar de la valorile NLLH c modelul regresiei trunchiate t l este un model mult mai bun. Acest lucru este sprijinit de : (y a b z2/100 c z3/10 d z5/10 e z7 f z8/10 si y a b z2/100 c z3/10 d z5/10 e z7 f z8/10) in Fig.1 si Fig.2

Bibliografie Abadir KM (1999) An introduction to hypergeometric functions for economists. Econom Rev18:287330 Abadir KM, Magdalinos T (2002) The characteristic function from a family of truncated normal distributions. Econom Theory 18:12761287 Burdett K (1996) Truncated means and variances. Econ Lett 52: 263267 Dahiya RC, Staneski PG, Chaganty NR (2001) Maximum likelihood estimation of parameters of the truncated Cauchy distribution. Commun Stat Theory Methods 30:17351750 Fair RC (1978) Theory of extra-marital affairs. J Polit Econ 86:4561 Gradshteyn IS, Ryzhik IM (2000) Table of integrals, series, and products, 6th edn. Academic, San Diego, CA Greene WH (2003) Econometric analysis, 5th edn. Prentice Hall, New Jersey Horrace WC (2005) On ranking and selection from independent truncated normal distributions. J Econom 126:335354 Lee LF (1979) On the first and second moments of the truncated multinormal distribution and a simple estimator. Econ Lett 3:165169 Lien DD (1985) Moments of truncated bivariate lognormal distributions. Econ Lett 19:243247 Lien DD (1986) Moments of ordered truncated bivariate lognormal distributions. Econ Lett 20:4547 Prudnikov AP, Brychkov YA, Marichev OI (1986) Integrals and series (vols 1, 2 and 3). Gordon and Breach Science Publishers, Amsterdam Sercu P (1997) The variance of a truncated random variable and the riskiness of the underlying variables. Insur: Math and Econ 20:7995

S-ar putea să vă placă și