BACHILLERATO EN CONTADURIA PBLICA ESTADISTICA II Tema: REGRESION Y CORRELACION LINEAL SIMPLE. Estudiantes: Ma!e"a P#as $uesada Manue" C##nad# Henande% Ne"s#n E. Pee% A&uie 'i"(et) Mui""# Lei*a P#+es#: He!t# O"meda Guea Pati,# -e!)a: A&#st#. /010. INTRODUCCIN El anlisis de regresin lo que se pretende es predecir o estimar el valor promedio de la variable explicada en base a unos valores fijos de las variables explicativas. En el anlisis de regresin, las variables explicativas son fijas y la variable explicada es estadstica. Si sabemos que existe una relacin entre una variable denominada dependiente y otras denominadas independientes (como por ejemplo las existentes entre la experiencia profesional de los trabajadores y sus respectivos sueldos, las estaturas y pesos de personas, la produccin agraria y la cantidad de fertili!antes utili!ados, etc.", puede darse el problema de que la dependiente asuma m#ltiples valores para una combinacin de valores de las independientes. $a dependencia a la que %acemos referencia es relacional matemtica y no necesariamente de causalidad. &s, para un mismo n#mero de unidades producidas, pueden existir niveles de costo, que varan empresa a empresa. Si se da ese tipo de relaciones, se suele recurrir a los estudios de regresin en los cuales se obtiene una nueva relacin pero de un tipo especial denominado funcin, en la cual la variable independiente se asocia con un indicador de tendencia central de la variable dependiente. 'abe recordar que en t(rminos generales, una funcin es un tipo de relacin en la cual para cada valor de la variable independiente le corresponde uno y slo un valor de la variable dependiente. $a regresin lineal simple, es una %erramienta muy importante para la Econometra, que estudia la dependencia existente entre una variable dependiente y una o ms variables explicativas. El t(rmino regresin fue introducido por )rancis *alton en su libro +atural in%eritance (,--." y fue confirmada por su amigo /arl 0earson. Su trabajo se centr en la descripcin de los rasgos fsicos de los descendientes (variable &" a partir de los de sus padres (variable 1". Estudiando la altura de padres e %ijos a partir de ms de mil registros de grupos familiares, se lleg a la conclusin de que los padres muy altos tenan una tendencia a tener %ijos que %eredaban parte de esta altura, pero que revelaban tambi(n una tendencia a regresar a la media. *alton generali! esta tendencia bajo la 2ley de la regresin universal2 3'ada peculiaridad en un %ombre es compartida por sus descendientes, pero en media, en un grado menor.4 El modelo de regresin lineal simple, busca encontrar la recta de regresin que relacione dos variables (5 e 6" 7n ejemplo de dic%a regresin lineal, es la renta, ya que no podemos saber el nivel de renta en un futuro, pero si podemos saber si el promedio de la renta aumentar o disminuye determinando con cierta exactitud la cantidad. 1. ASPECTOS TERICOS REGRESIN SIMPLE Y CORRELACIN $a regresin como una t(cnica estadstica, una de ellas la regresin lineal simple y la regresin multifactorial, anali!a la relacin de dos o mas variables continuas, cuando anali!a las dos variables a esta se el conoce como variable bivariantes que pueden corresponder a variables cualitativas, la regresin nos permite el cambio en una de las variables llamadas respuesta y que corresponde a otra conocida como variable explicativa, la regresin es una t(cnica utili!ada para inferir datos a partir de otros y %allar una respuesta de lo que puede suceder. Siendo as la regresin una t(cnica estadstica, por lo tanto para interpretar situaciones reales, pero a veces se manipula de mala manera por lo que es necesario reali!ar una seleccin adecuada de las variables que van a construir las formulas matemtica, que representen a la regresin, por eso %ay que tomar en cuenta variables que tiene relacin, de lo contraria se estara matemati!ando un galimatas. Se pueden encontrar varios tipos de regresin, por ejemplo 8egresin lineal simple 8egresin m#ltiple ( varias variables" Simple b" 9#ltiple, etc. 8egresin logstica $a regresin lineal t(cnica que usa variables aleatorias, continuas se diferencia del otro m(todo analtica que es la correlacin, por que esta #ltima no distingue entre las variables respuesta y la variable explicativa por que las trata en forma sim(trica. $a matemati!acin nos da ecuaciones para manipular los datos, como por ejemplo medir la circunferencia de los ni:os y ni:as y que parece incrementarse entre las edades de ; meses y ,- a:os, aqu podemos inferir o predecir que las circunferencias del crneo cambiara con la edad, en este ejercicio la circunferencia de la cabe!a es la respuesta y la edad la variable explicativa. En la regresin tenemos ecuaciones que nos representan las diferentes clases de regresin 8egresin $ineal y < & = 1x 8egresi>n $ogar?mica y < & = 1$n(x" 8egresin Exponencial y < &c(bx" 0ara obtener un modelo de regresin es suficiente establecer la regresin para eso se %ace uso del coeficiente de correlacin 8. 8 < 'oeficiente de correlacin, este m(todo mide el grado de relacin existente entre dos variables, el valor de 8 vara de @, a ,, pero en la prctica se traba con un valor absoluto de 8. El valor del coeficiente de relacin se interpreta de modo que a media que 8 se aproxima a ,, es ms grande la relacin entre los datos, por lo tanto 8 (coeficiente de correlacin" mide la aproximacin entre las variables. El coeficiente de correlacin se puede clasificar de la siguiente manera 'A88E$&'BC+ D&$A8 A 8&+*A ," 0erfecta ," 8 < , ;" Excelente ;" 8 < E.. F < 8 F , G" 1uena G" 8 < E.- F < 8 F E.. H" 8egular H" 8 < E.I F < 8 F E.- I" 9ala I" 8 F E.I JBSK8B17'BC+ JBD&8B&+KE JE)B+B'BC+ $a distribucin divriate es cuando se estudia en una poblacin dos variables, que forman pares correspondientes a cada individuo, como por Ejm $as notas de ,E alumnos en biologa y lenguaje 1BA$A*B& ; H I I L L M M - . $E+*7&NE ; ; I I I M I - M ,E $os pares de valores son ( ;, ;" (H,;" (I,I"OO.(-,M" (.,,E" forman una distribucin divriate. $a correlacin, m(todo por el cual se relacionan dos variables se pude graficar con un diagrama de dispersin de puntos, a la cual muc%os autores le llaman nubes de puntos, encuadrado dentro de un grfico de coordenadas 5 6 en la cual se pude tra!ar una recta y cuyos puntos mas cercanos de una recta %ablaran de una correlacin mas fuerte, %a esta recta se le denomina recta de regresin, que puede ser positiva o negativa, la primera contundencia a aumentar y la segunda en descenso o decreciente. Kambi(n se puede describir un diagrama de dispersin en coordenadas cartesianas valores como en la distribucin divriate, en donde la nube de puntos representa los pares de valores. *8&)B'AS JE 8E'K& JE 8E*8ESBC+ 0or #ltimo se pueden graficar las lneas de tendencia, %erramienta 8egresin 'uadrtica y < & = 1x ='x; $a 8egresin y la correlacin son dos t(cnicas estadsticas que se pueden utili!ar para solucionar problemas comunes en los negocios. 9uc%os estudios se basan en la creencia de que es posible identificar y cuantificar alguna 8elacin )uncional entre dos o ms variables, donde una variable depende de la otra variable. Se puede decir que 6 depende de 5, en donde 6 y 5 son dos variables cualquiera en un modelo de 8egresin Simple. "Y es una funcin de " Y ! f"# 'omo 6 depende de 5, 6 es la variable dependiente, y 5 es la variable independiente. En el 9odelo de 8egresin es muy importante identificar cul es la variable dependiente y cul es la variable independiente. En el 9odelo de 8egresin Simple se establece que 6 es una funcin de slo una variable independiente, ra!n por la cual se le denomina tambi(n 8egresin Jivariada porque slo %ay dos variables, una dependiente y otra independiente y se representa as Y ! f "# "Y es$% &e'&esand( )(& " $a variable dependiente es la variable que se desea explicar, predecir. Kambi(n se le llama 8E*8ES&+JA D&8B&1$E JE 8ES07ESK&. $a variable Bndependiente 5 se le denomina D&8B&1$E E50$B'&KBD& 8E*8ESA8 y se le utili!a para E50$B'&8 6. AN*LISIS ESTAD+STICO, REGRESIN LINEAL SIMPLE En el estudio de la relacin funcional entre dos variables poblacionales, una variable 5, llamada independiente, explicativa o de prediccin y una variable 6, llamada dependiente o variable respuesta, presenta la siguiente notacin 6 < a = b 5 = e Jonde (a" es el valor de la ordenada donde la lnea de regresin se intercepta con el eje 6. (b" es el coeficiente de regresin poblacional (pendiente de la lnea recta" (e" es el error SUPOSICIONES DE LA REGRESIN LINEAL ,. $os valores de la variable independiente 5 son fijos, medidos sin error. ;. $a variable 6 es aleatoria G. 0ara cada valor de 5, existe una distribucin normal de valores de 6 (subpoblaciones 6" H. $as variancias de las subpoblaciones 6 son todas iguales. I. Kodas las medias de las subpoblaciones de 6 estn sobre la recta. L. $os valores de 6 estn normalmente distribuidos y son estadsticamente independientes. ESTIMACIN DE LA ECUACIN DE REGRESIN MUESTRAL 'onsiste en determinar los valores de 2a2 y 2b 2 a partir de la muestra, es decir, encontrar los valores de a y b con los datos observados de la muestra. El m(todo de estimacin es el de M-ni.(s Cuad&ad(s, mediante el cual se obtiene $uego, la ecuacin de regresin muestral estimada es que se interpreta como $uego, la ecuacin de regresin muestral estimada es Pue se interpreta como (a" es el estimador de a Es el valor estimado de la variable 6 cuando la variable 5 < E (b" es el estimador de b, es el coeficiente de regresin Est expresado en las mismas unidades de 6 por cada unidad de 5. Bndica el n#mero de unidades en que vara 6 cuando se produce un cambio, en una unidad, en 5 (pendiente de la recta de regresin". 7n valor negativo de b sera interpretado como la magnitud del decremento en 6 por cada unidad de aumento en 5. /. ANTECEDENTES DEL PRO0LEMA $os datos de la siguiente tabla representan las estaturas (5, cm" y los pesos (6, Qg" de una muestra de ,; %ombres adultos. 0ara cada estatura fijada previamente se observ el peso de una persona seleccionada de entre el grupo con dic%a estatura, resultando ,I; ,II ,I; ,II ,IM ,I; ,IM ,LI ,L; ,M- ,-G ,M- Y IE L,.I IH.I IM.I LG.I I. L, M; LL M; -H -; 'on estos datos vamos a plantear una ecuacin de regresin simple que nos permita pronosticar los pesos conociendo las tallas. 7tili!aremos a < E.EI, y contrastaremos nuestra %iptesis con la prueba ). 1. DESARROLLO 8epresentacin matemtica y grficas de los datos 8epresentacin 9atemtica estatura pesos 8egresin $ineal B.'. para la media B. '. individual datos x y x R; y R; xy y est. 8esidual $. B. $. S. $. B. $. S. , ,I; IE ;G,EH ;IEE MLEE IL.HG @L.HG IG.EM I..M. HM.GE LI.IL ; ,II L,.I ;HE;I GM-;.G .IG;.I I..EG ;.HM IL.E. L,..M IE.EI L-.E; G ,I; IH.I ;G,EH ;.ME.G -;-H IL.HG @,..G IG.EM I..M. HM.GE LI.IL H ,II IM.I ;HE;I GGEL.G -.,;.I I..EG @,.IG IL.E. L,..M IE.EI L-.E; I ,IM LG.I ;HLH. HEG;.G ..L..I LE.MM ;.MG I-.EI LG.H- I,.-I L..L- L ,I; I. ;G,EH GH-, -.L- IL.HG ;.IM IG.EM I..M. HM.GE LI.IL M ,IM L, ;HLH. GM;, .IMM LE.MM E.;G I-.EI LG.H- I,.-I L..L- - ,LI M; ;M;;I I,-H ,,--E LM.M, H.;. LI.,M ME.;H I-.-I ML.IM . ,L; LL ;L;HH HGIL ,EL.; LI.,, E.-. L;.LI LM.IL IL.;M MG..H ,E ,M- M; G,L-H I,-H ,;-,L M-... @L... MH.LI -G.GG L..HI --.I; ,, ,-G -H GGH-. MEIL ,IGM; -G.G; E.L- M-.E, --.LH MG.G, .G.GH ,; ,M- -; G,L-H LM;H ,HI.L M-... G.E, MH.LI -G.GG L..HI --.I; 8epresentacin *rfica 2. 3IPTESIS SA +o %ay relacin entre la variable peso y la variable estatura. S& Say relacin entre la variable peso y la variable estatura. Kabla de anlisis de varian!a )uente de *rados de Suma de 'uadrados Dariacin libertad cuadrados medios estadstico ) Jebido a la regresin , ,EL,., ,EL,., MG.E- error ,E ,HI.; ,H.I total ,, ,;EL.G Se obtiene un valor ) < MG.E- T H..L, con lo cual se rec%a!a la %iptesis nula y aceptamos que la variable estatura est relacionada con la variable peso con un .IU de confian!a. Je acuerdo al desarrollo matemtico %emos obtenido los siguientes clculos $o que nos permite obtener los coeficientes a y b. $uego, b < ,;;G V ,HE..LLM < E.-LML a < LI.;I W (E.-LML" (,L;.,LM" < @MI.HHL 4. INTERPRETACIN $a ecuacin de regresin estimada es 'oeficiente de correlacin 8< E..GM. 'oeficiente de determinacin 8X<E.-M.L El valor de b < E.-LML indica el incremento del peso en Qilogramos, en promedio, por cada centmetro de aumento en la estatura de los %ombres adultos. El valor de a, no tiene interpretacin prctica en el ejemplo, se interpretara como el valor obtenido, en promedio, para el peso 6, cuando la estatura es E. 7tili!ando la ecuacin de regresin para estimar o predecir valores de la variable 6 0ara una talla de ,-E se obtiene un peso de -E.M Qg. 5. CONCLUSIN $a ecuacin de 8egresin $ineal estimada para las variables estatura y peso muestran, de acuerdo a la prueba ), relacin. Esta relacin se %a estimado en un 8 < .G.M, que indica una fuerte relacin positiva. &dems si consideramos el coeficiente de determinacin 8X < -M.. podemos indicar que el -M..U de las variaciones que ocurren en el peso se explicaran por las variaciones en la variable estatura. 0I0LIOGRA6IA DE REGRESION Y CORRELACION ,. Dommi 9N YPu( es un monografaZ [citada ,G E- ;EEI\ direccin %ttpVV]]].mografias.comVtrabajosMVberenVberen.s%tml" ;. Korino S . 8esumen del libro de Estadsticas de 1erenson y $evine [citada ,I E- ;EEI\ direccin %ttpVV %ttpVV]]].mografias.comVtrabajos,GU;EVberenVberen.s%tml" G. El 8incn del Dago, S$ ' Koro ML,;^ Salamanca (Espa:a" [,- E- ;EEI\ direccin %ttpVV %tlm.rincondelvago.comVestadisticaV%tml" H. El 8incn Jel Dago, S$ ' Koro ML,;^ Salamanca (Espa:a" [,L E- ;EEI\ direccin %ttpVV%tlm.rincondelvago.comVestadisticaV%tml" I. Artega 'alvom, 'ayuela Jomngue! &, 8egresin $ogstica +o condicionada y tama:o de muestra una revisin bibliogrfica. 8evista Espa:ola de salud 0ublica [serie en Bnternet\ ;EE; 9ar!o [citada ,L E- EI\ Dol ME+^; [,; paginas\ direccin %ttpVV]]].scielospp%pVZpiol<s,,GI@ IM;M;EE;EEE;EEEE_scrip[<sciVarte L. *aldos 'lculo y Estadstica BBB Edicin 7nica. *rupo $a 8epublica. $ima 0er#`;EEI. M. 'annavos *. 0robabilidad y Estadstica &plicacin y m(todos. Ed. en espa:ol 9c *8&a@ SB$$VB+KE8&9E8B'&+& JE 9E5B'A.,..I.
Resumen de Diseño Estadístico Para Investigadores en Ciencias Sociales y del Comportamiento. Capítulo 2: Variables Estadísticas: RESÚMENES UNIVERSITARIOS