Sunteți pe pagina 1din 17

UNIVERSIDAD DON BOSCO FACULTAD DE ESTUDIOS TECNOLGICOS

CICLO: 02/ 2012

Actividad Evaluativa Regresin y Correlacin


Materia: Estadstica I Integrantes: Kevin Ren Molina Arteaga Vctor Alfonso Sanabria Snchez Ernesto Antonio Crcamo Aguilar Rodrigo Jos Rodrguez Perez Cesar Ernesto Iglesias Cuellar

Docente: Lic. Mauricio Cordova

San Salvador, 19 de septiembre de 2012

ndice

Introduccin. i 1. Definicin de los Conceptos...1 2. Lnea de Regresin o Recta de Mnimos Cuadrados1 2.1 Ejemplos de Aplicacin..3 3. Tipos de Curvas Reducibles a la Forma Lineal 3.1 Curva Exponencial ....5 3.2 Curva Potencial..6 3.3 Curva o Modelo Reciproco...6 4. Aplicacin de Parbola de Mnimos Cuadrados....8 5. Definicin de Conceptos. 5.1Variacion Total.11 5.2Variacion Explicada...11 5.3Variacion No Explicada...11 5.4Coeficiente de Determinacin 11 5.5Coeficiente de Correlacin.. 12 6. Conclusiones.. 13 7. Bibliografa.14

Introduccin
En la aplicacin de los mtodos estadsticos estudiados anteriormente, se ha tratado con una nica variable de inters. A estas variables se le examinaron varias medidas que describen su comportamiento y se aplicaron diversas tcnicas de inferencia estadstica, como intervalos de confianza y pruebas de hiptesis, para hacer estimaciones y sacar conclusiones acerca de ellas. En este trabajo se tratara con problemas que abarcan dos variables cuantitativas (Valores continuos y Discretos) para establecer y medir las relaciones existentes entre ellas.

1. Definicin de los conceptos de Regresin y Correlacin.


Regresin: La regresin es una tcnica estadstica utilizada para simular la relacin existente entre dos o ms variables. Por lo tanto la regresin se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada.

En otra palabras se le llama regresin a la estimacin de una variable (variable dependiente) por medio de una o mas variables relacionadas (variables independientes). Correlacin: La correlacin se dirige sobre todo a medir la intensidad o fuerza con que estn relacionadas linealmente las variables.

2. Lnea de regresin o recta de mnimos cuadrados.


Existen varios mtodos para calcular la ecuacin de regresin uno de ellos es el Mtodo de Mnimos cuadrados, matemticamente es el mas exacto o de mejor ajuste. Para ello supongamos ecuacin de una lnea recta o lnea de regresin: Y= ax + b; Donde Y representa el valor estimado de Y, que corresponde a un valor particular de X. El criterio de los mnimos cuadrados requiere que encontremos la pendiente a y el intercepto b o coeficiente de regresin tales que:
n n

1)

Yi = a
i=1 n

Xi + nb
i=1 n

Y= a X + nb

2)

Xi Yi = a

Xi2 +

b Xi
i=1

X Y = a X2 + b X

i=1

i=1

Ecuaciones normales.

Deduccin de formulas: S= (aX1 + b Y1)2 + (aX2 + b + Y2)2 ++ (aXn + b - Yn)2 S= (aXi + b - Yi)2
i=1
n

S es mnimo si:

ds da

=0

ds db

=0

Derivando con respecto a la constante b: ds = 2 (aXi + b - Yi)(1) = 0 db i=1 = (aXi + b - Yi) = 0 =a Xi + b - Yi = 0 = Yi = a Xi + nb


i=1 i=1 i=1 n i=1 i=1 n i=1 n n n n n

l.q.q.d

Derivando con respecto a la constantes a:


n

ds da

= 2(aXi + b - Yi)(Xi) = 0
i=1

= (aXi2 + bXi - YiXi) = 0


i=1

= a Xi2 + b Xi - Yi Xi = 0
i=1 i=1 i=1

i=1

Xi Yi = a Xi2 + b Xi = 0
i=1 i=1

l.q.q.d

X Y 1 1 3 2

Ejemplos de Aplicacin 4 4 6 4 8 5 9 7 11 8 14 9

1. Dada la siguiente tabla:

a) Hacer diagrama de dispersin b) Trace la recta de aproximacin c) Encontrar la recta de regresin Solucin:

10 9 8 7 6 5 4 3 2 1 0 0 2 4 6 8 10 12 14 16

Diagrama de dispersin Recta de aprox.

n= 8

c)

Y= a X + nb X Y = a X2 + b X a= 84/132

40= 56a + 8b (-7) 364= 524a + 56b 84 = 132 a + 0b

a= 0.6363

Sustituyendo a: 40= 56a+8b b= 40-56(0.6363) / 8 b= 0.5459 Y= ax + b d) Y = 0.6363 x + 0.5459

Estimar Y para x= 7 Y= 0.6363 (7) + 0.5459 Y= 4.9995 3

2. Se toma una muestra aleatoria de 8 ciudades de una regin geogrfica de 13 departamentos y se determina por los datos del censo el porcentaje de graduados en educacin superior y la mediana del ingreso de cada ciudad, los resultados son los siguientes: Ciudad % de (x) Graduados Ingreso (y) Mediana 1 7.2 4.2 2 6.7 4.9 3 17 7 4 12.5 6.2 5 6.3 3.8 6 23.9 7.6 7 6 4.4 8 10.2 5.4

De las ecuaciones normales: Y

Se debe encontrar los trminos de las ecuaciones N 1 2 3 4 5 6 7 8 Por tanto se procede de la siguiente forma: y 4.2 4.9 7.0 6.2 3.8 7.6 4.4 5.4 43.5 x 7.2 6.7 17.0 12.5 6.3 23.9 6.0 10.2 89.8 xy 30.24 32.83 119.00 77.50 23.94 181.64 26.40 55.08 546.63 51.84 44.89 289.00 156.25 39.69 571.21 36.00 104.04 1292.92

Sustituyendo en las ecuaciones los resultados obtenidos se tiene:

Para resolver el anterior sistema, se multiplica la primera ecuacin por (-89.8) y la segunda por (8) as:

Este valor de b se reemplaza en cualquiera de las ecuaciones para obtener el valor de a: Reemplazando b = 0.20477 en la primera ecuacin normal.

Se tiene entonces que los coeficientes de regresin son: a =3.139 y b = 0.20477, la ecuacin de regresin queda: Y = 3.1390 + 0.2077x Significa entonces que por cada incremento en unidad en X el valor de y se aumenta en 0.20477

3. Describir tres tipos de curvas reducibles a la forma lineal.


Curva exponencial: Y=abx Se utiliza cuando se desea calcular especialmente tasas de crecimiento; tomando la variable tiempo como variable independiente, sin embargo, no necesariamente deber ser as ya que se puede considerarse cualquier otra variable y ajustar la funcin sin hacer referencia a tasas de crecimiento. Este tipo de curva se puede trabajar con log o con ln y se puede presentar tambin as: Y= aex ; b=e Para este caso las ecuaciones normales serian: 1. ln Y = (n)(ln a) + x 2. [( X)(Y)]=(x)(ln a) + x2 5

Curva potencial: Y=axb Aplicando logaritmos a la funcin Y = axb tenemos: Log Y = log a + b log x Ahora tomando las ecuaciones normales: 1. [log Y] = n [log a] + b [log x] 2. ( [(log Y)(log X)]) =([log x])log a+ b ([log x]2)

Curva o modelo reciproco: Y = Y= 1 ax + b 1 Y

1 ax + b

= ax + b

Transformamos la ecuacin de esta manera para luego utilizar las ecuaciones normales as: 1. (1 / y) = a (x) + nb 2. (x/ y) = a (x2) + b (x)

caso exponencial

Ejemplo de Aplicacin

X 1 2 3 4 5 15 3

X 1.25 5 11.25 20 30.5 68 13.6

V=lny 0.2231 1.6094 2.4203 2.9957 3.4177 10.666 2.1332 1 4 9 16 25 55 11


XV 0.2231 1.7794 3.2188 3.86 7.2609 8.37 11.983 18.18 17.088 39.45 39.774 71.64 7.9548 14.328 -0.529 1.138 2.88 1.82 -8.95 -3.641 -0.728 0.2798 1.2950 8.2944 3.3124 80.102 95.803 19.16

1/5

Deshaciendo los cambios efectuados:

Por lo que el ajuste efectuado es:

4. Aplicacin de La Parbola de Mnimos Cuadrados Tomamos de muestra los los siguientes valores para X y Y: x y 1.2 4.5 1.8 5.6 3.1 7.0 4.9 7.8 5.7 7.2 7.1 6.8 8.6 4.5 9.8 2.7

Primero llevamos los datos a un Grafico de los Puntos X y Y, para saber de mejor forma el tipo de diagrama de dispersin, y as saber la funcin a la que se adecua mejor los datos obtenidos.
9 8 7 6 5 4 3 2 1 0 0 2 4 6 8 10 12

X 1.2 1.8 3.1 4.9 5.7 7.1 8.6

Y 4.5 5.6 7.0 7.8 7.2 6.8 4.5

X2 1.44 3.24 9.61 24.01 32.49 50.41 73.96

X3 1.73 5.83 29.79 117.65 185.19 357.91 636.06

X4 2.08 10.49 92.35 576.48 1055.58 2541.16 5470.12

XY 5.40 10.62 21.70 38.22 41.04 48.28 38.70

X2Y 6.48 19.12 7.27 187.28 233.93 342.79 332.82

9.8 x =42.2

2.7 y= 46.4

96.04 x2=291 .20

941.19 x3=2275 .35

9223.66 x4=18971. 92

26.46 xy=230. 42

254.31 x2y=14 49

Formulas:

y an b x c x xy a x b x
x
2 2

c x3

y a x b x3 c x 4

Dado que n = 8, las ecuaciones estn dadas por:

8a 42.2b 291.2c 46.4 42.2a 291.2b 2275.35c 230.42 291.2a 227.35b 18971.92c 1449
Resolviendo I y II: [8a 42.2b 291.2c 46.4]

42.2a 291.2b 2275.35c 230.42


42.2a 222.605b 1536.08c 244.76 42.2a 291.2b 2275.35c 230.42

68.595b 739.27c 14.36


Resolviendo I y III:
(8a 42.2b 291.2c 46.4) (36.4)

291.2a 227.35b 18971.92c 1449


291.2a 1536.08 10599.68c 1688.96 291.2a 227.35b 18971.92c 1449

739.27b 8372.24c 239.96


9

68 .595 b 739 .27 c 14 .36


739.27b 8372.24c 239.96

(10 .7773161 )

739.27b 7967.34649c 154.762259 739.27b 8372.24c 239.96

404.89351c 85.197741

404.89351c 85.197741 c 85.197741 0.2110 404.89351

739.27b 8372.24c 239.96 739.27b 8372.24(0.2110) 239.96 239.96 1766.54264 b 2.065 739.37
8a 42.2b 291.2c 46.4 8a (42.2 * 2.065) 291.2(0.2110) 46.4 8a 46.4 87.143 67.4432 20.7002 a 2.588 8
La ecuacin de la parbola queda:
y 2.588 2.065 x 0.2110 x 2

10

5. Definir los siguientes conceptos:


Variacin Total: Es la suma de los cuadrados de las desviaciones de los valores de Y con respecto a Y
n V.T =

(Yi - )2
i=1

se conoce a V.T como suma de cuadrados total (S.C.T) Variacin Explicada: suma de los cuadrados de las desviaciones de los valores de la lnea de regresin(y de la ecuacin de regresin: )con respecto a la media V.E = ( i - )2
i=1 n

Se llama tambin suma de cuadrados de regresin (SCR o SSR) Variacin no Explicada: Es la suma de los cuadrados de las desviaciones de los valores de Y con respecto a V.nE = (Y i - i)2
i=1 n

Se llama tambin suma de cuadrados del error (SCE o SSE). Coeficiente de Determinacin r2: Es el cociente entre la V.E y la V.T r2 = V.E V.T Donde: = ( i - )2 (Yi - )2

valores estimados Y valores reales

11

Coeficiente de Correlacin r : r=

V.E
V.T

- )2

(Yi - )2

Se dice que una correlacin es perfecta si r2 =1 r=1 o r=-1 Ahora si VE=0 entonces VT=VnE y no hay correlacion entre X^Y ya que r=0

12

Conclusin

Las tcnicas de regresin y correlacin cuantifican la asociacin estadstica entre dos o ms variables. La regresin lineal simple expresa la relacin entre una variable dependiente Y y una variable independiente X, en trminos de la pendiente y la interseccin de la lnea que mejor se ajuste a las variables. La correlacin simple expresa el grado o la cercana de la relacin entre las dos variables en trminos de un coeficiente de correlacin que proporciona una medida indirecta de la variabilidad de los puntos alrededor de la mejor lnea de ajuste- ni la regresin ni la correlacin dan pruebas de relaciones causa efecto.

13

Bibliografa

http://recursostic.educacion.es/descartes/web/materiales_didacticos/Correlacion_regresion_rect a_regresion/correlacion_y_regresion.htm#MEDIDA DE LA CORRELACIN Estadstica, Autores: John E. Freund/Richard Manning Smith, 4ta Edicin, Editorial Prentice Hall, Captulo 11

S-ar putea să vă placă și