Sunteți pe pagina 1din 23

Universidad Mariano Glvez de Guatemala

Facultad: Ingeniera en Sistemas de la Informacin


Curso: Estadstica 1
Ingeniero: Rudy Santisteban

Conceptos Regresin y Correlacin

Autor: Richard Jacobo Velsquez Pastor


No de carne: 3090 14 1641
Seccin: A
Fecha de entrega: 01/08/15

Introduccin:
Es parte de la Estadstica corresponde a la Estadstica Inferencial y dentro de ella
los captulos de correlacin y regresin son muy usados en la Investigacin
Cientfica, una herramienta muy til cuando se trata de relacionar 2 o ms variables,
relacionadas entre s, como por ejemplo. nivel de hemoglobina y embarazo en el
mbito de las Ciencias de la Salud, la Correlacin implica el grado de dependencia
de una variable respecto a otra y la Regresin es otra tcnica que ayuda en la
investigacin de la salud Psicologa costos de una Empresa etc.

Objetivos:
Es el anlisis de regresin lineal es estimar el valor de una variable aleatoria (la
variable dependiente) dado que el valor de una variable asociada (la variable
independiente) es conocido. La variable dependiente tambin se llama variable de
respuesta, mientras que la variable independiente tambin se llama variable de
prediccin. La ecuacin de regresin es la frmula algebraica por la cual se
determina el valor estimado de la variable dependiente o de respuesta.
El termino anlisis de regresin simple indica que el valor de una variable
dependiente se estima con base de una variable independiente. El anlisis de
regresin mltiple, se ocupa de la estimacin del valor de una variable dependiente
con base en dos o ms variables independientes.
Y as como el anlisis de regresin permite obtener una frmula que expresa la
relacin entre dos o ms variables, el anlisis de correlacin obtiene un ndice que
muestra el grado de relacin entre dos o ms variables.
El coeficiente de correlacin lineal, desarrollado por el matemtico ingles Karl
Pearson (1857-1936) y conocido con la letra r, puede tomar valores desde -1 hasta
+1. Son estos extremos que manifiestan una relacin lineal perfecta (negativa o
positiva).

Regresin Y Correlacin Lineal


La regresin como una tcnica estadstica, una de ellas la regresin lineal simple y
la regresin multifactorial, analiza la relacin de dos o ms variables continuas,
cuando analiza las dos variables a esta se le conoce como variable bivariantes que
pueden corresponder a variables cualitativas, la regresin nos permite el cambio en
una de las variables llamadas respuesta y que corresponde a otra conocida como
variable explicativa, la regresin es una tcnica utilizada para inferir datos a partir
de otros y hallar una respuesta de lo que puede suceder.
Siendo as la regresin una tcnica estadstica, por lo tanto para interpretar
situaciones reales, pero a veces se manipula de mala manera por lo que es
necesario realizar una seleccin adecuada de las variables que van a construir las
formulas matemtica, que representen a la regresin, por eso hay que tomar en
cuenta variables que tiene relacin, de lo contraria se estara matematizando un
galimatas.

Se pueden encontrar varios tipos de regresin, por ejemplo:


Regresin lineal simple
Regresin mltiple (varias variables)
1. Simple
2. Mltiple, etc.
Regresin logstica
La regresin lineal tcnica que usa variables aleatorias, continuas se diferencia del
otro mtodo analtica que es la correlacin, porque esta ltima no distingue entre
las variables respuesta y la variable explicativa por que las trata en forma simtrica.
La mate matizacin nos da ecuaciones para manipular los datos, como por ejemplo
medir la circunferencia de los nios y nias y que parece incrementarse entre las
edades de 2 meses y 18 aos, aqu podemos inferir o predecir que las
circunferencias del crneo cambiara con la edad, en este ejercicio la circunferencia
de la cabeza es la respuesta y la edad la variable explicativa.
En la regresin tenemos ecuaciones que nos representan las diferentes clases de
regresin:
Regresin Lineal: y = A + Bx
Regresin Logartmica: y = A + BLn(x)
Regresin Exponencial: y = Ac(bx)
Regresin Cuadrtica: y = A + Bx +Cx2

+2 SD (98%)
Media (50%)
-2 SD (2%)
Para obtener un modelo de regresin es suficiente establecer la regresin para eso
se hace uso del coeficiente de correlacin: R.
R = Coeficiente de correlacin, este mtodo mide el grado de relacin existente
entre dos variables, el valor de R vara de -1 a 1, pero en la prctica se traba con un
valor absoluto de R.
El valor del coeficiente de relacin se interpreta de modo que a media que R se
aproxima a 1, es ms grande la relacin entre los datos, por lo tanto R (coeficiente
de correlacin) mide la aproximacin entre las variables.
El coeficiente de correlacin se puede clasificar de la siguiente manera:
CORRELACIN VALOR O RANGO
1) Perfecta 1) R = 1
2) Excelente 2) R = 0.9 < = R < 1
3) Buena 3) R = 0.8 < = R < 0.9
4) Regular 4) R = 0.5 < = R < 0.8
5) Mala 5) R < 0.5
Distribucin divariante
La distribucin divariante es cuando se estudia en una poblacin dos variables, que
forman pares correspondientes a cada individuo, como por Eje:
Las notas de 10 alumnos en biologa y lenguaje
BIOLOGIA 2
4
5
5
6
6
7
7
8
9
LENGUAJE 2

10

Los pares de valores son: ( 2, 2) (4,2) (5,5)(8,7) (9,10) forman una distribucin
divriate.

La correlacin, mtodo por el cual se relacionan dos variables se pude graficar con
un diagrama de dispersin de puntos, a la cual muchos autores le llaman nubes de
puntos, encuadrado dentro de un grfico de coordenadas X Y en la cual se pude
trazar una recta y cuyos puntos ms cercanos de una recta hablaran de una
correlacin ms fuerte, ha esta recta se le denomina recta de regresin, que puede
ser positiva o negativa, la primera contundencia a aumentar y la segunda en
descenso o decreciente.
Tambin se puede describir un diagrama de dispersin en coordenadas cartesianas
valores como en la distribucin divrciate, en donde la nube de puntos representa
los pares de valores.
GRAFICOS DE RECTA DE REGRESIN

Por ltimo se pueden graficar las lneas de tendencia, herramienta muy til para
el mercadeo porque es utilizada para evaluar la resistencia que proyectan
los precios. Cuando una lnea de tendencia central se rompe ya sea con tendencia
al alza o en la baja es porque ocurre un cambio en los precios, por lo tanto las lneas
de tendencia pueden ser alcista cuando se unen los puntos sucesivos y bajista
cuando se unen los puntos mximos.

Tambin existen grficos que representan la dispersin de datos dentro de las


coordenadas cartesianas, sea las nubes de puntos y que pueden darse segn la
relacin que representa, que puede ser lineal, exponencial y sin relacin, esta ltima
cuando los puntos estn dispersos en todo el cuadro sin agruparse lo cual sugiere
que no hay relacin.
LOS GRFICOS SIGUIENTES NOS MUESTRAN ESTA RELACIN:
Relacin lneas:

Relacin Exponencial:

Sin Relacin

Matemticamente las ecuaciones seran:


Ajuste Lineal: Y = Bx + A
Ajuste Logartmico: Y =BLnX + A

Ajuste Exponencial: Y = AC BX
En el modelo de regresin lineal simple se utiliza la tcnica de estimacin de los
mnimos cuadrados, este modelo tiene solo una variable de prediccin y se supone
una ecuacin de regresin lineal.
En el siguiente ejemplo la relacin entre la calificacin y salario la variable repuesta
es el salario inicial y la variable predictiva o de prediccin es la calificacin promedia,
si se desea determinar una ecuacin de regresin para el salario inicial promedio
como una funcin de la calificacin promedio se podr graficar y procesar los datos
en una computadora, estos datos son:
CP = Calificacin Promedio
SI = Salario Inicial
De este grupo de datos se obtiene el siguiente grfico de dispersin
Regresin simple y correlacin
La Regresin y la correlacin son dos tcnicas estadsticas que se pueden utilizar
para solucionar problemas comunes en los negocios.
Muchos estudios se basan en la creencia de que es posible identificar y cuantificar
alguna Relacin Funcional entre dos o ms variables, donde una variable depende
de la otra variable.
Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera
en un modelo de Regresin Simple.
"Y es una funcin de X" Y = f(X)
Como Y depende de X,
Y es la variable dependiente, y
X es la variable independiente.
En el Modelo de Regresin es muy importante identificar cul es la variable
dependiente y cul es la variable independiente.
En el Modelo de Regresin Simple se establece que Y es una funcin de slo una
variable independiente, razn por la cual se le denomina tambin Regresin
Divariada porque slo hay dos variables, una dependiente y otra independiente y se
representa as: Y = f (X) "Y est regresando por X"
La variable dependiente es la variable que se desea explicar, predecir. Tambin se
le llama regresando o variable de respuesta.
La variable Independiente X se le denomina variable explicativa regresor y se le
utiliza para explicar y.
ANLISIS ESTADSTICO: REGRESIN LINEAL SIMPLE
En el estudio de la relacin funcional entre dos variables poblacionales, una variable
X, llamada independiente, explicativa o de prediccin y una variable Y, llamada
dependiente o variable respuesta, presenta la siguiente notacin:
Y=a+bX+e
Donde:
a es el valor de la ordenada donde la lnea de regresin se intercepta con el eje Y.
b es el coeficiente de regresin poblacional (pendiente de la lnea recta) e es el error

SUPOSICIONES DE LA REGRESIN LINEAL


Los valores de la variable independiente X son fijos, medidos sin error.
La variable Y es aleatoria
Para cada valor de X, existe una distribucin normal de valores de Y
(subpoblaciones Y)
Las variancias de las subpoblaciones Y son todas iguales.
Todas las medias de las subpoblaciones de Y estn sobre la recta.
Los valores de Y estn normalmente distribuidos y son estadsticamente
independientes.
Estimacin de la ecuacin de regresin maestral
Consiste en determinar los valores de "a" y "b " a partir de la muestra, es decir,
encontrar los valores de a y b con los datos observados de la muestra. El mtodo
de estimacin es el de Mnimos Cuadrados, mediante el cual se obtiene:

Que se interpreta como:


a es el estimador de a
Es el valor estimado de la variable Y cuando la variable X = 0
b es el estimador de b , es el coeficiente de regresin
Est expresado en las mismas unidades de Y por cada unidad de X. Indica el
nmero de unidades en que vara Y cuando se produce un cambio, en una unidad,
en X (pendiente de la recta de regresin).
Un valor negativo de b sera interpretado como la magnitud del decremento en Y
por cada unidad de aumento en X.
Podemos clasificar los tipos de regresin segn diversos criterios.
En primer lugar, en funcin del nmero de variables independientes:
Regresin simple: Cuando la variable Y depende nicamente de una nica variable
X.
Regresin mltiple: Cuando la variable Y depende de varias variables (X1, X2, ...,
Xr)
En segundo lugar, en funcin del tipo de funcin f(X):
Regresin lineal: Cuando f(X) es una funcin lineal.
Regresin no lineal: Cuando f(X) no es una funcin lineal.
En tercer lugar, en funcin de la naturaleza de la relacin que exista entre las dos
variables:
La variable X puede ser la causa del valor de la variable Y.

Por ejemplo, en toxicologa, si = Dosis de la droga e Y = Mortalidad, la mortalidad


se atribuye a la dosis administrada y no a otras causas.
Puede haber simplemente relacin entre las dos variables.
Por ejemplo, en un estudio de medicina en que se estudian las variables X = Peso
e Y = Altura de un grupo de individuos, puede haber relacin entre las dos, aunque
difcilmente una pueda considerarse causa de la otra.
En este tema se tratar nicamente de la Regresin lineal simple.
Ejemplo de regresin lineal
MODELO DE REGRESION LINEAL

SEPUESTOS DEL MODELO DE REGRESIN LINEAL


Para poder crear un modelo de regresin lineal, es necesario que se cumpla con los
siguientes supuestos:5
La relacin entre las variables es lineal.
Los errores son independientes.
Los errores tienen varianza constante.
Los errores tienen una esperanza matemtica igual a cero.
El error total es la suma de todos los errores.

TIPOS MODELO DE REGRESIN LINEAL


Existen diferentes tipos de regresin lineal que se clasifican de acuerdo a sus
parmetros:
1) Regresin lineal simple

Slo se maneja una Variable independiente, por lo que slo cuenta con dos
parmetros. Son de la forma:6

2) Anlisis
Dado el modelo de regresin simple, si se calcula la Peraza valor esperado) del
valorm>Y, se obtiene

Obteniendo dos ecuaciones denominadas ecuaciones normales e generan la


siguientelucinra ambos parmetros:6

La interpretacin del parmetro beta 2 es que un incremento en Xi de una unidad,


Yi incrementar en beta 2

3) Regresin lineal mltiple


Maneja variasriables independientes. Cuenta con varios parmetros. Se expresan
de la forma:8

Rectas de Regresin

Las rectas de regresin son mejor se ajustan a la nube de puntos (o tambin llamado
pentagrama de dispersin) generada por una distribucin binomial.
Matemticamente, son posibles dos rectas de mximo ajuste:9
La recta de regresin dem>Yem>sobrem>X:

La recta de regresin dem>Xem>sobrem>Y:

La rrelacin r") de las rectas determinar la calidad del ajuste. Sim>rem>es


cercano o igual a 1, el ajuste ser bueno; sim>rem>es cercano o igual a 0, se
tratar de un ajuste malo. Ambas rectas de regresin se intersecan en un punto
llamado centro de gravedad de la distribucin.
Aplicaciones de la regresin lineal
Lneas de tendencia
Tendencia
Una lnea de tendencia representa una tendencia en una serie de datos obtenidos
a travs de un largo perodo. Este tipo de lneas puede decirnos si un conjunto de
datos en particular (como por ejemplo, el PBI, el precio del petrleo o el valor de
las acciones) han aumentado o de crementado en un determinado perodo.10 Se
puede dibujar una lnea de tendencia a simple vista fcilmente a partir de un grupo
de puntos, pero su posicin y pendiente se calcula de manera ms precisa utilizando
tcnicas estadsticas como las regresiones lineales. Las lneas de tendencia son
generalmente lneas rectas, aunque algunas variaciones utilizan polinomios de
mayor grado dependiendo de la curvatura deseada en la lnea.
Medicina
En medicina, las primeras evidencias relacionando la mortalidad con
el fumar tabaco11 vinieron de estudios que utilizaban la regresin lineal. Los
investigadores incluyen una gran cantidad de variables en su anlisis de regresin
en un esfuerzo por eliminar factores que pudieran producir correlaciones espurias.
En el caso del tabaquismo, los investigadores incluyeron el estado socio-econmico
para asegurarse que los efectos de mortalidad por tabaquismo no sean un efecto
de su educacin o posicin econmica. No obstante, es imposible incluir todas las
variables posibles en un estudio de regresin.12 13 En el ejemplo del tabaquismo,

un hipottico gen podra aumentar la mortalidad y aumentar la propensin a


adquirir enfermedades relacionadas con el consumo de tabaco. Por esta razn, en
la actualidad las pruebas controladas aleatorias son consideradas mucho ms
confiables que los anlisis de regresin.
TIPOS DE CORRELACIN
Cada conjunto de correlaciones se basa en un campo de correlacin, que no es ms
que una lista de propiedades. stas pueden ser propiedades de datos, que se
encuentran en el propio mensaje, o propiedades de contexto, que describen detalles
del sistema o de mensajes no relacionados con los datos transmitidos en el
mensaje.
Puede usar un tipo de correlacin en ms de un conjunto de correlaciones. Si
necesita establecer correlaciones entre distintos valores para las propiedades de un
tipo de correlacin, deber crear un conjunto de correlaciones nuevo: cada uno de
ellos se puede inicializar una sola vez.
Puede promocionar las propiedades de un esquema de propiedades para declarar
que algunas de las propiedades de un mensaje estn accesibles para la
orquestacin. Para obtener ms informacin, vea conmocionar propiedades.
TIPOS DE CORRELACIN
1 Ir relacin directa
La correlacin directa se da cuando al aumentar una de las variables la otra
aumenta.
La recta correspondiente a la nube de puntos de la distribucin es una recta
creciente.

2rrelacin inversa
La correlacin inversa se da cuando al aumentar una de las variables la otra
disminuye.
La recta correspondiente a la nube de puntos de la distribucin es una recta
decreciente.

3rrelacin nula
La correlacin nula se da cuando no hay dependencia de ningn tipo entre las
variables.
En este caso se dice que las variables son incorreladas y la nube de puntos tiene
una forma redondeada.

GRADO DE CORRELACIN
El grado de correlacindica la proximidad que hay entre los puntos de la nube de
puntos. Se pueden dar tres tipos:
1.rrelacin fuerte
La correlacin ser fuerte cuanto ms cerca est los puntos de la recta.

2.rrelacin dbil
La correlacin ser dbil cuanto ms separados estn los puntos de la recta.

3.rrelacin nula
El eficiente de correlacin lineal el cociente entre la varianza el producto de las
aviaciones tpicas ambas variables.
El eficiente de correlacin lineal expresa mediante la letra

Propiedades del coeficiente de correlacin


1.eficiente de correlacin vara al hacerlo la escala de medicin.
Es decir, si expresamos la altura en metros o en centmetros el coeficiente de
correlacin no vara.
2. signo del eficiente de correlacin el mismo que el de la varianza.
Si la covarianza es positiva, la correlacin es directa.
Si la covarianza es negativa, la correlacin es inversa.
Si la covarianza es nula, no existe correlacin.
3. El eficiente de correlacin lineal un nmero real comprendido entre -1 y 1.
-1 = r = 1
4. el eficiente de correlacin lineal ms valores cercanos a -1 la correlacin es
arte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a -1.
5. el eficiente de correlacin lineal ms valores cercanos a 1 la correlacin es arte
y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.
6. el eficiente de correlacin lineal ms valores cercanos a 0, la correlacin.
7. r = 1 -1, los puntos de la nube estn sobre la recta creciente o decreciente.
Entre ambas variables hay dependencia funcional.
Ejemplos: Las notas de 12 alumnos de una clase en Matemticas y Fsica son las
siguientes:
Matemticas
2 3 4 4 5 6 6 7 7 8 10 10
Fsica
1 3 2 4 4 4 6 4 6 7 9
Hallar el eficiente de correlacin la distribucin e interpretarlo.
xi Yi xii xi2 yi2
2

10

16

16

16

16

20

25

16

24

36

16

36

36

36

28

49

16

42

49

36

56

64

49

10 9

90

100 81

10 10 100

100 100

72 60 431 504 380


1llamos los das aritmticos.
2lculamos la varianza.

3lculamos las variaciones tpicas.

4plicamos la frmula del eficiente de correlacin lineal.

Al ser el eficiente de correlacin, la correlacin es directa.


Como eficiente de correlacin muy prximo a 1 la correlacin es muy fuerte.
Los valores de dos variables X e Y se distribuyen segn la tabla siguiente:
Y/X
0
2
4
1

3
2
5
0
Determinar el eficiente de correlacin.
Convertimos la tabla de doble entrada en tabla simple.
xi
Yi
fi xifi xi2fi yifi yi2fi xiyifi
0

18

16

16

16

10

20

15

45

30

12

48

12

32

16

120

41

97

76

font> font> 20 40

Al ser el eficiente de correlacin negativo, la correlacin es inversa.


Como eficiente de correlacin est muy prximo a 0 la correlacin es muy dbil.
La recta de regresin la que mejor se ajusta a la de puntos.
La recta de regresin por el punto (X y Y) llama dentro de gravedad.
Recta de regresin de Y sobre X
La recta de regresin de Y sobre X se utiliza para estimar los valores de la Y a partir
de los de la X.
La pendiente de la recta es el cociente entre la covarianza y la varianza de la
variable X.

Recta de regresin de X sobre Y


La recta de regresin X sobre Y se utiliza para estimar los valores de la X a partir
de los de la Y.
La pendiente la recta es el cociente entre la covarianza y la varianza de la variable
Y.

Si la correlacin es nula, r = 0, las rectas de regresin son perpendiculares entre s,


y sus ecuaciones son:
y =mg src="image038.png" alt="Monografias.com" />
x =mg src="image039.png" alt="Monografias.com" />

Ejemplo: Las notas de 12 alumnos de una clase en Matemticas y Fsica son las
siguientes:
Matemticas
2 3 4 4 5 6 6 7 7 8 10 10
Fsica
1 3 2 4 4 4 6
Hallar las rectas de regresin representarlas.
xi Yi xii xi2 yi2
2

16

16

16

16

20

25

16

24

36

16

36

36

36

28

49

16

42

49

36

56

64

49

10 9

90

100 81

10 10 100

100 100

72 60 431 504 380


1llamos lasdias arimticas.
2lculamos lavarianza.

3lculamos lasrianzas.

4Recta de regresin de Y sobre X.

4Recta de regresin de X sobre Y.

10

Ejercicios regresin y correlacin lineal resueltos


Una compaa de seguros considera que el nmero de vehculos (y) que circulan
por una determinada autopista a ms de 120 km/h , puede ponerse en funcin del
nmero de accidentes (x) que ocurren en ella. Durante 5 das obtuvo los siguientes
resultados:
Accidentes xi
5
7
2
1
9
Nmero de vehculos
15
18
10
8
20
yi
/font>
Calcula
el
coeficiente
de
correlacin
lineal.
Si ayer se produjeron 6 accidentes, cuntos vehculos podemos suponer que
circulaban
por
la
autopista
a
ms
de
120
km
/
h?
Es buena la prediccin?
Construimos una tabla, teniendo en cuenta que la frecuencia absoluta es uno.
Debemos conocer la media aritmtica de las dos variables, las varianzas, las
desviaciones tpicas y la covarianza.
font> font> Media
Varianza
Covarianza
aritmtica
font> Fi

Xi

Yi

xi2

yi2

xi . yi

font> 1

15

25

225

75

font> 1

18

49

324

126

font> 1

10

100

20

font> 1

64

font> 1

20

81

400

180

24

71

160

1113

409

font>

EJERCICIOS REGRESION Y CORRELACION LINEAL RESUELTOS


Correlacin y regresin
El nmero de espaoles (en millones) ocupados en la agricultura, para los aos que
se indican, era:
Ao
1980 1982 1984 1986 1988 1990 1992 1994
Ocupados 2,1 2,04 1,96 1,74 1,69 1,49 1,25 1,16
a) Podra explicarse su evolucin mediante una recta de regresin?
b) Qu limitaciones tendran las estimaciones hechas por esa recta?
[sol] a) Si; b) No vale para hacer estimaciones alejadas de los aos considerados.
2. Asocia las rectas de regresin y = x +16, y = 2x 12, y = 0,5x + 5 a las nubes
de puntos siguientes:

3. Asigna los coeficientes de correlacin lineal r = 0,4, r = 0,85 y r = 0,7, a las nubes
del problema anterior.
[sol] a) Respectivamente: (c), (b), (a). b) Respectivamente: (a), (b), (c)
Tipo II. Clculo de la correlacin y regresin
4. [S] a) Calcula la recta de regresin de Y sobre X en la distribucin siguiente
realizando todos los clculos intermedios.
X 10 7 5 3 0

Y 2 4 6 8 10
b) Cul es el valor que correspondera segn dicha recta a X = 7?
[sol] a) y = 0,8276x +10,138; b) 4,3448.
5. [S] El nmero de bacterias por unidad de volumen, presentes en un cultivo
despus de un cierto nmero de horas, viene expresado en la siguiente tabla:
X: N de horas 0 1 2 3 4 5
Y:
N
de
12 19 23 34 56 62
bacterias
Calcula:
a) Las medias y desviaciones tpicas de las variables, nmero de horas y nmero
de bacterias.
b) La covarianza de la variable bidimensional.
c) El coeficiente de correlacin e interpretacin.
d) La recta de regresin de Y sobre X.
6. La tabla siguiente muestra las notas obtenidas por 8 alumnos en un examen, las
horas de estudio dedicadas a su preparacin y las horas que vieron la televisin los
das previos al examen.
Nota
5 6 7 3 5 8 4 9
Horas
estudio

de

10 9

10 5

14

Horas de TV 7 6 2 11 9 3 9 5
a) Representa grficamente los diagramas correspondientes a nota-estudio y notaTV.
b) Se observa correlacin entre las variables estudiadas? De qu tipo? En qu
caso estimas que es ms fuerte?
[sol] b) S. Directa; inversa.
7. Con los datos del problema anterior, halla el coeficiente de correlacin de notaestudio y nota-TV. Qu puede deducirse con ms precisin conociendo la nota

que obtuvo una persona en el examen: el tiempo que dedic al estudio o el que
dedic a ver la televisin?
[sol] 0,943382 y (0,846283. El tiempo que dedic al estudio.
8. Con los mismos datos, halla las rectas de regresin correspondientes y estima
para un alumno que sac un 2 en el examen:
a) Las horas que estudi.
b) Las horas que vio la TV.
[sol] a) Est = (0,246753 + 1,46753 ota; 2,7 h. b) TV = 14,1299 ( 1,2987 ota; 11,5
h.
Tipo III. Estimacin a partir del a recta de regresin
9. La altura, en cm, de 8 padres y del mayor de sus hijos varones, son:
Padre
170 173 178 167 171 169 184 175
Hijo
172 177 175 170 178 169 180 187
a) Calcula la recta de regresin que permita estimar la altura de los hijos
dependiendo de la del padre; y la del padre conociendo la del hijo.
b) Qu altura cabra esperar para un hijo si su padre mide 174? Y para un padre,
si su hijo mide 190 cm?
[sol] a) H = 68,1853 + 0,621859 ; P = 77,4406 + 0,545082 . b) 176,4 cm; 181
cm.
10. [S] Durante su primer ao de vida han pesado a Marta cada mes. En la tabla
siguiente se dan sus pesos:
x 1
2
3
4
5
6
7
8
9
10 11 12

y 3,2 3,7 4,2 5,3 5,7 6,5 6,8 7,2 7,9 7,7 8 8,5
En esta tabla, x representa la edad en meses e y el peso en kilogramos.
a) Calcula la media y la desviacin tpica de los pesos.
b) Determina la ecuacin de la recta de regresin de y sobre x, explicando
detalladamente los clculos que haces y las frmulas que utilizas.
[sol] a) 6,225; 1,7181 b) y = 0,48706x + 3,05909
11. [S] Utilizando la recta de regresin de x sobre y correspondiente a la distribucin
siguiente:
x = altura sobre el nivel del
0 184 231 481 911
mar
y = temperatura media en
20 18 17 12 10
C
Calcula la altitud de una ciudad en la que la temperatura media es de 15.
[sol] 392,7 m.

Conclusin:
Regresin y correlacin lineal son dos herramientas para investigar la dependencia
de una variable dependiente y en funcin de una variable independiente x. y = f(x)
y = variable dependiente que se desea explicar o predecir, tambin se llama
regresor o respuesta
x = variable independiente, tambin se llama variable explicativa, regresor o
predictor
Regresin lineal - la relacin entre x y y se representa por medio de una lnea recta
Regresin curvilnea - la relacin entre x y y se representa por medio de una curva.
Las tcnicas de regresin y correlacin cuantifican la asociacin estadstica entre
dos o ms variables. La regresin lineal simple expresa la relacin entre una
variable dependiente Y y una variable independiente X, en trminos de la pendiente
y la interseccin de la lnea que mejor se ajuste a las variables.
La correlacin simple expresa el grado o la cercana de la relacin entre las dos
variables en trminos de un coeficiente de correlacin que proporciona una medida
indirecta de la variabilidad de los puntos alrededor de la mejor lnea de ajuste- Ni la
regresin ni la correlacin dan pruebas de relaciones causa efecto.

S-ar putea să vă placă și