Sunteți pe pagina 1din 4

REGRESIÓN LINEAL SIMPLE

1. INTODUCCION
El objetivo de este tema es estudiar la asociación entre dos variables conocida también como
asociación simple, solo en forma descriptiva entre dos variables conocida también como
asociación simple, solo en forma descriptiva. Este tema contiene la aplicación de los métodos
descriptivo a muestra bivariante cuantitativas, es decir muestra donde, en cada unidad estadística
se observa dos características cuantitativa medible.

La primera forma del estudio de la asociación entre las variables X e Y es la regresión, que
consiste en determinar una relación funcional entre ellas, con el fin de que se pueda predecir
el valor de una variable en base a la otra. La variable que se va predecir se denomina
variable dependiente y la variable que es la base de la preedición se denomina variable
independiente.

La segunda forma del estudio de la asociación entre las variables X e Y, es denominada


correlación, que consiste en determinar la variación conjunta de las dos variables, su grado de
relación y su sentido. La medida del grado de la relación se denomina coeficiente de
correlación. El cuadrado del índice de correlación se denomina coeficiente de determinación.

Se realizara un estudio descriptivo de la regresión lineal en el sentido que, la ecuación de


regresión que se calcula será valida, solo si hay la seguridad de que existe un alto nivel de
correlación entre las variable medido por el coeficiente de determinación.

2. DIAGRAMA DE DISPERSIÓN
Se denomina diagrama de dispersión o nube de puntos, a la grafica de los valores (x,y) de
las variables X e Y en el sistema cartesiano.
Es frecuente visualizar el tipo de relación existente entre dos variables a partir del diagrama de
dispersión.

3. LA COVARIANZA
La covarianza de los datos observado en una muestra es la estadística que mide el nivel de la
variabilidad conjunta de los datos de las variables en pareja con respecto a sus medias
respectivas.
____ __ ___
cov( x, y )  xy  x y

4. EL COEFICIENTE DE CORRELACION
El coeficiente de correlación lineal de Pearson de los n pares de valores de una variable
bidimensional (x,y) es el numero abstracto o relativo r que se calcula por:

cov( x, y )
r
 x y

El coeficiente de correlación de la muestra es un numero real comprendido entre -1 y 1


El grado o nivel de ajuste de la ecuación a los datos se analiza en forma descriptiva aplicando el
coeficiente de determinación que se define como el cuadrado del coeficiente de correlación.

5. REGRESIÓN LINEAL SIMPLE.


Dados n pares de valores de una variable bidimensional, la regresión lineal simple Y con
respecto a X, consiste en determinar la ecuación de la recta:

Y = a + bx

Que mejor se ajusta a los valores de la muestra, con el fin de poder predecir o estimar Y a
partir de X.

Lic. JOSE HUAMAN 29


El proceso de predecir o estimar Y a partir de la variables X , es la regresión. Hallar la
función lineal, consiste en determinar las constante “a” y “b” a partir de los datos de la
muestra.

cov( x, y )
b
 x2
__ __
a  y b x

Interpretación de coeficiente de regresión b

 Si b > 0, entonces la tendencia lineal es creciente, es decir a mayores valores de X


corresponde mayores valores de Y. También a menores valores de X menores valores de
Y.
 Si b < 0, entonces, la tendencia lineal es decreciente, es decir, a mayores valores de X
corresponde menores valores de Y. También, a menores valores de X corresponde
mayores valores de Y.
 Si b = 0, entonces Y permanece estacionario para cualquier valor de X es decir no hay
regresión.

6. COEFICIENTE DE DETERMINACION.
El coeficiente de determinación es una medida de la proximidad del ajuste de la recta de regresión.
Cuanto mayor sea el valor, mejor será el ajuste y mas útil la recta de regresión como instrumento
de predicción; para calcular el coeficiente de determinación se eleva al cuadrado el coeficiente de
correlación

Ejemplo 1
El gerente de la empresa estudia la relación que existe entre las variables gastos (y) y salario
(x) de un personal obrero, a la vez trata de encontrar la ecuación de regresión para hacer
estimaciones.

x y
28 25
25 20
35 32
40 37
45 40
35 30
70 55
80 60

Lic. JOSE HUAMAN 30


PRACTICA DIRIGIDA

1) En un estudio del efecto de un componente de la dieta sobre la composición de los lípidos


del plasma, se obtuvieron los siguientes datos en una muestra de 8 animales experimentales
X = Medida del componente de la dieta
Y = Medida de la concentración de lípidos en el plasma

x y
18 38
21 40
28 47
35 54
47 66
33 52
40 59
19 38

 Hallar la ecuación de regresión


 Estimar y cuando x =50
 Hallar e interpretar el coeficiente de determinación

2) Los datos siguientes muestran la Densidad óptica de cierta sustancia a diferente Niveles
de concentración.
X = Nivel de concentración
Y = Densidad óptica

x y x y
80 0,08 280 0,38
120 0,12 320 0,41
160 0,18 360 0,42
200 0,21 400 0,51

 Hallar la ecuación de regresión


 Estimar y cuando x =150
 Hallar e interpretar coefiente de determinación

3) El administrador de un hospital reunió los siguientes datos sobre el Costo por comida
estándar a diferente Volúmenes de preparación.
X = Números de comidas servidas
Y = Costo por comidas

x y
30 1,15
35 1,11
40 0,98
45 1,01
50 0,97

 Hallar la ecuación de regresión


 Estimar y cuando x =65
 Hallar e interpretar coeficiente de determinación

Lic. JOSE HUAMAN 31


4) Se llevo a cabo un experimento para estudiar el Efecto de cierto medicamento para disminuir
la Frecuencia cardiaca en adultos. La variable independiente es la dosis en miligramos del
medicamento y la variable dependiente es la diferencia entre la frecuencia cardiaca mas baja
después de la administración del medicamento y un control antes de administrarlo se reunieron
los siguientes datos en la tabla.

x y
1,01 12
1,25 12
1,51 14
1,75 12
2,01 16
2,25 18

 Hallar la ecuación de regresión


 Estimar y cuando x =1,56
 Hallar e interpretar el coeficiente de determinación

5) Se llevo a cabo un experimento para estudiar la relación entre una Medición objetiva de la
ansiedad y la Frecuencia cardiaca en adulto. Se obtuvieron los siguientes resultados en los
10 adultos normales.

X = Frecuencia cardiaca por minutos


Y = Medición objetiva de la ansiedad

x y x y
50 48 75 36
55 41 80 38
60 45 85 36
65 41 90 30
70 42 95 32

 Hallar la ecuación de regresión


 Estimar y cuando x =65
 Hallar e interpretar el coeficiente de determinación

6) Se reunieron los siguientes datos en un estudio de la relación entre la Inteligencia y el Tamaño


de la familia.
X = Tamaño de la familia
Y = Puntuación de inteligencia

x y x y
1 105 6 101
2 102 7 95
3 104 8 93
4 100 9 97
5 97 10 88

 Hallar la ecuación de regresión


 Estimar y cuando x =65
 Hallar e interpretar el coeficiente de determinación

Lic. JOSE HUAMAN 32

S-ar putea să vă placă și