Sunteți pe pagina 1din 6

Cuaderno de Estadística .CUCS.

Departamento de Disciplinas Filosóficas, Metodológicas e


Instrumentales

REGRESION LINEAL SIMPLE Y COEFICIENTE DE CORRELACION

Como ya se explico en clase, el análisis de regresión lineal es un procedimiento útil para identificar si dos
variables de carácter numérico tienen o no una relación o asociación entre si, además de que permite
conocer indirectamente la fuerza de la asociación en función de la pendiente de la línea de regresión y
predecir el comportamiento de la variable dependiente en función de los valores dados para la variable
independiente.

Tambien ayuda a saber por cada cuantos cambios de la variable independiente de da un cambio en la
variable dependiente que se está estudiando.

Hasta lo visto en clase y repasando dijimos que:

1.- El primer paso para el cálculo del análisis de regresión lineal es la elaboración de la Gráfica de Gantt o
Gráfica de Dispersión.

2.- Una vez elaborada esta gráfica, si se aprecia una posible línea que promedie a todos los puntos de la
grafica entonces se procede al cálculo de la ecuación de la línea recta, que para el caso es la línea de
regresión.

3.- la ecuación de la línea recta es:

Y= a+bx

Donde “x” es cualquier valor de la variable independiente

“a” es el punto donde la línea de regresión cruza al eje de las “Y” o eje vertical de la grafica de dispersión.

“b” es el valor del ángulo de la pendiente de la línea de regresión.

4.- Para resolver la ecuación entonces hay que calcular primero el valor de “b” con la formula que ya
desglosamos en clase

Esta columna Esta columna


se suma se suma

No. De X Y
sujeto (VI) (VD)

1
Mtro. Leobardo Cuevas Alvarez y cols. 2016
Cuaderno de Estadística .CUCS. Departamento de Disciplinas Filosóficas, Metodológicas e
Instrumentales

Después de realizar las operaciones para cada dato, se suman las columnas indicadas y los resultados se
substituyen en la formula que esta arriba. El resultado sera un valor pequeño porque es el valor del ángulo
de la pendiente de la línea de regresión.

5.- Una vez obtenido el valor de “b”, entonces se procede a calcular el valor de “a” con la siguiente
operación:

Es importante en esta operación


realizar primero la multiplicación de
“b” por e promedio de “x” y después
la resta con el promedio de “y”.

6.- Ya que se tienen los valores de “b” y de “a” entonces se substituyen en la ecuación de la línea recta: Y=
a+bx

Primero se realiza la ecuación substituyendo el valor de “x” más bajo y se resuelve para saber donde inicia
la línea de regresión; luego se substituye con el valor más alto de “X” y se realiza la operación para saber
hasta donde termina la línea recta. Teniendo esos dos puntos se traza la línea de regresión en la misma
gráfica de dispersión que ya se había realizado.

Quedaría como ejemplo algo así:

7.- La interpretación se realiza siguiendo los propósitos del procedimiento de análisis de regresión lineal. Por
ejemplo:

“ se puede concluir que con base en el análisis de regresión lineal se encontró que si existe relación de
asociación entre el ingreso de las familias y el peso de los niños, sin embargo esa relación es relativamente
débil debido al pendiente que se observa en la línea de regresión. entre los ingresos de las familias y el peso
2
Mtro. Leobardo Cuevas Alvarez y cols. 2016
Cuaderno de Estadística .CUCS. Departamento de Disciplinas Filosóficas, Metodológicas e
Instrumentales

de los niños en el ejemplo que hicimos en clase. Por tanto la relación que se encontró es creciente y positiva,
es decir, a mayor ingreso, mayor es el peso de los niños”

8.- Como dijimos que se puede predecir el comportamiento de la variable dependiente siempre y cuando
sea en el rango de valores dados para la variable dependiente, entonces podemos calcular por ejemplo,
cuanto pesaría un niño cuya familia gana 287 pesos mensuales. La forma de hacerlo es:

a.- Con la ecuación Y= a+bx substituyes el valor de “x” por 287 y resuelves la ecuación, entonces tendras la
respuesta sobre el peso del niño. Pero también puedes saber la respuesta a la siguiente pregunta:

¿por cada cincuenta pesos de diferencia en el ingreso de las familias, cuanto varia el peso de los niños?

9.- La manera de saberlo es simplemente ir substituyendo en la misma ecuación la “x” por el valor de 50,
luego por 100, después por 150, y finalmente por 200. El primer resultado se lo restas al segundo, y el
segundo se lo restas al tercero y el tercero al cuarto. Observaras que te da como resultado el mismo valor,
es decir una constante. Esa constante es la respuesta a la pregunta planteada. En el caso del ejemplo de
clase la respuesta es que por cada cincuenta pesos de diferencia en el ingreso de las familias se espera que
el peso de los niños variará en .41 de kgs.

COEFICIENTE DE CORRELACION DE PEARSON

Este es un procedimiento que sirve para:

1.- Identificar el valor preciso de la fuerza de asociación que existe entre dos variables. La fuerza de
asociación se mide en valores que van de cero a 1 positivo y de cero a 1 negativo:

-1---------.75--------------------.30------------0----------.30---------------.75----------------- +1

De este modo podemos tener una fuerza de asociación perfecta cuando es 1 sea positivo o negativo.

Esto se relaciona con la forma de la grafica de Gantt. Si los puntos cayeron casi formando una línea recta la
correlación o fuerza de asociación es muy fuerte entre las dos variables, la independiente y la dependiente y
entonces tendremos valores de .80 o de .90 o de .95, por ejemplo.

Pero si los puntos en las graficas de Gantt cayeron medianamente dispersos entonces la fuerza de asociación
es regular, y entonces tendremos valores de correlación de .50, o de .45 o de .30 por ejemplo.

Para saber este valor hay que realizar la siguiente ecuación:

r=
√∑(𝑥 − 𝑥)2∑(𝑦 − 𝑦)2 En la tabla donde se desgloso la
ecuación de “b”, recuerdan que
dejarían una columna en blanco, esa
columna seria para calcular esta
operación 3
Mtro. Leobardo Cuevas Alvarez y cols. 2016
Cuaderno de Estadística .CUCS. Departamento de Disciplinas Filosóficas, Metodológicas e
Instrumentales

Entre mas alejado del 1 positivo o negativo la

Grafica de dispersión sale como estas:

Y entre más cercano al valor de 1 positivo o negativo las graficas salen como estas:

Recuerden que entre más cercano al 1 positivo, como en la primera grafica, es más fuerte la correlación. En
la segunda es más fuerte pero en sentido inverso, es decir con pendiente negativa.

La otra utilidad del Coeficiente de Correlación de Pearson es conocer el peso relativo de la variable
independiente en los cambios observados en la variable dependiente. Para saber eso simplemente se eleva
al cuadrado el valor de la correlación y el resultado se multiplica por 100. El resultado se interpreta en
porcentaje.

Por ejemplo, si la correlación fue de .41 éste se eleva al cuadrado y da 0.1681 y se multiplica por 100, da
como resultado 16.8%. Este es el peso real que tiene la variable ingreso de las familias en los cambios
observados en el peso de los niños para el caso del ejemplo que hemos manejado en la clase.

Esto significa que existen más de 84% de otras causas del cambio del peso de los niños que no son
precisamente el ingreso de las familias, pueden ser por ejemplo la ingesta de carbohidratos, entre otras
cosas.

Van a realizar un análisis de regresión y a calcular la fuerza de asociación y el peso relativo en el siguiente
problema:

Se hizo un estudio en niños de 5 a 7 años de edad diagnosticados con discapacidad intelectual. El estudio se
hizo para identificar si había o no una probable relación entre tiempo en que tardaron los niños en

4
Mtro. Leobardo Cuevas Alvarez y cols. 2016
Cuaderno de Estadística .CUCS. Departamento de Disciplinas Filosóficas, Metodológicas e
Instrumentales

aprender a solucionar operaciones matemáticas de división y el valor del coeficiente intelectual obtenido en
una prueba de inteligencia especializada.

Partieron de la hipótesis de que a mayor valor del CI menor seria el tiempo consumido en el aprendizaje del
procedimiento para realizar divisiones matemáticas. Los datos encontrados en un grupo de 20 niños fueron
los siguientes:

No. De
sujeto
1 50 2
2 67 1.4
3 63 1.8
4 64 1.3
5 58 1.8
6 55 1.9
7 48 2.3
8 68 1.5
9 67 1.2
10 56 1.9
11 60 1.9
12 62 1.2
13 43 3.6
14 45 3.1
15 47 3.0
16 54 2.4
17 52 2.3
18 57 1.9
19 57 2.0
20 58 1.7
21 63 1.5
22 43 2.9
23 66 1.1
24 64 1.2
25 54 2.3

A.- Realizar la gráfica de dispersión y tomar la decisión de si es posible o no encontrar una relación lineal
entre ambas variables.

b.- Si es posible una relación lineal, entonces realizar los cálculos de “b” y “a”, realizar la substitución de los
resultados en la ecuación de y= a+bx y calcular la línea de regresión.

c.- Trazar la línea en la grafica de dispersión.

d.- Identificar como es la relación entre ambas variables – débil, fuerte o muy fuerte-; además identificar
como es la tendencia –creciente positiva, decreciente, inversa y proporcional o creciente directa y
proporcional-.

e.- Calcular el peso relativo de la variable independiente y el valor preciso de la fuerza de asociación.

5
Mtro. Leobardo Cuevas Alvarez y cols. 2016
Cuaderno de Estadística .CUCS. Departamento de Disciplinas Filosóficas, Metodológicas e
Instrumentales

f.- Realizar las conclusiones pertinentes.

IMPORTANTE: RECUERDA REALIZAR TODAS LAS OPERACIONES EN ESTE CUADRNO Y REALIZARLAS A LAPIZ.
NO OLVIDES HACER LA GRAFICA DE MANERA CORRECTA COLOCANDO LOS ROTULOS A LOS EJES Y ELABORAR
LA CONCLUSION DE ACUERDO A LOS PROPOSITOS DE LAS PRUEBAS. IMPRIME LA HOJA CON LOS DATOS Y EL
PROBLEMA Y PEGALA A TU CUADERNO.

6
Mtro. Leobardo Cuevas Alvarez y cols. 2016

S-ar putea să vă placă și