Sunteți pe pagina 1din 18

FACULTAD DE CIENCIAS EMPRESARIALES

ESCUELA PROFESIONAL DE ADMINISTRACIÓN

“TÉCNICAS BÁSICAS DE REGRESIÓN LINEAL MULTIPLE EN LA TOMA


DE DESICIONES”

INFORME ACADÉMICO

AUTOR:
Céliz Ventura Veronica
Estela Guabloche Katherin
Montoya Pizuri Leonardo Antonio
Pérez Ruibal Marin Rober
Sevillano Malaverry Joel Teodoro
Tello Padilla Julio Jefferson

ASESOR:
Pereyra Gonzales Tony

CIUDAD DE MOYOBAMBA-PERÚ

2019
2|Página

INDICE

TÉRMINOS DE INTRODUCCIÓN: .................................................................................................... 3


REGRESIÓN LINEAL MULTIPLE:...................................................................................................... 4
Regresión lineal matricial .......................................................................................................... 6
CORRELACION MULTIPLE .............................................................................................................. 6
Planos de regresión y coeficientes de correlación .................................................................... 7
MÉTODOS DE REGRESIÓN LINEAL MÚLTIPLE................................................................................ 7
Heterocedasticidad ................................................................................................................... 7
Multicolinealidad ...................................................................................................................... 7
Multicolinealidad exacta ........................................................................................................... 8
Multicolinealidad aproximada .................................................................................................. 8
APLICACIONES DE LA REGRESIÓN LINEAL ..................................................................................... 8
Líneas de tendencia................................................................................................................... 8
Medicina .................................................................................................................................... 8
COEFICIENTE DE CORRELACIÓN .................................................................................................... 9
CLASIFICACIÓN DE LA CORRELACIÓN. ................................................................................. 9
TIPOS DE CORRELACIÓN............................................................................................................ 9
EJERCICIOS................................................................................................................................... 11
EJERCICION°1........................................................................................................................... 11
EJERCICIO N°2.......................................................................................................................... 12
EJERCICIO N°3 ......................................................................................................................... 13
EJERCICIO N°4.......................................................................................................................... 14
EJERCICIO N°5.......................................................................................................................... 15
EJERCICIO N°6.......................................................................................................................... 16
BIBLIOGRAFÍA .............................................................................................................................. 18
3|Página

TÉCNICAS BÁSICAS DE REGRESIÓN LINEAL MULTIPLE EN LA TOMA


DE DESICIONES

TÉRMINOS DE INTRODUCCIÓN:

A fin de facilitar la comprensión del presente trabajo definiremos algunos conceptos


básicos.

Análisis de Correlación. - Es el conjunto de técnicas estadísticas empleado para medir la


intensidad de la asociación entre dos variables.

El principal objetivo del análisis de correlación consiste en determinar qué tan intensa es
la relación entre dos variables. Normalmente, el primer paso es mostrar los datos en un
diagrama de dispersión.
Diagrama de Dispersión. - es aquel grafico que representa la relación entre dos variables.

Variable Dependiente. - es la variable que se predice o calcula. Cuya representación es


“Y”

Variable Independiente. - es la variable que proporciona las bases para el cálculo. Cuya
representación es: X1, X2, X3.......

Coeficiente de Correlación. - Describe la intensidad de la relación entre dos conjuntos de


variables de nivel de intervalo. Es la medida de la intensidad de la relación lineal entre
dos variables.

El valor del coeficiente de correlación puede tomar valores desde menos uno hasta uno,
indicando que mientras más cercano a uno sea el valor del coeficiente de correlación, en
cualquier dirección, más fuerte será la asociación lineal entre las dos variables. Mientras
más cercano a cero sea el coeficiente de correlación indicará que más débil es la
asociación entre ambas variables. Si es igual a cero se concluirá que no existe relación
lineal alguna entre ambas variables.

Análisis de regresión. - Es la técnica empleada para desarrollar la ecuación y dar las


estimaciones.
Ecuación de Regresión. - es una ecuación que define la relación lineal entre dos variables.

- Ecuación de regresión Lineal: Y’ = a + Bx


- Ecuación de regresión Lineal Múltiple: Y’ = a + b1X1 + b2X2 + b3X3...

Principio de Mínimos Cuadrados. - Es la técnica empleada para obtener la ecuación de


regresión, minimizando la suma de los cuadrados de las distancias verticales entre los
valores verdaderos de “Y” y los valores pronosticados “Y”.
Análisis de regresión y Correlación Múltiple. - consiste en estimar una variable
dependiente, utilizando dos o más variables independientes.
4|Página

Ecuación de regresión Múltiple. - La forma general de la ecuación de regresión múltiple


con dos variables independientes es:

X1, X2: Variables Independientes


a: es la ordenada del punto de intersección con el eje Y.

b1: Coeficiente de Regresión (es la variación neta en Y por cada unidad de variación en
X1.).
b2: Coeficiente de Regresión (es el cambio neto en Y para cada cambio unitario en X2).

REGRESIÓN LINEAL MULTIPLE:

En la mayor parte de los problemas que se generan en la industria en que se aplica el


análisis de regresión, se requiere más de una variable independiente en el modelo de
regresión. La complejidad de la mayoría de los mecanismos científicos es tal que, con
objeto de estar en condiciones de pronosticar una respuesta, se necesita un modelo de
regresión múltiple.

La regresión múltiple comprende tres o más variables. Existe solo una variable
dependiente, pero hay dos o más de tipo independiente. En esta operación se desarrolla
una ecuación la cual se puede utilizar para predecir valore de y, respecto a valores dados
de la diferencia de variables independientes adicionales a través de incrementar la
capacidad predicativa sobre la de la regresión lineal simple.
Aunque hay muchos problemas en los cuales una variable puede predecirse con bastante
exactitud en términos de otra, parece razonable que las predicciones deban mejorar si
adicionalmente se considera información relevante.

Una extensión natural del modelo de regresión lineal simple consiste en considerar más
de una variable explicativa.
Los modelos de regresión múltiple estudian la relación entre:

- una variable de interés Y (variable respuesta o dependiente)


- un conjunto de variables explicativas o regresoras X1, X2, . . . , Xp

En el modelo de regresión lineal múltiple se supone que la función de regresión que


relaciona la variable dependiente con las variables independientes es lineal, es decir: Y =
β0 + β1X1 + β2X2 + · · · + βp Xp + ε
5|Página

Estimación de los coeficientes por el método de mínimos cuadrados

En el caso de la regresión múltiple la ecuación se amplía y puede tener más variables


independientes adicionales. Esto puede ampliarse a cualquier número (k) de variables
independientes, siendo la ecuación general de regresión múltiple:

Donde:

X1, Xk son las variables independientes. a es la intersección con el eje Y. Es la ordenada


del punto de intersección con el eje Y.

B1 es la variación neta en Y por cada unidad de variación en X1 manteniendo X2


constante. Se denomina coeficiente de regresión parcial, coeficiente de regresión neta, o
simplemente coeficiente de regresión.

Bk es el cambio neto en Y para cada cambio unitario en Xk manteniendo X1 constante.


También se le conoce como coeficiente de regresión parcial, coeficiente de regresión neta,
o simplemente coeficiente de regresión.

Se pueden aplicar técnicas de mínimos cuadrados similares para estimar los coeficientes
cuando los modelos lineales involucran potencias y productos de las variables

independientes.

La solución de este conjunto de ecuaciones de las estimaciones únicas produce los


coeficientes b0, b1, b2,...bk.
6|Página

Regresión lineal matricial

Al ajustar un modelo de regresión lineal múltiple, en particular cuando el número de


variables excede de 2, el conocimiento de la teoría matricial puede facilitar las
manipulaciones matemáticas. Supóngase que el experimentador tiene k variables
independientes X1, X2 . . ., XK, y n observaciones y1, y2 . . ., y yn, cada una de las cuales
se puede expresar por la ecuación:

Y1= a + B1 x1i + B2 x2i + . . . + Bk xki + ⌡i


Este modelo representa n ecuaciones que describen cómo se generan los valores de
respuesta. Con la notación matricial, se pueden escribir las ecuaciones.

CORRELACION MULTIPLE

El grado de relación existente entre tres o más variables se llama correlación múltiple.
Los principios fundamentales implicados en los problemas de correlación múltiple son
análogos a los de la correlación simple tratada con anterioridad.

Como se observó en la parte de regresión lineal múltiple, existe una ecuación de regresión
para estimar una variable dependiente, a partir de variables independientes.

También, como observamos en la parte de regresión lineal múltiple, análogamente a como


existen las rectas de regresión de mínimos cuadrados de aproximación a una serie de N
datos puntuales (X, Y) en un diagrama de dispersión de dos dimensiones, existen los
planos de regresión de mínimos cuadrados que se ajustan a una serie de N datos puntuales
(X1, X2, X3) en un diagrama de dispersión de tres dimensiones.

La base del cálculo de la correlación múltiple se basa en la teoría de la regresión múltiple,


ya sea por mínimos cuadrados o matricialmente, de acuerdo a nuestra parte de regresión
lineal múltiple.
7|Página

Planos de regresión y coeficientes de correlación

Vamos a suponer una ecuación de regresión para el caso de tres variables, como a
continuación se indica:

X1 = b1.23 + b12.3 X2 + b 13.2 X3


Esta ecuación se llama ecuación de regresión lineal de X1 sobre X2 y X3; con b1.23,
b12.3, y b13.2 los coeficientes de regresión parcial de acuerdo a la teoría de regresión
múltiple. Como observamos, tenemos una variable dependiente X1 y dos variables
independientes X2 y X3.

Tomando como referencia esta ecuación, si los coeficientes de correlación lineal entre las
variables X1 y X2, X1 y X3, X2 y X3 se calculan como en la parte de correlación lineal
simple y se denotan, respectivamente, por r12, r13, r23 (también llamados coeficientes
de correlación de orden cero), el plano de regresión de mínimos cuadrados tiene la
ecuación:

MÉTODOS DE REGRESIÓN LINEAL MÚLTIPLE.

Podemos comenzar definiendo que es una técnica usada en estadística para establecer una
relación entre algunas variables dependientes o para explicar algunas variables
independientes. Existen muchos conceptos importantes relacionados con este método que
son importantes conocer al momento de realizar una regresión lineal múltiple.

Heterocedasticidad
Este concepto estadístico hace referencia a las perturbaciones no constantes durante las
observaciones realizadas, sin embargo, con respecto a la regresión lineal implica no seguir
el modelo de regresión lineal múltiple. La Heterocedasticidad se presenta en algunos
casos cuando los datos de una muestra son valores que se han promediado o han sido
simplemente agregados.

Multicolinealidad
Este concepto está vinculado a las variables explicativas y la correlación entre ellas. La
correlación entre dos variables siempre va darse a menos que el experimento se realice
en las condiciones específicas de un laboratorio.
8|Página

Multicolinealidad exacta
Este concepto importante para entender la regresión lineal múltiple es una forma de
multicolinealidad que se da cuando una variable o más son una combinación lineal de la
otra, lo cual también se conoce como coeficiente de correlación entre dos variables.
Multicolinealidad aproximada
Este fenómeno ocurre cuando no se puede afirmar que una o más variables sean una
combinación lineal de la otra, aunque existe un coeficiente entre ellas muy cercano uno
del otro.

APLICACIONES DE LA REGRESIÓN LINEAL

Líneas de tendencia

Una línea de tendencia representa una tendencia en una serie de datos obtenidos a través
de un largo período. Este tipo de líneas puede decirnos si un conjunto de datos en
particular (como, por ejemplo, el PBI, el precio del petróleo o el valor de las acciones)
han aumentado o decremento en un determinado período.8 Se puede dibujar una línea de
tendencia a simple vista fácilmente a partir de un grupo de puntos, pero su posición y
pendiente se calcula de manera más precisa utilizando técnicas estadísticas como las
regresiones lineales. Las líneas de tendencia son generalmente líneas rectas, aunque
algunas variaciones utilizan polinomios de mayor grado dependiendo de la curvatura
deseada en la línea.

Medicina

En medicina, las primeras evidencias relacionando la mortalidad con el fumar tabaco


vinieron de estudios que utilizaban la regresión lineal. Los investigadores incluyen una
gran cantidad de variables en su análisis de regresión en un esfuerzo por eliminar factores
que pudieran producir correlaciones espurias. En el caso del tabaquismo, los
investigadores incluyeron el estado socio-económico para asegurarse que los efectos
de mortalidad por tabaquismo no sean un efecto de su educación o posición económica.
No obstante, es imposible incluir todas las variables posibles en un estudio de regresión.

En el ejemplo del tabaquismo, un hipotético gen podría aumentar la mortalidad y


aumentar la propensión a adquirir enfermedades relacionadas con el consumo de tabaco.
Por esta razón, en la actualidad las pruebas controladas aleatorias son consideradas
mucho más confiables que los análisis de regresión.
9|Página

COEFICIENTE DE CORRELACIÓN

Según Morales (2011) El coeficiente de correlación r de Pearson expresa en qué grado


los sujetos tienen el mismo orden en dos variables. Si los sujetos más altos pesan más y
los más bajitos pesan menos, entre peso y altura tendremos una correlación positiva: a
mayor altura, mayor peso. Si los de más edad corren más despacio y los más jóvenes
corren más deprisa, entre edad y velocidad tendremos una correlación negativa; a mayor
edad, menor velocidad. Los coeficientes de correlación pueden ser por lo tanto positivos
o negativos. Lo que expresan estos coeficientes se entiende bien mediante su
representación gráfica, los diagramas de dispersión en los que las dos variables están
simbolizadas con las letras X e Y. p.1

Para Sote (2005), el coeficiente de correlación (r) se define como un “indicador


estadístico que nos permite conocer el grado de relación, asociación o dependencia que
pueda existir entre dos o más variables”. (p. 360)
Y agrega lo siguiente:

CLASIFICACIÓN DE LA CORRELACIÓN.

- Correlación simple: cuando estudia la posible relación entre dos variables.


- Correlación múltiple: cuando analiza la asociación o dependencia de más de dos
variables.
- Correlación rectilínea o lineal: cuando los datos presenten una tendencia de línea recta.
- Correlación curvilínea: la variable presenta una tendencia distinta a la línea recta.
(p.233)

Además, Sote (2005) expresa lo siguiente:

TIPOS DE CORRELACIÓN.

Correlación positiva, correlación negativa e incorrelación.


Correlación positiva o directamente proporcional r = (+).

Nos indica que al modificarse en promedio una variable en un sentido, la otra lo hace en
la misma dirección.

Correlación negativa o inversamente proporcional r = (-).


Nos muestra que al cambiar una variable en una determinada dirección (en promedio), la
otra lo hace en sentido contrario u opuesto.
10 | P á g i n a

Incorrelación r = 0

Cuando la obtención de dicho indicador “r” sea exactamente igual a cero, se dice que no
existe alguna relación, asociación o dependencia entre las variables estudiadas, siendo
por tanto ellas, variables correlacionadas o faltes de alguna dependencia lineal. p.( 239-
240

Existen diversos coeficientes que miden el grado de correlación, adaptados a la naturaleza


de los datos. El más conocido es el coeficiente de correlación de Pearson (introducido en
realidad por Francis Galton), que se obtiene dividiendo la covarianza de dos variables por
el producto de sus desviaciones estándar. Otros coeficientes son:

*Coeficiente de correlación de Sperman.


*Coeficiente de correlación de Pearson

En estadística, el coeficiente de correlación de Pearson es un índice que mide la relación


lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la
correlación de Pearson es independiente de la escala de medida de las variables.
El coeficiente de correlación entre dos variables aleatorias X e Y es el cociente
donde σXY es la covarianza de (X,Y) y σX y σY las desviaciones típicas de las
distribuciones marginales. (Enciclopedia Libre Wikipedia (2010). Parra.1).

Coeficiente de correlación de Spearman


En estadística, el coeficiente de correlación de Spearman, ρ (ro) es una medida de la
correlación (la asociación o interdependencia) entre dos variables aleatorias continuas.
Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.
El estadístico ρ viene dado por la expresión:
donde D es la diferencia entre los correspondientes valores de x - y. N es el número de
parejas.
11 | P á g i n a

EJERCICIOS.

EJERCICION°1
Calcular el coeficiente de correlación lineal
Un centro comercial sabe en función de la distancia, en kilómetros, a la que se sitúe de
un núcleo de población, acuden los clientes, en cientos, que figuran en la tabla:
Nº de Clientes (X) Distancia (Y)

8 15

7 19

6 25

4 23

2 34

1 40

1.- Calcular el coeficiente de correlación lineal.

xi yi xi ·yi xi² yi²

8 15 120 64 225

7 19 133 49 361

6 25 150 36 625

4 23 92 16 529

2 34 68 4 1 156

1 40 40 1 1 600

28 156 603 170 4 496


12 | P á g i n a

EJERCICIO N°2

Una compañía desea hacer predicciones del valor anual de sus ventas totales en cierto
país a partir de la relación de éstas y la renta nacional. Para investigar la relación cuenta
con los siguientes datos: XY

X representa la renta nacional en millones de euros e Y representa las ventas de la


compañía en miles de euros en el periodo que va desde 1990 hasta 2000 (ambos
inclusive). Calcular:

1. La recta de regresión de Y sobre X.


2. El coeficiente de correlación lineal e interpretarlo.
3. Si en 2001 la renta nacional del país fue de 325 millones de euros. ¿Cuál será la
predicción para las ventas de la compañía en este año?
13 | P á g i n a

EJERCICIO N°3
Los valores de dos variables X e Y se distribuyen según la tabla siguiente:

Se pide:

1 Calcular la covarianza.

2 Obtener e interpretar el coeficiente de correlación lineal.

3 Ecuación de la recta de regresión de Y sobre X.

Convertimos la tabla de doble entrada en una tabla simple.


14 | P á g i n a

EJERCICIO N°4
En una empresa de transportes trabajan cuatro conductores. Los años de antigüedad de
permisos de conducir y el número de infracciones cometidas en el último año por cada
uno de ellos son los siguientes:

Calcular el coeficiente de correlación lineal e interpretarlo.


15 | P á g i n a

EJERCICIO N°5
Una persona rellena semanalmente una quiniela y un boleto de lotería primitiva
anotando el número de aciertos que tiene. Durante las cuatro semanas del mes de
febrero, los aciertos fueron:

Obtener el coeficiente de correlación lineal e interpretarlo. ¿Ofrecerían confianza las


previsiones hechas con las rectas de regresión?
16 | P á g i n a

EJERCICIO N°6
17 | P á g i n a
18 | P á g i n a

BIBLIOGRAFÍA

- Recuperado de: file:///C:/Users/Hello/Pictures/leccion2.8regresion-


correlacion.pdf
- Recuperado de:
http://cmap.upb.edu.co/rid=1236271044945_1568712640_516/leccion2.8regresi
on-correlacion.pdf
- Recuperado de: http://www.virtual.sepi.upiicsa.ipn.mx/mdid/regrcorr.pdf
- (P. Morales, Guatemala, Universidad Rafael Landívar (2011).)

S-ar putea să vă placă și