Sunteți pe pagina 1din 13

Algoritmo de regresin lineal de Microsoft

Inteligencia de Negocios

Integrantes:
Juan Manuel Chupilln Gerson Pila Challco Vctor Condorena Rondn Nelson Alarcn Rodrguez

Agenda
Algoritmo de regresin lineal de Microsoft Anlisis de regresin lineal Ejemplo de regresin lineal Como funciona el algoritmo Requisitos para los modelos de regresin lineal Conclusin

Algoritmo de regresin lineal de Microsoft


Ayuda a calcular una relacin lineal

Tiempo

Rendimiento

Variable Independiente

Variable Dependiente

Algoritmo de regresin lineal de Microsoft


La relacin toma la forma de una ecuacin para la lnea que mejor represente una serie de datos

Lnea de Regresin

Cada punto de datos del diagrama tiene un error asociado con su distancia con respecto a la lnea de regresin

Anlisis de regresin Lineal


Es una tcnica estadstica utilizada para estudiar la relacin entre variables. Puede utilizarse para explotar y cuantificar la relacin entre una variable independiente (x) y otra dependiente (y), as como para desarrollar una ecuacin lineal con fines predictivos. En el contexto de la investigacin de mercados puede utilizarse para determinar en cual de diferentes medios de comunicacin puede resultar ms eficaz invertir, o para predecir el nmero de ventas de un determinado producto.

Ejemplo de regresin Lineal


En un proceso de extraccin se estudia la relacin entre tiempo de extraccin y rendimiento. Los datos obtenidos se encuentran en la siguiente tabla:
Tiempo (min) 10 15 20 8 12 13 15 12 14 20 19 18 Rendimiento (%) 64 81.7 76.2 68.5 66.6 77.9 82.2 74.2 70 76 83.2 85.3

a)

En este problema cual variable se considera independiente y cual independiente? Se debe considerar el tiempo de extraccin como variable independiente (x) y al rendimiento como la variable dependiente (y), dado que el rendimiento siempre va a variar conforme el tiempo y no viceversa.

b) Mediante un diagrama de dispersin analice la relacin entre estas dos variables. Qu tipo de relacin observa y cuales son algunos hechos especiales?

c) Haga un anlisis de regresin (ajuste una lnea recta a estos datos, aplique pruebas de hiptesis y verifique residuos)

Para ajustar la mejor recta que pasa ms cerca de todos los puntos y para calcular estimadores, se usa mtodo de mnimos cuadrados
Y estimado X Tiempo (min) 10 15 20 8 12 13 15 12 14 20 19 18 Suma 176 y Rendimiento (%) 64 81.7 76.2 68.5 66.6 77.9 82.2 74.2 70 76 83.2 85.3 905.8 100 225 400 64 144 169 225 144 196 400 361 324 2752 4096 6674.89 5806.44 4692.25 4435.56 6068.41 6756.84 5505.64 4900 5776 6922.24 7276.09 68910.36 640 1225.5 1524 548 799.2 1012.7 1233 890.4 980 1520 1580.8 1535.4 13489 69.93 75.88 81.83 67.55 72.31 73.5 75.88 72.31 74.69 81.83 80.64 79.45 -5.93 5.82 -5.63 0.95 -5.71 4.4 6.32 1.89 -4.69 -5.83 2.56 5.85 35.1649 33.8724 31.6969 0.9025 32.6041 19.36 39.9424 3.5721 21.9961 33.9889 6.5536 34.2225 293.8764 X2 Y2 Xy e E2

Para ajustar la recta se calcula

Para encontrar los estimadores:

Por lo tanto, la lnea recta ajustada est dada por:

Con esta ecuacin podemos graficar la recta de regresin lineal:

Cmo funciona el algoritmo

Es una variacin del algoritmo de rboles de decisin de Microsoft.


En un modelo de regresin lineal, el conjunto de datos se utiliza para calcular las relaciones en el paso inicial, mientras que en un modelo de rboles de decisin estndar los datos se dividen repetidamente en rboles o subconjuntos ms pequeos. Se invoca un caso especial del algoritmo de rboles de decisin de Microsoft, con parmetros que restringen el comportamiento del algoritmo y requieren ciertos tipos de datos de entrada.

Requisitos para los modelos de regresin lineal


Cada modelo debe contener una columna numrica

Una nica columna key

Una columna de prediccin

Se requiere al menos una columna de prediccin

Columnas de entrada

Deben contener datos numricos continuos y se les debe asignar el tipo de datos adecuado

Conclusin
Con este algoritmo no tiene que seleccionar un mtodo de clculo, como por ejemplo para resolver los mnimos cuadrados. La regresin lineal podra simplificar en exceso las relaciones en escenarios en los que varios factores afectan al resultado.

S-ar putea să vă placă și