Documente Academic
Documente Profesional
Documente Cultură
INDICE
2
COMETENCIA ESPECÍFICA A DESARROLLAR
Aplica, desarrolla y analiza las técnicas de regresión lineal simple para
hacer predicciones de sucesos futuros en el ramo empresarial.
3
INTRODUCCIÓN
Y = α + βx,
4
INVESTIGACION CONCEPTUAL
I. La regresión lineal simple
Antecedentes
5
patrones hereditarios en la estatura de las personas adultas. Descubrio que os
niños que tienen padres padres altos o bajos tendian a “regresar” a la estatura
promedio de la población adulta. Con ese modesto inicio el uso del análisis de
regresión se dio a conocer convirtiéndose en una de las herramientas estadísticas
más poderosas que se encuentran disponibles actualmente.
Es lineal por que la relación puede identificarse mediante una línea recta que se
dibuje entre los puntos. La figura 11.1 (b) muestra una relación lineal y negativa
entre X y Y porque las dos variables parecen moverse en direcciones opuestas.
Las figuras 11.1 (c) y 11.1 (d) indican relaciones curvilineales. El patrón de los
6
puntos de dispersión no se describe bien con la línea recta, pero se define de
manera más exacta con la curva que proporciona un mejor ajuste. Finalmente, es
difícil observar toda relación entre X y Y en la figura 11.1 (c). La ausencia de todo
patrón detectable sugiere que no existe ninguna relación entre X y Y.
Mediciones univariables
Mediciones bivariables
Los métodos de análisis bivariable se utilizan para estudiar las relaciones que hay
entre variables tomadas de dos en dos.
Mediciones multivariables
7
sea posible. Sin embargo, como estas diferencias son positivas
para algunas observaciones y negativas para otras, en términos
matemáticos se minimiza la suma de los cuadrados de las
diferencias.
III. El diagrama de dispersión
8
En la gráfica A se observa que los valores de Y, en general, aumentan en
forma lineal cuando se incrementa X.
En la gráfica B es un ejemplo de una relación lineal negativa. Cuando crece
X, se observa que los valores de Y decrecen. Un ejemplo de este tipo de
relación puede ser el precio de un producto específico y la cantidad de
ventas.
En la gráfica C se muestra un conjunto de datos en el que existe muy poca
o ninguna relación entre X y Y. Para cada valor de X aparecen valores
altos y bajos de Y.
En la gráfica D muestran una relación curvilínea entre X y Y. Los valores de
Y aumentan cuando crece, pero el incremento disminuye para valores altos
de X . un ejemplo de esta relación curvilínea puede ser la edad y el costo
de mantenimiento de una máquina. Cuando la máquina tiene muchos años,
el costo de mantenimiento se eleva con rapidez al principio, pero después
de cierto número de años se nivela.
En la grafica E muestra una relación parabólica o en forma de U entre X y
Y. Conforme X aumenta, al principio Y disminuye; pero si X aumenta más,
Y no sólo deja de disminuir sino que aumenta después de su valor mínimo.
Un ejemplo tipo de relación puede ser el número de errores por hora en una
tarea y número de horas trabajadas.
Por ultimo en la gráfica F indica una relación exponencial o curvilínea
negativa entre X y Y. en este caso, Y disminuye con rapidez al principio del
9
incremento de X pero después, cuando X aumenta más, la velocidad de
disminución es mucho menor. Un ejemplo de esta relación exponencial
puede ser el valor de reventa de un tipo dado de automóvil y los años que
tiene. El primer año el valor baja en forma drástica respeto a su precio
original; sin embargo, la disminución es mucho más lenta en los años
subsecuentes.
ÇÇÇ
10
-
11
Donde
12
Es decir, deberemos evaluar esas distancias verticales a la recta, es decir, los
errores o residuales.
13
Ahora, ya es fácil obtener una media que nos indique el porcentaje de variaciones
controladas o explicadas mediante el modelo, que se conoce como Coeficiente de
Determinación, que denotaremos con R2. Su expresión en tantos por 1, será:
Como puede observarse, a partir de la expresión anterior: 0< R² <1. Por tanto:
Si R²=1, entonces no hay residuos, habrá una dependencia funcional. Cuanto más
se acerque dicho valor a la unidad, mayor poder explicativo tendrá el modelo de
regresión.
14
En donde n-k-1 es el número de grados de libertad y k es el número de variables a
la derecha. El numerador bajo el radical de la formula (12.4) es la suma de los
errores elevada al cuadrado y se minimizará de acuerdo con el concepto de
mínimo cuadrados ordinarios. La pantalla 12.2 muestra una impresión en Minitab
de los valores reales para los pasajeros (Y1), el valor proyectado para los
pasajeros (𝑌̂), y el error (Y- 𝑌̂), y el error al cuadrado (Y- 𝑌̂)2. La suma de esta
última columna es la suma de los errores al cuadrado y se tiene que es 8.1016. El
error estándar entonces será:
15
tenga una distribución t con n − 2 grados de libertad . El
estadístico T se usa para construir un intervalo de confianza de (1
− α) 100% para el coeficiente β.
16
Ha ∶ 𝛽 1≠ 0
Si se rechaza H0, se concluirá que b1 0 y que entre las dos variables existe una
relación estadísticamente significante. La base para esta prueba de hipótesis la
proporcionan las propiedades de la distribución muestral de b1, el estimador de
𝛽1, obtenido mediante el método de mínimos cuadrados.
Primero, considérese que es lo que ocurriría si para el mismo estudio de regresión
se usara otra muestra aleatoria simple. Supóngase, por ejemplo, que Armand’s
Pizza Parlors usa una muestra de las ventas de otros 10 restaurantes. El análisis
de regresión de esta otra muestra dará como resultado una ecuación de regresión
parecida a la ecuación de regresión anterior 𝑌̂ = 60 + 5x. Sin embargo, no puede
esperarse que se obtenga exactamente la misma ecuación (una ecuación en la
que la intersección con el eje y sea exactamente 60 y la pendiente sea
exactamente 5). Los estimadores b0 y b1, obtenidos por el método de mínimos
cuadrados, son estadísticos muestrales que tienen su propia distribución muestral.
A continuación se presentan las propiedades de la distribución muestral de b1.
17
- I. de C. para y pendiente y ordenada del
modelo)
- Para el intervalo de confianza de la pendiente β 1 se utiliza la
distribución t de student con n-2 grados de libertad ya que se
desconoce la varianza de la población 𝜎2𝛽 ; el estimador de
esta varianza se define por:
-
- Por lo tanto el estadístico de prueba se define como:
-
- En el intervalo de confianza de nivel 1-α estab dado por :
-
- Una prueba muy sensilla y util es la prueba de independencia
entre variables. Si la hipotesis nula H0: B1=0 es aceptada, Y
18
no depende linealmente de X, en caso contrario, se dice que
Y depende de X.
Al calcular los límites de confianza para los valores de medios, estos se obtiene
para cada valor de Xo; tales limites serán más estrechos a medida que se
aproximan a la medida de la variable independiente y más amplios a medida que
se alejan de ella, por esta razón se obtienen limites llamados bandas de confianza
dentro de las cuales queda comprendida la recta verdadera para un nivel de
significación a.
20
en la figura 17.8(a) se presenta una situación en la que existe una significativa
relación lineal simple entre X y Y. sin embargo, parece mas apropiado tener un
modelo curvilíneo entre las dos variables. Este efecto se resalta en la figura 17.8
(b), que es la grafica residual de ei contra Xi. aquí se tiene un efecto curvilíneo
obvio entre Xi y ei. al graficar los residuos hemos dejado fuera o eliminado la
tendencia lineal de X con Y, exponiendo, en consecuencia, la falta de ajuste en el
modelo lineal simple. Así pues, de (a) y (b) podemos llegar a concluir que el
modelo curvilíneo puede ser un mejor ajuste y deberia evaluarse en lugar del
modelo lineal simple.
1 (𝑋𝑖 −𝑋̅)2
En la que ℎ𝑖 = 𝑛 + ∑𝑛 2 ̅2
𝑖=1 𝑋1 −𝑛𝑋
21
- Análisis residual (gráfico y numérico)
donde
22
entre X y Y. a medida que X no se da ningún cambio en Y, de modo que
no hay ninguna asociación entre los valores de X y los de Y. por el
contrario, en el panel C se presenta una correlación perfectamente
positiva entre las dos variables. En este caso, Y aumenta de una
manera perfectamente predecible conforme se incrementa X.
Para problemas orientados a la regresión, el coeficiente de correlación
de muestra (r) puede obtenerse de la siguiente manera:
De modo que
XVIII. 𝑟 = √𝑟 2
∑𝑛 ̅ ̅
𝑖=1(𝑋1 −𝑋 )(𝑌1 −𝑌)
XIX. 𝑟=
√∑𝑛 ̅ 2 √∑𝑛
𝑖=1(𝑋1 −𝑋)
̅ 2
𝑖=1(𝑌1 −𝑌)
23
∑𝑛 ̅̅
𝑖=1 𝑋1 𝑌1 −𝑛𝑋𝑌
XX. 𝑟=
√∑𝑛 2 ̅2 𝑛 2 ̅2
𝑖=1 𝑋1 −𝑛𝑋 √∑𝑖=1 𝑌1 −𝑛𝑌
se encuentra que la ecuación (12) puede expresarse, sin hacer caso del
signo, como
24
En el caso de la correlación lineal, la cantidad r es la misma, ya sea que
se considere a X o a Y como la variable independiente. Por lo tanto r es
una muy buena medida de la correlación lineal entre dos variables.
25
BIBLIOGRAFÍA.
file:///G:/BOCOS%205to%20SEM/4%20Libros%20de%20
Dise%C3%B1o%20de%20experimentos%20(MG-
5)/Estadistica%20para%20admin.%20y%20economia%20
-%20Anderson%2010%20th.pdf
file:///G:/BOCOS%205to%20SEM/4%20Libros%20de%20
Dise%C3%B1o%20de%20experimentos%20(MG-
5)/ESTADISTICA%20INFERENCIAL%20II%20-
%20LIBRO%20DEL%20CURSO%20Ing.%20Ind..pdf
file:///G:/BOCOS%205to%20SEM/4%20Libros%20de%20
Dise%C3%B1o%20de%20experimentos%20(MG-
5)/Probabilidad%20y%20Estadistica%20para%20ing.%20
-%20Walpole%208%C2%AA%20ed.pdf
VIDEOS
https://youtu.be/z2Ev6JmMrA (Regresión lineal simple)
https://youtu.be/p747mbpgB8U (Introducción 1-
Regresión lineal simpe y multiple)
26