Documente Academic
Documente Profesional
Documente Cultură
Integrantes:
22.097.260 Arrieche, Yessika
24.143.631 Terán, Yohander
23.833.426 Almao, Betzabeth
24.680.221 Virguez, Grency
Barquisimeto, enero del 2019
Página 1
Índice
Pág.
Introducción……………………………………………………………………………. 3
Anova……………………………………………………………………………………… 4
Problema 1……………………………………………………………………………… 4
Problema 2…………………………………………………………………………….. 10
Regresión……………………………………………………………………………….. 13
Problema 1……………………………………………………………………………… 13
Problema 2……………………………………………………………………………… 23
Página 2
Introducción
En el mundo moderno que vivimos hoy en día muchos problemas presentan
incertidumbre que no sabemos a ciencia exacta que va a ocurrir, muchas empresas
utilizan la estadística como ciencia para predecir en base a cálculos matemáticos
que es lo que mejor les conviene para poder tomar las mejores decisiones y de
esta forma mejorar la calidad del producto o servicio que prestan.
Otro modelo para estudiar este tipo de problemas es la regresión, está nos permite
conocer que tan relacionadas están dos variables y la influencia que puede tener
una sobre la otra para este caso existe la regresión lineal simple que estudia el
comportamiento de una variable independiente y de otra dependiente.
Página 3
Anova
Problema 1.
Tarjeta gráfica
Página 4
Diseño del experimento
Unidad Experimental
Variable de interés
Factor
Tarjetas gráficas. Es un factor de efectos fijos ya que viene decidido que niveles
concretos se van a utilizar.
Objetivo
Página 5
Estimación de los efectos de los tratamientos y contrastes de las hipótesis
𝑯𝟎 𝒗𝒔 𝑯𝟏
I=5.
𝐻1 , Será verdadera si al menos dos de las cincos µ𝑖 son distintas o si las cincos
µ𝑖 difieren de la otra.
Página 6
Análisis.
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 8 244 30,5 18,6914286
Columna 2 8 326 40,75 21,66
Columna 3 8 677,6 84,7 27,5085714
Columna 4 8 474 59,25 25,9457143
Columna 5 8 684 85,5 21,3314286
ANÁLISIS DE
VARIANZA
Origen de las Suma de Grados de Valor crítico
variaciones cuadrados libertad Promedio de los cuadrados F Probabilidad para F
Entre grupos 20012,936 4 5003,234 217,272805 3,455E-24 3,90824093
Dentro de los grupos 805,96 35 23,02742857
Total 20818,896 39
Página 7
𝐹 = 217,272805 > 𝐹(4,35) (0,01) = 3,908 Como el valor 𝐹 > 𝐹𝑘−1,𝑘(𝑛−1) (𝛼),
con un nivel de significancia del 1%, Rechazamos 𝐻0 , y por tanto existe evidencia
estadística para pensar que si hay diferencian entre la rapidez desplazamiento
entre los tiempo, en segundos, necesario para desplazarse en la pantalla, pero solo
podemos decir que hay diferencia de una manera general, sin llegar a saber con
exactitud cuales poblaciones difieren realmente entre sí. En términos de nuestro
problema, al menos dos de la cinco tarjetas grafica afectan la rapidez de
desplazamiento en la pantalla (es decir existe relación entre las variables).Por esta
razón, realizamos una comparación entre grupos.
𝐻0 = 𝜇𝐴 = 𝜇𝐵 vs 𝐻1 = 𝜇𝐴 ≠ 𝜇𝐵
𝐻0 = 𝜇𝐴 = 𝜇𝐶 vs 𝐻1 = 𝜇𝐴 ≠ 𝜇𝐶
𝐻0 = 𝜇𝐴 = 𝜇𝐷 vs 𝐻1 = 𝜇𝐴 ≠ 𝜇𝐷
𝐻0 = 𝜇𝐴 = 𝜇𝐸 vs 𝐻1 = 𝜇𝐴 ≠ 𝜇𝐸
𝐻0 = 𝜇𝐵 = 𝜇𝐶 vs 𝐻1 = 𝜇𝐵 ≠ 𝜇𝐶
𝐻0 = 𝜇𝐵 = 𝜇𝐵 vs 𝐻1 = 𝜇𝐵 ≠ 𝜇𝐵
𝐻0 = 𝜇𝐵 = 𝜇𝐸 vs 𝐻1 = 𝜇𝐵 ≠ 𝜇𝐸
𝐻0 = 𝜇𝐶 = 𝜇𝐵 vs 𝐻1 = 𝜇𝐶 ≠ 𝜇𝐵
𝐻0 = 𝜇𝐶 = 𝜇𝐸 vs 𝐻1 = 𝜇𝐶 ≠ 𝜇𝐸
𝐻0 = 𝜇𝐷 = 𝜇𝐸 vs 𝐻1 = 𝜇𝐷 ≠ 𝜇𝐸
Es decir.
Página 8
𝐻0 , Será verdadera si 𝜇𝑖 son idénticas, es decir las medias de las tarjetas sean
iguales.
𝐻1 , Será verdadera si 𝜇𝑖 son distintas, es decir las medias de las tarjetas sean
distintas.
Con i= A,B,C,D,E.
1 1
̅̅̅
|𝑇 ̅̅̅
𝐴 − 𝑇𝐵 | = 10,2 > (2,7238)√(23,0274286)√ + = 6,53 𝑅𝐻0
8 8
1 1
̅̅̅
|𝑇 ̅̅̅
𝐴 − 𝑇𝐶 | = 54,2 > (2,7238)√(23,0274286)√ + = 6,53 𝑅𝐻0
8 8
1 1
̅̅̅
|𝑇 ̅̅̅
𝐴 − 𝑇𝐷 | = 28,8 > (2,7238)√(23,0274286)√ + = 6,53 𝑅𝐻0
8 8
1 1
̅̅̅
|𝑇 ̅̅̅
𝐴 − 𝑇𝐸 | = 55 > (2,7238)√(23,0274286)√ + = 6,53 𝑅𝐻0
8 8
1 1
̅̅̅
|𝑇 ̅̅̅
𝐵 − 𝑇𝐶 | = 44 > (2,7238)√(23,0274286)√ + = 6,53 𝑅𝐻0
8 8
1 1
̅̅̅
|𝑇 ̅̅̅
𝐵 − 𝑇𝐷 | = 18,6 > (2,7238)√(23,0274286)√ + = 6,53 𝑅𝐻0
8 8
1 1
̅̅̅
|𝑇 ̅̅̅
𝐵 − 𝑇𝐸 | = 44,8 > (2,7238)√(23,0274286)√ + = 6,53 𝑅𝐻0
8 8
Página 9
1 1
̅̅̅
|𝑇 ̅̅̅
𝐶 − 𝑇𝐷 | = 25,4 > (2,7238)√(23,0274286)√ + = 6,53 𝑅𝐻0
8 8
1 1
̅̅̅
|𝑇 ̅̅̅
𝐶 − 𝑇𝐸 | = 0,8 < (2,7238)√(23,0274286)√8 + 8 = 6,53 Tarjeta C y E se
comportan similares.
1 1
̅̅̅
|𝑇 ̅̅̅
𝐷 − 𝑇𝐸 | = 26,2 > (2,7238)√(23,0274286)√ + = 6,53 𝑅𝐻0
8 8
Página 10
Problema 2. La tabla que se presenta al final del enunciado muestra las
mediciones de la elasticidad de cuatro grupos de revestimiento cuando son
expuestos a distintas intensidades de luz. Durante el un periodo de 5 meses. Las
mediciones son tomadas en el último día de los siguientes cinco meses y se
registran en,
Solución:
Unidad experimental
Variable de interés
La elasticidad.
Factor Principal
Tipo de Revestimiento.
Factor Secundario
Página 11
Niveles del factor principal
Objetivo
𝐻0𝐴 = 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 = 𝜇5
𝐻0𝐵 = 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 = 𝜇5
Página 12
Análisis:
𝐹𝐴 = 301,095028 > 𝐹(3,12) (0,01) =5,95 Rechazamos la hipótesis nula con un nivel de
significación del 1%. El factor A (Tipo de revestimiento) aparentemente si influye en la
elasticidad promedio.
𝐹𝐵 = 5,49799524 > 𝐹(4,12) (0,01) =5,41 Rechazamos la hipótesis nula con un nivel de
significación del 1%. El Factor B(tiempo de exposición a la luz) aparentemente si influye
en la elasticidad promedio.
Página 13
Regresión
Problema 1.
Página 14
a. Piensa que un modelo de regresión lineal ajusta satisfactoriamente la
demanda (variable respuesta) en función de la temperatura (variable
explicativa).
b. Separe los datos en dos subgrupos. Uno en el que se incluyan los datos
correspondientes a temperaturas inferiores o iguales a los 60º, y un segundo conjunto
de datos que incluya temperaturas superiores a los 60º. Ajuste un modelo de
regresión lineal para cada grupo por separado. Considera que el considerar dos
modelos de regresión por separado para dicho conjunto de datos resulta idóneo?
Página 15
Solución:
Subgrupo 1.
D 9
8
e
7
m
6
a
5
n 4
d 3
2
1 Series1
0
-1 0 20 40 60 80
Temperatura
Página 16
Con el siguiente Análisis:
Estadísticas de la regresión
Coeficiente de correlación
múltiple 0,94890245
Coeficiente de determinación
R^2 0,90041586
R^2 ajustado 0,89517459
Error típico 0,79606501
Observaciones 21
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crítico de
libertad cuadrados cuadrados F F
Regresión 1 108,868853 108,868853 171,793443 5,7567E-11
Residuos 19 12,0406704 0,63371949
Total 20 120,909524
Página 17
Como estamos hablando de un modelo de relación lineal debemos identificar
cuáles son las variables dependiente e independiente
Es decir Y/X.
Coeficiente de determinación 𝑹𝟐
𝑹𝟐 − Ajustado
Página 18
Análisis de los parámetros estimados.
𝑦 = 𝑎0 + 𝑎1 𝑋1
𝐻0 : a1=0 vs 𝐻1 : a1≠0
Como |T| > 𝑡38 (0,025) se rechaza 𝐻0 ; es decir la variable temperatura está
aportando información significativa al modelo hasta ahora planteado.
𝐻0 : b0 = b1 = 0 vs 𝐻1 : b1≠ 0 o b0≠0
Como se puede observar F> 𝐹1,19 (0,05) y por tanto se rechaza 𝐻0 , es decir
que el modelo planteado hasta ahora es el adecuado.
Subgrupo.2
Página 19
Relación entre Demanda eléctrica y
Temperatuas superiores a los 60.
y = 0,0916x - 5,2913
R² = 0,7991
6
D
e 5
m
a 4 Series1
n
d Linear (Series1)
3
a
2
0
0 20 40 60 80 100 120
Temperatura
Página 20
Análisis:
Estadísticas de la regresión
Coeficiente de correlación
múltiple 0,89394817
Coeficiente de determinación
R^2 0,79914333
R^2 ajustado 0,78732823
Error típico 0,66391098
Observaciones 19
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crítico de
libertad cuadrados cuadrados F F
Regresión 1 29,8130934 29,8130934 67,6374673 2,5002E-07
Residuos 17 7,49322243 0,44077779
Total 18 37,3063158
Página 21
Bondad del ajuste (prueba del modelo).
Ajuste lineal .
Con un valor de 0,89394817 el coeficiente obtenido es alto lo que indica que las
variables están directamente relacionadas mientras la temperatura del día es
superior a los 60 puede que la demanda de electricidad aumente.
Coeficiente de determinación 𝑹𝟐
𝑹𝟐 - ajustado
𝑦 = 𝑎0 + 𝑎1 𝑋1
𝐻0 : a1=0 vs 𝐻1 : a1≠0
Página 22
Análisis del modelo Anova.
𝐻0 : b0 = b1 = 0 vs H1 : b1≠ 0 o b0≠0
Como se puede observar F> 𝐹1,17 (0,05) y por tanto se rechaza 𝐻0 , es decir que el
modelo planteado hasta ahora es el adecuado.
Página 23
Problema 2.
Los tres elementos básicos de un sistema de procesamiento de datos son los archivos,
flujos y procesos. Los archivos son conjuntos de registros permanentes en el sistema; los
flujos, interfaces de datos entre el sistema y su entorno, y los procesos, manipulaciones
lógicas de los datos, definidas funcionalmente. Se emprende una investigación del costo
de desarrollo de software en lo relativo a archivos, flujos y procesos. El estudio revela los
datos siguientes:
Solución:
Para descubrir el costo del desarrollo de software en función de los tres (3) elementos
principales, usaremos regresión lineal múltiple con la modalidad Stepwise hacia
adelante.
El Stepwise hacia adelante nos permite ir paso a paso, introduciendo las variables
independientes en el modelo de regresión lineal, hasta completar el mejor modelo
posible.
Página 24
Sea 𝐹(𝑥) la manera de predecir el costo del desarrollo del software, suponiendo que
𝐹(𝑥) es lineal; nos queda:
𝐹(𝑥) = 𝑎0 + 𝑎1 𝑋1 + ⋯ . . +𝑎𝑖 𝑋𝑗
𝑦 = 𝑎0 + 𝑎1 𝑋1 + ⋯ . . +𝑎𝑖 𝑋𝑗
Página 25
Estudiamos a 𝑿𝟏 = Archivos
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,778546122
Coeficiente de determinación R^2 0,606134064
R^2 ajustado 0,562371182
Error típico 27,94612288
Observaciones 11
ANÁLISIS DE VARIANZA
Promedio de los
Grados de libertad Suma de cuadrados cuadrados F Valor crítico de F
Regresión 1 10816,97704 10816,97704 13,8504148 0,004758732
Residuos 9 7028,872054 780,9857837
Total 10 17845,84909
Página 26
Estudiemos la Bondad del ajuste del modelo.
-Ajuste lineal:
R= 0,778546122.
Esto nos indica que Y y 𝑋1 tienen una buena relación lineal; es decir que posiblemente
mientras más archivos tenga el software el precio de este subirá.
𝑅 2= 0,606134064
Esto nos indica que 𝑋1 : Archivos, tienen un 60% de efecto sobre el precio del software.
𝑅 2-ajustado= 0,562371182.
Esto nos indica que el modelo hasta ahora planteado es aceptable pero se puede
mejorar.
𝑦 = 𝑎0 + 𝑎1 𝑋1
𝐻𝑜 : a1=0 vs 𝐻1 : a1≠0
T= 3,72161453855876. 𝑡9 (0,025)=2,262.
P-valor= 0,00475873.
Como podemos observar P-valor< 0,05 rechazamos 𝐻𝑜 ; es decir que el modelo hasta
ahora planteado es el adecuado.
𝑦 = 4,64398433 + 5,76994964𝑋1
Página 27
Estudiamos a 𝑿𝟐 = Flujos
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,943260856
Coeficiente de determinación R^2 0,889741043
R^2 ajustado 0,862176303
Error típico 15,68305102
Observaciones 11
ANÁLISIS DE VARIANZA
Promedio de los Valor crítico de
Grados de libertad Suma de cuadrados cuadrados F F
Regresión 2 15878,18438 7939,092188 32,2782317 0,000147794
Residuos 8 1967,664714 245,9580893
Total 10 17845,84909
Página 28
Estudiemos la Bondad del ajuste del modelo.
-Ajuste lineal:
R= 0,943260856.
Esto nos indica que Y e 𝑋1 , 𝑋2 tienen una buena relación lineal; es decir que es posible
que mientras más archivos y flujos tenga el software el precio de este subirá.
𝑅 2= 0,889741043.
Esto nos indica que 𝑋1 : Archivos y 𝑋2 : Flujos, tienen un 88% de efecto sobre el precio del
software.
𝑅 2-ajustado= 0,862176303.
Esto nos indica que el modelo hasta ahora planteado ha mejorado considerablemente
en comparación con el anterior.
𝑦 = 𝑎0 + 𝑎1 𝑋1 + 𝑎2 𝑋2
Para 𝑿𝟏
𝐻0 : a1=0 vs 𝐻1 : a1≠0
T=4,06291541. 𝑡9 (0,025)=2,262.
Para 𝑿𝟐
𝐻0 : a2=0 vs 𝐻1 : a2≠0
T=3,81172129. 𝑡9 (0,025)=2,262.
Página 29
De acuerdo a este análisis podemos de decir que tanto los archivos como los flujos son
necesarios para predecir un buen precio del software.
Como podemos observar F>𝐹2,8 (0,05) rechazamos 𝐻0 ; es decir que el modelo hasta
ahora planteado es el adecuado.
Página 30
Estudiamos a a 𝑿𝟑 =Procesos
Resumen
Estadísticas de la regresión
Coeficiente de correlación
múltiple 0,980525552
Coeficiente de determinación
R^2 0,961430359
R^2 ajustado 0,944900512
Error típico 9,916134034
Observaciones 11
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 3 17157,54109 5719,180364 58,1632969 2,58384E-05
Residuos 7 688,3079993 98,32971419
Total 10 17845,84909
Página 31
Estudiemos la Bondad del ajuste del modelo.
-Ajuste lineal:
R= 0,980525552.
Esto nos indica que Y y 𝑋1 , 𝑋2 , 𝑋3 , tienen una buena relación lineal; es decir que es
posible que mientras más archivos, flujos y procesos tenga el software el precio de este
subirá.
𝑅 2= 0,961430359.
Esto nos indica que 𝑋1 : Archivos, 𝑋2 : Flujos y 𝑋3 : Procesos tienen un 96% de efecto
sobre el precio del software.
𝑅 2-ajustado= 0,944900512
Esto nos indica que el modelo hasta ahora planteado ha mejorado considerablemente
en comparación con el anterior que se planteó.
𝑦 = 𝑎0 + 𝑎1 𝑋1 + 𝑎2 𝑋2 + 𝑎3 𝑋3
Para 𝑿𝟏
𝐻0 : a1=0 vs 𝐻1 : a1≠0
T=0,06330973. 𝑡9 (0,025)=2,262.
Entonces como T<𝑡9 (0,025) aceptamos 𝐻0 ; es decir que 𝑋1 para este modelo no está
aportado información significativa
Para 𝑿𝟐
Página 32
𝐻0 : a2=0 vs 𝐻1 : a2≠0
T=2,39670869. 𝑡9 (0,025)=2,262.
Para 𝑿𝟑
𝐻0 : a3=0 vs 𝐻1 : a3≠0
T=4,08605987. 𝑡9 (0,025)=2,262.
De acuerdo a este análisis podemos de decir que para este modelo se tendrá que
descartar a 𝑋1 .
Como podemos observar F>𝐹2 , 8(0,05) rechazamos 𝐻0 ; es decir que el modelo hasta
ahora planteado es el adecuado.
Página 33