Documente Academic
Documente Profesional
Documente Cultură
ASIGNATURA: ESTADÍSTICA II
PROFESOR: HERNAN RIVAS
INTRODUCCIÓN
El programa “Statgraphics Plus 5.1 para Windows” es una herramienta con la que será posible
estudiar y analizar al máximo todo lo que se relacione con las estadísticas. Este programa contiene un
conjunto de herramientas que permiten crear diferentes datos variables, los cuales luego se podrán analizar
bajo varios métodos de trabajo y seleccionar cual de todos es el mejor para poder trabajarlos y por ultimo
agregarle gráficos específicos a cada campo, si se desea. Statgraphics Plus trabaja de una manera muy
sencilla, pero a la vez profesional.
Para poder hacer un correcto uso del mismo, solo será necesario un poco de práctica y perseverancia.
Por último, cada uno de los resultados obtenidos, podrán ser impresos, con el fin de poder adaptarse a
proyectos y trabajos reales.
En la siguiente práctica se asumirá que la variable X tiene una distribución Normal con media de
500 y desviación estándar igual a 10, N (500, 102). Se pide realizar los siguientes procedimientos:
a) Generar k = 200 muestras aleatorias de tamaño n = 25. Obtenga la media, varianza, desviación estándar
y la mediana para cada muestra y guárdelas en un vector.
b) Construir el histograma y la gráfica de cajas de y bigotes para el ventor de medias muéstrales. Obtenga
la media y la varianza para este vector. Estime el error cuadrático medio de la media de la muestra.
d) Construir los k = 200 intervalos de confianza del 95% para µ = 500. ¿Cuántos de estos intervalos cubren
a µ? Desarrollar este numeral asumiendo primero que σ2 es conocido y después que no lo es.
e) Para el vector de varianzas muestrales calcule su media y su varianza. Estime el error cuadrático medio
n
para el vector de varianzas muéstrales. Realice el mismo ejercicio para S*2 = ∑ ( X i − X )2 / n . Compare los
i =1
errores cuadráticos medios estimados de estos dos estimadores de la varianza poblacional
Observación: Generar 200 muestras de tamaño 25, es equivalente a generar una sola muestra de tamaño
5000. Las primeras 25 observaciones son la primera muestra, las siguientes 25 son la
segunda muestra y así sucesivamente hasta que las últimas 25 observaciones son la muestra
número 200.
ALGUNAS GENERALIDADES
Figura 1
StatAdvisor interpreta una tabla de Análisis de la Varianza y aconseja sobre posteriores análisis.
Podemos acceder a esta herramienta desde los iconos correspondientes en la Barra de Herramientas o
en la de Tareas. Veremos así la interpretación correspondiente al último análisis realizado. Si queremos
guardar la información generada para cada análisis junto con el resultado de los mismos activaremos la
opción VER…STATADVISOR de la barra de menú.
Explicaremos ahora brevemente el uso de StatGallery. Cuando se haya generado un archivo de datos
y ejecutado un análisis estadístico sobre él (ya veremos cómo realizar estas operaciones en capítulos
posteriores), el sistema generará una ventana con los resultados de dicho análisis. Esa ventana estará
dividida en paneles que contendrán resultados gráficos y textuales según las opciones que hayamos decidido
aplicar.
Pulsando el botón derecho del ratón en uno de estos paneles aparecerá un menú emergente en el que
seleccionaremos la opción Copiar Ventana a Galería. Posteriormente abrimos la ventana de StatGallery y
pulsamos el mismo botón en el panel en el que queremos cargar la información. Elegimos esta vez la opción
Pegar y la copia queda realizada. Si elegimos la opción Pegar link se lleva a cabo una copia dinámica o
vínculo, de manera que si realizamos cualquier modificación sobre el panel original en la ventana de análisis
correspondiente, dicha modificación se cargará automáticamente en StatGallery sin tener que repetir el
proceso de copia.
La configuración de paneles dentro de una página de StatGallery puede personalizarse sencillamente
desplazando con el ratón las barras horizontales y verticales que los delimitan. En la Figura anterior
podemos ver un ejemplo de una página personalizada cargada con distinta información gráfica y textual.
PROCEDIMIENTOS DE LA PRÁCTICA
a) Generar k = 200 muestras aleatorias de tamaño n = 25. Obtenga la media, varianza, desviación estándar
y la mediana para cada muestra y guárdelas en un vector.
Para generar datos aleatorios procedemos de la siguiente manera, el la línea principal de comandos
seleccionamos Describe o PLOT → PROBABILITY DISTRIBUTION y a continuación seleccionamos la
distribución normal y OK.
Línea
principal de
comandos
Ventana de
edición
Comandos
Submenú del directos
comando PLOT
Después de lo anterior aparece la ventana
Guardar resultados
Comandos
directos para
distribuciones
de probabilidad
A continuación por TABULAR OPTIONS (icono amarillo del menú propio de PROBABILITY
DISTRIBUTIONS) seleccionamos la opción RAMDON NUMBERS. Después de lo anterior se obtiene la
ventana siguiente:
Ventana RANDOM NUMBERS:
Permite generar números
aleatorios para varias
distribuciones de probabilidad
Entonces, nos ubicamos en la ventana números aleatorios y con clic derecho seleccionamos la opción PANE
OPTIONS y modificamos el tamaño muestral por 5000 en nuestro caso y OK. Esto es,
Después de la instrucción anterior se han generado 5000 números aleatorios de una normal con media 500 y
desviación estándar 10. Para salvar estos resultados procedemos así, en el icono SAVE RESULTS
indicamos guardar los números aleatorios y especificamos el nombre de la variable, X en nuestro caso, y
OK y cerramos la ventana de PROBABILITY DISTRIBUTIONS; después de lo anterior aparece una
columna llamada X con 5000 datos en la ventana de edición.
Cerrar la ventana de
PROBABILITY
DISTRIBUTIONS
OK
Observación: Antes de cerrar la ventana de PROBABILITY DISTRIBUTONS podemos generar la muestra
aleatoria de la distribución UNIFORME [0, θ = 400]. Para ello procedemos así:
Muestra de
la uniforme
Muestra de la
normal
Para continuar el proceso generemos unas variables de códigos para identifica las 200 muestras de tamaño
25 de la normal y las 300 muestras de tamaño 30 de la uniforme continua; esto lo hacemos de la siguiente
manera:
• En la ventana de edición seleccionamos la tercera columna (Col_3) con clic izquierdo sobre Col_3.
• A continuación con clic derecho se activan las opciones sobre la columna, seleccionamos la opción
MODIFY COLUMN para cambiar el nombre de la columna. Esta columna la llamaremos Cod1.
• Entonces, nuevamente sobre la tercera columna (Cod1) con clic derecho seleccionamos la opción
GENERATE DATA y se obtiene la ventana
• A continuación, generamos los códigos para identificar las 200 muestras de tamaño 25 de la normal
utilizando los operadores Rep(?;?) y Count(?;?;?). Esto lo hacemos así, en la línea para expresiones
de la ventana anterior escribimos Rep(Count(1;k;1);n) y de esta forma se genera una columna que
contiene 25 veces uno, 25 veces dos, y así sucesivamente hasta 25 veces 200.
• Para generar los códigos para identificar las 300 muestras de la uniforme, procedemos de la misma
forma y creamos la variable Cod2 en la columna Col_4.
Nota: Rep(Count(1;200;1);25)
Rep(Count(1;300;1);30)
Después de lo anterior se obtiene la ventana siguiente
Observe que en Cod1 hay 25 veces uno, luego sigue el dos y así sucesivamente. Además, en Cod2 hay 30
veces uno, luego le sigue el dos y así sucesivamente hasta que aparece 30 veces trescientos.
Ahora, para obtener los vectores de medias, varianzas, desviaciones estándar y medianas para cada una de
las 200 muestras aleatorias de la normal procedemos como sigue:
• A continuación indicamos que los datos están en la columna X y los códigos están la columna Cod1.
Esto es,
• Después de lo anterior indicamos OK y se obtiene la siguiente salida
Nombre de la
ventana
• Entonces nos ubicamos en la ventana Summary Statistics y con clic derecho en Panel OPTIONS
seleccionamos los estadísticos deseados como se observa a continuación:
Guardar resultados
• Finalmente, guardamos los resultados usando el icono SAVE RESULTS e indicamos los estadísticos
a guardar y el nombre de cada columna e indicamos OK. LO anterior se muestra a continuación:
• Para finalizar cerramos la ventana SUBSET ANÁLISIS y en la ventana de edición aparecen las
columnas que contienen los 200 valores de los estadísticos requeridos como se observa a
continuación,
b) Construir el histograma y la gráfica de cajas y bigotes para el ventor de medias de las muestras.
Obtenga la media y la varianza para este vector. Estime el error cuadrático medio de la media de la
muestra.
Solución:
• Por el comando DESCRIBE del menú principal seleccionamos NUMERIC DATA y a continuación
la opción ONE-VARIABLE-ANALYSIS como se observa a continuación. Luego, indicamos que
los datos para el análisis están en la variable MediaX.
Finalmente, para estimar el error cuadrático medio para la media de la muestra generamos la columna
ECM1 con la instrucción ( mediaX − 500 ) ; esto es,
2
c) Repetir el numeral anterior para el vector de medianas.
Solución: Se procede igual que en el numeral (b) anterior pero usando los datos que están en la columna
MedianasX.
d) Construir los k = 200 intervalos de confianza del 95% para µ = 500. ¿Cuántos de estos intervalos cubren
a µ?. Desarrollar este numeral asumiendo primero que σ 2 es conocido y después que no lo es.
Solución: Sabemos que el intervalo de confianza para la media de una población normal con varianza
σ σ
conocida es x − zα 2 × < µ < x + zα 2 ×
. Por lo tanto, para construir los intervalos generamos dos
n n
1.96*10 1.96*10
columnas que llamaremos LI1 = mediaX - , y LS1 = mediaX + , como se observa a
25 25
continuación
Después de lo anterior aparecen las columnas LI1 y LS1 en la ventana de edición. Para contar cuantos de
estos intervalos contienen a la media poblacional, generamos una nueva columna que llamaremos
CONTAR1 con la siguiente instrucción: (LI1<500)&(LS1>500). De esta forma, se obtiene una variable
cuyo valor es 1 cuando la condición se cumple y toma el valor de cero en otro caso. Lo anterior lo hacemos
así:
s s
Ahora, cuando la varianza poblacional es desconocida el intervalo es < µ < x + tα 2, n −1
x − tα 2,n −1 .
n n
Entonces, para obtener los 200 intervalos generamos dos variables que llamaremos LI2 y LS2 de la
INVSTUDENT(0.975;24)*SX
siguiente forma: LI2 = mediaX - y
25
INVSTUDENT(0.975;24)*SX
LS2 = mediaX + . Para determinar cuantos de estos intervalos cubren a la
25
media poblacional, procedemos de la misma forma que en le caso de varianza conocida.
e) Para el vector de varianzas de las muestras calcule su media y su varianza. Estime el error cuadrático
n
medio para el vector de varianzas de las muestras. Realice el mismo ejercicio para S*2 = ∑ ( X i − X )2 / n .
i =1
Compare los errores cuadráticos medios estimados de estos dos estimadores de la varianza poblacional
• Para encontrar la media y la varianza del vector de varianzas de las muestras ingresamos por el
comando DESCRIBE, luego la opción NUMERIC DATA y a continuación ONE-VARIABLE
ANÁLISIS e indicando que los datos están en la variable S 2 .
• Nos ubicamos en resúmenes estadísticos para S X 2 , damos clic derecho y en opciones de ventanas
marcamos los cuadros de la media y la varianza y aceptar (OK).
• Vamos a opciones graficas y seleccionamos los gráficos que deseamos realizar; aceptar.
• Para hallar el ECM_ S X 2 , activamos la columna, le damos clic derecho, Generar Datos
( )
2
ECM_ S X 2 = S X 2 − 100 , aceptar.
• Para hallar el ECM_ S X 2 , activamos la columna, le damos clic derecho, Generar Datos
ECM_ S X 2 =
( n − 1) S X 2 , aceptar.
n