Sunteți pe pagina 1din 14

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA

PROYECTO DE CARRERA DE INGENIERÍA EN INFORMÁTICA

ASIGNATURA: ESTADÍSTICA II
PROFESOR: HERNAN RIVAS

PRÁCTICA 4: Trabajando con STATGRAPHIS

INTRODUCCIÓN

El programa “Statgraphics Plus 5.1 para Windows” es una herramienta con la que será posible
estudiar y analizar al máximo todo lo que se relacione con las estadísticas. Este programa contiene un
conjunto de herramientas que permiten crear diferentes datos variables, los cuales luego se podrán analizar
bajo varios métodos de trabajo y seleccionar cual de todos es el mejor para poder trabajarlos y por ultimo
agregarle gráficos específicos a cada campo, si se desea. Statgraphics Plus trabaja de una manera muy
sencilla, pero a la vez profesional.

Para poder hacer un correcto uso del mismo, solo será necesario un poco de práctica y perseverancia.
Por último, cada uno de los resultados obtenidos, podrán ser impresos, con el fin de poder adaptarse a
proyectos y trabajos reales.

En la siguiente práctica se asumirá que la variable X tiene una distribución Normal con media de
500 y desviación estándar igual a 10, N (500, 102). Se pide realizar los siguientes procedimientos:

a) Generar k = 200 muestras aleatorias de tamaño n = 25. Obtenga la media, varianza, desviación estándar
y la mediana para cada muestra y guárdelas en un vector.

b) Construir el histograma y la gráfica de cajas de y bigotes para el ventor de medias muéstrales. Obtenga
la media y la varianza para este vector. Estime el error cuadrático medio de la media de la muestra.

c) Repetir el numeral anterior para el vector de medianas.

d) Construir los k = 200 intervalos de confianza del 95% para µ = 500. ¿Cuántos de estos intervalos cubren
a µ? Desarrollar este numeral asumiendo primero que σ2 es conocido y después que no lo es.

e) Para el vector de varianzas muestrales calcule su media y su varianza. Estime el error cuadrático medio
n
para el vector de varianzas muéstrales. Realice el mismo ejercicio para S*2 = ∑ ( X i − X )2 / n . Compare los
i =1
errores cuadráticos medios estimados de estos dos estimadores de la varianza poblacional

Observación: Generar 200 muestras de tamaño 25, es equivalente a generar una sola muestra de tamaño
5000. Las primeras 25 observaciones son la primera muestra, las siguientes 25 son la
segunda muestra y así sucesivamente hasta que las últimas 25 observaciones son la muestra
número 200.
ALGUNAS GENERALIDADES

El Asesor Estadístico (StatAdvisor)

Es una herramienta incorporada en STATGRAPHICS que produce de manera automática una


interpretación corta y fácilmente comprensible de los resultados de los análisis estadísticos realizados.

Figura 1

StatAdvisor interpreta una tabla de Análisis de la Varianza y aconseja sobre posteriores análisis.

Podemos acceder a esta herramienta desde los iconos correspondientes en la Barra de Herramientas o
en la de Tareas. Veremos así la interpretación correspondiente al último análisis realizado. Si queremos
guardar la información generada para cada análisis junto con el resultado de los mismos activaremos la
opción VER…STATADVISOR de la barra de menú.

La Galería de Resultados (StatGallery)


Esta herramienta permite el almacenamiento de los resultados de uno o varios análisis estadísticos,
generando así una presentación organizada y personalizada de los mismos. La ventana de StatGallery se
compone de páginas cada una de las cuales contiene 9 paneles organizados con estructura matricial (3x3).
En ellas se pueden almacenar hasta 100 salidas gráficas y un número ilimitado de salidas de texto
provenientes de los análisis ejecutados.

Explicaremos ahora brevemente el uso de StatGallery. Cuando se haya generado un archivo de datos
y ejecutado un análisis estadístico sobre él (ya veremos cómo realizar estas operaciones en capítulos
posteriores), el sistema generará una ventana con los resultados de dicho análisis. Esa ventana estará
dividida en paneles que contendrán resultados gráficos y textuales según las opciones que hayamos decidido
aplicar.

Pulsando el botón derecho del ratón en uno de estos paneles aparecerá un menú emergente en el que
seleccionaremos la opción Copiar Ventana a Galería. Posteriormente abrimos la ventana de StatGallery y
pulsamos el mismo botón en el panel en el que queremos cargar la información. Elegimos esta vez la opción
Pegar y la copia queda realizada. Si elegimos la opción Pegar link se lleva a cabo una copia dinámica o
vínculo, de manera que si realizamos cualquier modificación sobre el panel original en la ventana de análisis
correspondiente, dicha modificación se cargará automáticamente en StatGallery sin tener que repetir el
proceso de copia.
La configuración de paneles dentro de una página de StatGallery puede personalizarse sencillamente
desplazando con el ratón las barras horizontales y verticales que los delimitan. En la Figura anterior
podemos ver un ejemplo de una página personalizada cargada con distinta información gráfica y textual.

PROCEDIMIENTOS DE LA PRÁCTICA
a) Generar k = 200 muestras aleatorias de tamaño n = 25. Obtenga la media, varianza, desviación estándar
y la mediana para cada muestra y guárdelas en un vector.

Para generar datos aleatorios procedemos de la siguiente manera, el la línea principal de comandos
seleccionamos Describe o PLOT → PROBABILITY DISTRIBUTION y a continuación seleccionamos la
distribución normal y OK.

Línea
principal de
comandos

Ventana de
edición

Comandos
Submenú del directos
comando PLOT
Después de lo anterior aparece la ventana

Guardar resultados

Comandos
directos para
distribuciones
de probabilidad

Caja de Opciones Opciones


dialogo Tabulares gráficas

Luego en la ventana de PROBABILITY DISTRIBUTIONS clic derecho y ANALYSIS OPTIONS para


cambiar la media por 500 y la desviación estándar por 10 y obtenemos

A continuación por TABULAR OPTIONS (icono amarillo del menú propio de PROBABILITY
DISTRIBUTIONS) seleccionamos la opción RAMDON NUMBERS. Después de lo anterior se obtiene la
ventana siguiente:
Ventana RANDOM NUMBERS:
Permite generar números
aleatorios para varias
distribuciones de probabilidad

Entonces, nos ubicamos en la ventana números aleatorios y con clic derecho seleccionamos la opción PANE
OPTIONS y modificamos el tamaño muestral por 5000 en nuestro caso y OK. Esto es,

Guardar resultados de los


5000 números aleatorios.

Después de la instrucción anterior se han generado 5000 números aleatorios de una normal con media 500 y
desviación estándar 10. Para salvar estos resultados procedemos así, en el icono SAVE RESULTS
indicamos guardar los números aleatorios y especificamos el nombre de la variable, X en nuestro caso, y
OK y cerramos la ventana de PROBABILITY DISTRIBUTIONS; después de lo anterior aparece una
columna llamada X con 5000 datos en la ventana de edición.

Cerrar la ventana de
PROBABILITY
DISTRIBUTIONS

OK
Observación: Antes de cerrar la ventana de PROBABILITY DISTRIBUTONS podemos generar la muestra
aleatoria de la distribución UNIFORME [0, θ = 400]. Para ello procedemos así:

• En la CAJA DE DIALOGO (icono rojo) de los comandos para PROBABILITY DISTRIBUTONS


con clic izquierdo cambiamos la distribución normal por la uniforme.
• Luego en la ventana de PROBABILITY DISTRIBUTIONS clic derecho y ANÁLISIS OPTIONS
para cambiar el límite superior por 400 y el limite inferior por cero.
• A continuación en la ventana RAMDON NUMBERS con clic derecho y PANE OPTIONS
cambiamos el tamaño de la muestra por 9000 para generar las 300 muestras de tamaño n = 30.

Después de lo anterior, la ventana de edición queda como

Muestra de
la uniforme

Muestra de la
normal

Para continuar el proceso generemos unas variables de códigos para identifica las 200 muestras de tamaño
25 de la normal y las 300 muestras de tamaño 30 de la uniforme continua; esto lo hacemos de la siguiente
manera:

• En la ventana de edición seleccionamos la tercera columna (Col_3) con clic izquierdo sobre Col_3.

• A continuación con clic derecho se activan las opciones sobre la columna, seleccionamos la opción
MODIFY COLUMN para cambiar el nombre de la columna. Esta columna la llamaremos Cod1.

Después de lo anterior se obtiene la siguiente ventana


Opciones sobre la
columna.

• Entonces, nuevamente sobre la tercera columna (Cod1) con clic derecho seleccionamos la opción
GENERATE DATA y se obtiene la ventana

Operadores para generar datos en la Algunas funciones


ventana de edición

• A continuación, generamos los códigos para identificar las 200 muestras de tamaño 25 de la normal
utilizando los operadores Rep(?;?) y Count(?;?;?). Esto lo hacemos así, en la línea para expresiones
de la ventana anterior escribimos Rep(Count(1;k;1);n) y de esta forma se genera una columna que
contiene 25 veces uno, 25 veces dos, y así sucesivamente hasta 25 veces 200.
• Para generar los códigos para identificar las 300 muestras de la uniforme, procedemos de la misma
forma y creamos la variable Cod2 en la columna Col_4.

Nota: Rep(Count(1;200;1);25)
Rep(Count(1;300;1);30)
Después de lo anterior se obtiene la ventana siguiente

Observe que en Cod1 hay 25 veces uno, luego sigue el dos y así sucesivamente. Además, en Cod2 hay 30
veces uno, luego le sigue el dos y así sucesivamente hasta que aparece 30 veces trescientos.

Ahora, para obtener los vectores de medias, varianzas, desviaciones estándar y medianas para cada una de
las 200 muestras aleatorias de la normal procedemos como sigue:

• Seleccionamos el comando DESCRIBE; luego, el comando NUMERIC DATA de las opciones de


DESCRIBE y a continuación la opción SUBSET ANÁLISIS como se observa a continuación,

Menú de opciones para el


comando NUMERIC DATA

Opciones del comando


DESCRIBE

• A continuación indicamos que los datos están en la columna X y los códigos están la columna Cod1.
Esto es,
• Después de lo anterior indicamos OK y se obtiene la siguiente salida

Nombre de la
ventana

• Entonces nos ubicamos en la ventana Summary Statistics y con clic derecho en Panel OPTIONS
seleccionamos los estadísticos deseados como se observa a continuación:

Guardar resultados
• Finalmente, guardamos los resultados usando el icono SAVE RESULTS e indicamos los estadísticos
a guardar y el nombre de cada columna e indicamos OK. LO anterior se muestra a continuación:

• Para finalizar cerramos la ventana SUBSET ANÁLISIS y en la ventana de edición aparecen las
columnas que contienen los 200 valores de los estadísticos requeridos como se observa a
continuación,

b) Construir el histograma y la gráfica de cajas y bigotes para el ventor de medias de las muestras.
Obtenga la media y la varianza para este vector. Estime el error cuadrático medio de la media de la
muestra.
Solución:

Para resolver lo anterior procedemos de la siguiente forma.

• Por el comando DESCRIBE del menú principal seleccionamos NUMERIC DATA y a continuación
la opción ONE-VARIABLE-ANALYSIS como se observa a continuación. Luego, indicamos que
los datos para el análisis están en la variable MediaX.

• Después de lo anterior se obtiene un análisis descriptivo de la variable. Para construir el histograma


y la gráfica de cajas y bigotes entramos por el comando por Graphical Options y seleccionamos las
opciones histograma de frecuencias Box-and-Whisker Plot como se muestra a continuación:

• Después de lo anterior obtenemos


• En las opciones gráficas están los gráficos pedidos y en Summary Statistics están las estadísticas
descriptivas para el vector de medias de las muestras. Los resultados anteriores se copian y se llevan
a un procesador de texto para su análisis posterior, a continuación cerramos la ventana One-
Variable-Analysis.

Finalmente, para estimar el error cuadrático medio para la media de la muestra generamos la columna
ECM1 con la instrucción ( mediaX − 500 ) ; esto es,
2
c) Repetir el numeral anterior para el vector de medianas.

Solución: Se procede igual que en el numeral (b) anterior pero usando los datos que están en la columna
MedianasX.

d) Construir los k = 200 intervalos de confianza del 95% para µ = 500. ¿Cuántos de estos intervalos cubren
a µ?. Desarrollar este numeral asumiendo primero que σ 2 es conocido y después que no lo es.

Solución: Sabemos que el intervalo de confianza para la media de una población normal con varianza
σ σ
conocida es x − zα 2 × < µ < x + zα 2 ×
. Por lo tanto, para construir los intervalos generamos dos
n n
1.96*10 1.96*10
columnas que llamaremos LI1 = mediaX - , y LS1 = mediaX + , como se observa a
25 25
continuación

Después de lo anterior aparecen las columnas LI1 y LS1 en la ventana de edición. Para contar cuantos de
estos intervalos contienen a la media poblacional, generamos una nueva columna que llamaremos
CONTAR1 con la siguiente instrucción: (LI1<500)&(LS1>500). De esta forma, se obtiene una variable
cuyo valor es 1 cuando la condición se cumple y toma el valor de cero en otro caso. Lo anterior lo hacemos
así:
s s
Ahora, cuando la varianza poblacional es desconocida el intervalo es < µ < x + tα 2, n −1
x − tα 2,n −1 .
n n
Entonces, para obtener los 200 intervalos generamos dos variables que llamaremos LI2 y LS2 de la
INVSTUDENT(0.975;24)*SX
siguiente forma: LI2 = mediaX - y
25
INVSTUDENT(0.975;24)*SX
LS2 = mediaX + . Para determinar cuantos de estos intervalos cubren a la
25
media poblacional, procedemos de la misma forma que en le caso de varianza conocida.

e) Para el vector de varianzas de las muestras calcule su media y su varianza. Estime el error cuadrático
n
medio para el vector de varianzas de las muestras. Realice el mismo ejercicio para S*2 = ∑ ( X i − X )2 / n .
i =1

Compare los errores cuadráticos medios estimados de estos dos estimadores de la varianza poblacional

Solución: Procedemos de la siguiente forma:

• Para encontrar la media y la varianza del vector de varianzas de las muestras ingresamos por el
comando DESCRIBE, luego la opción NUMERIC DATA y a continuación ONE-VARIABLE
ANÁLISIS e indicando que los datos están en la variable S 2 .
• Nos ubicamos en resúmenes estadísticos para S X 2 , damos clic derecho y en opciones de ventanas
marcamos los cuadros de la media y la varianza y aceptar (OK).
• Vamos a opciones graficas y seleccionamos los gráficos que deseamos realizar; aceptar.
• Para hallar el ECM_ S X 2 , activamos la columna, le damos clic derecho, Generar Datos

( )
2
ECM_ S X 2 = S X 2 − 100 , aceptar.
• Para hallar el ECM_ S X 2 , activamos la columna, le damos clic derecho, Generar Datos

ECM_ S X 2 =
( n − 1) S X 2 , aceptar.
n

S-ar putea să vă placă și