Documente Academic
Documente Profesional
Documente Cultură
INTRODUCCIÓN
Como en cualquier otra aplicación Windows, esta ventana puede modificarse en cuanto al
tamaño y a la disposición de sus elementos. Se trata de una ventana típica de una
aplicación Windows que consta de los siguientes elementos:
Archivo: Mediante este menú se pueden abrir, guardar o describir los diferentes
archivos que Minitab emplea (proyecto o de hoja de trabajo), así como Consultar base
de datos (ODBC), abrir gráfica u otros archivos. Igualmente, es posible controlar las
tareas de impresión.
Editar: Permite realizar las tareas habituales de edición: borrar, eliminar, copiar, y
pegar celdas.
Datos: Este menú permite realizar modificaciones en la hoja de trabajo, como es crear
subconjuntos, dividir y combinar. En las columnas te permite copiar, desapilar, apilar
o transponer. Entre otras acciones, ordenar, jerarquizar, eliminar filas, borrar
variables, codificar, cambiar tipo de datos y concatenar.
Calc: Este es un menú es que más se va utilizar ya que aquí se encuentran todas las
opciones relativas a la modificación y generación de nuevas variables, cálculo de los
estadísticos, introducción de datos por patrón, cálculo de las distribuciones de
probabilidad, datos aleatorios, etc.
Estadísticas: Mediante este menú se accede a los diferentes análisis estadísticos
que se pueden realizar con los datos. Entre las opciones se encuentra la estadística
básica, la cual nos va a permitir realizar los cálculos de la estadística descriptiva, las
pruebas de z, t y proporciones para una muestra o dos muestras, realizar prueba de
hipótesis. Otras opciones se encuentran regresión, ANOVA, gráficas de control,
potencia y tamaño de la muestra, entre otras.
Gráfica: Permite la creación y edición de diversos tipos de gráficos. Algunos de ellos
son también accesibles a través de determinadas técnicas estadísticas.
Editor: Tiene distintas opciones según esté activada la ventana de sesión o la hoja
de datos. Con la ventana de sesión activada permite, por ejemplo, que se pueda
escribir (en dicha ventana) utilizando el lenguaje de comandos.
Herramientas: Entre otras cosas, permite personificar la barra de herramientas y la
barra de menús
Ventana: Dispone de las funciones habituales para controlar las ventanas.
Ayuda: Proporciona ayuda al usuario en el formato típico de Windows.
Asistente: Es una herramienta basada en un menú diseñada para guiar incluso a los
usuarios inexpertos en sus análisis y ayudarles a interpretar sus resultados con
confianza.
La ventana de sesión se activa de dos maneras: hacer clic sobre ella o hacer clic sobre su
icono en la barra de herramientas (primer icono de la Figura 2). Para activar la hoja de
trabajo podemos hacer clic sobre ella o hacer clic sobre su icono en la barra de herramientas
(segundo icono de la Figura 2). Para activar la ventana de proyecto (Project Manager) se
puede maximizar o hacer clic sobre su icono en la barra de herramientas (tercer icono de
la Figura 2).
apunta hacia abajo (↓); si se hace clic sobre ella, apuntará hacia la derecha ( →). Para
escribir datos por columna no hay más que situarse en la casilla del caso 1, teclear el dato
y pulsar la tecla enter. La casilla activa se moverá hacia abajo.
Para introducir una variable numérica se puede realizar de dos maneras; introduciendo el
valor numérico directamente sobre la celda o bien dando clic con botón derecho del mouse
Al introducir variables que no son numéricas, como las de texto o fecha/hora, en la hoja de
datos aparecerá en la celda un guion y la letra T si la variable es de texto, y si, la variable
es de fecha/hora aparece el guion con la letra D como lo muestra la figura 3.
Figura 3. Hoja de trabajo con los tres tipos de datos (numérico, texto y
fecha/hora)
Para cambiar el formato de una variable numérica, dar clic sobre el nombre de la variable
pulsar con el botón derecho del mouse y la instrucción Formato columna > numérico. Una
de las utilidades de esta opción es el cambio del número de decimales que se muestran en
la hoja de datos (figura 4).
Una vez introducidos los datos, éstos pueden guardarse en un archivo para poder ser
utilizados en cualquier otro momento.
Para guardar únicamente la hoja de datos hay que seleccionar Archivo> Guardar hoja de
trabajo actual como (si se va a grabar el archivo de datos por primera vez y, por tanto,
asentar un nombre al archivo) ó archivo guardar como hoja de trabajo actual (si el archivo
de datos ya tiene nombre pero se quiere guardar los últimos cambios realizados). Minitab
le asigna automáticamente la extensión .mtw
Para grabar toda la información (la hoja de datos, el contenido de la ventana de sesión, los
gráficos que se hayan realizado, los valores de las constantes y de las matrices que se
hayan creado, etc.) se usa la opción Archivo > Guardar proyecto como (si se va a grabar
el proyecto de Minitab por primera vez y, por tanto, dar un nombre al archivo) ó Archivo >
Guardar proyecto (si el proyecto ya tiene nombre pero se quiere guardar los últimos
cambios realizados). Es muy importante diferenciar entre archivos de datos (.mtw) y
archivos de proyectos (.mpj).
Un archivo sólo puede ser recuperado de la forma en que fue grabado. Si se ha grabado
como hoja de datos (.mtw) se recupera con la opción Archivo> Abrir hoja de trabajo. Si
se ha grabado como proyecto de Minitab (.mpj) se recupera con la opción Archivo> Abrir
proyecto
Archivos de programa > Minitab 16 > español > datos de muestra y, llevan la extensión
.mtw.
Solo se explicarán algunas de las opciones más utilizadas del menú Datos. En el cuadro
de diálogo de cada herramienta existe un botón de ayuda.
Esta opción se utiliza para copiar las filas especificadas de la hoja de trabajo activa en una
nueva hoja de trabajo. Se puede especificar el subconjunto basándose en números de fila,
puntos destacados en una gráfica, o una condición. Se puede crear subconjunto de datos
de varias maneras:
Copiar filas especificadas de la hoja de trabajo activa en una hoja de trabajo nueva,
utilizando la opción: Crear subconjunto de hoja de trabajo
Dividir la hoja de trabajo activa en dos o más hojas de trabajo nuevas basándose en una
o más seleccionando "Por" variables.
Esta opción se utiliza para dividir el contenido de una columna apilada o bloque de columnas
apilado en dos o más columnas más cortas dentro de su hoja de trabajo actual o copiar las
columnas divididas en una hoja de trabajo nueva.
Los datos pueden ser numéricos, de texto o de fecha/hora. Las columnas deben tener la
misma longitud y los elementos del cuadro de diálogo es el siguiente:
1. Desapilar los datos en: Ingresa la columna o el bloque de columnas que desea desapilar.
2. Utilizando subíndices en: Ingresa la columna que contiene los subíndices. Los valores
de esta columna determinan cómo se desapilará la columna de origen.
Incluir valor faltante como un valor de subíndice: Marca esta opción para que Minitab pueda
crear una columna para todos los valores faltantes.
3. Almacenar datos no apilados en: Especifica dónde desea almacenar las columnas o el
bloque de columnas desapilados.
En nueva hoja de trabajo: Elija esta opción para almacenar las columnas o bloques
de columnas desapilados en una hoja de trabajo nueva. Nombre: (Opcional)
Especificar un nombre para la hoja de trabajo nueva.
Después de última columna en uso: Elija esta opción para colocar la columna o el
bloque de columnas desapilados en la hoja de trabajo actual después de la última
columna que contiene datos.
Nombrar las columnas que contienen los datos no apilados: Marca esta opción para
nombrar las columnas que contienen los datos no apilados.
1.4.3 Ordenar
Esta opción nos permite ordenar una o más columnas de datos de acuerdo con los valores
de las columnas asociadas que seleccione. El ordenamiento coloca en orden alfabético o
numérico los datos y lleva consigo las columnas asociadas. También se puede ordenar en
orden ascendente o descendente y especificar si los datos ordenados deberían
almacenarse en las columnas originales, en otras columnas que especifique o en una hoja
de trabajo nueva
Minitab provee seis comandos con los que puede cambiar los datos de un tipo a otro, estos
son:
Numérico a texto
Texto a numérico
Fecha/hora a texto
Fecha/hora a numérico
Numérico a fecha/hora
Texto a fecha/hora
Este es un menú que permite realizar operaciones con las celdas en la hoja de trabajo. El
menú contiene los siguientes comandos (figura 5)
Figura 5. Comandos que se utilizan en el menú Calc
1.5.1 Calculadora
Almacenar resultado en variable: Ingresa una columna o constante objetivo donde desea
almacenar el resultado de la expresión matemática.
Asignar como una fórmula: Marca esta opción si desea asignar la expresión como una
fórmula a la columna. Esto permite a Minitab volver a calcular valores automáticamente
cada vez que el usuario agrega, elimina o cambia datos asociados.
Calcula varias estadísticas basándose en una column seleccionada. La instrucción es: Calc
> Estadísticas de columnas
Calcula varias estadísticas para cada fila de las columnas seleccionadas. Instrucción: Calc
> Estadísticas de filas
Las estadísticas que elija muestra el siguiente cuadro de dialogo (figura 7):
Figura 7. Ejemplo del cuadro de dialogo de estadísticas de filas
Una vez ingresado a Excel aparece una ventana, tal como lo muestra la Figura 8.
Figura 8. Ventana de Excel
Los archivos creados con Excel se denominan libros, porque poseen varias hojas para que
el usuario ingrese información o cree varias planillas.
Cada hoja de un libro está formada por columnas (nombradas con las letras A, B,..., Z, AA,
AB,...) y filas (identificadas mediante números); la intersección entre una fila y una columna
se denomina celda y ésta se nombra con la letra de la columna y el número de la fila (A1,
C14, etc.).
Tener en cuenta:
Para cerrar un libro se utiliza la opción Cerrar, del menú Archivo o haciendo clic en el botón
Despliegue el menú Archivo y elija la opción Nuevo y seleccionar libro en blanco con el
icono o bien selecciona el botón
Haga clic en Aceptar o pulse Enter. Se abre un nuevo libro de trabajo con un nombre
predeterminado en la barra de título.
2.1.5 Salir de Excel
Una vez finalizado el trabajo deberá salir de la aplicación. Para ello podrá utilizar la opción
Salir, del menú Archivo o utilizar el botón de cerrar la ventana que se encuentra a la
derecha de la barra de título.
Dentro de cada una de las celdas que conforman las hojas de un libro, podrá ingresar:
textos, números, fechas, fórmulas y funciones.
Selecciona la celda en donde desea ingresar el dato haciendo clic en ella o utilizando las
teclas de movimiento.
Tipea el dato. Mientras escribe, la información aparece en la celda y en la barra de
fórmulas.
♦ Con la tecla Enter. Al pulsar esta tecla se está confirmando el dato ingresado.
Inmediatamente Excel lo almacenará en la celda activa y desplazará el cursor hacia la celda
que se encuentra debajo de aquella.
♦ Con las teclas de movimiento (← , ↑, →, ↓); en este caso, luego de almacenarse el dato,
el cursor se moverá a la dirección que le indique la tecla pulsada.
♦ Pulsando la tecla Tab.
Normalmente el puntero del mouse en Excel tiene forma de cruz blanca y sirve para
seleccionar una celda o un rango de celdas.
Por ejemplo, si desea seleccionar los rangos A1:A5 y C1:D6, deberá proceder de la
siguiente forma:
• Suelta el mouse y luego la tecla; podrá visualizar los rangos tal como lo muestra
Las fórmulas en una planilla de Excel se escriben como cualquier fórmula matemática,
utiliza los operadores aritméticos convencionales, los más comunes son + (suma), - (resta),
* (multiplicación), / (división), ∧ (potenciación) y permite incluir paréntesis.
• Hacen referencia a otra celda. Siempre que sea posible, hay que evitar el uso de datos
fijos y reemplazarlos por las coordenadas de las celdas que contienen los datos que van a
intervenir en la fórmula. De esta manera, al cambiar el valor de una celda, cambiará a la
vez el resultado del cálculo automáticamente.
• El rango que contiene los valores que intervienen en la fórmula se coloca entre paréntesis.
Entre la primera y la última celda del rango se colocan dos puntos que significa desde...
hasta.
Las fórmulas pueden copiarse como cualquier otro dato. Si desea copiar una fórmula realiza
el mismo procedimiento que hace para copiar un dato.
Cuando se copia una fórmula no se obtiene otra fórmula igual a la original porque Excel
toma las referencias de las celdas como relativas. Por ejemplo, si la fórmula a copiar es
= A3 * D3, entonces para la fila 4 la fórmula será = A4 * D4 y así sucesivamente.
Si la referencia es absoluta la fórmula copiada no varía como en el caso anterior. La
referencia absoluta es una dirección de celda cuyos componentes están precedidos por
el signo $; por ejemplo la dirección $A$5 se refiere en forma absoluta a la celda A5.
Las funciones también deben comenzar con el signo =, continuar con el nombre y, por
último, paréntesis de apertura y cierre, donde se indicará (en algunos casos) parámetros o
rangos.
• Observa que aparece seleccionado el rango a sumar con líneas de puntos. Si el rango
no es el correcto, puede seleccionar otro marcándolo con el mouse o escribiéndolo en la
fórmula (Figura 13).
menú formulas, elija Función. Aquí aparece un cuadro de diálogo con una lista de todas
las funciones disponibles, clasificadas por categoría (Figura14). En este cuadro se elige la
función que se quiere aplicar sobre un conjunto de valores.
Luego, aparece otro cuadro en el cual se ingresa el rango de celdas en las que se
encuentran los datos. Dependiendo de la función elegida el programa pedirá uno o más
parámetros.
Supongamos que se quiere calcular la Media Aritmética (Promedio) de una base de datos:
En el cuadro de Pegar Función, elija la categoría Estadísticas. Aparecerá una lista con
los nombres de todas las funciones estadísticas disponibles.
En la lista con los nombres de las funciones, elija Promedio. En la parte inferior del cuadro
aparece información acerca de la función elegida (su estructura, que operación realiza,
etc.).
Haga clic en Aceptar. Aparecerá otro cuadro en el cual debemos ingresar el rango (Figura
15)
Rang
MATERIALES Y EQUIPO
Práctica impresa
Computadora
Software Minitab 16 versión en español
Manual de Minitab
Microsoft Excel
PROCEDIMIENTO
Utiliza el software Minitab para realizar las siguientes actividades y detallada cada uno de
los procedimientos.
Actividad 1
b) Introduzca los datos tal y como se presentan en la tabla y genera las cuatro variables
con sus etiquetas descriptivas: Año (variable de texto), Usuarios y Préstamos
(variable numérica) y Tiempo (variable de fecha/hora). Graba la hoja de datos en un
archivo denominado Prestamos.mtw
c) Ordena las cuatro variables en forma creciente y almacena los datos en una nueva
hoja de trabajo con el nombre Prestamosordenados.mtw
d) En la hoja de trabajo de prestamosordenados calcula, en una nueva columna, la
variable que indica el porcentaje anual de préstamos por usuario, resultado de
multiplicar por 100 el resultado de dividir el número anual de préstamos entre el
número anual de usuarios. Pon a la nueva variable el siguiente nombre: PPU como
una etiqueta descriptiva. Haz que los resultados aparezcan con dos decimales.
Vuelve a grabar la hoja de datos.
Actividad 2
En la siguiente Tabla aparece el peso promedio diario de pan producido (en Kgs) por dos
operarios (A y B) que usan las maquinas 1 y 2. Durante un periodo de 20 días se tomaron
muestras de 4 piezas de pan de cada máquina con los siguientes resultados:
Actividad 3
Se tiene la siguiente lista con las temperaturas diarias promedio de una cierta ciudad
durante el mes de agosto 2016.
1) Temperatura máxima
2) Temperatura mínima
6) Número de temperaturas ≥ 20
Prueba lógica B2< al valor del resultado de la temperatura promedio del mes o la celda
$G$4 para fijar el valor al copiar la función de la temperatura promedio
Valor_si_verdadero la palabra SI
Valor_si_falso la palabra NO
SUGERENCIAS DIDÁCTICAS
Elaborar un Diagrama de flujo de los menús Datos, Calc, Estadísticas y Editor con todas
las herramientas y las flechas de flujo de los comandos.
Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Práctica No. Nombre de la Práctica
Asignatura
Probabilidad y Estadística 2 Determinación de medidas de
Ambiental tendencia central y dispersión
para datos no agrupados con
MINITAB
Competencias a desarrollar:
Solución de Problemas.
INTRODUCCIÓN
Las medidas de centralización nos sirven para representar el valor medio de los datos, es
decir, el valor que refleja el tamaño del dato más esperado. Ello nos indica la posición en la
que se encuentra en el centro de los datos.
xi Xi
Media muestral X i 1
Media poblacional i 1
n N
2.1.2 Mediana: Es un número tal que, si ordenamos los datos de forma creciente o
decreciente, cumple la condición de ser mayor que una mitad y menor que la otra. Es decir,
divide a la distribución en dos partes iguales.
n 1
Me X
2 2
Donde X es la posición y n es el total de datos ordenados crecientemente
2.1.3 Moda: Es el valor que más veces se repite en la distribución. Si los datos de la
distribución están agrupados en intervalos, la moda es el punto medio del intervalo que
contiene el mayor número de frecuencias.
Una distribución de observaciones puede no tener moda, es decir, puede que no haya
ningún valor de la distribución que aparezca con más frecuencia
Dividen un conjunto de datos en grupos con el mismo número de individuos. Para calcular
las medidas de posición es necesario que los datos estén ordenados de menor a mayor.
2.2.1 Cuartiles: Así como la mediana divide a la distribución en mitades, los cuartiles de
una distribución son los valores que dividen la distribución en cuartos.
El primer cuartil (Q1) deja un cuarto de las observaciones por debajo del mismo, y tres
cuartos por encima. El segundo cuartil (Q2) tiene dos cuartos por debajo y dos por encima
(el segundo cuartil coincide con la mediana). El tercer cuartil (Q3) tiene tres cuartos de las
observaciones por debajo y un cuarto por encima.
kn k
Qk X
4 4
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, se necesita conocer también la dispersión que presentan los datos en su
distribución, con objeto de tener una visión de los mismos más acorde con la realidad a la
hora de describirlos e interpretarlos.
x x x
2 2
Es una medida relativa de dispersión, la cual nos permite comparar dos distribuciones.
Relaciona la desviación estándar y la media al expresar la primera como un porcentaje de
la segunda.
S
C.V . x100 C.V . x100
Para una población: Para una muestra:
x
El coeficiente de variación es muy útil cuando se desea comparar dos o más medidas de
dispersión y éstas están en unidades diferentes o bien están en las mismas unidades pero
sus medias son muy distintas.
Una herramienta que permite calcular los estadísticos descriptivos más usuales es el
software Minitab en las siguientes opciones:
2. Estadísticas > Estadística básica > mostrar estadísticas descriptivas > Estadísticas,
esta opción genera estadísticas descriptivas para cada columna o subconjunto
dentro de una columna. Puede mostrar las estadísticas en la ventana Sesión y/o
mostrarlas en una gráfica.
3. Estadísticas > Estadística básica > almacenar estadísticas descriptivas >
Estadísticas, nos sirve para almacenar estadísticas descriptivas para cada columna
o subconjunto dentro de una columna.
Para calcular los parámetros estadísticos se pueden seguir cualquiera de las dos
instrucciones:
Minitab también perrmite el uso de representaciones gráficas para un mejor análisis de los
resultados obtenidos.
Estadísticas > Estadísticas básicas > Mostrar estadísticas descriptivas > Gráficas
4.1 Histograma
Los diagramas de caja son especialmente útiles cuando la distribución de una variable es
asimétrica o se aleja de la distribución normal.
5. Problema práctico
Tras haber definido los parámetros estadísticos más importantes, veamos un ejemplo
haciendo uso del Minitab.
Para estudiar el efecto de las aguas residuales de las alcantarillas que afluyen a un lago,
se toman 25 muestras distintas en las que se mide la concentración en mg/l de nitrato en el
agua. Los datos obtenidos son los siguientes:
36.5 36.5 36.5 36.5 36.5
37.5 36.0 35.0 37.5 36.5
36.0 37.5 38.5 38.0 37.0
37.0 37.0 38.0 35.5 36.5
37.5 37.0 35.5 36.0 38.0
Calcula la media, mediana, moda, tercer cuartil, rango, valor mínimo, valor máximo,
varianza, desviación estándar y coeficiente de variación.
Procedimiento:
Al comparar los dos gráficos se puede concluir que existe una asimetría ligeramente
positiva, es decir hay mayor concentración de valores al lado derecho de a media (36.78).
MATERIALES Y EQUIPO
Práctica impresa
Computadora
PROCEDIMIENTO
Resuelva las siguientes actividades con el software Minitab y expresa los resultados en dos
cifras decimales.
Actividad 1
a) Calcula la media, mediana, moda, valor mínimo, valor máximo, rango, primer cuartil,
varianza, desviación estándar y el coeficiente de variación.
b) Elabora una gráfica de valores individuales
c) Interpreta los resultados
d) Guarda el archivo como una hoja de trabajo llamado Actividad1.mtw
Actividad 2
a) Calcula la media, mediana, moda, valor mínimo, valor máximo, rango, primer cuartil,
varianza, desviación estándar y el coeficiente de variación.
b) Elabora una gráfica de caja
c) Interpreta los resultados
d) Guarda el archivo como una hoja de trabajo llamado Actividad2.mtw
Actividad 3
17.2, 17.1 17.0 17.1 16.9 17.0 17.1 17.0 17.3 17.2
16.9 17.0 17.1 17.3 17.2 17.4 17.1 17.1 17.0 17.1
Actividad 4
Encontrar las medidas de tendencia central (𝑋̅, Me y Mo) y las medidas de dispersión (S2, S
y C.V.) y medidas de posición (primer cuartil) para una muestra de análisis de aire de Pb
cuyos valores son: 3, 5, 2, 6, 5, 9, 5, 2, 7, 4, 5, 7, 8, 9, 4, 3, 5, 8, 8, 6 partes por millón (ppm).
Guarda el archivo como una hoja de trabajo denominado actividad4.mtw
Actividad 5
Las autoridades sanitarias de un municipio están interesadas en evaluar la calidad del agua
para consumo, en términos de colonias de bacterias tróficas, en un acuífero próximo a la
ciudad. Se consideran dos zonas diferentes del acuífero y se obtienen los siguientes
resultados (número de colonias por 1000 mm de agua):
Zona 1: 194 199 191 202 215 214 197 204 199 202 230 193 194 209
Zona 2: 158 161 143 174 220 156 156 156 198 161 188 139 147 116
Se pide:
3. Representa gráficamente los datos con un diagrama de caja simple (donde los datos del
gráfico son resúmenes para distintas variables).
SUGERENCIAS DIDÁCTICAS
Resolver las cinco actividades con el apoyo de Microsoft Excel y calculadora científica.
Compara los tres resultados. Envía al profesor un cuadro comparativo de los tres resultados
obtenidos.
Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Práctica No. Nombre de la Práctica
Asignatura
Probabilidad y Estadística 3 Tabla de frecuencias y
Ambiental determinación de medidas de
tendencia central y dispersión
para datos agrupados con
EXCEL
Competencias a desarrollar:
Solución de Problemas.
INTRODUCCIÓN
Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases
y a partir de estas determinar las características de la muestra y por consiguiente las de la
población de donde fue tomada. A los datos agrupados se les llama intervalos o clases y
se presentan como en una tabla de frecuencias.
Una hoja de cálculo es una de las herramientas más adecuadas para introducir tablas de
valores y obteniendo resultados y efectuando representaciones gráficas que faciliten su
representación.
1. Tabla de frecuencias
La distribución de frecuencias o tabla de frecuencias es un método para tabular que
permite organizar datos en intervalos, clases o categorías. Para construir una tabla de
frecuencias, es necesario seguir los siguientes pasos:
b) Determinar el número de intervalos de clase (ni).- Permite calcular el número de filas que
tendrá una tabla de frecuencias. No debe ser menor de 5 y mayor de 12, ya que un
número mayor o menor de clases podría oscurecer el comportamiento de los datos. Para
calcular el número de intervalos se aplica la regla de Sturges:
𝑛𝑖 = 1 + 3.32𝑥 log(𝑛)
c) Calcular el Ancho del Intervalo o amplitud (i).- Se obtiene dividiendo el Rango para el
número de intervalos. El valor del rango se puede aproximar dependiendo de los datos.
Es importante comentar que para el cálculo de la amplitud se tiene que considerar que
la amplitud tiene que tener, exactamente, el mismo número de decimales que manejan
los datos originales.
Para validar si los parámetros que establecimos están bien calculados, debemos
proceder a aplicar los siguientes cálculos
• Regla No. 1: No. de Intervalos de clase x Amplitud > Rango
En la figura 1 se muestra la estructura que debe llevar una tabla de frecuencias debe en
Excel.
d) Tabulación de Datos
d1) Limites de clase.- Los límites de clase definen el ancho de cada intervalo; es decir, en
qué número inicia nuestro intervalo (Límite Inferior de Clase, o L.I.C.) y hasta dónde llega
(Límite Superior de Clase, o L.S.C.).
El límite inferior de la primera clase (es decir, el inicio del primer intervalo), siempre será el
valor mínimo. La distancia entre el primer intervalo y el segundo, será siempre igual a la
amplitud, y así sucesivamente. Se sugiere determinar el L.I.C. de todos los intervalos de la
tabla, antes de proceder.
Para establecer los Límites Superiores de Clase, se recomienda seguir la siguiente tabla:
0 decimales (Enteros). Restar “0.5” (al L.I.C del Sumar “0.5” (al L.S.C. del
mismo intervalo) mismo intervalo)
Proceder con el mismo procedimiento para calcular el resto de los límites exactos para los
intervalos posteriores.
d3) Marcas de Clase o puntos medio de clase (Vi).- Es el valor medio de cada clase, se
obtiene sumando los límites superior (Ls) e inferior (Li) del intervalo y dividiendo ésta suma
entre 2
d4) Frecuencia absoluta (fi).- Es el número de veces que se repite el valor de cada
variable. La suma de frecuencias absolutas es siempre al total de datos observados.
En Excel es mucho más sencillo de hacer, para lo cual se recurre a la función Frecuencia.
d5) Frecuencia Acumulada Absoluta (fa).- Esta frecuencia nos ayuda a cuantificar los
datos que se van acumulando intervalo tras intervalo.
La frecuencia acumulada del primer intervalo, siempre será igual a la frecuencia absoluta
del mismo, ya que solamente se han acumulado esos datos. A partir del posterior (intervalo
2), se debe sumar, a la frecuencia absoluta de ese intervalo, la frecuencia acumulada del
intervalo anterior; en este caso, del primero. Tras seguir el mismo procedimiento hasta
culminar con todos los intervalos, observamos que la última frecuencia acumulada es igual
al número total de datos de la distribución, pues evidentemente, se han sumado todos y
cada uno de ellos de forma acumulada.
d6) Frecuencia Relativa (fr).- Indica la proporción con que se repite un valor. Es el cociente
entre la frecuencia absoluta y el número total de datos. La suma de las frecuencias relativas
es siempre 1.
Una vez terminada la tabla de frecuencias se procede a calcular las medidas de tendencia
central y de dispersión.
2.1 Media
X
fiVi
n
2.2 Mediana
En primer lugar es necesario determinar la clase que contiene la mediana, para después
determinar la posición de ésta dentro de la clase y poder hacerla interpolación.
n 2 fa
Me Li
fi
(i )
Dónde:
fa = Frecuencia acumulada absoluta que está antes de la clase que contiene la mediana
2.3 Moda:
Se define como el punto medio de la clase cuya frecuencia absoluta tiene el mayor valor
numérico, la cual recibe el nombre de clase modal
d1
Mo Li (i )
d1 d 2
3. Medidas de posición:
3.1 Cuartiles
Para datos agrupados la fórmula de la mediana se modifica de acuerdo con el punto de
interés, de acuerdo con las frecuencias acumuladas y después se lleva a cabo la
interpolación.
Dónde:
Li es el límite inferior
fi es la frecuencia absoluta
4. Medidas de dispersión
4. 1 Varianza
Para datos agrupados en una distribución de frecuencias se asume que el punto medio de
cada clase representa a todas las mediciones incluidas en la clase, la formulas son:
Varianza de la población: 2
f (x )
i
2
Varianza de la muestra: S 2
f (x X )
i
2
n 1
Excel es una hoja de cálculo, lo que quiere decir que su propósito es precisamente calcular
expresiones matemáticas. En las casillas o celdas de la ventana de Excel se pueden
introducir tanto números como expresiones. Así por ejemplo, si en la celda A1 se introduce
el número 5, y en la celda A2 el número 7 y se quiere calcular su suma, en la celda A3 se
introduce la expresión “=A1+A2” obteniendo el valor de dicha suma. El símbolo “=” indica
que el programa ha de calcular la expresión que viene a continuación. En ocasiones se
puede intercalar el símbolo “$” junto a la referencia de una celda, por ejemplo “$A$2”. Esto
indica que la referencia de la celda es absoluta; es decir, que si se copia la expresión en
otra celda, al ser absoluta la formula quedará tal cual está.
3. En la celda C coloca las siguientes funciones: C2, MIN; C3, MAX; C4, RANGO; C5, ni;
C6, i.
4. En la celda siguiente de cada función D realiza la fórmula correspondiente:
D2 =MIN(A2:A31)
D3 =MAX(A2:A31)
D4 =D3-D2
D6 =D4/6
Figura 2. Tabla de Excel con las funciones y los resultados de las expresiones
matemáticas.
6. Introducir los datos en cada una de las celdas de la tabla de frecuencia de acuerdo al
procedimiento que se detalla a continuación:
a) Límites de clase
• En la columna F en la primera fila en blanco (F3) inserta el límite inferior, en la
segunda fila (F4) expresa la fórmula =F3+ el rango, es decir =F3+483.5, copia la
celda F4 y pega en las demás celdas de la fila hasta obtener los valores de los
limites inferiores de cada intervalo de clase.
• En la columna G introduzca los limites superiores, coloca el primer límite superior
con la fórmula =(F3+483.5)-0.1, copia la celda G3 y pega en las demás celdas
hasta completar los limites superiores de clase.
Antes de realizar los cálculos, se seleccionan dos columnas en la hoja de trabajo; una para
escribir los parámetros estadísticos y la otra donde se realizaran las operaciones y que
mostrarán los resultados obtenidos (figura 5 )
Figura 5. Ejemplo de la selección de columnas para calcular los parámetros
estadísticos
5.2.1 Media
Para calcular la media es necesario que en la tabla de frecuencias se añada otra columna
para realizar la fórmula de fiVi y su sumatoria (∑fivi) como se muestra en la figura 6.
En el primer intervalo Introduzca la fórmula es =K3*J3, copia y pega en los demás intervalos
y posteriormente selecciona todos los intervalos y con el cursor elija el símbolo ∑.
Comprueba que el resultado obtenido se encuentre entre los valores del intervalo que
contiene la mediana.
5.2.3 Moda
Comprueba que el resultado obtenido se encuentre entre los valores del intervalo que
contiene la moda
Para calcular la varianza es necesario que en la tabla de frecuencias se añada otra columna
para realizar la fórmula 𝑓𝑖(𝑥 − 𝑋̅)2 , donde x es el punto medio de cada intervalo. En el primer
intervalo Introduzca la fórmula es =K3*(J3-1390.45)^2, copia y pega en los demás intervalos
y posteriormente selecciona todos los intervalos y con el cursor elija el símbolo ∑ (figura ).
6. Representaciones gráficas
6.1 Histograma
Para representar un histograma en Excel, coloca en cada celda el límite exacto inferior y en
otra celda las frecuencias absolutas. Selecciona las dos columnas y realiza la siguiente
instrucción:
Selecciona las barras del gráfico y con botón derecho dar formato a la serie de datos y
reduzca el Ancho del intervalo al 0%.
Al interpretar los resultados en el gráfico, se observa que presenta una asimetría positiva,
donde la media > mediana > moda. Es decir hay mayor concentración de valores al lado
derecho de la media (1390.45).
7.2 Ojiva
Es una gráfica de frecuencias acumuladas que permite ver cuántas observaciones están
por encima de ciertos valores, en lugar de hacer un cierto registro del número de elementos
que hay dentro de los intervalos.
Al construir el gráfico aparece en la parte superior título del gráfico, selecciona y cambia en
nombre.
MATERIALES Y EQUIPO
Práctica impresa
Computadora
PROCEDIMIENTO
Resuelva las siguientes actividades con el apoyo de Microsoft Excel
Actividad 1
Actividad 2
55.8 47.3 60.9 94.6 37.0 56.3 91.3 30.0 65.8 68.2
42.3 75.3 33.8 71.4 60.6 65.2 76.0 52.6 69.0 58.2
45.9 48.0 39.1 61.8 35.5 78.8 56.0 39.8 44.6 65.0
71.7 60.7 61.2 77.1 61.5 59.1 47.2 49.5 74.5 69.3
83.2 69.8 40.0 64.9 31.7 27.1 36.7 87.1 62.3 66.3
a) Captura los datos en Excel y ordena de manera ascendente
b) Si se usan 5 intervalos de clase calcula la amplitud del mismo.
c) Construya la tabla de frecuencias con sus valores.
d) Calcula las medidas de tendencia central y dispersión
e) Construya un histograma
f) Interpreta los resultados
g) Guarda la hoja de trabajo con el siguiente nombre actividad2.xls
SUGERENCIAS DIDÁCTICAS
Calcular la actividad 2 utilizando la fórmula para calcular los intervalos de clase y compara
resultados. Entrega tabla comparativa de las dos clases.
Competencias a desarrollar:
Solución de Problemas.
INTRODUCCIÓN
En la vida cotidiana aparecen muchas situaciones en las que los resultados observados
son diferentes aunque las condiciones iniciales en las que se produce la experiencia sean
las mismas. Por ejemplo, al lanzar una moneda unas veces resultará cara y otra cruz. Estos
fenómenos, denominados aleatorios, se ven afectados por la incertidumbre.
En el lenguaje habitual, frases como "probablemente...", "es poco probable que...", "hay
muchas posibilidades de que..." hacen referencia a esta incertidumbre.
1. Conceptos fundamentales
1.1 Experimento
Es definido como cualquier proceso que genere un conjunto de datos. En la mayoría de los
casos los resultados dependerán del azar, por lo tanto no se pueden predecir con certeza.
Por ejemplo si un químico realiza un análisis varias veces en las mismas condiciones,
obtendría diferentes medidas. Por lo tanto, se dice que es un experimento aleatorio.
Ejemplo 1.1
Considere un experimento en el cual cada uno de tres vehículos que toman una salida de
una autopista particular vira a la izquierda (L) o la derecha (R) al final de la rampa de salida.
El Evento B que exactamente uno de los tres vehículos vire a la derecha: B = {RLL, LRL,
LLR}
Evento C que cuando mucho uno de los vehículos vire a la derecha: C= {LLL, RLL, LRL,
LLR}
Evento D que los tres vehículos viren en la misma dirección: D = {LLL, RRR}
Ejemplo 1.3
Para sacar el espacio muestral es necesario saber que los posibles resultados para cada
bomba son: 0 (que ninguna este en uso), 1 (que una esté en uso), 2 (que dos estén en uso),
así sucesivamente hasta que las 6 estén en uso. Por lo tanto los elementos son 0, 1, 2, 3,
4, 5, 6.
S= {(0,0); (0,1); (0,2,); (0,3); (0,4); (0,5); (0,6); (1,0); (1,1); (1,2); (1,3); (1,4); (1,5); (1,6); (2,0);
(2,1); (2,2); (2,3); (2,4); (2,5); (2,6); (3,0); (3,1); (3,2); (3,3); (3,4); (3,5); (3,6); (4,0); (4,1);
(4,2); (4,3); (4,4); (4,5); (4,6); (5,0); (5,1); (5,2); (5,3); (5,4); (5,5); (5,6); (6,0); (6,1); (6,2);
(6,3); (6,4); (6,5); (6,6)}
Sea:
El evento A está definido como el que la primera gasolinera tiene más bombas ocupadas
que la segunda
A = {(1,0), (2,0); (2,1); (3,0); (3,1); (3,2); (4,0); (4,1); (4,2); (4,3); (5,0); (5,1); (5,2); (5,3); (5,4);
(6,0); (6,1); (6,2); (6,3); (6,4); (6,5)}
El evento B definido como el que la primera gasolinera tiene la mitad de bombas ocupadas
que la segunda
B = {(1,2); (2,4); (3,6)}
Para representar que un elemento "a" pertenece al conjunto "A" se aplica el símbolo de
pertenencia y si un elemento no pertenece a un conjunto se denota por .
Se utilizarán las siguientes operaciones para crear eventos nuevos a partir de eventos
dados.
2.1 Complemento de un evento A, denotado por A’, es el conjunto de todos los resultados
en S que no están contenidos en A.
2.2 Unión de dos eventos A y B, denotados por A ∪ B y leídos “A o B”, es el evento que
consiste en todos los resultados que están en A o en B o en ambos eventos (de tal suerte
que la unión incluya resultados donde tanto A como B ocurren, así también resultados
donde ocurre exactamente uno), es decir, todos los resultados en por lo menos uno de los
eventos.
2. 3 Intersección de dos eventos A y B, denotada por A ∩ B y leída “A y B”, es el evento
que consiste en todos los resultados que están tanto en A como en B.
Cuando los eventos no tienen resultados en común, se denota el evento nulo (∅) y se dice
que A y B son eventos mutuamente excluyentes o disjuntos.
3.1 Unión de conjuntos.- Esta operación puede representarse por medio de diagramas
de Venn-Euler, como lo muestra la siguiente figura 1:
Se representa: A B= x / x A ó x B ó a Ambos
3.3 Complemento de conjuntos.- Formado por todos los elementos que no están en A
(sino en el conjunto universal U), se llama complemento de A.
3.4 Diferencia de conjuntos.- A y B (en ese orden) es el conjunto de los elementos que
pertenecen a A y no pertenecen a B y se denota como A- B (A/B). Esto es:
A / B x/x A y x B
Propiedad A B C A ( B C ) ( A B) C A (B C )
asociativas
Propiedades A (B C ) ( A B) ( A C ) A (B C ) ( A B) ( A C )
distributivas
Leyes de A A A U A
identidad A U U A
Leyes de Morgan ( A B ) A B ( A B ) A B
Leyes de A A U A A
complemento
5. Problemas prácticos
En este ejemplo, hay intersección en los tres eventos, A ∩ B ∩ C = {3}; las otras
intersecciones son: A ∩ B = {3,4}, B ∩ C = {3,5) y A ∩ C = {1,3}. Estos elementos los
colocamos en su lugar correspondiente dentro del diagrama y corresponden a los
elementos 1, 3, 4, 5.
En una unidad habitacional viven 120 familias y se sabe que 70 de ellas tienen aire
acondicionado, que 30 poseen ventilador y que 17 tienen ambas cosas. Se desea conocer:
a) ¿cuántas familias tienen exclusivamente aire acondicionado?, b) cuántas familias son
dueños exclusivamente de ventilador, c) ¿cuántas familias son propietarias de un aire
acondicionado o de ventilador?, y d) ¿cuántas familias no poseen ni aire acondicionado ni
ventilador? Construya un diagrama de Venn-Euler para representar los resultados.
En este ejemplo se tiene dos sucesos: sea el suceso A familias que tienen aire
acondicionado y el suceso B familias que tienen ventilador y A ∩ B = {17}. En el conjunto
universo deben ser 120.
alta baja
Resistencia a rayaduras
alta 40 4
baja 2 3
Sea el evento A de que una muestra tiene alta resistencia a los golpes y el evento B que la
muestra tiene alta resistencia a rayaduras. Determine el número de muestras en A ∩ B, A’
y A ∪ B. Ilustra mediante un diagrama de Venn-Euler (Figura 8).
A ∩ B = 40 muestras
A’ = 7 muestras
A ∪ B = 46 muestras
MATERIALES Y EQUIPO
Práctica impresa
Calculadora
PROCEDIMIENTO
Actividad 1
Se realizó un estudio para determinar la calidad de agua para consumo público, para ello
se analizaron algunas muestras, encontrándose la presencia de: Magnesio, Calcio,
Aluminio, Zinc, Manganeso, Fósforo y Cromo. Sean los Eventos:
C = {Fósforo}
a) A’
b) 𝐴 ∪ 𝐶
c) (𝐴 ∩ 𝐵′) ∪ 𝐶′
d) 𝐵′ ∩ 𝐶′
e) A/B
f) 𝐴 ∩ 𝐵 ∩ 𝐶
g) (𝐴′ ∪ 𝐵′ ) ∩ (𝐴′ ∩ 𝐶)
Actividad 2
Longitud
Excelente Buena
Acabado de la Excelente 75 7
superficie Buena 10 8
Sea que A denote el evento de que una muestra tiene acabado en la superficie excelente y
sea que B denote el evento de que una muestra tienen una longitud excelente.
a) B’
b) 𝐴 ∪ 𝐵
c) A/B
d) 𝐴′ ∩ 𝐵
Actividad 3
Actividad 4
a) El evento formado por los automóviles que tienen los dos tipos de defectos.
b) El evento formado por los automóviles que tienen por lo menos un tipo de defectos.
d) El evento formado por los automóviles que tienen exactamente un tipo de defecto
Actividad 5
Actividad 6
Se presentan 44 solicitudes para cubrir los puestos que ofrece una empresa. Entre los
solicitantes hay 29 Ingenieros Industriales, 19 Ingenieros Químicos y 6 Ingenieros
Industriales y Ambientales, 8 Ingenieros Químicos y Ambientales y 9 Ingenieros Industriales
y Químicos y 1 que tiene triple titulación. Es decir hay uno que es Ingeniero Industrial,
Ingeniero Químico e Ingeniero Ambiental. ¿Cuántos Ingenieros Ambiental han presentado
la solicitud? Representa el Diagrama de Venn-Euler.
SUGERENCIAS DIDÁCTICAS
Resolver los ejercicios 3.16, 3.17 y 3.18 del libro de Probabilidad y Estadística aplicadas a
la ingeniería del autor Douglas C. Montgomery y George C. Runger de la editorial Limusa
Wiley, segunda edición. Con el objetivo de elaborar diagramas de Venn-Euler y rellenar las
áreas correspondientes a operaciones entre conjuntos.
Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Práctica No. Nombre de la Práctica
Asignatura
Probabilidad y Estadística 5 Factorial, permutaciones y
Ambiental combinaciones con EXCEL.
Competencias a desarrollar:
Solución de Problemas.
INTRODUCCIÓN
El análisis combinatorio o combinatoria es la ciencia que estudia las reglas de conteo, es
decir, las diferentes formas en que se puede ordenar o agrupar los elementos dados
siguiendo unas determinadas reglas establecidas. Existen distintas formas de realizar estas
agrupaciones, según se repitan los elementos o no, según se puedan tomar todos los
elementos de que los cuales se dispone o no y si influye o no el orden de colocación de los
elementos, por lo que, el desarrollo de la combinatoria está fuertemente ligado con su
aplicación en la teoría de la probabilidad.
Por ejemplo 4! = 1 x 2 x 3 x 4
5! = 1 x 2 x 3 x 4 x5
6! = 1 x 2 x 3 x 4 x 5 x 6
Otra manera es: Fórmulas > Insertar Función > Matemáticas y trigonométricas,
buscar FACT y anotar el número del que se desea obtener el factorial.
Problema práctico 1.1
3!
a) , sintaxis con Excel =FACT(3)/2
2
b) 7! , sintaxis =FACT(7)
8!
h) , sintaxis =FACT(8)/FACT(5)
5!
Luego, se aprecia que el número total de resultados distintos que se pueden obtener al
lanzar un dado o la moneda es 8. Como se muestra en la figura 3, los eventos son
mutuamente excluyentes.
Para hallar la respuesta se hace uso de la operación de adición, el cual se define como:
Martha tiene en su maleta de viaje 3 blusas de colores: blanco, azul y naranja; y 4 faldas
de colores: verde, rosa, beige y negra. ¿De cuantas maneras diferentes puede hacerlo?.
El resultado del primer pozo puede presentarse de 2 maneras (0: seco, 1: productor), el
resultado del segundo, tercero y cuarto pozos también puede presentarse de 2 maneras.
Un diagrama de árbol es una herramienta gráfica que permite enumerar todas las posibles
maneras de realizar un conjunto de acciones secuenciales o independientes. El árbol se
construye a partir de un nodo, que representa la primera acción a efectuar; de éste se
desprenden tantas ramas como maneras diferentes se pueda realizar esa acción; en las
terminales de cada rama se dibujan otros nodos, que representan la segunda acción a
efectuar y de los que se desprenden tantas ramas como maneras lógicas diferentes pueda
realizarse esa segunda acción, considerando la manera en que se realiza la primera. Y así,
sucesivamente.
El número de maneras diferentes en que se pueden comportar los tres interruptores es: 2
22=8
2. Técnicas de Conteo
2.1 Permutaciones
Una permutación es todo arreglo de objetos en donde nos interesa el orden, lugar o posición
que ocupa cada uno de los objetos que constituyen dicho arreglo. Para calcular el número
de permutaciones se aplica la fórmula siguiente:
𝑃𝑛 = 𝑛!
Donde La expresión 𝑃𝑛 representa las permutaciones de "n" objetos, tomando todos los
objetos a la vez. Los conjuntos de objetos se diferenciaran únicamente por el orden de los
objetos. Existen dos tipos de permutaciones: Con repetición y sin repetición
Se simbolizan:
n
Pn n! ó P(n, n) n!
Para calcular en Excel se hace uso de los factoriales con la función FACT
Si en un librero hay 15 diferentes libros, 6 de los cuales son de cálculo diferencial, 4 son de
química orgánica y 5 son de física.
Nota: como es un valor muy grande Excel lo expresa a como exponencial a la 12, si se
quiere con todas las cifras, con botón derecho seleccionar: formato de celdas > número y
marcar la opción de usar separador de miles.
b) ¿De cuántas maneras diferentes puedes acomodarlos en tu librero, si los de cada materia
deben quedar juntos?
El considerar que los libros de cada materia deben quedar juntos implica distinguir las 3
materias como 3 objetos que se pueden permutar (figura 8):
Para calcular el número total de maneras que se pueden colocar los 15 libros y que cada
materia queden juntos, se hace uso del principio multiplicativo. Utilizando la función FACT
en Excel:
=PERMUTACIONES(3,3)*PERMUTACIONES(6,6)*PERMUTACIONES(4,4)*PERMUTAC
IONES(5,5)
Se simbolizan:
n!
P(n, r)
(n r)!
¿De cuántas maneras diferentes se pueden sentar los 52 alumnos del grupo de
Probabilidad en un salón que dispone de 60 plazas?
n!
P(n 1 , n 2 ,..n r )
n1 ! n 2 !...n r !
a) ¿Cuántas claves de acceso a una computadora será posible diseñar con los números 1,
1, 1, 2, 3, 3, 3, 3?, b) ¿cuántas de las claves anteriores empiezan por un número uno
seguido de un dos?, c) ¿cuántas de las claves del inciso a empiezan por el número dos y
terminan por el número tres?
a) El total de elementos con los que se cuenta para diseñar la clave de acceso son 8 (figura
9), distribuidos de la siguiente manera: n1 =3 que corresponden al número uno, n2 = 1
porque solo hay un número dos, n3= 4 ya que existen cuatro números 3.
Excel no tiene una función para calcular permutaciones con repetición, por lo que
podemos hacer uso de la función FACT.
Sintaxis =FACT(8)/(FACT(3)*FACT(1)*FACT(4))
b) Como están condicionados los dos primeros espacios que conforman la clave de acceso
(figura 10), es decir, en el primer espacio se debe colocar el número 1 y en el segundo
espacio el número dos, solamente nos restan 6 números para ocupar los siguientes
espacios, 2 números uno y 4 números tres. Por lo tanto, n1=2 y n2=4.
c) Ahora están condicionados el primer y último espacio que conforman la clave de acceso
(figura 11), es decir, en el primer espacio se debe colocar el número 2 y en el último
espacio el número 3, solamente nos restan 6 números para ocupar los espacios libres
(intermedios), quedando 3 números uno y 3 números tres. Por lo tanto, n1=3 y n2=3.
P(n,r)= nr
n = 5 y r = 12
5 x 5 x 5 x ……5 = 512
12 preguntas
Pcirc,n= n-1!
¿De cuántos modos distintos podemos ubicar las cifras del 1 al 7 en la figura 12?
Figura 12. Permutación circular para ubicar los
dígitos del 1 al 7
Se puede solucionar este problema como la conjunción de dos sucesos: En primer lugar se
ubica una cifra en el centro (7 posibilidades) y en segundo lugar las otras 6 cifras, las cuales
por ordenarse en una circunferencia podrán permutarse de (6 –1)! maneras, por lo cual:
Pcirc,7 = 7x(6-1)!
=7*FACT(6-1)!
2.2 Combinaciones
Es un arreglo de elementos en donde no nos interesa el lugar o posición que ocupan los
mismos dentro del arreglo. En una combinación nos interesa formar grupos y el contenido
de los mismos.
o C(n, r)
Cr
n! n
r! (n r)! r
n
Si se considera que el conjunto a, b, c, d y se desean obtener subconjuntos de dos
elementos, entonces, se tienen los siguientes arreglos:
AB AC AD
BC BD
CD
El hecho de contener los mismos elementos y aunque el orden sea diferente, entonces cada
una de las anteriores ordenaciones se considera una combinación.
n! 4! 4 x3x 2! 12
Cr 6
r! (n r)! 2!(4 2)! 2! (2 x1)
n
2
Un granjero compra 3 vacas, 2 cerdos y 4 gallinas a un hombre que tiene 6 vacas, 5 cerdos
y 8 gallinas. ¿Cuántas elecciones puede hacer el granjero?
=COMBINAT(6,3)*COMBINAT(5,2)*COMBINAT(8,)
MATERIALES Y EQUIPO
Práctica impresa
Microsoft Excel
PROCEDIMIENTO
Utilizando el Microsoft Excel y con apoyo de las herramientas básicas para calcular las
técnicas de conteo, resuelva las siguientes actividades:
Actividad 1
Cierta sustancia química se forma mezclando cinco líquidos distintos. Se propone verter el
líquido en un estante y agregar sucesivamente los demás. Todas las combinaciones
posibles se deben probar para establecer cuál da el mejor resultado. ¿Cuántas formas se
deben hacer?
Actividad 2
Cuántas palabras diferentes de cuatro letras pueden crearse con los caracteres de la
palabra ambiental? (No se deben repetir letras)
Actividad 3
Suponga que una organización ambiental que tiene 300 miembros se van a formar dos
comités. Si un comité va a tener cinco miembros y el otro ocho, ¿De cuántas formas
distintas se pueden seleccionar estos comités?
Actividad 4
¿De cuántas maneras diferentes se pueden colocar 6 personas, para una junta de
comité?
a) En fila:
b) En fila, si dos personas deben quedar juntas:
c) Alrededor de una mesa:
d) Alrededor de una mesa, si dos personas deben quedar siempre juntas.
Actividad 5
El gobierno municipal desea controlar los ruidos molestos que se generan en la ciudad,
para ello un jefe de tránsito necesita asignar oficiales entre 10 disponibles para controlar el
tráfico en los cruceros A, B y C. ¿De cuántas maneras lo puede hacer?
Actividad 6
Una caja de cartón con 12 baterías para radio contiene una que esta defectuosa. ¿En
cuántas formas diferentes puede elegir un inspector tres de las baterías y obtener:
a) Ninguna batería defectuosa
b) Una batería defectuosa
Actividad 7
Actividad 8
Poco tiempo después de ser puestos en servicio, algunos autobuses fabricados por una
cierta compañía presentaron fallas en la emisión de diesel. Suponga que una ciudad
particular utiliza 25 de estos autobuses y que en 8 de ellos aparecieron las fallas.
Actividad 9
Actividad 10
Una empresa necesita 14 ingenieros ambientales para hacer un trabajo sobre el impacto
ambiental en los procesos productivos, de las cuales requiere que 4 sean mujeres, 5
hombres, y los restantes pueden ser de uno u otro sexo. ¿De cuántas formas puede elegir
la empresa a las 14 personas, si hay 18 candidatos de los cuales 8 son mujeres y 10 son
hombres?
SUGERENCIAS DIDÁCTICAS
Elaborar un cuadro comparativo de las técnicas de conteo (permutaciones y
combinaciones), utilizando algunos parámetros: tipo de combinatoria, se toman todos los
elementos, importa el orden, se repiten los elementos, fórmula, con el objetivo de que pueda
construir los conceptos asociados al conteo y poder así superar una de las dificultades que
se presentan durante la resolución de las actividades.
Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Asignatura Práctica No. Nombre de la Práctica
Probabilidad y Estadística 6 Tipos de eventos y teorema de
Ambiental Bayes.
Competencias a desarrollar:
Solución de Problemas.
INTRODUCCIÓN
Se lanzan dos veces el dado, ¿Cuál es la probabilidad que el total de los puntos obtenidos
sean 7?
Si se calcula el espacio muestral del evento de lanzar dos veces el dado, nos queda:
𝟔 𝟏
Por lo tanto, 𝑷(𝟕) = 𝟑𝟔
=𝟔
2.1 Axiomas
Los axiomas de probabilidad son las condiciones mínimas que deben verificarse para que
una función definida sobre un conjunto de sucesos determine consistentemente sus
probabilidades.
Axioma 1: Si A es un evento de S, entonces la probabilidad del evento A es:
0 ≤ 𝑃(𝐴) ≤ 1
P(s) = 1
P (A B) = P(A) + P(B)
P(A’) = 1 – P(A)
Tres caballos, A, B, y C están siendo tratados con tres métodos experimentales distintos
para aumentar la velocidad con la que pueden correr. Después del tratamiento intervienen
en una carrera. El caballo C tiene doble probabilidad de ganar que B, y B doble que A.
Calcular las probabilidades de que gane cada uno.
1
𝑃(𝐴 ∪ 𝐵 ∪ 𝐶) = k + 2k + 4k = 1 por lo tanto 𝑘 = 7
1
𝑃(𝐴) =
7
2
𝑃(𝐵) =
7
4
𝑃(𝐶) =
7
2.2 Teoremas
Demostración:
P(A) = P A P( A) P() P( A) 0 P( A)
Demostración:
Demostración:
Si A y B son dos eventos cualquiera, entonces el evento A se puede separar en dos eventos
mutuamente excluyentes, (𝐴/𝐵) y 𝐴 ∩ 𝐵, por tanto, 𝐴 = (𝐴/𝐵) ∪ (𝐴 ∩ 𝐵), luego 𝑃(𝐴) =
(𝐴/𝐵) + 𝑃(𝐴 ∩ 𝐵), entonces, 𝑃(𝐴/𝐵) = 𝑃(𝐴) − 𝑃(𝐴 ∩ 𝐵).
Demostración:
Demostración:
a) Sea el evento E que estudie probabilidad y estadística ambiental, el evento A que estudie
álgebra lineal y por el teorema 4 (Sí E y A son dos sucesos cualesquiera no mutuamente
excluyentes), se tiene que:
54 69 35
𝑃(𝐸 ∪ 𝐴) = 𝑃(𝐸) + 𝑃(𝐴) − 𝑃(𝐸 ∩ 𝐴) = + −
100 100 100
54 + 69 − 35 88
P(E ∪ A) = = = 0.88
100 100
Se dice que dos eventos son mutuamente excluyentes si uno o sólo uno de ellos puede
tener lugar en un mismo tiempo, es decir, o uno o el otro, pero no pueden suceder ambos
al mismo tiempo. La figura 4 se representa gráficamente los eventos mutuamente
excluyentes.
35
Evento M= {contratación fija de los empleados de mantenimiento}, la 𝑃(𝑀) = 70 = 0.5
3
Evento I = {contratación fija a los ingenieros supervisores}, la 𝑃(𝐼) = 70 = 0.043
c) Ahora la pregunta es que tenga contrato fijo y sea transportista, entonces, cambia
la manera de designar las probabilidades al estar seleccionando solamente a los de
contratación fija, el total de casos resulta de sumar 8 + 35 + 3 = 46.
8
Sea el evento C = {que tena contrato fijo y sea transportista}, la 𝑃(𝐶) = 46 = 0.174
Por ejemplo, suponga que tenemos 5 letras B y 3 letras A en una bolsa (figura 6). Sacamos
una letra, que puede ser B o A. Ahora quedan 7 en la bolsa. Cuál es la probabilidad de que
la segunda letra sea B?
P(A) = 3/8
P(B) = 5/8
P(B) = 4/7
P(A) = 3/7
Cuando se tiene este caso se emplea entones, el concepto de probabilidad condicional para
denominar la probabilidad del evento relacionado. La expresión 𝑃(𝐵/𝐴) indica la
probabilidad de ocurrencia del evento A si el evento B ya ocurrió.
Decimos que dos sucesos A y B son dependientes entre sí si la ocurrencia de uno de ellos
modifica la probabilidad del otro, es decir, si P(B/A) ≠ P(B) o P(A/B) ≠ P(A)
P(A ∩ B) = P( A )* P( B )
P(A ∩ C) = P( A ) * P( C )
P(B ∩ C) = P( B ) * P( C )
P( A ∩ B ∩C ) = P( A ) * P( B ) * P( C )
Teniendo en cuenta que A y B son dos eventos independientes y que sean A y B los
respectivos eventos de que ambos vehículos estén disponibles se tiene que
Supóngase que se tiene una caja de fusibles que contiene 20 piezas, de las cuales 5 están
defectuosas. Sí se seleccionan 2 al azar y se sacan de la caja en sucesión, es decir, una
tras otra sin reemplazo del primero. ¿Cuál es la probabilidad de que ambos fusibles resulten
defectuosos?.
Ya que al sacar el primer fusible este no es reemplazado, el espacio muestral cambia. Para
el primer fusible es 20 y para el segundo es 19, por lo tanto los eventos son independientes.
A la probabilidad de que un evento B suceda, cuando se sabe que algún otro evento A se
ha presentado se llama probabilidad condicional y se escribe P(B/A). Esta expresión, por lo
común, se lee “la probabilidad de que B ocurra dado que ocurrió A”, o simplemente “la
probabilidad de B, dado A”.
P A B
P(B/A) = sí P(A) 0
P( A)
Se trata de un evento condicionado, ya que se desea que ocurra es que tenga alta
selectividad, puesto que ya tiene alta fidelidad. Entonces:
P( A B) 0.18 2
P(B/A) =
P( A) 0.81 9
5. Teorema de Bayes
Si B1, B2, B3……… Bn son eventos mutuamente excluyentes, de los cuales uno debe de
ocurrir, entonces:
B
p( Bi ) p i
B
p( i ) n A
para i = 1,2,3,……., n
A Bi
i 1
p( Bi ) p
A
Para obtener la solución de este tipo de problemas es necesario hacer uso de los
diagramas de árbol y los eventos. Como se observa en la figura 8.
Sea E = {eficiente}
M = {mal hecho}
Figura 8. Diagrama de árbol de la probabilidad de
producción de tornillos de las tres
compañías.
M M
p( A). p A
a) p A
M p( B). pB M p(C ). pC M p( D). pD M
p( A). p A
(0.33).(0.20) 0.066
= 0.5042
(0.33).(0.20) (0.25).(0.10) (0.15).(0.05) (0.27).(0.12) 0.1309
M M
p( B). p B
b) pB
M p( B). pB M p(C ). pC M p( D). pD M
p( A). p A
(0.25).(0.10) 0.025
= 0.191
(0.33).(0.20) (0.25).(0.10) (0.15).(0.05) (0.27).(0.12) 0.1309
c) pC M p( A). pA p(B). pB p(CM).pC p(D). pD
p(C ). p C
M M M M
(0.15).(0.05) 0.0075
= 0.0573
(0.33).(0.20) (0.25).(0.10) (0.15).(0.05) (0.27).(0.12) 0.1309
M M
p( D). p D
d) pD
M p(B). pB M p(C ). pC M p(D). pD M
p( A). p A
(0.27).(0.012) 0.324
= 0.2475
(0.33).(0.20) (0.25).(0.10) (0.15).(0.05) (0.27).(0.12) 0.1309
MATERIALES Y EQUIPO
Práctica impresa
Calculadora
PROCEDIMIENTO
Actividad 1
Actividad 2
Se sabe que en una colmena existen aproximadamente 50 abejas machos y 300 abejas
hembras. Si se eligen 3 abejas sin reposición hallar las siguientes posibilidades.
Actividad 3
Longitud
Excelente Bueno
Acabado de Excelente 75 7
superficie Bueno 10 8
Sean
a) P(A)
b) P(B)
Actividad 4
La probabilidad de que falle un conector eléctrico que se mantiene seco durante el periodo
de garantía, es 1%. Si el conector se humedece, la probabilidad de falla durante el periodo
de garantía es 5%. Si el 90% de los conectores se mantienen secos, y el 10% se humedece,
qué proporción de conectores fallará durante el periodo de garantía?
Actividad 5
Actividad 6
Una agencia de protección ambiental ha decidido realizar un plan de protección para lo cual
decide analizar las especies candidatas de acuerdo a la siguiente tabla suministrada por el
Servicio de Fauna y Medio Ambiente.
Mamíferos 53 8 61
Aves 74 11 85
Peces 54 33 87
181 52 233
Suponga que se elige una especie candidata al azar. Calcular las siguientes
probabilidades
Actividad 7
a) P(C2 ∩ B)
b) P(C3 ∪ A)
c) P(A∩C1)
d) P(A/C1)
e) P(C3/B)
Actividad 8
b) ¿Cuál es la probabilidad de que una muestra escogida al azar sea de la zona industrial
y éste contaminada?
c) ¿Cuál es la probabilidad de que una muestra escogida al azar sea de zona urbana y
no esté contaminada?
SUGERENCIAS DIDÁCTICAS
Resolver e interpretar problemas de probabilidad para eventos mutuamente excluyentes y
no excluyentes de su entorno (como lanzamiento de dados, extracción de bolas de color de
una urna al azar, extracción de cartas de una baraja española, ganar la lotería de acuerdo
con diferentes parámetros, etc), a partir de la definición y utilizando la regla de adición a
través de problemas planteados por el docente.
Competencias a desarrollar:
Solución de Problemas.
INTRODUCCIÓN
Para un determinado espacio muestral S una variable aleatoria (VA) es cualquier regla que
relaciona un número con cada resultado en el espacio muestral, es decir cuando se asocia
un valor numérico a cada resultado del espacio muestral.
Se utilizan letras mayúsculas X, Y….. para designar variables aleatorias, y las respectivas
minúsculas (x, y,…) para designar valores concretos de las mismas.
Se dice que una variable aleatoria X es discreta si sólo toma valores enteros, es decir, un
número finito de valores o infinito numerable.
(X<x) representa el suceso "la variable aleatoria X toma un valor menor a x"
(X ≤x) representa el suceso "la variable aleatoria X toma un valor menor o igual a x"
Si x es una variable aleatoria discreta, la función dada por f(x) para cada x contenida en el
intervalo de x se denomina función de probabilidad, o distribución de probabilidad, de
x.
Una función puede fungir como la distribución de probabilidad de una variable aleatoria
discreta x si y sólo si sus valores, f(x), cumple las condiciones siguientes:
Las distribuciones probabilidad revelan un gran número de valores que pueden constituirse
como el resultado de un experimento. En otras palabras, nos ayudan a describir la
probabilidad de que un evento se realice a futuro; esto involucra el diseño de escenarios de
acontecimientos futuros posibles.
Comúnmente son utilizadas como parte de las tendencias posibles en que ocurran distintos
resultados, como en el caso de algunos fenómenos naturales, como la situación del clima
en un día, si llueve o será soleado, por ejemplo.
Las definiciones de media y varianza para una variable aleatoria discreta siguen la misma
filosofía, sustituyendo frecuencias relativas por probabilidades.
La media o valor esperado de una variable aleatoria discreta X , denotada como E(X), es:
Sea Y una variable aleatoria discreta con distribución de probabilidades P(X=x). Entonces,
la varianza de Y es:
2. Distribución binomial
Es una de las distribuciones de probabilidad de variables discretas más útiles. Sus áreas
de aplicación incluyen inspección de calidad, ventas, mercadotecnia, medicina,
investigación de opiniones entre otras.
a) En los experimentos que tienen este tipo de distribución, siempre se esperan dos
tipos de resultados, ejemplo: Defectuoso, no defectuoso, pasa, no pasa, favorable,
no favorable, etc., denominados arbitrariamente “éxito” (que es lo que se espera que
ocurra) o “fracaso” (lo contrario del éxito).
c) Cada uno de los ensayos o repeticiones del experimento son independientes entre
sí.
Además, sea P, la probabilidad de éxito cada vez que el experimento se lleva a cabo y 1 -
P la probabilidad de fracaso.
𝑛!
𝑃(𝑥, 𝑛, 𝑃) = { } 𝑃 𝑥 (1 − 𝑃)𝑛−𝑥
(𝑛 − 𝑥)! 𝑥!
O bien:
Donde:
x = 0, 1, 2,.........,n
q es el complemento de P
0 P 1 para n entero
0 para cualquier otro valor
Media 𝜇 = 𝑛𝑃
Varianza 𝜎 2 = 𝑛𝑃𝑞
Nota: para F(x), si se quiere calcular la P(x ≥ 15) en la constante de entrada se escribe el
valor de 14, esto quiere decir que la F(x) calcula todos los valores acumulados que van
desde x = 0 hasta x = 14. Entonces, para calcular la probabilidad P(x ≥ 15) = 1 – P(x ≤ 14).
La figura 1 muestra el cuadro de diálogo que se presenta en una distribución binomial con
Minitab.
Microsoft Excel nos permite calcular la probabilidad binomial para ello, se sigue la
instrucción:
FÓRMULAS > Selecciona “insertar función fx” > en el cuadro de diálogo selecciona
“estadísticas” > busca con la barra de desplazamiento DISTR.BINOM.N y selecciona
Se asegura que, en el 60% de todas las instalaciones fototérmicas, los gastos de servicios
se reducen al menos en una tercera parte. De acuerdo con lo anterior. ¿Cuál es la
probabilidad de que se reduzcan al menos en una tercera parte?, en:
a) Cuatro de 5 instalaciones
Se define la variable aleatoria y se establecen los distintos valores que ella puede tomar.
Sea la variable aleatoria A = los gastos de servicios se reduzcan al menos en una tercera
parte, la cual puede tomar los valores se reduzcan al menos (≥) en una tercera parte y que
no se reduzcan cuando los valores sean menores a una tercera parte.
Para resolver el inciso a), se definen los parámetros n, P y x.
n = 5, P = 0.6 y x = 4
Selecciona Probabilidad
Ingresa los parámetros requeridos.
Numero de ensayos = valor de n que es 5
Probabilidad del evento = valor de P de 0.6
Columna de entrada = se deja vacía
Elija Constante de entrada = valor de x que es 4
Da clic en Aceptar
x P( X = x )
4 0.2592
Abrir el Microsoft Excel y da clic en libro en blanco, selecciona la celda donde quieras que
aparezca el resultado y sigue la siguiente instrucción:
En el cuadro de diálogo, anotar los valores que pide en cada argumento de la función:
x P( X = x )
3 0.66304
Este resultado corresponde a los valores de x = 0 hasta x = 3, por lo tanto, para conocer
la P(x ≥ 4) se saca su complemento por la siguiente ecuación:
El modelo geométrico surge con la misma situación básica de la binomial: Se tiene una
serie de pruebas. Con las siguientes características:
Esta distribución es un caso especial de la Binomial, ya que se desea que ocurra un éxito
por primera y única vez en el último ensayo que se realiza del experimento, es decir la
secuencia de experimentos se termina cuando el primer éxito se presente.
Se dice que una variable aleatoria X tiene una distribución geométrica si y solo si
Dónde:
0 𝑠𝑖 𝑥 < 0
𝑥
F(x) = P(X ≤ x) =
∑(1 − 𝑃)𝑥−1 𝑠𝑖 𝑥 ≥ 0
{ 𝑖=0
1
Media E( X )
P
Ahora abre Minitab y con la opción Calc > Distribuciones de probabilidad selecciona
Geométrica
x P( X = x )
6 0.0386890
El valor de x es de 7
x P( X = x )
7 0.0000000
4. Distribución de Poisson
Esta distribución es una de las más importantes distribuciones de variable discreta. Sus
principales aplicaciones hacen referencia a la modelización de situaciones en las que nos
interesa determinar el número de hechos de cierto tipo que se pueden producir en un
intervalo de tiempo o de espacio, bajo presupuestos de aleatoriedad y ciertas circunstancias
restrictivas. Otro de sus usos frecuentes es la consideración límite de procesos dicotómicos
reiterados un gran número de veces si la probabilidad de obtener un éxito es muy pequeña.
e
x
P( x; ) x 0,1,2,......; 0
x!
0 para cualquier otro valor
Media E(X )
Varianza X2
Nota: para F(x), si se quiere calcular la P(x ≥ 15) en la constante de entrada se escribe el
valor de 14, esto quiere decir que la F(x) calcula todos los valores acumulados que van
desde x = 0 hasta x = 14. Entonces, para calcular la probabilidad P(x ≥ 15) = 1 – P(x ≤ 14).
La figura 4 muestra el cuadro de diálogo que se presenta en una distribución Poisson con
Minitab.
Microsoft Excel nos permite calcular la probabilidad binomial para ello, se sigue la
instrucción:
FÓRMULAS > Selecciona “insertar función fx” > en el cuadro de diálogo selecciona
“estadísticas” > busca con la barra de desplazamiento POISSON.DIST y selecciona
X teclea el valor de x
Media teclea el número el valor de λ
Acumulado escriba FALSO si es f(x) y VERDADERO si es la F(x), función de
distribución acumulada.
Da clic en Aceptar
Se sabe que 10 es el número promedio de camiones- tanque de aceite que llegan por día
a una cierta ciudad portuaria. Las instalaciones del puerto pueden atender cuando mucho
a 15 camiones-tanque en un día. ¿Cuál es la probabilidad de que en un determinado día
se tengan que esperar hasta el otro día los camiones tanque?
Para resolver este problema se identifica como una distribución de Poisson porque se
produce en un intervalo de tiempo y como parámetro nos da el promedio (λ).
Sea la variable aleatoria X el número de camiones tanque que llegan por día, entonces, si
se quiere calcular la probabilidad que se tengan que esperar hasta otro día el valor de x
debe ser mayor de 15, debido a que solo se pueden atender hasta quince por día.
El resultado que nos da Minitab y la F(x) acumulados los valores que van desde x = 0
hasta x = 15, es decir, P (X ≤15).
x P( X <= x )
15 0.951260
El resultado es 0.951260 que corresponde a los valores que van de x = 0 hasta X = 15,
para sacar la P(x>16) se calcula su complemento 1 – P (X ≤15)
MATERIALES Y EQUIPO
Práctica impresa
Calculadora
Software Minitab 16
Microsoft Excel
PROCEDIMIENTO
Actividad 1
Un estudio de higiene industrial y seguridad hecho a largo plazo de los accidentes en una
fábrica, llevó a la gerencia a concluir que el número de accidentes por trabajador, durante
un año (X). Si el número promedio de accidentes por trabajador por año fue de 0.3,
estimar lo siguiente:
Supóngase que el 40% de los ríos de cierta región industrial de México están contaminados
con benceno. Si tomamos una muestra aleatoria de tamaño n=30, calcular lo siguiente:
Actividad 3
Actividad 4
En una encuesta aplicada a los habitantes de la Ciudad de México para determinar medidas
de contaminación ambiental, la cual consiste en implementar el programa de hoy no circula,
con el fin de prevenir, minimizar y controlar la emisión de contaminantes provenientes de
fuentes móviles circulantes, el 75% de los entrevistados está de acuerdo con el programa.
Actividad 6
Actividad 7
La probabilidad de que una muestra de aire contenga una molécula rara es de 0.01 si se
supone que las muestras son independientes con respecto a la molécula rara.
¿Cuál es la probabilidad que sea necesario analizar 125 muestras antes de detectar una
molécula rara?
Actividad 8
En un estudio de contaminación del aire, en las terminales camiones de carga, se sabe que
el número promedio de camiones que llegan diariamente, a una terminal de camiones
de carga es de 3. Para que los complejos habitacionales no se contaminen con los humos
de los camiones, se restringe el número de camiones que arriban y se establece un límite
de no más de 8 por día. Hacer una gráfica con los resultados y calcular lo siguiente:
Actividad 9
Actividad 10
Resolver cada una de las actividades con la utilización de fórmulas y a través de tablas de
distribución con el objetivo de comparar resultados.
Competencias a desarrollar:
Solución de Problemas.
INTRODUCCIÓN
Una variable Aleatoria Continua es aquella que puede asumir un número infinitamente
grande de valores correspondientes a los puntos sobre un intervalo en una línea recta.
Varios matemáticos intervinieron en su desarrollo entre ellos figura el astrónomo del siglo
XVIII Karl Gauss, a veces es llamada en su honor la distribución de Gauss.
1. La curva tiene un solo pico, por consiguiente es unimodal. Presenta una forma de
campana., es asintótica al eje de las abscisas (para x = )
Una variable aleatoria continua, X, sigue una distribución normal de media ( µ ) y desviación
típi a ( σ ), y se designa por N(µ, σ), se si cumplen las siguientes condiciones:
1 1 𝑥−𝜇 2
− ( )
𝑓(𝑥) = 𝑒 2 𝜎 𝑝𝑎𝑟𝑎 − ∞ ≤ 𝑥 ≤ +∞
𝜎√2𝜋
Donde:
Es decir la probabilidad de que dicha variable tome un valor menor que x0.
Matemáticamente esta función de distribución coincide con la integral de la función de
densidad desde -∞ hasta el valor de x0.
F(b) − F(a) si a ≤ b.
Dicha variable se puede transformar en una variable normal tipi!cada, N(0,1), mediante la
siguiente expresión:
x
Z
De manera que la función de densidad de esta nueva variable es:
1 𝑧2
−( )
𝑓(𝑍) = 𝑒 2
𝜎√2𝜋
A partir de dicha expresión, las tablas de la distribución normal presentan los valores de o
probabilidad de que la variable Z tome un valor inferior a z0.
𝑧0
𝐹(𝑍) = ∫ 𝑓(𝑍)𝑑
−∞
Las fórmulas más importantes para el cálculo de probabilidades de una N(0,1) son las
siguientes:
P(Z ≥ z) = 1 – F(z)
P(Z ≤ -z) = (Z ≥ z)
De forma que si se quiere obtener la probabilidad de que X se encuentre entre dos valores,
𝑥−𝜇
xa y xb, primero se tipifican dichos valores con la expresión de 𝑍 = 𝜎
, y después se
buscaría en las tablas de la distribución normal la probabilidad acumulada para esos dos
nuevos valores, za y zb . De manera que:
Existen dos maneras para calcular la distribución normal, una es con la opción Calc y la
otra es a través de la opción Gráficas. En la primera opción solamente se obtiene el
resultado de la probabilidad y hacer cada operación por separado si se trata de un intervalo.
La segunda opción es más completa porque nos permite obtener la gráfica con su área
sombreada y el resultado de la probabilidad, además, hay dos procedimientos uno para
calcular los valores de x y el otro procedimiento para obtener la probabilidad.
Nota: para F(x), si se quiere calcular la P(x ≥ 15) en la constante de entrada se escribe el
valor de 14, esto quiere decir que la F(x) calcula todos los valores acumulados que van
desde x = 0 hasta x = 14. Entonces, para calcular la probabilidad P(x ≥ 15) = 1 – P(x ≤ 14).
La figura 2 muestra el cuadro de diálogo que se presenta en una distribución normal con el
Minitab.
Con esta opción podemos visualizar el área sombreada bajo la curva y así poder interpretar
nuestros resultados.
Al dar aceptar nos muestra el siguiente cuadro de diálogo (figura 4) y realiza la siguiente
instrucción:
Al seleccionar área sombreada nos aparece otro cuadro de diálogo para definir el valor
de x o el valor de probabilidad dependiendo de lo que se quiera calcular (figura 5).
Figura 5. Cuadro de diálogo para definir el valor de X
Selecciona el Valor X.
Da clic en alguna de las colas dependiendo del valor de la media y el valor de X,
por ejemplo si la media es 4 y el valor de x es 6, entonces se selecciona la cola
derecha, porque el valor de x ex mayor que la media.
En Valor X, ingrese su valor
Haga clic en Aceptar.
Selecciona Probabilidad.
Da clic en alguna de las colas dependiendo del valor de probabilidad, por
ejemplo si se tiene una media de 1.5, una desviación estándar de 0.2 y se quiere
conocer el valor de x que cubra el 95%, la probabilidad es de 0.95. Aquí se
selecciona la cola izquierda, para que sombree el 95% de la gráfica.
En Probabilidad, ingresa el valor de P.
Haga clic en Aceptar.
El procedimiento es el siguiente:
Abrir Minitab, selecciona Gráfica > Gráficas de distribución de probabilidad > ver
probabilidad > Aceptar
Media = 120
Desviación estándar = 20
Da clic en Valor X
Selecciona el gráfico que dice centro, porque se tiene un intervalo que va de 80 a 140.
Da Aceptar
b) Para clasificar a los examinados en tres grupos, se tiene que el 0.20 es de bajo intelecto,
el 0.65 aceptable y el 0.15 con un intelecto aceptable.
Para conocer el valor de x que marca el paso de un grupo a otro, se sigue el siguiente
procedimiento:
Nuevamente en Gráficas > Gráfica de distribución de probabilidad > Ver probabilidad y
Aceptar
En el cuadro de diálogo ya aparece por default el valor de media y desviación estándar
que se introdujeron al calcular el inciso a, así que:
Selecciona Área sombreada
Defina Probabilidad
Selecciona el gráfico que dice centro. En este ejercicio se toman los dos valores de P
que nos dan la marca para cada grupo, que es P = 0.20 y P = 0.15.
En la gráfica de la figura 9 se muestra el área sombreada y los valores de x, para cada
marca del grupo de intelectos.
Aceptable
Intelecto
Bajo Excelente
Intelecto Intelecto
Sí las dimensiones de los medidores están dentro especificación 1.50±d, se tiene que
buscar el valor de +d y –d y que cubra el 95% de la especificación, entonces se
visualiza un gráfico de dos colas.
Selecciona Probabilidad
Da clic en Aceptar
Se van a rechazar los medidores que estén por debajo de 1.108 o por encima de1.892.
MATERIALES Y EQUIPO
Calculadora
Software Minitab 16
Microsoft Excel
Actividad 1
c) ¿Cuál es el nivel máximo de concentración de mercurio en sangre del 40% de las aves
menos contaminadas?
Actividad 2
Actividad 3
Actividad 4
Sea X la cantidad de radiación que puede ser absorbida por un individuo antes de que le
sobrevenga la muerte. Supongamos que X es Normal con una media de 500 roentgen y
una desviación típica de 150 roentgen.
Actividad 5
La vida promedio de cierto motor pequeño es de 10 años, con una desviación estándar de
2 años. El fabricante reemplaza gratis todos los motores que fallen dentro del periodo de
garantía. Si estuviera dispuesto a reemplazar sólo el 3% de los motores que fallen, ¿cuánto
tiempo en garantía debería ofrecer? Suponga que la duración de un motor tiene una
distribución normal.
Actividad 6
El consumo medio bimestral de energía eléctrica en una ciudad es de 59 Kwh., con una
desviación típica de 6 Kwh. Se supone que se distribuye según una distribución normal.
Competencias a desarrollar:
Solución de Problemas.
INTRODUCCIÓN
“Es la que puede tomar cualquier valor fraccionario en un rango determinado de valores”
Las variables aleatorias que pueden tomar cualquier valor de un intervalo real de la forma
(a, b), (a, +∞), (- ∞, b), (- ∞, + ∞) o uniones de ellos se les denomina variables aleatorias
continuas.
La razón de utilizar intervalos, es debido a que en las variables continuas la probabilidad de
que una variable tome cualquier valor concreto es 0.
1. Distribución Weibull
Fue establecida por el físico suizo Weibull quien demostró que el esfuerzo al que se
someten los materiales puede modelarse de manera adecuada mediante el empleo de esta
distribución. También. Se ha usado para modelar situaciones del tipo tiempo- falla, o bien
puede indicar la vida útil de cierto artículo, planta o animal, confiabilidad de un componente,
pero uno de los grandes usos es con la descripción de las variaciones de viento. Esto es
muy importante para la industria eólica, ya que permite diseñar turbinas.
1 ( x / )
x e x 0
f ( x; , )
0 x 0
F x, , 1 e x
Los parámetros de esta distribución permiten gran flexibilidad para modelizar sistemas en
los que el número de fallos aumenta con el tiempo (por ejemplo, el desgaste), disminuye
con el tiempo (algunos semiconductores) o permanece constante (fallos provocados por
causas externas al sistema).
1.3 Propiedades de la distribución Weibull
1
𝐸(𝑋) = 𝛼 Γ ( + 1)
𝛽
Su varianza es:
2
2 2
2 1
𝜎 = 𝛼 {Γ ( + 1) − [Γ ( + 1)] }
𝛽 𝛽
Asuma que la vida de una lámpara fluorescente sigue una distribución Weibull con los
parámetros de forma (α) 2 horas y el parámetro de escala (β) de 10000.
Acumulado escriba VERDADERO, ya que devuelve el valor acumulado que va desde los
valores de x = 0 hasta el valor de x = 8000.
El resultado de P(x≤ 8000) = 0.4727, pero como se desea calcular que las lámparas duren
por lo menos 8000 horas se calcula el complemento.
x P( X <= x )
8000 0.472708
Opción 2: Gráfica > Gráficas de distribución de probabilidad > Ver probabilidad >
Aceptar
Para n < 30 que son las llamadas muestras pequeñas, el estadístico t es el apropiado.
Se llama distribución t de Student, por ser su descubridor Gosset, que publicó sus trabajos
con el seudónimo de “student” a principios del siglo XX.
Cuando n ≥ 30, la distribución t se aproxima a la distribución normal.
En este tipo de distribución se necesita un nuevo concepto que son los “grados de
libertad”, que se calculan por la fórmula:
𝜈+1 −
(𝜈+1)⁄
Γ( 2 ) 𝑡2 2
𝑓(𝑥) = (1 + ) , −∞ < 𝑡 < +∞
Γ(𝜈⁄2)√𝑘𝜋 𝜈
Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales con
𝑥̅ − 𝜇
media (µ) y desviación estándar (σ). Entonces la variable aleatoria 𝑡 = 𝑆⁄ tiene una
√𝑛
Se acostumbra representar con 𝑡𝛼 el valor t por arriba del cual se encuentra un área igual
a 𝛼. Como la distribución t es simétrica alrededor de una media de cero, se tiene que 𝑡1−𝛼 =
−𝑡𝛼 ; es decir, el valor t que deja un área de 1 − 𝛼 a la derecha y por tanto un área de 𝛼 a la
izquierda, es igual al valor t negativo que deja un área de 𝛼 en la cola derecha de la
distribución. Esto es, t0.95 = -t0.05, t0.99=-t0.01, etc.
Características:
3. Su varianza, n > 2
5. Cuando n ≥ 30 t = Z
6. Cuando los grados de libertad son altos, los valores de t coinciden con los de la normal.
2.3 Procedimiento para calcular de los valores críticos de t (ttabulada) con Minitab
Gráfica > Gráficas de distribución de probabilidad > Ver probabilidad > Aceptar
A continuación Minitab da como resultado el gráfico con los valores críticos de t (ver figura
5)
Gráfica > Gráficas de distribución de probabilidad > Ver probabilidad > Aceptar
El resultado se muestra en la figura 6 que corresponde a la gráfica de P(-t0.005 < t <-t0.05) que
corresponden a t1 = -2.977 y t2 = -1.761
Figura 6. Resultado de los valores de t de tablas de P(-t0.025 < t
<t0.05), representado gráficamente.
𝑥̅ − 𝜇
2.4 Procedimiento con Minitab para obtener tcalculada con la formula 𝑡 = 𝑆⁄
√𝑛
Distribución: Selecciona t
Da clic en cola derecha, porque el valor de la media muestral es mayor que la poblacional
Probabilidad: 0.05 que corresponde al valor de = 5%
Aceptar
x 16.4 12.0
t 3.45
s n 5.1 16
Comparando los valores de ttabulada (1.753)con los de tcalculada (3.45) se puede concluir que el
consumo de 12 al/ es real.
Grados de libertad: 15
x P( X <= x )
3.45 0.998214
Opción 2: Gráfica > Grafica de distribución de probabilidad > ver probabilidad >
aceptar
Distribución: Selecciona t
Da clic en cola derecha, porque el valor de la media muestral es mayor que la poblacional
Valor X: 3.45
Aceptar
Esta distribución es estadísticamente aplicada. Entre otros usos, sirve de base para
elaborar inferencias sobre la varianza de una población basada en una muestra.
n 1S 2
2
Tiene una distribución muestral que es una distribución Chi-cuadrada con g..l = n - 1 grados
de libertad y se denota X2 (X es la minúscula de la letra griega ji). El estadístico ji-cuadrada
está dado por:
X2
n 1S 2
2
Donde n es el tamaño de la muestra, S2 la varianza muestral y σ2 la varianza de la población
de donde se extrajo la muestra. El estadístico Chi-cuadrada también se puede dar con la
siguiente expresión:
x x
2
X 2
2
Propiedades de las distribuciones ji-cuadrada
La figura 9 ilustra tres distribuciones X2. Note que el valor modal aparece en el valor (n - 3)
= (g.l.- 2).
1
x x 0
1e 2
f ( x)
2 2
2
x 2
0 x0
La tabla que se utilizará para esta práctica es la del libro de probabilidad y estadística de
Walpole, la cual da valores críticos 𝑋𝛼2 (g.l.) para veinte valores especiales de α. Para
denotar el valor crítico de una distribución X2 con gl grados de libertad se usa el símbolo 𝑋𝛼2
(gl); este valor crítico determina a su derecha un área de α bajo la curva X2 y sobre el eje
horizontal. Por ejemplo para encontrar X20.05(6) en la tabla se localiza 6 gl en el lado
izquierdo y 0.05 a o largo del lado superior de la misma tabla.
Problema práctico 3.1
Para obtener los valores de Y2 cuando hay dos zonas sombreadas es : Y2 = (g.l., )
2
derecho y para el lado izquierdo Y2 = (g.l.,1- )
2
Entonces:
Cuando es una zona sombreada del lado izquierdo es: Y2=(g.l.,1-α) = (10,1 − 0.1) = (10,0.9)
= 4.865
(n 1) S 2
3.4 Procedimiento con Minitab para obtener X2calculada con la formula 𝑋 2
2
Problema práctico 3.2
Suponga que los tiempos requeridos por un cierto autobús para alcanzar un de sus destinos
en una ciudad grande forman una distribución normal con una desviación estándar σ=1
minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la
varianza muestral sea mayor que 2.
(n 1) S 2 (17 1)( 2)
X
2
32
2
(1) 2
Grados de libertad: 16
Aceptar
Chi-cuadrada con 16 GL
x P( X <= x )
32 0.990000
Con esto se obtiene la probabilidad de cola izquierda de la distribución chi cuadrado por lo
que al valor se le debe restar 1 el resultado obtenido.
(n 1) S 2
3.5 Procedimiento con Excel para obtener X2calculada con la formula 𝑋 2
2
FÓRMULAS > fx > Estadísticas > DISTR.CHICUAD
X el valor X2 calculada = 32
Acumulado VERDADERO
La P(X2 ≤ 32) = 0.99, con esto se obtiene la probabilidad de cola izquierda de la distribución
chi cuadrado por lo que al valor se le debe restar 1 el resultado obtenido.
g.l.1
Media: para g.l. 2 2
g.l.2 2
Características de la distribución F
1. Cuando g.l.1 > 2, g.l.2 >2, la curva de la distribución F es un curva unimodal asimétrica a
la derecha.
3. La amplitud de F va de 0 a α.
R.A. Fisher elaboró primero la distribución Z, que más tarde se transformó en la distribución
F. La relación entre F y Z es:
Y si Z = 2, entonces:
F= e2(2) = e4 = 54.59
Para manejar las tablas de Fisher (figura 12), se tendrá que buscar primero los grados de
libertad dos para luego localizar el área correspondiente, relacionándola con los grados de
libertad uno, para calcular el valor de F.
En este caso se puede buscar el área de 0.95 directamente en la tabla con sus
respectivos grados de libertad, es decir con α=0.05 y g.l.1=15 y g.l.2 =10, y el resultado
es 2.845
b) El área a la derecha de F es de 0.95 con g.l.1=6 y g.l.2=8.
Se tiene que buscar en la tabla un área de 0.05, puesto que nos piden un área a la derecha
de F de 0.95 con g.l.1=6 y g.l.2=8. Como es de lado izquierdo se saca a la inversa g.l.2=8 en
la horizontal y g.l.1=6 en la vertical, dando un valor de 4.417. Entonces:
1 1
FI(0.95) = 0.241
F 4.417
Cómo se pide el área a la izquierda de F de 0.10, se busca en las tablas el área de 0.90
con ambos g.l. 24, se busca la parte inversa y el valor es 1.702.
1 1
FI(0.1) = 0.588
F 1.702
𝑆12
4.4 Procedimiento con Minitab para obtener F calculada con la formula F=
𝑆22
g.l.1 = n1 – 1 = 16 – 1 = 15
g.l.2 = n2 – 1 = 18 – 1 = 17
Como se quiere calcular la probabilidad de que la varianza del río B sea ≥ 2, entonces:
8.09
[𝐹(15,17, 𝑔. 𝑙. ) ≥ 2 ∗ 7
] = [𝐹15,17 ≥ 2.31]
En el cuadro de diálogo
Aceptar
x P( X <= x )
2.31 0.950197
Como se desea calcular la probabilidad de que la varianza del río B sea el doble que la
varianza del río A, entonces, se calcula el complemento:
Aceptar
Software Minitab 16
Microsoft Excel
PROCEDIMIENTO
Resuelva en Minitab las actividades de la distribuciones continuas de probabilidad e
interpreta los resultados mediante el gráfico.
Actividad 1
Un fabricante de focos afirma que su producto durará un promedio de 500 horas de trabajo.
Para conservar este promedio esta persona verifica 25 focos cada mes. Si el valor “y”
calculado cae entre –t 0.05 y t 0.05, él se encuentra satisfecho con esta afirmación. ¿Qué
conclusión deberá él sacar de una muestra de 25 focos cuya duración fue?:
Actividad 3
Actividad 4
Actividad 5
Actividad 6
SUGERENCIAS DIDÁCTICAS
Resolver las actividades con la utilización de tablas de distribución con el objetivo de
comparar resultados.
Resolver ejercicios para calcular los valores críticos de la distribución t-Student, Chi-
cuadrada y Fischer con sus respectivos gráficos.
Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Asignatura Práctica No. Nombre de la Práctica
Probabilidad y Estadística 10 Distribución de la media
Ambiental muestral y diferencia de medias
con MINITAB
Competencias a desarrollar:
Solución de Problemas.
INTRODUCCIÓN
Existen multitud de mecanismos para seleccionar una muestra que sea representativa de
la población, y estos dependen principalmente de los recursos disponibles y de la
naturaleza de los elementos que componen la población. Hay dos preguntas fundamentales
en la selección de una muestra:
Cuántos elementos debe tener la muestra?, es decir, Cuál debe ser el tamaño de la
misma?
De qué forma se seleccionan esos elementos?
A la primera pregunta la mejor respuesta siempre es: cuantos más mejor. Normalmente son
los recursos disponibles para llevar a cabo el estudio o la población accesible la que limita
este tamaño. Si se quiere estudiar una población y se va a hacer a partir de una muestra,
es evidente que a mayor tamaño de la muestra más nos aproximamos a la población y por
tanto se podrá formular conclusiones más precisas acerca de la misma.
1. Tipos de Muestreo
1.1 Muestreo aleatorio simple.
Es el tipo de muestreo más simple y en él se basan todos los demás. Para obtener los
elementos de la muestra se numeran los elementos de la población y se seleccionan al azar
los elementos que debe contener la muestra. Todos los elementos tienen la misma
probabilidad de ser elegidos (figura 1)
Figura 1. Representación gráfica de muestreo
aleatorio simple
Hay dos tipos de muestreo aleatorio simple: el muestreo con reemplazo y sin reemplazo.
En el muestreo con reemplazo, después de que un elemento ha sido seleccionado de entre
el marco de la muestra se devuelve y es elegible para ser seleccionado de nuevo. En el
muestreo sin reemplazo, después de que un elemento se selecciona del marco de la
muestra, se retira de la población y no regresa a la base del muestreo. Este tipo de muestreo
suele ser más eficiente pues no permite que el mismo elemento de la población entre a la
muestra más de una vez.
Se puede realizar o bien con ayuda de una tabla de números aleatorios o bien mediante un
generador de números aleatorios (ordenador). En cualquier caso, será necesario enumerar
a todos los elementos de la población, y en algunos casos, la población ni siquiera es
numerable (por ejemplo, en un estudio medioambiental, la selección de peces en un río).
Por este motivo, en multitud de ocasiones este muestreo es adaptado para obtener un
método que, en la medida de lo posible, se acerque a él (la selección de elementos en la
muestra sea lo más aleatoria posible).
Como parte de una encuesta de contaminación del aire, un inspector decide examinar las
emisiones de 10 de los treinta camiones de una compañía, cada camión es identificado del
01 al 30.
Para solucionar el problema se puede hacer uso del Minitab para elegir a los diez camiones.
En la hoja de trabajo en la columna C1, se anotarán los números de los camiones con
formato de texto. A continuación se describe el procedimiento:
Cambiar la columna a formato de texto: Datos > Cambiar tipo de datos > Seleccionar
Numérico a texto
Para generar los 10 camiones aleatoriamente con o sin reemplazo se sigue la instrucción:
Los camiones elegidos aleatoriamente son: 02, 22, 30, 06, 15, 26, 13, 19, 24, 16
Nota: Como son números aleatorios en cada estudiante se generará diferentes camiones.
Este procedimiento exige numerar todos los elementos de la población, pero en lugar de
extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es
un número elegido al azar, y los elementos que integran la muestra son los que ocupa los
lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el
resultado de dividir el tamaño de la población entre el tamaño de la muestra:
k= N/n.
El número i que empleamos como punto de partida será un número al azar entre 1 y k.
El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la
población ya que al elegir a los miembros de la muestra con una periodicidad constante (k)
se puede introducir una homogeneidad que no se da en la población. Suponga que se
quiere testar el funcionamiento de una máquina, para lo cual se va a seleccionar una de
cada 15 piezas producidas. Si ocurriera la desgracia de que justamente 1 de cada 15 piezas
fuese defectuosa y el error de la máquina fuera defectuoso periódicamente, se tendría dos
posibles resultados muestrales: que falla siempre y que no falla nunca.
En la sierra de Arteaga se desea saber cuántos pinos han sido atacados por una plaga de
un escarabajo de la corteza, se sabe que existen 1050 pinos en la zona a muestrear. La
muestra se realiza de manera sistemática caminando en una línea tratando de recorrer
todos los pinos y muestrear 21 pinos.
1050
El valor de 𝐾 = 21
= 50, por lo que se debe seleccionar uno de cada 50 pinos.
Al seleccionar cada valor k-ésimo, debe usarse una tabla de números aleatorios para
seleccionar un valor entre 1 y k, incluso como punto inicial, es decir un valor entre 1 y 50.
El segundo elemento para la muestra es el punto inicial más el valor de k.
3, 53, 103, 153, 203, 253, 303, 353, 403, 453, 503, 553, 603, 653, 703, 753, 803, 853, 903,
953, 1003
Para calcular el número de elementos por estrato podemos hacer uso de una regla de tres,
de este modo:
𝑛 𝑛1
−− Dónde n = tamaño de la muestra
𝑁 𝑛𝑒
N = tamaño de la población
Entonces:
n1 = 40x100/500 = 8
n2 = 40x150/500 = 12
n3 = 40 x 50/500 = 4
n4 = 40x125/500 = 10
n5 = 40 x 75/500 = 6
Los habitantes de cada colonia están registrados y se les asignará un número, por ejemplo,
en el estrato 1 hay 100 habitantes entonces se numerará de 001 a 100, en el estrato 2 hay
150 y se numerará de 001 a 150 y así sucesivamente se hará con los de más estratos. Y
del tamaño de cada estrato se sacaran el número de muestras que se obtuvieron, por medio
del método de muestreo aleatorio simple haciendo uso del Minitab.
En la hoja de trabajo se pueden colocar en las diferentes columnas los estratos con formato
de texto y calcular los números aleatorios por separado como se explicó en el problema
práctico 1.1 del muestreo aleatorio simple. La opción es:
En la C1 se llamará estrato 1 y se colocarán los números del 001 al 100 que representan el
tamaño de la muestra y en la columna C2 se nombrará como muestra 1 y aquí se obtendrán
las ocho muestras elegidas aleatoriamente.
Del estrato 1 (1 a 100) se tomarán 8 muestra, las muestras son: 096, 010, 061, 077, Del
estrato 2 (1 a 150) se tomarán 12 muestras y las muestras son: 101, 013, 054,016, 055,
079, 123, 031, 027, 033, 014, 026.
Del estrato 3 (1 a 50) se tomarán 4 muestras y son: 018, 045, 016, 037
Del estrato 4 (1 a 125) se tomarán 10 muestras y las muestras son: 042, 055, 087, 067,
031, 062, 101, 073, 085, 122.
Del estrato 5 /1 a 75) se tomarán 6 muestras y estas son: 041, 050, 036, 029, 072, 042.
Por algunas razones naturales, los elementos muestrales se encuentran formando grupos,
como por ejemplo, las personas que viven en colonias de una ciudad, lo elementos de una
caja de una línea de producción, los clubes de personas, las áreas arboladas de un terreno,
etc.
Como el objetivo del muestreo es levantar la mayor cantidad de información al menor costo,
en este tipo de casos lo más económico el encuestar a un elemento muestral y a todos sus
vecinos, así se ahorran los costos de un traslado del encuestador. A este modelo de
muestreo se llama “por conglomerados”, ya que una vez seleccionado un elemento para la
muestra, se incluyen también a todos los elementos que estén alrededor de él. A diferencia
del muestreo estratificado, este muestreo no requiere que los elementos tengan
características homogéneas. Es decir son heterogéneos en su interior, pero diferentes entre
sí en propiedades y tamaño.
Si se va a realizar una encuesta sobre las políticas y leyes de la contaminación del aire en
la Ciudad de México, como se haría un muestreo por conglomerados. Si se desea
seleccionar al azar a cuatro conglomerados y seleccionar aleatoriamente 200 colonias a
visitar para realizar la entrevista.
2. Error en el muestreo.
De la misma manera, tal vez la desviación estándar u otra medición que se calcule con base
en la muestra no sea igual al valor correspondiente de la población. Por tanto, es posible
que existan ciertas diferencias entre los estadísticos de la muestra (como la media o la
desviación estándar), y los parámetros de población correspondientes. A dicha diferencia
se la conoce como error de muestreo.
Por ejemplo, supongamos que se ha obtenido una muestra aleatoria de tamaño 25 de una
población con media µ = 15: si la media de la muestra es 𝑥̅ =12, entonces a la diferencia
observada 𝑥̅ − 𝜇 = −3 se le denomina el error muestral. Una media muestral 𝑥̅ puede
pensarse como la suma de dos cantidades, la media poblacional µ y el error muestral; si e
denota el error muestral, entonces:
𝑥̅ = 𝜇 + 𝑒
Como el muestreo es con reemplazo y se van a tomar 2 elementos de una población que
tiene tres valores (2, 4, 6), se hace uso dela siguiente formula:
Así que se tendría 9 muestras ordenadas de tamaño 2, a las cuales se calcularían sus
medias muestrales y el error muestral por medio de las formulas.
La siguiente tabla contiene una lista de todas las muestras ordenadas de tamaño 2 que es
posible seleccionar con reemplazo y también contiene las medias muestrales y los
correspondientes errores muestrales.
Muestras ordenadas ̅
Media muestral 𝒙 ̅−𝝁
Error muestral 𝒆 = 𝒙
(2,2) 2 2 - 4 = -2
(2,4) 3 3 – 4 = -1
(2,6) 4 4–4=0
(4,2) 3 3 – 4 = -1
(4,4) 4 4–4=0
(4,6) 5 5–4=1
(6,2) 4 4–4=0
(6,4) 5 5–4=1
(6,6) 6 6–4=2
μx̅ = (2 + 3 + 4 + 3 + 4 +5 + 4 + 5 + 6)/9 = 4
Si se considera todas las muestras aleatorias posibles, cada una de ellas de tamaño
n, se cumplirá que 𝜇𝑥̅ = 𝜇 y 𝜎𝑥̅ = 𝜎⁄ .
√𝑛
Además, si 𝑥̅ sigue una distribución normal, X también será normal.
𝑁!
𝑘= 𝑁 𝐶𝑛 =
𝑛! (𝑁 − 𝑛)!
Cuando las muestras se toman de una población pequeña y sin reemplazo, se puede usar
la formula siguiente para encontrar 𝜎𝑥̅ , como factor de corrección.
𝜎 𝑁−𝑛
𝜎𝑥̅ = √
√𝑛 𝑁 − 1
𝑘 = 𝑁𝑛
𝑁−𝑛
El factor de corrección √ 𝑁−1 para una población finita. Pero en la práctica este factor es
omitido a menos que la muestra sea lo suficientemente grande comparada con la población.
Cuando los tamaños muestrales se hacen más grandes, las distribuciones de media
muestral empiezan a aproximarse a una distribución normal y la variación entre las medias
disminuye, y entonces, se aplica el teorema de límite central para la distribución de la media
muestral.
Con esta distribución se puede calcular la probabilidad de algún evento relacionado con la
variable aleatoria, mediante la siguiente fórmula:
𝑥−𝜇
𝑧=
𝜎
En donde z es una variable estandarizada con media igual a cero y varianza igual a uno.
Con esta fórmula se pueden a hacer los cálculos de probabilidad para cualquier ejercicio,
utilizando la tabla de la distribución z.
Se sabe que cuando se extraen muestras de tamaño mayor a 30 o bien de cualquier tamaño
de una población normal, la distribución muestral de medias tiene un comportamiento
aproximadamente normal, por lo que se puede utilizar la fórmula de la distribución normal
con 𝜇 = 𝜇𝑥̅ y 𝜎 = 𝜎𝑥̅ , entonces la fórmula para calcular la probabilidad del comportamiento
del estadístico, en este caso la media de la muestra, quedaría de la siguiente manera:
𝑥̅ − 𝜇
𝑧=𝜎
⁄ 𝑛
√
𝑥̅ − 𝜇
𝑧=
𝜎 𝑁−𝑛
⁄ 𝑛 √𝑁 − 1
√
Suponga que en un establo, ordeñan e veces al día a vacas de la raza Holstein, arrojando
los siguientes resultados en litros/vaca: 54, 55, 59, 63, 64, 68, 69 y 70.
Suponga que se toman todas las muestras posibles de tamaño n=2 de esta población con
reemplazo encuentre:
a) la distribución de la media
b) pruebe que x .
Haciendo uso de Minitab, escriba los nombres a las columnas, llama a la columna C1,
“Población”, a la C2 “Muestra1, C3 “Muestra 2” y C4 “Medias Muestrales”
En la columna C1 captura los datos de la población y calcula la media poblacional (µ) con
la opción
En el cuadro de diálogo
Da Aceptar
El tamaño de la muestra es 2, y como es con reemplazo, para calcular todas las muestras
posibles hacemos uso de la fórmula: k= Nn = 82= 64 posibles combinaciones. Las cuales
son:
Una vez realizado la captura, calcula las medias muestrales en la columna C4 con la opción:
Da Aceptar
Se sigue el mismo procedimiento para calcular la media poblacional, solo que la variable
de entrada es la columna C4 Medias Muestrales, y el resultado es el siguiente:
Gráfica > Histograma > en el cuadro de diálogo selecciona con ajuste y da Aceptar
La figura 12 se representa el gráfico del Histograma de las medias muestrales.
Considerar una población que consiste de 3, 4, 6, 8, 10, 11, 12, 15, 20 y se extraen 30
muestras de tamaño 4. Calcular:
a) µ, la media poblacional.
Estadísticas: Da clic y en la siguiente ventana, activa ninguna, para desactivar todos los
estadísticos y selecciona la media y la desviación estándar. Da clic en
aceptar y nuevamente aceptar, ver figura 13.
Da Aceptar
Recuerda que los datos pueden salir diferente a los mostrados en este problema por ser
datos aleatorios.
Variables de entrada: Selecciona obs1, obs2, obs3, obs4 como se muestra en la figura 15.
Da Aceptar
A continuación muestran los resultados de las medias obtenidas de cada una de las
muestras.
En el cuadro de diálogo:
Da Aceptar
Interpretación: Notar que la media de las medias muestrales es 𝜇𝑥̅ = 10.508 que está
cerca de la media poblacional µ = 9.89. Además la desviación estándar de la media muestral
es 3.028 mientras que 𝜎⁄ es igual 5.42⁄ = 2.71 ambos valores también están
√𝑛 √4
relativamente cerca. El histograma si está un poco alejado de la normalidad. Si se
incrementa el tamaño de las muestras se puede notar una mejor aproximación a la
Normal.
Suponga que se tienen dos poblaciones distintas, la primera con media µ1 y desviación
estándar σ1, y la segunda con media µ2 y desviación estándar σ2. Más aún, se elige una
muestra aleatoria de tamaño n1 de la primera población y una muestra independiente
aleatoria de tamaño n2 de la segunda población; se calcula la media muestral para cada
muestra y la diferencia entre dichas medias (ver figura 17)
x1 x 2 1 2 y que 12 22
, por lo que no es difícil deducir que x1 x 2 .
n1 n2
x1 x2 1 2
z
12 22
n1 n2
En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en una
escuela primaria se usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe
que tanto para niños como para niñas los pesos siguen una distribución normal. El promedio
de los pesos de todos los niños de sexto grado de esa escuela es de 100 libras y su
desviación estándar es de 14.142, mientras que el promedio de los pesos de todas las niñas
del sexto grado de esa escuela es de 85 libras y su desviación estándar es de 12.247 libras.
Si x1 representa el promedio de los pesos de 20 niños y x 2 es el promedio de los pesos de
una muestra de 25 niñas, encuentre la probabilidad de que el promedio de los pesos de los
20 niños sea al menos 20 libras más grande que el de las 25 niñas.
Sí:
p( ( x1 x2 20)
z=1.25
Gráfica > Gráfica de distribución de probabilidad > Selecciona ver probabilidad >
Aceptar
Selecciona Cola derecha porque se quiere calcular un valor mayor al resultado µ1 -µ2 (>20)
Da Aceptar
Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños sea al
menos 20 libras más grande que el de la muestra de las niñas es 0.1056.
MATERIALES Y EQUIPO
Práctica Impresa
Calculadora
Software Minitab 16
PROCEDIMIENTO
Resuelva las siguientes actividades con el uso de Minitab.
Actividad 1
Actividad 2
Actividad 3
Considerando como población los número naturales impares del 1 al 40, extrae una muestra
de tamaño 15 por medio de un muestreo aleatorio simple. Utilice el Minitab para elegir a las
muestras.
Actividad 4
Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos
compañías. Los tubos de la compañía A tienen una vida media de 7.2 años con una
desviación estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7
años con una desviación estándar de 0.7. Determine la probabilidad de que una muestra
aleatoria de 34 tubos de la compañía A tenga una vida promedio de al menos un año más
que la de una muestra aleatoria de 40 tubos de la compañía B.
Actividad 5
Los seis pozos que conforman el campo exploratorio Corocito tiene un producción de en
miles de BND de 1.0, 1.2, 2.1, 0.7, 2.6 y 0.3. A partir de estos datos se pide calcular sin
reemplazo.
Actividad 6
Actividad 7
Se tomaron muestras agua de cinco tuberías de agua potable para determinar la cantidad
de plomo en ppm y los resultados fueron 2, 3, 6, 8 y 11. Considere todas las muestras
posibles de tamaño 2 que pueden obtenerse con reemplazo de esta población. Encuentra:
Actividad 8
Una empresa de material eléctrico fabrica bombillas que tienen una duración que se
distribuye aproximadamente en forma normal, con media de 800 horas y desviación
estándar de 40 horas. Calcule la probabilidad de que una muestra aleatoria de 16 bombillas
tenga una vida promedio de menos de 775 horas.
SUGERENCIAS DIDÁCTICAS
Elaborar un caso práctico con base en la utilización de los diferentes tipos de muestreo y
obtener las muestras para calcular los parámetros de la población.
Competencias a desarrollar:
Solución de Problemas.
INTRODUCCIÓN
Si se extrae una muestra aleatoria de tamaño n de una población normal con media μ y
varianza σ2, y se calcula la varianza muestral, se obtiene un valor del estadístico S2.
A la distribución muestral de la varianza (S2) se le conoce también como Ji-cuadrado o Chi-
cuadrada (Χ 2). Es decir, que si se extraen todas las muestras posibles de una población
normal y a cada una se le calcula la varianza, se obtendrá la distribución muestral de las
varianzas.
Entonces el estadístico:
𝑛
2
(𝑛 − 1)𝑆 2 (𝑋𝑖 − 𝑋̅)2
𝜒 = = ∑
𝜎2 𝜎2
𝑖=1
(𝑛 − 1)𝑆 2
𝜒2 =
𝜎2
Donde:
n es el tamaño de la muestra
𝑆 2 es la varianza muestral
El cálculo de probabilidad de una distribución muestral de varianzas nos sirve para saber
cómo se va a comportar la varianza o desviación estándar en una muestra que proviene de
una distribución normal. También es utilizada para obtener una estimación por intervalos y
realizar pruebas de hipótesis para una varianza poblacional.
Sea una población donde se observa la variable aleatoria X . Supongamos que Xi:
(𝑛 − 1)𝑆 2 24 𝑥12.16
𝜒2 = = = 18.24
𝜎2 16
Gráfica > Gráfica de distribución de probabilidad > selecciona Ver probabilidad >
Aceptar
Definir área sombreada por: Selecciona Valor de X y cola derecha porque se quiere
calcular un valor mayor de la varianza muestral
Da Aceptar
2
La P(Χ 𝑛−1 ≥ 12.16) = 0.7912
Interpretación:
Que como el 95% de los valores de Χ 2 con 24 grados de libertad cae entre 12.4 y 39.36, el
valor calculado con σ2 = 16 unidades es razonable y, por lo tanto, la desviación estándar de
la medición realizada con un instrumento de precisión es mayor a 4 unidades.
Otro método para comparar dos poblaciones es comparar sus varianzas. Surgen muchas
aplicaciones estadísticas en las que deben compararse las varianzas poblacionales. En
aplicaciones industriales referentes a dos métodos o máquinas para producir el mismo
producto, se utilizan con frecuencia las varianzas y se las compara con propósitos de control
de calidad.
La distribución F tiene una amplia aplicación en la comparación de varianzas muestrales y
también es aplicable en problemas que implican dos o más muestras.
Definición de la distribución F:
𝑆12
⁄ 2 𝜎22 𝑆12
𝜎
𝐹= 2 1 = 2 2
𝑆2 𝜎1 𝑆2
⁄ 2
𝜎2
Si 𝑆12 y 𝑆22 son las varianzas muestrales de muestras aleatorias independientes de tamaños
n1=10 y n2 =20, tomadas de poblaciones normales que tienen las mismas varianzas,
𝑆2
encuentre P( 1⁄ 2 ≤ 2.42).
𝑆2
Gráfica > Gráfica de distribución de probabilidad > selecciona Ver probabilidad >
Aceptar
Distribución: Selecciona F
Da Aceptar
𝑆2
La P( 1⁄ 2 ≤ 2.42) = 0.9498
𝑆2
MATERIALES Y EQUIPO
Práctica Impresa
Calculadora
Software Minitab 16
PROCEDIMIENTO
Resuelva las siguientes actividades con el uso de Minitab.
Actividad 1
Actividad 2
Las rentabilidades mensuales de cierto tipo de acciones son independientes unas de otras
y siguen una distribución normal con desviación estándar de 1.7. Se toma una muestra de
12 meses. Hallar la probabilidad de que la desviación estándar muestral sea:
b) mayor que 1.
Actividad 3
Una óptica adquiere cristales, y se sabe que la varianza del índice de refracción de esta
clase de cristales es 1.36 x 10-4. Ya que se necesita que los diversos cristales tengan un
índice de refracción muy parecido, la óptica rechaza uno de los cargamentos si la varianza
muestral de 30 cristales, escogidos al azar exceda a 2.02 x10-4. Suponiendo que los valores
muestrales pueden considerarse como una muestra aleatoria de una población normal
¿Cuál es la probabilidad de que un cargamento sea rechazado a pesar que la varianza es
de 1.36 x 10-4?
Actividad 4
Una cierta empresa fabrican bombillas cuya tiempo de vida sigue una distribución normal.
a) 0.05 es la probabilidad de que la varianza muestral sea mayor que ¿qué porcentaje
de la varianza poblacional?
b) 0.10 es la probabilidad de que la varianza muestral sea mayor que ¿qué porcentaje
de la varianza poblacional?
Actividad 5
Si 𝑆12 y 𝑆22 representan las varianzas de las muestras aleatorias independientes de tamaño
n1= 25 y n2 = 31, tomadas de poblaciones normales con varianzas 𝑆12 =10 y 𝑆22 = 15,
𝑆2
respectivamente, encuentre P( 1⁄ 2 > 1.26).
𝑆2
Actividad 6
Método 1 Método 2
n1 = 31 n2 = 25
𝑆12 = 50 𝑆22 = 24
𝑆2
Encuentre la P( 1⁄ 2 ≤ 1.672) si las varianzas poblacionales son iguales.
𝑆2
Actividad 7
SUGERENCIAS DIDÁCTICAS
Elaborar un caso práctico con base en la utilización de los diferentes tipos de muestreo y
obtener las muestras para calcular los parámetros de la población.
Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Asignatura Práctica No. Nombre de la Práctica
Probabilidad y Estadística 12 Intervalos de confianza para
Ambiental medias con MINITAB
Competencias a desarrollar:
Solución de Problemas.
INTRODUCCIÓN
1. Estimación de parámetros.
La inferencia estadística asume que se cuenta con datos de una muestra y que se desea
conocer cuáles son las características (ya sea la media, la desviación estándar, la varianza
o cualquier otro que pueda interesar), no de esa muestra, sino de la población a la que esa
muestra pertenece. A los valores de esas características a nivel poblacional se les conoce
como parámetros y se representan simbólicamente con letras griegas (en realidad, sólo
algunos de ellos tienen tal privilegio): 𝜇𝑥 , 𝜎𝑥2 , 𝜎𝑥 , etc.
Para conocer los valores de los parámetros se pueden plantear, bien recoger datos para
todos los elementos de la población, algo que puede resultar poco viable en muchas
situaciones prácticas, o bien, realizar una estimación de los mismos a partir de los datos de
una muestra. Esta segunda vía es mucho más habitual en la práctica, si bien, supone asumir
cierto riesgo de error pues, en cuanto que estimación, el valor que se obtenga no tiene por
qué coincidir con el verdadero valor de ese parámetro.
Una estimación puntual del valor de un parámetro poblacional desconocido (como puede
ser la media µ , o la desviación estándar σ ), es un número que se utiliza para aproximar el
verdadero valor de dicho parámetro poblacional. A fin de realizar tal estimación, se tomará
una muestra de la población y se calculará el parámetro muestral asociado (𝑋̅ para la media,
𝑆 para la desviación estándar, etc.). El valor de este parámetro muestral será la estimación
puntual del parámetro poblacional.
Por ejemplo, suponga que la compañía Sonytron desea estimar la edad media de los
compradores de equipos de alta fidelidad. Seleccionan una muestra de 100 compradores y
calculan la media de esta muestra, este valor será un estimador puntual de la media de la
población.
Observar que cuanto mayor sea el tamaño de la muestra n, menor será la variabilidad del
estimador 𝑥̅ , por tanto, mejor serán nuestras estimaciones.
1.2 Estimación por Intervalo
Para que la estimación puntual pueda ser más viable se formuló la estimación por intervalos
en la que el estimador puntual se sujeta a la adición y a la sustracción de un error muestral
máximo y con ello produce una gama de valores entre los cuales se supone con una
determinada confianza que está contenido en el parámetro.
𝜇
99% ՜ 𝛼 = 0.01
𝑥1 95% ՜ 𝛼 = 0.05 𝑥2
90% ՜ 𝛼 = 0.10
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒
= 𝑥̅ ± 𝑧(𝜎𝑥̅ ) 𝑠𝑖 𝑠𝑒 𝑐𝑜𝑛𝑜𝑐𝑒 𝜎 ; sabiendo que:
𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎
𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑓𝑖𝑛𝑖𝑡𝑎
𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑖𝑛𝑓𝑖𝑛𝑖𝑡𝑎
𝜎 ; 𝜎 𝑁−𝑛
𝜎𝑥̅ = 𝜎𝑥̅ = (√ )
√𝑛 √𝑛 𝑁−1
𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑓𝑖𝑛𝑖𝑡𝑎
𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑖𝑛𝑓𝑖𝑛𝑖𝑡𝑎
𝑆 ; 𝑆 𝑁−𝑛
𝑆𝑥̅ = 𝑆𝑥̅ = (√ )
√𝑛 √𝑛 𝑁−1
𝑔. 𝑙. = 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 = 𝑛 − 1
𝛼 = 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑠𝑒𝑎𝑑𝑜 (0.10 , 0.05 , 0.01)
𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑓𝑖𝑛𝑖𝑡𝑎
𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑖𝑛𝑓𝑖𝑛𝑖𝑡𝑎
𝑆 ; 𝑆 𝑁−𝑛
𝑆𝑥̅ = 𝑆𝑥̅ = (√ )
√𝑛 √𝑛 𝑁−1
En la siguiente tabla se muestran los valores de "𝒛" para los niveles de confianza deseado.
90 % 0.10 1.645
95 % 0.05 1.96
99 % 0.01 2.58
Tamaño de la muestra = 36
Datos resumidos: Selecciona esta opción. Al elegir esta opción se activan los conceptos
siguientes:
Tamaño de la muestra: Ingresa el valor para el tamaño de la muestra que es
36
Z de una muestra
Error
estándar
de la
N Media media IC de 95%
36 2.6000 0.0500 (2.5020, 2.6980)
Interpretación:
Con un nivel de confianza al 95% se puede afirmar que la concentración media de zinc en
agua en la población se encuentre en 2.502 mg/l y 2.698 mg/l.
Problema práctico 2.2
En una ciudad se eligieron al azar 31 muestras de las temperaturas más altas que se han
registrado en °C, las cuales fueron: 32, 31, 33, 36, 38, 32, 31, 30, 31, 31, 35, 34, 29, 30, 32,
31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
Construya un intervalo del 90% de confianza para conocer temperatura media poblacional.
Con mucha frecuencia los estadísticos recomiendan que incluso cuando no sea posible
suponer la normalidad, se desconoce σ y n ≥ 30, σ se puede reemplazar con 𝑆 para poder
utilizar el intervalo de confianza, como se presenta en este ejemplo, donde, n = 31 y se
desconoce σ.
Estadísticas descriptivas: C1
Z de una muestra: C1
Error
estándar
de la
Variable N Media Desv.Est. media IC de 90%
C1 31 31.452 2.188 0.393 (30.805, 32.098)
Interpretación:
El contenido de siete contenedores similares de ácido sulfúrico son 9.8, 10.2, 10.4, 9.8,
10.0, 10.2, y 9.6 litros. Encuentre un intervalo de confianza del 95% para la media de todos
los contenedores si se supone una distribución aproximadamente normal.
En la hoja de trabajo de Minitab, en la columna 1 introducir los datos del contenido de ácido
sulfúrico de los siete contenedores. Si desea da un nombre a la variable aleatoria, por
ejemplo se le puede nombrar “litros”, en la parte sombreada de la columna 1, esto es
opcional.
Estadísticas descriptivas: C1
La instrucción es:
Da aceptar
T de una muestra: C1
Error
estándar
de la
Variable N Media Desv.Est. media IC de 95%
C1 7 10.000 0.283 0.107 (9.738, 10.262)
Interpretación.
Con un nivel de confianza del 95% se sabe que el promedio del contenido de los
contenedores está entre 9.74 y 10.26 litros.
Si los tamaños de muestras n1 y n2 son mayores que 30, entonces, puede emplearse el
intervalo de confianza de la distribución normal. Sin embargo, cuando se toman muestras
pequeñas se supone que las poblaciones de interés están distribuidas de manera normal,
y los intervalos de confianza se basan en la distribución t.
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒 𝜎1 2 𝜎2 2
𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑝𝑎𝑟𝑎 = (𝑥̅1 − 𝑥̅2 ) ± 𝑧(𝜎𝑥̅1 −𝑥̅ 2 ) 𝑠𝑖 𝑠𝑒 𝑐𝑜𝑛𝑜𝑐𝑒 𝜎 𝑑𝑜𝑛𝑑𝑒 𝜎𝑥̅1 −𝑥̅2 = √ +
𝜇1 − 𝜇2 𝑛1 𝑛2
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒
𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑝𝑎𝑟𝑎 = (𝑥̅1 − 𝑥̅2 ) ± 𝑧(𝑆𝑥̅1 −𝑥̅2 ) 𝑠𝑖 𝑛𝑜 𝑠𝑒 𝑐𝑜𝑛𝑜𝑐𝑒 𝜎 𝑦 𝑛 > 30
𝜇1 − 𝜇2
𝑆1 2 𝑆2 2
𝑑𝑜𝑛𝑑𝑒 𝑆𝑥̅1 −𝑥̅2 = √ +
𝑛1 𝑛2
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒
𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑝𝑎𝑟𝑎 = (𝑥̅1 − 𝑥̅2 ) ± 𝑡(𝑔. 𝑙. , 𝛼⁄2)(𝑆𝑥̅1 −𝑥̅ 2 ) 𝑠𝑖 𝑛𝑜 𝑠𝑒 𝑐𝑜𝑛𝑜𝑐𝑒 𝜎 𝑦 𝑛 < 30
𝜇1 − 𝜇2
(𝑆1 2 )(𝑛1 − 1) + (𝑆2 2 )(𝑛2 − 1)
𝑑𝑜𝑛𝑑𝑒 𝑔. 𝑙. = 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 = 𝑛1 + 𝑛2 − 2 𝜎̂ 2 =
𝑛1 + 𝑛2 − 2
𝜎̂ 2 𝜎̂ 2
𝑆𝑥̅1 −𝑥̅2 = √ +
𝑛1 𝑛2
Si 𝑋̅1 = 400.9, 𝑆1 =10.6, 𝑋̅2 = 367.2 y 𝑆2 =6.1, el tamaño de ambas muestras es de n = 15,
como se desconoce σ y el tamaño de la muestra es pequeño se utiliza la expresión 3.1 con
“t”
En el cuadro de diálogo realiza lo siguiente de acuerdo a cada uno de los elementos que la
componen (ver figura 7)
Muestras en una columna: Elija esta opción si los datos de las muestras se encuentran
en una columna individual. Por lo tanto se deja sin seleccionar.
Muestras en diferentes columnas: Elija esta opción si los datos de las dos muestras están
en columnas separadas. Se deja sin seleccionar.
Datos resumidos (diferencias): Elija esta opción para introducir los datos. Al seleccionar
esta opción se activan los siguientes elementos e
introduzca los datos que se piden:
Asumir varianzas iguales: Marca esta opción cuando las varianzas poblacionales son
iguales.
En la parte inferior del cuadro de diálogo selecciona Opciones y realiza lo siguiente (ver
figura 8):
Error
estándar
de la
Muestra N Media Desv.Est. media
1 15 400.9 10.6 2.7
2 15 367.20 6.10 1.6
Interpretación:
El intervalo de confianza de 98% para la diferencia en las medias de la dureza entre las
muestras curadas por los dos métodos es de 25.91 a 41.49 con una desviación estándar
poblacional de 8.65.
MATERIALES Y EQUIPO
Práctica Impresa
Calculadora
Software Minitab 16
PROCEDIMIENTO
Resuelva las siguientes actividades con el uso de Minitab.
Actividad 1
Las concentraciones de Zinc que se sacan del agua de 7 en sitios diferentes son: 2.5, 2.4,
2.6, 2.65, 2.76, 2.8, 2.71 gramos por mililitro. Encuentra el intervalo de confianza de 95%
para la concentración media de zinc en el río.
Actividad 2
En una explotación minera, las rocas excavadas se someten a un análisis químico para
determinar su contenido porcentual de cadmio. Se puede suponer que este contenido es
una variable con distribución normal de media µ y varianza σ2. Después de analizar 25
rocas se obtiene un contenido porcentual medio de 9.77 con una desviación típica de 3.164.
Construya un intervalo de confianza de nivel 95% para el contenido porcentual medio de
cadmio en la mina.
Actividad 3
Actividad 4
Se seleccionó una muestra de 12 detectores de radón y cada uno se expuso a 100 pCi/l
(picocuries por litro) de radón. Las lecturas resultantes fueron: 105.6, 90.9, 91.2, 96.9, 91.3,
100.0, 105.0, 99.6, 107.7, 103.3, 92.4 y 96.5. Considerando que la distribución de las
lecturas es normal, construir e interpretar un intervalo del 99% de confianza para la lectura
media poblacional.
Actividad 5
Los datos que a continuación se dan son los pesos en kilogramos del contenido de 16
muestras de recolección de basura en una comunidad con el propósito de verificar el peso
promedio: 5.06, 5.08, 4.99, 5.03, 5.04, 5.10, 4.97, 5.12, 5.14, 5.05, 4.93, 4.96, 5.06, 5.02,
5.09, 4.96. Si el peso de cada muestra de basura es una variable aleatoria normal con un
desviación estándar de 0.05 kilos obtener un intervalo del 90% de confianza para la media
poblacional.
Actividad 6
Actividad 7
Se midió cinco veces el contenido de carbono (en partes por millón) para cada una de las
dos placas de silicio diferentes.
Actividad 8
El artículo “Quality of the Fire Clay Coal Bed. Southeastern Kentuchy” (J. Hower, W.
Andrews y cols., en Journal of Coal Quality, 1994:13-26) contiene mediciones acerca de
muestras de carbón en algunos condados de Kentucky. En unidades de porcentajes de
ceniza, cinco muestras del condado de Knott tenían un promedio de dióxido de aluminio
(AlO2) de 32.17 y desviación estándar de 2.23. Seis muestras de condado de Leslie tenían
un promedio de contenido de AlO2 de 26.48 y desviación estándar de 2.02. Determine un
intervalo de confianza de 98% para la diferencia en el contenido de AlO2 contenido entre
las muestras de carbón de los dos condados.
SUGERENCIAS DIDÁCTICAS
Resolver cada uno de las actividades con el apoyo de tablas y formulas con el fin de
comparar los resultados.
Retomar el caso práctico del tema de muestreo y calcular el intervalo de confianza para la
media al 95 y al 99 %.
Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Asignatura Práctica No. Nombre de la Práctica
Probabilidad y Estadística 13 Intervalos de confianza para la
Ambiental varianza con MINITAB
Competencias a desarrollar:
Solución de Problemas.
INTRODUCCIÓN
Para construir un intervalo de confianza para la varianza de la población se toma como base
para el cálculo de probabilidades la distribución chi-cuadrada.
Los limites para un intervalo de confianza de la varianza poblacional del (1 - ) % pueden
encontrarse considerando la partición de la curva de la distribución, figura 1.
Si se tiene una población de valores con distribución normal, puede mostrarse que las
distribuciones 𝜒 2 ( 𝑗𝑖 − 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑎) son las distribuciones de probabilidad apropiadas para la
razón:
(𝑛 − 1)𝑆 2
𝜎2
Existe una distribución 𝜒 2 distinta para los diferentes valores (𝑛 − 1) que representan los
grados de libertad, asi:
(𝑛 − 1)𝑆 2
𝜒 2 𝑔. 𝑙. =
𝜎2
Como se sabe que el cociente anterior tiene una distribución 𝜒 2 , puede utilizarse esta
distribución para realizar inferencias estadísticas acerca de varianzas o desviaciones
desconocidas.
Las distribuciones 𝜒 2 no son simétricas, por ello, un intervalo de confianza de dos extremos
para una varianza requiere de dos valores distintos de 𝜒 2 , en vez del método ± que se
utilizo en los intervalos de confianza que se basan en la distribución normal.
Para construir intervalos de confianza para una varianza poblacional se utiliza la siguiente
formula:
El cuadro de diálogo realiza el siguiente procedimiento para cada uno de los elemento (ver
figura 2)
Datos: Elija uno de los siguientes elementos de la lista desplegable de acuerdo a los datos
del problema, en este caso se conoce desviación estándar de la muestra. Al
seleccionar esta opción se activa:
Método
Estadísticas
N Desv.Est. Varianza
16 2.20 4.84
IC para IC para
Método Desv.Est. varianza
Chi-cuadrada (1.49, 3.97) (2.21, 15.78)
Para calcular el IC para la desviación estándar se saca raíz cuadrada a cada uno de los
valores obtenidos de la varianza, es decir √2.21 𝑦 √15.78.
Interpretación:
El cuadro de diálogo realiza el siguiente procedimiento para cada uno de los elemento (ver
figura 5)
Datos: No se modifica
Al dar clic en Opciones, aparece un segundo cuadro de diálogo, que sirve para definir el
intervalo de confianza y realiza lo siguiente:
Método
Estadísticas
IC para IC para
Variable Método Desv.Est. varianza
C1 Chi-cuadrada (15.0, 27.9) (226, 779)
Bonett (14.7, 28.5) (217, 814)
Interpretación:
𝝈𝟏 𝟐⁄
2. Intervalos de confianza la razón de dos varianzas
𝝈𝟐 𝟐
𝑈⁄
𝑔. 𝑙.1
𝐹=
𝑉⁄
𝑔. 𝑙.2
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒
𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑝𝑎𝑟𝑎 𝑆1 2 1 𝜎1 2 𝑆1 2
= ( 2) ( ) ≤ 2 ≤ ( 2 ) (𝐹𝛼⁄2 (𝑔. 𝑙.2 , 𝑔. 𝑙.1 ))
𝜎1 2⁄ 𝑆2 𝐹𝛼⁄2 (𝑔. 𝑙.1 , 𝑔. 𝑙.2 ) 𝜎2 𝑆2
𝜎2 2
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒
𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑝𝑎𝑟𝑎 = (𝑆1 ) ( 1
)≤
𝜎1 𝑆1
≤ ( ) (𝐹𝛼⁄ (𝑔. 𝑙.2 , 𝑔. 𝑙.1 ))
𝜎1 𝑆2 𝐹𝛼⁄2 (𝑔. 𝑙.1 , 𝑔. 𝑙.2 ) 𝜎2 𝑆2 2
⁄𝜎2
Método 1 Método 2
n1 = 31 n2 = 25
𝑆12 = 50 𝑆22 = 24
𝜎1 2⁄
Construya un intervalo de confianza al 90 % para
𝜎2 2
El procedimiento para resolver problemas con dos varianzas en Minitab se realiza de la
siguiente manera: instrucción:
El cuadro de diálogo realiza el siguiente procedimiento para cada uno de los elemento (ver
figura 6)
Datos: Elija uno de los siguientes elementos de la lista desplegable de acuerdo a los datos
del problema, en este caso se conoce varianzas de la muestra.
Primero: Ingresa la columna que contiene los datos para la primera muestra.
Segundo: Ingresa la columna que contiene los datos para la segunda muestra.
* NOTA * Las gráficas que no sean gráficas de intervalos no se pueden crear con
datos resumidos.
Método
Estadísticas
IC para IC para
Distribución relación de relación de
de los datos Desv.Est. varianza
Normal (1.037, 1.983) (1.074, 3.932)
Pruebas
Estadística
Método GL1 GL2 de prueba Valor P
Prueba F (normal) 30 24 2.08 0.069
Además, automáticamente Minitab genera la representación gráfica de intervalos de la
desviación estándar de las dos muestras, figura 8.
Interpretación:
El intervalo de confianza para la relación de las dos varianzas al 90% es de 1.07 a 3.93
minutos para el ensamblaje de los motores por medio de los dos métodos.
Al iniciar cualquier investigación, la primer pregunta que surge es: ¿de qué tamaño debe
ser la o las muestras?. La respuesta a esta pregunta se verá en esta sección, con conceptos
que ya se han visto a través de este material.
¿Qué tan grande debe ser una muestra si la media muestral se va a usar para estimar la
media poblacional?. La respuesta depende del error estándar de la media, si este fuera
cero, entonces se necesitaría una sola media que será igual necesariamente a la media
poblacional desconocida µ, porque σ=0. Este caso extremo no se encuentra en la práctica,
pero refuerza el hecho de que mientras menor sea el error estándar de la media, menor es
el tamaño de muestra necesario para lograr un cierto grado de precisión.
𝑧𝜎
𝜀=
√𝑛
𝑧𝜎 2
𝑛=( )
𝜀
Como n debe de ser un número entero, redondeamos hacia arriba todos los resultados
fraccionarios.
En el caso de que se tenga una población finita y un muestreo sin reemplazo, el error de
estimación se convierte en:
𝑧𝜎𝑁−𝑛
𝜀= √
√𝑛 𝑁 − 1
𝑧2𝜎2𝑁
𝑛=
𝜀 2 (𝑁 − 1) + 𝑧 2 𝜎 2
Con Minitab solo se puede determinar el tamaño de las muestras para poblaciones infinitas.
Estimar tamaños de muestra: Elija esta opción para estimar los tamaños de muestra
necesarios para alcanzar los márgenes de error
especificados.
Márgenes de error para los intervalos de confianza: Ingresa los márgenes de error que
desee utilizar para estimar los tamaños de la muestra, siendo el valor de 4 para este
problema.
En la parte inferior del cuadro de diálogo se selecciona opciones:
Método
Parámetro Media
Distribución Normal
Desviación estándar 12.2 (valor de población)
Nivel de confianza 95%
Intervalo de confianza Bilateral
Resultados
Tamaño
Margen de la
de error muestra
4 36
El tamaño de la muestra para la media con un intervalo de confianza al 95% con una
distribución normal es de 36.
𝑧 2 (𝜎12 + 𝜎22 )
𝑛=
𝜀2
“Para un problema de dos muestras cuando los tamaños son iguales, establezca n1 = n2 =
n y se resuelve la ecuación por la de una muestra”:
𝑧𝜎 2
𝑛=( )
𝜀
Para el segundo caso se pondrá una n en función de la otra. Este caso se utiliza cuando
las poblaciones son de diferente tamaño y se sabe que una es K veces mayor que la otra.
𝑧 2 (𝜎12 +𝑘𝜎22 )
n1=kn2 𝑛1 =
𝑘𝜀 2
El rango de las varianzas: 𝜎12 + 𝜎22 = 8 𝑚𝑖𝑛𝑢𝑡𝑜𝑠, por lo tanto el rango de las desviaciones
estándar 𝜎1 + 𝜎2 = √8 = 2.828
Valor de planificación
Método
Parámetro Media
Distribución Normal
Desviación estándar 2.828 (valor de población)
Nivel de confianza 95%
Intervalo de confianza Bilateral
Resultados
Tamaño
Margen de la
de error muestra
1 31
Interpretación:
Para un intervalo de confianza del 95% y con un margen de error no mayor a 1 minuto el
tamaño de la muestra (n) es de 31 obreros.
Rancho 1 4 5 4 4 5 5 6 4 4 5
Rancho 2 4 5 5 4 5 6 6 6 5 6 5 6
Rancho 3 7 6 6 7 5 6 4 4 5 5 6 6
Para Resolverlo con Minitab proceda a capturar de todos los datos en la columna 1 en la
hoja de trabajo y si se desea escriba un nombre a la variable, como se muestra en la figura
11.
Figura 11. Hoja de trabajo con datos registrados
en pulgadas en la columna 1 de los
tres ranchos.
Calcula la media, la varianza y la desviación estándar de todas las muestras con la siguiente
opción:
Error
estándar
de la
Variable N Media Desv.Est. media IC de 95%
Pulgadas 34 5.176 0.904 0.155 (4.873, 5.480)
Estadística > Potencia y tamaño de muestra > Tamaño de la muestra para estimación
Valor de planeación
Márgenes de error para los intervalos de confianza: Anota el valor del erro 0.5
Selecciona Opciones
En el cuadro de diálogo de opciones realiza lo siguiente con cada uno de los elementos:
Método
Parámetro Media
Distribución Normal
Desviación estándar 0.904 (valor de población)
Nivel de confianza 95%
Intervalo de confianza Bilateral
Resultados
Tamaño
Margen de la
de error muestra
0.5 13
Práctica Impresa
Calculadora
Software Minitab 16
PROCEDIMIENTO
Resuelva las siguientes actividades con el uso de Minitab.
Actividad 1
Actividad 2
Se midió cinco veces el contenido de carbono (en partes por millón) para cada una de las
dos placas de silicio diferentes. Las mediciones fueron:
Actividad 4
Actividad 5
Se desea estimar el peso promedio de los sacos que son llenados por un nuevo instrumento
en la industria: Se conoce que el peso de un saco que se llena con este instrumento es una
variable aleatoria con distribución normal. Si se supone que la desviación estándar del peso
es de 0.5 Kg. Determina el tamaño de muestra aleatoria necesaria para determinar una
probabilidad igual a 0.95 de que el estimado y el estimado se diferencien mutuamente en
menos de 0.1 Kg.
Actividad 6
Suponga que se desea estimar el pH medio de lluvia en una zona que sufre de fuerte
contaminación debida a la descarga de humo de una planta generadora de electricidad. Se
sabe que σ está en la cercanía de 0.5 pH y que se desea estimar que se encuentre dentro
de 0.1 de m, con una probabilidad cercana a 0.95. ¿Aproximadamente cuántas
precipitaciones de lluvia deben incluirse en su muestra (una lectura de pH por lluvia)?
Actividad 8
Una agencia estatal tiene la responsabilidad de vigilar la calidad de agua para la cría de
peces con fines comerciales. Esta agencia se encuentra interesada en comparar la
variación de cierta sustancia tóxica en dos estuarios cuyas aguas se encuentran
contaminadas por desperdicios industriales provenientes de una zona industrial cercana.
En el primer estuario se seleccionan 11 muestras y en el segundo 8, las cuales se enviaron
a un laboratorio para su análisis. Las mediciones en ppm que se observaron en cada
muestra son las siguientes:
Estuario 10 10 12 13 9 8 12 12 10 14 8
1
Estuario 11 8 9 7 10 8 8 10
2
Actividad 9
Suponga que se desea estimar la diferencia entre la acidez media de las lluvias de dos
lugares diferentes, uno en una zona poco contaminada unto al mar y el otro en un área muy
contaminada. Si desea que su estimación sea correcta al 0.1 de pH más cercano, con una
probabilidad de 0.90, ¿cuántos valores de pH tendrían que incluirse en cada muestra?
Asuma que la varianza de las mediciones del pH es 0.25 para cada lugar y que las muestras
serán de igual tamaño.
SUGERENCIAS DIDÁCTICAS
Elaborar un caso práctico con base en la utilización de los diferentes tipos de muestreo y
obtener las muestras para calcular los tamaños de la muestra.
Competencias a desarrollar:
Solución de Problemas.
INTRODUCCIÓN
En una investigación no solo se requiere estimar un parámetro, sino que el investigador
puede proponer hipotéticamente un valor o valores para el parámetro; valor basado en su
propia experiencia profesional o según oriente el marco teórico, de la investigación. Por
tanto, es necesario decidir si se considera ese supuesto o se rechaza, obviamente se
efectúa en base a datos obtenidos de una muestra aleatoria, y empleando la prueba de
hipótesis estadísticas o llamado también contraste de hipótesis estadística, o simplemente
prueba de hipótesis.
Definición:
“Una prueba de hipótesis es el proceso mediante el cual, a partir de los valores de una
muestra aleatoria extraída de una población bajo estudio, se decide si mantiene el supuesto
que plantea el investigador para el parámetro, o se rechaza; con cierta probabilidad de error
(riesgo) por tomar una decisión”
Para la población se plantea un supuesto para el parámetro, de ésta se extrae una muestra
aleatoria, los datos recolectados de ella se usan para generalizarlo en toda la población,
mediante el proceso de la prueba de hipótesis.
𝐻0 : 𝜃 = 𝜃0 𝐻0 : 𝜃 ≤ 𝜃0 𝐻0 : 𝜃 ≥ 𝜃0
𝐻0 : 𝜃 < 𝜃0 𝐻0 : 𝜃 > 𝜃0 𝐻0 : 𝜃 ≠ 𝜃0
Se rechaza 𝐻𝑜 :
Se rechaza 𝐻𝑜 :
Error tipo 𝑰.- se comete cuando se rechaza la hipótesis nula Ho cuando es verdadera. Se
conoce como 𝛼 (nivel de significancia).
Error tipo 𝑰𝑰.- se comete cuando se acepta la hipótesis nula Ho cuando en realidad es falsa.
Se conoce como 𝛽.
Pero una buena prueba estadística es aquella en donde tanto como β son pequeñas,
porque permitirá tomar una decisión correcta, con menor riesgo para equivocarse.
El error está bajo control del investigador y se elige o establece antes de realizar la prueba
de hipótesis, es el nivel de significancia para la prueba de hipótesis, entonces como se
puede controlar , también 1- está controlada.
Pero el error β, es complicado, porque varía con , esto es, el tamaño de muestra, la prueba
estadística concreta que se utiliza, el diseño elegido y la magnitud del efecto, influyen en
estos errores.
Para resolver correctamente una prueba de hipótesis se sugiere seguir los siguientes
pasos:
1) Planteamiento de la hipótesis:
𝐻𝑜 : 𝜃 = 𝜃 𝐻𝑜 : 𝜃 = 𝜃 𝐻𝑜 : 𝜃 = 𝜃
𝑎) 𝑏) 𝑐)
𝐻𝑎 : 𝜃 < 𝜃 𝐻𝑎 : 𝜃 > 𝜃 𝐻𝑎 : 𝜃 ≠ 𝜃
3) Regla de decisión
Se decide si se acepta o rechaza la hipótesis nula de acuerdo con el valor crítico del
estadístico de prueba.
𝑋̅ − 𝜇0
𝑍= 𝜎
⁄ 𝑛
√
𝑋̅ − 𝜇0
𝑡=
𝑆⁄
√𝑛
5) Conclusión
Se acepta o se rechaza la hipótesis nula, según donde caiga el valor calculado del
estadístico de prueba.
1) Planteamiento de la hipótesis:
Los valores críticos de Z para una prueba unilateral a un nivel de significancia de 0.01 es
de 2.33
Se rechaza 𝐻𝑜 :
Se acepta 𝐻𝑜 : Regió
n
Zona de
aceptación
2.33
3) Regla de decisión
El cuadro de diálogo realiza el siguiente procedimiento para cada uno de los elemento (ver
figura 4)
Datos resumidos: Selecciona esta opción. Al elegir esta opción se activan los conceptos
siguientes:
Nivel de confianza: Escriba el nivel de confianza que se desea calcular, en este problema
es el 99%
Hipótesis Alterna: Elija menor que (de cola inferior), no es igual a (con dos colas) o mayor
que (de cola superior). En este caso Ha es mayor, elija mayor que.
Error
estándar
de la 95% Límite
N Media media inferior Z P
36 10.300 0.333 9.752 0.90 0.184
5) Conclusión
Nota: Si P es igual o mayor que el nivel de significancia (α) con que se hace la prueba se
acepta la hipótesis nula. En caso de que P es menor que el nivel de significancia (α) se
rechaza la hipótesis nula y se acepta la alternativa.
En este caso P = 0.184 y es mayor que (0.01) y observando en el gráfico de los valores
críticos, 𝑧𝑐 calculada cae en zona de aceptación debo aceptar 𝐻𝑜 como cierta, es decir, el
nivel de radiación que emiten los televisores están en un nivel seguro.
Por lo que se concluye que se acepta 𝐻𝑜 como cierta, es decir, el nivel de radiación que
emiten los televisores están en un nivel seguro.
El cuadro de diálogo realiza el siguiente procedimiento para cada uno de los elemento.
1) Planteamiento de la hipótesis:
Distribución: Selecciona t
Selecciona Probabilidad
3) Regla de decisión
El cuadro de diálogo realiza el siguiente procedimiento para cada uno de los elemento (ver
figura 10)
Nivel de confianza: Escriba el nivel de confianza que se desea calcular, en este problema
es el 99%
Error
estándar Límite
de la superior
Variable N Media Desv.Est. media 95% T P
mg/g 25 10.480 2.409 0.482 11.304 -8.55 0.000
5) Conclusión
En este caso P = 0.000 y es menor que (0.01) y observando en el gráfico de los valores
críticos, y Como tc = - 8.55 < -t(0.99; 24) = -2.492 el valor del estadístico de prueba se encuentra
dentro de la zona de rechazo de Ho, por lo que se puede afirmar que la concentración de
nitrógeno en las hojas jóvenes de Rhizophora mangle es menor en la zona protegida.
Población 1 Población 2
𝜇1 𝜇2
𝜎12 𝜎22
Muestra 1 Muestra 2
𝑋̅1 𝑋̅2
𝑆12 𝑆22
n1 n2
Hipótesis nula: 𝐻𝑜 : 𝜇1 − 𝜇2 = ∆𝑜
𝐻𝑎 : 𝜇1 − 𝜇2 > ∆𝑜 𝑍0 > 𝑍𝛼
Las situaciones más comunes que implican pruebas sobre dos medias son aquellas con
varianzas desconocidas. Si ambas distribuciones son normales y que 𝜎12 = 𝜎22 = 𝜎, se
puede utilizar la prueba de t de 2 muestras. El estadístico de prueba es dado por el
procedimiento de prueba.
̅𝟏 − 𝐗
(𝐗 ̅ 𝟐 ) − 𝐝𝐨
𝐭=
𝟐 𝟐
√𝐒𝟏⁄𝐧 + 𝐒𝟐⁄𝐧
𝟏 𝟐
𝐻𝑜 : 𝜇1 − 𝜇2 = 𝑑𝑜 = 0.050
2) Planteamiento de la hipótesis:
𝐻𝑜 : 𝜇1 − 𝜇2 ≤ 0.050
𝐻𝑎 : 𝜇1 − 𝜇2 > 0.050
2) Establecimiento de los valores críticos del estadístico de prueba
3) Regla de decisión
Para resolver con Minitab se toma es estadístico Z de una prueba, con la instrucción:
Error
estándar de 95% Límite
N Media la media inferior Z P
64 0.05300 0.00112 0.05115 2.67 0.004
5. Conclusión:
Dado que Zc de 2.67 > Z crítica de 1.65, se Rechaza la Hipótesis Nula (Ho), por lo tanto
se acepta la Hipótesis Alternativa (Ha), se refrenda la afirmación 12 > 0.050. Vale decir,
la aleación reduce significativamente en más de 0.050 ohms la resistencia del conductor
Páramo: 10.5, 15.0, 14.5, 8.5, 7.5, 13.5, 15.0, 11.5, 17.0, 13.0, 13.5, 14.5, 13.5, 15.0,
10.5, 10.0
Selva: 19.5, 17.0, 13.5, 9.0, 12.0, 16.5, 16.5, 18.0, 18.0, 18.0, 12.0, 16.0, 12.0,
14.5, 16.5, 17.0
Conociendo que la temperatura del agua es una variable que se distribuye normalmente,
se quiere saber si los ríos de selva son más calientes a un nivel de significancia de 0.05.
El cuadro de diálogo realiza el siguiente procedimiento para cada uno de los elemento.
3) Planteamiento de la hipótesis:
𝐻𝑜 : 𝜇1 − 𝜇2 = 10
𝐻𝑎 : 𝜇1 − 𝜇2 > 0 (La temperatura del agua es mayor en los ríos de la zona de selva)
Distribución: Selecciona t
Selecciona Probabilidad
3) Regla de decisión
El cuadro de diálogo realiza el siguiente procedimiento para cada uno de los elemento (ver
figura 15)
Segundo: Seleccionar C1
Nivel de confianza: Escriba el nivel de confianza que se desea calcular, en este problema
es el 95%
Hipótesis alterna: Elija mayor que, ya que depende de la prueba que se desee.
Error
estándar
de la
N Media Desv.Est. media
T2 16 15.38 2.90 0.73
T1 16 12.69 2.66 0.66
5) Conclusión
En este caso P = 0.005 y es menor que (0.05) y observando en el gráfico de los valores
críticos, y Como tc = 2.73< -t(0.99; 24) = 1.697 el valor del estadístico de prueba se encuentra
dentro de la zona de rechazo de Ho, Por lo tanto se concluye que la temperatura del agua
es mayor en los ríos de la zona de selva.
MATERIALES Y EQUIPO
Práctica Impresa
Calculadora
Software Minitab 16
PROCEDIMIENTO
Resuelva las siguientes actividades con el uso de Minitab.
Actividad 1
El rendimiento diario de una planta química local ha promediado 880 toneladas durante los
últimos años. A la gerente de control de calidad le gustaría saber si este promedio cambió
en los meses recientes. Ella selecciona al azar 50 días de la base de datos y calcula el
promedio y la desviación estándar de n = 50 rendimientos como 𝑋̅ = 871 toneladas y S =
21 toneladas respectivamente. Pruebe la hipótesis apropiada con = 0.05.
Actividad 2
Se saca una muestra de 36 análisis de nitratos (NO3-) para el diseño de una planta de
tratamiento de aguas industriales. Para esto, se calcula un promedio estadístico de 𝑋̅ = 92
mg/L. Estudios previos indican una desviación estándar conocida de σ = 9 mg/L. Probar la
hipótesis de que el valor esperado de μo es 100 mg/L. Asumir α = 0.05.
Actividad 3
Antes de que una sustancia se pueda considerar segura para enterrarse como residuo se
deben caracterizar sus propiedades químicas. El artículo “Landfilling Ash/Sludge Mixtures”
(J. Benoît,T. Eighmy y B. Crannell, en Journal of Geotechnical and Geoenvironmental
Engineering
1999:877-888) notifica que en una de seis muestras de lodo de una planta de tratamiento
de agua residual de Nueva Hampshire, la media del pH era 6.68 con desviación estándar
de 0.20. ¿Se puede concluir que la media del pH es menor de 7.0? si la prueba se realizó
con = 0.05.
Actividad 4
Los siguientes datos son las horas-hombre que se pierden semanalmente en promedio por
accidentes en 10 plantas industriales antes y después de implantar un cierto programa de
seguridad:
Antes 45 73 46 124 33 57 83 34 26 17
Después 36 60 44 119 35 51 77 29 24 11
Actividad 5
¿Sugieren los datos que la carga promedio de falla es mayor que 10Mpa? Supóngase que
la carga donde se presenta la falla tiene una distribución normal, y utilice = 0.05. Calcule
el valor de P.
Actividad 6
Actividad 7
Actividad 8
SUGERENCIAS DIDÁCTICAS
Elaborar un caso práctico con base en la utilización de los diferentes tipos de muestreo y
realizar pruebas de hipótesis a un nivel de confianza del 95%
Resolver las actividades de manera manual con la utilización de fórmulas y tablas.
Realizar una tabla de pruebas relacionadas con medias para pruebas de hipótesis. Donde
se exprese Ho, valor del estadístico de prueba, Ha y la región crítica.