Sunteți pe pagina 1din 53

I PARCIAL

DISEÑO Y EXPERIMENTACIÓN
▪ Una población o universo es una colección o totalidad de posibles
individuos, especímenes, objetos o medidas de interés sobre los
que se hace un estudio. Las poblaciones pueden ser finitas o
infinitas. Si es finita y pequeña se pueden medir todos los
individuos para tener un conocimiento “exacto” de las
características (parámetros) de esa población. Por ejemplo, un
parámetro que podría ser de interés es la proporción p de
productos defectuosos, o la media, m, de alguna variable medida a
los productos. Si la población es infinita o grande es imposible e
incosteable medir a todos los individuos, en este caso se tendrá
que sacar una muestra representativa de dicha población, y con
base en las características medidas en la muestra (estadísticos) se
podrán hacer afirmaciones acerca de los parámetros de la
población
▪ Con frecuencia, las poblaciones de interés son los
materiales, los productos terminados, partes o
componentes, o algunos de los procesos. En muchos
casos estas poblaciones se pueden suponer infinitas o
grandes.
▪ Por ejemplo, en empresas con producción en masa no
siempre es posible medir cada pieza de material que llega
o las propiedades de cada producto terminado. Incluso, si
la producción no es masiva, conviene imaginar al proceso
como una población infinita o muy grande, debido a que
el flujo del proceso no se detiene, es decir, no existe el
último artículo producido mientras la empresa siga
operando. En estos casos los procesos (poblaciones) se
estudian mediante muestras de artículos extraídas en
algún punto del proceso.
▪ Un asunto importante será lograr que las muestras sean
representativas, en el sentido de que tengan los aspectos
clave que se desean analizar en la población. Una forma de
lograr esa representatividad es diseñar de manera adecuada
un muestreo aleatorio (azar), donde la selección no se haga
con algún sesgo en una dirección que favorezca la inclusión
de ciertos elementos en particular, sino que todos los
elementos de la población tengan las mismas oportunidades
de ser incluidos en la muestra. Existen varios métodos de
muestreo aleatorio, por ejemplo: el simple, el estratificado, el
muestreo sistemático y por conglomerados; cada uno de ellos
logra muestras representativas en función de los objetivos
del estudio y de ciertas circunstancias y características
particulares de la población (Gutiérrez Pulido, 2005).
▪ El objetivo de la inferencia estadística es hacer
afirmaciones válidas acerca de la población o proceso con
base en la información contenida en una muestra.
Estas afirmaciones tienen por objetivo coadyuvar en la toma
de decisiones. La inferencia estadística por lo general se
divide en:
▪ estimación
▪ prueba de hipótesis
y se apoya en cantidades o datos estadísticos calculados a
partir de las observaciones en la muestra.
▪ Un estadístico se define como cualquier función de los
datos muestrales que no contiene parámetros
desconocidos. Un ejemplo de estadístico es la media
muestral X con la cual se tratan de hacer afirmaciones
sobre la media, µ, que es un parámetro poblacional
▪ Un aspecto clave en la interpretación y utilización de
cualquier estadístico es que se trata de una variable
aleatoria, ya que su valor depende de los elementos que
son seleccionados en la muestra y, por lo tanto, varía
de una muestra a otra. La forma de tomar en cuenta
este hecho es conocer la distribución de probabilidad
de cada estadístico.
▪ Al conocer la distribución de probabilidad del
estadístico se podrán hacer estimaciones acerca de
cuál es el valor del parámetro poblacional, y también
será posible probar o verificar la validez de hipótesis o
conjeturas que se tengan sobre la población o proceso.
▪ Por ejemplo, un proveedor puede afirmar que el
porcentaje de su producto que no cumple con
especificaciones es de 0.1%, por lo que interesaría
investigar, con base en una muestra, si esta afirmación
se puede tomar como verdadera.
▪ La distribución de probabilidad o distribución de una
variable aleatoria X relaciona el conjunto de valores
posibles de X (rango de X), con la probabilidad
asociada a cada uno de estos valores y los representa a
través de una tabla o por medio de una función
planteada como una fórmula. Por ejemplo, sea la
variable aleatoria dada por el estadístico media
muestral, X, entonces al conocer su distribución de
probabilidad podremos saber cuáles son los valores
que puede tomar X y cuáles son más probables.
▪ En otras palabras, la distribución de probabilidad de la
media muestral X señala qué valores se espera que
tome X, de acuerdo con los supuestos asumidos. De
esta forma, la distribución de probabilidad hace que lo
aleatorio no sea un capricho, y modela (describe, acota)
los posibles valores de un estadístico muestral, con lo
que al observar una realización específica de un
estadístico se pueden corroborar o rechazar supuestos
(prueba de hipótesis), o bien, hacer estimaciones
poblacionales.
▪ Las distribuciones de probabilidad que más se usan en
intervalos de confianza y pruebas de hipótesis son las
distribuciones: normal, T de Student, ji-cuadrada y F.
▪ La distribución normal está completamente definida
por sus parámetros, que son la media, µ, y la
desviación estándar, σ. Por ejemplo, se muestra la
distribución normal con µ = 0 y σ = 1, que se simboliza
con N(0, 1) y se conoce como la distribución normal
estándar.
▪ Se observa que, tanto la distribución normal estándar
como la T de Student son simétricas y centradas en
cero, mientras que las distribuciones ji-cuadrada y F
son sesgadas y sólo toman valores positivos. Las cuatro
distribuciones están relacionadas entre sí, ya que las
distribuciones T de Student, ji-cuadrada y F se definen
en términos de la distribución normal estándar.
▪ En la ciudad de Tegucigalpa, se tiene un clima cálido, y se ha registrado
todos los días la temperatura al medio día durante un año los datos se
encuentran en la siguiente tabla
TEMPERATURA DIAS
13 2
14 5
15 10
16 15
17 30
18 35
19 50
20 71
21 50
22 35
23 30
24 15
25 10
26 5
27 2
TOTAL 365
▪ Las distribuciones de probabilidad que tienen una variable
que representa cierta característica de una población se
definen completamente cuando se conocen sus parámetros,
pero cuando éstos no se conocen, será necesario estimarlos
con base en los datos muestrales para hacer inferencias
sobre la población. Por ejemplo, los parámetros de una
distribución normal son la media, µ, y la desviación
estándar, σ, que en caso de desconocerse será necesario
estimarlos a partir de los datos en la muestra. Hay dos
tipos de estimación: puntual y por intervalo.
▪ Un estimador puntual de un parámetro desconocido es
un estadístico que genera un valor numérico simple,
que se utiliza para hacer una estimación del valor del
parámetro desconocido; por ejemplo, tres parámetros
sobre los que con frecuencia se desea hacer inferencia
son:
1. La media µ del proceso (población).
2. La varianza σ2 o la desviación estándar σ del proceso.
3. La proporción p de artículos defectuosos.
▪ Una forma operativa de saber qué tan precisa es la
estimación consiste en calcular un intervalo de
confianza que indique un rango “donde puede estar el
parámetro” con cierto nivel de seguridad o confianza.
Construir un intervalo al 100(1 – a)% de confianza para
un parámetro desconocido q, consiste en estimar dos
números (estadísticos) L y U, de manera que la
probabilidad de que q se encuentre entre ellos sea 1 –
α, es decir,
▪ Una prueba de hipótesis es una regla que
especifica si se puede aceptar o rechazar una
afirmación acerca de una población
dependiendo de la evidencia proporcionada por
una muestra de datos.
▪ El propósito de la prueba de hipótesis no es
cuestionar el valor calculado del estadístico
(muestral), sino hacer un juicio con respecto a
la diferencia entre estadístico de muestra y un
valor planteado del parámetro.
▪ Una prueba de hipótesis examina dos hipótesis
opuestas sobre una población: la hipótesis nula y la
hipótesis alternativa. La hipótesis nula es el enunciado
que se probará. Por lo general, la hipótesis nula es un
enunciado de que "no hay efecto" o "no hay diferencia".
La hipótesis alternativa es el enunciado que se desea
poder concluir que es verdadero de acuerdo con la
evidencia proporcionada por los datos de la muestra.
▪ Con base en los datos de muestra, la prueba
determina si se puede rechazar la hipótesis
nula. Usted utiliza el valor p para tomar esa
decisión. Si el valor p es menor que el nivel de
significancia (denotado como α o alfa), entonces
puede rechazar la hipótesis nula.
▪ Un error común de percepción es que las pruebas estadísticas
de hipótesis están diseñadas para seleccionar la más probable
de dos hipótesis.
▪ Sin embargo, al diseñar una prueba de hipótesis, establecemos
la hipótesis nula como lo que queremos desaprobar.
▪ Puesto que establecemos el nivel de significancia para que sea
pequeño antes del análisis (por lo general, un valor de 0.05
funciona adecuadamente), cuando rechazamos la hipótesis
nula, tenemos prueba estadística de que la alternativa es
verdadera. En cambio, si no podemos rechazar la hipótesis
nula, no tenemos prueba estadística de que la hipótesis nula
sea verdadera. Esto se debe a que no establecimos la
probabilidad de aceptar equivocadamente la hipótesis nula
para que fuera pequeña.
▪ ¿Tienen las estudiantes de pregrado una estatura
media diferente de 66 pulgadas?
▪ ¿Es la desviación estándar de su estatura igual a o
menor que 5 pulgadas?
▪ ¿Es diferente la estatura de las estudiantes y los
estudiantes de pregrado en promedio?

1. En un estudio estadístico, ¿qué es una población y
para qué se toma una muestra?
2. ¿Qué es probar una hipótesis?
3. ¿Qué es hacer una estimación puntual y en qué
consiste hacer una estimación por intervalo para la
media, por ejemplo?
4. ¿Por qué no es suficiente la estimación puntual y por
qué se tiene que recurrir a la estimación por intervalo?
NOMBRE FÓRMULA

GRADOS DE GL= n – 1
LIBERTAD

MEDIA

ERROR DE
ESTIMACIÓN
E=
▪ En un proceso de inyección de plástico una característica de
calidad del producto (disco) es su grosor, el cual debe ser de
1.20 mm con una tolerancia de ±0.10 mm. Así, el grosor del
disco debe estar dentro de la especificación inferior, EI = 1.10,
y la superior, ES = 1.30, para considerar que el proceso de
inyección fue satisfactorio. Para evaluar esta característica de
calidad, durante una semana se hace un muestreo sistemático
en una línea de producción, y se obtienen 25 muestras de
tamaño 5 cada una. Por lo tanto, al final se tiene una muestra
de n = 125 y se obtiene la media muestral, X = 1.179 mm y la
varianza, S^2 = 0.00071, por lo que la estimación
del error estándar de la media es??
▪DATOS

▪E=
▪ Cuando n ≥ 45, la distribución T de Student es
prácticamente igual a la distribución normal estándar,
por lo tanto, de la tabla de la distribución normal se
obtiene que

▪ Con un α=5%, encuentre el valor de Z


▪ Se puede afirmar entonces que con una confianza de
95%, la media m de grosor de los discos se encuentra
en el intervalo [_____,_____]. En el cálculo anterior al
valor de 0.00466 se le conoce como error de
estimación, porque hasta en 0.00466 puede diferir el
estimador puntual X del parámetro poblacional µ.
▪ En el proceso de fabricación de discos para computadoras,
una de las variables críticas es el rendimiento de formato. Se
toma una muestra aleatoria de n = 10 discos de la
producción del turno de la mañana. Se formatean y se
reporta el rendimiento de cada disco. Los datos obtenidos
son: 96.11, 91.06, 93.38, 88.52, 89.57, 92.63, 85.20, 91.41,
89.79, 92.62. Con base en estos datos interesa estimar
puntualmente y por intervalo la media y la desviación
estándar para la población de discos de dicho turno.
▪ MEDIA

▪ DESVIACIÓN ESTÁNDAR
▪ Con una confianza de 95% se espera que el
rendimiento promedio de los discos producidos
durante ese turno esté entre ________ y_________.
▪RESUELVA EJERCICIOS 11, 12 , 13
PÁG 52

S-ar putea să vă placă și