Documente Academic
Documente Profesional
Documente Cultură
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS
ESTADISTICA INFERENCIAL
UNIDAD II
TEORIA DEL MUESTREO
La teoría del muestreo se refiere al estudio de las relaciones que existen entre un colectivo
o población y las muestras que se extraen de las mismas. El estudio de las muestras
permite hacer estimaciones de características desconocidas de la población (tales como
media, desviación estándar, proporciones, etc.). Estas estimaciones se hacen a partir del
conocimiento de las características de las muestras (media, desviación estándar,
proporción, etc.)
Las características o medidas obtenidas de una muestra se llaman estadísticos; y las
medidas correspondientes a la población parámetros. Cuando una medida muestral o
estadística es utilizada como representante de una característica poblacional o parámetro
se denomina estimador.
Ventajas de la utilización de las muestras
1. El costo es menor u se puede obtener un mejor rendimiento del dinero invertido.
2. Se obtiene una disminución notable del tiempo necesario para alcanzar la
información.
Cuando una muestra posee 30 o más datos se denominan grandes muestras y si la muestra
tiene menos de 30 observaciones se denomina pequeñas muestras. Al procedimiento
utilizado para elegir una muestra se denomina Muestreo.
Necesidades del Muestreo
1. Población infinita
2. Población uniforme.
3. Proceso de investigación destructiva.
4. Economía de costos.
5. Calidad.
Muestreo con o sin reemplazo
Con reemplazamiento cuando un elemento de la población puede ser escogido
varias veces para formar parte de la muestra.
Sin reemplazamiento cuando un elemento de la población solo puede ser
seleccionado una sola vez para formar parte de la muestra.
Población: es una colección de todos los elementos que estamos estudiando y acerca de
los cuales se intenta extraer conclusiones. Puede ser infinita o finita.
Muestra: Una parte de la población o un subconjunto del con junto de unidades obtenidas
con el objeto de investigar las propiedades de la población.
distribución muestral teórica, ya que es imposible sacar todas las muestras aleatorias
posibles de tamaño n de una población infinita. Si la población es finita se puede construir
una distribución muestral experimental, sacando todas las muestras posibles de un tamaño
dado, calculando para cada muestra el valor del estadístico que nos interesa. Ejemplo,
supongamos que se tiene una población de tamaño N = 10 y queremos extraer con
reemplazamiento todas las muestras posibles de tamaño n = 5, para esto se utiliza la
relación 𝑵𝒏 , es decir, 105 = 100000 muestras de tamaño n = 5.
En cambio, si el muestreo es sin reemplazamiento, el número de muestras de tamaño N =
5 viene dado por la combinatoria:
𝑵 𝑵! 𝟏𝟎!
[ 𝒏 ] = 𝒏!(𝑵−𝒏)! = 𝟓!(𝟏𝟎−𝟓)! = 252 muestras
Ejemplo.
Desarrollo:
Se supondrá una población de N elementos.
Se calcularán la media aritmética y la desviación estándar de la población.
Se determinará el número total de muestras distintas de tamaño n que es
posible extraer y de concluirá cuales son; es decir, se enumerará la distribución
muestral (el conjunto de todas las muestras de ese tamaño que es posible
obtener de esa población).
Se resolverá la media de cada una de las muestras identificadas en el paso 3; con
esto ya se tiene la distribución muestral de la media (el conjunto de todas las
medias de todas las muestras de ese tamaño que es posible obtener de la
población)
Se calcula la media y la desviación estándar de la distribución muestral de la
media.
Se obtendrán las conclusiones para el muestreo al comparar los parámetros
poblacionales con los valores obtenidos para la distribución muestral de la media.
Se obtendrá también la forma de la distribución muestral de la media para obtener
otra importante conclusión: la que permite utilizar la distribución normal para
hacer los juicios sobre la probabilidad de estar en lo correcto cuando se hacen
inferencias.
Ejemplo:
1. Carrocerías Los Ríos cuenta con siete empleados de producción (a quienes se les
considera la población). En la tabla se incluyen los ingresos por hora de cada uno
de ellos.
2. Los tiempo de servicio de los ejecutivos que laboran en una firma auditora son:
Nombres Años
Matías 20
Samuel 22
Andrés 26
Marco 24
Fernando 28
1. DISTRIBUCION MUESTRAL
Consideremos todas las posibles muestras de tamaño n en una población. Para cada
muestra podemos calcular un estadístico muestral (la media muestral x, la desviación
estándar muestral s, la proporción muestral p, etc.) que variará de una a otra muestra. Así
obtenemos una distribución de los estadísticos resultantes de cada muestra que se llama
distribución muestral, en otras palabras es:
Las muestras aleatorias obtenidas de una población son, por naturaleza propia,
impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y tomadas
de la misma población tenga la misma media muestral o que sean completamente
parecidas; puede esperarse que cualquier estadístico, como la media muestral, calculado
a partir de las medias en una muestra aleatoria, cambie su valor de una muestra a otra, por
ello, se quiere estudiar la distribución de todos los valores posibles de un estadístico. Tales
distribuciones serán muy importantes en el estudio de la estadística inferencial, porque
las inferencias estadísticas se harán usando estadísticos muéstrales. Conocer esta
distribución muestral y sus propiedades permite juzgar la confiabilidad de un estadístico
Elementos Medias
Muestra muestrales muestrales
Xj X
1 100 - 200 150
2 100 - 300 200
3 100 - 400 250
4 200 - 300 250
5 200 - 400 300
6 300 - 400 350
Con una población de solo N = 4, se puede enumerar cada media muestral posible que
aparece en la tabla anterior junto con sus respectivas probabilidad. Tal listado se le
denomina una distribución muestral, y aparece en la y su histograma.
DISTRIBUCION MUESTRAL
Medias Numero de
Probabilidad
muestrales muestras
de P(x)
X que dan X
150 1 1/6 = 0.1667
200 1 1/6 = 0.1667
250 2 2/6 = 0.3333
250 2 2/6 = 0.3333
300 1 1/6 = 0.1667
350 1 1/6 = 0.1667
6 1
Distribución muestral. Es una lista de todos los valores posibles para un estadístico y la
probabilidad relacionada con cada valor
La varianza en las medias muestras es como cualquier otra varianza. Mide la dispersión
de las observaciones individuales (medias muestrales) alrededor de su media (la gran
media). Se halla
1. Determinando la cantidad por la cual cada una de las observaciones (medias
muestrales) difieren de su media (la gran media).
2. Elevando al cuadrado tales desviaciones.
3. Promediando las desviaciones al cuadrado y dividiendo por el número de medias
muestrales.
Varianza de la distribución muestral de la medias muestrales
𝝈𝟐𝑿 =
(𝟏𝟓𝟎−𝟐𝟓𝟎)𝟐 + (𝟐𝟎𝟎−𝟐𝟓𝟎)𝟐 + (𝟐𝟓𝟎−𝟐𝟓𝟎)𝟐 + (𝟐𝟓𝟎−𝟐𝟓𝟎)𝟐 + (𝟑𝟎𝟎−𝟐𝟓𝟎)𝟐 + (𝟑𝟓𝟎−𝟐𝟓𝟎)𝟐
𝟔
𝝁𝒙 = √𝝈𝟐𝒙
En el caso actual
Ejemplo:
Las ventas en miles de dólares para para Manufacturas Cotopaxi durante los últimos 5
meses fueron de 68, 73, 65, 80 y 72. Asumiendo que estos cinco meses constituyen la
población, la media claramente es 𝜇 = 71,6. Como director de marketing Manufacturas
Cotopaxi, se desea estimar este 𝜇 “desconocido” toma una muestra de tamaño n = 3. Se
espera que el error de muestreo que es probable que ocurra sea relativamente pequeño.
Realice la distribución muestral y haga comentarios sobre el posible error de muestreo.
2. ¿Qué pasará con el error estándar del ejercicio anterior si n = 3? ¿Por qué hay
diferencia)
11 4 18 2 1 2 0 2 2 4
3 4 1 2 2 3 3 19 8 3
7 1 0 2 7 0 4 5 1 14
16 8 9 1 1 2 5 10 2 3
¿Qué se concluye de este ejemplo? El teorema de límite central indica que, sin que
importe la forma de la distribución de la población, la distribución muestral de la media
se aproximará a la distribución de probabilidad normal. Cuanto mayor sea el número de
observaciones en cada muestra, más evidente será la convergencia. El ejemplo demuestra
el mecanismo del teorema central del límite. Comenzó con una población con sesgo
positivo. Después seleccionó 25 muestras aleatorias de 5 observaciones calculó la media
de cada muestra y, por último, organizó las 25 medias de muestra en una gráfica. Se
central del límite garantiza que la distribución muestral de la media sigue una distribución
normal.
Aplique la fórmula para convertir cualquier distribución normal en una distribución
normal estándar. A este hecho también se le denomina valor z. Así, se emplea la tabla de
la distribución normal estándar para determinar la probabilidad de seleccionar una
observación que caerá dentro de un intervalo específico. La fórmula para determinar un
valor z es:
𝑿− 𝝁
Z=
𝝈
En esta fórmula, X es el valor de la variable aleatoria; 𝜇 es la media de la población, y
𝜎es la desviación estándar de la población.
Sin embargo, la mayor parte de las decisiones de negocios se refieren a una muestra, no
a una sola observación. Así, lo importante es la distribución de X, la media muestral, en
lugar de X, el valor de una observación. Éste es el primer cambio en la fórmula (7-5). El
segundo consiste en emplear el error estándar de la media de n observaciones en lugar de
la desviación estándar de la población. Es decir, se usa 𝜎/√𝑛en el denominador en vez
de 𝜎. Por consiguiente, para determinar la probabilidad de una media muestral con rango
específico, primero aplique la fórmula para determinar el valor z correspondiente.
Después se consulta la tabla de áreas bajo la curva normal estándar para localizar la
probabilidad.
CÁLCULO DEL VALOR z DE X CUANDO SE CONOCE LA DESVIACIÓN
ESTÁNDAR DE LA POBLACIÓN
𝑿− 𝝁
Z=
𝝈/√𝒏
EJERCICIOS:
1. TelCom planea instalar nuevos equipos que mejorarían la eficiencia de sus
operaciones. Sin embargo, antes que los ejecutivos puedan decidir si dicha
inversión será eficaz en función de los costos, deben determinar la probabilidad
de que la media de una muestra de n = 35
a. Esté entre 145 y 150
b. Sea mayor que 145
c. Sea menor que 155
d. Este entre 145 y 155
e. Sea mayor que 155
2. Una población normal tiene una media de 60 y una desviación estándar de 12.
Usted selecciona una muestra aleatoria de 9. Calcule la probabilidad de que la
media muestral:
a. Sea mayor que 63.
= 34.088,80 ≤ 𝜇 ≤ 36.911,20
= 34.188,80 ≤ 𝜇 ≤ 37.011,20
Los puntos extremos $34.18880 y $37.011,20, estos puntos extremos se llaman límites de
confianza. El grado de confianza o nivel de confianza es de 95%, y el intervalo de confianza
abarca de $34.188,80 a $37.011, 20 con frecuencia de ± $1.411,20 se conoce como margen de
error.
Si todos los intervalos posibles se construyeran con base en todas las medias muéstrales
diferentes, el 95% de ellas contendría la media poblacional desconocida.
Esto significa que el 5% de todos los intervalos estará errado – no contendrían la media
poblacional. Este 5% hallado como (1 – coeficiente de confianza), es denominado el valor alfa y
representa la probabilidad d error. El valor alfa es la probabilidad de que cualquier intervalo dado
no contenga la media poblacional.
Ejercicios:
1. Burger Kin, es una franquicia de comida rápida, que se especializa en hamburguesas de
media onza, y sándwiches de pollo. También ofrece refrescos y papas a la francesa. El
departamento de planeación de la firma informa que la distribución de ventas diarias de
los restaurantes tiende a seguir la distribución normal. La desviación estándar de la
distribución de ventas diarias es de $3.000. Una muestra de 40 mostró que las ventas
medias diarias suman $20.000
a. ¿Cuál es la media de la población?
b. ¿Cuál es la mejor estimación de la media de la población? ¿Qué nombre recibe
este valor?
c. Construya un intervalo de confianza del 99% de la media poblacional.
d. Interprete el intervalo de confianza.
2. Se toma una muestra de 49 observaciones de una población normal con una desviación
estándar de 10. La media de la muestra es de 55. Determine el intervalo de confianza de
99% de la media poblacional.
debe sustituirse:
Ejemplo:
La Compañía de Taxis Modelo, planea comprar una flota de nuevos taxis para sus
operaciones en la Ciudad de Quito. LA decisión depende de si el rendimiento del auto en
consideración e por lo menos 44,26 km por galón de gasolina. Los 36 carros que prueba
la compañía reporta una media de 41,20 km por galón, con una desviación estándar
muestral de 5,63 km. A un nivel de confianza del 99%, ¿Qué aconsejaría a la Compañía
de Taxis?
2.6. Intervalo de confianza para la media en el caso de muestras pequeñas – la
distribución t.
En los ejemplos anteriores, el tamaño de la muestra era mayor (n ≥ 30). Sin embargo, no
siempre puede ser posible obtener por lo menos 30 observaciones. Para una compañía de
seguros que prueba la resistencia al impacto de los autos, destruir a propósito 30 vehículos
de lujos puede volverse un poco costoso.
Cuando debe tomarse una muestra pequeña, la distribución normal puede no aplicar. El
teorema de límite central asegura normalidad en el proceso de muestreo sólo si la muestra
es grande. Cuando se utiliza una muestra pequeña, puede ser necesaria una distribución
alternativa, la distribución de t Student (o simplemente la distribución t). Para utilizar
la distribución de t se debe cumplir tres condiciones:
1. La muestra es pequeña.
2. La desviación estándar poblacional desconocida 𝜎.
3. La población es normal o casi normal
Si 𝜎 es conocida, la distribución Z se usa inclusive si la muestra es pequeña. Además, si
no puede asumir una población normal, se aumenta el tamaño de la muestra para utilizar
la distribución Z y de no ser posible se debe confiar en las pruebas no paramétricas.
Al igual que la distribución Z, la distribución t tiene una media de cero, es simétrica con
respecto a la media y oscila entre -∞ y + ∞. Sin embargo, mientras que la distribución Z
tiene una varianza de 𝜎 2 = 1, la varianza de la distribución t es mayor 1. Por tanto, es más
plana y más dispersa que la distribución Z. La varianza para la distribución t es
Varianza de la distribución t
𝑛−1
𝜎2 =
𝑛−3
En la realidad la distribución t es una familia de distribuciones cada una con su propia
varianza. La varianza depende de los grados de libertad (g.l), definidos como el numero
de observaciones que se puede escoger libremente. Es el número de observaciones menos
el número de restricciones impuestas sobre tales observaciones, en donde una restricción
es algún valor que tales observaciones deben poseer. Si asume que tiene n = 4
observaciones que deben producir una media de 10. La media de 10 sirve como una
Para crear un intervalo de confianza de la media poblacional con una desviación estándar
desconocida:
1. Suponga que la población muestreada es normal o aproximadamente normal. De
acuerdo con el teorema de límite central, sabemos que este supuesto es
cuestionable en el caso de muestras pequeñas, y es más válido en el de muestras
grandes.
2. Estime la desviación estándar de la población (𝜎) con la desviación estándar de la
muestra (S).
3. Utilice la distribución t en lugar de la distribución Z.
El valor apropiado de t puede hallarse de la tabla de distribución t. Para ilustrar, se asume
que se desea un intervalo de confianza del 95% y se tiene una muestra de 20
observaciones. Debido a que n = 20, los grados de libertad son g.l. = n – 1 = 19. Bajando
por la primera columna en la tala “g.l.” hasta 19. Se mueve a través de dicha fila hacia la
columna encabezada por un nivel de confianza de 0,95 para las pruebas de dos colas. (se
ignoran las dos filas referentes a las pruebas de una cola). La entrada resultante de 2,093
es el valor de t apropiado para un intervalo de confianza de 95% con un tamaño muestral
de 20 (g.l. = 19)
Ejemplo:
Una empresa de construcción fue culpada de inflar los comprobantes que registra para
los contratos de construcción con el gobierno. El contrato estableció que un cierto tipo de
trabajo debería promediar $1.150. Por motivos de tiempo, los directivos de sólo 12
agencias del gobierno llamados a dar testimonio ante la corte respecto a los comprobantes
de la empresa. Si se descubrió a partir del testimonio una media de $1.275 y una
desviación estándar de $235, ¿un intervalo de confianza de 95% apoyará el caso legal de
la empresa? Se asume que los montos de los comprobantes son normales.
tiende a sugerir una contravención del contrato laboral, permitiendo así una acción
correctiva?
2. El gerente de San Luis Shoping, desea estimar la cantidad media que gastan los
clientes que visitan el centro comercial. Una muestra de 20 clientes revela las
siguientes cantidades.
4 1 2 2 1 2 2 1 0 3
Un representante de ventas afirma que 45% de las ventas de KFC se lleva a cabo
en la ventana de servicio para automóviles.
Un estudio de las casas del área de Distrito Metropolitano de Quito indicó que
85% de las construcciones nuevas cuenta con sistema centralizado de gas.
Estos ejemplos ilustran la escala de medición nominal. Cuando se mide con una escala
nominal, una observación se clasifica en uno de dos o más grupos mutuamente
excluyentes. Por ejemplo, un graduado del Instituto Tecnológico Central Técnico entra al
mercado laboral en un puesto relacionado con su campo de estudio o no lo hace. Solo hay
dos posibilidades, y el resultado de clasificarse en unos de los dos grupos. En este evento,
el parámetro de interés en la proporción poblacional. Por tanto la preocupación se
encontrara en la proporción de respuestas que queda dentro de uno de estos dos resultados.
El error estándar de la distribución muestral de la proporciones muéstrales
𝝅(𝟏− 𝝅)
𝝈𝒑 = √
𝒏
Sin embargo, la formula contiene 𝜋, el parámetro que se desea estimar. Por tanto, la
proporción muestral p se utiliza como estimador de 𝜋.
Estimación del error estándar de la distribución de las proporciones muéstrales
𝒑(𝟏−𝒑)
𝑺𝒑 = √
𝒏
Proporción Fracción, razón o porcentaje que indica la parte de la muestra de la población
que posee un rasgo de interés particular.
Como ejemplo de proporción, una encuesta reciente indicó que 92 de cada 100
entrevistados estaban de acuerdo con el horario de verano para ahorrar energía. La
proporción de la muestra es de 92/100, 0.92 o 92%. Si “p” representa la proporción de la
muestra, X el número de éxitos y n el número de elementos de la muestra, se determina
una proporción muestral de la siguiente manera:
𝑋
Proporción Muestral p=
𝑛
La proporción de la población se define por medio de 𝜋. Por consiguiente, 𝜋 se refiere al
porcentaje de éxitos en la población.
Para crear el intervalo de confianza de una proporción, es necesario cumplir con los
siguientes supuestos:
1. Las condiciones binomiales, estudiadas han quedado satisfechas. En resumen,
estas condiciones son:
y color del envase. De las 1.400 amas de casa de la muestra, 420 identificaron la
marca por su nombre.
a. Calcule el valor de la proporción de la población.
b. Construya el intervalo de confianza de 99% de la proporción poblacional
c. Interprete sus conclusiones.
son los más comunes. Para calcular el tamaño de la muestra, se necesitará un estadístico
z que corresponda al nivel de confianza elegido. El nivel de confianza de 95%
corresponde al valor z de 1.96, y el nivel de confianza de 99%, a un valor z de 2.58. Note
que las muestras más grandes (con su consecuente requerimiento de más tiempo y dinero
para recolectarlas) corresponden a niveles de confianza más altos. Asimismo, observe que
utilizamos un estadístico z.
1. Realice un estudio piloto. Éste es el método más común. Suponga que desea un
cálculo aproximado de la cantidad de horas que trabajan a la semana los
estudiantes matriculados en la Facultad de Administración de la Universidad
Central. Para probar la validez del cuestionario, se aplica a una pequeña muestra
de estudiantes. A partir de esta pequeña muestra se calcula la desviación estándar
de la cantidad de horas que trabajan y se utiliza este valor como la desviación
estándar de la población.
fórmula es el margen de error que se utiliza para calcular los puntos extremos de los
intervalos de confianza para estimar una media poblacional.
𝜎
E = 𝑍𝑎 √√𝑛
2
Al despejar n en esta ecuación se obtiene el siguiente resultado:
Donde:
n es el tamaño de la muestra.
Za/2 es el valor normal estándar correspondiente al nivel de confianza deseado.
𝝈 es la desviación estándar de la población
E es el margen de error deseado
3. Use su juicio para el valor de 𝜎. Por ejemplo, se puede empezar por estimar el
mayor y el menor valor en los datos de la población. Esta diferencia entre el mayor
y el menor valor proporciona una estimación del rango de los datos. Por último,
este valor dividido entre 4 suele considerarse como una aproximación burda a la
desviación estándar y tomarse como un valor planeado aceptado de 𝜎.
Ejercicios:
1. Un estudiante de administración desea determinar la cantidad media que ganan al
mes los miembros de los consejos ciudadanos de las grandes ciudades. El error al
calcular la media debe ser inferior a $100, con un nivel de confianza de 95%. El
estudiante encontró un informe del Departamento de Trabajo en el que la
desviación estándar es de $1.000 ¿Cuál es el tamaño de la muestra que se requiere?
2. ¿Qué tan grande debe seleccionarse una muestra para tener un intervalo de
confianza de 95% con un margen de error de 10? Suponga que la desviación
estándar poblacional es 40.
𝜋(1− 𝜋)
E = Za/2√
𝑛
𝒁𝒂/𝟐 𝟐
n = 𝝅(𝟏 − 𝝅)( )
𝑬
donde:
n es el tamaño de la muestra
Za/2 es el valor normal estándar correspondiente al nivel de confianza deseado
𝜋 es la proporción de la población (p = x/n)
E es el margen de error deseado
Las elecciones del estadístico z y el margen de error E son las mismas que para calcular
la media poblacional. Sin embargo, en este caso la desviación estándar de la población de
una distribución normal está representada por 𝜋(1 − 𝜋). Para encontrar el valor de una
proporción de la población, podemos hallar un estudio similar o conducir un estudio
piloto. Si no se puede encontrar un valor confiable, entonces se debe usar un valor de 𝜋
de 0.50. Observe que 𝜋(1 − 𝜋) tiene el mayor valor utilizando 0.50 y, por lo tanto, sin
una buena estimación de la proporción de la población, se sobrestima el tamaño de la
muestra. Esta diferencia no afectará el estimador de la proporción de la población.
3. Se calcula que una población tiene una desviación estándar de 10. Desea estimar
la media de la población a menos de 2 unidades del error máximo admisible, con
un nivel de confianza de 95%. ¿De qué tamaño debe ser la muestra?
Así, si quisiera construir un intervalo de confianza de una media a partir de una población
finita sin conocer la desviación estándar de la población, la formula se ajusta de la
siguiente manera:
El siguiente ejemplo resume los pasos para determinar un intervlo de confianza de una
media.
Ejemplo:
1. Hay 250 familias en una determinada Ciudad. Una muestra aleatoria de 40 de
estas familias revelo que la contribución anual media a la iglesia fue de $450, y la
desviación estándar, de $75. ¿La media poblacional puede ser de $445 o $425?
a. ¿Cuál es la media poblacional?
b. Construya el intervalo de confianza de 90% de la media poblacional.
¿Cuáles son los puntos extremos del intervalo de confianza?
c. Interprete el intervalo d confianza
2. El mismo estudio relacionado con las contribuciones para la iglesia reveló que 15
de las 40 familias tomadas de la muestra asiste regularmente a la iglesia.
Construya el intervalo de confianza de 95% de la población de familias que asisten
a la iglesia con regularidad.
BIBLIOGRAFIA
1. WEBSTER ALLEN L. Estadística Aplicada a los Negocios y a la Economía,
Mc Graw-Hill, 3era Edición, 2000
2. ARAGON SALGADO LUZ GRICEL, Estadística en el área de las Ciencias
Sociales y Administrativas, Alfaomega, 2016
3. LIND, MARCHAL,WATHEN, Estadística Aplicada a los Negocios y a la
Economía, 15 ed. Mc Graw-Hill, 2012
4. MARTINEZ BENCARDINO CIRO, Estadística y Muestreo, 2012, 13era
Edición, Bogotá, ECO EDICIONES.