Sunteți pe pagina 1din 36

UNIVERSIDAD POLITÉCNICA SALESIANA

CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

ESTADISTICA INFERENCIAL
UNIDAD II
TEORIA DEL MUESTREO
La teoría del muestreo se refiere al estudio de las relaciones que existen entre un colectivo
o población y las muestras que se extraen de las mismas. El estudio de las muestras
permite hacer estimaciones de características desconocidas de la población (tales como
media, desviación estándar, proporciones, etc.). Estas estimaciones se hacen a partir del
conocimiento de las características de las muestras (media, desviación estándar,
proporción, etc.)
Las características o medidas obtenidas de una muestra se llaman estadísticos; y las
medidas correspondientes a la población parámetros. Cuando una medida muestral o
estadística es utilizada como representante de una característica poblacional o parámetro
se denomina estimador.
Ventajas de la utilización de las muestras
1. El costo es menor u se puede obtener un mejor rendimiento del dinero invertido.
2. Se obtiene una disminución notable del tiempo necesario para alcanzar la
información.
Cuando una muestra posee 30 o más datos se denominan grandes muestras y si la muestra
tiene menos de 30 observaciones se denomina pequeñas muestras. Al procedimiento
utilizado para elegir una muestra se denomina Muestreo.
Necesidades del Muestreo
1. Población infinita
2. Población uniforme.
3. Proceso de investigación destructiva.
4. Economía de costos.
5. Calidad.
Muestreo con o sin reemplazo
 Con reemplazamiento cuando un elemento de la población puede ser escogido
varias veces para formar parte de la muestra.
 Sin reemplazamiento cuando un elemento de la población solo puede ser
seleccionado una sola vez para formar parte de la muestra.
Población: es una colección de todos los elementos que estamos estudiando y acerca de
los cuales se intenta extraer conclusiones. Puede ser infinita o finita.
Muestra: Una parte de la población o un subconjunto del con junto de unidades obtenidas
con el objeto de investigar las propiedades de la población.

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


1
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

Muestreo estadístico: Es un enfoque sistemático para seleccionar unos cuantos elementos


(una muestra) de un grupo de datos (población) a fin de hacer algunas inferencias sobre
el grupo total. Desde el punto de vista matemático, podemos describir las muestras y las
poblaciones mediante medidas como la media, la moda, la desviación estándar, etc. No
es más que el procedimiento a través del cual se obtienen las muestras.
Tipos de muestreo
Muestreo de juicio o no probalístico. (opinático). Se basa en el conocimiento de la
población por parte de alguien, quien hace a la muestra representativa, dependiendo de
su intención, por lo tanto es subjetiva.
Probabilístico (errático): Todos los elementos de la población tienen la probabilidad de
pertenecer a la muestra.
Etapas de un estudio por muestreo
A continuación los pasos que es conveniente seguir para realizar un estudio por muestreo:
1. Definir los objetivos. Es la etapa inicial de cualquier estudio científico.
2. Definir el problema a estudiar. Consiste en especificar cuáles son todos y cada
uno de sus elementos. Marco muestral es la especificación de todos y cada uno
de los elementos de la población a estudiar. Unidad de muestreo cada uno de los
elementos a estudiar de una población (familiar, personas, facturas, cheques,
piezas fabricadas, etc.)
3. Elegir el diseño de la muestra. Se debe decidir si se tomará una sola muestra o
varias, en el caso de ser varias de ellas se debe especificar si serán nuestras
independientes o muestras relacionadas. Finalmente se debe determinar si se
utilizará muestreo aleatorio simple, el estratificado, el sistemático, por
conglomerado o algún otro tipo.
4. Realizar una prueba piloto. En ocasiones en conveniente, realizar un estudio
preliminar para determinar si el diseño de la muestra no presenta dificultades. Es
recomendable para estudios que se realizan por primera vez o estudios en los que
se aplican encuestas.
5. Recolección, procesamiento y análisis de la información.
6. Presentación de conclusiones.
UNIDAD II
DISTRIBUCIONES MUESTRALES
Es el conjunto de todas las muestras distintas de determinado tamaño n que es posible
extraer de una población de tamaño N.
Una distribución muestral es una es una distribución de probabilidad de un estadístico
muestral calculado a partir de todas las muestras posibles de tamaño n, elegidas al azar
en una población determinada. Si la población es infinita, tenemos que concebir la

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


2
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

distribución muestral teórica, ya que es imposible sacar todas las muestras aleatorias
posibles de tamaño n de una población infinita. Si la población es finita se puede construir
una distribución muestral experimental, sacando todas las muestras posibles de un tamaño
dado, calculando para cada muestra el valor del estadístico que nos interesa. Ejemplo,
supongamos que se tiene una población de tamaño N = 10 y queremos extraer con
reemplazamiento todas las muestras posibles de tamaño n = 5, para esto se utiliza la
relación 𝑵𝒏 , es decir, 105 = 100000 muestras de tamaño n = 5.
En cambio, si el muestreo es sin reemplazamiento, el número de muestras de tamaño N =
5 viene dado por la combinatoria:
𝑵 𝑵! 𝟏𝟎!
[ 𝒏 ] = 𝒏!(𝑵−𝒏)! = 𝟓!(𝟏𝟎−𝟓)! = 252 muestras

Por lo que considerando este caso, la distribución muestral para un estadístico


determinado, por ejemplo, la media X viene dado por:
muestra 1 𝑋1
muestra 2 𝑋2

muestra 252 𝑋252

Esto es, 𝑋1, , 𝑋2, , 𝑋3 ,……., , 𝑋𝑛 o sea, la distribución muestral de medias.


Se puede hacer una aproximación experimental de distribuciones muéstrales basadas en
poblaciones infinitas o finitas grandes, sacando un número de muestras aleatorias y
siguiendo el mismo procedimiento anterior.

“Error” de muestreo. Como la muestra forma parte o es una porción representativa de


la población, es poco probable que su media sea exactamente igual a la media
poblacional. Asimismo, es poco probable que la desviación estándar de la muestra sea
exactamente igual a la desviación estándar de la población. Por lo tanto, puede esperar
una diferencia entre un estadístico de la muestra y el parámetro de la población
correspondiente. Esta diferencia recibe el nombre de error de muestreo.

ERROR DE MUESTREO. Diferencia entre el estadístico de una muestra y el parámetro


de la población correspondiente.

Ejemplo.

2.1.Distribución muestral de la media. Conjunto de las medias de todas las


muestras de tamaño n que es posible obtener de una población de tamaño N.

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


3
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

Desarrollo:
 Se supondrá una población de N elementos.
 Se calcularán la media aritmética y la desviación estándar de la población.
 Se determinará el número total de muestras distintas de tamaño n que es
posible extraer y de concluirá cuales son; es decir, se enumerará la distribución
muestral (el conjunto de todas las muestras de ese tamaño que es posible
obtener de esa población).
 Se resolverá la media de cada una de las muestras identificadas en el paso 3; con
esto ya se tiene la distribución muestral de la media (el conjunto de todas las
medias de todas las muestras de ese tamaño que es posible obtener de la
población)
 Se calcula la media y la desviación estándar de la distribución muestral de la
media.
 Se obtendrán las conclusiones para el muestreo al comparar los parámetros
poblacionales con los valores obtenidos para la distribución muestral de la media.
 Se obtendrá también la forma de la distribución muestral de la media para obtener
otra importante conclusión: la que permite utilizar la distribución normal para
hacer los juicios sobre la probabilidad de estar en lo correcto cuando se hacen
inferencias.

Ejemplo:

1. Carrocerías Los Ríos cuenta con siete empleados de producción (a quienes se les
considera la población). En la tabla se incluyen los ingresos por hora de cada uno
de ellos.

Empleado Ingreso por


hora
José $7,00
Juan $7,00
Marco $8,00
Pedro $8,00
Antonio $7,00
Pablo $8,00
Andrés $9,00

1. ¿Cuál es la media de la población?


2. ¿Cuál es la distribución muestral de la media de muestras de tamaño 2?
3. ¿Cuál es la media de la distribución muestral de la media?
4. ¿Qué observaciones es posible hacer sobre la población y la distribución muestral
de la media?

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


4
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

2. Los tiempo de servicio de los ejecutivos que laboran en una firma auditora son:
Nombres Años
Matías 20
Samuel 22
Andrés 26
Marco 24
Fernando 28

a. De acuerdo con la fórmula de las combinaciones, ¿Cuántas muestras de tamaño 2


son posibles?
b. Elabore una lista de todas las muestras posibles de 2 ejecutivos de la población y
calcule las medias.
c. Organice las medias en una distribución muestral.
d. Compare la media poblacional y la media de las medias de las muestras.
e. Compare la dispersión de la población con la dispersión de la distribución
muestral de la media.
f. A continuación se muestra una gráfica con los valores de la población. ¿tienen los
valores de la población una distribución normal (en forma de campana)
g. ¿Comienza la distribución muestral de la media que se calculó en el inciso c) a
indicar una tendencia a adoptar forma de campana?

1. DISTRIBUCION MUESTRAL

Consideremos todas las posibles muestras de tamaño n en una población. Para cada
muestra podemos calcular un estadístico muestral (la media muestral x, la desviación
estándar muestral s, la proporción muestral p, etc.) que variará de una a otra muestra. Así
obtenemos una distribución de los estadísticos resultantes de cada muestra que se llama
distribución muestral, en otras palabras es:

La distribución de probabilidad de todas las muestras de un determinado tamaño de muestra de


la población.

Las muestras aleatorias obtenidas de una población son, por naturaleza propia,
impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y tomadas
de la misma población tenga la misma media muestral o que sean completamente
parecidas; puede esperarse que cualquier estadístico, como la media muestral, calculado
a partir de las medias en una muestra aleatoria, cambie su valor de una muestra a otra, por
ello, se quiere estudiar la distribución de todos los valores posibles de un estadístico. Tales
distribuciones serán muy importantes en el estudio de la estadística inferencial, porque
las inferencias estadísticas se harán usando estadísticos muéstrales. Conocer esta
distribución muestral y sus propiedades permite juzgar la confiabilidad de un estadístico

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


5
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

muestral como un instrumento para hacer inferencia sobre un parámetro poblacional


desconocido.
Hay dos tipos de distribuciones muéstrales: la distribución muestral de medias y la de
proporciones.
Se asume en aras de la simplicidad de la discusión, que se tiene una población de N = 4
ingresos para cuatro estudiantes universitarios. Estos ingresos son de $100, $200, $300
∑𝑋
y $400. El ingreso promedio puede calcularse con 𝜇 = ; 𝜇 = $250. Sin embargo,
𝑁
para hacer las cosas aún más simples, se puede pensar que calcular la media de cuatro
observaciones requiere mucho esfuerzo. Como alternativa, se decide seleccionar una
muestra de n = 2 observaciones para estimar el 𝜇 “desconocido”. Se podría entonces
seleccionar aleatoriamente una muestra de 4C2 = 6 posibles muestras. Estas seis muestras
∑𝑋
distintas y sus medias X = se muestran en la tabla siguiente:
𝑛

Elementos Medias
Muestra muestrales muestrales
Xj X
1 100 - 200 150
2 100 - 300 200
3 100 - 400 250
4 200 - 300 250
5 200 - 400 300
6 300 - 400 350

Asumiendo que cada muestra tiene la misma probabilidad de ser seleccionada, la


probabilidad de seleccionar una muestra de una X igual a la media poblacional de 250 es
sólo 2/6 = 33,3%. Cuatro de las seis muestras resultarán con algún error en el proceso de
estimación. Este error de muestreo es la diferencia en 𝜇 y la media muestral que se
utiliza para estimar, (X – 𝜇).

Error de muestreo. Es la diferencia entre el parámetro poblacional y el estadístico de la


muestra utilizado para estimar el parámetro.

Con una población de solo N = 4, se puede enumerar cada media muestral posible que
aparece en la tabla anterior junto con sus respectivas probabilidad. Tal listado se le
denomina una distribución muestral, y aparece en la y su histograma.

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


6
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

DISTRIBUCION MUESTRAL
Medias Numero de
Probabilidad
muestrales muestras
de P(x)
X que dan X
150 1 1/6 = 0.1667
200 1 1/6 = 0.1667
250 2 2/6 = 0.3333
250 2 2/6 = 0.3333
300 1 1/6 = 0.1667
350 1 1/6 = 0.1667
6 1

Distribución muestral. Es una lista de todos los valores posibles para un estadístico y la
probabilidad relacionada con cada valor

2.1. DISTRIBUCION MUESTRAL DE LA MEDIA

Es la distribución de probabilidad de todos los valores de la media muestral (x).

La distribución muestral de medias como otras distribuciones de probabilidad tiene un


valor esperado, una desviación estándar y una forma característica.
Estas medias muestrales, al igual que cualquier lista de números, tienen una media
denominada “la media de las medias muestrales”. Se calculan:
∑𝑿
𝝁𝑿 =
𝒏
𝟏𝟓𝟎+𝟐𝟎𝟎+𝟐𝟓𝟎+𝟐𝟓𝟎+𝟑𝟎𝟎+𝟑𝟓𝟎
𝝁𝑿 = 𝟔
= 250
Además debe notarse que la media de la distribución muestral es igual a la media de la
población original. La media de la distribución muestral siempre será igual a la media
poblacional.
La varianza y el error estándar de la medias muestrales

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


7
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

La varianza en las medias muestras es como cualquier otra varianza. Mide la dispersión
de las observaciones individuales (medias muestrales) alrededor de su media (la gran
media). Se halla
1. Determinando la cantidad por la cual cada una de las observaciones (medias
muestrales) difieren de su media (la gran media).
2. Elevando al cuadrado tales desviaciones.
3. Promediando las desviaciones al cuadrado y dividiendo por el número de medias
muestrales.
Varianza de la distribución muestral de la medias muestrales

∑(𝑿− 𝝁𝒙 )𝟐 ∑(𝑿− 𝝁)𝟐𝝁


𝝈𝟐𝑿 = =
𝒏 𝒏
Dadas las seis mediadas muestrales anteriores,

𝝈𝟐𝑿 =
(𝟏𝟓𝟎−𝟐𝟓𝟎)𝟐 + (𝟐𝟎𝟎−𝟐𝟓𝟎)𝟐 + (𝟐𝟓𝟎−𝟐𝟓𝟎)𝟐 + (𝟐𝟓𝟎−𝟐𝟓𝟎)𝟐 + (𝟑𝟎𝟎−𝟐𝟓𝟎)𝟐 + (𝟑𝟓𝟎−𝟐𝟓𝟎)𝟐
𝟔

= 4.166,67 dólares al cuadrado.


Si se tuviera que sacar la raíz cuadrada de la varianza en la distribución de estas medias
muestrales, se tendría el error estándar de la distribución muestral 𝝈𝑿 Por tanto,
Error estándar de la distribución muestral de las medias muestrales

𝝁𝒙 = √𝝈𝟐𝒙
En el caso actual

𝝁𝒙 = √𝟒. 𝟏𝟔𝟕 = 64,55 dólares.


El error estándar de la distribución muestral (error estándar) es una medida de la
dispersión de las medias muestrales alrededor de 𝜇. Debido a que la diferencia entre X y
𝜇 es el error de muestreo, toda medida de la tendencia de la media muestral a desviarse
de 𝜇 se le denomina acertadamente error estándar. Por tanto, el error estándar 𝜎𝑥 mide la
tendencia a sufrir del erro de muestreo en el esfuerzo por estimar 𝜇.

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


8
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

Ejemplo:
Las ventas en miles de dólares para para Manufacturas Cotopaxi durante los últimos 5
meses fueron de 68, 73, 65, 80 y 72. Asumiendo que estos cinco meses constituyen la
población, la media claramente es 𝜇 = 71,6. Como director de marketing Manufacturas
Cotopaxi, se desea estimar este 𝜇 “desconocido” toma una muestra de tamaño n = 3. Se
espera que el error de muestreo que es probable que ocurra sea relativamente pequeño.
Realice la distribución muestral y haga comentarios sobre el posible error de muestreo.

El impacto del tamaño de la muestra en el error estándar.


Dada una población de tamaño N = 1000, se considera que ¿se obtendría un estimado más
preciso de la media poblacional 𝜇 con una muestra de tamaño n = 1000 o con una muestra
más grande de n = 900. Puede verse que a medida que n aumente 𝜎𝑥 disminuye.
Ejercicios.
1. Una población de las producciones semanales de una fábrica de miles de toneladas
es 200, 250, 150, 200 y 300. Realice una distribución muestral y calcule la media
y el error estándar para la muestra de tamaño n = 2

2. ¿Qué pasará con el error estándar del ejercicio anterior si n = 3? ¿Por qué hay
diferencia)

2.2. Teorema del límite central


Cuando se seleccionan muestras aleatorias simples de tamaño n de una población, la
distribución muestral de la media muestral x puede aproximarse mediante una
distribución normal a medida que el tamaño de la muestra se hace grande.

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


9
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


10
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

Esto nos lleva a importantes conclusiones.


1. La media de la distribución muestral de medias será exactamente igual a la media
poblacional si selecciona todas las muestras posibles del mismo tamaño de una
población dada. Es decir,
𝝁 = 𝝁𝒙

Aunque no seleccione todas las muestras, es de esperar que la media de la


distribución muestral de medias se aproxime a la media poblacional.

2. Habrá menos dispersión en la distribución muestral de las medias que en la


población. Si la desviación estándar de la población es 𝜎, la desviación estándar
de la distribución muestral de medias es 𝜎/√𝑛. Se debe notar que, cuando se
incrementa el tamaño de la muestra, disminuye el error estándar de la media.
Ejemplo:
Jaime Jaramillo fundó su negocio de fundición de metales hace 20 años. El negocio
creció a lo largo del tiempo y ahora cuenta con 40 empleados. FUNDAC S.A. encara
algunas decisiones importantes con la atención médica de su personal. Antes de tomar
una decisión definitiva con la compra de un programa de atención médica, Jaime
decide formar un comité de cinco empleados. El comité será el encargado de hacer
los estudios adecuados del plan médico y hará las mejores recomendaciones para la
compra del mejor programa médico para sus empleados. Jaime reflexiona que el
criterio será diferente entre los miembros del comité que trabajan muchos años con
relación a los nuevos. Si Jaime selecciona al azar este comité, ¿Qué puede esperar en
términos del promedio de años que llevan con FUNDAC S.A. los miembros del
comité? ¿Cuál es la forma de distribución de los años de experiencia de todos sus
empleados (la población) en comparación con la forma de distribución muestral de la
media? Los tiempos de servicio (redondeados al año inmediato) de los 40 empleados
que actualmente están en nómina en FUNDAC S.A. son los siguientes

11 4 18 2 1 2 0 2 2 4
3 4 1 2 2 3 3 19 8 3
7 1 0 2 7 0 4 5 1 14
16 8 9 1 1 2 5 10 2 3

¿Qué se concluye de este ejemplo? El teorema de límite central indica que, sin que
importe la forma de la distribución de la población, la distribución muestral de la media
se aproximará a la distribución de probabilidad normal. Cuanto mayor sea el número de
observaciones en cada muestra, más evidente será la convergencia. El ejemplo demuestra
el mecanismo del teorema central del límite. Comenzó con una población con sesgo
positivo. Después seleccionó 25 muestras aleatorias de 5 observaciones calculó la media
de cada muestra y, por último, organizó las 25 medias de muestra en una gráfica. Se

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


11
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

observó un cambio en la forma de la distribución muestral de las medias respecto de la


de la población. El desplazamiento va de una distribución con sesgo positivo a una que
tiene la forma de la distribución de probabilidad normal.
Se puede demostrar que la media de la distribución muestral es la media poblacional, es
decir, que 𝜇𝑥 = 𝜇, y si la desviación estándar de la población es 𝜎, la desviación estándar
de las medias muestrales es en la que n es el número de observaciones de cada muestra.
Entonces 𝜎/√𝑛, es el error estándar de la media. En realidad, el nombre completo es
desviación estándar de la distribución muestral de la media.
Desviación estándar de la distribución muestral de la media
𝝈
𝝁𝑿 =
√𝒏
Nos permite importantes conclusiones.
1. La media de la distribución muestral de medias será exactamente igual a la media
poblacional si se selecciona todas las muestras posibles del mismo tamaño de una
población dada.
𝜇 = 𝜇𝑋
Es decir, Aunque no seleccione todas las muestras, es de esperar que la media de
la distribución muestral de medias se aproxime a la media poblacional.

2. Habrá menos dispersión en la distribución muestral de las medias que en la


población. Si la desviación estándar de la población es 𝜎, la desviación estándar
de la distribución muestral de medias es 𝜎/√𝑛. Note que, cuando se incrementa
el tamaño de la muestra, disminuye el error estándar de la media.

2.3. Uso de la distribución muestral de la media


La mayoría de las decisiones que se toman en los negocios tienen como fundamento los
resultados de un muestreo.

De acuerdo con los conceptos que se analizaron, es posible calcular la probabilidad de


que la media de una muestra se encuentre dentro de cierto margen. La distribución de
muestreo seguirá la distribución de probabilidad normal con dos condiciones:
1. Cuando se sabe que las muestras se toman de poblaciones regidas por la distribución
normal. En este caso, el tamaño de la muestra no constituye un factor.
2. Cuando se desconoce la forma de la distribución de la población o se sabe que no es
normal, pero la muestra contiene por lo menos 30 observaciones. En este caso, el teorema

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


12
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

central del límite garantiza que la distribución muestral de la media sigue una distribución
normal.
Aplique la fórmula para convertir cualquier distribución normal en una distribución
normal estándar. A este hecho también se le denomina valor z. Así, se emplea la tabla de
la distribución normal estándar para determinar la probabilidad de seleccionar una
observación que caerá dentro de un intervalo específico. La fórmula para determinar un
valor z es:
𝑿− 𝝁
Z=
𝝈
En esta fórmula, X es el valor de la variable aleatoria; 𝜇 es la media de la población, y
𝜎es la desviación estándar de la población.
Sin embargo, la mayor parte de las decisiones de negocios se refieren a una muestra, no
a una sola observación. Así, lo importante es la distribución de X, la media muestral, en
lugar de X, el valor de una observación. Éste es el primer cambio en la fórmula (7-5). El
segundo consiste en emplear el error estándar de la media de n observaciones en lugar de
la desviación estándar de la población. Es decir, se usa 𝜎/√𝑛en el denominador en vez
de 𝜎. Por consiguiente, para determinar la probabilidad de una media muestral con rango
específico, primero aplique la fórmula para determinar el valor z correspondiente.
Después se consulta la tabla de áreas bajo la curva normal estándar para localizar la
probabilidad.
CÁLCULO DEL VALOR z DE X CUANDO SE CONOCE LA DESVIACIÓN
ESTÁNDAR DE LA POBLACIÓN
𝑿− 𝝁
Z=
𝝈/√𝒏

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


13
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

EJERCICIOS:
1. TelCom planea instalar nuevos equipos que mejorarían la eficiencia de sus
operaciones. Sin embargo, antes que los ejecutivos puedan decidir si dicha
inversión será eficaz en función de los costos, deben determinar la probabilidad
de que la media de una muestra de n = 35
a. Esté entre 145 y 150
b. Sea mayor que 145
c. Sea menor que 155
d. Este entre 145 y 155
e. Sea mayor que 155

2. Una población normal tiene una media de 60 y una desviación estándar de 12.
Usted selecciona una muestra aleatoria de 9. Calcule la probabilidad de que la
media muestral:
a. Sea mayor que 63.

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


14
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

b. Sea menor que 56.


c. Se encuentre entre 56 y 63.

3. En el norte de una determinada Ciudad, la renta de un departamento con una


recámara tiene una distribución normal con una media de $2 200 mensuales y una
desviación estándar de $250 mensuales. La distribución del costo mensual no se
rige por la distribución normal. De hecho, tiene un sesgo positivo. ¿Cuál es la
probabilidad de seleccionar una muestra de 50 departamentos de una recámara y
hallar que la media es de por lo menos $1 950 mensuales?
4.

2.4. Estimación e intervalos de confianza


Actualmente se debe estar bien consciente de que las poblaciones son generalmente muy
grandes como para ser estudiadas en su totalidad. Su tamaño requiere que se seleccione
muestras, las cuales se pueden utilizar más tarde para hacer inferencias sobre las
poblaciones.
Hay por lo menos dos tipos de estimadores que se utilizan más comúnmente para este
propósito: un estimador puntual y un estimador por intervalo. Un estimador puntual
utiliza un estadístico para estimar el parámetro en un solo valor o punto. El gerente de
una tienda puede seleccionar un muestra de n = 500 clientes y hallar el gasto promedio
de = $37,10. Este valor sirve como una estimación puntual para la media poblacional.
Una estimación por intervalo especifica el rango dentro del cual está el parámetro
desconocido. El gerente puede decidir que la media poblacional está en algún sitio entre
$35 y $38. Tal intervalo con frecuencia va acompañado de una afirmación sobre el nivel
de confianza que se da en su exactitud. Por tanto se llama intervalo de confianza (I.C).
Estimador. Un estimador puntual utiliza un número único o valor para localizar una
estimación del parámetro. Un intervalo de confianza denota un rango dentro del cual
puede encontrarse el parámetro, y el nivel de confianza que el intervalo contiene del
parámetro.
Hay tres niveles de confianza relacionados comúnmente con los intervalos de confianza:
99,95 y 90%. Se podría calcular un intervalo de confianza del 82% si se deseara. Estos
tres intervalos de confianza, denominados coeficiente de confianza, son simplemente
convencionales. El gerente mencionado anterior mente puede tener un 95% de confianza
en que la media poblacional esté entre $35 y $38.
Las estimaciones por intervalo tienen ciertas ventajas sobre las estimaciones puntuales.
Debido al error de muestreo, probablemente no será igual a 𝜇. Sin embargo, no hay
manera de saber qué tan grande es el error de muestreo. Por tanto, los intervalos se utilizan
para explicar esta discrepancia de confianza y cómo interpretarlo.

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


15
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

Fundamentos de un intervalo de confianza


Un intervalo de confianza tiene un límite inferior de confianza (LIC) y un límite
superior de confianza (LSC). Estos límites se hallan calculando primero la media
muestral . Luego se suma una cantidad a para obtener el LSC, y la misma cantidad se
resta de para obtener el LIC.
Si se desea construir un intervalo convencional del 95% ¿Cuántos errores estándar se debe
mover por encima y por debajo de la media muestral? Como lo demuestra la figura,
debido a que la tabla Z contiene valores sólo para el área que está por encima o por debajo
de la media se divide el 95% entre 2, produciendo 0.4750. Luego se halla rl valor Z =
1,96. Así, para construir un intervalo de confianza del 95%, simplemente se especifica un
intervalo de 1,96 errores estándar por encima y por debajo de la media muestral. Este
valor del 95% es llamado coeficiente de confianza o intervalo de confianza.
Intervalo de confianza. Conjunto de valores que se forma a partir de una muestra de
datos de forma que exista la posibilidad de que el parámetro poblacional ocurra dentro de
dicho conjunto con una probabilidad específica. La probabilidad específica recibe el
nombre de nivel de confianza.
Para calcular el intervalo de confianza, se debe considerar dos situaciones:
a. Utilizamos los datos de la muestra para calcular µ, con , mientras que la
desviación estándar de la población (𝜎) es conocida.
b. Utilizamos los datos de la muestra para calcularµ con , mientras que la
desviación estándar de la población es desconocida. En este caso,
sustituimos la desviación estándar de la(s) muestra(s) por la desviación
estándar de la población (𝜎).

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


16
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

2.5. Intervalo de confianza para la media poblacional – muestras grandes


Uno de los usos más comunes de los intervalos de confianza es estimar la media
poblacional. Un fabricante puede desear estimar la producción mensual promedio de su
planta; un representante de mercadeo puede interesarse en la reducción en las ventas
semanales promedio, etc.
Se debe recordar que el intervalo se forma utilizando la media muestral como un
estimador puntual para el cual se adiciona y se resta un cierto valor para obtener los limites
superior e inferior del intervalo de confianza.

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


17
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

2.5.1. Intervalo de confianza para estimar 𝝁 cuando 𝝈 es conocida


𝜎
I.C. para estimar 𝝁 = ±Z
√𝑛
Cuánto debe sumarse y restarse, depende en parte del nivel de confianza deseado,
estipulado por el valor de Z en la formula. Un nivel de confianza del 95% requiere un
valor de Z de 1,96(0,95/2=0,4750). El área de 0,4750 corresponde a un valor de Z de 1,96
Consideremos el caso de un promotor inmobiliario quien intenta construir un gran centro
comercial. Puede estimaren le área el ingreso promedio por familia como indicador de
las ventas esperadas. Una muestra de n = 100 familias de una media de = $35.500. Se
𝜎
asume que la desviación estándar es 𝜎 = $7.200 dado que 𝜎 = , se estima un
√𝑛
intervalo del 95% como
7.200
I.C. para estimar 𝜇 = 35.500 ± (1,96)
√100

= 34.088,80 ≤ 𝜇 ≤ 36.911,20

Interpretación de un intervalo de confianza

El promotor puede interpretar los resultados de su intervalo de confianza de dos formas.


La primera, la más común establece que el promotor tiene un “95% de confianza en que
la media poblacional real desconocida este entre $34.088,80 y $36.911,20. Aunque el
valor real para la media poblacional sigue siendo desconocido, el promotor tiene un 95%
de confianza en que esté entre estos dos valores.
La segunda interpretación reconoce que se pueden desarrollar muchos intervalos de
confianza diferentes. Otra muestra probablemente producirá una media muestral
diferente debido al error de muestreo. Con una diferente, el intervalo tendría límites
superior e inferior distintos. Por tanto, la segunda interpretación establece que si se
construyen todos los nCn intervalos de confianza, el 95% de ellos contendrá la media
poblacional desconocida.
Si una segunda muestra de una media de $35.600 en lugar de $35.500, el intervalo es
7.200
I.C. para estimar 𝜇 = 35.600 ± (1,96) √100

= 34.188,80 ≤ 𝜇 ≤ 37.011,20
Los puntos extremos $34.18880 y $37.011,20, estos puntos extremos se llaman límites de
confianza. El grado de confianza o nivel de confianza es de 95%, y el intervalo de confianza
abarca de $34.188,80 a $37.011, 20 con frecuencia de ± $1.411,20 se conoce como margen de
error.
Si todos los intervalos posibles se construyeran con base en todas las medias muéstrales
diferentes, el 95% de ellas contendría la media poblacional desconocida.

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


18
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

Esto significa que el 5% de todos los intervalos estará errado – no contendrían la media
poblacional. Este 5% hallado como (1 – coeficiente de confianza), es denominado el valor alfa y
representa la probabilidad d error. El valor alfa es la probabilidad de que cualquier intervalo dado
no contenga la media poblacional.

Ejercicios:
1. Burger Kin, es una franquicia de comida rápida, que se especializa en hamburguesas de
media onza, y sándwiches de pollo. También ofrece refrescos y papas a la francesa. El
departamento de planeación de la firma informa que la distribución de ventas diarias de
los restaurantes tiende a seguir la distribución normal. La desviación estándar de la
distribución de ventas diarias es de $3.000. Una muestra de 40 mostró que las ventas
medias diarias suman $20.000
a. ¿Cuál es la media de la población?
b. ¿Cuál es la mejor estimación de la media de la población? ¿Qué nombre recibe
este valor?
c. Construya un intervalo de confianza del 99% de la media poblacional.
d. Interprete el intervalo de confianza.
2. Se toma una muestra de 49 observaciones de una población normal con una desviación
estándar de 10. La media de la muestra es de 55. Determine el intervalo de confianza de
99% de la media poblacional.

3. Se selecciona una muestra de 250 observaciones de una población normal en la cual la


desviación estándar poblacional se sabe que es de 25. La media de la muestra es de 20.
a. Determine el error estándar de la media.
𝜎
b. Explique por qué se debe utilizar la formula 𝝁 = ± Z para
√𝑛
determinar el intervalo de confianza del 95%
c. Determine el intervalo de confianza de 95% de la media poblacional.

4. Una empresa de investigación llevó a cabo una encuesta para determinar la


cantidad media que los fumadores gastan en cigarrillos durante una semana. La
empresa descubrió que la distribución de cantidades que gastan por semana tendía
a seguir una distribución normal, con una desviación estándar de $5. Una muestra
de 49 fumadores reveló que = $20
a. ¿Cuál es el estimador puntual de la media de la población? Explique lo
que indica.

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


19
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

b. Con el nivel de confianza de 95%, determine el intervalo de confianza de


µ. Explique lo que significa.
5. El administrador de una estación de despacho de combustible para automóviles le
gustaría estimar la cantidad de galones de gasolina que vendió. Suponga que la
cantidad de galones vendidos tiende a seguir una distribución normal, con una
distribución estándar de 2,30 galones. De acuerdo con sus registros, selecciona
una muestra aleatoria de 60 ventas y descubre que la cantidad media de galones
vendidos es de 8,60
a. ¿Cuál es el estimador puntual de la media poblacional?
b. Establezca un intervalo de confianza de 99% de la media poblacional.
c. Interprete el significado del inciso b).

2.5.2. Intervalo de confianza cuando 𝝈 es desconocido


La fórmula anterior requiere la suposición improbable que la desviación estándar de la población
es conocida. En el evento probable que se 𝜎 sea desconocida, la desviación estándar de la muestra

debe sustituirse:

Intervalo de confianza para estimar 𝝁 cuando 𝝈 es desconocido


𝑺
I.C. para estimar 𝝁 = ± Z( )
√𝒏

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


20
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

Ejemplo:
La Compañía de Taxis Modelo, planea comprar una flota de nuevos taxis para sus
operaciones en la Ciudad de Quito. LA decisión depende de si el rendimiento del auto en
consideración e por lo menos 44,26 km por galón de gasolina. Los 36 carros que prueba
la compañía reporta una media de 41,20 km por galón, con una desviación estándar
muestral de 5,63 km. A un nivel de confianza del 99%, ¿Qué aconsejaría a la Compañía
de Taxis?
2.6. Intervalo de confianza para la media en el caso de muestras pequeñas – la
distribución t.
En los ejemplos anteriores, el tamaño de la muestra era mayor (n ≥ 30). Sin embargo, no
siempre puede ser posible obtener por lo menos 30 observaciones. Para una compañía de
seguros que prueba la resistencia al impacto de los autos, destruir a propósito 30 vehículos
de lujos puede volverse un poco costoso.
Cuando debe tomarse una muestra pequeña, la distribución normal puede no aplicar. El
teorema de límite central asegura normalidad en el proceso de muestreo sólo si la muestra
es grande. Cuando se utiliza una muestra pequeña, puede ser necesaria una distribución
alternativa, la distribución de t Student (o simplemente la distribución t). Para utilizar
la distribución de t se debe cumplir tres condiciones:
1. La muestra es pequeña.
2. La desviación estándar poblacional desconocida 𝜎.
3. La población es normal o casi normal
Si 𝜎 es conocida, la distribución Z se usa inclusive si la muestra es pequeña. Además, si
no puede asumir una población normal, se aumenta el tamaño de la muestra para utilizar
la distribución Z y de no ser posible se debe confiar en las pruebas no paramétricas.
Al igual que la distribución Z, la distribución t tiene una media de cero, es simétrica con
respecto a la media y oscila entre -∞ y + ∞. Sin embargo, mientras que la distribución Z
tiene una varianza de 𝜎 2 = 1, la varianza de la distribución t es mayor 1. Por tanto, es más
plana y más dispersa que la distribución Z. La varianza para la distribución t es
Varianza de la distribución t
𝑛−1
𝜎2 =
𝑛−3
En la realidad la distribución t es una familia de distribuciones cada una con su propia
varianza. La varianza depende de los grados de libertad (g.l), definidos como el numero
de observaciones que se puede escoger libremente. Es el número de observaciones menos
el número de restricciones impuestas sobre tales observaciones, en donde una restricción
es algún valor que tales observaciones deben poseer. Si asume que tiene n = 4
observaciones que deben producir una media de 10. La media de 10 sirve como una

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


21
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

restricción y hay n – 1 = 3 grados de libertad. Por tanto, se puede escoger tres


observaciones cualesquiera; por ejemplo se puede escoger 8, 9 y 11. Después de que se
seleccionan estos tres valores, ya no hay libertad para escoger la última observación. El
cuarto valor debe ser 12 si se quiere tener un promedio de 10. Vale la pena destacar en la
figura que a medida que n aumenta, la distribución t se aproxima a la distribución Z. Es
por esto que se puede utilizar la distribución Z cuando n ≥ 30.

Grados de libertad. El número de observaciones menos el número de restricciones


impuestas sobre tales observaciones.
Para todo conjunto de condiciones dadas la distribución t producirá un intervalo más
amplio que la distribución Z, si esta se utilizara. Este ancho adicional es necesario debido
a que se pierde algo de precisión porque 𝜎 es desconocida y debe estimarse.
El estadístico t se calcula en gran parte como el estadístico Z.

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


22
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

Para crear un intervalo de confianza de la media poblacional con una desviación estándar
desconocida:
1. Suponga que la población muestreada es normal o aproximadamente normal. De
acuerdo con el teorema de límite central, sabemos que este supuesto es
cuestionable en el caso de muestras pequeñas, y es más válido en el de muestras
grandes.
2. Estime la desviación estándar de la población (𝜎) con la desviación estándar de la
muestra (S).
3. Utilice la distribución t en lugar de la distribución Z.
El valor apropiado de t puede hallarse de la tabla de distribución t. Para ilustrar, se asume
que se desea un intervalo de confianza del 95% y se tiene una muestra de 20
observaciones. Debido a que n = 20, los grados de libertad son g.l. = n – 1 = 19. Bajando
por la primera columna en la tala “g.l.” hasta 19. Se mueve a través de dicha fila hacia la
columna encabezada por un nivel de confianza de 0,95 para las pruebas de dos colas. (se
ignoran las dos filas referentes a las pruebas de una cola). La entrada resultante de 2,093
es el valor de t apropiado para un intervalo de confianza de 95% con un tamaño muestral
de 20 (g.l. = 19)

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


23
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

Ejemplo:
Una empresa de construcción fue culpada de inflar los comprobantes que registra para
los contratos de construcción con el gobierno. El contrato estableció que un cierto tipo de
trabajo debería promediar $1.150. Por motivos de tiempo, los directivos de sólo 12
agencias del gobierno llamados a dar testimonio ante la corte respecto a los comprobantes
de la empresa. Si se descubrió a partir del testimonio una media de $1.275 y una
desviación estándar de $235, ¿un intervalo de confianza de 95% apoyará el caso legal de
la empresa? Se asume que los montos de los comprobantes son normales.

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


24
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

Decidir si utilizar una distribución t o Z es crucial. Vale la pena recordar que la


distribución t debería utilizarse cuando todas estas tres condiciones están presentes:
1. La población es normal.
2. Se toma una muestra pequeña, y
3. Desviación estándar es desconocida 𝜎.
Ejercicios:
1. El contrato laboral realizado entre GMC y Ford Motor requiere que la producción
promedio para una sección de producción se realiza a 112 unidades por mes, por
empleado. Surgieron desacuerdos entre GMC y FMC respecto a si se mantenía
este estándar o no. El contrato laboral especificó que si los niveles de producción
promedio se reducirían por debajo de la cantidad estipulada de 𝜎 = 112, a FMC
se le permitiría tomar acciones correctivas. Debido al costo implicado, sólo se
evaluaron 20 trabajadores, resultando una media de 102 unidades. Se asume que
se encontró una desviación estándar de 8,5 unidades y que los niveles de
producción están distribuidos normalmente. ¿un intervalo de confianza del 90%

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


25
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

tiende a sugerir una contravención del contrato laboral, permitiendo así una acción
correctiva?

2. El gerente de San Luis Shoping, desea estimar la cantidad media que gastan los
clientes que visitan el centro comercial. Una muestra de 20 clientes revela las
siguientes cantidades.

¿Cuál es la mejor estimación de la media poblacional? Determine un intervalo de


confianza de 95%. Interprete el resultado. ¿Concluiría de forma razonable que la
media poblacional es de $50? ¿y de $60?

3. Pollos Stav, hornea y vende pollos en 50 lugares del área de Quito D.


Metropolitano. El administrador está interesado en el ausentismo de sus
trabajadores. La siguiente información se refiere al número de días de ausentismo
de una muestra de 10 trabajadores durante el último periodo de pago de dos
semanas.

4 1 2 2 1 2 2 1 0 3

a. Determine la media y la desviación estándar de la muestra


b. ¿Cuál es la media de la población? ¿Cuál es la mejor estimación de dicho
valor?
c. Construya un intervalo de confianza de 95% de la media poblacional
d. Explique la razón por la que se utiliza la distribución t como parte del intervalo
de confianza
e. ¿Es razonable concluir que la trabajadora común no falta ningún día durante
un periodo de pago?

2.7.Intervalo de confianza para la proporción poblacional


El material hasta ahora expuesto utiliza la escala de medición de razón. Es decir, se
emplean variables como ingresos, pesos, distancias y edades. Ahora se consideran casos
como los siguientes:
 El director de servicios profesionales de un Instituto Tecnológico informa que
80% de sus graduados entra en el mercado laboral en un puesto relacionado con
su área de estudio.

 Un representante de ventas afirma que 45% de las ventas de KFC se lleva a cabo
en la ventana de servicio para automóviles.

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


26
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

 Un estudio de las casas del área de Distrito Metropolitano de Quito indicó que
85% de las construcciones nuevas cuenta con sistema centralizado de gas.

 Una encuesta reciente entre hombres casados de entre 35 y 50 años de edad


descubrió que 63% creía que ambos cónyuges deben aportar dinero.

Estos ejemplos ilustran la escala de medición nominal. Cuando se mide con una escala
nominal, una observación se clasifica en uno de dos o más grupos mutuamente
excluyentes. Por ejemplo, un graduado del Instituto Tecnológico Central Técnico entra al
mercado laboral en un puesto relacionado con su campo de estudio o no lo hace. Solo hay
dos posibilidades, y el resultado de clasificarse en unos de los dos grupos. En este evento,
el parámetro de interés en la proporción poblacional. Por tanto la preocupación se
encontrara en la proporción de respuestas que queda dentro de uno de estos dos resultados.
El error estándar de la distribución muestral de la proporciones muéstrales
𝝅(𝟏− 𝝅)
𝝈𝒑 = √
𝒏
Sin embargo, la formula contiene 𝜋, el parámetro que se desea estimar. Por tanto, la
proporción muestral p se utiliza como estimador de 𝜋.
Estimación del error estándar de la distribución de las proporciones muéstrales
𝒑(𝟏−𝒑)
𝑺𝒑 = √
𝒏
Proporción Fracción, razón o porcentaje que indica la parte de la muestra de la población
que posee un rasgo de interés particular.
Como ejemplo de proporción, una encuesta reciente indicó que 92 de cada 100
entrevistados estaban de acuerdo con el horario de verano para ahorrar energía. La
proporción de la muestra es de 92/100, 0.92 o 92%. Si “p” representa la proporción de la
muestra, X el número de éxitos y n el número de elementos de la muestra, se determina
una proporción muestral de la siguiente manera:
𝑋
Proporción Muestral p=
𝑛
La proporción de la población se define por medio de 𝜋. Por consiguiente, 𝜋 se refiere al
porcentaje de éxitos en la población.
Para crear el intervalo de confianza de una proporción, es necesario cumplir con los
siguientes supuestos:
1. Las condiciones binomiales, estudiadas han quedado satisfechas. En resumen,
estas condiciones son:

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


27
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

a. Los datos de la muestra son resultado de conteos.


b. Sólo hay dos posibles resultados (lo normal es referirse a uno de los
resultados como éxito y al otro como fracaso).
c. La probabilidad de un éxito permanece igual de una prueba a la siguiente.
d. Las pruebas son independientes. Esto significa que el resultado de la
prueba no influye en el resultado de otra.
2. Los valores n𝜋 y n(1- 𝜋) deben ser mayores o iguales que 5. Esta condición
permite recurrir al teorema central del límite y emplear la distribución normal
estándar, es decir, z, para completar un intervalo de confianza.
El desarrollo del estimador puntual de la proporción de la población y el intervalo de
confianza de una proporción de población es similar a hacerlo para una media. Para
ilustrarlo, considere lo siguiente: Pedro Santoro es candidato para representar al tercer
distrito Sur de Quito al Consejo Municipal. De una muestra aleatoria de 100 electores en
el distrito, 60 indican que planean votar por él en las próximas elecciones. La proporción
de la muestra es de 0.60, pero no se conoce la proporción poblacional. Es decir, no se
conoce qué proporción de electores de la población votará por Santoro. El valor de la
muestra, 0.60, es el mejor estimador del parámetro poblacional desconocido. Así, p, que
es de 0.60, constituye un estimador de 𝜋 (proporción de la población), que no se conoce.
Para crear el intervalo de confianza de una proporción de población se aplica la fórmula:
Intervalo de confianza para estimar la proporción de una población
𝑝(1−𝑝)
I.C. para estimar 𝝅 = p ± z√
𝑛
donde 1 – a es el coeficiente de confianza y 𝑍𝑎 es el valor de z que deja un área a/2 en la
2
cola superior de la distribución normal estándar.
Ejemplo:
1. El sindicato que representa a PETROECUADOR E.P. considera la propuesta de
fusión con PETROLEOS DEL PACIFICO. De acuerdo con el reglamento del
sindicato de PETROECUADOR, por lo menos tres cuartas partes de los miembros
del sindicato deben aprobar cualquier fusión. Una muestra aleatoria de 2000
miembros actuales de PETROECUADOR revela que 1600 planean votar por la
propuesta. ¿Qué es el estimador de la proporción poblacional? Determine el
intervalo de confianza de 95% de la proporción poblacional. Fundamente su
decisión en esta información de muestra: ¿puede concluir que la proporción
necesaria de miembros de PETROECUADOR favorece la fusión?

2. Se llevó a cabo una encuesta de mercado para calcular la proporción de amas de


casa que reconocerían el nombre de la marca de un limpiador a partir de la forma

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


28
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

y color del envase. De las 1.400 amas de casa de la muestra, 420 identificaron la
marca por su nombre.
a. Calcule el valor de la proporción de la población.
b. Construya el intervalo de confianza de 99% de la proporción poblacional
c. Interprete sus conclusiones.

3. El gerente de una estación de televisión debe determinar en la ciudad que


porcentaje de casas tienen más de un televisor. Una muestra de 500 casas revela
que 275 tienen dos o más televisores. ¿Cuál es el intervalo de confianza del 90%
para estimar la proporción de todas las casas que tienen dos o más televisores?

4. La empresa de búsqueda de ejecutivos se especializan en ayudar a las empresas a


ubicar y asegurar talento para la alta gerencia. Tales firmas denominadas
“cazadores de cabezas” son responsables de la ubicación de muchos de los
mejores directores ejecutivos es una persona de fuera – un ejecutivo con menos
de 5 años en la compañía que maneja”. Si en una muestra de 350 compañías
Ecuatorianas, 77 tienen directores ejecutivos de fuera, ¿un intervalo del 99% de
confianza apoyaría la información?

2.8 Elección del tamaño adecuado de una muestra


Una variable importante cuando se trabaja con intervalos de confianza es el tamaño de
la muestra. Sin embargo, en la práctica, no es una variable, sino una decisión que se toma
para que la estimación del parámetro de población sea bueno. Esta decisión se basa en
tres variables:
a. El margen de error que tolerará el investigador.
b. El nivel de confianza deseado.
c. La variabilidad o dispersión de la población que se estudia.
La primera variable es el margen de error. El máximo error admisible, designado E, es
la magnitud que se suma y resta de la media muestral (o proporción muestral) para
determinar los puntos extremos del intervalo de confianza. Por ejemplo, en un estudio de
salarios, podemos decidir que deseamos estimar el salario promedio de la población con
un margen de error de más o menos $1 000. O en una encuesta de opinión, podemos
decidir que deseamos calcular la proporción de la población con un margen de error de
más o menos 5%. El margen de error es la magnitud del error que se tolerará al estimar
un parámetro poblacional. Quizás se pregunte por qué no elegir márgenes pequeños de
error. Existe una compensación entre el margen de error y el tamaño de la muestra. Un
margen de error pequeño requiere de una muestra más grande y de más tiempo y dinero
para recolectarla. Un margen de error más grande permitirá tener una muestra más
pequeña y un intervalo de confianza más amplio.

La segunda elección es el nivel de confianza. Al trabajar con un intervalo de confianza,


lógicamente se elegirán niveles de confianza relativamente altos como de 95 y 99%, que

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


29
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

son los más comunes. Para calcular el tamaño de la muestra, se necesitará un estadístico
z que corresponda al nivel de confianza elegido. El nivel de confianza de 95%
corresponde al valor z de 1.96, y el nivel de confianza de 99%, a un valor z de 2.58. Note
que las muestras más grandes (con su consecuente requerimiento de más tiempo y dinero
para recolectarlas) corresponden a niveles de confianza más altos. Asimismo, observe que
utilizamos un estadístico z.

El tercer factor en la determinación del tamaño de una muestra es la desviación


estándar de la población. Si la población se encuentra muy dispersa, se requiere una
muestra grande. Por el contrario, si se encuentra concentrada (homogénea), el tamaño de
muestra que se requiere será menor. No obstante, puede ser necesario utilizar un
estimador de la desviación estándar de la población. He aquí algunas sugerencias para
determinar dicho estimador.

1. Realice un estudio piloto. Éste es el método más común. Suponga que desea un
cálculo aproximado de la cantidad de horas que trabajan a la semana los
estudiantes matriculados en la Facultad de Administración de la Universidad
Central. Para probar la validez del cuestionario, se aplica a una pequeña muestra
de estudiantes. A partir de esta pequeña muestra se calcula la desviación estándar
de la cantidad de horas que trabajan y se utiliza este valor como la desviación
estándar de la población.

2. Utilice un estudio comparativo. Aplique este enfoque cuando se encuentre


disponible un estimador de la dispersión de otro estudio. Suponga que quiere
calcular la cantidad de horas semanales que trabajan los recolectores de basura.
La información de ciertas dependencias estatales o federales que normalmente
estudian la fuerza de trabajo puede ser útil para obtener un cálculo aproximado de
la desviación estándar.

3. Emplee un enfoque basado en el intervalo. Para aplicar este enfoque necesita


conocer o contar con un cálculo de los valores máximo y mínimo de la población.
Recuerde, la regla empírica, que se podía esperar que casi todas las observaciones
se encontraran a más o menos 3 desviaciones estándares de la media, si la
distribución seguía la distribución normal. Por consiguiente, la distancia entre los
valores máximo y mínimo es de 6 desviaciones estándares. Puede calcular la
desviación estándar como un sexto del rango. Por ejemplo, la directora de
operaciones de la ESPOCH desea un cálculo aproximado del número de cheques
que expiden cada mes los estudiantes universitarios. Ella cree que la distribución
del número de cheques es normal. La cantidad mínima de cheques expedidos cada
mes es de 2, y la máxima, de 50. El rango de la cantidad de cheques que se expiden
por mes es de 48, que se determina al restar 50 - 2. El estimador de la desviación
estándar es entonces de 8 cheques mensuales: 48/6.

2.8.1. Tamaño de la muestra para calcular una media poblacional


Para calcular una media poblacional, se puede expresar la interacción entre estos tres
factores y el tamaño de la muestra se expresa con la fórmula siguiente. Note que esta

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


30
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

fórmula es el margen de error que se utiliza para calcular los puntos extremos de los
intervalos de confianza para estimar una media poblacional.

𝜎
E = 𝑍𝑎 √√𝑛
2
Al despejar n en esta ecuación se obtiene el siguiente resultado:

Tamaño de la muestra para estimar la media de la población

Donde:

n es el tamaño de la muestra.
Za/2 es el valor normal estándar correspondiente al nivel de confianza deseado.
𝝈 es la desviación estándar de la población
E es el margen de error deseado

El tamaño de muestra proporciona el margen de error deseado al nivel de confianza


elegido. En la ecuación E es el margen de error que el usuario está dispuesto a aceptar, y
el valor Za/2 es consecuencia directa del nivel de confianza que se va a usar para calcular
la estimación por intervalo. A reserva de decisión del usuario, 95% de confianza es el
valor más usado (Z0,025 = 1,96).

Para usar la ecuación es necesario contar con el valor de la desviación estándar


poblacional 𝜎. Sin embargo, aun cuando este valor no se conozca, puede usarse la
ecuación siempre que se tenga un valor preliminar o un valor planeado de 𝜎. En la
práctica se suele usar alguno de los procedimientos siguientes para obtener este valor
planeado de 𝜎.
1. Usar como valor planeado de 𝜎 una estimación de la desviación estándar
poblacional calculada a partir de datos de estudios anteriores.

2. Emplear un estudio piloto seleccionando una muestra preliminar. La desviación


estándar muestral obtenida de la muestra preliminar puede usarse como valor
planeado de 𝜎.

3. Use su juicio para el valor de 𝜎. Por ejemplo, se puede empezar por estimar el
mayor y el menor valor en los datos de la población. Esta diferencia entre el mayor
y el menor valor proporciona una estimación del rango de los datos. Por último,
este valor dividido entre 4 suele considerarse como una aproximación burda a la
desviación estándar y tomarse como un valor planeado aceptado de 𝜎.

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


31
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

Para demostrar cómo se usa la ecuación en la determinación del tamaño de la muestra, se


considera el ejemplo siguiente. En un estudio previo para investigar el costo de la renta
de automóviles en la Ciudad de Quito se encontró que el costo medio de la renta de un
automóvil mediano era aproximadamente $55 por día. Suponga que la organización que
realizó dicho estudio quiere realizar un nuevo estudio para estimar la media poblacional
de las rentas por día de automóviles medianos en la Ciudad de Quito. Antes de iniciar,
especificó que la media poblacional de las rentas por día debe estimarse con un margen
de error de $2 y que se desea un nivel de 95% de confianza.

El margen de error especificado es E = 2, el nivel 95% de confianza indica que


Z0.025=1.96. Por tanto, sólo falta un valor planeado de la desviación estándar poblacional
σ para calcular el tamaño de muestra deseado. El analista revisó los datos muéstrales del
estudio anterior y encontró que la desviación estándar poblacional del costo de la renta
diaria era $9.65. Usando $9.65 como valor planeado de σ, se tiene

De esta manera, el tamaño de la muestra necesario para obtener un margen de error de $2


debe ser de por lo menos 89,43 rentas de automóviles medianos (se debe redondear 90).

Ejercicios:
1. Un estudiante de administración desea determinar la cantidad media que ganan al
mes los miembros de los consejos ciudadanos de las grandes ciudades. El error al
calcular la media debe ser inferior a $100, con un nivel de confianza de 95%. El
estudiante encontró un informe del Departamento de Trabajo en el que la
desviación estándar es de $1.000 ¿Cuál es el tamaño de la muestra que se requiere?

2. ¿Qué tan grande debe seleccionarse una muestra para tener un intervalo de
confianza de 95% con un margen de error de 10? Suponga que la desviación
estándar poblacional es 40.

3. En un conjunto de datos que el rango es 36


a. ¿Cuál es el valor planeado para la desviación estándar poblacional?
b. ¿De qué tamaño deberá ser la muestra para que el margen de error en un
intervalo de confianza de 95% sea 3?
c. ¿De qué tamaño deberá ser la muestra para que el margen de error en un
intervalo de confianza de 95% sea 2?
2.8. Tamaño de la muestra para calcular la proporción de una población

Para determinar el tamaño de la muestra en el caso de una proporción, es necesario


especificar las tres variables:
1. El margen de error.

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


32
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

2. El nivel de confianza deseado


3. La variación o dispersión de la población a estudiar.

En el caso de la distribución binomial, el margen de error es:

𝜋(1− 𝜋)
E = Za/2√
𝑛

Despejando n se obtiene lo siguiente:

Tamaño de la muestra de la proporción de la población

𝒁𝒂/𝟐 𝟐
n = 𝝅(𝟏 − 𝝅)( )
𝑬

donde:

n es el tamaño de la muestra
Za/2 es el valor normal estándar correspondiente al nivel de confianza deseado
𝜋 es la proporción de la población (p = x/n)
E es el margen de error deseado

Las elecciones del estadístico z y el margen de error E son las mismas que para calcular
la media poblacional. Sin embargo, en este caso la desviación estándar de la población de
una distribución normal está representada por 𝜋(1 − 𝜋). Para encontrar el valor de una
proporción de la población, podemos hallar un estudio similar o conducir un estudio
piloto. Si no se puede encontrar un valor confiable, entonces se debe usar un valor de 𝜋
de 0.50. Observe que 𝜋(1 − 𝜋) tiene el mayor valor utilizando 0.50 y, por lo tanto, sin
una buena estimación de la proporción de la población, se sobrestima el tamaño de la
muestra. Esta diferencia no afectará el estimador de la proporción de la población.

En la práctica, el valor planeado 𝜋 se determina mediante alguno de los métodos


siguientes.

1. Utilizar la proporción poblacional de una muestra previa de las mismas unidades


o de unidades similares.

2. Utilizar un estudio piloto y elegir una muestra preliminar. La proporción muestral


de esta muestra se usa como valor planeado, 𝜋.

3. Proponer una “mejor aproximación” para el valor de 𝜋

4. Si no aplica ninguna de las alternativas anteriores, emplear como valor planeado


𝜋 = 0,50
Ejercicios:

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


33
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

1. Un estudiante de administración para su estudio desea que el margen de error se


encuentre a 0,10 de la proporción de la población; el nivel de confianza deseado
es de 90%, y no se encuentra disponible ningún estimador de la proporción de la
población, ¿Cuál es el tamaño de la muestra que se requiere?

2. El secretario académico de la universidad desea calcular el promedio aritmético


de las calificaciones de los estudiantes que se graduaron durante los pasados 10
años. Los promedios oscilan entre 2,0 y 4,0. El promedio se va a calcular a 0,05
más o menos de la media poblacional. La desviación estándar se calcula que es
de 0,279. Utilice el nivel de confianza de 99%. ¿Ayudaría al secretario a
determinar cuántas boletas tiene que estudiar?

3. Se calcula que una población tiene una desviación estándar de 10. Desea estimar
la media de la población a menos de 2 unidades del error máximo admisible, con
un nivel de confianza de 95%. ¿De qué tamaño debe ser la muestra?

4. Suponga que el presidente de Estados Unidos desea un cálculo de la proporción


de la población que apoya su actual política relacionada con las revisiones del
sistema de seguridad social. El presidente quiere que el cálculo se encuentre a
menos de 0.04 de la proporción real. Suponga un nivel de confianza de 95%.
Los asesores políticos del presidente calculan que la proporción que apoya la
actual política es de 0.60.
a. ¿De qué tamaño debe ser la muestra que se requiere?
b. ¿De qué tamaño debe ser una muestra si no hubiera disponible ningún
estimador de la proporción que apoya la actual política?

2.9. Factor de correlación de una población finita


Las poblaciones de las que se han tomado muestras hasta ahora han sido muy grandes o
infinitas. ¿Qué sucedería si la población de la que se toma la muestra no fuera muy
grande? Es necesario realizar algunos ajustes en la forma de calcular el error estándar de
las medias muéstrales y del error estándar de las proporciones muéstrales.
Una población con un límite superior es finita. Por ejemplo, hay 12 179 estudiantes en la
matrícula de la Universidad Central; hay 40 empleados en Marathon; Chrysler ensambló
917 Jeeps Wrangler en la planta de Alexis Avenue el día de ayer; o había 65 pacientes
programados para cirugía en St. Rose Memorial Hospital en Sarasota el día de ayer. Una
población finita puede ser muy pequeña; puede constar de todos los estudiantes
registrados para este curso. También puede ser muy grande, como todas las personas de
la tercera edad que viven en Florida.
En el caso de una población finita, en la que el número total de objetos o individuos es N
y el número de objetos o individuos incluidos en la muestra es n, es necesario ajustar los
errores muéstrales en las fórmulas de los intervalos de confianza. En otras palabras, para

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


34
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

determinar el intervalo de confianza de la media, se ajusta el error estándar de la media


en las fórmulas del intervalo de confianza de la media poblacional con una 𝜎 conocida e
intervalo de confianza de la media poblacional con 𝜎 desconocida. Si quiere determinar
el intervalo de confianza de una proporción, necesita ajustar el error estándar de la
proporción en la fórmula (p = x/n).
Este ajuste recibe el nombre de factor de corrección de una población finita. Con
frecuencia se le abrevia FCP, el cual es:
𝑵−𝒏
FPC = √
𝑵−𝟏
¿Por qué es necesario aplicar un factor y cuál es el efecto de hacerlo? Por lógica, si la
muestra es un porcentaje significativo de la población, el estimador es más preciso.
Observe el efecto del término (N - n)/(N - 1). Suponga que la población es de 1.000 y que
la muestra es de 100. Entonces esta razón es de (1.000 - 100)/(1.000 - 1), o 900/999. Al
extraer la raíz cuadrada se obtiene el factor de corrección 0.9492. Al multiplicar este
factor de corrección por el error estándar, se reduce el error estándar aproximadamente
5% (1 - 0.9492 - 0.0508). Esta reducción de la magnitud del error estándar da como
resultado un intervalo menor de valores al calcular la media poblacional o la proporción
poblacional. Si la muestra es de 200, el factor de corrección es de 0.8949, lo cual significa
que el error estándar se redujo más de 10%. La tabla se muestra los efectos de diversos
tamaños de muestras.

Así, si quisiera construir un intervalo de confianza de una media a partir de una población
finita sin conocer la desviación estándar de la población, la formula se ajusta de la
siguiente manera:

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


35
UNIVERSIDAD POLITÉCNICA SALESIANA
CARRERA DE ADMINISTRACIÓN DE
EMPRESAS

El siguiente ejemplo resume los pasos para determinar un intervlo de confianza de una
media.
Ejemplo:
1. Hay 250 familias en una determinada Ciudad. Una muestra aleatoria de 40 de
estas familias revelo que la contribución anual media a la iglesia fue de $450, y la
desviación estándar, de $75. ¿La media poblacional puede ser de $445 o $425?
a. ¿Cuál es la media poblacional?
b. Construya el intervalo de confianza de 90% de la media poblacional.
¿Cuáles son los puntos extremos del intervalo de confianza?
c. Interprete el intervalo d confianza

2. El mismo estudio relacionado con las contribuciones para la iglesia reveló que 15
de las 40 familias tomadas de la muestra asiste regularmente a la iglesia.
Construya el intervalo de confianza de 95% de la población de familias que asisten
a la iglesia con regularidad.

3. La asistencia al juego de básquet de la noche anterior fue de 400.Una muestra


aleatoria de 50 asistentes reveló que la cantidad media de refrescos consumidos
por persona fue de 1,86, con una desviación estándar de 0,50. Construya el
intervalo de confianza de 99% de la cantidad media de refresco consumidos por
persona.

BIBLIOGRAFIA
1. WEBSTER ALLEN L. Estadística Aplicada a los Negocios y a la Economía,
Mc Graw-Hill, 3era Edición, 2000
2. ARAGON SALGADO LUZ GRICEL, Estadística en el área de las Ciencias
Sociales y Administrativas, Alfaomega, 2016
3. LIND, MARCHAL,WATHEN, Estadística Aplicada a los Negocios y a la
Economía, 15 ed. Mc Graw-Hill, 2012
4. MARTINEZ BENCARDINO CIRO, Estadística y Muestreo, 2012, 13era
Edición, Bogotá, ECO EDICIONES.

ESTADISTICA INFERENCIAL ING.COM. NELSON PERALTA M.B.A.


36

S-ar putea să vă placă și