Sunteți pe pagina 1din 27

UNIVERSIDAD NACIONAL DE CAJAMARCA 2017

“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

INTRODUCCIÓN

El objetivo más importante de la Estadística es obtener una inferencia con


respecto a la población basándose en la información contenida en una
muestra. Como las poblaciones se describen mediante medidas numéricas
denominadas parámetros, el objetivo de la mayoría de las investigaciones
estadísticas es deducir una inferencia con respecto a uno o más parámetros de
la población.

Se han estudiado, hasta el momento, las nociones fundamentales de


distribución de probabilidades; se está en condiciones, entonces, de tratar los
métodos de inferencia estadística, los cuales comprenden los procedimientos
para estimar parámetros de poblaciones y probar (contrastar) si una afirmación
provisional sobre un parámetro poblacional se ve apoyada o desaprobada ante
la evidencia de la muestra.

Hablando en general, hay dos tipos de inferencia: la deductiva y la inductiva.


Una inferencia deductiva es un juicio o generalización que se basa en un
razonamiento o proceso dialéctico a priori. Por ejemplo, se supone que dos
monedas están perfectamente equilibradas y que entonces la probabilidad de
cada una de caer "cara" es = 0,5 (premisa). La media o número esperado de
"caras" en la jugada de las monedas deber ser 1 (conclusión). Si las premisas
son ciertas, las conclusiones no pueden ser falsas.

Una inferencia inductiva, por otra parte, es un juicio o generalización derivado


de observaciones empíricas o experimentales; la conclusión sobre el número
promedio de "caras" con base en los resultados de una muestra de prueba. Si
los resultados de las pruebas son diferentes, la conclusión también será
diferente. No se requiere una suposición a priori sobre la naturaleza de las
monedas. La inferencia estadística es primordialmente de naturaleza inductiva

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

y llega a generalizaciones respecto de las características de una población al


valerse de observaciones empíricas de la muestra.

Es muy probable que una estadística muestral sea diferente del parámetro de
la población y sólo por coincidencia sería el uno exactamente igual al otro. La
diferencia entre el valor de una estadística muestral y el correspondiente
parámetro de la población se suele llamar error de estimación. Sólo se sabría
cuál es el error si se conociera el parámetro poblacional, pero éste por lo
general se desconoce. La única manera de tener alguna certeza al respecto es
hacer todas las observaciones posibles del total de la población en la mayoría
de las aplicaciones prácticas, lo cual, desde luego, es imposible o
impracticable.

Y en efecto, la razón de ser de la inferencia estadística es la falta de


conocimientos acerca de las características de la población. Pero que tales
características se desconozcan no impide el que se actúe.

Las inferencias estadísticas se hacen por posibilidades o probabilidades. De la


media de la muestra se hacen inferencias sobre la media de la población. No
se sabe exactamente cuál es la diferencia entre estas dos medias, ya que la
última es desconocida en la mayoría de los casos. No obstante, si se sabe que
es más bien poca la probabilidad de que esta diferencia sea mayor que, por
ejemplo, tres a aún dos errores estándares.

Los problemas que se tratan en la inferencia estadística se dividen


generalmente en dos clases: los problemas de estimación y los de prueba de
hipótesis. Como al estimar un parámetro poblacional desconocido se suele
hacer una afirmación o juicio este último ofrece solamente una estimación. Es
un valor particular obtenido de observaciones de la muestra. No hay que
confundir este concepto con el de estimador, que se refiere a la regla o
método de estimar un parámetro poblacional. Por ejemplo, se dice que X es un

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

estimador de m porque la media muestral proporciona un método para estimar


la media de la población. Un estimador es por naturaleza una estadística y
como tal tiene una distribución. El procedimiento mediante el cual se llega a la
obtención y se analizan los estimadores se llama estimación estadística, que a
su vez se divide en estimación puntual y estimación por intervalos.

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

OBJETIVOS

 Entender los conceptos de estimación puntual y estimación por


intervalos.

 Calcular las estimaciones para la media poblacional, tanto en el


caso en que la desviación estándar poblacional sea conocida como
en el caso de que sea desconocida.

 Saber interpretar correctamente los resultados de las estimaciones


por intervalos.

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

TEMA 4: ESTIMACIÓN DE PARAMETROS

1. DEFINICIONES:

El campo de la inferencia estadística trata básicamente de predicciones y


generalizaciones. Por ejemplo, se puede afirmar, basándose en
opiniones recogidas por medio de una encuesta, que en las próximas
elecciones presidenciales el candidato de gobierno obtendrá 60% de los
votos. Para hacer esta afirmación fue necesario determinar el porcentaje
de votos favorables en una muestra seleccionada de la población. Al
porcentaje obtenido de esta forma se le llama “estadístico” o
“estadígrafo”.

A partir de este valor se puede estimar el porcentaje real de votos que


dicho candidato obtendrá el día de la elección. Este porcentaje real
proviene del universo de votantes o población y se le llama parámetro.
En general, cualquiera de las medidas de resumen -promedio, desviación
estándar, porcentaje, tasa- se considera “estadístico” si proviene de la
muestra, y “parámetro” si proviene del universo o población.

La inferencia estadística entrega las herramientas para realizar


afirmaciones acerca de un parámetro de la población, basándose en el
valor del respectivo estadístico proveniente de una muestra. Para realizar
estas inferencias es necesario conocer, previamente, la distribución de
probabilidad del estadístico. A la distribución de probabilidad de un
estadístico se le llama “distribución muestral”.

Podemos tomar una muestra, calcular en ella un estadístico (promedio o


porcentaje, por ejemplo) y luego hacer afirmaciones respecto del
correspondiente parámetro. Esto se conoce con el nombre de estimación
de parámetros, y se puede hacer de dos formas:

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

 Estimación puntual: consiste en asumir que el parámetro tiene


el mismo valor que el estadístico en la muestra.
 Estimación por intervalos: se asigna al parámetro un conjunto
de posibles valores que están comprendidos en un intervalo
asociado a una cierta probabilidad de ocurrencia. También se
llaman “intervalos de confianza” debido a que la probabilidad
asociada a ellos es la confianza de los mismos. Así, diremos que
un intervalo de 99% de confianza es más confiable que uno de
95%. También se define la confianza de la estimación como la
probabilidad de acertar con el intervalo.

La estimación que tiene valor estadístico para promedio o media y para


el porcentaje de la población es esta última, que explicaremos a
continuación.

Estimación de la media de la población

Explicaremos este punto con el siguiente ejemplo: queremos estimar


el número de hijos promedio que tienen las mujeres de una
población determinada. Con este objeto se seleccionó, por muestreo
aleatorio simple, una muestra de 20 mujeres a quienes se entrevistó,
obteniendo como resultado un promedio de 3,2 hijos y una
desviación estándar de 0,8. Con estos resultados podríamos hacer
una estimación puntual y decir que la población de interés tiene en
promedio 3,2 hijos. Pero esta estimación tiene el inconveniente de
que se desconoce el error que se está cometiendo.

Si a esta estimación le asignamos un error, que llamaremos E,


podríamos decir que el promedio de hijos de la población está
ubicado dentro de un intervalo de estimación que tiene como límite

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

inferior 3,2 - E y como límite superior 3,2 + E. De este modo, le


asignamos al resultado un intervalo de estimación. Si además le
damos a este intervalo una probabilidad de ocurrencia de los valores
comprendidos en él, habremos construido un intervalo de confianza
para el promedio de hijos de nuestra población de mujeres.

Entonces, generalizando lo que se explicó para la variable


“promedio de hijos”, podemos decir que:
Un intervalo de confianza para estimar el promedio de la población
está constituido por los siguientes elementos: el promedio de la
muestra y el error de estimación.

El elemento esencial en la construcción del intervalo de estimación


es el error.

¿Cómo se obtiene el error en la construcción de un intervalo


para el promedio?

Desarrollando la fórmula siguiente:

Está compuesta por la desviación estándar de la muestra (S), el


tamaño de la muestra (n) y, aquí aparece un elemento nuevo, t –
Student-, que corresponde a una distribución de probabilidad muy
similar a la distribución normal.
En la tabla de t los valores se buscan en función de dos cosas:
 la probabilidad que hemos elegido para nuestro intervalo, y
 los “grados de libertad” que se calculan restando 1 al tamaño

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

de la muestra (n).
En nuestro ejemplo elegimos una confianza de 95% que, asociada
a los 19 grados de libertad (n-1), nos conduce a un valor de
tabla t de Student igual a 2,093. Ya veremos en forma detallada el
uso práctico de la tabla t, recordemos por ahora el valor de “t”
encontrado porque lo utilizaremos para la construcción del intervalo.
Volviendo a la fórmula para calcular el error, vemos entonces que el
error está compuesto por tres elementos:

 El valor t que se obtiene de la tabla t de Student.


 La desviación estándar de la muestra.
 El tamaño de la muestra.

Volviendo a nuestro ejemplo, calculemos el error. Recordemos que


deseamos conocer el número promedio de hijos que tienen las
mujeres en esa población y que, estudiando una muestra de 20
mujeres, el resultado fue un promedio de 3,2 hijos y una desviación
estándar de 0,8

¿Cuáles son, entonces, los elementos que nos permitirán


calcular el error de nuestra estimación?

El valor t que obtuvimos de la tabla t de Student t = 2,093


La desviación estándar de la muestra S = 0,8

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

El tamaño de la muestra n = 20
Reemplazando esos valores en la fórmula obtendremos el error,
que es:

2. INTERVALO DE ESTIMACIÓN

Construiremos ahora el intervalo de estimación, sumando y restando al


promedio, el error. De esta manera el límite inferior será: promedio - E; y
el límite superior: promedio + E.

Límite inferior (a) = 3,2 - 0,37 = 2,83


Límite superior (b) = 3,2 + 0,37 = 3,57

De este modo se consigue un intervalo (2,83; 3,57) que nos permite


estimar, con 95% de confianza, que el promedio de hijos en la población
de mujeres está entre 2,83 y 3,57.

En resumen, los pasos en la construcción de un intervalo de confianza


para la estimación del promedio son:

 Obtener una muestra aleatoria.


 Calcular promedio y desviación estándar muestral.
 Elegir la confianza del intervalo (95% ó 99%).
 Obtener el valor de t en tabla.
 Calcular el error de estimación.
 Calcular los límites del intervalo (a y b).

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

De estos 6 puntos, ya hemos tratado los puntos 1, 2, 5 y 6.

Sólo haremos un comentario sobre el punto 3: la elección de la


confianza. Lo decide el investigador y se podría elegir cualquier valor,
pero por lo general se usa 95% ó 99%. La elección de uno u otro
dependerá de la confianza y la precisión que necesitemos para nuestra
estimación, ya que si el intervalo es más grande, la precisión será menor;
por lo tanto, un intervalo de 99% tiene mayor confianza y menor precisión
que uno de 95%.

Cómo buscar un valor en la Tabla t de Student

El primer paso es calcular los grados de libertad (gl) restando 1 al


tamaño de la muestra: gl = n-1.

El segundo paso es elegir la confianza del intervalo. Elijamos un


95%.

Tercero, buscar el valor de t. Como la distribución es simétrica, un


intervalo de 95% (0,95) al centro de la curva deja necesariamente
2,5% (0,025) en cada extremo de la curva. El valor que buscamos
deja sobre sí a 2,5% de los sujetos, ó 0,025 si trabajamos sobre
base 1, que es cómo están los valores en las tablas (véase gráfico).

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

En la primera fila de la tabla aparece el símbolo alfa, que indica la


probabilidad, debemos buscar allí un t con alfa 0,025. De allí hacia
abajo, en toda la columna, se encuentran los valores de t asociados
a 0,025 de probabilidad. Luego buscamos en la primera columna los
grados de libertad (n-1). En el cruce de la fila de los grados de
libertad con la columna de la probabilidad está el valor de t que nos
interesa.

En nuestro ejemplo el tamaño de muestra es de 20 sujetos, por lo


tanto tenemos 19 grados de libertad. Entonces buscaremos en la
tabla un valor de t para 0,025 de probabilidad y con 19 grados de
libertad. Encontramos t = 2,093.

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

3. INTERVALOS DE CONFIANZA PARA LA MEDIA

Supongamos que la estatura de los niños de 2 años está distribuida


normalmente con una media de 90 cm y una desviación estándar de
36 cm. ¿Cuál sería la distribución muestral de la media para una
muestra de tamaño 9? Recordemos que la media de una
distribución muestral de medias es igual a μ:

Y el error estándar es:

Para nuestro ejemplo, la distribución muestral de la media tendría


una media de 90 y una desviación estándar de 36/3 = 12.
Recordemos que la desviación estánda r de una distribución
muestral es igual al error estándar.

La siguiente figura muestra esta distribución en donde el área


sombreada representa el 95% del total, encontrándose entre los
valores de 66.48 y 113.52. Estos límites fueron calculados
añadiendo y restando 1.96 desviaciones estándar del valor de la
media de 90, lo que equivale al 95% del área bajo una curva normal
estándar, es decir:
90 - (1.96 x 12) = 90 - 23.52 = 66.48 90 + (1.96 x 12) = 90 + 23.52 =
113.52

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

Lo que nos muestra la figura es que 95% de las medias se


encontrarían a no más de 23.52 de la media de 90 (o sea a 1.96
desviaciones estándar). Ahora si consideramos la probabilidad de
que la media de una muestra aleatoria se encuentre a cierta
distancia de la media de la población, entonces podemos decir que
como 95% de la distribución está a 23.5 de 90, la probabilidad de
que la media de cualquier muestra esté a 23.52 de 90 es de 0.95.

Lo anterior significa que si calculamos repetidamente la media de

una muestra, , y consideramos un intervalo que vaya de - 23.52

a + 23.52, este intervalo contendrá a la media de la población


95% de las veces. En general, podemos calcular el intervalo de
confianza con la siguiente fórmula:

Notar que no es otra cosa que despejar µ de la formula para el


valor de Z de la distribucion de medias.

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

Donde z es el valor de la curva estandar normal para la confianza


que se requiere. En el caso de 95% de confianza:

De esta formula se puede observar que tanto el tamaño de la


muestra como el valor de σ se deben conocer. Z se puede obtener
de la tabla de la distribución normal a partir del nivel de confianza
establecido.
Como en muchas ocasiones se desconoce σ en esos casos lo
correcto es utilizar otra distribución para muestras (la llamada “ t ” de
student que veremos en la siguiente sesión) si la población de
donde provienen los datos es normal.
En este caso se puede utilizar una estimación puntual de la
desviación estándar de la población por medio de la desviación
estándar de la muestra, es decir ( σ ~ s).

Ejemplo 1:

Se encuentra que la concentración promedio de zinc de una muestra


de 36 cereales es de 2.6 gramos por miligramo. Encuentre los
intervalos de confianza de 95% y 99% para la concentración media
de zinc en el cereal. Suponga que la desviación estándar de la
población es 0.3.

Solución: La estimación puntual de μ es x = 2.6 (el valor de la


media de la muestra). El valor de z para un nivel de confianza del
95% es 1.96, por lo tanto:

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

Para un nivel de confianza de 99% el valor de z es de 2.575 por lo


que el intervalo será más amplio:

Ejemplo 2:

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

Los vuelos de una empresa de aviación tienen una duración


bimestral aproximadamente distribuida de forma normal con una
desviación estándar de 40 horas. Si una muestra de 30 vuelos tiene
una duración promedio de 780 horas, encuentre los intervalos de
confianza de 96% para la media de la población de todos los vuelos
de esta empresa.

Con un nivel de confianza del 96% se sabe que la duración media


de los vuelos está entre 765 y 795 horas.

3.1. Estimación para la media poblacional. Muestras grandes.

Cuando el tamaño de la muestra es grande o la variable tiene


distribución normal, el intervalo de confianza está dado por:

Como el error estándar está afectado por el tamaño de la


muestra, este a su vez afecta al intervalo de confianza.
Conforme aumenta el tamaño de la muestra, el error estándar
disminuye, indicando esto que hay menos variabilidad en la

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

distribución muestral de a media muestral. La estimación


obtenida de una muestra grande será más precisa que una
estimación obtenida de una muestra pequeña.

Cuando el tamaño de la muestra n es mayor o igual a 30, se


aplica el teorema de limite central asegura que la media
muestral sigue la distribución normal. Si la media muestral
tiene una distribución normal; se puede usar la distribución
normal estándar, es decir, z, para los cálculos.

Ejemplo:
En una encuesta aplicada a 1600 colombianos se encontró
que en un promedio ven 14.6 horas de televisión a la semana
con una desviación estándar de 5 horas. Realice una
estimación de la variable con para un nivel de confianza del
80%.

Los colombianos ven televisión en promedio entre 14.4 y


14.76 horas con un nivel de confianza del 80%.

3.2. Estimación para la media poblacional. Muestras


pequeñas.

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

Cuando el número de observaciones es menor a 30, la


estimación del intervalo se basa en las suposiciones que si la
población es normal o que si se conoce la desviación estándar
de la población.

En caso que la muestra sea pequeña, menor de 30, y se

conoce la varianza de la población, , el intervalo de


confianza es:

Cuando el tamaño de la muestra sea pequeño y no se

conozca la varianza poblacional , se utiliza la desviación


estándar de la muestra s, y la distribución de probabilidad t.

La distribución de probabilidad t o distribución t de Student es


una distribución de probabilidad que surge del problema de
estimar la media de una población normalmente distribuida
cuando el tamaño de la muestra es pequeño. Esta es la base
del popular test de la t de Student para la determinación de las
diferencias entre dos medias muéstrales y para la
construcción del intervalo de confianza para la diferencia entre
la media de dos poblaciones.

La distribución t surge, en la mayoría de los estudios


estadísticos prácticos, cuando la desviación típica de una
población se desconoce y debe ser estimada a partir de los
datos de una muestra.

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

La distribución tiene las siguientes características:


 Al igual que la distribución Z, es una distribución
continua.
 La distribución t tiene una media de 0, es simétrica
respecto de la media y se obtiene de - a + la

varianza de t es para v > 2. Cuando los grados


de libertad son suficiente grandes la varianza de la
distribución t tiende a 1.
 Tiene forma acampanada y simétrica.
 No hay distribución t, sino una “familia” de
distribuciones t. todas con la misma media cero, pero
con su respectiva desviación estándar diferente de
acuerdo con el tamaño de la muestra n. existe una
distribución t para una muestra de 20, y otra para una
muestra de 22 y así sucesivamente.
 La distribución t es más ancha y más plana en el
centro que la distribución normal estándar como
resultado de ello se tiene una mayor variabilidad en
las medias de muestras calculadas a partir de
muestras más pequeñas. Sin embargo a medida que
aumenta el tamaño de la muestra, la distribución t se
aproxima a la distribución normal estándar.

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

Para la estimación del intervalo de confianza, el valor t se


desprende de los grados de libertad, n-1, (fila) y nivel de confianza.

Por ejemplo par un nivel de confianza, de 90% y 5 grados de


libertad, t = 2.0105.

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

3.3. Intervalo de confianza para muestras pequeñas donde no


se conoce la varianza poblacional.

Ejemplo:
En una encuesta aplicada a 10 personas de la calle se
encontró que en promedio ven 2.5 horas de televisión al día
con una desviación estándar de 0.8 horas. Con un nivel de
confianza del 95% estime el intervalo de confianza para la
media poblacional.

En ese caso:

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

Se estima que la población debe ver en promedio entre 1.93


horas y 3.07 horas de televisión al día, con un nivel de
confianza del 95%.

4. INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN

Un estimador puntual de la proporción P en un experimento binomial


está dado por la estadística P=X/N, donde X representa el número
de éxitos en N pruebas.

Por tanto, la proporción de la muestra p=x/n se utilizará como


estimador puntual del parámetro P. Si no se espera que la
proporción P desconocida esté demasiado cerca de 0 ó de 1, se
puede establecer un intervalo de confianza para P al considerar la
distribución muestral de proporciones.

Considerando el valor z para la distribución de proporciones:

Si intentamos despejar el valor de P nos encontramos con que :

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

Pero ¿cómo podemos encontrar P si también está del lado derecho


de la ecuación?

Lo que haremos es aproximar la proporción de la población por la de


la muestra, es decir sustituir P por la proporción de la muestra p
siempre y cuando el tamaño de muestra no sea pequeño.

Cuando n es pequeña y la proporción desconocida P se considera


cercana a 0 ó a 1, el procedimiento del intervalo de confianza que se
establece aquí no es confiable ya que realmente se debería emplear
la distribución binomial, por tanto, no se debe utilizar. Para estar
seguros, se debe requerir que np y n(1-p) sea mayor o igual a 5.

El error de estimación será la diferencia absoluta entre p y P, y


podemos tener el nivel de confianza de que esta diferencia no
excederá el valor de.

Ejemplo 1:

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

Un fabricante de reproductores de discos compactos utiliza un


conjunto de pruebas amplias para evaluar la función eléctrica de su
producto. Todos los reproductores de discos compactos deben
pasar todas las pruebas antes de venderse. Una muestra aleatoria
de 500 reproductores tiene como resultado 15 que fallan en una o
más pruebas. Encuentre un intervalo de confianza de 90% para la
proporción de los reproductores de discos compactos de la
población que no pasarían todas las pruebas.

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

z=1.645 nos da un área de ~0.05 a cada lado, si lo buscamos en las


tablas encontraríamos el valor de 0.04998

Ejemplo 2:
En un estudio de 300 accidentes de automóvil en una ciudad
específica, 60 tuvieron consecuencias fatales. Con base en esta
muestra, construya un intervalo del 95% de confianza para
aproximar la proporción de todos los accidentes automovilísticos que
en esa ciudad tienen consecuencias fatales.

El intervalo de confianza es entonces:

0.154737 < P < 0.245263

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

CONCLUSIONES

 Se llama estimación al conjunto de técnicas que permiten dar


un valor aproximado de un parámetro de una población a
partir de los datos proporcionados de una muestra.

 El nivel de confianza con el que deseamos trabajar


dependerá de la precisión de la estimación.

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS


UNIVERSIDAD NACIONAL DE CAJAMARCA 2017
“Norte de la Universidad”
FACULTAD DE INGENIERIA
Escuela Académico Profesional de Ingeniería de Minas

BIBLIOGRAFIA

 https://www.bioestadistica.uma.es/baron/apuntes/ficheros/cap02.pd
f

 http://www.zweigmedia.com/MundoReal/finitetopic1/confint.html

 http://www.esap.edu.co/portal/wp-
content/uploads/2015/08/6_estadstica_ii.pdf

 file:///D:/Users/Mis%20Documentos/Downloads/Clase6hhhh.pdf

ESTADÍSTICA Y PROBABILIDADES – ESTIMACIÓN DE PARÁMETROS

S-ar putea să vă placă și