Sunteți pe pagina 1din 11

UNSM Ing.

de Sistemas e Informática
Inferencia Estadística

ESTIMACIÓN POR INTERVALOS

Un intervalo de confianza para un parámetro  es un intervalo construido alrededor del


estimador del parámetro de tal manera que podemos esperar que el verdadero valor del
parámetro quede incluido en dicho intervalo. La estimación de parámetros por
intervalos, permite construir un intervalo que contendrá el parámetro a estimar con un nivel
de confianza fijada a priori por el experimentador.

P ( A    B )  1 
1   : Nivel de confianza
Es la probabilidad (expresada en porcentaje) que representa la seguridad de que el
intervalo contenga al verdadero valor del parámetro.

 : Nivel de significancia
Es la probabilidad de que el intervalo no contenga al verdadero parámetro.

Ejemplo:
P ( A    B )  0,95 Es un intervalo del 95% de confianza para el parámetro 

Significa que si se extraen repetidamente muestras de la población y se calculan los


intervalos de esta manera, entonces el 95% de estos intervalos contendrán al parámetro
desconocido.

Nota:

Nivel de confianza Nivel de significancia


Conclusión
1   
0.90 0.10 Poco significativa.
0.95 0.05 Significativa.
0.99 0.01 Altamente significativa.

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL

Li    L s

De una población desconocemos la media  y deseamos estimarla mediante un intervalo


con un nivel de confianza apropiada a partir de la media x obtenida en una muestra de
tamaño n.
1.- Si la varianza poblacional σ2 es conocida

 Para una población infinita:  Para una población


 finita:
x  z / 2
n  Nn
x  z / 2 
n N1
n
 0,05
N

Aquilino M. García Bautista 1


UNSM Ing. de Sistemas e Informática
Inferencia Estadística

2.- Si la varianza poblacional σ2 es desconocida

 Para una población infinita:  Para una población finita:


S S Nn
x  t0 x  t0 
n n N1
donde: t0  t1   / 2 , n 1 n
 0,05
N

Ejemplo 1:

Los siguientes datos corresponden a las calificaciones obtenidas por un grupo de


estudiantes en un curso de matemática. Considerando que durante los últimos años se ha
venido obteniendo una varianza de 18. Llegue a una conclusión altamente significativa
acerca del verdadero promedio. 71 75 65 69 73 68 74 70
Solución:
n1  8 1    0,99

12  18 conocida  z   0,01


x1  70,63
1  4,24  / 2  0,005
2
S1  11,13 z 0,005   2,58

 4,24
x  z  /2  70,63  2,58  66,77    74,49
n 8

Con una confianza del 99% podemos concluir que el verdadero promedio de las
calificaciones se encuentra variando entre 67 y 75 aproximadamente.

Error de Estimación:

Es la diferencia entre el promedio de la muestra x y el promedio real  de la población.


Es decir es la diferencia entre el estadígrafo y el parámetro:
Ei  x  
Error máximo probable:

x  Z  /2
n
 
x  Z /2    x  Z /2 
n n  E  Z /2
n
       
ERROR ERROR

Para muestras pequeñas el Error máximo probable es:

S
E  t  /2
n

Ejemplo 2:

Aquilino M. García Bautista 1


UNSM Ing. de Sistemas e Informática
Inferencia Estadística
Para estimar el tiempo promedio que lleva ensamblar cierto componente de una
computadora, el supervisor de una empresa electrónica tomó el tiempo que 40 técnicos
demoraban en ejecutar esta tarea, obteniendo una media de 12,73 minutos y una
desviación estándar de 2,06 minutos.
a) ¿Qué podemos decir, con una confianza del 99% acerca del error máximo si
x  12,73 se utiliza como estimación puntual del tiempo medio que se requiere para
realizar la tarea?
n = 40  Z 1    0,99
x  12,73  / 2  0,005
S = 2,06 Z  /2  2,58

e  2,58
2,06
 e  0,84
40

b) Hallar un intervalo de confianza del 98% para el tiempo medio real que lleva
ensamblar el componente de la computadora.

S
1    0,98 x  t / 2, n 1
n
 / 2  0,01
2,06
t0.01, 39  2,438 12,73  2,438
40

11,9359    13,5241
c) Hallar un intervalo de confianza del 95% para el tiempo medio real que lleva
ensamblar el componente de la computadora a diez técnicos.

n = 40 x  12,73 S = 2,06

S
1    0,95 x  t / 2 , n  1
n
 / 2  0,025 2,06
t0 , 025 , 3 9  2,030 12,73  2,030
40

12,07    13,39

INTERVALO DE CONFIANZA PARA LA VARIANZA POBLACIONAL


Li  2  L s

Sea x1 , x 2 , .... , x n una muestra aleatoria extraída de una población normal con media
 y varianza 2 desconocidas, entonces:

( n  1 ) S2 ( n  1 ) S2
 2 
12  /2 , n1 2
 / 2 , n 1

Ejemplo 3:

Durante varios años se ha aplicado una prueba de matemática a todos los alumnos del
primer ciclo de la UNSM-T, si 64 alumnos seleccionados al azar demoraron para resolver la
prueba en promedio 28,5 minutos con una varianza de 9,3 minutos2.

Aquilino M. García Bautista 1


UNSM Ing. de Sistemas e Informática
Inferencia Estadística
a) Construir un intervalo de confianza del 99% para la desviación estándar verdadera
del tiempo que demoran los estudiantes en resolver el examen.

n = 64 1    0,99
x  28,5  /2  0,005  1   /2  0,995
S2 = 9,3

63  9,3 63  9,3
 2 
20,995 , 63 20,005 , 63

63  9,3 63  9,3
 2 
95,6 37,8

6,13  2  15,5

2,48    3,94

Con una confianza del 99% se puede afirmar que la desviación estándar poblacional
del tiempo que demoran los estudiantes en resolver el examen se encuentra variando
entre 2,48 y 3,94.

b) Con una confianza del 90%, ¿Cuál sería el valor máximo para la varianza
poblacional?

n = 64 1    0,90
x  28,5  / 2  0,05  1   / 2  0,95
S2 = 9,3

63  9,3 63  9,3
 2 
2
0,95 , 63 2
0,05 , 63

63  9,3 63  9,3
 2 
82,5 45,7

7,10  2  12,82

Con una confianza del 90% se puede afirmar que el valor máximo para la varianza
poblacional es de 12,82.

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN POBLACIONAL

Li  P  L s

Dado un nivel de confianza 1-, para construir un intervalo para la proporción se tendrán
en cuenta los siguientes casos:

Aquilino M. García Bautista 1


UNSM Ing. de Sistemas e Informática
Inferencia Estadística
Si la población es infinita: Si la población es finita:

pq pq Nn


p  Z / 2 p  Z / 2
n n N1

Ejemplo 4:
En un estudio de 300 accidentes de automóvil en cierta ciudad, 60 tuvieron consecuencias
fatales. Con base en esta muestra, construir un intervalo del 90% de confianza para
aproximar la proporción de todos los accidentes automovilísticos que tienen
consecuencias fatales en dicha ciudad.
60
n = 300 p   0. 2 N: desconocido  población infinita
300

1   0.90
p  Z  / 2 p
 / 2  0.05
Z 0,05   1.65 0.2  0.8
0.2  1.65
300

0.162  P  0.238

Con una confianza del 90% se afirma que la verdadera proporción de accidentes
automovilísticos que tienen consecuencias fatales, está variando entre 0.162 y 0.238.

Ejemplo 5:
Un candidato político está planeando su estrategia de campaña y quiere determinar qué tan
conocido es. En una muestra aleatoria de 3000 de los 25000 votantes la localidad,
1800 manifestaron reconocer el nombre del candidato. Construir un intervalo del 95%
de confianza para la verdadera proporción de votantes en el país que están
familiarizados con dicho candidato.
1800
N = 25000 n = 3000 p   0.6
3000
n 3000
  0.12  0.05
N 25000
Se debe utilizar el factor de corrección para poblaciones finitas.

1   0.95 p  Z  / 2 p
 / 2  0.025
Z   1.96 0.6  0.4 25000  3000
0,025 0.6  1.96
3000 24999

0.58  P  0.62

Con una confianza del 95% podemos afirmar que la verdadera proporción de votantes en el
país que están familiarizados con dicho candidato, se encuentra variando entre 0.58 y 0.62.

INTERVALO DE CONFIANZA
PARA LA RAZÓN DE DOS VARIANZAS POBLACIONALES

Aquilino M. García Bautista 1


UNSM Ing. de Sistemas e Informática
Inferencia Estadística
12
Li   Ls
2
2

Generalmente en investigaciones comparativas de dos poblaciones independientes se


estudian la homogeneidad o la heterogeneidad a través de un intervalo de confianza para la
razón de dos varianzas poblacionales.

Sean x1 , x 2 , ... , x n1 y y1 , y 2 , ... , y n2 dos muestras aleatorias independientes de


2
tamaños n1 y n2 , tomadas de poblaciones normales N ( 1 , 1 ) y N (  2 , 2
2 )
con varianzas 12 y 2
2 desconocidas.

 El intervalo de confianza del (1-)100% para la razón de varianzas es:

v1  n 1  1
S12 S12 g.l. del numerador

S2
2 12 S2
2
v2  n 2  1 g.l. del denominador
 
F1  /2 , v , v 22 F / 2 , v , v
1 2
1 2

 Si el 1 pertenece al intervalo, entonces las varianzas son iguales.


 Cuando el 1 no pertenece al intervalo, las varianzas son diferentes.

Ejemplo 6:

Dos marcas de máquinas A y B han sido diseñadas para producir cierto tipo de
producto. Tienen igual precio. Un fabricante, al decidir cuál comprar, ha observado en
operación durante una hora nueve máquinas diferentes de cada marca. El número de
artículos producidos por cada máquina fue:
Marca A : 35 36 49 44 43 37 38 42 39
Marca B : 27 28 53 52 48 29 34 47 45
Con 90% de confianza, ¿Cuál máquina le recomendaría comprar, teniendo en cuenta la
variabilidad? ¿Por qué?

Marca A Marca B 1    0,90


nA  9 nB  9  / 2  0,05

x A  40,33 x B  40,33 1   / 2  0,95

S2
A  20,5 S2
B  115

20,5 20,5 20,5 20,5


115 2A 115 
2
115   A  115
 
F0,95 , 8 , 8 2B F0,05 , 8 8 3,44 2B 0,291

2A
0,05   0,61 1  IC  2A  2B
2B
Con una confianza del 90%, le recomendaría compra la marca A, porque presenta
menor variabilidad.

Aquilino M. García Bautista 1


UNSM Ing. de Sistemas e Informática
Inferencia Estadística
INTERVALO DE CONFIANZA PARA LA DIFERENCIA
ENTRE DOS MEDIAS POBLACIONALES
Li  1  2  L s

Sean x1 , x 2 , ... , x n1 una muestra aleatoria extraída de una población normal



N 1 , 12  y y1 , y 2 , ... , y n2 una muestra aleatoria extraída de una población

N  2 , 2
2  entonces:
1.- Cuando las varianzas poblacionales  i2 son conocidas:

12 2
 x1  x 2   z  /2  2
n1 n2

2.- Cuando las varianzas poblacionales  i2 son desconocidas:

a) Suponiendo que las varianzas poblacionales son iguales: 12  22

( n1  1 ) S12  ( n 2  1 ) S 2  1 1 
 x1  x2   t0 2 
n

n1  n 2  2  1 n 2 

t0  t1 /2 , n1  n2 2

b) Suponiendo que las varianzas poblacionales son diferentes: 12  2


2

2
 S2 2 
S2
 1  S2 
S12
 x1  x2   t0  2  n
 1
n2 

n1 n2 g 
2 2
 S2   S2 
 1  2
n  n 
 1   2
t0  t1  / 2 , g n1  1 n2  1

Ejemplo 7:

Una de las funciones del departamento de Sistemas de Cómputo del periódico incluye el
informe de las actividades del sistema de la computadora central. En general, durante un

Aquilino M. García Bautista 1


UNSM Ing. de Sistemas e Informática
Inferencia Estadística
día cualquiera el sistema debe procesar más de veinte tareas diferentes. Los requerimientos
de estas tareas varían, desde trabajos muy pequeños que requieren una cantidad mínima de
acceso a los dispositivos de almacenamiento de datos (cartuchos), hasta trabajos grandes y
complejos que requieren acceso a más de 200 cartuchos diferentes de almacenamiento de
datos. Se tienen los siguientes datos:
2 5 9 45 50 23 8
34 21 9 10 45 23 12
Durante otro día se lograron procesar 15 tareas, obteniéndose un promedio de 25,7 y una
varianza de 90. Con una confianza del 99%, ¿Qué podríamos afirmar acerca de los
promedios?

Solución:
1α  0,99
Día 1 Día 2
α  0,01
n1  14 n 2  15 α2  0,005
x1  21,14 x 2  25,7 1α2  0,995
t 0,995 , 27  2,771
S2  265,05 S 2  90
1 2
2 y σ2
σ1 2 desconocidas.

 Primero verificar si 2  σ2
σ1 2 ó 2  σ2
σ1 2

265,05 265,05
2
90 σ1 90
 
F0,995 , 13 ,14 2 F0,005 , 13 ,14
σ2
                   
4,25 0,212
σ2
0,69  1  13,89
σ2
2

1 I C  2  σ2
σ1 2

 Segundo para la diferencia de medias


13 x 265,05  14  90  1 1 
 21,14  25,7   2,771   
27  14 15 

 18,15  μ1  μ2  9,03 0  IC  μ1  μ2

Con una confianza del 99% podríamos afirmar que los promedios son iguales
porque el cero pertenece al intervalo.

Ejemplo 8:
Un profesor de la facultad de Ingeniería Agroindustrial enseña en dos secciones el mismo
curso de control de calidad. En cada sección procede de la misma forma, esto es, utiliza la
misma metodología así como el mismo sistema de evaluación; sin embargo, en cada una
utiliza un texto diferente. Al terminar el periodo el profesor extrae una muestra aleatoria de
cada sección, y obtiene las siguientes notas:

Aquilino M. García Bautista 1


UNSM Ing. de Sistemas e Informática
Inferencia Estadística
Texto : Notas
1 : 78 78 74 72 81 76 80
2 : 51 53 62 90 49 83 80 57 28
Conocedor de que Usted es un excelente alumno de Inferencia Estadística, le pide su
consejo para decidirse por sólo uno de los textos. Ayúdele a tomar una decisión significativa.
Solución:
1  α  0,95
Texto 1 Texto 2
α  0,05
n1  7 n2  9 α 2  0,025
1  α 2  0,975
x1  77 x 2  61,44
t 0,975 , 8  2.306
S2  10,33 S2
2  387,28
1
2 y σ2
σ1 2 desconocidas.

 Primero verificar si 2  σ2
σ1 2 ó 2  σ2
σ1 2

10,33 10,33
387,28 σ2 387,28
 1 
F0,975 , 6 , 8 σ2
2
F0,025 , 6 , 8
             
4,65 0,179

σ2 1 IC  σ2  σ2
1 2
0,006  1  0,149
σ2 σ2  σ2
2 1 2

 Para la diferencia de medias

10,33 387,28
 77  61,44   2.306 
7 9

0.18  μ1  μ 2  30.94 0  IC  μ1  μ 2
1   2

2
 10,33 387,28 
Con una confianza del 95% le   
recomendaría usar el texto 1 ya que con g   7 9   8.54
este texto se ha obtenido una mayor nota 2 2
 10,33   387,28 
promedio y una menor varianza.    
 7  9
 

6 8
 g  8

Ejemplo 9:

Los resultados del control de calidad de dos procesos manufactureros son:


Tipo 1 Tipo 2
10 20 25 30 33 20 27 35 40 41
37 41 43 46 46 50 50 54 56 57
48 50 51 52 54 57 60 63 64 65
56 57 65 73 86 67 67 73 83 95
¿Permiten estos resultados concluir que los procesos son igualmente efectivos? Usar un
nivel de confianza del 95%

Aquilino M. García Bautista 1


UNSM Ing. de Sistemas e Informática
Inferencia Estadística

Ejemplo 10:

Una cadena de supermercados se ha propuesto elevar el consumo promedio semanal por


cliente en sus automercados. Para experimentar el método se escogen dos automercados en
los cuales las ventas por cliente en el pasado, eran prácticamente iguales, con una varianza
de 225. En uno de ellos no se experimenta el método y en una muestra de 15 clientes las
ventas medias fueron de $125 con una desviación estándar de 10. En el otro, donde se
experimentó el método, en una muestra de 14 clientes las ventas medias fueron de $130
con una desviación estándar de 17. ¿Opina Usted que el método es eficiente?

INTERVALO DE CONFIANZA PARA LA DIFERENCIA


DE PROPORCIONES POBLACIONALES
Li  P1  P2  L s

Dado un nivel de confianza 1-, para construir un intervalo para la diferencia de


proporciones se utilizará:

p1  q1 p  q2
( p1  p 2 )  z  / 2  2
n1 n2

Ejemplo 11:

Se considera cierto cambio en un proceso de fabricación de ciertos artículos. Se toman


muestras del procedimiento existente y del nuevo para determinar si éste tiene como
resultado una mejoría. Si se encuentra que 75 de 1500 artículos del procedimiento actual
son defectuosos y 80 de 2000 artículos del procedimiento nuevo también lo son, ¿se puede
afirmar que el procedimiento nuevo es mejor? Obtenga una conclusión al nivel significancia
del 10%.

Procedimiento existente Procedimiento nuevo 1    0,90


n1  1500 n2  2000   0,10
75 80  / 2  0,05
p1   0,05 p2   0,04
1500 2000 Z0,05   1,65

0,05  0,95 0,04  0,96


( 0,05  0,04 )  1,65 
1500 2000

 0,0002  P1  P2  0,0218

El procedimiento nuevo será mejor sólo si la proporción de defectuosos es menor. En este


caso el cero pertenece al intervalo de confianza por lo tanto se puede afirmar que ambas
proporciones son iguales. Por lo tanto con una confianza del 90% podemos afirmar que el
nuevo procedimiento no es mejor.

Ejemplo 12:

En una encuesta se preguntó sobre los hábitos de lectura, utilizando una muestra aleatoria
de 350 señoras que trabajan y otra muestra independiente de 325 que no lo hacen. En el
primer caso 105 manifestaron que estaban suscritas a cierto tipo de revista. En el segundo,
la respuesta fue de 130 que no estaban suscritas ni mostraban interés por ninguna revista,
argumentando la falta de tiempo. Al nivel del 1%, ¿se podrá afirmar que las señoras que
trabajan leen menos que las señoras que no trabajan?

Aquilino M. García Bautista 1


UNSM Ing. de Sistemas e Informática
Inferencia Estadística

Al reemplazar los datos en la fórmula, se obtiene:

0,3  0,7 0,6  0,4


( 0,3  0,6 )  2,58    0,39  P1  P2   0,21
350 325

Con una confianza del 99% se puede afirmar que las Sras. que trabajan leen menos que las
Señoras que no trabajan.

Aquilino M. García Bautista 1

S-ar putea să vă placă și