Documente Academic
Documente Profesional
Documente Cultură
UNIDAD 5
ESTADISTICA INFERENCIAL I
2
INDICE
5.7 APLICACIONES 34
BIBLIOGRAFIA 35
5.1 PRUEBA Z PARA LA DIFERENCIA ENTRE DOS PROPORCIONES.
Esta prueba se basa en la aproximación normal de la distribución binomial.
Queremos comparar dos proporciones, p1 y p2, observadas en dos grupos dis-
tintos de tamaños n1 y n2, respectivamente. Esta prueba es utilizable cuando los
tamaños muestrales n1 y n2 son grandes, para poder aplicar el Teorema Central
́ ite. El objetivo de una prueba de dos muestras es determinar si las dos
del Lim
muestras independientes fueron tomadas de dos poblaciones, las cuales presentan
la misma proporción de elementos con determinada característica. La prueba se
concentra en la diferencia relativa (diferencia dividida entre la desviación estándar
de la distribución de muestreo) entre las dos proporciones muestrales. Diferencias
pequeñas denotan únicamente la variación casual producto del muestreo (se
acepta H0), en tanto que grandes diferencias significan lo contrario (se rechaza H0).
El valor estadístico de prueba (diferencia relativa) es comparado con un valor tabular
de la distribución normal, a fin de decidir si H0 es aceptada o rechazada. Una vez
más, esta prueba se asemeja considerablemente a la prueba de medias de dos
muestras.
4
EJERCICIOS
1.- Una muestra de 87 mujeres trabajadoras profesionales mostró que la cantidad
promedio que pagan a un fondo de pensión privado el 5% de su sueldo. Una
muestra de 76 hombres trabajadores profesionales muestra que la cantidad que
paga un fondo de pensión privado es 6.1% de su sueldo. Un grupo activista de
mujeres desea demostrar que las mujeres no pagan tanto como los hombres en
fondos de pensión privados. Si se usa alfa = 0.01 ¿Se confirma lo que el grupo
activista de mujeres desea demostrar o no?
Paso 1. Determinar la hipótesis Nula “Ho” y Alternativa “Ha”. Nótese que este
problema es de una cola.
Ho: Lo que pagan las mujeres en el fondo de pensión es mayor a lo que pagan los
hombres
Ha: Lo que pagan las mujeres en el fondo de pensión es menor a lo que pagan los
hombres
Paso 2.
5
Paso 3.
Calcular los intervalos que implican ese nivel de significancia Para dicho
nivel de significancia el valor de Z es: Z=-2.326 Gráficamente queda de la siguiente
manera:
Paso 4.
6
2.- En un estudio de infección de vías urinarias no complicadas, los pacientes fueron
asignados para ser tratados con trimetoprim / sulfametoxazol o fosfomicina /
trometamol. 92% de los 100 tratados con fosfomicina/ trometamol mostraron
curación bacteriológica mientras que el 61% de los 100 manejados con trimetoprim
/ sulfametoxazol se curó la infección. Cuando comparamos proporciones de
muestras independientes, debemos primero calcular la diferencia en proporciones.
El análisis para comparar dos proporciones independientes es similar al usado para
dos medias independientes. Calculamos un intervalo de confianza y una prueba de
hipótesis para la diferencia en proporciones. La notación que usamos para el
análisis de dos proporciones es el mismo que para una proporción. Los números
inferiores son para distinguir los dos grupos.
Proporción π1 π2 p1 p2
Desviación
√π1(1-π2) √π2(1- π2) √p1(1-p1) √p2(1- p2)
estándar
7
poblaciones es igual a 0. Ho: π1 - π2 = 0
a cero. H1: π1 – π2 ≠ 0.
(p1-p2) – 0 0.31 - 0
Rechazamos la hipótesis nula de que las dos proporciones son iguales y aceptamos
la hipótesis alternativa de que son diferentes.
8
5.2 PRUEBA PARA LA DIFERENCIA ENTRE DOS PROPORCIONES.
De acuerdo con Berenson y levine (1991). La prueba de la diferencia entre dos
proporciones está basadas en muestras independientes, se puede efectuar con el
uso de dos métodos diferentes, pero los resultados serán equivalentes.
El primero implica el uso de la distribución normal, para muestras grandes. Para el
segundo método se emplea el binomial, el resultado llega a ser un éxito o fracaso.
Ho: p = p0
H1: p ¹ p0
Ho: p1 = p2 Þ p1 - p2 = 0
H1: p1 ¹ p2
9
Estimación de la Diferencia de dos Proporciones
Aquí se tiene el mismo caso que en la estimación de una proporción, ya que al hacer
el despeje nos queda las dos proporciones poblacionales y es precisamente lo que
queremos estimar, por lo que se utilizarán las proporciones de la muestra como
estimadores puntuales:
10
EJERCICIOS
Solución:
Sean P1 y P2 las proporciones reales de defectuosos para los procesos actual y
nuevo, respectivamente. De aquí, p1=75/1500 = 0.05 y p2 = 80/2000 = 0.04. con el
uso de la tabla encontramos que z para un nivel de confianza del 90% es de 1.645.
0.0017<P1-P2<0.0217
Como el intervalo contiene el valor de cero, no hay razón para creer que el nuevo
procedimiento producirá una disminución significativa en la proporción de artículos
defectuosos comparado con el método existente.
11
Datos:
n 45 n 71
H M
P .58 P .42
H M
ESTADISTICA INFERENCIAL 1 UNIDAD 4: PRUEBAS DE HIPOTESIS CON DOS MUESTRAS Y VARIAS
MUESTRAS DE DATOS NUMÉRICOS
P P .58.42.16
1.
PH Las hipótesismuestra
= proporción nula y alternativa
de hombresson
(H) las siguientes:
PM = proporción muestra de mujeres (M)
NESTADISTICA
H =P
Ho= tamaño de .muestra
H−PINFERENCIAL
M≤0 1 hombres
La proporción de hombres
UNIDAD que
4: PRUEBAS reportanCON
DE HIPOTESIS 9 oDOS
más visitasY por
MUESTRAS mes es
VARIAS
NMUESTRAS DE DATOS
M = tamaño NUMÉRICOS
de muestra mujeres
laESTADISTICA
misma o menor que1la proporción
INFERENCIAL de 4:mujeres
UNIDAD PRUEBASque hacen lo
DE HIPOTESIS mismo.
CON DOS MUESTRAS Y VARIAS
MUESTRAS
Por lo tanto: DE DATOS NUMÉRICOS
PH = proporción muestra
Ha=Ph−Pm>0. de hombres
La proporción de (H)
hombres que reportan 9 o más visitas por mes es
+
PM = proporción muestra de mujeres (M)
mayor 45 (.proporción
a la 58
de )muestra
71(.hombres
42
dede)hombres (H)
mujeres que hacen lo mismo.
P =
NPHH==tamaño
proporción muestra
= 0.48
NPMM==tamaño
proporción
2.NHEspecifica
= tamaño de 45 +
muestra
de muestra
71
el muestra
de mujeres (M)
mujeres
significación de α=0.05 El valor crítico para la prueba de
nivel dehombres
NM =
una
Por tamaño
sola
lo cola de
tanto: es muestra
1.64 mujeres
y
3.Por lo tanto:
Estima el error estándar de la diferencia de las dos proporciones:
45(.58) + 71(.42) 1
P = æ = 0.481 ö
s ph-m =45(..48(1 - . 48)ç ) + ÷ = 0.10
58)++7171(.42
45
P= è 45= 071 ø
.48
45 + 71
y
æ 1 1ö
y 4. Calcula de prueba estadística:
s ph-m = .48(1 - .48)ç + ÷ = 0.10
æ 1 71 ø1 ö
è 45
= .48
s ph(-mdiferencia (1 - .48 )ç +es _ observadas
_ entre_ proporcion ÷ = 0.10
) - (diferencia_ entre_ proporcion
es _ H o )
Z= è 45 71 ø
4. Calcula de prueba estadística: s ph - m
4. Calcula de prueba estadística:
4.(.58 - .42de
Calcula ) -prueba
(0) estadística:
Z= = 1.60
.10
(diferencia _ entre_ proporcion
es _ observadas ) - (diferencia_ entre_ proporciones _ H o )
Z=
(diferencia_ entre_ proporcion sp m
es _ observadas ) - (diferencia_ entre_ proporcion es _ H )
=
LaZ hipótesis nula es aceptada porque elh -valor de la Z calculada es menor que elo
La hipótesis
valor crítico nula
Z. Laes aceptada porqueno
administración s phde
el valor
puede la Z calculada es menor que el valor
- m concluir con un 95 por ciento de
58La- .administración
crítico(.Z. 42) - (0) no puede concluir con un 95 por ciento de confianza que la
Z=
confianza
proporción de hombres =
que 1.60
la proporción
que
de hombres que visita 9 o más veces los Oxxo es mayor
visita 9 o más veces los Oxxo es mayor que la proporción de
que (.58 -
.10
.42 ) - ( 0)
la proporción de mujeres.
Z=
mujeres. = 1.60
.10
La hipótesis nula es aceptada porque el valor de la Z calculada es menor que el valor
crítico Z. La administración no puede concluir con un 95 por ciento de confianza que la
5.3
La PRUEBA
proporción de PARA
hipótesis nula esLAaceptada
hombres DIFERENCIA
que visita 9porque
o másENveces
elnvalor
PROPORCIONES
losde Z.quees
la Zescalculada
Oxxo mayor la menor quedeel valor
proporción
crítico
mujeres.
Una Z. La administración no puede concluir con un 95 por ciento de confianza
distribución poblacional representa la distribución de valores de una población yque unala
proporción de hombres que visita 9 o más veces los Oxxo es mayor que
distribución muestral representa la distribución de los valores de una muestra. 12 la proporción de
En
mujeres.
contraste con las distribuciones de mediciones individuales, una distribución muestral es
una distribución de probabilidad que se aplica a los valores posibles de una estadística
13
5.3 PRUEBA PARA LA DIFERENCIA EN N PROPORCIONES Z.
parámetros 𝑛1 , 𝑦 𝜎1 , 𝑛1 𝑦 𝜎2 𝑦 𝑛𝑘 𝑦 𝜎𝑘
𝑥1 − 𝑛𝑖 𝜃𝑖
𝑧𝑖 = 𝑝𝑎𝑟𝑎 𝑖 = 1,2 … 𝑘
√𝑛𝑖 𝜃𝑖 (1 − 𝜃𝑖 )
14
EJERCICIOS
Solución:
n=500
p = 15/500 = 0.03
z(0.90) = 1.645
0.0237<P<0.0376
Se sabe con un nivel de confianza del 90% que la proporción de discos defectuosos
que no pasan la prueba en esa población está entre 0.0237 y 0.0376.
Solución:
p=x/n = 20/400=0.05
z(0.95)=1.96
15
Si p=0.05 se usa para estimar P, podemos tener un 95% de confianza en que P
dista menos de 0.021 de p. En otras palabras, si p=0.05 se usa para estimar P, el
error máximo de estimación será aproximadamente 0.021 con un nivel de confianza
del 95%
Esto da por resultado dos valores, (0.029, 0.071). Con un nivel de confianza del
95% se sabe que la proporción de pulas defectuosas de esta compañía está entre
0.029 y 0.071.
16
5.4 PRUEBA DE INDEPENDENCIA (JI-CUADRADA).
H 0 : A y B son independientes
H 1 : A y B no son independientes
17
Prueba de independencia
EJERCICIOS
Ejercicios de prueba de Independencia. Tabla de Contingencia
1.- En una encuesta pre-electoral realizada a 500 personas se obtuvo la siguiente
En una encuesta pre-electoral realizada a 500 personas se obtuvo la siguiente
Distribución en función de sus edades y de su intención de voto. Compruebe la
Distribución en función de sus edades y de su intención de voto:
hipótesis a un nivel de confianza del 95%.
Edad 18 – 35 35 – 50 50 o más
Partido
A 10 40 60
B 15 70 90
C 45 60 35
D 30 30 15
Solución:
Paso 1. Redactar las hipótesis (Nula y Alternativa)
La hipótesis Nula siempre se
redacta en términos
Pasode
1. independencia:
Redactar las hipótesis (Nula y Alternativa)
H0: La intenciónLa
dehipótesis
voto es Independiente deredacta
Nula siempre se la edad en
detérminos
las personas.
de independencia:
Χ2 (GL;α)
Paso 3. Determinar Buscamos
el punto Crítico en la tabla de la distribución Chi-cuadrado con 6 grados de
libertad por el lateral y en la parte superior de la tabla el nivel de significación de
2 0,05. (α=1-0,95 = 0,05) encontramos que el valor crítico es.
Χ (GL;α) Buscamos en la tabla de la distribución Chi-cuadrado con 6 grados de
libertad por el lateral y en la parte superior de la tabla el nivel de significación de
Χ2 (6; 0,05) = 12,592 2
0,05. (α=1-0,95 = 0,05) encontramos que el valor crítico es. Χ (6; 0,05) = 12,592
2
Χ (6; 0,05) = 12,592
18
libertad por el lateral y en la parte superior de la tabla el nivel de signifi
0,05. (α=1-0,95 = 0,05) encontramos que el valor crítico es.
19
Paso 4. Calcular las Esperanzas
Paso 4. Calcular las Esperanzas
Paso 4. Calcular las Esperanzas
O E
O E
10 22 6,55
15
10 35
22 11,43
6,55
45
15 28
35 10,32
11,43
30
45 15
28 15,00
10,32
40
30 44
15 0,36
15,00
70
40 70
44 0
0,36
60
70 56
70 00,29
30
60 30
56 0
0,29
60 44 5,82 Supera al punto crítico (70,26
30 30 0 > 12,592)
90
60 70
44 5,71
5,82 Supera al punto crítico (70,26
35
90 56
70 7,88
5,71 > 12,592)
15
35 30
56 7,50
7,88
500
15 500
30 70,26
7,50
500 500 70,26
2.- Se realiza una investigación para determinar si hay alguna asociación aparente
entre la altura de los estudiantes de posgrado y el éxito en sus clases, a juicio de
sus profesores. Se selecciona una muestra aleatoria consistente en 500
estudiantes. Se clasifica a cada estudiante de acuerdo a dos criterios, la altura y el
éxito. La tabla de contingencia generada es la siguiente:
20
Mayor altura que el promedio poblacional
Si No
Exito Si 162 263 425
No 38 37 75
200 300 500
Datos utilizados para contrastar asociación entre altura y éxito en las clases. Las
frecuencias esperadas aparecen entre paréntesis :
Como 4.18 está entre 3.84 y 5.02, el valor p está entre 0.025 (0.975) 0.05 (0.950).
El valor p es pequeño, es menor de 0.05. Podemos rechazar H 0 y concluir que la
sobre talla y el éxito en las clases no son independientes.
21
5.5 PRUEBAS DE CONTINGENCIA (JI-CUADRADA).
La prueba chi-cuadrado de contingencia sirve para comprobar la independencia de
frecuencias entre dos variables aleatorias, X e Y.
Por tanto, todo lo que necesitamos serán unas estimas de las funciones de
probabilidad de ambas variables por separado (f(x) y f(y)) y de la función de
probabilidad conjunta (f(x,y). Empezaremos la prueba tomando una muestra de
parejas de valores sobre la que contaremos la frecuencia absoluta con la que
aparece cada combinación de valores (xi,yj) o de grupos de valores (i,j) (Oij) La tabla
siguiente, en la que se recogen estos datos, es en realidad nuestra estimación de
la función de probabilidad conjunta multiplicada por el número total de datos (T).
22
X (xi) en cualquier combinación con distintos valores de Y, es decir, son nuestra
estima de la función de probabilidad de X multiplicada por el número total de
observaciones; análogamente, las sumas de columnas (Cj) son nuestra estima de
la función de probabilidad de Y multiplicada por el número total de observaciones.
Tal como pasaba en la prueba anterior, si las variables son independientes, es decir,
si las frecuencias Eij son realmente los valores esperados de las frecuencias Oij, se
puede calcular un parámetro que depende de ambas que tiene distribución chi-
cuadrado,
Por otra parte, si las variables no son independientes, las diferencias entre las series
de frecuencias observadas y esperadas serán mayores que las atribuibles al efecto
del azar y, al estar elevadas al cuadrado en el numerador de la expresión anterior,
ésta tenderá a ser mayor que lo que suele ser el valor de una variable chi-cuadrado.
23
Por tanto, el parámetro anterior ser el estadístico de la prueba de hipótesis y la
región crítica se encontrar siempre en la cola derecha de la distribución chi-
cuadrado. Nuevamente, esta prueba será siempre de una sola cola.
Estadístico de contraste
EJERCICIOS
1.- Una asociación de profesores universitarios quiere determinar si la satisfacción
en el trabajo es independiente del rango académico. Para ello realizó un estudio
nacional entre los académicos universitarios y encontró los resultados mostrados
24
son la tabla siguiente. Con =0.05, haga una prueba para saber si son
dependientes la satisfacción en el trabajo y el rango.
Rango
Instructor Profesor Profesor Profesor
Satisfacción en
el asociado
asistente
Mucha 40 60 52 63
trabajo Regular 78 87 82 88
Poca 57 63 66 64
Solución:
Regla de decisión:
Se procederá a calcular los valores esperados de cada celda. Como los grados de
libertad son 6, esto quiere decir que necesitamos calcular únicamente 6
frecuencias esperadas, y las faltantes se encuentran por diferencia.
Se calcularán los valores esperados E11, E12, E13, E21, E22 y E23.
Rango
Instructor Profesor Profesor Profesor Total
asistente asociado
Satisfacción en Mucha 40 60 52 63 215
el Regular 78 87 82 88 335
Poca 57 63 66 64 250
trabajo
Total 175 210 200 215 800
25
Satisfacción Instructor Profesor Profesor Profesor Total
asistente asociado
Mucha 40 60 52 63 215
26
Solución:
Regla de decisión:
Si X2R 7.378 no se rechaza Ho. Si X2R > 7.378 se rechaza Ho.
Se procederá a calcular los valores esperados de cada celda. Como los grados de
libertad son 2, esto quiere decir que necesitamos calcular únicamente 2 frecuencias
esperadas, y las faltantes se encuentran por diferencia.Se calcularán los valores
esperados E11, y E22. Como se necesitan los totales de renglón y columna se
mostrarán en la tabla:
27
5.6 PRUEBAS DE BONDAD DE AJUSTE.
Las pruebas de bondad de ajuste tienen por objetivo determinar si los datos se
ajustan a una determinada distribución, esta distribución puede estar
completamente especificada (hipótesis simple) o perteneciente a una clase
paramétrica (hipótesis compuesta).
Se analizarán dos pruebas básicas que pueden aplicarse: La prueba Chi - Cuadrado
y la prueba de Smirnov-Kolmogorov. Ambas pruebas caen en la categoría de lo que
en estadística se denominan pruebas de “Bondad de Ajuste” y miden, como el
nombre lo indica, el grado de ajuste que existe entre la distribución obtenida a partir
de la muestra y l a distribución teórica que se supone debe seguir esa muestra.
Ambas pruebas están basadas en la hipótesis nula de que no hay diferencias
significativas entre la distribución muestral y la teórica. Ambas pruebas están
basadas en las siguientes hipótesis:
28
Donde f0(x, q) es la distribución que se supone sigue la muestra aleatoria. La
hipótesis alternativa siempre se enuncia como que los datos no siguen la
distribución supuesta. Si se desea examinar otra distribución específica, deberá
realizarse de nuevo la otra prueba suponiendo que la hipótesis nula es esta nueva
distribución. Al especificar la hipótesis nula, el conjunto de parámetros definidos por
q puede ser conocido o desconocido. En caso de que los parámetros sean
desconocidos, es necesario estimarlos mediante alguno de los métodos de
estimación analizados con anterioridad.
Para formular la hipótesis nula deberán tenerse en cuenta los siguientes aspectos
o criterios:
29
Prueba de independencia
EJERCICIOS
Ejercicio de Bondad de Ajuste
1.- La distribución del número de entrevistas conseguidas por los 56 alumnos que
participaron en el proyecto fue la siguiente:
La distribución Compruebe
del número la hipótesis
de entrevistas a un nivel
conseguidas por de
los 56 alumnos qu
significación del 95% participaron en el proyecto fue la siguiente:
Solución:
Paso 1. Redactar las hipótesis (Nula y Alternativa)
La hipótesis Nula siempre se
Paso 1.del
redacta como una afirmación Redactar
patrón las hipótesis (Nula y Alternativa)
esperado:
La hipótesis Nula siempre se redacta como una afirmación del patrón esperad
H0: Todos los estudiantes tienen la misma probabilidad de conseguir el mismo
número de entrevistas.H0: Todos los estudiantes tienen la misma probabilidad de conseguir el mism
número de entrevistas.
H1: No Todos los estudiantes tienen la misma probabilidad de conseguir el mismo
H1: No Todos los estudiantes tienen la misma probabilidad de conseguir el m
número de entrevistas.número de entrevistas.
30
G.L.= 5-1 = 4
Prueba de independencia
Paso 5.5.Tomar
Paso Tomar la decisión.
la decisión
SeSe rechazala
rechaza la hipótesis
hipótesis nula
nulacon un un
con 5% 5%
de significación.
de significación.
31
Ha: La población no es binomial
32
200 (0.599) = 119.8 200(0.315) = 63 200 (0.086) = 17.2
Como 8.26 es mayor que 5.99, se rechaza la hipótesis nula con un nivel de
significancia de 0.05.
33
5.7 APLICACIONES
Para la ocurrencia de dos eventos, en la cual se desea observar si son dependientes
o independientes.
La distribución ji cuadrada sirve para todas las inferencias sobre la variancia de una
población.
Existen muchos problemas para los cuales los datos son categorizados y los
resultados expuestos en forma de conteos o cuentas.
34
BIBLIOGRAFIA
http://www.virtual.unal.edu.com/cursos/sedes/marizales/403006/lecciones/
capituloes/tema7.html
http://www.facmed.unam.mx/eptos/salud/sencenseneza/planunico/spi/a
ntologia2012/s.pdf
http://eecrib.com/doc/82253086/unidad-iv-pruebas-de-hipotesis-con-dos-
muestras-y-varias-muestras-de-datos-numericos.
http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap04c.
html
35