Sunteți pe pagina 1din 61

Prueba de Hipótesis

Carmen Le Foulon

ICP 0502

Miércoles 12 de septiembre

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 1 / 61


Hoy veremos

1. Recordando

2. Test de hipótesis: sobre la media

3. Comparación entre dos grupos: proporciones

4. Comparación entre dos grupos: test de medias

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 2 / 61


Recordando

Pruebas de hipótesis

Primero que nada: debemos definir la hipótesis.


La hipótesis por tanto es una afirmación sobre la población.
Esta afirmación es sobre el valor de los parámetros poblacionales.
La hipótesis que queremos evaluar la llamamos hipótesis nula.
Para el test de hipótesis evaluamos si dada nuestra estimación, hay evidencia
o no para rechazar nuestra hipótesis nula.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 3 / 61


Recordando

Pruebas de hipótesis

Hipótesis nula: es aquella que proponemos.


La prueba de hipótesis es una prueba por contradicción
Es decir: buscamos si la evidencia es suficientemente fuerte como para
rechazar nuestra hipótesis nula, considerando la variabilidad muestral.
¿Y cómo determinamos si la evidencia es lo suficientemente fuerte como para
rechazarla?
Si es muy poco probable obtener el valores igual o más extremos a los que
obtuvimos en base a nuestra muestra, si el parámetro poblacional fuera
efectivamente el de Ho.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 4 / 61


Recordando

Pasos Pruebas de hipótesis

Todas las pruebas de hipótesis deben seguir cinco pasos:


1 Explicitar los supuestos para construir modelo estadı́stico:
2 Definir las hipótesis
3 Calcular el test estadı́stico
4 Calcular el valor p
5 Concluir

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 5 / 61


Recordando

Pasos Pruebas de hipótesis

1 Supuestos para construir modelo estadı́stico:


Modelo distribución poblacional
Modelo muestral
2 Hipótesis:
Hipótesis nula: nuestra propuesta sobre el valor del parámetro.
Hipótesis alternativa: rango de posibles valores alternativos.
3 El test estadı́stico: nos dice cuán lejos está la estimación obtenida del
parámetro dado por la hipótesis nula en términos de desviaciones estándar de
la distribución muestral.
4 El valor p: nos da la probabilidad (cuán inusual) encontrar valores iguales o
más extremos al del test estadı́stico dado que la hipótesis nula es verdadera.
Se obtiene de la distribución muestral del estimador dado Ho.
5 Conclusiones

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 6 / 61


Recordando

Aplicación: prueba de hipótesis sobre una proporción

La pregunta de investigación es si la mayorı́a de las personas considera peor


condenar a una persona inocente que dejar libre a un culpable o no.
Nuestra hipótesis nula es si el porcentaje es igual a 50 %.
Evidencia: datos de una encuesta de opinión pública, obtenida mediante
muestreo aleatorio a 400 personas.
De las 400 entrevistas, un 55 % respondió que era peor condenar a una
persona inocente.
¿La evidencia nos permite o no rechazar la hipótesis nula?

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 7 / 61


Recordando

Aplicación: prueba de hipótesis sobre una proporción


Paso 1: Supuestos

De una muestra aleatoria de 400 personas, un 55 % respondió que era peor


condenar a una persona inocente.
1 Supuestos para construir modelo estadı́stico:
Modelo distribución poblacional: binomial: 400 repeticiones de v.a. que sigue
proceso Bernouilli).
Modelo muestral: muestra aleatoria de 400 personas.
Distribución muestral del estimaor: dado que es muestra suficientemen grande,
distribución muestral se aproxima a Normal
Recordando: muestra grande (AyF): np > 15 y n(1 − p) > 15
2 Hipótesis
3 Valor test estadı́stico
4 Valor p
5 Conclusión

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 8 / 61


Recordando

Aplicación: prueba de hipótesis sobre una proporción


Paso 2: Hipótesis nula y alternativa

De una muestra aleatoria de 400 personas, un 55 % respondió que era peor


condenar a una persona inocente.
1 Supuestos para construir modelo estadı́stico:
Modelo distribución poblacional: binomial
Modelo muestral: muestra aleatoria, muestra suficientemente grande
Distribución muestral del estimador: distribución muestral se aproxima a
Normal
2 Hipótesis:
Hipótesis nula: p = 0,5
Hipótesis alternativa: p > 0,5
Hipótesis de una sola cola
3 Valor test estadı́stico
4 Valor p
5 Conclusión

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 9 / 61


Recordando

Aplicación: prueba de hipótesis sobre una proporción


Paso 3: Test estadı́stico

1 Supuestos para construir modelo estadı́stico


2 Hipótesis:
Hipótesis nula: p = 0,5
Hipótesis alternativa: p > 0,5
3 Test estadı́stico:

p̂ − p0 p̂ − p0 0,55 − 0,5
z= =r =r = 2,0
es0 p0 (1 − p0 ) 0,5(1 − 0,5)
n 400
4 Valor p
5 Conclusión

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 10 / 61


Recordando

Aplicación: prueba de hipótesis sobre una proporción


Paso 4: Valor p

La probabilidad de obtener un estadı́stico muestral de valores iguales más


extremos que el obtuvimos en la muestra si Ho es verdadero.
Entre más pequeño el valor p, mayor es la evidencia en contra de Ho: es
menos probable.
Recuerden que es una prueba por contradicción: buscamos que los datos nos
entreguen la evidencia en contra de Ho

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 11 / 61


Recordando

Aplicación: prueba de hipótesis sobre una proporción


Paso 4: Valor p

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 12 / 61


Recordando

Aplicación: prueba de hipótesis sobre una proporción


Paso 4: Valor p
Distribución muestral asumiendo p = 0,5

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 13 / 61


Recordando

Aplicación: prueba de hipótesis sobre una proporción


Paso 4: Valor p

Distribución muestral Estandarizada N(0,1) asumiendo p = 0,5

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 14 / 61


Recordando

Aplicación: prueba de hipótesis sobre una proporción


Paso 4: Valor p

De una muestra de 400 personas, un 55 % respondió que era peor condenar a una
persona inocente.
1 Supuestos para construir modelo estadı́stico
2 Hipótesis:
Hipótesis nula: p = 0,5
Hipótesis alternativa: p > 0,5
3 Test estadı́stico: z = 2,0
4 El valor p: en base a la distribución muestral asumiendo que H0 es verdadera:
Prob(propmuestral ≥ 0,55) = 0,0228, lo que estandarizando
Prob(z ≥ 2,0) = 0,0228

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 15 / 61


Recordando

Aplicación: prueba de hipótesis sobre una proporción


Paso 5: Conclusión

Una vez que tenemos la probabilidad de obtener un estimador con valores


iguales o más extremos a los de nuestra estimación, ¿qué?
Es decir, cuán pequeña debe ser probabilidad para que digamos que es
suficiente evidencia en contra de Ho.
Depende a la tolerancia que tengamos a equivocarnos en la decisión: el error
que estamos dispuesto a asumir.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 16 / 61


Recordando

Nivel de significancia estadı́stica

Valor predefinido: en general, α = 0,05


Se rechaza Ho si el valor p es menor o igual que ese número.
Cuando rechazamos Ho: los resultados en contra de Ho son estadı́sticamente
significativos.
Si no rechazamos Ho: Ho es plausible, pero no sabemos si es verdadera.
Por eso: nunca aceptamos Ho, Ho es plausible, pero también lo son otros
posible valores.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 17 / 61


Recordando

Ejemplo: test de proporción

De una muestra de 400 personas, un 55 % respondió que era peor condenar a una
persona inocente.
1 Supuestos para construir modelo estadı́stico
2 Hipótesis:
Hipótesis nula: p = 0,5
Hipótesis alternativa: p > 0,5
3 Test estadı́stico: z = 2,0
4 El valor p: Prob(z ≥ 2,0) = 0,0228
5 Conclusión:
Definiendo α = 0,05
Como Prob(z ≥ 2,0) = 0,0228 < 0,05
Rechazamos Ho.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 18 / 61


Test de hipótesis: sobre la media

Test de hipótesis: sobre la media

Nuestra hipótesis es sobre el valor que toma la media de la población de


interés
Debemos seguir siempre los 5 pasos del test de hipótesis
La distbrución muestral bajo H0 depende de si conocemos o no la desviación
estándar poblacional.
Si la conocemos, la distribución muestral de la media es Normal.
Si no la conocemos, la distribución muestral de la media estándarizada es
t-Student.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 19 / 61


Test de hipótesis: sobre la media

Test de hipótesis cuando conocemos la desviación estándar


poblacional
Ingreso promedio egresados Ciencia Polı́tica: muestra aleatoria 400 egresados:
promedio 630.000, conocemos por otros estudios desviación estándar poblacional
es 350.000.
Queremos evaluar si el ingreso promedio poblacional es mayor a 600.000 pesos.
Supuestos
Ingresos: Variable cuantitativa, distribución Normal, muestra aleatoria.
Estimador: media muestral µ̂ = X̄ ∼ N (µ, σ 2 )
Hipótesis:
H0 : µ=600.000
Ha : µ >600.000
Por tanto, test de una cola
Estadı́stico de prueba (test estadı́stico)
Valor p
Conclusiones

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 20 / 61


Test de hipótesis: sobre la media

Ejemplo: test de media conocemos σ

Supuestos: modelo estadı́stico: µ̂ = X̄ ∼ N (µ, σ 2 )


Hipótesis:
H0 : µ=600.000
Ha : µ >600.000
Estadı́stico de prueba:
Estándarizamos bajo H0 , conociendo σ = 350, 000:

µ̂ − µ0 630000 − 600000 30000


z= = = = 1, 71
σ0 350000 17500

400
Valor p
Conclusiones

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 21 / 61


Test de hipótesis: sobre la media

Ejemplo: test de media conocemos σ

Supuestos: modelo estadı́stico: µ̂ = X̄ ∼ N (µ, σ 2 )


Hipótesis:
H0 : µ=600.000
Ha : µ >600.000
z estadı́stico: 1,71
Valor p
¿Cuál es la probabilidad de que la media muestral (x̄) tome valores mayores o
iguales a nuestro t-estadı́stico = 1,71?
Es decir: qué probabilidad hay, si los ingresos de los egresados de Ciencia
Polı́tica se distribuyen Normal, con µ = 600000 y σ = 350000, que de una
muestra aleatoria de 400 egresados tenga un promedio mayor o igual a
630.000, el cual toma un valor estandarizado de 1,71.
Conclusiones

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 22 / 61


Test de hipótesis: sobre la media

Distribución muestral bajo hipótesis nula, conocemos σ


350000
Distribución muestral bajo H0 : µ = 600000 y σ √
400

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 23 / 61


Test de hipótesis: sobre la media

Dist muestral estandarizada bajo Ho,conocemos σ


350000
Distribución muestral bajo H0 : µ = 600000 y σ √
400

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 24 / 61


Test de hipótesis: sobre la media

Ejemplo: test de media conocemos σ

Supuestos: modelo estadı́stico: µ̂ = X̄ ∼ N (µ, σ 2 )


Hipótesis:
H0 : µ=600.000
Ha : µ >600.000
z estadı́stico: 1,71
Valor p = 0,0432
Conclusiones: definir nivel de significancia
Si queremos un nivel de confianza de 95 %
¿Rechazamos H0 ?

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 25 / 61


Test de hipótesis: sobre la media

Ejemplo: test de dos colas, conocemos σ

Supuestos
Ingresos: Variable cuantitativa, distribución Normal, muestra aleatoria.
Estimador: media muestral µ̂ = X̄ ∼ N (µ, σ 2 )
Hipótesis: pero ahora:
H0 : µ=600.000
Ha : µ 6=600.000
Por tanto, test de dos colas
Estadı́stico de prueba (test estadı́stico)
Valor p
Conclusiones

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 26 / 61


Test de hipótesis: sobre la media

Ejemplo: test de media dos colas, conocemos σ

Supuestos: modelo estadı́stico: µ̂ = X̄ ∼ N (µ, σ 2 )


Hipótesis:
H0 : µ=600.000
Ha : µ 6=600.000
Estadı́stico de prueba observado:
Estándarizamos bajo H0 , conociendo σ = 350, 000:

µ̂ − µ0 630000 − 600000 30000


z= = = = 1, 71
σ0 350000 17500

400
Valor p
Conclusiones

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 27 / 61


Test de hipótesis: sobre la media

Distribución muestral estandarizada, conocemos σ


350000
Distribución muestral bajo H0 : µ = 600000 y σ √
400

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 28 / 61


Test de hipótesis: sobre la media

Ejemplo: test de media dos colas, conocemos σ

Supuestos: modelo estadı́stico: µ̂ = X̄ ∼ N (µ, σ 2 )


Hipótesis:
H0 : µ=600.000
Ha : µ 6=600.000
test estadı́stico: 1,71
Valor p = 0,0864
Conclusiones: definir nivel de significancia
Si queremos un nivel de confianza de 95 %
¿Rechazamos H0 ?
Qué relación tiene el test de una cola versus el de dos colas

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 29 / 61


Test de hipótesis: sobre la media

Si no conocemos desviación estándar poblacional

Hasta ahora, hemos asumido que conocemos la desviación estándar


poblacional, pero en muchos casos no la conocemos.
Por lo tanto, debemos estimarla
El estimador de la desviación estándar poblacional es la desviación estándar
muestral
Pero eso implica que nuestra distribución muestral, y nuestro test estadı́stico
ya no se distribuye Normal, ya que estamos introduciendo un estimador de la
desviación estándar en vez de la desviación estándar poblacional
Se distribuye t-Student con (n-1) grados de libertad
El análisis posterior es idéntico, sólo que ahora debemos ocupar la
distribución t-Student para calcular los valores p.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 30 / 61


Test de hipótesis: sobre la media

Test de hipótesis cuando usamos estimación de σ

Ingreso promedio egresados Ciencia Polı́tica: muestra aleatoria 400 egresados:


promedio 630.000, desviación estándar de la muestra es 360.000
Queremos evaluar si el ingreso promedio poblacional es igual a 600.000 pesos.
Supuestos
Ingresos: Variable cuantitativa, distribución Normal, muestra aleatoria.
Estimamos desviación estándar poblacional: hatσ = 360,000
Estimador: media muestral ya no se distribuye Normal.
Media muestral estandarizada se distribuye t-Student(n-1)
Hipótesis:
H0 : µ=600.000
Ha : µ 6=600.000
Por tanto, test de dos cola
Estadı́stico de prueba (test estadı́stico)
Valor p
Conclusiones

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 31 / 61


Test de hipótesis: sobre la media

Test de hipótesis cuando usamos estimación de σ

Supuestos
Estimamos desviación estándar poblacional: hatσ = 360,000
Media muestral estandarizada se distribuye t-Student(n-1)
Hipótesis:
H0 : µ=600.000
Ha : µ 6=600.000
Estadı́stico de prueba (test estadı́stico)
360,000
se= √ = 18000
400
x̄ − µHo 630,000 − 600 − 000
test = = = 1,667
se 18000
Valor p
Conclusiones

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 32 / 61


Test de hipótesis: sobre la media

Test de hipótesis cuando usamos estimación de σ

Supuestos
Estimamos desviación estándar poblacional: hatσ = 360,000
Media muestral estandarizada se distribuye t-Student(n-1)
Hipótesis:
H0 : µ=600.000
Ha : µ 6=600.000
Estadı́stico de prueba (test estadı́stico)=1.667
Valor p:
Prob(t > 1,667) = 0,048
valor p = 0.048 + 0.048=0.096
Conclusiones: definiendo α = 0,05, rechazo H0

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 33 / 61


Comparación entre dos grupos: proporciones

Comparación entre dos grupos: proporciones

La hipótesis se refiere a la proporción de una variable de interés entre dos


grupos.
En este caso, bajo Ho conocemos siempre la desviación estándar ya que se
deriva de la proporción.
Bajo la Ho de que la proporción en ambos grupos es la misma, al calcular la
desviación estándar bajo Ho, se considera la proporción en toda la muestra
(proporción agrupada).
r
1 1
se0 = p̂(1 − p̂)( + )
n1 n2

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 34 / 61


Comparación entre dos grupos: proporciones

Comparando la proporción entre dos grupos

Buscamos determinar si la proporción de quienes aprueban el gobierno versus


quienes no lo aprueban o no aprueba ni desaprueban es igual entre hombres y
mujeres, donde de las 884 mujeres encuestas, 400 aprueban el gobierno, y de los
579 hombres encuestados, 224 aprueban el gobierno.
Supuestos
Hipótesis
Test estadı́stico
valor p
Conclusión

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 35 / 61


Comparación entre dos grupos: proporciones

Comparando la proporción entre dos grupos

Buscamos determinar si la proporción de quienes aprueban el gobierno versus


quienes no lo aprueban o no aprueba ni desaprueban es igual entre hombres y
mujeres, donde de las 884 mujeres encuestas, 400 aprueban el gobierno, y de los
579 hombres encuestados, 224 aprueban el gobierno.
nmuj = 884 y propm = 0,452
nhomb = 579 y proph = 0,387
Supuestos:
Muestras aleatorias de los dos grupos, independientes entre sı́.
Variable categórica
N grande, usamos aproximación de la Binomial a la Normal
Hipótesis
Test estadı́stico
valor p
Conclusión

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 36 / 61


Comparación entre dos grupos: proporciones

Comparando dos grupos

Supuestos:
Hipótesis:
H0 : (pM − pH ) = 0
Ha : (pM − pH ) 6= 0
Test estadı́stico: -2.48
(pˆM − pˆH ) − 0 (0,452 − 0,387) − 0
z=r =r = −2,48
1 1 1 1
p̂(1 − p̂)( + ) 0,427(1 − 0,427)( + )
n1 n2 884 579
valor p
Conclusión

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 37 / 61


Comparación entre dos grupos: proporciones

Comparando dos grupos

Supuestos:
Hipótesis:
H0 : (pM − pH ) = 0
Ha : (pM − pH ) 6= 0
Test estadı́stico: -2.48
valor p = 0.013 = prob(z ≤ −2,48) + prob(z ≥ 2,48)
Conclusión: Conclusión: Definiendo un nivel de significancia de 5 %, se
rechaza H0 ya que valorp < α ⇒ 0,013 < 0,05

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 38 / 61


Comparación entre dos grupos: test de medias

Comparación entre dos grupos: test de medias

Como en todos los tests de hipótesis, partimos por identificar el modelo


poblacional, modelo muestral para derivar modelo estadı́stico, y derivar por
tanto, distribución muestral según la hipótesis nula.
En este caso, la hipótesis nula se base en la relación entre dos medias.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 39 / 61


Comparación entre dos grupos: test de medias

Ejemplo: Comparación entre dos grupos

¿Son los ingresos de los egresados de ciencia polı́tica diferentes a los de sociologı́a?
Muestra de 1.000 egresados: 500 de ciencia polı́tica y 500 de sociologı́a.
Promedio ciencia polı́tica = 630.000, conocemos desviación estándar
poblacional=130.000
Promedio muestra sociologı́a = 613.000, conocemos desviación estándar
poblacional=150.000
Supuestos
Hipótesis:
H0 : µcp = µsocio
Ha : µcp 6= µsocio

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 40 / 61


Comparación entre dos grupos: test de medias

Ejemplo: Comparación entre dos grupos

µ̂cp = x̄cp = 630000; σcp = 130000, ncp = 500


µ̂socio = x̄socio = 613000; σsocio = 150000, nsocio = 500
Supuestos:
Hipótesis:
H0 : µcp = µsocio ⇒ (µcp − µsocio ) = 0
Ha : µcp 6= µsocio ⇒ (µcp − µsocio ) 6= 0
Estadı́stico de prueba:
La nueva variable aleatoria de interés es ahora la estimación de la diferencia de
las medias muestrales, que en este caso es x¯dif = x̄cp − x̄socio
x¯dif se distribuye Normal
µdif = µcp −
sµsocio
2
σcp σ2
sigmadif = + socio
ncp nsocio

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 41 / 61


Comparación entre dos grupos: test de medias

Ejemplo: Comparación entre dos grupos

µ̂cp = x̄cp = 630000; σcp = 130000, ncp = 500


µ̂socio = x̄socio = 613000; σsocio = 150000, nsocio = 500
Hipótesis:
H0 : (µcp − µsocio ) = 0
Ha : (µcp − µsocio ) 6= 0
Estadı́stico de prueba:
Entonces, bajo H0 , µdifH o = 0, y usando las desviaciones estándar
poblacionalessobtenemos que
2
r
σcp σ2 1300002 1500002
sigmadifH o = + socio = + = 8876,94
ncp nsocio 500 500

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 42 / 61


Comparación entre dos grupos: test de medias

Ejemplo: Comparación entre dos grupos

µ̂cp = x̄cp = 630000; σcp = 130000, ncp = 500


µ̂socio = x̄socio = 613000; σsocio = 150000, nsocio = 500
Hipótesis:
H0 : (µcp − µsocio ) = 0
Ha : (µcp − µsocio ) 6= 0
Estadı́stico de prueba:

µ̂dif − µdif (µ̂cp − µ̂socio ) − µdif


test = =
σdif σdif
(630000 − 613000) − 0
test = = 1,92
8876,94

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 43 / 61


Comparación entre dos grupos: test de medias

Ejemplo: Comparación entre dos grupos

µ̂cp = x̄cp = 630000; σcp = 130000, ncp = 500


µ̂socio = x̄socio = 613000; σsocio = 150000, nsocio = 500
Hipótesis:
H0 : (µcp − µsocio ) = 0
Ha : (µcp − µsocio ) 6= 0
Estadı́stico de prueba:1.92
Valor p = prob(X > |1,92|) = prob(X > 1,92) + prob(X < −1,92)

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 44 / 61


Comparación entre dos grupos: test de medias

Distribución muestral de la diferencia de medias

Distribución muestral bajo H0 : µdif = 0

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 45 / 61


Comparación entre dos grupos: test de medias

Distribución muestral de la diferencia de medias


estandarizada
Distribución muestral estandarizada bajo H0 : µdif = 0

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 46 / 61


Comparación entre dos grupos: test de medias

Ejemplo: Comparación entre dos grupos

µ̂cp = x̄cp = 630000; σcp = 130000, ncp = 500


µ̂socio = x̄socio = 613000; σsocio = 150000, nsocio = 500
Hipótesis:
H0 : (µcp − µsocio ) = 0
Ha : (µcp − µsocio ) 6= 0
Estadı́stico de prueba:1.92
Valor p = 0.0554
Conclusión:
Definir nivel de significancia
α = 0,05 no se puede rechazar H0
¿Cómo cambiarı́a nuestra conclusión si hubiéramos realizado test de una cola?,
es decir, si ahora Ha : (µcp − µsocio ) > 0

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 47 / 61


Comparación entre dos grupos: test de medias

Intervalo de confianza

El intervalo de confianza se construye agregando el margen de error a la


estimación puntual.
El margen de error está dado por el error estándar de la estimación, por la
distribución muestral y por el nivel de confianza: qué porcentaje de los
intervalos de confianza generados contendrı́a el verdadero parámetro.
En otras palabaras, necesitamos la distribución muestral y el intervalo de
confianza para determinar el valor por el debemos multiplicar el error
estándar.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 48 / 61


Comparación entre dos grupos: test de medias

Intervalo de confianza

En el ejemplo, la distribución muestral es Normal, y definimos nivel de


confianza en 95 %.
Por lo tanto, para construir el intervalo de confianza identificamos el valor z
para el cual Prob(−z < X < z) = 0,95, el cual es 1.96.
Ası́, el intervalo de confianza para la diferencia de medias es:
IC95 % = (x̄dif − 1,96 ∗ sedif , x̄dif + 1,96 ∗ sedif )
IC95 % = (17000 − 1,96 ∗ 8876,94, 17000 + 1,96 ∗ 8872,94)
IC95 % = (−398,8, 34398,8)

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 49 / 61


Comparación entre dos grupos: test de medias

Intervalo de confianza, test estadı́stico y valor p

¿Qué relación existe entre el intervalo de confianza, el test estadı́stico y el


valor p?
Recordando en el ejemplo:
Test estadı́stico es 1.92
Valor p=0.0554
IC95 % = (−398,8, 34398,8)

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 50 / 61


Comparación entre dos grupos: test de medias

Ejemplo: Comparación entre dos grupos, usando


estimación de desviación estándar poblacional

¿Son los ingresos de los egresados de ciencia polı́tica diferentes a los de sociologı́a?
Muestra de 1.000 egresados: 500 de ciencia polı́tica y 500 de sociologı́a.
Promedio ciencia polı́tica = 630.000, no conocemos desviación estándar
poblacional, desviación de la muestra =145.000
Promedio muestra sociologı́a = 613.000, no conocemos desviación estándar
poblacional, desviación de la muestra =145.000
Al no conocer la desviación estándar poblacional, la estimamos usando los datos
de la muestra.
µ̂cp = x̄cp = 630000; σ̂cp = secp = 145000, ncp = 500
µ̂socio = x̄socio = 613000; σ̂socio = sesocio = 145000, nsocio = 500

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 51 / 61


Comparación entre dos grupos: test de medias

Ejemplo: Comparación entre dos grupos


µ̂cp = x̄cp = 630000; σ̂cp = secp = 145000, ncp = 500
µ̂socio = x̄socio = 613000; σ̂socio = sesocio = 145000, nsocio = 500
Supuestos:
La distribución muestral estandarizada se distribuye t-Student.
El error estándar de la diferencia está dado por:
s
2
secp se 2
sedif = + socio
ncp nsocio

Los grados de libertad dependen de los tamaños de muestra y de los errores


estándar.
En este caso, con ncp = nsocio y secp = sesocio los grados de libertad (df )
corresponden a (ncp + nsocio − 2).
Por lo tanto:
¯ − µdif )
(xdif
∼ t − Student(ncp +nsocio −2)
sedif
Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 52 / 61
Comparación entre dos grupos: test de medias

Ejemplo: Comparación entre dos grupos

µ̂cp = x̄cp = 630000; σ̂cp = secp = 145000, ncp = 500


µ̂socio = x̄socio = 613000; σ̂socio = sesocio = 145000, nsocio = 500
Supuestos:
(x̄dif − µdif )
∼ t − Student(ncp +nsocio −2)
sedif
Hipótesis:
H0 : µcp = µsocio ⇒ (µcp − µsocio ) = 0
Ha : µcp 6= µsocio ⇒ (µcp − µsocio ) 6= 0
test estadı́stico:

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 53 / 61


Comparación entre dos grupos: test de medias

Ejemplo: Comparación entre dos grupos

µ̂cp = x̄cp = 630000; σ̂cp = secp = 145000, ncp = 500


µ̂socio = x̄socio = 613000; σ̂socio = sesocio = 145000, nsocio = 500
Supuestos
Hipótesis:
H0 : (µcp − µsocio ) = 0
Ha : (µcp − µsocio ) 6= 0
test estadı́stico:
(x̄ − µdif ) (17000 − 0)
s dif =r = 1,85
2
secp 2
sesocio 1450002 1450002
+ +
ncp nsocio 500 500

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 54 / 61


Comparación entre dos grupos: test de medias

Ejemplo: Comparación entre dos grupos

µ̂cp = x̄cp = 630000; σ̂cp = secp = 145000, ncp = 500


µ̂socio = x̄socio = 613000; σ̂socio = sesocio = 145000, nsocio = 500
Hipótesis:
H0 : (µcp − µsocio ) = 0
Ha : (µcp − µsocio ) 6= 0
Estadı́stico de prueba:1.85
Valor p = prob(X > |1,85|) = prob(X > 1,85) + prob(X < −1 − 85)

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 55 / 61


Comparación entre dos grupos: test de medias

Distribución muestral de la diferencia de medias


estandarizada
Distribución muestral bajo H0 : µdif = 0

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 56 / 61


Comparación entre dos grupos: test de medias

Ejemplo: Comparación entre dos grupos

µ̂cp = x̄cp = 630000; σ̂cp = secp = 145000, ncp = 500


µ̂socio = x̄socio = 613000; σ̂socio = sesocio = 145000, nsocio = 500
Hipótesis:
H0 : (µcp − µsocio ) = 0
Ha : (µcp − µsocio ) 6= 0
Estadı́stico de prueba:1.85
Valor p = 0.064
Conclusión:
Definir nivel de significancia
α = 0,05 no se puede rechazar H0
¿Cómo cambiarı́a nuestra conclusión si hubiéramos realizado test de una cola?,
es decir, si ahora Ha : (µcp − µsocio ) > 0

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 57 / 61


Comparación entre dos grupos: test de medias

Intervalo de confianza

En este ejemplo, la distribución muestral del estadı́stico de prueba es


t-Student, y definimos nivel de confianza en 95 %.
Por lo tanto, para construir el intervalo de confianza identificamos el valor t
para el cual Prob(−t < X < t) = 0,95, donde X ∼ t − Student(998) el cual es
1.9623
Ası́, el intervalo de confianza para la diferencia de medias es:
IC95 % = (x̄dif − 1,9623 ∗ sedif , x̄dif + 1,9623 ∗ sedif )
IC95 % = (17000 − 1,9623 ∗ 9170,6, 17000 + 1,9623 ∗ 9170,6)
IC95 % = (−995,48, 34995,48)

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 58 / 61


Comparación entre dos grupos: test de medias

Ejemplo: Comparación entre dos grupos, usando


estimación de desviación estándar poblacional, diferencias
entre grupos
Cuando los grupos no tienen la misma varianza o tamaño muestral, el cálculo
de los grados de libertad se complejiza.
Sin embargo, el tamaño se mueve entre (n1 + n2 − 2) y el mı́nimo entre
(n1 − 1) y (n2 − 1).
En términos prácticos, los grados de libertad no varı́an mucho si las razones
son menores a 2.
En todo caso, lo software estadı́sticos lo calculan automáticamente.
Por interés general, la fórmula es:

s12 s2
+ 2 )2 (
grados de libertad = n1 n2
1 s12 2 1 s2
( ) + ( 2 )2
n1 − 1 n1 n2 − 1 n2

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 59 / 61


Comparación entre dos grupos: test de medias

Ejemplo: Comparación entre dos grupos, usando


estimación de desviación estándar poblacional, diferencias
entre grupos

Por ejemplo, secp = 85000 y sesocio = 205000, ncp = nsocio = 500, los grados
de libertad serı́an 665.65 en vez de los 998 cuando ambas eran iguales.
Valor p para test de dos colas es de 0.0872, con error estándar de la
diferencia = 9924.72.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 60 / 61


Comparación entre dos grupos: test de medias

Comparación entre grupos

Muestra pareadas: pre y post del mismo individuo.


No se cumple el supuesto de independencia entre los grupos.
Solución: generar una nueva variable aleatoria: la diferencia entre pre y post,
y trabajar sobre esa variable.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Miércoles 12 de septiembre 61 / 61

S-ar putea să vă placă și