Sunteți pe pagina 1din 41

Facultad de Ciencias Sociales

Departamento de Sociología
Estadística II

Modulo 4. Pruebas de Hipótesis


para una población
Parte II

Catalina Canals Cifuentes


4/04/2016
INTRODUCCIÓN
Contenidos
I. Test de hipótesis
hipótesis para
parauna
unapoblación
población
II. Test Z para medias: Estadísticos, supuestos y
PARTE I

distribución nula.
III. Test Z para proporciones: Estadísticos, supuestos y
distribución nula.
IV. Relación entre pruebas de hipótesis e intervalos de
confianza.
PARTE II

V. Test T parapara medias:


medias: Estadísticos,
Estadísticos, supuestos,
distribución nula.
distribución nula. Relación
RelaciónTest
TestTTyyTest
TestZ.Z.
VI. Test Binomial para proporciones:
proporciones: Estadísticos,
Estadísticos,
supuestos yy distribución
distribuciónnula.
nula.
VII. Pruebas de hipótesis para mediana.
PARTE III

VIII. Pruebas de hipótesis de distribución de variables:


normalidad, simetría y curtosis.
I. Test de hipótesis para una
población
I. TEST DE HIPÓTESIS PARA UNA POBLACIÓN

0. Verificar Supuestos
1. Definir Hipótesis
2. Definir significancia
3. Determinar el estadístico del Test
4. Identificar la distribución nula
5. Rechazamos o No rechazamos H0
I. TEST DE HIPÓTESIS PARA UNA POBLACIÓN

Test de
hipótesis para
una Población

Parámetros Distribución

Media Proporción Mediana Normalidad Simetría Curtosis

• Test Z • Test Z
• Test T • Test
binomial
V. Test T para medias (T de
Student)
V. TEST T PARA MEDIAS
Test Z para medias
Test de hipótesis paramétrico para evaluar
hipótesis sobre el valor de una media poblacional
(parámetro)

SUPUESTOS:
– Variable cuantitativa
– Muestreo probabilístico
– Muestra grande
V. TEST T PARA MEDIAS
Test T para medias
Test de hipótesis paramétrico para evaluar
hipótesis sobre el valor de una media poblacional
(parámetro)

SUPUESTOS:
– Variable cuantitativa
– Muestreo probabilístico
– Distribución de la variable normal
V. TEST T PARA MEDIAS
Hipótesis del Test T
HIPÓTESIS:
– H0: 𝜇 = 𝜇0
– H1: 𝜇 ≠ 𝜇0 (Prueba de dos colas)
– H1: 𝜇 > 𝜇0 (Prueba de una cola)
– H1: 𝜇 < 𝜇0 (Prueba de una cola)
V. TEST T PARA MEDIAS
Estadístico y distribución nula en Test T
para medias
ത 𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
𝑋:


Problema: ¿Cómo distribuye 𝑋?


𝑋−𝜇 ത
𝑋−𝜇
Si X es normal, Estadístico T= ത
= =∼ 𝑇 𝑛−1 𝑔𝑙
𝑆𝐸(𝑋) 𝑠Τ 𝑛
𝑆𝑖 𝐻0 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎,
𝑋ത − 𝜇0
∼ 𝑇 𝑛−1 𝑔𝑙
𝑠Τ 𝑛
V. TEST T PARA MEDIAS
Grados de libertad (gl)
Corresponden al número de valores de un
conjunto de observaciones que pueden ser
asignados de forma arbitraria, previo a que los
demás valores asuman un valor automáticamente.

Los grados de libertad se relacionan con la forma


que tendrá la distribución determinada.
V. TEST T PARA MEDIAS
Distribución T
• Simétrica en torno a 0.
• La dispersión de los datos
depende de los grados de
libertad (gl):
• Desviación estándar> 1,
pero se acerca a 1
cuando los gl aumentan.
• Dado que es más dispersa
que una distribución N(0,1),
la probabilidad de caer en
las colas es mayor.
V. TEST T PARA MEDIAS
Test T para medias de dos colas
TEST DE DOS COLAS: ZONA DE RECHAZO
– H0: 𝜇 = 𝜇0
– H1: 𝜇 ≠ 𝜇0
𝑆𝑖 𝐻0 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎,
𝑋ത − 𝜇0
∼ 𝑇 𝑛−1 𝑔𝑙
𝑠Τ 𝑛
𝑛−1 𝑔𝑙 ത 0
𝑋−𝜇 𝑛−1 𝑔𝑙
 ℙ −𝑇𝛼Τ ≤ ≤ 𝑇𝛼Τ =1−𝛼
2 𝑠Τ 𝑛 2

Zona de Rechazo:
ത 0
𝑋−𝜇 ത 0
𝑋−𝜇
< −𝑇𝛼Τ2 ∪ > 𝑇𝛼Τ2
𝑠Τ 𝑛 𝑠Τ 𝑛
V. TEST T PARA MEDIAS
Test T para medias de dos colas
TEST DE DOS COLAS: ZONA DE RECHAZO
H0: 𝜇 = 23 H1: 𝜇 ≠ 23
ത 0
𝑋−𝜇
𝑆𝑖 𝐻0 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎 ∼ 𝑇 𝑛−1 𝑔𝑙  eligiendo
𝑠Τ 𝑛
𝛼=5%
𝑛−1 𝑔𝑙 𝑋ത − 𝜇0 𝑛−1 𝑔𝑙
ℙ −𝑇𝛼ൗ ≤ ≤ 𝑇𝛼ൗ = 95%
2 𝑠Τ 𝑛 2

Siendo 𝑋ത = 22, 𝑠 = 2 𝑦 𝑛 = 30

𝑋−23 22−23
𝑠/ 𝑛
=
2/ 30
=-2,78
29 𝑔𝑙
𝑇𝛼Τ = (Ver tabla)
2
V. TEST T PARA MEDIAS
Test T para medias de dos colas
TEST DE DOS COLAS: ZONA DE RECHAZO
H0: 𝜇 = 23 H1: 𝜇 ≠ 23
ത 0
𝑋−𝜇
𝑆𝑖 𝐻0 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎
𝑠Τ 𝑛
∼ 𝑇 𝑛−1 𝑔𝑙  eligiendo 𝛼=5%
𝑛−1 𝑔𝑙 𝑋ത − 𝜇0 𝑛−1 𝑔𝑙
ℙ −𝑇𝛼ൗ ≤ ≤ 𝑇𝛼ൗ = 95%
2 𝑠Τ 𝑛 2

Siendo 𝑋ത = 22, 𝑠 = 2 𝑦 𝑛 = 30

𝑋−23 22−23
𝑠/ 𝑛
=
2/ 30
=-2,78
29 𝑔𝑙 𝑛−1 𝑔𝑙
𝑇𝛼Τ = 2.045-2,78<-𝑇𝛼Τ
2 2
Rechazamos 𝐻0
V. TEST T PARA MEDIAS
Test T para medias de dos colas
TEST DE DOS COLAS: VALOR P
H0: 𝜇 = 𝜇0 H1: 𝜇 ≠ 𝜇0
ത 0
𝑋−𝜇
Valor P= 2 ℙ ≤ −|𝑉𝑎𝑙𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙|
𝑠Τ 𝑛

H0: 𝜇 = 23 H1: 𝜇 ≠ 23
ത 0
𝑋−𝜇
Valor P=2 P ≤ −2.78
𝑠Τ 𝑛
ത 0
𝑋−𝜇
Dado que Τ ∼ 𝑇 𝑛−1 𝑔𝑙
𝑠 𝑛
ത 0
𝑋−𝜇 ത 0
𝑋−𝜇
Valor P=2 P Τ ≤ −2.78 = 2𝑃 ≥ 2.78 =
𝑠 𝑛 𝑠Τ 𝑛
2 (Ver tabla)
V. TEST T PARA MEDIAS
Test T para medias de dos colas
TEST DE DOS COLAS: VALOR P
H0: 𝜇 = 𝜇0 H1: 𝜇 ≠ 𝜇0
ത 0
𝑋−𝜇
Valor P= 2 ℙ ≤ −|𝑉𝑎𝑙𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙|
𝑠Τ 𝑛

H0: 𝜇 = 23 H1: 𝜇 ≠ 23
ത 0
𝑋−𝜇
Valor P=2 P ≤ −2.78
𝑠Τ 𝑛
ത 0
𝑋−𝜇
Dado que ∼ 𝑇 𝑛−1 𝑔𝑙
𝑠Τ 𝑛
ത 0
𝑋−𝜇 ത 0
𝑋−𝜇
Valor P=2 P ≤ −2.78 = 2𝑃 ≥ 2.78 =
𝑠Τ 𝑛 𝑠Τ 𝑛
2 *0.005=0.01
Rechazamos 𝐻0
V. TEST T PARA MEDIAS
Test T para medias de una cola
TEST DE UNA COLA: ZONA DE RECHAZO
– H0: 𝜇 = 𝜇0
H1: 𝜇 > 𝜇0 H1: 𝜇 < 𝜇0
ത 0
𝑋−𝜇
𝑆𝑖 𝐻0 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎, ∼ 𝑇 𝑛−1 𝑔𝑙
𝑠Τ 𝑛

Zona de Rechazo:
ത 0
𝑋−𝜇 𝑛−1 𝑔𝑙 ത 0
𝑋−𝜇 𝑛−1 𝑔𝑙
>𝑇𝛼 <-𝑇𝛼
𝑠Τ 𝑛 𝑠Τ 𝑛
V. TEST T PARA MEDIAS
Test T para medias de una cola
TEST DE UNA COLA: ZONA DE RECHAZO
– H0: 𝜇 = 23
H1: 𝜇 > 23 H1: 𝜇 < 23
ത 0
𝑋−𝜇
𝑆𝑖 𝐻0 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎, ∼ 𝑇 𝑛−1 𝑔𝑙
𝑠Τ 𝑛
Siendo 𝑋ത = 22, 𝑠 = 2, 𝑛 = 30 y a=5%
ത 0
𝑋−𝜇
=-2.78
𝑠Τ 𝑛
29 𝑔𝑙
𝑇𝛼 = (Ver tabla)
V. TEST T PARA MEDIAS
Test T para medias de una cola
TEST DE UNA COLA: ZONA DE RECHAZO
– H0: 𝜇 = 23
H1: 𝜇 > 23 H1: 𝜇 < 23
ത 0
𝑋−𝜇
𝑆𝑖 𝐻0 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎, ∼ 𝑇 𝑛−1 𝑔𝑙
𝑠Τ 𝑛
Siendo 𝑋ത = 22, 𝑠 = 2, 𝑛 = 30 y a=5%
ത 0
𝑋−𝜇
=-2.78
𝑠Τ 𝑛
29 𝑔𝑙
𝑇𝛼 = 1.699
ത 0
𝑋−𝜇 𝑛−1 𝑔𝑙 ത 0
𝑋−𝜇 𝑛−1 𝑔𝑙
>𝑇𝛼 <-𝑇𝛼
𝑠Τ 𝑛 𝑠Τ 𝑛
No se rechaza H0 Se rechaza H0
V. TEST T PARA MEDIAS
Test T para medias de una cola
TEST DE UNA COLA: VALOR P
H0: 𝜇 = 𝜇0 =23
H1: 𝜇 > 𝜇0 =23 H1: 𝜇 < 𝜇0 =23
ത 0
𝑋−𝜇 ത 0
𝑋−𝜇
Valor P= ℙ > 𝑉𝑎𝑙𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 Valor P=ℙ <𝑉𝑎𝑙𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
𝑆𝐸 𝑋ത 𝑆𝐸 𝑋ത
ത 0
𝑋−𝜇 ത 0
𝑋−𝜇
Valor P= ℙ > − 2.78 Valor P=ℙ < − 2.78
𝑆𝐸 𝑋ത 𝑆𝐸 𝑋ത
ത 0
𝑋−𝜇
Dado que ∼ 𝑇 𝑛−1 𝑔𝑙
𝑠Τ 𝑛
Valor P= 𝑉𝑒𝑟 𝑇𝑎𝑏𝑙𝑎 Valor P= 𝑉𝑒𝑟 𝑇𝑎𝑏𝑙𝑎
V. TEST T PARA MEDIAS
Test T para medias de una cola
TEST DE UNA COLA: VALOR P
H0: 𝜇 = 𝜇0 =23
H1: 𝜇 > 𝜇0 =23 H1: 𝜇 < 𝜇0 =23
ത 0
𝑋−𝜇 ത 0
𝑋−𝜇
Valor P= ℙ > 𝑉𝑎𝑙𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 Valor P=ℙ <𝑉𝑎𝑙𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
𝑆𝐸 𝑋ത 𝑆𝐸 𝑋ത
ത 0
𝑋−𝜇 ത 0
𝑋−𝜇
Valor P= ℙ > − 2.78 Valor P=ℙ < − 2.78
𝑆𝐸 𝑋ത 𝑆𝐸 𝑋ത
ത 0
𝑋−𝜇
Dado que ∼ 𝑇 𝑛−1 𝑔𝑙
𝑠Τ 𝑛
Valor P= 0.995 Valor P=0.005
No se rechaza H0 Se rechaza H0
V. TEST T PARA MEDIAS
Test T y Test Z
• Test Z está diseñado para cuando la varianza es conocida,
y por ende el error estándar es conocido. Problema: casi
nunca conocemos la varianza poblacional.  Puede
utilizarse el estimador de la varianza, cuando n es grande.
• Test T está diseñado para cuando la varianza es
desconocida.
• Entonces, si la variable distribuye normal, la varianza es
ത 0
𝑋−𝜇
desconocida y n es grande, ¿ distribuye Normal(0,1)
𝑆𝐸 𝑋ത
o T?
• Para n grande la distribución T converge en la
distribución Z, siendo prácticamente idénticas para
n>30.
V. TEST T PARA MEDIAS
Test T y normalidad
• Una técnica estadística es robusta cuando funciona de
forma adecuada incluso cuando se violan ciertos
supuestos.

• El Test T es robusto a las violaciones al supuesto de


normalidad, cuando n>15.

• El Test T NO es robusto a la violación del supuesto de


muestra probabilística.
VI. Test binomial para
proporciones
VI. TEST BINOMIAL PARA PROPORCIONES
Test Binomial para proporciones
Test de hipótesis no paramétrico para evaluar hipótesis sobre el
valor de una proporción (porcentaje) poblacional (parámetro)

SUPUESTOS:
– Variable categórica
– Muestra aleatoria

HIPÓTESIS:
– H0: 𝑝 = 𝑝0
– H1: 𝑝 ≠ 𝑝0 (Prueba de dos colas)
– H1: 𝑝 > 𝑝0 (Prueba de una cola)
– H1: 𝑝 < 𝑝0 (Prueba de una cola)
VI. TEST BINOMIAL PARA PROPORCIONES
Estadístico y distribución nula en Test
Binomial para proporciones

La variable X= cantidad de
veces que ocurre el suceso A,
en un total de n veces,
distribuye binomial (B(n,p)),
donde p es la proporción
poblacional del suceso A.

𝑆𝑖 𝐻0 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎,
𝑋 ∼ 𝐵(𝑛, 𝑝0 )
VI. TEST BINOMIAL PARA PROPORCIONES
Test Binomial para proporciones de dos
colas
TEST DE DOS COLAS: VALOR P
H0: 𝑝 = 𝑝0 H1: 𝑝 ≠ 𝑝0
Si 𝑝ҧ <𝑝0 :
Valor P= 2ℙ 𝑋 ≤ 𝑉𝑎𝑙𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙

Si 𝑝ҧ >𝑝0 :
Valor P= 2ℙ 𝑋 ≥ 𝑉𝑎𝑙𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
VI. TEST BINOMIAL PARA PROPORCIONES
Test Binomial para proporciones de dos
colas
VI. TEST BINOMIAL PARA PROPORCIONES
Test Binomial para proporciones de dos
colas
EJEMPLO
H0: 𝑝 = 0.5 H1: 𝑝 ≠ 0.5

X: cantidad de veces que se eligió a un hombre para el


entrenamiento=9
Si 𝐻0 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎, X~𝐵(10,0.5)
Valor P= 2ℙ 𝑋 ≥ 𝑉𝑎𝑙𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙

Valor P= 2(P(9)+P(10))=
P(9)+P(10)+P(1)+P(0)=
2(0.001 + 0.01)=0.022
Con 5% de significancia, se
rechaza H0
VI. TEST BINOMIAL PARA PROPORCIONES
Test Binomial para proporciones de una
cola
VALOR P
H0: 𝑝 = 𝑝0
H1: 𝑝 > 𝑝0 H1: 𝑝 < 𝑝0
Valor P= ℙ 𝑋 ≥ 𝑉𝑎𝑙𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 Valor P=ℙ 𝑋 ≤ 𝑉𝑎𝑙𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
VI. TEST BINOMIAL PARA PROPORCIONES
Test Binomial para proporciones de una
cola
VALOR P
H0: 𝑝=50%
H1: 𝑝 >50% H1: 𝑝 <50%
Valor P= ℙ 𝑋 ≥ 𝑉𝑎𝑙𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 Valor P=ℙ 𝑋 ≤ 𝑉𝑎𝑙𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
Valor P= 𝑃 9 + 𝑃 10 Valor P=𝑃 0 + ⋯ + 𝑃(9)
Valor P=0,001+0,01=0,011 Valor P=0,999
Se Rechaza H0 No se Rechaza H0
EJERCICIOS
Considere una muestra probabilística de chilenos con los
siguientes datos:
n 10
Promedio de tamaño del hogar (n° personas) 4
Desviación estándar de tamaño del hogar 1.3
Proporción de personas que viven en 20%
condiciones de hacinamiento
Realice test de hipótesis para probar las siguientes hipótesis con
1% de significancia: defina las hipótesis nula y alternativa, indique
qué test utilizará y porqué, refiérase al cumplimiento de los
supuestos del test, determine el estadístico del test y la
distribución nula, estime el estadístico y el valor P, interprete
estadística y sociológicamente sus resultados. Suponga que el
número de hogares distribuye normal.
1. La minoría de chilenos viven hacinados.
2. Los chilenos viven en hogares de 3 miembros promedio.
3. Los chilenos viven en hogares de más de 5 miembros
promedio.
PREGUNTAS
Indique para las siguientes situaciones que test de hipótesis
recomendaría y por qué.
4. Un grupo de investigadores realizó una encuesta con una
muestra probabilística a 20 chilenos para estimar la pobreza, y
quieren probar la hipótesis de que la pobreza es inferior al 10%.
5. Un investigador realizó una encuesta a 30 mujeres
embarazadas, preguntándoles si, tras tomarse una ecografía, el
médico les preguntó si quería saber si su hijo tenía alguna
malformación. Quiere probar la hipótesis de que a la minoría de
las mujeres no se les realiza esta pregunta, pero la variable no
distribuye normal.
6. Un investigador realizó una encuesta a 30 estudiantes de JGM
sobre la cantidad de litros de cerveza consumidos durante la fiesta
mechona. Quiere probar la hipótesis de que el consumo promedio
es superior a 1 litro, sabiendo que la variable distribuye normal.
INTRODUCCIÓN
Contenidos
I. Test de hipótesis
hipótesis para
parauna
unapoblación
población
II. Test Z para medias: Estadísticos, supuestos y
PARTE I

distribución nula.
III. Test Z para proporciones: Estadísticos, supuestos y
distribución nula.
IV. Relación entre pruebas de hipótesis e intervalos de
confianza.
PARTE II

V. Test T parapara medias:


medias: Estadísticos,
Estadísticos, supuestos,
distribución nula.
distribución nula. Relación
RelaciónTest
TestTTyyTest
TestZ.Z.
VI. Test Binomial para proporciones:
proporciones: Estadísticos,
Estadísticos,
supuestos yy distribución
distribuciónnula.
nula.
VII. Pruebas de hipótesis para mediana.
PARTE III

VIII. Pruebas de hipótesis de distribución de variables:


normalidad, simetría y curtosis.

S-ar putea să vă placă și