Documente Academic
Documente Profesional
Documente Cultură
CÁTEDRA I
UNIDAD 6
UNIDAD 6:
Muestreo. Prueba de hipótesis.
Contenidos
aleatorias.
intervalos de confianza.
MUESTREO
IMPORTANCIA
De cómo se seleccionen las unidades de observación depende la calidad de la información que se
recoja. Por eso deben invertirse el tiempo y el esfuerzo necesarios en la planificación y ejecución del
diseño de la muestra.
MARCO DE MUESTREO
Es el listado que comprende las unidades de la población. Se utiliza para buscar la documentación que
ayuda a la identificación de la población de estudio. Sus requisitos son:
comprehensividad
actualización
sin duplicidad
sin unidades que no pertenezcan a la población que se analiza
con información suplementaria que ayude a la localización de las unidades.
fácil de utilizar
TAMAÑO DE LA MUESTRA
Está determinado por los siguientes factores:
Tiempo y recursos disponibles.
Modalidad de muestreo seleccionada.
Tipo de análisis de datos previstos.
Varianza poblacional.
Error máximo admisible para la estimación de los parámetros.
Nivel de confianza de la estimación.
ERROR MUESTRAL
Es la diferencia existente entre las estimaciones (obtenidas a partir de la muestra) y los parámetros
(características poblacionales). Una estimación es más precisa cuando su error muestral es menor.
NIVEL DE CONFIANZA: Expresa el grado de confianza que el investigador tiene en que su
estimación se ajuste a la realidad. Proviene del nivel de probabilidad utilizado en el método de
estimación.
Cada unidad tiene una probabilidad igual (o establecida a priori) de ser seleccionada para la
muestra.
La elección de cada unidad es independiente de las demás.
Permite controlar el error muestral.
Que algunas unidades de la población tengan mayor probabilidad que otras de ser
seleccionadas para la muestra.
Dificultad para calcular el error muestral.
Introducción de sesgos.
Laura Matías
Inés
Claudia
X: “Cantidad de sesiones semanales de Terapia que recibe
la persona elegida”
1 3
1 2
=(1+1+2+3)/4 =1.75
Promedio
Luego X es un estimador insesgado de 1.75 0.6875
Varianza 0.34375
0.6211
Se cumple que: μX μ y
σ 2X σ 2 / n , o sea σ X σ / n
Error típico
de la media
α c
Zona de Rechazo
o Región crítica
c α/2
α/2
Contiene los valores poco
probables de ocurrir si H0
es verdadera. c1 c2
Regla de Decisión
¿Qué puede
ocurrir con la H0 es verdadera H0 es Falsa
decisión?
Rechazo H0
Decisión
Error de Tipo I Decisión Correcta
No Rechazo H0
Decisión Correcta Error de Tipo II
H0: µ µ0
Bajo H0 : X N 0 ; n Bajo H0 : Z
X - μ0
σ n
N0,1
2.- Plantear las hipótesis: Hipótesis nula e Hipótesis alternativa. [Mencionar los supuestos
necesarios para realizar la prueba de hipótesis]
5.- Realizar cálculos: (1) obtener el valor observado del estadístico de prueba,
(2) precisar la zona de rechazo o calcular el valor p.
Supuestos necesarios
*En todas las pruebas de hipótesis la/s muestra/s debe/n ser aleatoria/s.
*En las pruebas para la media, o para la diferencia de medias, las poblaciones de observaciones
intervinientes tienen que estar normalmente distribuidas o bien contar con tamaños suficientemente grandes
que aseguren la normalidad de la respectiva variable Media Muestral por el Teorema Central del Límite.
*En las pruebas para una proporción o diferencia de proporciones, la cantidad de observaciones debe ser
grande, las observaciones independientes y con la misma probabilidad de éxito.
Problema 1
Una muestra de 23 adultos del municipio A obtuvo, este año, una media de 34
en el estilo de humor Mejoramiento Personal de la Escala Sentido del Humor
(Casullo, 2004). Según investigaciones realizadas anteriormente se sostiene que,
a nivel poblacional, esas puntuaciones estaban normalmente distribuidas con
media 32 y desvío 3.
α 0,05
(2) Se opta por precisar la zona de rechazo.
-3 -2 -1
32
0 xc=33,03
1 2
X
3
La zona de rechazo son los valores del estadístico de prueba X mayores que 33,03.
6 Establecer la Regla de Decisión y formular la decisión en base a la información
muestral.
α 0.05
-3 -2 -1
00 Z1 c=1.642 Z3
Pues que el valor p sea menor que el nivel de significación es equivalente a que el
valor observado del estadístico de prueba pertenezca a la zona de rechazo de H0.
OTRA FORMA: Si se utiliza el cálculo el valor p en lugar de construir la zona de rechazo
Las acciones 1 a 5-(1) y la conclusión (acción 7) son idénticas a las de los desarrollos
anteriores. Veamos las acciones 5-(2) y 6)
p 0.0007
-3 -2 -1 0 1 2 3
de Excel 0.0007=1-DISTR.NORM(34;32;3/RAIZ(23);1)
Establecer la Regla de Decisión y formular la decisión en base a la información
6 muestral.
X 0
t Bajo H0 se distribuye como una t de Student
µµ0 con n-1 grados de libertad
s/ n
Problema 2
Se administró la Escala sobre Sentido del Humor a 6 adultos de la ciudad
de Rosario resultando las siguientes puntuaciones en Descalificación
Personal: 23-13-16-28-21-14. Con un nivel de significación del 1% puede
afirmarse que la media de esta muestra difiere significativamente de la
media de Descalificación Personal de los adultos con que se construyó la
base de datos Psicología y Humor? Considere a ésta última como
poblacional.
Statistix 8.0
One-Sample T Test
33 26 29 27 9 20 31 38 22 13 34 25 34 19 19 23 27 24 26
22 28 43 22 21 19
One-Sample T Test
Null Hypothesis: mu = 28
Alternative Hyp: mu < 28
95% Conf Interval
Variable Mean SE Lower Upper T DF P
AF 25.360 1.5098 22.244 28.476 -1.75 24 0.0466
H0: 1-2=d
El Estadístico de Prueba es
t=
(X 1
- X2 ) - d
donde s
2 n1 1s12 n2
1s22
c
1 1 n1 n2 2
Sc2 ( + )
n1 n2
Bajo H0
1-2=d se distribuye como una t de Student con n1+n2-2 grados de
libertad
Problema 4
Se ha realizado un estudio acerca de los factores psicosociales que intervienen en el
Grupo 1: 39 36 40 35 34 37 31 32 32 36
Grupo 2: 34 33 36 38 35 32 35 30 36 32
Ponga a prueba la hipótesis de que el nivel medio de ansiedad rasgo difiere entre
estos dos grupos de adolescentes. Se supone que los puntajes de ansiedad rasgo se
hipotéticas de las que estas muestras provienen. Usar un nivel de significación del 5%.
Statistix 8.0
Variable Mean N SD SE
Grupo1 35.200 10 3.0111 0.9522
Grupo2 34.100 10 2.3781 0.7520
Difference 1.1000
El Estadístico de Prueba es
p 0 Bajo H0
Z
0 1 0 / n 0
Se distribuye como una normal estándar
p1 p2 n1p1 n 2 p 2
Z donde p c
pc 1 pc 1 n1 1 n2 n1 n 2
Bajo H0
12 Se distribuye como una normal estándar
Problema 5
Sample Size 80
Successes 68
Proportion 0.85000
Difference 0.10000
Standard Error 0.03992
Z (uncorrected) 2.07 P 0.0194
Z (corrected) 1.94 P 0.0264
Sample 1 Sample 2
Sample Size 200 400
Successes 84 220
Proportion 0.42000 0.55000
Null Hypothesis: P1 = P2
Alternative Hyp: P1 < P2
Difference -0.13000
SE (diff) 0.04330
Z (uncorrected) -3.00 P 0.0013
Z (corrected) -2.92 P 0.0018