Sunteți pe pagina 1din 9

(semana 3) Selección de muestra

1. En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos
de una población), se selecciona una muestra, entendiendo por tal una parte representativa de la
población. En ese sentido, escoja un tipo de muestreo y argumente la viabilidad de esta técnica para
la base de datos dada. Para seleccionar una muestra debe tenerse en cuenta el cómo seleccionar
los elementos que formarán parte de la muestra (tipo de muestreo) y cuántos elementos debemos
seleccionar (Tamaño de muestra).

Para este caso se escoge un tipo de muestreo aleatorio y probabilístico debido a que es uno de los
mas confiables y utilizados en estudios estadísticos, por otro lado comprende que aquí todos los
sujetos o elementos de la población pueden pasar a formar parte de la muestra, pues tienen la misma
probabilidad de ser escogidos, lo cual es bueno debido a que considera que cada uno de los
elementos de la población pueden llegar a ser parte de la muestra.

Siendo esto así

2. Utilizando la variable género P(6020) determine el tamaño de la muestra seleccionando


adecuadamente justificando:
a. Fórmula a desarrollar

N ∗ zα2 ∗ p ∗ q
n=
e2 ∗ (N − 1) + zα2 ∗ p ∗ q

 En donde 𝑛 corresponde al tamaño de muestra buscado


 𝑒 es el error de estimación aceptado
 𝑁 tamaño de la población o universo
 𝑍 parámetro estadístico que depende de nivel de confianza
 𝑝 probabilidad de que ocurra el evento estudiado

b. Estimación de la proporción de mujeres

según lo que se tiene se supone una proporción de mujeres correspondiente al 50%

c. Nivel de confiabilidad

El nivel de confiabilidad en este caso corresponde al 5%


d. Error de estimación
El error de determinación que se asume corresponde a un 2%

De donde si reemplazamos los datos anteriores en la ecuación:

N ∗ zα2 ∗ p ∗ q
n= 2
e ∗ (N − 1) + zα2 ∗ p ∗ q
de donde el n corresponde a:

Dato Valor
N 60.356
Z 1,960
P 50,00%
Q 50,00%
e 2,00%

de lo cual 2309.18

(semana 4) Intervalo de confianza para dos variables numéricas


1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para los
hombres y mujeres. Según los resultados, ¿Existen diferencias?
Mujer
1 806
2 1304
3 1459
4 1140
5 3678
6 1331
7 1461
8 1380
9 1441
10 853
11 6530
12 736
13 1389
14 1068
15 475
16 1719
17 329
18 303
19 68
20 39
21 34
22 14
23 11
24 4
25 3
26 5

Mujeres

6530

3678

1719
1459 1461 1441
1380 1389
1304 1140 1331
806 853 736 1068475 329303 68 39 34 14 11 4 3 5

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

Hombres
1 798
2 1211
3 1340
4 1106
5 3155
6 1278
7 1355
8 1261
9 1244
10 752
11 5624
12 589
13 955
14 833
15 393
16 1371
17 271
18 268
19 97
20 37
21 41
22 20
23 16
24 6
25 4
26 13

Si existen diferencias entre la escolaridad de los hombres y mujeres y eso se observa de


manera gráfica gracias a los histogramas

2. Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% para
estimar, la escolaridad promedio de los hombres y de las mujeres de forma individual, en los
niveles de estudio de Bachiller, Tecnólogo y Universitario.

Para esto se plantea un intervalo de confianza de proporción para hombre y mujeres y en


cada uno de los casos de bachiller, tecnólogo y universitario.

Para todos se calcula un intervalo de confianza del 95%, de donde 𝑧𝛼 = 1.96


2
Se utiliza la siguiente ecuación para el intervalo de confianza
𝑝̅ (1 − 𝑝̅ )
𝑝̅ ± 𝑧𝛼 √
2 𝑛
Los datos se toman de la base de datos dados en el Excel

Mujeres:
Bachiller

𝑝̅ = 0.13
0.13(1 − 0.13)
0.13 ± 1.96√
2309

0.13 ± 0.013

Tecnólogo

𝑝̅ = 0.04
0.04(1 − 0.04)
0.04 ± 1.96√
2309

0.04 ± 0.0076
Universitario

𝑝̅ = 0.03
0.03(1 − 0.03)
0.03 ± 1.96√
2309

0.03 ± 0.0069

Hombres:
Bachiller

𝑝̅ = 0.12
0.12(1 − 0.12)
0.13 ± 1.96√
2309
0.12 ± 0.013

Tecnólogo

𝑝̅ = 0.02
0.02(1 − 0.02)
0.02 ± 1.96√
2309

0.04 ± 0.0062
Universitario

𝑝̅ = 0.02
0.02(1 − 0.02)
0.02 ± 1.96√
2309

0.02 ± 0.0062

3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para
estimar la diferencia promedio de escolaridad para los hombres y mujeres, en los niveles de
estudio de Bachiller, Tecnólogo y Universitario.

Para esto se utiliza la siguiente formula

̅̅̅̅(1 − 𝑝̅ 1) 𝑝2
𝑝1 ̅̅̅̅(1 − 𝑝̅ 2)
𝑝̅ 1 − 𝑝̅ 1 ± 𝑧𝛼 √ +
2 𝑛 𝑛

Bachiller

0.13(1 − 0.13) 0.12(1 − 0.12)


(0.13 − 0.12) ± 1.96√ +
1119 1190

0.13(1 − 0.13) 0.12(1 − 0.12)


(0.01) ± 1.96√ +
1119 1190
(0.01) ± 0.027
Tecnólogo
0.04(1 − 0.04) 0.02(1 − 0.02)
(0.04 − 0.02) ± 1.96√ +
1119 1190

0.04(1 − 0.04) 0.02(1 − 0.02)


(0.02) ± 1.96√ +
1119 1190
(0.02) ± 0.0162
Profesional

0.03(1 − 0.03) 0.02(1 − 0.02)


(0.03 − 0.02) ± 1.96√ +
1119 1190

0.03(1 − 0.03) 0.02(1 − 0.02)


(0.01) ± 1.96√ +
1119 1190
(0.01) ± 0.014

(semana 5) Prueba de hipótesis para dos variables nominales


Bueno según lo que piden en el trabajo y comparando con lo que tu me enviaste( a menos que ese
no sea el trabajo final), *le hace falta en el punto de la semana 3 una mejor argumentación del
porque selecciono el muestreo aleatorio, no se da la confiabilidad ni el tamaño de la muestra a
realizarse*

En el punto 2 lo de la proporción de mujeres ese argumento no es tan convincente, el nivel de


confiabilidad es algo irrisorio, pues un 5% de confiabilidad es lo peor, debe ser de 90% para arriba,
*el error de estimación no lo calcula*, solo lo pone arbitrariamente, el tamaño de la muestra lo
debía mencionar a mi parecer desde el inciso a y expresarlo en palabras, no solo poner el numero y
ya.

lo de la semana 4, *en el histograma le hacen falta las columnas que tiene cualquier histograma de
frecuencias, por lo tanto no puede concluir de manera puntual sobre si existen diferencias o no*,
ademas este histograma se debia realizar con la muestra seleccionada y no la totalidad de los datos,
por ende los puntos 2 y 3 supongo también los tomo asi(por tanto están mal)

Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las mujeres
en Colombia. Para determinar lo anterior, use la “muestra” encontrada en la semana 3:

1. Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y sexo


(P6020), realice un diagrama de barras comparativo para los hombres y mujeres en un solo
gráfico. Según los resultados, ¿Existen diferencias?
Con lo datos suministrados en el Excel y con la muestra ya estimada se tiene que

Histograma

920
849

270 270

HOMBRE SI MUJER SI HOMBRENO MUJER NO

Que según esto en términos estadísticos las diferencias no son so muchas y el comportamiento
entre hombre y mujeres que asisten a un establecimiento oficial no difiere mucho.

2. Con un nivel de confianza del 95%, estime e interprete la proporción de hombres y de mujeres
que asisten a un establecimiento oficial.

Para este se utiliza la siguiente ecuación:

𝑝̅ (1 − 𝑝̅ )
𝑝̅ ± 𝑧𝛼 √
2 𝑛
Para este caso según un nivel de confianza del 95% se tiene que 𝑧𝛼 = 1.96
2
Hombres

𝑝̅ (1 − 𝑝̅ )
𝑝̅ ± 𝑧𝛼 √
2 𝑛
Que según los datos se tiene que

0.77(1 − 0.77)
0.77 ± 1.96√
1190
0.52 ± 0.023
Mujeres

𝑝̅ (1 − 𝑝̅ )
𝑝̅ ± 𝑧𝛼 √
2 𝑛
Que según los datos se tiene que
0.76(1 − 0.76)
0.76 ± 1.96√
1119
0.52 ± 0.025

3. Realice una prueba de hipótesis para determinar la afirmación del investigador. Utilice un nivel
de significancia del 5%. ¿Qué se puede decir de lo anterior?

Para este punto se tiene que la prueba de hipótesis


La hipótesis nula corresponda a:

𝐻0 : 𝑝ℎ = 𝑝𝑚
La hipótesis alternativa corresponde a:
𝐻1 : 𝑝ℎ > 𝑝𝑚
Para este caso se determina el valor estadístico de prueba que corresponde a :

𝑥1 𝑥2
𝑛1 − 𝑛2
𝑍 𝑝𝑟𝑢𝑒𝑏𝑎 =
√𝑝(1 − 𝑝)( 1 + 1 )
𝑛1 𝑛2
Es así que los valores se tienen que:
𝑍 𝑝𝑟𝑢𝑒𝑏𝑎 = 0.81
Como el z para la confianza que se necesita corresponde a 1.64, se puede decir que no se puede
rechazar 𝐻0

S-ar putea să vă placă și