Sunteți pe pagina 1din 9

SEGUNDA ENTREGA ESTADÍSTICA II

TRABAJO COLABORATIVO

VANESSA MONSALVE CADAVID

OLGA LUCIA SEQUERA VERGARA

ALISSON BRENDA FIGUEREDO AVILAN

NATALIE PRISCO CANDELA

JONATHAN JIMENEZ MEJIA

ESTADÍSTICA II SUBGRUPO 12

TUTOR: DIANA VELASQUEZ

ADMINISTRACION DE EMPRESAS

POLITECNICO GRANCOLOMBIANO

JUNIO DE 2019

BOGOTÁ
Trabajo Colaborativo Estadística II

A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares (GEIH),


realizada por el DANE[1]. Esta encuesta se hace en las 13 ciudades principales de
Colombia (Bogotá, Medellín, Cali, barranquilla, Bucaramanga, Manizales, Pasto, Pereira,
Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y 11 ciudades intermedias (Tunja,
Florencia, Popayán, Valledupar, Quibdó, Neiva, Riohacha, Santa Marta, Armenia,
Sincelejo, San Andrés). Esta encuesta, se solicita información sobre las condiciones de
empleo de las personas (si trabajan, en qué trabajan, cuánto ganan, si tienen seguridad
social en salud o si están buscando empleo), además de las características generales de la
población como sexo, edad, estado civil y nivel educativo, se pregunta sobre sus fuentes de
ingresos. La GEIH proporciona al país información a nivel nacional, cabecera - resto,
regional, departamental, y para cada una de las capitales de los departamentos.

Base de datos: en el archivo de Excel ( https://goo.gl/zB3Ntf ) se tiene información sobre


las características generales de las personas que respondieron en un mes en particular. Para
este trabajo colaborativo, realice lo siguiente:

Parte 1 Semana 3

Selección de muestra

1. En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los


elementos de una población), se selecciona una muestra, entendiendo por tal una parte
representativa de la población. En ese sentido, escoja un tipo de muestreo y argumente
la viabilidad de esta técnica para la base de datos dada. Para seleccionar una muestra
debe tenerse en cuenta el cómo seleccionar los elementos que formarán parte de la
muestra (tipo de muestreo) y cuántos elementos debemos seleccionar (Tamaño de
muestra).
2. Utilizando la variable género P(6020) determine el tamaño de la muestra
seleccionando adecuadamente justificando:
a. Fórmula a desarrollar
b. Estimación de la proporción de mujeres
c. Nivel de confiabilidad
d. Error de estimación

SOLUCIÓN

Selección de muestra:
 Para la selección de los elementos yo sugiero el muestreo estratificado ya que la
población se puede dividir en dos grupos heterogéneos, es decir, distintos que son
los hombres y las mujeres.
 El género define una característica única en cada persona y según la cartilla s1 es
necesario que cada individuo tenga una característica que no le permita
permanecerá otro estrato. Es decir, si se es hombre no podría categorizarse al mismo
tiempo como mujer.
 Si se va a usar este tipo de muestreo es necesario que tengamos en cuenta la
cantidad de hombres y mujeres de la población (base de datos).
Mujeres: 31.969
Hombres: 28.387
Total: 60.356
 La selección de mujeres y de hombres deberá ser proporcional a estas cantidades,
según la fórmula del documento necesitamos el total de cada estrato (31.969 y
28.387; N₁ y N₂), el total de la población (60.356; N) y el tamaño de la muestra (n)
𝑁𝑖
𝑛𝑖 = 𝑛
𝑁
Nos falta el tamaño de la muestra, está la podríamos hallar con la formula
𝑁𝑧² 𝑝𝑞
𝑛=
(𝑁 − 1)𝐸 2 + 𝑍 2 𝑝𝑞
Se conoce el tamaño de la población, como en este caso que es 60.356
𝐴
 Podemos definir P como la proporción de mujeres y calcular con la formula P= 𝑁

(A seria la cantidad de mujeres encuestadas). Para los hombres q seria 1-P.


31969
 P= 60356 P= 0,53 q= 1-0,53 q= 0,47

 Para el nivel de confiabilidad sugiero el 95% que nos daría según la distribución
normal un valor Z= 1,96 (esto dado que al ser una población grande la muestra será
mayor a 30 y su distribución se aproxima a una normal según teorema del límite
central).

 Para el error de estimación podemos usar el margen del 5% (0,05) que es el límite
contrato el nivel de confiabilidad es del 95%; así la muestra será representativa.

 Hallemos entonces el tamaño de la muestra:

𝑁 𝑍 2𝑝 𝑞
n= (𝑁−1)𝐸 2 +𝑍 2 𝑝 𝑞

(60356)(1,96)²(0,53)(0,47)
n= (60356−1)(0,05)²+(1,96)²(0,53)(0,47)

(60356)(3,84)(0,53)(0,47)
n= (60355)(0,0025)+(3,84)(0,53)(0,47)

57733,17
n= 150,89+0,97

57733,17
n= 151,86

n= 380,17 ≈ 381 personas para la muestra

 De esas 381 personas se debe hacer una selección proporcional de hombres y


mujeres según el muestreo estratificado.

𝑁𝑖
𝑛𝑖 = 𝑛
𝑁
MUJERES HOMBRES

31969 28387
n₁= 381 (60356) n₂= 381 (60356)

n₁= 381 (0,53) n₂= 381(0,47)

n₁= 201,93 ≈ 202 n²= 179,07

n₁+n₂= n

202+179= 381 con esto se demuestra que el muestreo estará completo.

 ¿Cómo escogemos esas 202 mujeres y esos 179 hombres?


R/ Aplicando un muestreo aleatorio simple en cada grupo (estrato) usando los pasos
de la cartilla 1.
Semana 4

Intervalo de confianza para dos variables numéricas


Un investigador, cree determinar que existen diferencias entre los niveles de estudio
de los hombres y las mujeres en Colombia. Para determinar lo anterior, use la
“muestra” encontrada en la semana 3:

1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un


histograma para los hombres y mujeres. Según los resultados, ¿Existen diferencias?
2. Asumiendo que los datos son normales, calcule un intervalo de confianza del
95% para estimar, la escolaridad promedio de los hombres y de las mujeres de
forma individual, en los niveles de estudio de Bachiller, Tecnólogo y Universitario.
3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al
95% para estimar la diferencia promedio de escolaridad para los hombres y mujeres,
en los niveles de estudio de Bachiller, Tecnólogo y Universitario.

Solución

 Es necesario que realicemos el muestreo aleatorio simple en hombres y mujeres de


las bases de datos para realizar los análisis y gráficos (histogramas que nos piden.
Estuve viendo algunos videos de cómo hacerlo y estos son los gráficos que pude
construir)
 Según estas imágenes parece que si hay diferencias en los grados de escolaridad de
hombres y mujeres. Se puede observar que las mujeres no tienen representación en
grados de escolaridad después del valor 18.

 Aunque ambos presentan su mayor valor en el grado de escolaridad 11, los hombres
parecen desertar de sus actividades también en grados inferiores con mayor
frecuencia, si consideramos que en la muestra tenemos menos hombres.
 Vamos a seguir los pasos de la cartilla s3; para hallar el intervalo de confianza de
95% tendríamos que el nivel alfa es del 5% (100% - 95%) este valor debe dividirse
a la mitad, por lo tanto tenemos un valor de 2.5%.

 Al restar con el 50% nos queda 47.5% en decimal seria 0,475 y este es el valor que

debemos buscar en la tabla Z. según la tabla Z 2 = 1,96

 Ahora el intervalo de confianza será:

∝ 𝑝̂ (1−𝑝̂ ) ∝ 𝑝̂ (1−𝑝̂ )
𝑝̂ - Z 2 √ < P < 𝑝̂ + Z 2 √
𝑛 𝑛

¿Qué seria 𝑝̂ ?

 El valor que calculamos de la proporción de mujeres nos había dado 0,53 y 1-P =
0,47 era la de hombres.

(0,53)(0,47) (0,53)(0,47)
0,53 – 1,96 √ < P< 0,53 + 1,96 √
60356 60356

0,53 – 0,00398 < P 0,53 + 0,00398


0,526 < P < 0,533

 Lo mismo se hace si P es el valor de la proporción de hombres:


(0,47)(0,53) (0,47)(0,53)
0,47 – 1,96 √ < P< 0,47 + 1,96 √
60356 60356

0,47 – 0,00398 < P < 0,47 + 0,00398


0,466 < P< 0,474
 Entonces la proporción de hombres esta entre el 46,6% y el 47,4% y la de las
mujeres esta entre el 52,6% y el 53,3%.

S-ar putea să vă placă și