Documente Academic
Documente Profesional
Documente Cultură
Estadística II
Modalidad Virtual
Contexto
A continuación, se tiene la información de la Gran encuesta integrada de Hogares (GEIH), realizada por el DANE [1].
Esta encuesta se hace en las 13 ciudades principales del Colombia
(Bogota,Medellin,cali,barranquilla,Bucaramanga,manizalez,pasto,Pereira,ibague,cucuta,villavivencio,montería,Cartagena)
y 11 ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva, Riohacha, Santa Marta, Armenia,
Sincelejo, San Andrés). Esta encuesta, se solicita información sobre las condiciones de empleo de las personas (Si
trabajan, en que trabajan, cuánto ganan, si tienen seguridad social en salud o si están buscando empleo), además de las
características generales de la población como sexo, edad, estado civil y nivel educativo, se pregunta sobre sus fuentes
de ingresos. La GEIH proporciona al país información a nivel nacional, cabecera resto, regional, departamental, y para
cada una de las capitales de los departamentos.
Parte 1.
Tamaño de Muestra
RANGO 101
INTERVALOS 20,7
AMPLITUD 5
Definimos el inicio y el fin de cada intervalo, en el primer caso vemos que el primer intervalo inicia en 0 y termina
en 5, después definimos la frecuencia que es la cantidad de datos que están entre cada intervalo.
HISTOGRAMA
6000
5000
4000
3000
2000
1000
0
5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 105
CURTOSIS -1,2
Se trata de una platicurtica y hay una menor concentración de datos en torno a la media
Realice una descripción numérica y descripción como es la población.
DESCRIPCION NUMERICA:
CANTIDAD DE DATOS 60356
SUMATORIA 1869360
MEDIA 30,97
MODA 11,00
VARIANZA 430,77
DESVIACION 20,75
DESCRIPCION POBLACION: la mayoría de la población del censo se encuentra entre los 15 y 25 años de edad, se
evidencia que hay muchas más personas jóvenes que ancianos.
Calcule una nueva variable que sea el P6040 new = P6040 2/3
Tomamos cada uno de los datos de la columna P6040 y lo elevamos a la 2/3 como se ilustra en la siguiente imagen.
P6040 P6040new
2 1,59 primer dato
60 15,33 último dato
Teniendo en cuenta la variable anterior realice el cálculo del tamaño de muestra, utilizando la siguiente
formula:
Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95% y un margen de error absoluto que
no supere 0,5.
=+DESVEST.P(B2:B60358)
cuantil Z 1,96
Hallamos la muestra
˳
n : (1,96²)*(4,57²) = 65493,8316
0,035²
n: 65493.8316 = 31410
1+(65493.8316/60358)
Teniendo en cuenta los resultados anteriores, realice una selección de elementos para una muestra,
utilizando el algoritmo del coordinado negativo.
P6040new aleatorio
7,61 37059
16,98 7704
12,84 54518
3,30 14431
2,52 9620
4,00 39878
14,29 42051
17,63 20666
8,55 2896
8,78 25134
Código: 1721981807