Sunteți pe pagina 1din 10

TRABAJO COLABORATIVO ESTADISTICA

Utilizando la variable edad (P6040), realice lo siguiente:

● Realice un histograma y describa la información según la forma y la curtosis de los datos.

● Realice una descripción numérica y descripción como es la población.

LIMITE LÍMITE CLAS FRECUENCI PORCENTAJ FRECUENCIA PORCENTAJ FRECUENCIA


INFERIOR SUPERIOR E A E RELATIVA E ACUMULADA
0 6 3 5819 9,64 0,1 9,64 5819
6 12 9 6520 10,8 0,2 20,44 12339
12 18 15 6906 11,44 0,32 31,89 19245
18 24 21 6712 11,12 0,43 43,01 25957
24 30 27 6041 10,01 0,53 53,02 31998
30 36 33 5135 8,51 0,62 61,52 37133
36 42 39 4607 7,63 0,69 69,16 41740
42 48 45 4713 7,81 0,77 76,97 46453
48 54 51 4240 7,02 0,84 83,99 50693
54 60 57 3191 5,29 0,89 89,28 53884
60 66 63 2313 3,83 0,93 93,11 56197
66 72 69 1675 2,78 0,96 95,88 57872
72 78 75 1279 2,12 0,98 98 59151
78 84 81 717 1,19 0,99 99,19 59868
84 90 87 357 0,59 1 99,78 60225
90 96 93 109 0,18 1 99,96 60334
96 102 99 22 0,04 1 100 60356
Σ 60356

HISTOGRAMA DE EDAD
8000

7000
6906 6712
6000 6520
5819 6041
5000
5135
4000 4607 4713
4240
3000 3191
2000 2313
1675
1000 1279
717
0 357
109 22
6 12 18 24 30 36 42 48 54 60 66 72 78 84 90 96 102
INTERPRETACION DE HISTOGRAMA: Del cuadro anterior se puede inferir que la mayoría de la
escolaridad se encuentran entre las edades de 18 y 24 años, siendo el bloque más representativo,
esto debido a diferentes factores y por el comportamiento de la gráfica donde su amplitud está
dada en las edades menores a 30 años y luego empieza a decrecer conforme avanza, se deduce
que en la actualidad el acceso a la educación es más fácil de como lo era antes.

CURTOSIS

42+ 6 ( 45267−41740
4713 )=¿ per=46.50
25∗60356
Per25= =15089
100

12+6 ( 15089−12339
6906 )=¿ per 25=14.39
90∗60356
Per90 =54320.4
100

per 90 60+6 ( 45320.4−53884


2313 )=¿ per 90 37.79
10∗6.356
Per10 =6035.6
100

per 10 6+ 6 ( 6035.6−5819
6520 )=¿ per 10 6.20
46.50−14.39
k −0.5k =0.51
37.79−6.20
La curtosis tiene un valor de 0.51 lo cual nos da muestra que el comportamiento de la distribución
es platicutica, es decir que los datos esperados no tienen un concentración profunda hacia el
medio de los datos, con lo cual su población es muy dispersa y sus edades muy variantes.
● Calcule una nueva variable que sea el

● Teniendo en cuenta la variable anterior realice el cálculo del tamaño de muestra,

utilizando la siguiente fórmula:

Donde, se tiene lo siguiente:

Z: Es el cuantil de la distribución normal estándar al nivel de significancia que se establezca.

S: Es la desviación estándar de la variable.

Es el margen de error absoluto.

Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95% y un margen de error

de absoluto que no supere 0.5.

TAMAÑO DE LA MUESTRA

Cuantil = 52.490
Desviación = 4.448

Margen de error 0.5

52.4902 4.448 2 2860.18∗19.784 n 56585.80


n0 = =¿ n0 = 0= n0 =226343.20
0.5 2
0.25 0.25

22634.20
n= =¿ 22634.20 22634.20
226343.20 n= =¿n= =¿n=4765.094
1+ 1+3.750 4.75
60356
● Teniendo en cuenta los resultados anteriores, realice una selección de elementos para
una muestra, utilizando el algoritmo del coordinado negativo.

ALGORITMO COORDINADO NEGATIVO


Por medio del algoritmo coordinado negativo se tomó una muestra aleatoria de 4765 datos, los
cuales oscilan datos entre el 0 (edad mínima) y 20 (edad máxima).

min max X f fr F X*F (X-X,)2 (X-X,)2*F


0 1,5 0,75 83 0,02 598 62,25 79,92 6633,47
1,5 3 2,25 319 0,07 917 717,75 55,35 17657,20
3 4,5 3,75 196 0,04 1113 735 35,28 6915,29
4,5 6 5,25 648 0,14 1761 3402 19,71 12773,69
6 7,5 6,75 348 0,07 2109 2349 8,64 3007,72
7,5 9 8,25 644 0,14 2753 5313 2,07 1335,16
9 10,5 9,75 401 0,08 3154 3909,75 0,00 1,45
10,5 12 11,25 611 0,13 3765 6873,75 2,43 1487,17
12 13,5 12,75 307 0,06 4072 3914,25 9,36 2874,86
13,5 15 14,25 615 0,13 4687 8763,75 20,79 12788,77
15 16,5 15,75 210 0,04 4897 3307,5 36,73 7712,28
16,5 18 17,25 273 0,06 5170 4709,25 57,16 15603,45
18 19,5 18,75 75 0,02 5245 1406,25 82,09 6156,44
19,5 21 20,25 35 0,01 5280 708,75 111,52 3903,07
46172,2
4765 5 98850,02

De los datos obtenidos con la selección utilizada tomamos la siguiente información

PROMEDIO 9,69
VARIANZA 20,75
DESVIACION ESTANDAR 4,56
VARIACION RELATIVA 2,14

Compara la media poblacional, con la media muestral y determine la variación relativa.


Haciendo una comparación entre la media poblacional y la media muestral se pudo observar que
en toda la población, como en la muestra seleccionada su edad promedio se encuentra entre los 9
y los 10 años, y por variación relativa de 2.14 lo cual nos dice que para ambos casos hablamos de
datos heterogéneos, que nos muestra una población con edades muy dispersas para el tipo de
estudio analizado.

INTERVALO DE CONFIANZA PARA DOS VARIABLES NUMÉRICAS

Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los
hombres y las mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la base de la
hoja “muestra” y realizar lo siguiente:

● Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para los
hombres y mujeres. Según los resultados, ¿Existen diferencias?

min Max X f fr F
Vacío 0 0 17 0,04 17
0 2,5 1,25 46 0,12 63
2,5 5 3,75 53 0,14 116
5 7,5 6,25 55 0,14 171
7,5 10 8,75 42 0,11 213
10 12,5 11,25 89 0,23 302
12,5 15 13,75 46 0,12 348
15 17,5 16,25 21 0,06 369
17,5 20 18,75 9 0,02 378
20 22,5 21,25 1 0,00 379
22,5 25 23,75 1 0,00 380
380

Histogr am a Hobr e VS Mujer es


100
89
90
80
70
60 53
55
504646
42
40
30
21
2017
9
10
11
0
HombreHombre Mujer Mujer Mujer Mujer Mujer Hombre Mujer Mujer Mujer HombreHombre Mujer Hombre Mujer
El grafico anterior nos da un punto de vista donde los hombres tienden a tener en general un nivel
de estudio por cantidad superior al de las mujeres, es decir su acceso a la educación es superior
por encima del de las mujeres, no obstante si se basa en el nivel alcanzado por número de títulos
se puede apreciar que las mujeres llegan a un nivel de profesionalismo superior siendo el grado
más alto, alcanzado por la misma cantidad, también se observa que el nivel académico por
cantidad de participantes (hombre-mujer) disminuye conforme su complejidad aumenta y que en
los grados básicos es mayor su participación hasta 10, sin embargo también hay un número
considerable de 17 personas que no reportan su grado de conocimiento.

● Teniendo en cuenta lo anterior, realice un estudio descriptivo de ambas variables.


Realice lectura de resultados.

Este estudio nos dice que la posición transversal del nivel académico encontrado para hombres y
mujeres está dada por el tiempo alcanzado en sus niveles académicos, donde el máximo alcanzado
esta entre los grados de 10 a 12 con un nivel de 89 datos, lo cual hace ver que en la educación
media es más accesible por diversos factores como puede ser el acompañamiento de los padres,
así como las políticas de acceso a la educación de primera instancia, los datos en mayoría son
confiables gracias a que su muestra es de 380 participantes de los cuales, solo 17 no cuenta con
registro alguno sin embargo esto solo cumple con el 4.7% de los encuestados el restante 95.3% si
cuentan con información viable de estudiar, al igual entre más especializado sea el grado de
estudio de hombres y mujeres menor es el acceso y esto es deducible por las responsabilidades y
futuros riesgos que tiendes a adquirir a medida que su edad avanza, no obstante si se mide la
información por nivel de complejidad en tiempo vs nivel académico alcanzado se notara que las
mujeres tienden a especializar más sus estudios que los hombres y esto gracias a una dedicación
más exhaustiva por parte de ellas.

De los resultados obtenidos podemos decir que la frecuencia de estudiantes tiende a disminuir
con la complejidad de número de título conseguida y que su pico más alto lo encontramos entre
10 y 12, por otro lado en la educación de entre 2 y 5 se tiene un participación importante de
mujeres, aunque también hay una incidencia de 17 participantes que no se encuentran registros,
es decir aun cuanto hay más hombres que accedieron a una educación temprana que las mujeres,
hay una cuantía de mujeres que no se tiene registro en cifras anteriores a 2 y posteriores a 6, pero
su resultado ya empieza a variar si se observa un nivel de escolaridad superior a 12 llegando a ser
la única que cumple el máximo de datos correspondiente a 24.

● Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% y
determine, la escolaridad de los hombres y de las mujeres de forma individual.

Teniendo en cuenta la escolaridad en mujeres se pudo observar una muestra de 214 estudiantes
de donde se obtuvieron los siguientes datos

Media 10,2380952
varianza 97,4904762
desviación
estándar 9,87372656
tamaño muestra 214
confianza 95%
t 2,257
error 5%

De donde se obtuvo el límite inferior de 8.7 por medio de la operación:

10.2−2.257∗9.873
=8.714
√214
Un límite superior de 11.7 por medio de la operación:

10.2+ 2.257∗9.873
=11.762
√ 214
Nos dice que hay un 95% de confianza que las estudiantes se encuentren entre el grado 8 y 11.

Para los hombres Tomamos los datos de una muestra de 166 participantes

Media 7,95238095
varianza 53,447619
desviación
estándar 7,31078785
tamaño muestra 166
confianza 95%
t 2,262
error 5%

De donde se obtuvo el límite inferior de 6.6 por medio de la operación:

7.952−2.262∗7.310
=6.669
√214
Un límite superior de 9.2 por medio de la operación:

7.952+ 2.262∗7.310
=9.236
√ 214
Nos dice que hay un 95% de confianza que los estudiantes se encuentren entre el grado 6 y 9.

●Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la
diferencia de los niveles de escolaridad para los hombres y mujeres.

Media 17,364
varianza 286,528
desviación 16,927
estándar
tamaño muestra 380
confianza 95%
t 2,250
error 5%

De donde se obtuvo el límite inferior de 6.6 por medio de la operación:

17.364−2.250∗16.927
=15.410
√ 380
Un límite superior de 9.2 por medio de la operación:

17.364+2.250∗16.927
=19.318
√ 380
Nos dice que hay un 95% de confianza que los estudiantes tengan una diferencia de escolaridad
entre 15 y 19.

Parte 2

Prueba de hipótesis para dos variables nominales


Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las
mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la base de la hoja de
“muestra” y realizar lo siguiente:
 Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y
sexo (P6020), realice un diagrama de barras comparativo para los hombres y
mujeres en un solo gráfico. Según los resultados, ¿Existen diferencias?
 Con un nivel de confianza del 95%, realice una estimación de los hombres que
asisten a un establecimiento oficial.
 Con un nivel de confianza del 95%, realice una estimación de las mujeres que
asisten a un establecimiento oficial.
 Realice una prueba de hipótesis para determinar la afirmación del investigador.
Utilice un nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?

HOMBRE MUJER
vacío 122 vacío 159
ingresa 35 ingresa 45
no ingresa 9 no ingresa 10
Ingreso de hombres vs mujeres
180

160
159
140

120
122
100

80

60

40 45
35
20

0 9 10
vacio ingresa no ingresa

Según el grafico anterior podemos determinar que las mujeres cuentan con un ingreso superior al
de los hombres a un colegio oficial, en vez de ser al contrario, no obstante la falta de registros es
evidente viendo que hay más mujeres que no cuentan con reporte de ingreso o no ingreso (159)
mientras que los hombres tienen una falencia de reporte de (122), esto nos da una muestra poco
selectiva y con información poco fiable debido a la falta de datos.

S-ar putea să vă placă și