Documente Academic
Documente Profesional
Documente Cultură
POR:
DAVID ANDRÉS BOLAÑOS GARCIA
HANS OLIVER ROJAS VALENCIA
Para poder estudiar con datos fiables estas variables, utilizaremos la base de datos
de la encuesta nacional de calidad de vida – ENCV 2012, realizada por el
Departamento Administrativo Nacional de Estadística - DANE. En esta actividad, nos
basaremos en una muestra de la población de Bogotá, y se compararán diferentes
variables para determinar la relación entre el estrato contra diferentes variables,
además de determinar su relación o la falta de ella en el análisis propuesto. En el
presente trabajo se presentan las gráficas, tablas y el análisis univariado, bivariado y
multivariado realizado. Para el análisis, se tomaron 3 variables categóricas y 3
variables continuas, realizándose análisis continua – continua, continua –categórica
y categórica – categórica.
Los datos fueron tomados de la encuesta nacional de calidad de vida – ENCV 2012,
obtenidos en la ciudad de Bogotá a partir de una encuesta realizada a 1789 hogares
(individuos). La Encuesta de Calidad de Vida (ECV) tiene como objetivo la
investigación multidimensional del bienestar de los hogares, su unidad de análisis
son las viviendas, hogares y personas, el marco muestral fue la población urbana de
Bogotá registrada en el Censo general de población y vivienda de 2005. El tipo de
muestreo utilizado por el DANE, para la ENCV-12, fue probabilístico, estratificado,
multietápico y por conglomerados (DANE, 2010, pg. 6), siendo Bogotá una unidad
primaria de muestreo, sus manzanas las unidades secundarias de muestreo, y áreas
de 10 viviendas en promedio, las unidades terciarias de muestreo. El tamaño de
muestra fue de 10% y el error estándar menor a 5% (DANE, 2010, pg. 7).
Se escogieron variables del capítulo servicios del hogar; que indaga por la
conexión a servicios públicos, privados o comunales, del capítulo de trabajo, que
indaga por las fuentes de ingreso del hogar, y del capítulo de vivienda, que indaga
por las condiciones físicas y económicas de la misma. De todas las variables
generadas por el DANE a partir de la ENCV-12, se escogieron para este ejercicio 3
continuas y 3 discretas. Las tres continuas y su codificación son: ingreso por hogar
(IngHogar), ingreso per cápita (IngPCap) y número de hogares por vivienda
(HogaresViv), donde esta última es una variable de intervalo y las otras dos de
razón. Las tres variables discretas y su codificación son: estrato (Estrato), servicio
de alcantarillado en la vivienda (Alcant) y servicio de recolección de basuras
(Recbas), donde la primera es ordinal y tiene siete categorías (estratos E0 a E6) y
las otras dos variables son dicotómicas y tienen dos categorías (Si o No).
4. METODOLOGÍA
Para llevar a cabo los análisis bivariados entre las variables continuas, se utilizaron
diagramas de dispersión, de densidad, tablas de covarianzas y tablas de correlación;
entre las variables categóricas se usaron tablas de contingencia, medidas de
asociación y valores Test; mientras que entre las variables continuas y categóricas
se emplearon diagramas de caja, razones de correlación y valores test.
Se selecciona el directorio donde está ubicado el archivo en formato .txt, para que r
importe los resultados. La función read.table es la encargada de “llamar” los datos
para que sean adoptados por r. Usando View(), se visualizan los datos importados.
Es una manera de confirmar que la información sea la requerida para la actividad.
Hay formas de interpretar la información, pero una de las maneras más útiles de ver
la agrupación de los datos es usando la función quantile(). Esta función me permite
agrupar los datos por percentiles, deciles o cuartiles, dependiendo del análisis que
quiera hacer de los datos. A manera de ejemplo, se usó la función de quantile() para
determinar los cuartiles de los datos de ingreso per capita (IngresoPCap),
obteniendo los siguientes resultados:
Las variables no continuas pueden expresarse de forma gráfica. Esto se hace con la
finalidad de determinar la cantidad de individuos que están en una de las
subcategorías de la variable a analizar. En el caso del ejemplo, se puede determinar
que la mayoría de la población que fue entrevistada en Bogotá (de acuerdo con la
muestra) vive en estratos 2 y 3, mientras que la menor cantidad de la población
entrevistada, vive en estratos altos (estrato 5 y estrato 6). La forma de realizar el
gráfico de barras es utilizando la función barplot().
Otra forma de determinar el comportamiento de los datos, es utilizando el diagrama
de torta. La interpretación del diagrama de torta es similar al diagrama de barras,
solo que se puede determinar el porcentaje de cada una de las variables que se está
interpretando. La función para elaborar un diagrama de torta es pie().
Analizando el gráfico, se determina que tiene una alta asimetría positiva, ya que al
realizar el cálculo, usando la fórmula skewness() nos da un valor de 6.22, además
de observar gráficamente su tendencia asimétrica. Los valores expresados en el
histograma son los esperados, ya que en la sociedad actual, muchas personas
ganas el mínimo o un valor muy cercano, mientras que pocas personas perciben
salarios altos.
En la figura 1 del anexo, se muestran los diagramas de ponqué de las tres variables
categóricas, donde se puede ver que la mayoría de las viviendas encuestadas
pertenecieron a los estratos 2 y 3, en menor medida al 1 y al 4, y unos pocos a los
estratos 5, 6 y 0, pero este resultado no es diciente por si solo ni permite un análisis
en contexto, tal que se realizó un agrupamiento y re-categorización del estrato,
pasando de 6 subgrupos a 3, quedando los estratos 0,1 & 2 en el grupo “bajo”, el
estrato 3 en el grupo “medio”, y los estratos 4,5 & 6 en la categoría “alto” (ver figura
2). Ello nos permitió identificar que en realidad son las viviendas de estrato “bajo” las
más numerosas, representan cerca de la mitad de la muestra, los “estratos medios”
representaron el 40% y los estratos altos, que son minoría, apenas un 13%.
Se comprueba que existe una alta relación lineal entre el ingreso del hogar y el
ingreso per cápita, debido en parte a que el ingreso per cápita se estima a partir de
dividir el ingreso total del hogar por el número de personas en edad de trabajar que
lo componen (DANE, 2012). Además, existen casos donde en el hogar solo hay una
sola persona en edad de trabajar, tal que el valor de sus ingresos per cápita será
exactamente igual al del ingreso del hogar, de ahí que el comportamiento de ambas
variables sea muy similar. Todo esto nos sugiere una concentración de los ingresos
de la población de la ciudad en pocos hogares privilegiados, con valores que son
atípicos para el resto de la población. Sin embargo, no existe crisis de hacinamiento
habitacional en la ciudad, pues la gran mayoría de los hogares de la muestra no
comparte su vivienda con otros hogares, tal que en Bogotá, predomina la vivienda
unifamiliar.
A grandes rasgos, se confirma la relación lineal positiva entre los ingresos per cápita
y la pertenencia en un estrato, salvo excepciones evidenciadas por cada estrato
tratado de manera individual. Igual situación pasa entre las variables ingreso del
hogar y estrato, entre más altos son los valores de la primera variable, más alto será
el estrato en la 2da. Aunque está relación se desdibuja un poco en los diagramas de
dispersión debido al agrupamiento de la variable estrato en 6 o 3 grupos, y por los
valores atípicos en el ingreso, los diagramas de cajas permiten ver está relación con
más claridad. En el contexto, esto implica que a mayores ingresos del hogar o de
sus integrantes en edad de trabajar, estos podrán acceder a viviendas de mayor
estrato. Esta situación repercute en una desigualdad social en cuanto al estrato de la
vivienda, donde la mayoría de la población posee vivienda de estrato 2 o 3 (bajo y
medio-bajo) y muy pocos de 5 y 6 (alto y muy-alto), como lo confirman la varianza y
la desviación estándar que se acercan al 0.
Se halló también que prácticamente todas las viviendas de Bogotá, cuentan con
servicio de alcantarillado y recolección de basuras, sin importar el estrato, los
ingresos del hogar o el número de hogares que convivan en una misma vivienda.
Por lo cual, se puede deducir que estos servicios públicos de carácter sanitario son
prestados por la ciudad, sin atender a la condición socioeconómica de los hogares y
viviendas.
7. REFERENCIAS BIBLIOGRÁFICAS.
8. ANEXO.
Tabla 11. Tabla de contingencia para las variables Estrato y Hogares por vivienda
Tabla 12. Ordenamiento por valores Test entre el estrato, Alcant y RecBas.
Categoria Estrato Test.Value p.Value Class.Cat Cat.Class Global Weight
Alcant.Si Alto 0.310 0.756 13.0 100.0 99.9 1787
RecBas.Si Alto 0.000 1.000 13.0 100.0 100.0 1789
Alcant.No Alto -0.310 0.756 0.0 0.0 0.1 2
Alcant.No1 Bajo 1.231 0.218 100.0 0.2 0.1 2
RecBas.Si1 Bajo 0.000 1.000 46.7 100.0 100.0 1789
Alcant.Si1 Bajo -1.231 0.218 46.7 99.8 99.9 1787
Alcant.Si2 Medio 0.921 0.357 40.3 100.0 99.9 1787
RecBas.Si2 Medio 0.000 1.000 40.2 100.0 100.0 1789
Alcant.No2 Medio -0.921 0.357 0.0 0.0 0.1 2
Figura 15. Distribución de hogares por vivienda respecto a los ingresos per cápita
Figura 16. Perfiles fila y columna del estrato respecto a los ingresos del hogar
recategorizados.
Figura 17. Perfiles fila y columna de los hogares por vivienda respecto al
alcantarillado (gráficas en color negro) y perfiles fila y columna del alcantarillado
respecto a los hogares por vivienda (gráficas en color rojo)
Figura 18. Diagrama de caja y bigotes de los estratos (Sin categorizar) respecto al
ingreso per capita.