Sunteți pe pagina 1din 26

Clculo del ndice de Gini

Ing. Byron Humberto Gonzlez Ramrez


byrong.gt@gmail.com http://www.byrong.tk
Publicacin: marzo 2006 Actualizacin: febrero 2009

Tabla de contenido
Presentacin.................................................................................................................... 1 Definicin ........................................................................................................................ 1 Ejemplo de clculo .......................................................................................................... 2 3.1 Descripcin de los datos .......................................................................................... 2 3.2 Clculo del ndice de Gini ......................................................................................... 4 3.3 Clculos usando Excel .............................................................................................. 6 3.3.1 Curva de Lorenz .............................................................................................. 12 3.4 Clculos usando StatsDirect ................................................................................... 18 3.5 Clculos usando CaEst............................................................................................ 21 4 Referencias ................................................................................................................... 24 1 2 3

Ing. Byron Gonzlez http://www.byrong.tk

Presentacin

Como Giles D. (2002) menciona el ndice de Gini ha sido y es probablemente la medida ms usada para medir la desigualdad en los ingresos. Desde su aparecimiento en 1912 este ndice ha sido ampliamente estudiado y modificado por diferentes autores. La ecuacin ms popular actualmente es la propuesta por Brown (1994) y citada por la mayora de instituciones dedicadas a estudios econmicos y demogrficos en Amrica Latina. Enseguida se describe el clculo manual del ndice de Gini y se presenta la manera de calcularlo usando tres alternativas de software. As mismo se describe la construccin de la curva de Lorenz, un grfico desarrollado en 1905 por Max Lorenz para representar la distribucin del ingreso. Ha sido nuestra intencin desarrollar cada uno de los apartados de este documento con la mayor descripcin posible para ayudar en la comprensin y clculo de este ndice. Interpretaciones particulares luego de obtenido el ndice de Gini y la Curva de Lorenz sern necesarios para cada uno de los escenarios sobre los cules se hayan calculado.

Definicin

Para una poblacin determinada este ndice puede oscilar entre cero (0) y uno (1). Tomara un valor de cero cuando todos los integrantes de la poblacin reciben el mismo ingreso. Por el contrario, el uno significa que un miembro o unos pocos perciben todo el ingreso y los restantes nada. Para calcular el ndice de Gini se usa frecuentemente la ecuacin 1, en la que se necesita acumular los valores de ingresos y poblacin estudiados.

donde,

X= proporcin acumulada de la poblacin Y= proporcin acumulada del ingreso

Ecuacin 1:

Relacin entre los ingresos (X) y poblacin (Y) para el clculo del ndice de Gini. Ecuacin propuesta por Brown (1994) y citada en ayudas del software Epidat (2006)

Ing. Byron Gonzlez http://www.byrong.tk

Para facilitar los clculos puede usarse en forma equivalente la ecuacin 2 presentada por Vargas S. En esta ecuacin k est referida al nmero de clases formadas.

` G

(Pi - Qi )
=
i =1

k -1

P
i =1

k -1

= 1

Q P
i =1 i =1 k 1

k 1

Ecuacin 2:

Clculo del ndice de Gini usando distribuciones de frecuencias, citada por Vargas S.

Ejemplo de clculo

3.1

Descripcin de los datos

En la tabla 1 se presentan los ingresos mensuales de jefes de hogares correspondientes a la regin nororiental del pas (datos ficticios). Vamos a realizar los clculos necesarios para el ndice de Gini y medir la desigualdad de los ingresos. Debemos aclarar que el ndice puede ser calculado usando el listado completo de datos o bien conformando grupos. En este caso hemos elegido agrupar los datos. Al respecto Medina F. (2001) menciona que este procedimiento necesariamente conduce a prdida de informacin debido a que los valores individuales de cada observacin son sustituidos por las marcas de cada una de las clases formadas por los ingresos de las personas. Consideramos que en efecto existe una prdida de informacin, que se compensa con la facilidad con que finalmente se realizan los clculos.

Ing. Byron Gonzlez http://www.byrong.tk

Tabla 1:

Ingresos en quetzales de 43 personas residentes en la regin nororiental de Guatemala


persona 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ingreso 3200 1800 1200 600 5000 3000 2700 1360 750 600 150 600 700 100 600 Persona 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 ingreso 600 2500 1500 360 1200 1680 2300 1094 1045 2625 4070 3565 2855 600 600 persona 31 32 33 34 35 36 37 38 39 40 41 42 43 ingreso 600 300 480 480 480 600 720 400 715 960 900 400 600

En la tabla 2 se presentan los valores considerados para construir la tabla de frecuencias. Estos valores fueron obtenidos empleando Excel (ver el apartado 3.3). Tambin aparece el clculo del nmero de clases usando la ecuacin de Sturges1. Se aproxim a 7 clases para facilitar los clculos. Algunos aspectos sobre este tema se mencionan en Levin R. et al (2004). Tabla 2: Valores empleados para construir la tabla de frecuencias
nmero de casos (n) Mximo Mnimo Rango nmero de clases intervalo de clase 43 5000 100 4900 6.44 700

Se emple Excel para construir el histograma y definir las frecuencias de cada clase (Ver apartado 3.2). Las frecuencias calculadas para cada una de las clases definidas se muestran en la tabla 3,

Ecuacin de Sturges: 1+ 3.33 x Log (n)

Ing. Byron Gonzlez http://www.byrong.tk

Tabla 3:

Tabla de frecuencias para los ingresos en quetzales de 43 personas residentes en la regin nororiental de Guatemala
limite inferior 100 800 1500 2200 2900 3600 4300 limite superior 800 1500 2200 2900 3600 4300 5000 marca de clase 450 1150 1850 2550 3250 3950 4650 Frecuencia 23 8 2 5 3 1 1

3.2

Clculo del ndice de Gini

Considerando la ecuacin 1 es necesario calcular la proporcin acumulada de poblacin e ingresos. De la Tabla 3 hemos elegido las marcas de clase de los ingresos y la cantidad de poblacin correspondiente a cada clase. En la tabla 4 se presentan los clculos necesarios para obtener los valores de p y q. El procedimiento general para calcular el ndice de Gini es el siguiente: 1. Calcular el acumulado de poblacin, que se ha indicado en la columna (3). Por ejemplo para calcular el acumulado para la clase 2 es necesario sumar 23+8=31. Para la clase 3 sumar 31+2=33.

2. Calcular el producto entre el ingreso y poblacin para cada una de las clases, que se ha ubicado en la columna (4). Por ejemplo para la clase 4 es necesario multiplicar 2550 x 5 = 12750.

3. Calcular el acumulado del producto entre ingreso y poblacin, que se ha anotado en la columna (5). Por ejemplo para calcular el acumulado de la clase 2 es necesario sumar 10350+9200=19550. Para la clase 3 sumar 19550+3700=23250.

4. Calcular el valor de p. Esto se consigue dividiendo cada uno de los valores de la columna (3) entre el valor de la ltima clase de esa misma columna. Este ltimo valor corresponde al total acumulado de poblacin. Por ejemplo, para la clase 3, p= 33/43 = 0.77.

Ing. Byron Gonzlez http://www.byrong.tk

Tambin es necesario realizar la sumatoria de la columna (6). En este caso el valor corresponde a 4.84. Debe aclararse que no se incluye en la sumatoria el valor de la ltima clase. 5. Calcular el valor de q. Se consigue dividiendo cada uno de los valores de la columna (5) entre el valor de la ltima clase de esa misma columna. Este ltimo valor corresponde al total acumulado. Por ejemplo, para la clase 4, q=36,000/54350=0.66. 6. Calcular la diferencia p-q. Bastar con restar en cada clase el valor correspondiente a p y q. Luego de contar con todos los valores calculados para esta columna, es necesario sumarlos. Para este caso la suma de la columna (8) es de 1.44. 7. Calcular el ndice de Gini. El ndice se obtiene al calcular el cociente entre la suma de p-q y la suma de p. En nuestro caso IG=1.44/4.84 = 0.30. Podemos considerar que el total de ingresos no est concentrado en solo una parte de la poblacin. El nivel de concentracin es relativamente bajo. Tabla 4:
(0) Clase (1) ingresos

Clculos de los valores de p y q para obtener el ndice de Gini


(2) poblacin (3) acumulado de poblacin (4) producto entre ingresos y poblacin (4)=(1)x(2) (5) acumulado del producto entre ingresos y poblacin (6) p (6)=(3)/43 (7) q (7)=(5)/54350 (8) p-q (8)=(6)(7)

1 2 3 4 5 6 7

450 1150 1850 2550 3250 3950 4650

23 8 2 5 3 1 1

23 31 33 38 41 42 43

10350 9200 3700 12750 9750 3950 4650

10350 19550 23250 36000 45750 49700 54350 Suma

0.53 0.72 0.77 0.88 0.95 0.98 1.00 4.84

0.19 0.36 0.43 0.66 0.84 0.91 1.00

0.34 0.36 0.34 0.22 0.11 0.06 1.44

Ing. Byron Gonzlez http://www.byrong.tk

3.3

Clculos usando Excel

Hemos indicado que el ndice de Gini se ha obtenido agrupando los datos de ingresos y luego haciendo los clculos de la frecuencia de poblacin correspondiente a cada uno de los grupos o clases formadas. El procedimiento general para calcular el ndice de Gini usando Excel es el siguiente: 1. Para construir la tabla de frecuencias necesitamos calcular el mximo, mnimo, y el rango como se muestra en la figura 1:

Figura 1: Clculo de los valores mximo, mnimo y rango de los ingresos

2. Es necesario calcular el nmero de clases a formar y el intervalo que tendr cada clase. Hemos usado la ecuacin de Sturges, como se muestra en la figura 2. El intervalo de clase se obtiene dividiendo el rango entre el nmero de clases calculado. Se definieron siete clases.

Figura 2: Clculo del nmero de clases usando la ecuacin de Sturges

Ing. Byron Gonzlez http://www.byrong.tk

3. El intervalo de clase ser de 700 (4900/9=700). Considerando que el valor mnimo es de 100 se inici el primer intervalo de clase usando esta cantidad. Las clases formadas pueden verse en la figura 3. Note que los lmites de cada clase se localizan en celdas distintas.

Figura 3: Definicin de lmites de clase

4. Ahora que disponemos de los lmites de clase necesitamos determinar la cantidad de personas que se ubican en cada una de ellas. Es decir necesitamos construir una tabla de frecuencias. Iremos al men Herramientas, elegiremos Anlisis de datos y enseguida histograma. Esto se muestra en la figura 4.

Figura 4: Calcular tabla de frecuencias usando la funcin histograma

5. En la ventana siguiente se solicita ingresar el Rango de entrada. Esto corresponde a todos los datos de ingresos. Luego solicita el Rango de clases. Aqu indicaremos el rango donde se localizan los lmites superiores de clase. Esto se muestra en la figura 5. Note que al final de esta ventana se ha marcado la opcin Crear grfico. Tambin se ha solicitado crear el histograma y la tabla de frecuencias en una hoja nueva. .

Ing. Byron Gonzlez http://www.byrong.tk

Figura 5: Definicin de datos de entrada y salida para crear la tabla de frecuencias e histograma

6. Como resultado tendremos las frecuencias de cada una de las clases. Ver figura 6(a). Enseguida haremos un reordenamiento de la tabla de frecuencias para trabajar con las marcas de clase y las frecuencias. Ver figura 6(b). De este punto en adelante definiremos a las marcas de clase como ingresos y a la frecuencia como poblacin.

(a)

(b) Figura 6: Tabla de frecuencias calculada

Ing. Byron Gonzlez http://www.byrong.tk

7. Las columnas que se necesitan para calcular el ndice de Gini se muestran en la figura 7.

Figura 7: Columnas necesarias para calcular el ndice de Gini

8. Es necesario calcular el acumulado de poblacin. Observe la funcin usada en la figura 8 para obtener los valores acumulados. Para obtener el resto de valores acumulados copie la funcin al resto de celdas.

Figura 8: Funcin usada para calcular el acumulado de poblacin

9. Para obtener el producto de ingresos y poblacin bastar con multiplicar los valores de las celdas correspondientes. Vea la figura 9.

Figura 9: Producto entre ingresos y poblacin

Ing. Byron Gonzlez http://www.byrong.tk

10

10. Necesitamos calcular el acumulado del producto ingresos*poblacin. Esto se ilustra en la figura 10.

Figura 10: Acumulado del producto entre ingresos y poblacin

11. El valor de p se obtiene de dividir cada uno de los valores acumulados de poblacin entre el gran total de poblacin, como se ilustra en la figura 11.

Figura 11: Clculo de los valores de p

12. El valor de q se obtiene de dividir cada uno de los valores acumulados de ingresos*poblacin entre el gran total de la columna de ingresos*poblacin. Esto se ilustra en la figura 12.

Figura 12: Clculo de los valores de q

Ing. Byron Gonzlez http://www.byrong.tk

11

13. Enseguida se calculan las diferencias de p-q para cada una de las clases. Ver la figura 13.

Figura 13: Clculo de los valores de p-q

14. Sumar los valores para la columna de p. Ver figura 14(a). Tambin sumar los valores de p-q. Ver figura 14 (b). En ambos casos note que se evitan sumar los valores de la unidad.

Figura 14: sumatoria de los valores de p y los valores de p-q

15. Finalmente operamos el cociente entre la sumatoria de p-q y la sumatoria de los valores de p. El resultado corresponde el Indice de Gini. El valor en este caso es igual a 0.30.

Ing. Byron Gonzlez http://www.byrong.tk

12

Figura 15: Clculo del ndice de Gini

3.3.1

Curva de Lorenz

La curva de Lorenz la obtenemos graficando los valores de p y q. Sin embargo, para que el grfico tenga el aspecto deseado es necesario seguir algunos pasos. Procedimiento para obtener la curva de Lorenz usando Excel: 1. A la serie de datos de p y q anteponer valores de cero como se ilustra en la figura 16.

Figura 16: Agregar valores de cero a la serie de datos de p y q

2. Marcar la serie de datos y hacer clic sobre el botn que identifica el asistente de grficos. Elegir un grfico tipo xy . El subtipo debe ser dispersin con puntos de

datos conectados por lneas suavizadas.

Ing. Byron Gonzlez http://www.byrong.tk

13

Figura 17: Elegir el tipo de grfico para la curva de Lorenz

3. Continuar con el asistente de grficos hasta el paso 3. Escribir el ttulo para los ejes X e Y como se indica.

Figura 18: Definir el ttulo de los ejes del grfico

Ing. Byron Gonzlez http://www.byrong.tk

14

4. Ubicar el grfico como objeto en la hoja en uso. Su aspecto no es semejante a la curva de Lorenz. Necesitamos ajustar los valores de la escala en los ambos ejes.

Figura 19: Aspecto inicial del grfico sin ajustes

5. Ubicar el puntero sobre el eje X y presionar el botn derecho. Escoger Formato de ejes. Cambiar el valor de mximo a 1 y el valor de unidad mayor a 0.1. Repetir este procedimiento para el eje Y. Ver la figura 20.

Figura 20: Cambiar los valores para los ejes X e Y

Ing. Byron Gonzlez http://www.byrong.tk

15

6. Modificar el color del rea de trazado y eliminar las lneas horizontales. El grfico est casi listo y debe parecerse al mostrado en la figura 21.

Figura 21: Grfico ajustado en ejes y color del rea de trazado

7. Se necesita agregar una serie de datos para conseguir que el grfico quede terminado. Se hace clic derecho sobre el grfico y se elige la opcin Datos de origen como se ilustra en la figura 22.

Figura 22: Men para agregar otra serie de datos

Ing. Byron Gonzlez http://www.byrong.tk

16

8. En la ventana resultante elegir la pestaa Serie y hacer clic sobre el botn Agregar . Ahora podrn verse dos series de datos y en la parte derecha es posible definir los rangos de celdas para la nueva serie de datos.

Figura 23: Agregar una segunda serie de datos

9. Es necesario que cercanamente al rango de datos originales se agreguen dos parejas de ceros y unos para poder adicionar la nueva serie de datos. En la figura 24 puede verse la relacin entre los valores de X e Y y los valores de 0 y 1.

Ing. Byron Gonzlez http://www.byrong.tk

17

Figura 24: Relacin entre valores de X e Y y rango de celdas agregado

10. Luego de modificar el color de la lnea resultante nuestra Curva de Lorenz lucir de la siguiente forma.
1 0.9

Porcentaje de ingresos

0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Porcentaje de poblacin

Figura 25:

Curva de Lorenz para los ingresos de 43 personas residentes en la regin nororiental de Guatemala

Ing. Byron Gonzlez http://www.byrong.tk

18

3.4

Clculos usando StatsDirect

StatsDirect es un programa producido por Stats Direct Ltd. del Reino Unido. El software puede ser descargado desde el sitio http://www.statsdirect.com e incluye un amplio repertorio de metodologas estadsticas. Podemos mencionar entre ellas: distribuciones de probabilidad, anlisis de varianza, mtodos no paramtricos, regresin y correlacin, anlisis de sobrevivencia, entre otros. En nuestro caso aprovechamos la disponibilidad del clculo del ndice de Gini que StatsDirect incluye en su apartado de pruebas no paramtricas. Debemos aclarar que el archivo de instalacin que se descarga nos permite usar una versin de prueba durante 10 das. Este tiempo es relativamente corto, por lo que si la intencin es usarlo para los clculos del proyecto de investigacin sobre pobreza en el curso de Estadstica I, se recomienda a los profesores indicar esta condicin. StatsDirect se integra completamente a Excel. Es posible por lo tanto acceder a StatsDirect desde Excel presionando un enlace que se agrega durante la instalacin. En nuestro caso aprovecharemos que los clculos iniciales del nmero de clases y frecuencia de poblacin para los ingresos se han elaborado en Excel. Procedimiento: 1. Desde el entorno de Excel, y aprovechando la tabla de frecuencias de ingresos y poblacin accederemos a StatsDirect. Esto se muestra en la figura 26.

Figura 26: Ingreso al entorno de StatsDirect

2. Una vez abierto StatsDirect veremos que el entorno de trabajo es muy similar a Excel. Seleccionaremos el rango de celdas que corresponde a los ingresos y a la poblacin (que en este caso se ha identificado como numerop). Ver la figura 27.

Ing. Byron Gonzlez http://www.byrong.tk

19

Figura 27: Entorno de StatsDirect y definicin del rango de valores a usar

3. Es necesario ir al men de pruebas no paramtricas para solicitar el clculo del ndice de Gini (Ver figura 28). Recuerde que para realizar el procedimiento satisfactoriamente deber haber marcado previamente el rango de celdas adecuado.

Figura 28: Ingresar al men de clculo del ndice de Gini

Ing. Byron Gonzlez http://www.byrong.tk

20

4. El siguiente cuadro de dilogo nos pregunta cuntos iteraciones deseamos que el programa realice en el remuestreo2 (bootstrap). Usaremos el valor de 2000 ofrecido por omisin por el software.

Figura 29: Nmero iteraciones de bootstrap

5. Enseguida StatsDirect calcula el valor del ndice de Gini. En este caso el valor calculado es de 0.313 (ver figura 30). Tambin indica la estimacin por intervalo, el error estndar y la estimacin del error sistemtico (bias).

Figura 30: Indice de Gini calculado por StatsDirect

El bootstrap es una tcnica estadstica que permite a partir de los datos observados generar nuevas muestras simuladas de igual tamao que la muestra original con el propsito de estudiar sus resultados y propiedades. Una explicacin amplia sobre este tema puede verse en http://www.sld.cu/galerias/pdf/sitios/revsalud/tesis_de_resampling.pdf

Ing. Byron Gonzlez http://www.byrong.tk

21

3.5

Clculos usando CaEst

CaEst es una calculadora estadstica que incluye en su apartado de procedimientos descriptivos el clculo del ndice de Gini y la construccin de la curva de Lorenz. Los profesores Martnez de Lejarza, I., Martnez de Lejarza, J. son los autores de la calculadora, misma que puede ser descargada desde http://www.uv.es/~lejarza/caes/index.htm. Para obtener el ndice de Gini con CaEst es necesario contar con la distribucin de frecuencias de ingresos y poblacin. Usaremos en nuestro caso los datos de la tabla 3. Se ingresan a la calculadora las marcas de clase de los ingresos y las frecuencias de poblacin. Procedimiento: 1. Descargar la calculadora desde la ubicacin indicada anteriormente. Verificar la carpeta en la que se ha guardado el archivo CaEst.exe. Una vez localizado el archivo hacer doble clic sobre l. Cuando Windows pregunte sobre la seguridad de abrir el archivo presionar ejecutar como se muestra en la figura 31.

Figura 31: Advertencia de seguridad al abrir el archivo CaEst

2. Una vez dentro de la calculadora elegir el clculo de ndice de Gini como se muestra en la figura 32.

Ing. Byron Gonzlez http://www.byrong.tk

22

Figura 32: Men para calcular el ndice de Gini

En el siguiente cuadro de dilogo presionar Aceptar, como se indica en la figura 33.

Figura 33: Cuadro de dilogo para acceder al clculo de nde de Gini

Enseguida se pregunta por el nmero de valores distintos a ingresar. Esto corresponde al nmero de clases definidas. En nuestro caso este valor es siete.

Figura 34: Definir la cantidad de clases a usar en el clculo del ndice de Gini

Ing. Byron Gonzlez http://www.byrong.tk

23

3. La pantalla siguiente nos permite introducir los valores de ingresos y poblacin.

Figura 35: Ingresos de valores de ingresos y poblacin en CaEst

4. Una vez ingresados los valores es necesario hacer clic en el botn Calcular una primera vez. Notar que desaparecen los datos de la primera fila (Esta es una condicin particular de la calculadora, pero los datos se operan satisfactoriamente al final). Tambin notar que en la parte superior izquierda se han agregado los valores de ingresos y poblacin, pero sin los datos de la primera clase. Figura 36 (a). Agregue usted nuevamente estos datos para tener las clases completas. Figura 36 (b), y presione finalmente Calcular para obtener el ndice Gini. Ver figura 37.

(a)

(b)

Figura 36: Definicin de los valores a usar en el clculo del ndice de Gini

Ing. Byron Gonzlez http://www.byrong.tk

24

Figura 37: Paso final para obtener el ndice de Gini

5. El ndice de Gini calculado para este caso por CaEst es de 0.298. Es posible obtener la curva de Lorenz al presionar el botn dibujar lorenz. Ver figura 38.

Figura 38: Resultado final del clculo de ndice de Gini

Referencias

Epidat (2003). Software para anlisis epidemiolgico de datos tabulados. Direccin General de Salud Pblica. Junta de Galicia, Espaa. Organizacin Panamericana de la Salud. OPSExtrado el 03 de febrero 2006 desde http://www.paho.org/spanish/sha/epidat.htm.

Giles D. (2002) Calculating a estndar error for the Gini Coefficient: Some further results. Universidad de Victoria. Departamento de Economa. Extrado el 17 de febrero 2006 desde http://web.uvic.ca/econ/ewp0202.pdf

Ing. Byron Gonzlez http://www.byrong.tk

25

Martnez de Lejarza, I., Martnez de Lejarza, J. (s.f.) Calculadora estadstica: CaEst. Facultad de Economa, Universidad de Valencia. Extrado el 03 de febrero 2006 desde http://www.uv.es/~lejarza/estadistic.htm

Levin R., et al (2004) Estadstica para administracin y economa. Sptima edicin. Prentice Hall. 826 p. ISBN 970-26-0497-4.

Medina F. (2001) Consideraciones sobre el ndice de Gini para medir la concentracin del ingreso. Serie estudios estadsticos y prospectivos. Comisin Econmica para Amrica Latina CEPAL- Extrado el 03 de febrero 2006 desde http://www.eclac.cl/publicaciones/ ISBN 92-1-321793-5.

StatsDirect (2006) Software de anlisis estadstico. Stats Direct Ltd. United Kingdom. Extrado el 03 de febrero de 2006 desde http://www.statsdirect.com/ Vargas S (s.f.) Expresin del ndice de Gini para frecuencias no unitarias. IES Alfonso X El Sabio, Toledo. Espaa. Extrado el 17 de febrero de 2006 desde http://www.uclm.es/profesorado/ricardo/Docencia_e_Investigacion/2/AntonioVargas.do c

S-ar putea să vă placă și