Sunteți pe pagina 1din 19

3.

Anlisis de la distribucin
espacial de los datos

Una de las ventajas de la tecnologa actual es la generacin de datos, en este sentido, cada
disciplina puede pensar en la mejor posibilidad de utilizarlos en funcin de sus propios
problemas. Una de las tareas de la geografa se ha centrado en la localizacin, y principal-
mente, en la comprensin y explicacin de determinados elementos sobre el espacio.
Los gegrafos suelen enfrentarse a la posibilidad de localizar bajo unos objetivos ligados
a la planeacin u ordenamiento del espacio, dicha localizacin puede planteare en dos sen-
tidos: uno, en cuanto al aprovechamiento de un recurso, por ejemplo, un lote baldo; y dos,
en cuanto a la localizacin de un lugar cuya posicin imparcial deba favorecer a muchos o
aprovecharse al mximo, como ocurre con un puesto de salud o un centro educativo. La
diferencia entre los dos radica en la importancia que se le da a la localizacin misma, lo que
puede modificar las decisiones si se piensa en la relacin que dicha localizacin puede tener
con su entorno inmediato o ms all.
Las medidas de resumen, como tcnicas de anlisis espacial, le otorgan al gegrafo la
posibilidad de localizar con precisin y objetividad ciertos elementos a nivel espacial por
medio del tratamiento estadstico de algunos datos. El presente captulo no solo se centra en
la obtencin de estas medidas, sino en la espacializacin grfica de las mismas.
Desde la Estadstica se proponen tres formas de describir los datos, como un paso bsico
para su transformacin en informacin; son estos:

Las representaciones grficas


Las distribuciones de frecuencias
Las medidas de resumen

3.1 Las representaciones grficas


Diagramas y/o grficos se constituyen en esquemas visuales, que muestran una o ms ideas
por medio de diferentes variables que son organizadas segn reglas especficas que permiten
acceder ms fcil y didcticamente a la informacin. Bertin (1968) define los diagramas como
la construccin grfica en que las correspondencias en un plano pueden establecerse entre
todas las divisiones de una y otra componente que explican un fenmeno. 1
Cabe agregar que, hablar de representaciones grficas desde la geografa implica necesaria-
mente incluir los mapas, puesto que en estos se hace posible la concretizacin de algunos

1
En los dems captulos de este trabajo, se presentan algunas herramientas grficas de gran utilidad.
fenmenos, mediante la espacializacin de variables, que en ocasiones, no son fcilmente
visibles en la realidad, pero que hacen parte de la dinmica y caracterizacin del espacio.

3.2 La distribucin de frecuencias


Es un mtodo que utiliza tablas denominadas de distribucin de frecuencias, con las
que se busca ordenar los datos y describir el nmero de veces que ocurre un resultado
dentro de un conjunto de observaciones. Segn Carrera, et al (1993) la distribucin de
frecuencias permite expresar con mayor claridad el grado de regularidad o irregularidad con
que se distribuyen los diferentes valores que toma una variable. Por su parte Harnett y
Murphy (1987) resaltan la importancia de este tipo de distribucin para hacer una indica-
cin ms precisa de la informacin disponible, contraria a las representaciones grficas que
proporcionan una representacin de la informacin y no de los datos en s mismos.
El siguiente es un ejemplo de una tabla de distribucin de frecuencias.

Cuadro 3.1 Tabla de distribucin de frecuencias

Viviendas Frecuencias Absolutas Frecuencias Relativas %


Xi ni Ni fi Fi
A 5 5 23 23
B 8 13 36 59
C 3 16 14 73
D 2 18 9 82
E 4 22 18 100
La primera columna (xi) muestra la variable a distribuir, en este caso viviendas.
La segunda columna (ni) muestra el nmero de veces en que ocurre un fenmeno; aqu
presentamos el nmero de personas que habitan en cada una de las viviendas.
La tercera columna (Ni) corresponde a la suma de una frecuencia absoluta con la adyacen-
te en direccin descendente.
La cuarta columna (fi) muestra el nmero de veces en que ocurre un fenmeno en relacin
con el total de observaciones, presentndose en porcentajes.
La quinta columna (Fi) corresponde a la suma de una frecuencia relativa con la adyacente
en direccin descendente.

3.3 Las medidas de resumen


Son tcnicas cuantitativas que permiten hacer una descripcin general del conjunto de
datos, a partir de la obtencin de un slo dato. De acuerdo a Harnett y Murphy (1987), el
propsito es reducir la informacin a una medida simple.
Este tipo de medidas son tiles para el anlisis espacial en tanto hacen posible describir la
distribucin de un fenmeno geogrfico en funcin de su concentracin o su dispersin, lo que
permite inferir que los datos implicados en este tipo de medidas tienen un carcter puntual.
Las medidas de resumen se clasifican en dos grupos:

Las medidas de tendencia central: moda, mediana y media


Las medidas de dispersin: desviacin tpica, varianza y covarianza.
DATOS GEOGRFICOS

Las medidas de resumen proporcionan un tratamiento adecuado de los datos puesto que
tienen en cuenta sus caractersticas temticas y ante todo su componente espacial; en este
sentido, los resultados arrojados por este tipo de medidas pueden reforzar la localizacin de un
punto o, sugerir un nuevo emplazamiento para el mismo, haciendo un poco ms objetiva la
toma de decisiones, sin embargo cabe recordar que a pesar de la exactitud que estas medidas
puedan tener, es el investigador quien utiliza tanto los mtodos como los resultados, de acuer-
do a sus requerimientos reales y a las posibilidades que proporciona el espacio.

3.3.1 Las medidas de tendencia central


Son aquellas que se caracterizan por sintetizar las posiciones de toda una estructura de
localizaciones en un solo punto. Son tiles especialmente para estudios evolutivos en los
que se analiza la posicin de los puntos en diferentes etapas o en trabajos comparativos en
los que se constatan dos o ms fenmenos espaciales independientes. (Gamir, et. al. 1995).
La ventaja de ste tipo de medidas, tanto estadsticamente como espacialmente, es que
no requieren un proceso matemtico complejo. No obstante, la espacializacin de algunos
de sus resultados puede en ocasiones no corresponder con la realidad geogrfica.

3.3.1.1 La Moda
Es el valor que se repite el mayor nmero de veces dentro de un conjunto de datos.
Para los siguientes datos:

34 5,7,3,2,8,4,1,6,5,3,8,3,5,7,2,4,3,4,6,2
La moda es 3

Es probable que en un conjunto de datos exista ms de una moda. Por ejemplo en el


siguiente conjunto de observaciones:
3,5,7,2,4,3,4,5,6,2,8,3,5,6,1,4,8,2,3,7,5
Los datos que ms se repiten son 3 y 5, por lo tanto estos representan la moda.

En geogrfia, cada dato corresponde a un emplazamiento. De acuerdo al tipo de escala


que se desee utilizar, cada dato puede convertirse en un punto. La moda en este caso corres-
ponder con el rea que contenga mayor densidad de puntos (datos).

Cmo se halla la moda en un conjunto de datos espacializados?


MADRID, A. & ORTZ, L.

Nuestro problema a solucionar es el siguiente: En la zona sur de la cabecera municipal de


Gmeza, se busca emprender una campaa de salud, para lo cual se ha pensado en determinar
cual es el rea que tiene el mayor nmero de viviendas, para dar mayor cubrimiento en el
menor tiempo posible.
Se escoge una escala que cubra toda el rea y que adems permita que cada dato sea
representado por un punto. En este caso hemos escogido la escala: 1:10.000
Se traza una cuadrcula sobre el rea. El tamao de la misma es decisin del investiga-
dor, sin embargo ste debe pensar en dos elementos bsicos: la distancia a recorrer en fun-
cin del problema y la posibilidad de encontrar un tamao adecuado para la cuadrcula que
responda eficazmente a una solucin. En nuestro caso hemos utilizado dos tamaos dife-
rentes de plantillas.
Seguidamente procedemos a contar el nmero de puntos en cada uno de los cuadros
para determinar el que tiene mayor densidad.

Cuadro 3.2 Nmero de viviendas por cada uno de los cuadros de la plantilla

Cuadro Nmero de
No viviendas
1A 6
2A 15
3A 2
4A 2 35
5A 3
1B 12
2B 11
3B 4
4B 1
5B 7
1C 12
2C 10
3C 3
4C 4
5C 3
1D 8
2D 11
3D 6
4D 15
5D 5
1E 6
2E 13
3E 10
4E 6
5E 7
ANLISIS DE LA DISTRIBUCIN ESPACIAL DE LOS DATOS

En la figura 3.1, tenemos 25 cuadros (4cm x 4cm), cada uno de ellos representa 1.600
m , pero encontramos que existen dos modas, las correspondientes a los cuadros 2A y 4D,
2

que se encuentran bastante separados uno del otro y cada uno con 15 viviendas, lo cual
probablemente dificultara cumplir con el objetivo de la campaa que es hacer un mejor
cubrimiento en el menor tiempo posible.
Se opta, entonces por ampliar el tamao de la cuadrcula; la figura 3.2 presenta reas de
2.500 m2, el cuadro que tiene mayor densidad es el 2D, con 21 viviendas.

Cuadro 3.3 Nmero de viviendas por cada uno de los cuadros de la plantilla

Cuadro Nmero de
No. Viviendas
1A 9
1B 20
1C 17
1D 6
2A 19
2B 15
2C 13
2D 21
3A 1
36 3B 2
3C 16
3D 10
4A 6
4B 8
4C 8
4D 12

3.3.1.2 La mediana o centro mediano


En trminos estadsticos la mediana corresponde al dato que se ubica en todo el centro
de las observaciones ordenadas, dejando la misma cantidad de datos a lado y lado de ste.
En los siguientes datos:

1, 2, 6, 8, 8, 9, 10, 12, 13, 15, 16, 17, 20, 21, 21


La mediana corresponde al nmero 12.

Cuando el nmero de datos es par la mediana corresponde al valor medio entre los dos
datos ubicados en el centro, as:

17, 18, 21, 23, 26, 27, 27, 27, 28, 30, 31, 31, 32, 34, 36, 36, 39, 40, 40, 42
La mediana es 30.5 como resultado de: 30 + 31
2
MADRID, A. & ORTZ, L.

En geografa, segn Gamir, et. al. (1995) el centro mediano de una estructura de puntos es
aquella posicin en la que se produzca una reparto equitativo de las observaciones puntuales en las
direcciones N, S, E y O. Es una medida ideal en tanto se busca la localizacin de un punto que
sea relativamente equidistante a todos los dems puntos que lo rodean, sin embargo tal emplaza-
miento corre el riesgo de corresponder a un lugar que no obedezca a las especificaciones planteadas
en el problema inicial, por ejemplo: una laguna, un ro, una pendiente fuerte...

Cmo se halla la mediana en un conjunto de datos espacializados?

Continuando con el problema anterior, ahora se requiere ubicar un puesto promotor de 39


salud que brinde los primeros auxilios, que est pendiente de las remisiones y que capacite a
la comunidad sobre infeccin respiratoria agua, enfermedad diarrica aguda, nutricin bsica
y cuidado de los nios en casa; este lugar, debe adems funcionar como un centro de concen-
tracin temporal para algunos especialistas.
El rea de estudio en este caso, fue determinada a partir de la mayor concentracin de vivien-
das que se estableci en el problema anterior. Se procedi a trazar un eje y a ubicar su centro, de tal
forma que conservara la misma cantidad de viviendas en cada cuadrante (figura 3.3).

Fig. 3.3 Centro Mediano


ANLISIS DE LA DISTRIBUCIN ESPACIAL DE LOS DATOS

Este procedimiento no implica operaciones de tipo matemtico, basta desplazar los ejes
hasta obtener el resultado deseado. En nuestro caso la distribucin de los puntos slo nos
permiti una orientacin de los ejes, pero es posible que para un mismo problema, dicha
orientacin seale varios centros medianos.
El centro mediano, a diferencia del centro de gravedad, proporciona un resultado ptimo
en trminos prcticos, sin embargo, como afirma Ebdon (1982) hay que limitar su uso a
investigaciones geogrficas preliminares, en las que cuenta ms la rapidez que la precisin.

3.3.1.3 La media aritmtica o centro de gravedad


La Media Aritmtica es lo que la estadstica denomina como el promedio. Consiste en la
suma de los datos dividida en el nmero total de stos. Esta medida depende considerable-
mente del valor que toma cada dato, es as como un slo valor puede hacer desplazar la
media hacia un punto y otro de las observaciones y no representar el fenmeno o la situa-
cin adecuada.
En el siguiente conjunto de datos:

24, 36, 25, 19, 28, 31, 34, 22, 32


La media resulta al aplicar: X = x
n
X = 24 + 36 + 25 + 19 + 28 + 31 + 34 + 22 +32
9
40 X = 251
9
X = 27,8

Geogrficamente, se habla de un centro de gravedad que incluye las dimensiones x e y,


con la idea de ubicar la media aritmtica de las localizaciones como tales y no del valor que
stas puedan tener.
Cmo se halla el centro de gravedad en un conjunto de datos espacializados?

2
En trminos prcticos no resulta fcil manejar coordenadas geogrficas, puesto que sus valores son mucho ms
altos, imprimiendo cierto grado de dificultad.
MADRID, A. & ORTZ, L.

Para aplicar este procedimiento al ejemplo anterior, procedemos a trazar un eje de coor-
denadas en la misma rea de estudio. Para facilitar el trabajo, a cada punto se le asign una
letra (figura 3.4) y se determinaron sus posiciones, con lo cual obtuvimos los siguientes
resultados (cuadro 3.4):

41

Figura 3.4 Centro de Gravedad


Cuadro 3.4 Datos para hallas el centro de gravedad

Se aplic la siguiente frmula:

x = Sx = 61,77 x = 2.94
n 21

y = Sy = 55.1 y = 2.62
n 21

Estos valores corresponden a un nuevo par de coordenadas que indican el centro de


gravedad. Tal lugar podra ser el nuevo emplazamiento del centro de promotores de salud.
Al compararlo con la medida anterior (mediana), observamos que la posicin del centro
de gravedad tuvo un desplazamiento hacia el occidente, que en distancia real corresponde
aproximadamente a 10 metros.
ANLISIS DE LA DISTRIBUCIN ESPACIAL DE LOS DATOS

Segn Estbanez & Bradshaw (1978) el centro de gravedad tiene una serie de ventajas
puede resultar de utilidad para estudiar el cambio o la variacin de una distribucin a lo
largo del tiempo... registra sensiblemente cualquier tipo de movimiento de los elementos
de una poblacin. Sin embargo como desventaja esta medida puede en algunos casos loca-
lizarse fuera del territorio estudiado... no indica ninguna caracterstica de la regin y ade-
ms no resulta sencillo interpretar los resultados.

3.3.1.4 El centro de gravedad ponderado


Consiste en aplicar el mismo procedimiento del centro de gravedad, pero a cada uno de
los puntos se le agrega un peso igual a un valor que es intrnseco a cada uno de los datos.

Cmo se halla el centro de gravedad ponderado?

Utilizando el mismo problema, hemos decidido tener en cuenta un nuevo valor que
actuar como peso (w). Este valor corresponde al nmero de personas que habita en cada una
42 de las viviendas del rea, con el fin de identificar los puntos que representan mayor demanda
del servicio de salud. Se obtuvieron los siguientes datos:

Cuadro 3.5 Datos para hallar el centro de gravedad ponderado


MADRID, A. & ORTZ, L.

Al localizar ste nuevo par de coordenadas (figura 3.5), observamos que en este caso el centro
de gravedad ponderado no se traslad notoriamente con relacin al centro de gravedad.

Fig. 3.5 Centro de gravedad ponderado

Podra decirse que entre las tres medidas (mediana, centro de gravedad y centro de grave-
dad ponderado), la diferencia es aproximadamente de 10 metros entre una y otra. En trmi-
nos reales y al hacer una observacin del terreno se podra afirmar que cualquiera de los tres
resultados sirve para ubicar el puesto de promotores de salud, puesto que topogrficamente
no presentan ningn inconveniente (figura 3.6)
43

Fig. 3.6 Diferencia espacial entre medidas

3.3.2 Las medidas de dispersin


Son tcnicas que analizan la disgregacin de un conjunto de datos en relacin con un
centro medio. Espacialmente sirven para identificar qu tan distanciados y/o concentrados se
encuentra cada uno de los puntos en relacin con un centro de gravedad. Estas medidas
superan, en parte, la dificultad de las medidas de tendencia central en las que los valores
extremos modifican radicalmente los resultados; las medidas de dispersin toman todos los
datos y buscan el grado de variabilidad o esparcimiento no slo a un centro medio, sino al
conjunto de datos puntuales.
ANLISIS DE LA DISTRIBUCIN ESPACIAL DE LOS DATOS

3.3.2.1 Desviacin tpica


Se define estadsticamente como el grado de dispersin absoluta de los valores respecto
a la media (Gamir, et al. 1995).
Para hallar la desviacin tpica se utiliza la siguiente frmula:

en donde: s = desviacin tpica


x = media de los valores de x
n = nmero de observaciones
En el siguiente conjunto de datos: 7, 5, 3, 4, 9, 1
x = 4,8
Ver Cuadro 3.6. Para obtener la desviacin tpica, se le resta a cada una de las observaciones
la media (columna 2), cada uno de estos resultados se eleva al cuadrado (columna 3) con el
propsito de evitar valores negativos, se suman y se dividen en el nmero de observaciones.
Finalmente se obtiene la desviacin tpica hallando la raz cuadrada de ste ltimo resultado.

44

Cuadro 3.6 Datos para hallar la desviacin tpica

=2,6

En geografa, al igual que en las medidas de tendencia central, para hallar la desviacin
tpica de un conjunto de datos puntuales espacializados, es necesario ubicarlos en el plano
bidimensional x e y, y bsicamente aplicar la misma frmula estadstica.
La desviacin tpica puede obtenerse a partir de dos mtodos: el grfico y el aritmtico.

Cmo se halla la desviacin tpica en un conjunto de datos espacializados?

3
Remitirse a dicho apartado.
MADRID, A. & ORTZ, L.

Nuestro problema a resolver es el siguiente: el puesto promotor de salud desea determi-


nar cual es la distancia media que debe recorrer cualquiera de sus especialistas a cada una de las
viviendas ubicadas en la zona escogida. Con ello desean determinar si en un solo da es
posible realizar una campaa de vacunacin, teniendo en cuenta el perodo de conservacin
de los antivirus a utilizar.
Recordemos que el centro de gravedad es igual a: x = 2,94
y = 2,62
En la figura 3.7 aparecen sealados los trayectos de cada uno de los puntos hacia el centro
de gravedad; es decir la distancia que existe entre cada vivienda y el centro promotor de salud.

45
Figura 3.7 Trayecto de cada uno de los puntos al centro de gravedad. Mtodo grfico

En el cuadro 3.7 se registran estas distancias en la columna 2, la columna 3 corresponde


al cuadrado de las distancias.

= 61,49 =1,71
21
Cuadro 3.7 Longitud de cada uno de los trayectos al centro de gravedad
ANLISIS DE LA DISTRIBUCIN ESPACIAL DE LOS DATOS

Al hacer el clculo obtenemos una desviacin tpica de 1,71, que en trminos reales
equivale a 171 metros, lo que significa que esta es la distancia promedio que deben recorrer
los especialistas desde el centro promotor de salud para prestar sus servicios.
La desviacin tpica resultante, equivale grficamente al radio de un crculo que encierra
los puntos ms cercanos al centro de gravedad, a partir de una distancia media, como se
observa en la figura 3.8

Figura 3.8 Desviacin tpica de las distancias. Mtodo grfico

Debe tenerse en cuenta que en la vida real sera ms pertinente establecer los trayectos a
46
partir de las vas existentes, tanto fluviales como terrestres, puesto que no se estaran teniendo en
cuenta los obstculos fsicos que pueden aparecer. No obstante, Estbanez & Bradshaw (1978)
consideran que existen algunos hechos de carcter geogrfico en los que se hace ms recomenda-
ble el uso de la desviacin tpica, que el de algunas medidas de tendencia central. Los autores
toman como ejemplo los estudios de funciones en los que el centro de gravedad se ubica por lo
general en el centro de las ciudades. Sin embargo por s solo ste dato representa nicamente un
punto, mientras que la desviacin tpica sugiere el emplazamiento de un rea de influencia cuyo
tamao est determinado por todos y cada uno de los puntos.
MADRID, A. & ORTZ, L.

Para aplicar el mtodo aritmtico al ejemplo anterior, utilizamos el siguiente cuadro de


trabajo:

47

Cuadro 3.8 Datos para la obtencin de la desviacin tpica. Mtodo aritmtico

Grficamente la diferencia no es muy notoria, ver figura 3.9

Figura 3.9 Desviacin Tpica de las distancias, Mtodo Aritmtico - Mtodo Grfico
ANLISIS DE LA DISTRIBUCIN ESPACIAL DE LOS DATOS

Entre el resultado arrojado por el mtodo grfico y el mtodo aritmtico, hay una dife-
rencia de 8 metros. Este ltimo mtodo es mucho ms exacto, siendo por tanto ms ptimo
en investigaciones que requieren mayor precisin o en aquellas en las que el nmero de
emplazamientos es muy grande. El mtodo grfico, por su parte, es til para estudios preli-
minares.

3.3.2.2 Desviacin tpica ponderada:


Consiste en hallar el grado de dispersin absoluta respecto al centro de gravedad ponde-
rado, pero teniendo en cuenta un peso para cada emplazamiento cuyo valor le da mayor
importancia a ciertas localizaciones puntuales que a otras.
Se denota con la letras s.w

Cmo se halla la desviacin tpica ponderada?

48

Teniendo en cuenta que el puesto promotor de salud, no cuenta con la suficiente canti-
dad de antivirus, se ha decidido elaborar la campaa de vacunacin estableciendo prioridades
de la siguiente manera:

Prioridad 3, para las viviendas en donde habiten mujeres embarazadas y nios menores
de 1 ao.
Prioridad 2, para viviendas con nios menores de 1 ao.
Prioridad 1, para viviendas con poblacin infantil en edad de vacunar.

Se le asignar el valor 0 a aquellas viviendas que no cumplan con ninguna de las condi-
ciones anteriores.
Para facilitar el trabajo es aconsejable elaborar el siguiente cuadro y totalizar las columnas.
MADRID, A. & ORTZ, L.

Cuadro 3.9 Datos para la obtencin de la desviacin tpica ponderada

El centro de gravedad ponderado est determinado por las siguientes coordenadas:


xw = 3.2 yw = 3.1
Al aplicar la frmula, tenemos que:
49

En la figura 3.10 se grafica la nueva rea de influencia a partir del centro de gravedad
ponderado. Obsrvese que es posible graficar el peso de cada una de las viviendas, utilizando
la variable talla4.

Figura 3.10 Desviacin de las distancias Ponderadas


4
La talla es la nica variable visual que desde la Cartografa Temtica se ha propuesto para representar grficamen-
te cifras que tienen una implantacin puntual.
ANLISIS DE LA DISTRIBUCIN ESPACIAL DE LOS DATOS

Ntese que hubo un desplazamiento en direccin Noreste, hacia las viviendas que obtu-
vieron mayor peso con relacin a las prioridades establecidas por el puesto de promotores de
salud.

3.4 Conclusiones de captulo


Cabe hacer algunas aclaraciones finales en cuanto a las medidas de tendencia central:

Su aplicacin es conveniente en casos que lo ameriten ya que existen fenmenos que no


solo basta localizarlos, sino que es preciso tener en cuenta algunas condiciones para ello. Ubi-
car por ejemplo una estacin limnigrfica responde a otras exigencias, tales como el costo, la
cercana a un ro, el fcil acceso a la misma, la importancia de la corriente hdrica en cuanto a
su dinmica... etc.
Se puede decir que este tipo de medidas se constituyen en una herramienta para el simple
anlisis de localizaciones ideales o artificiales, pero no para fenmenos que tienen un compor-
tamiento natural que no todas las veces es predecible.

50

S-ar putea să vă placă și