Sunteți pe pagina 1din 15

UNIDAD DE APRENDIZAJE N 3

CONSTRUCCIN Y CONEXIN DE BASE DE DATOS RELACIONAL

1. INTRODUCCION A LA BASE DE DATOS

Los Sistemas de Informacin Geogrfica, sobre todo los vectoriales, basan su


almacenamiento de datos en estructuras de bases de datos de tipo
relacional, por lo que es preciso la explicacin de los conceptos bsicos de esta
estructura y la forma de elaboracin de consultas y operaciones entre sus
componentes. Las bases de datos son las encargadas en los SIG de
almacenar los atributos de los objetos cartogrficos representados y deben
combinarse con las bases de datos que almacenan la topologa y geometra
de dichos objetos. Esta complejidad de almacenamiento de informacin es
lo que hace considerar a los SIG vectoriales ms complejos y/o potentes.
Actualmente y gracias a los desarrollos informticos asociados a la gestin de
informacin cualquier SIG es capaz de utilizar varios formatos de bases de
datos y trabajar indistintamente con ellos, salvando en muchos casos las
antiguas limitaciones de almacenamiento, conectividad, gestin, etc.

El trmino de bases de datos fue escuchado por primera vez en 1963, en un


simposium celebrado en California USA; pero no es hasta 1981 cuando la
Popularizacin de los programas de gestin de bases de datos comienza su
andadura.
El primer programa creado para los PC fue dBase de la compaa Ashton-
Tate. Suversin 2 (dBase II) inclua un lenguaje especfico que permiti a los
usuario yprogramadores crear programas a la medida; su desarrollador fue
Wayne Ratliff.
Las bases de datos relacionales son las ms extendidas y usadas actualmente;
fue propuesto inicialmente por E. F. Codd 1970 y a partir de la dcada de los
1980se generaliza su uso en los SGDB.
1.1. BASE DE DATOS: conjunto de datos informticos relacionados entre
s que estn almacenados de forma que son recuperable fcilmente, con
la posibilidad de relacionarlos, ordenarlos siguiendo un criterio, etc.

1.2. SISTEMA DE GESTIN DE BASES DE DATOS (SGBD): son el


conjunto de programas responsables de la generacin, mantenimiento,
actualizacin e integridad de las bases de datos.

1

2. TIPOS DE BASES DE DATOS

En general las bases de datos se clasifican a travs de tipo de gestor que las
soporta y administra diferencindose fundamentalmente 5 tipos que son:

MODELO PLANO: Son las primeras que se utilizaron y consisten en


representar la informacin de formaplana (texto plano), ya sea como una tabla
(organizada por renglones y columnas) osimplemente dando tratamiento de
base de datos a un archivo de texto.

MODELO JERRQUICO: Se almacena la informacin en una estructura


jerrquica, similar a las races deun rbol, en donde un nodo padre de
informacin tiene varios hijos; el nodo que no tiene padre sedenomina como
raz y a los nodos que no tienen hijos se les denomina hojas. La principal
limitacin de este tipo de bases de datos es su incapacidadde representar
eficazmente la redundancia de datos.


MODELO EN RED: Es muy parecido al jerrquico, diferencindose de la
anterior en el conceptode nodo, permitiendo que en un mismo nodotenga varios
padres, dando solucin alproblema de la redundancia de datos.

MODELO RELACIONAL: Es el ms utilizado actualmente tanto en el modelado


como en la administracin de datos. Su estructura se basa en el concepto de
tablas, compuestas de registros (filas) y campos (columnas). La informacin es
almacenada y recuperada por medio de consultas muy flexibles. El lenguaje
utilizado para la realizacin de las consultases SQL (Structurate Query
Language Lenguaje de Consulta Estructurado).

3. ELEMENTOS DE UNA BASE DE DATOS


Centrndonos en las bases de datos de tipo relacional, por ser aquellas que
gestinan los atributos de los elementos de los objetos SIG se pueden
diferenciar los siguientes elementos que la conforman:

ENTIDAD: son los objetos existentes en la realidad o bien abstractos,


a cerca de los cuales se quiere almacenar y recuperar informacin en una


base de datos y que se diferenciarn unos de otros por una serie de
atributos o caractersticas.
GRUPO DE ENTIDADES: ser la agrupacin de entidades del mismo
tipo.
ATRIBUTO: son los datos reales que caracterizan una entidad que los
describe.
DOMINIO: es el conjunto de datos admitidos para un atributo.
CAMPOS: son la columnas de la tabla y se corresponden con cada uno de
los atributos que componen un registro y hacen referencia a un dominio
de la entidad que deseamos describir. Estn definidos por el tipo de
datos que contienen.
CLAVE: El campo o conjunto de campos que representa a cada entidad
de forma nica.
REGISTRO LGICO, FILA O TUPLA: son las filas o fichas de la tabla
y contienen todos los datos de inters de una entidad. Estos registros
pueden ser de dos tipo atendiendo a su longitud, fija o variable.
TABLAS: es un contenedor de datos dividido en filas o registros y
columnas o campos.
Tienen las siguientes propiedades:
Cada entrada en la tabla corresponde a un tem individual.
Todos los tems de una columna son de la misma clase.
Cada columna tiene asignado un nombre nico en el conjunto de
columnas de la tabla.
Para una tabla dada todas las filas son diferentes.
Tanto las filas como las columnas pueden ser consideradas en
cualquier secuencia sin afectar ni el contenido ni la
representacin de la informacin.

En la mayora de los gestores de bases de datos se pueden unir tablas durante


la seleccin para la obtencin de bsquedas de informacin ms completas.
Esta operacin en los gestores de informacin geogrfica suele tener un
comando especfico.
En muchos programas se diferencian dos formas de unin entre tablas; en
cualquier caso es necesario:
Que exista un campo comn entre ambas tablas. Este campo no tiene que
llamarse de igual forma, pero si contener datos de iguales caractersticas.
Generalmente estos mtodos son usados para ahorrar espacio de
almacenamiento de datos y que las tablas no contengan datos redundantes.
Cuanto ms simple sea una tabla ms rpido ser realizar bsquedas en ella.

4. JOIN
Une dos tablas de forma no permanente, se encuentran dinmicamente unidas.
El tipo de unin que se suele realizar con este operador es de uno a uno o
muchos a uno.
A una tabla se le pueden unir tantas tablas como se desee.


5. RELATES:
Une dos tablas de forma no permanente, sin unin fsica de los campos de
ambas tablas, pero las actuaciones sobre una tabla son referenciadas en la
relacionada. El tipo de unin que se suele realizar con este operador es de uno
a muchos o muchos a muchos. A una tabla se le pueden unir tantas tablas como
se desee.

Las uniones de tablas y en concreto entre los diferentes registros de ambas


tablas se denominan cardinalidad y como hemos visto en la unin de las tablas
se diferencian cuatro tipos:

Uno a uno: seria una tabla en la que se relacionase cada registro con un
registro nico de la otra tabla y viceversa. Un ejemplo serauna tabla con los
datos personales de personasy la otra con los expedientes de cada una deellas
siendo el campo comn el DNI:


Uno a muchos: seria una tabla en la que serelacionase cada registro con
muchos registros de otra tabla. Un ejemplo sera una tabla con los eras
geolgicas.

Muchos a muchos: sera una tabla en la que se relacionase cada registro con
muchos registros de otra tabla y viceversa. Un ejemplo sera una tabla con los
direcciones de viviendas y otra con los nombres de los inquilinos, en los que
cada piso puede contener a ms de un inquilino y cada inquilino puede vivir en
ms de un piso.

SISTEMAS DE GESTIN DE BASES DE DATOS Y SIG

1. DEFINICION
Un Sistema de Gestin de Bases de Datos (SGBD) consiste en una coleccin
de datos interrelacionados y un conjunto de programas para acceder a los
mismos. Esta definicin es prcticamente idntica a la que se dio
anteriormente de Sistema de Informacin geogrfica.

Sin embargo, a lo largo del desarrollo de las tecnologas ligadas a los SIG
desde los setenta hasta la actualidad, una de las tendencias ms claras es el
papel, cada vez ms importante, que tiene el uso de SGBD para la gestin de
datos temticos como apoyo al SIG. En principio se utilizaron para
almacenar los atributos temticos asociados a un conjunto de entidades
espaciales almacenadas en formato vectorial, hoy en da se est empezando
a utilizar adems para el almacenamiento de la informacin geomtrica
(conjunto de coordenadas) de las entidades espaciales. Aunque se han hecho
algunos intentos para almacenar informacin en formato raster en un SGBD,
esta opcin no resulta eficiente.

2. CARACTERSTICAS FUNDAMENTALES DE UN SISTEMA DE


GESTIN DE BASE DE DATOS (SGBD)
Un SGBD permite el almacenamiento, manipulacin y consulta de datos
pertenecientes a una base de datos organizada en uno o varios ficheros. En
el modelo ms extendido (base de datos relacional) la base de datos
consiste, de cara al usuario, en un conjunto de tablas entre las que se
establecen relaciones. A pesar de sus semejanzas (ambos manejan
conjuntos de tablas) existen una serie de diferencias fundamentales entre
un SGBD y un programa de hoja de clculo, la principal es que un SGBD
permite:

El mtodo de almacenamiento y el programa que gestiona los datos


(servidor) son independientes del programa desde el que se lanzan las
consultas (cliente)
En lugar de primarse la visualizacin de toda la informacin, el objetivo
fundamental es permitir consultas complejas, cuya resolucin est
optimizada, expresadas mediante un lenguaje formal.


El almacenamiento de los datos se hace de forma eficiente aunque oculta
para el usuario y normalmente tiene, al contrario de lo que ocurre con las
hojas de clculo, poco que ver con la estructura con la que los datos se
presentan al usuario.
El acceso concurrente de mltiples usuarios autorizados a los datos,
realizando operaciones de actualizacin y consulta de los mismos
garantizando la ausencia de problemas de seguridad (debidos a accesos
no autorizados) o integridad (prdida de datos por el intento de varios
usuarios de acceder al mismo fichero al mismo tiempo.

3. BASES DE DATOS RELACIONALES


Es el modelo ms utilizado hoy en da. Una base de datos relacional es
bsicamente un conjunto de tablas, similares a las tablas de una hoja de
clculo, formadas por filas (registros) y columnas (campos). Los registros
representan cada uno de los objetos descritos en la tabla y los campos los
atributos (variables de cualquier tipo) de los objetos. En el modelo
relacional de base de datos, las tablas comparten algn campo entre ellas.
Estos campos compartidos van a servir para establecer relaciones entre las
tablas que permitan consultas complejas.

4. SQL. EL LENGUAJE DE CONSULTAS PARA LAS BASES DE DATOS


RELACIONALES

El lenguaje de consultas SQL (Lenguaje Estructurado de Consultas) se ha


convertido, debido a su eficiencia, en un estndar para las bases de datos
relacionales. A pesar de su estandarizacin se han desarrollado, sobre una
base comn, diversas versiones ampliadas como las de Oracle o la de
Microsoft SQL server.
Es un lenguaje declarativo en el que las rdenes especifican cual debe ser
el resultado y no la manera de conseguirlo (como ocurre en los lenguajes
procedimentales). Al ser declarativo es muy sistemtico, sencillo y con una
curva de aprendizaje muy agradable. Sin embargo los lenguajes declarativos
carecen de la potencia de los procedimentales. El gran xito de las bases de
datos relacionales se debe en parte a la posibilidad de usar este lenguaje.
Incluye diversos tipos de capacidades:
Comandos para la definicin y creacin de una base de datos (CREATE
TABLE).


Comandos para insercin, borrado o modificacin de datos (INSERT,
DELETE, UPDATE).

Comandos para la consulta de datos seleccionados de acuerdo a criterios


complejos que involucrandiversas tablas relacionadas por un campo comn
(SELECT).
Capacidades aritmticas: En SQL es posible incluir operaciones aritmticas
as como comparaciones, porejemplo A > B + 3.
Funciones matemticas (sqrt(x), cos(x)) o de manejo de textos.
Asignacin y comandos de impresin: es posible imprimir una tabla
construida por una consulta oalmacenarla como una nueva tabla.
Funciones agregadas: Operaciones tales como promedio (avg), desviacin
tpica (stddev), suma (sum),mximo (max), etc. se pueden aplicar a las
columnas de una tabla para obtener una cantidad nica y, a suvez, incluirla
en consultas ms complejas.

En una base de datos relacional, los resultados de la consulta van a ser


datos individuales, tuplas o tablas generados a partir de consultas en las
que se establecen una serie de condiciones basadas en valores numricos.
Por ejemplo una tpica consulta sobre una tabla en una base de datos
relacional, utilizando SQL podra ser:
SELECT id, nombre, pob1991
FROM municipios
WHERE pob1991>20000;
El resultado ser una tabla en la que tendremos tres columnas (id, nombre,
poblacion) procedentes de la tablamunicipios, las filas correspondern slo a
aquellos casos en los que la poblacion en 1991 (columna pob1991)sea mayor
que 20000. En el caso de que slo uno de los municipios cumpliera la
condicin obtendramos una sola fila (una tupla) y en caso de que la consulta
fuera:
SELECT pob1991
FROM municipios
WHERE pob1991>20000;

Obtendramos un slo nmero, la poblacin del municipio ms poblado.

10

5. SIG Y BASES DE DATOS RELACIONALES: EL MODELO GEO-


RELACIONAL

Lo ms habitual es utilizar el SGBD para almacenar la informacin temtica


y el SIG para la informacin geomtrica y topolgica. Una de las
funcionalidades de este modelo ser el enlazado de ambos tipos de
informacin que se almacenara de formas completamente diferentes. Se
trata del modelo de datos geo-relacional.

El mayor inters del modelo geo-relacional estar en poder lanzar una


consulta SQL y obtener una o varias entidades espacial (en lugar de
nmero, tabla o fila) como respuesta. Para ello debe enlazarse la base de
datos espacial (mapa vectorial) con la base de datos temtica (tablas)
mediante una columna en una de las tablas de la base de datos que
contenga los mismos identificadores que las entidades en la base de
datos espacial.

Podemos pensar en un mapa vectorial como en una tabla en la que cada


registro (fila) es un objeto (polgono, linea o punto) que contiene un
campo identificador y un campo que contiene la localizacin (conjunto de
coordenadas X e Y de tamao, lgicamente, variable). El hecho de que
esta informacin se presente en forma de tabla o en forma de mapa es
simplemente una cuestin de conveniencia.

11

En definitiva la nica diferencia entre el trabajo de un gestor


tradicional de bases de datos y el enlace de un SIG a base de datos es el
modo de presentacin (tabla o mapa). Casi todo el trabajo lo hace el
gestor de bases de datos y el Sistema de Informacin Geogrfica, se
limita a presentar los resultados.

Hasta ahora lo que hemos hecho es obtener objetos espaciales como


resultado de una consulta, pero cuando se trabaja con un SIG enlazado a
una base de datos, se pretende que las consultas incluyan tambien
condiciones espaciales. Incluso deberamos ser capaces de llevar a cabo
consultas interactivas en las que las condiciones se formulan en funcin
de donde haya pinchado el usuario en un mapa mostrado en pantalla.

Sin embargo en el modelo geo-relacional toda la informacin geomtrica


y topolgica est en el SIG no en el SGBD por tanto las consultas
debern preprocesarse y postprocesarse.

a. PREPROCESAMIENTO
Significa que el mdulo encargado de construir de forma automtica
consultas SQL como las que hemos visto antes, y lanzarlas al
programa servidor de bases de datos, deber hacerlo teniendo en
cuenta una serie de criterios espaciales definidos por el usuario.
Por ejemplo, si el usuario pincha en la pantalla dentro de un polgono
esperando obtener nombre y poblacin del municipio, el mdulo
deber determinar de que
polgono se trata e incluir su identificador, por ejemplo 17, como
condicin que debe cumplirse:

SELECT nombre, pob1991


FROM municipios
WHERE id==17;

b. POSTPROCESAMIENTO
Implica que los resultados de la consulta SQL debern filtrarse para
determinar cules cumplen determinadas condiciones relacionada con
el espacio. Para ello, una de las columnas pedidas en la consulta ha de
ser el identificador a partir del cual se obtiene, ya en el SIG, la
geometra del polgono a la que se puede aplicar la operacin de

12


anlisis espacial (distancia, cruce, inclusin, adyacencia, etc.)
necesaria para determinar si se cumple o no la condicin. Aquellos
casos en los que si se cumple constituye la salida del mdulo, el resto
se desechan.

6. BASES DE DATOS ORIENTADAS A OBJETOS


El modelo OO da lugar a las bases de datos orientados a objetos. Es un
concepto totalmente distinto al de las bases de datos relacionales que
responde al paradigma de la orientacin a objetos desarrollado en
programacin de ordenadores en los ltimos aos.

Permite una mayor flexibilidad a la hora de incorporar tipos ms complejos


como los tipos geomtricos (puntos, lineas, polgonos, etc.) por tanto es un
modelo, a priori, ms adecuado para el trabajo con un Sistema de
Informacin Geogrfica.
Se parte del concepto de clase que agrupa a todos los objetos que
comparten una serie de atributos, estos atributos pueden incluir la
geometra del objeto, las relaciones topolgicas y propiedades temticas.
Junto con los atributos, las clases incluyen un conjunto de mtodos
(acciones que pueden llevarse a cabo sobre los objetos).
No se permite el acceso directo a los atributos sino slo mediante sus
mtodos, esta propiedad se denomina encapsulamiento e incrementa la
seguridad de los datos ante errores. Otra caracterstica interesante es la
herencia por la cual unos objetos pueden derivar de otros heredando sus
atributos y mtodos e incorporando otros.

Por su complejidad, las bases de datos orientadas a objetos no utilizan SQL


e incluyen un lenguaje especfico para hacer las consultas.

7. GEODATABASE
En su nivel ms bsico, una geodatabase de ArcGIS es una coleccin de
datasets geogrficos de varios tipos contenida en una carpeta de sistema
de archivos comn, una base de datos de Microsoft Access o una base de
datos relacional multiusuario DBMS (por ejemplo Oracle, Microsoft SQL
Server, PostgreSQL, Informix o IBM DB2).
Las geodatabases tienen diversos tamaos, distinto nmero de usuarios,
pueden ir desde pequeas bases de datos de un solo usuario generadas en
archivos hasta geodatabases de grupos de trabajo ms grandes,

13


departamentos o geodatabases corporativas a las que acceden muchos
usuarios.

Una geodatabase es algo ms que una coleccin de datasets; el trmino


geodatabase tiene diversos significados en ArcGIS:
La geodatabase es la estructura de datos nativa para ArcGIS y es el
formato de datos principal que se utiliza para la edicin y administracin
de datos. Mientras ArcGIS trabaja con informacin geogrfica en
numerosos formatos de archivo del sistema de informacin geogrfica
(SIG), est diseado para trabajar con las capacidades de la
geodatabase y sacarles provecho.
Es el almacenamiento fsico de la informacin geogrfica, que
principalmente utiliza un sistema de administracin de bases de datos
(DBMS) o un sistema de archivos. Puede acceder y trabajar con esta
instancia fsica del conjunto de datasets a travs de ArcGIS o mediante
un sistema de administracin de bases de datos utilizando SQL.
Las geodatabases cuentan con un modelo de informacin integral para
representar y administrar informacin geogrfica. Este modelo de
informacin integral se implementa como una serie de tablas que
almacenan clases de entidad, datasets rster y atributos. Adems, los
objetos de datos SIG avanzados agregan comportamiento SIG, reglas
para administrar la integridad espacial y herramientas para trabajar con
diversas relaciones espaciales de las entidades, los rsteres y los
atributos principales.
La lgica del software de geodatabases proporciona la lgica de
aplicacin comn que se utiliza en ArcGIS para acceder y trabajar con
todos los datos geogrficos en una variedad de archivos y formatos.
Esto permite trabajar con la geodatabase, e incluye el trabajo con

14


shapefiles, archivos de dibujo asistido por ordenador (CAD), redes
irregulares de tringulos (TIN), cuadrculas, datos CAD, imgenes,
archivos de lenguaje de marcado geogrfico (GML) y numerosas otras
fuentes de datos SIG.
Las geodatabases poseen un modelo de transaccin para administrar
flujos de trabajo de datos SIG.

Dentro de una Geodatabase se pueden crear conjuntos de elementos donde


se almacenen grupos de datos correspondientes a un mismo tema. A este
grupo de datos, los llamaremos los Dataset, los cuales pueden almacenar
tanto informacin vectorial (Feature Dataset) como raster (Raster
Dataset Raster Catalog). La finalidad principal, es la de almacenar la
informacin de una forma ordenada, por su tipologa y por la temtica que
alberga. Dese cuenta que los Sistemas de Informacin Geogrfica, manejan
gran cantidad de informacin y generan a su vez, mucha informacin,
resultado de los anlisis que vamos efectuando.

15

S-ar putea să vă placă și