Sunteți pe pagina 1din 13

TEMA 7

Archivos y Bases de Datos

lvarez, S., Bravo, S.,


Departamento de Informtica y autom tica
Universidad de Salamanca

Introduccin
n Anteriormente a la explosin de la informtica, el
almacenamiento de los archivos consista generalmente en
el mantenimiento de una coleccin de fichas con datos.
n stas fichas se colocaban en armarios o ficheros, y cuando
era preciso consultar la informacin de alguna se deba
hacer de forma manual, buscando la ficha.
n Desde la llegada de la informtica, este proceso se ha
automatizado, ganando en rapidez, calidad y fiabilidad.
n La utilizacin de las computadoras en la administracin de
las empresas ha supuesto una revolucin respecto al
almacenamiento y gestin de sus datos, dando lugar al uso
de los denominados archivos informticos y bases de datos.

lvarez, S., Bravo, S.

Universidad de Salamanca

-2-

Archivos
n Un archivo o fichero es coleccin de informacin (datos relacionados
entre s), almacenada como una unidad en la computadora.
n Los archivos son el conjunto organizado de informaciones del mismo tipo,
que pueden utilizarse en un mismo tratamiento, como soporte mate rial de
estas informaciones

n Archivos y registros
Los archivos como coleccin de datos sirven para la E/S a la
computadora y son manejados con programas.
Un registro lgico (registro), es cada uno de las componentes del
archivo, conteniendo el conjunto de informaciones que se acceden y se
tratan de manera unitaria
Cada registro est constituido por uno o ms elementos denominados
campos, que pueden ser de diferentes tipos y que a su vez pueden
estar compuestos por subcampos.
Los bloques son la cantidad de informacin que se transfiere
fsicamente en cada operacin de acceso (R o W) sobre el exterior.
Un bloque puede tener uno o ms registros (registros bloqueados)
Un registro ocupe ms de un bloque (registros expandidos).

lvarez, S., Bravo, S.

Universidad de Salamanca

-3-

Caractersticas de los Archivos


n Las principales caractersticas que diferencian esta estructura de
datos de las restantes son las siguientes:
Residencia en soportes de informacin externos, tambin
denominados memoria secundaria o auxiliar, como son las cintas y
discos.
Independencia respecto de los programas, lo que significa que la
vida del archivo no est limitada por la vida del programa que lo cre,
y tambin que en diferentes momentos pueden utilizar el mismo
archivo diferentes programas.
Permanencia de las informaciones almacenadas, es decir, toda la
informacin almacenada en la memoria central desaparece cuando se
termina la ejecucin del programa que la maneja, pero para hacer
desaparecer un archivo ser necesario realizar explcitamente una
operacin de borrado.
Gran capacidad de almacenamiento: tericamente esta capacidad
es ilimitada. Por el contrario, las estructuras de datos que residen en
la memoria central tienen limitado su tamao por la capacidad de
sta.

lvarez, S., Bravo, S.

Universidad de Salamanca

-4-

Organizaci n de archivos
n Existen tres tipos de organizacin de archivos:
Organizacin secuencial:
Es aquella en la cual los registros ocupan posiciones consecutivas
de memoria, y slo se puede acceder a ellos de uno en uno a partir
del primero.
En un archivo secuencial no se pueden hacer operaciones de
escritura cuando se est leyendo, ni operaciones de lectura cuando
se est escribiendo.
Para actualizarlos es preciso crear nuevos archivos donde se copien
registros que vayan a permanecer, modificados o no, junto con los
nuevos.

lvarez, S., Bravo, S.

Universidad de Salamanca

-5-

Organizaci n de archivos
Organizacin directa o aleatoria:
Los datos se colocan y se acceden de forma aleatoria mediante su
posicin, es decir, indicando el lugar relativo que ocupan dentro del
conjunto de posiciones posibles.
En esta organizacin se pueden leer y escribir registros, en
cualquier orden y en cualquier lugar. Presenta el inconveniente de
que es tarea del programador establecer la relacin entre la
posicin que ocupa un registro y su contenido. Adems puede
desaprovecharse parte del espacio destinado al archivo, ya que
pueden quedar huecos libres entre unos registros y otros. Su
principal ventaja es la rapidez de acceso a un registro cualquiera,
puesto que no es preciso pasar por los registros anteriores.

lvarez, S., Bravo, S.

Universidad de Salamanca

-6-

Organizaci n de archivos
Organizacin secuencial indexada:
Un archivo con esta organizacin consta de tres reas:

lvarez, S., Bravo, S.

rea de ndices, rea primaria y rea de excedentes.

Universidad de Salamanca

-7-

Modos de acceso
n Se denomina modo de acceso a la forma en que el dispositivo que maneja
el soporte al que accedemos se posiciona en un determinado lugar del
mismo para realizar una operacin de lectura o escritura de un registro.
n Es determinado por el programador de la aplicacin en funcin del soporte
utilizado y del tipo de organizacin.
n Hay dos modos bsicos:
Acceso secuencial a un registro supone acceder inicialmente al primer registro
del archivo y despus, consecutivamente, a todos los sucesivos hasta llegar al
registro deseado. Se puede utilizar con cualquier soporte y orga nizacin.
Acceso directo solamente se puede dar en los soportes direccionales, como los
discos magnticos, y consiste en el posicionamiento sobre cualquier registro sin
necesidad de haber accedido antes a los anteriores.

lvarez, S., Bravo, S.

Universidad de Salamanca

-8-

Operaciones sobre archivos


n

Creacin

Consiste en la escritura o grabacin en un soporte determinado de todos los


registros que van a formar el archivo. Los datos pueden ser introducidos desde
un teclado, pueden proceder de otro archivo o ser obtenidos como resultado de
algn proceso.
n

Copia

Es una de las operaciones ms usadas y consiste en crear un nuevo archivo


como duplicacin de otro existente. La copia puede realizarse en el mismo o en
diferente soporte de informacin. Un caso particular de esta operacin es la
impresin de un archivo
n

Consulta

Clasificacin u ordenacin

Se realiza para obtener el contenido de uno o varios registros. En muchos casos


ir precedida de una b squeda de los mismos.
Es la operacin consistente en reubicar los registros de tal forma que queden
ordenados con respecto a los valores de un campo que denominamos clave de
ordenacin. En un archivo clasificado sern mucho ms rpidas las consultas que
se realicen por medio del campo que rige la ordenacin. Por ejemplo, ser muy
til clasificar alfabticamente el archivo de alumnos por el campo nombre, ya
que la mayora de las consultas se harn utilizando este campo.
n

Concatenaci n

Dados dos archivos con registros de igual estructura, se trata d e obtener uno
solo en que figuren todos los registros del primero y a continuac in todos los del
segundo. Esta operaci n se puede generalizar para ms de dos archivos.
lvarez, S., Bravo, S.

Universidad de Salamanca

-9-

Operaciones sobre archivos


n

Interseccin

Dados dos archivos de igual estructura, se trata de obtener otro en que figuren
los registros comunes a ambos.
n

Fusin o mezcla

A partir de dos archivos de igual estructura clasificados por un mismo campo, se


obtiene como resultado un archivo que contiene los registros de ambos y que
mantiene la ordenaci n.
n

Particin

Consiste en descomponer un archivo en dos, atendiendo a alguna c aracterstica


de su registro.
n

Actualizaci n

Es la operacin de modificar un archivo de situaci n por medio de un archivo de


movimientos, conteniendo altas, bajas y modificaciones que hay q ue realizar
sobre el archivo maestro para ponerlo al da.
n

Reorganizacin

Operacin consistente en reubicar los registros de un archivo que ha sufrido


actualizaciones, de tal manera que se ocupen de los posibles huecos libres
intermedios resultantes de bajas de registros para optimizar la ocupacin de la
memoria, liberando la que no estaba aprovechada.
n

Borrado

Eliminaci n total del archivo, cuando ya no se necesite, dejando libre el espacio


de la memoria que ocupaba en el soporte utilizado.

lvarez, S., Bravo, S.

Universidad de Salamanca

-10-

Bases de datos: introduccin


n La gestin de archivos fsicos, por lo general, es insuficiente
gestionar la informacin de una entidad
ocupan demasiado espacio fsico
su bsqueda es lenta
su actualizacin y optimizacin es complicada
los archivos pueden estar dispersos por los distintos
departamentos (esto puede ocasionar repeticiones o carencias
de archivos)
los mtodos para controlar la seguridad son muy complejos

n Las bases de datos informticas pretenden solucionar todos


estos problemas

lvarez, S., Bravo, S.

Universidad de Salamanca

-11-

Bases de datos
n Una base de datos es un conjunto integrado de datos
interrelacionados, junto con una serie de aplicaciones para su
manejo, accesibles simultneamente por diferentes usuarios y
programas.
n Las caractersticas que ha de presentar una base de datos son las
siguientes:

Control centralizado de los datos


Integridad de los datos
Minimizacin de las repeticiones
Independencia de los datos y las aplicaciones

Acceso concurrente a los datos


Coste mnimo de almacenamiento y mantenimiento
Versatilidad para la representacin de relaciones.
Establecimiento de medidas de seguridad.
Facilidad para el cambio, actualizacin y optimizacin

lvarez, S., Bravo, S.

Universidad de Salamanca

-12-

Estructura y arquitectura de una


base de datos
n Una BBDD almacena informacin de objetos de datos: entidades,
relaciones, ndices, consultas, formularios, reportes, etc.
n Cada entidad tiene una serie de atributos (campos) y un
contenido determinado.
n Para facilitar acceso rpido a los registros de cada entidad se
puede crear una determinada clave asociada a archivos de ndice
n Los programas que permiten gestionar las bases de datos se
denominan SGBD (Sistemas de Gestin de Base de Datos).
n Un SGBD es que puede trabajar con diferentes bases de datos,
por ejemplo: Almacn, Biblioteca, Agenda, etc.
n No confundir el concepto de BBDD (entidades u objetos de
informacin) con el SGBD (programa que maneja la base de
datos, tambin denominado gestor motor de base de datos).
n Ejemplos: Oracle , Ms access.
lvarez, S., Bravo, S.

Universidad de Salamanca

-13-

Tipos de bases de datos


n Base de datos jerrquica
Una base de datos de tipo jerrquico utiliza jerarquas o
rboles para la representacin lgica de los datos. Los archivos
son organizados en jerarquas, y normalmente cada uno de
ellos se corresponde con una de las entidades de la base de
datos. Los rboles jerrquicos se representan de forma
invertida, con la raz hacia arriba y las hojas hacia abajo.

lvarez, S., Bravo, S.

Universidad de Salamanca

-14-

Tipos de bases de datos


n Base de datos de red
Fue el resultado de estandarizacin del comit CODASYL.
El modelo de red intenta superar las deficiencias del enfoque
jerrquico, permitiendo el tipo de relaciones de muchos a
muchos, mediante la estructura de red o grafo.
Una estructura de datos en red, o estructura plex, es muy
similar a una estructura jerrquica, de hecho no es ms que
un superconjunto de sta. Al igual que en la estructura
jerrquica, cada nodo puede tener varios hijos, pero a
diferencia de sta, tambin puede tener varios padres.

lvarez, S., Bravo, S.

Universidad de Salamanca

-15-

Tipos de bases de datos


n Base de datos relacional
Las bases de datos relacionales son las ms conocidas y
utilizadas, tanto por su sencillo manejo, como por estar al
alcance de todo tipo de usuarios, al estar muy difundidas.
En una base de datos relacional, el objetivo es que el usuario
vea las bases de datos como una estructura lgica de
relaciones (tablas), simple y uniforme. Una relacin o tabla se
compone de:

lvarez, S., Bravo, S.

Universidad de Salamanca

-16-

Tipos de bases de datos


Los sistemas relacionales ofrecen muchos tipos de procesos de
datos, como: simplicidad y generalidad, facilidad de uso para el
usuario final, perodos cortos de aprendizaje y consultas de
informacin especificadas de una forma muy sencilla.
Las BBDD relacionales estn constituidas por una o ms tablas que
contienen la informacin ordenada de una forma organizada.
Las tablas son un medio de representar la informacin de una forma
ms compacta y es posible acceder a la informacin contenida en dos
o ms tablas.
Cumplen las siguientes leyes bsicas:
Generalmente, contendrn varias tablas.
Una tabla s lo contiene un nmero fijo de campos.
El nombre de los campos de una tabla es distinto.
Cada registro de la tabla es nico.
El orden de los registros y de los campos no est determinados.
Para cada campo existe un conjunto de valores posible

lvarez, S., Bravo, S.

Universidad de Salamanca

-17-

Tipos de bases de datos


En las tablas, las filas representan registros (conjuntos de
datos acerca de elementos separados) y las columnas
representan campos (atributos particulares de un registro).
Al realizar las bsquedas, una base de datos relacional hace
coincidir la informacin de un campo de una tabla con
informacin en el campo correspondiente de otra tabla y con
ello produce una tercera tabla que combina los datos
solicitados de ambas tablas.

lvarez, S., Bravo, S.

Universidad de Salamanca

-18-

Tipos de bases de datos


En estas BBDD las operaciones permitidas son bsicamente las de
actualizacin, es decir, insercin, borrado y modificacin de las
mismas, y tambin la consulta.
La base de todas operaciones reside en el lgebra relacional. Para
todo ello se emplean lenguajes relacionales como el SQL, y el
tratamiento de las bases debe cumplir unas reglas de integridad.
Estas reglas de integridad consisten en evitar que el modelo
represente plausiblemente a la realidad, evitando incoherencias.
Tambin recogen la unicidad de la clave primaria, su entidad, la
integridad del dominio y la integridad referencial
Las ventajas de una base de datos relacional son:
Compatibilidad y estandarizacin.
Fiabilidad.
Garanta de independencia de los datos.
Existencia de numerosos sistemas comerciales entre los que escoger y
consiguiente apoyo t cnico.
Conectividad garantizada con los lenguajes de programaci n estndar

lvarez, S., Bravo, S.

Universidad de Salamanca

-19-

Tipos de bases de datos


Desventajas o limitaciones (que conlleva la adopcin un
modelo de datos con una veintena de aos):
Imposibilidad de representar conocimiento en forma de reglas.
Inexistencia de mecanismos de herencia de propiedades (y por
supuesto demtodos).
Falta de poder expresivo (por ejemplo, para representar
jerarquas).
Dificultad para gestionar datos no atmicos (por ejemplo, los
valores estructurados de una estructura de rasgos).
Incompatibilidad entre los tipos de estructuras de datos que se
transfieren o inadaptacin de impedancia (impedance mismatch).

Una BBDD supone una plataforma estable y compatible, con


limitaciones en sus capacidades y poder expresivo.
En esta situacin se piensa que un cuidado diseo (modelado
conceptual) puede vencer muchas de estas desventajas y
aprovechar al mximo todas las ventajas mencionadas.

lvarez, S., Bravo, S.

Universidad de Salamanca

-20-

10

Tipos de bases de datos


El modelo Entidad-Relacin (E-R) es un modelo de
representacin que se utiliza para la representacin de las
bases de datos relacionales. Fue propuesto por Chen entre los
aos 1976-1977.
El modelo E-R describe los datos como entidades, relaciones
(vnculos) y atributos y permite representar el esquema
conceptual de una base de datos de forma grfica mediante
los diagramas E-R.

lvarez, S., Bravo, S.

Universidad de Salamanca

-21-

Ventajas y desventajas del uso de


las bases de datos
n La utilizacin de BBDD como plataforma para el desarrollo de los sistemas
de aplicacin en las organizaciones se ha incrementado debido a las
siguientes ventajas entre otras:
Permiten una globalizacin de la informacin: cada usuario recurre y utiliza
la informacin como un recurso corporativo que carece de dueo espec fico.
Eliminaci n de informaci n inconsistente: si existen dos o ms archivos con la
misma informacin, los cambios que se hagan a stos debern hacerse a todas
las copias del archivo de facturas.
Las bases de datos permiten compartir todo tipo de informaci n contenida en
ellas a cualquier usuario que la solicite.
Permite mantener la integridad en la informaci n: la integridad de la informaci n
es una de sus cualidades altamente deseable y tiene por objetivo que s lo se
almacena la informacin correcta.
Independencia de datos: el concepto de independencia de datos es quizs el que
ms ha ayudado a la rpida proliferacin del desarrollo de sistemas de bases de
datos. La independencia de datos implica un divorcio entre programas y datos.
Se evita la redundancia de la informacin, manteniendo ntegras las bases de
datos y bien definidas las tablas.
La ltima ventaja, y quiz una de las ms importantes: mantienen varios niveles
de control y seguridad

lvarez, S., Bravo, S.

Universidad de Salamanca

-22-

11

Ventajas y desventajas del uso de


las bases de datos
n La utilizacin de BBDD tiene las siguientes desventajas:
Al perder o daarse la base de datos se hacen irrecuperables
las tablas, informes, consultas, etc., que en ella existen.
Al tener una base de datos con demasiada informacin su
acceso se har ms lento y pudiendo influir adems su uso
simultneo por varios usuarios.

lvarez, S., Bravo, S.

Universidad de Salamanca

-23-

Seguridad en las bases de datos


n La seguridad de los datos integrados en una base de datos es un
concepto que se relaciona directamente con el propio concepto de
base de datos. Recordando que una base de datos es un conjunto
de datos integrados, adecuado a varios usuarios y a diferentes
usos. Es por ello, que el uso de dichos datos plantea problemas de
seguridad que el administrador de la base de datos tiene que
tratar de solventar.
n La proteccin de dichos datos deber llevarse a cabo tanto contra
fallos fsicos como contra fallos humanos. Dichos fallos alteran
o destruyen la informacin, los datos contenidos, por lo que la
base de datos perdera su funcionalidad.
n Normalmente el SGBD facilita mecanismos para prevenir los fallos
(subsistema de control), para detectarlos una vez que han
sucedido (subsistema de deteccin) y para corregir dichos
fallos una vez que han sido detectados (subsistema de
recuperacin).

lvarez, S., Bravo, S.

Universidad de Salamanca

-24-

12

Seguridad en las bases de datos


n La seguridad en las bases de datos est basada en tres pilares
fundamentales:
Accesibilidad: se busca que la informacin este en todo momento a
disposicin del usuario.
Confidencialidad: se trata de no desvelar los datos a usuarios no
autorizados, incluye la proteccin de los datos personales que se
incluyen en la base de datos.
Integridad: se busca que los datos permanezcan tal y como han sido
introducidos por el administrador o los usuarios con derecho a
modificacin, sin ser falseados.

n Las amenazas afectan normalmente a los tres aspectos, por lo


que las medidas que se tomen, lgicamente, debern incluir todos
ellos.
n Para la toma de dichas medidas tambin debemos considerar el
hardware, el tipo de sistema operativo, la seguridad fsica de
acceso a los equipos, controles organizativos y legales, etc.

lvarez, S., Bravo, S.

Universidad de Salamanca

-25-

13

S-ar putea să vă placă și