Sunteți pe pagina 1din 37

Mastère Informatique de Jendouba

Module
Bases de Données Avancées

Dr. FARAH Imed Riadh

Laboratoire RIADI
Module BDA : Objectifs

Approfondir les connaissances de base de l'étudiant(e) dans le domaine


des bases de données :

Rappeler les fonctionnalités des SGBD et les différentes étapes de


développement de ces systèmes

Rendre l'étudiant(e) capable de comprendre les besoins d'évolution


des SGBD relationnels

Faire connaître à l'étudiant(e) les plus récents développements dans


le domaine des bases de données :
BD actives, déductives, objets, multimédia,
distribuées, datawarehouse, ...

Initier l'étudiant(e) à un travail de recherche


Introduction Générale

Objectifs et Fonctionnalités des SGBD

Système de Gestion de Bases de Données (SGBD)

• Système logiciel chargé d'assurer le stockage et


l'accès à une base de données

Ensemble d'outils pour


• décrire les données
• manipuler les données
• partager les données

Un SGBD repose sur le modèle de données qu'il supporte


Modèle de Données

Définition

• ensemble de règles et de concepts permettant de


représenter le monde réel.

Exemples

• modèle réseau
• modèle relationnel
• modèle sémantique
• modèle objet
Fonctionnalités des SGBD

Gestion fiable et concurrente de l'espace mémoire secondaire

• stocker efficacement les données sur mémoire secondaire


• garantir la fiabilité des données (résistance aux pannes )
• assurer le partage des données entre plusieurs utilisateurs

Offrir des langages de définition et de manipulation de


données pour les différents utilisateurs

• langage de définition de données pour les administrateurs


• langage de manipulation de données pour l'utilisateur final
• langages et outils pour les développeurs d'applications
Fonctionnalités des SGBD (suite)

Traitement efficace des requêtes utilisateur

• mécanismes d'optimisation de requêtes

• gestion de l'intégrité sémantique des données

• utilisation des méthodes d'accès


Trois générations ont été développées

Première génération : SGBD hiérarchiques et réseaux :

• modèles de données basés sur l'existence de pointeurs


physiques entre les données

• le modèle HIERARCHIQUE limité à des liens


hiérarchiques 1-N entre les données

• le modèle RESEAU permettant une assez bonne


représentation de la réalité
SGBD hiérarchiques et réseaux

Langages :

• langages de manipulation dits "navigationnels",


permettant de naviguer à travers le réseau ou
la hiérarchie

• langages uniquement accessibles depuis un langage


de programmation (Cobol par exemple)

Produits : IMS, DBMS 32...


• produits commercialisés dans les années 60-70

• encore présents dans les entreprises


Différentes Générations de SGBD

Deuxième génération : SGBD relationnels

• repose sur la définition de domaines et de relations


entre ces domaines

• toutes les données sont représentées sous forme de tables

• l'algèbre relationnelle permet la manipulation du


contenu des tables
Le modèle relationnel

Le modèle relationnel de E. CODD

Version 1 : 1970
Versions 2 et 3 : 1990
Version 4 : Chris DATE en 1995 (à partir de V1)

Tout modèle de données doit avoir 3 composantes :


• définition
• contrôle
• manipulation
Autrement dit :
• des structures définissant les données
• des règles d ’intégrité induites par les structures définissant
les contraintes sur les données
• des opérateurs manipulant les données
Les concepts du modèle relationnel

4 concepts sont relatifs à la définition des données


• Relations n-aires (tuples)
• Domaines / attributs
• Clé primaire
• Clé étrangère / domaine primaire

3 concepts sont relatifs à l ’intégrité des données


• Intégrité de domaine
• Intégrité de relation
• Intégrité de référence

3 concepts sont relatifs à la manipulation des données


• Opérateurs sémantiques ‘ (liés aux domaines)
• Opérateurs ensemblistes (union, intersection, différence)
• Opérateurs relationnels (sélection, projection, jointure,
division)
SGBD relationnels

Langages de manipulation

• dits "assertionnels", l'utilisateur spécifie ce qu'il veut


obtenir et non comment l'obtenir

• langage de définition et de manipulation de données


intégrés et normalisés : SQL

• langage interactif de définition et de manipulation

Produits : Oracle, Sybase, IBM/UDB...

• produits commercialisés dans les années 80


• très présents dans les entreprises
Différentes Générations de SGBD

Troisième génération : SGBD avancés

Modèle de données :
• modèle de données plus riche sémantiquement
(modèle objet)
• distinction entre concepts d'entités, d'associations
• distinction entre différents types d'associations

Langages :
• langages de manipulation combinant la formulation de
requêtes associatives et de requêtes navigationnelles
• Intégration langage de programmation et langage
bases de données
• Intégration et adéquation avec les langages de
programmation objet
SGBD avancés

Approches

• extensions des systèmes relationnels


• introduction des SGBD objet
• développement de systèmes dédiés

Produits

• produits commercialisés à la fin des années 80 (1989)


• utilisés pour de nouvelles applications
Architecture type d'un SGBD
utilisateur

SGBD externe

SGBD interne

Système de stockage des données

Données
S o u rc e Données
S o u rc e
n n
Composants

Système de stockage de données

• assure la gestion des données sur mémoires secondaires

SGBD interne

• assure le placement des données dans les fichiers,


assemblage des données, liens entre données et structures

SGBD externe

• assure l'analyse et l'interprétation des requêtes de


l'utilisateur, la mise en forme des résultats.
Les nouvelles applications

Exemple :

Réseau d'agences immobilières en Tunisie

Chaque agence :

• décrit les biens immobiliers : maisons, appartements


dont elle est chargée de la vente

• peut modifier la description de ces biens

• effectue des recherches sur l'ensemble des biens qu'elle


possède
• recherche des biens : maisons, appartements dans la
liste de ceux détenus par d'autres agences
Nouvelles applications

L'ensemble des agences

• ont une description homogène des biens


• collaborent et peuvent s'échanger des informations
• peuvent accéder aux descriptions des autres agences

Caractéristiques du système d'information

• système réparti
• données complexes
• données multimédia
Architecture du système

Tunis Jendouba

Sfax
Réseau
d'interconnexion

Bizerte
Tozeur
Exemple de données

Description des maisons à vendre

adresse
nombre d'étages salle
à
manger séjour
étage 1
description des pièces cuisine
plan
photo de la maison

insérer image maison


Particularités

Architecture des systèmes

• répartition
• coopération
• interopération

Types de données

• données traditionnelles
• images, plans, son, vidéo
Modélisation

Nouveaux types de données

• données structurés
• objets volumineux

Distinction des différentes associations

• spécialisation, agrégation, ...

Définition de procédures associées

• exemple : calcul de la surface


Schéma relationnel

Appartement Numapp Adresse Etage

1 123 Cité des Jardins. Tunis 1


2 123 Cité des Jardins. Tunis 2
3 45 Rue de la liberté. Sousse 1

Pièce Numapp Numpièce Nom Superficie

1 1 Salon 30
1 2 Salle à manger 20
1 3 cuisine 10
1 4 chambre 20
1 5 Salle de bains 6
2 2 chambre 15
2 1 Salon 40
Traitement et manipulation

Récursivité

rechercher les immeubles proches de l'immeuble sis


540 Cité des Jardins à Tunis.

Déduction de nouvelles informations

la superficie totale de la maison déduite à partir de la


superficie des différentes pièces

analyse et extraction d'informations

Les maisons de plus de 100.000 DT sont achetés par


des couples de professionnels
Limites du modèle relationnel

Modélisation

• difficulté d'intégrer les nouveaux types de données

• "platitude" du modèle : les hiérarchies de composition


doivent être cassées

• pas de distinction entre les différents concepts de


modélisation : un seul concept : la relation

• pas de modélisation des traitements


Limites du modèle relationnel

Manipulation

• un nombre fini d'opérateurs de manipulation : les


opérateurs de l'algèbre relationnelle

• pas d'opérateurs permettant le traitement récursif

• expression explicite des opérations de jointure

• manipulation de type ensembliste

• pas de possibilité de navigation à travers la composition


Axes de recherche

Bases de données objet :

• intégrer les concepts objets dans les SGBD (classe, héritage)

Bases de données déductives :

• enrichir les SGBD de possibilités de déduction

Bases de données multimédia :

• intégrer dans un SGBD la gestion des données textuelles,


graphiques, images, sons etc...
Axes de recherche

Bases de données réparties :

• permettre d'interroger et de mettre à jour des données


provenant de sites répartis géographiquement

Systèmes d'aide à la décision

• générer de nouvelles informations à partir de l'analyse de


gros volumes de données; entreposer et accéder aux
"vieilles" données.
Systèmes de gestion de bases de données objet

C'est un système qui intègre les fonctionnalités d'un Système


de Gestion de Bases de Données et les caractéristiques d'un
langage objet

Modélisation :

• intégration des concepts des modèles objet


objets complexes (BLOB …)
conception homogène des données et des programmes
concept de classe et notions d'héritage
Systèmes de gestion de bases de données objet

Aspects système

• stockage efficace, adapté aux différents types


de données

• recherches efficaces

• algorithmes de contrôle de concurrence


paramétrables
Systèmes de gestion de bases de données déductifs

Intégrer les fonctionnalités des SGBD et des Systèmes


Experts
• stockage
• recherche
• déduction

Offrir un système complet pour :


• le contrôle des données
• le développement d'applications sophistiquées

Déduire de nouvelles informations à partir :


• des données de la base
• des règles modélisant la connaissance
Systèmes de gestion de bases de données déductifs

Offrir un langage de définition de la connaissance

• langage de règles

Assurer une exécution efficace du processus de déduction

• stockage des règles


• optimisation des programmes de règles
• contrôle de l'exécution
Systèmes de gestion de bases de données Multimédia

Réponse aux besoins des applications de type :

• Bureautique
• Conception Assistée par Ordinateur (CAO)
• Bases de données économiques
• Bases de données vocales
• Bases de données d'images et de vidéos
• Systèmes d'information géographiques (SIG)

Objectifs :

• intégrer plusieurs types de données


• gérer des objets de type multimédia
• offrir des possibilités de modélisation de données
• offrir des langages de manipulation de données adaptés
Systèmes de gestion de bases de données Multimédia

Solutions apportées au niveau de :

• description des objets multimédia


• stockage des différents types de données
• manipulation des objets multimédia
• gestion des traitements

Des systèmes spécifiques selon les applications :

• SIG : systèmes d'information géographiques


• Bases de données d'images
• Bases de données documentaires
• Bases de données de sons et vidéos
Systèmes de Gestion de Bases de Données Réparties

Base de donnée répartie :

• collection de données ayant des liens entre elles et


localisées sur différents ordinateurs d'un réseau

Chaque site du réseau

• peut exécuter des transactions locales


• participe à l'exécution d'au moins une transaction
globale

Système de Gestion de Bases de Données Réparties (SGBDR)

• logiciel chargé de la gestion de bases de données réparties


Systèmes de Gestion de Bases de Données Répartis

SGBD réparti
• une seule base de données logique distribuée
physiquement sur plusieurs sites
• un seul système gérant cette base de données
logique
SGBD hétérogène ou fédéré

• une collection de SGBD coopérants mais


autonomes
• notions de bases locales et bases globales
SGBD multibase

• couplage faible de différentes bases de données qui ne


constituent pas une entité logique
Systèmes D'aide à la Décision

Entrepôts de données (datawarehouse) :


• collection de données ayant des liens entre elles et
localisées sur différents ordinateurs d'un réseau

Analyse de données (OLAP)


• OLAP : On Line Analytic Processing
• Analyse de données et des transactions ayant porté
sur ces données

Prospection de données (Datamining)


• recherche dans les données afin de déterminer un
comportement ou des caractéristiques communes utilisables
pour prendre des décisions (extraction de connaissances)

S-ar putea să vă placă și