Sunteți pe pagina 1din 5


Pour une information détaillée et à jour,


la page WWW du projet

Thématique scientifique

L'extraction de connaissances dans les bases de

données (ECD ou « Knowledge Discovery in
Databases ») concerne les processus
fondamentalement interactifs et itératifs de
découverte de connaissances dans des grands
volumes de données (e.g., des règles d'associations
du type « Quand j'observe les caractéristiques A et B
alors j'observe souvent la caractéristique C », des
règles d'épisodes « Quand les événements A et B se
suivent en moins de 2 heures alors, moins de 5
heures après, il sont souvent suivis des événements
C et D » ou encore des contraintes d'intégrité bien
connues comme les dépendances d'inclusion ou des
dépendances fonctionnelles. La découverte de telles
propriétés dans des grands volumes pose des
problèmes que les disciplines « nourricières » de
l?ECD comme les statistiques ou l'apprentissage
automatique ne permettent pas de résoudre. Nous
nous intéressons à la perspective « Base de données
» au sens de T. IMIELINSKI et H. MANNILA [1] et
travaillons à une approche « langage de requête » où
les différentes étapes des processus d'extraction
s'organisent autour de requêtes, que ce soit pour «
sélectionner » les données à fouiller ou pour
interroger et explorer les collections, généralement
volumineuses, de propriétés extraites. On doit alors
souvent mettre en oeuvre un véritable processus de
« fouille de propriétés » qui lui-même peut provoquer
une nouvelle « fouille de données » etc. Pour les
connaissances sous forme de règles, des
propositions existent (e.g., l'opérateur MINE RULE)
mais une difficulté majeure est de travailler à des
approches suffisamment génériques pour évoluer
vers des langages généralistes : le «SQL » de l'ECD
est à inventer !

[1] T. IMIELINSKI and H. MANNILA. A Database

Perspective on Knowledge Discovery.
Communications of ACM, 39(11) : 58-64.

[CI-BOU-98b] BOULICAUT Jean-François, KLEMETTINEN Mika, MANNILA Heikki : Querying

Inductive Databases: a case study on the MINE RULE operator In: Proc. of the 2nd
European Symp. on Principles of Data Mining and Knowledge Discovery
PKDD'98, Nantes (F), september 1998. Springer-Verlag LNAI 1510, pp.

[CI-BOU-98a] BOULICAUT Jean-François, MARCEL Patrick, PINET F, RIGOTTI Christophe :

Spreadsheet generation from rule-based specifications. In: P. Fraternali, U. Geske, C.
Ruiz, D.Seipel. Proceedings of the 6th international workshop on
Deductive Database and Logic Programming ( DDLP' 98 ), Manchester,
June 1998. Berlin : GMD, 1998. pp. 59-70.GMD-Studien n° 22

[RI-BOU-99a] BOULMAKOUL A, LAURINI Robert, SERVIGNE Sylvie : First Specifications of a

TeleGeoMonitoring System for Transportation of Hazardous Materials. Computer,
Environnement and Urban Systems, Volume 23. 4 July 1999, pp. 259-

[CI-BOU-98c] BOULICAUT Jean-François : A formal framework for database audit. In: Proc.
of the 8th Workshop on Information Technologies and Systems
WITS'98, helsinki (FIN), december 12-13, 1998. pp. 257-266.

[RI-BOU-99b] BOULICAUT Jean-François : A KDD framework for database audit.

Information Technology and Management, Volume 1 (3), 1999. Baltzer.
pp. 195-207.

[CI-BOU-99a] BOULICAUT Jean-François, KLEMETTINEN Mika, MANNILA Heikki : Modeling

KDD processes within the inductive database framework. In: Proc. of
the 1st International Conference Data Warehousing and Knowledge
Discovery DaWaK'99, Florence (I), August 30 - September 1, 1999.
Springer-Verlag LNCS 1676. pp. 293-302.

[CI-BOU-99b] BOULICAUT Jean-François : Query languages for knowledge discovery in

databases (tutorial abstract). In: Proc. of the 3rd European Conference on
Principles of Data Mining and Knowledge Discovery PKDD'99, Prague
(CZ), September 15-18, 1999. Springer-Verlag LNAI 1504. pp. 582-583.

[CI-BOU-99c] BOULICAUT Jean-François, MARCEL Patrick, RIGOTTI Christophe : Query driven

knowledge discovery in multidimensional data. In: Proc. of the ACM Second
International Workshop on Data Warehousing and OLAP DOLAP'99,
Kansas City (Missouri, USA), November 6, 1999. ACM Press. pp. 87-93.
[CI-BOU-00a] BOULICAUT Jean-François, BYKOWSKI Artur : Frequent closures as a concise
representation for binary data mining. In: Proc. of the 4th Pacific-Asia Conference
on Knowledge Discovery and Data Mining PAKDD'00, Kyoto (JP), April
18-20, 2000. Springer-Verlag LNAI volume 1805. pp. 62-73.

[CI-BYK-00] BYKOWSKI Artur, GOMEZ-CHANTADA Lucia : Frequent Itemset Extraction in

Highly-correlated Data: a Web Usage Mining Application In: Proceedings of the
International Workshop on Web Knowledge Discovery and Data Mining
(WKDDM'00), Kyoto (Japan), April 2000. pp. 15-23.

[CI-ABD-00] ABDENNADHER Slim, RIGOTTI Christophe : Automatic Generation of Propagation

Rules for Finite Domains. In : Proc. of the 6th International Conference on
Principles and Practice of Constraint Programming, Singapore,
September 18-22, 2000. Springer-Verlag LNCS Volume 1834. pp. 18-

[CN-BOU-00a] BOULICAUT Jean-François, JEUDY Baptiste : Using constraints during set

mining: should we prune or not? Actes des Journées Bases de Données
Avançées BDA'00, Blois (F), 25-28 Octobre 2000. pp. 221-237.


Association Rule Discovery in Highly-Correlated Data: a Case Study in Web Usage Mining.
Proceedings of challenges, 2000 ADBIS-DASFAA Symposium on
Advances in Databases and Information Systems, Praha (CZ),
September 5-8, 2000. Matfyz press, ISBN 80-85863-56-1. pp. 46-55.

[CI-BOU-00c] BOULICAUT Jean-François, BYKOWSKI Artur, JEUDY Baptiste : Towards the

tractable discovery of association rules with negations Proceedings of the Fourth
International Conference on Flexible Query Answering Systems
(FQAS'00), Warsaw (Poland), October 25-28, 2000. Springer-Verlag,
Advances in Soft Computing. pp. 425-434.

[CI-BOU-00d] BOULICAUT Jean-François, BYKOWSKI Artur, RIGOTTI Christophe :

Approximation of frequency queries by mean of free-sets. Proc. of the 4th European
Conf. on Principles and Practice of Knowledge Discovery in Databases
PKDD'00, Lyon (F), September 13-16, 2000. Springer-Verlag LNAI
volume 1910, pp. 75-85.

[CI-BOU-01a] BOULICAUT Jean-François, JEUDY Baptiste : Mining Free Sets under Constraints
In: Proceedings of the International Database Engineering and
Applications Symposium, IDEAS'01, Grenoble (France), July 16-18,
2001. pp. 322-329. IEEE Computer Press.

[AU-BOU-01] BOULICAUT Jean-François, JEUDY Baptiste : Extraction de motifs fréquents :

quelques progrès récents (résumé) Journées Post Génomique de la Doua, 5-6
avril 2001, Lyon (F).
[CI-BYK-01] BYKOWSKI Artur, RIGOTTI Christophe : A condensed representation to find
frequent patterns In Proc. of the 20th ACM SIGACT-SIGMOD-SIGART
Symposium on Principles of Database Systems (PODS 2001) ,Santa
Barbara,CA, USA, May 2001. ACM Press. pp 267-273.

[CI-ABD-01a] ABDENNADHER Slim, RIGOTTI Christophe : Using confluence to generate rule-

based constraint solvers In Proc. of the 3rd ACM Int. Conf. on Principles and
Practice of Declarative Programming (PPDP 2001), Firenze, Italy,
September 2001. ACM Press.


Christophe : Extraction of Association Rules Between Low-Level Descriptors and Semantic
Descriptors in an Image Database In Proc. of the 1st International Workshop on
Multimedia Data and Document Engineering (MDDE 2001), Lyon,
France, July 2001.

[CN-BOU-01] BOULICAUT Jean-François, MARCEL Patrick, RIGOTTI Christophe : Query driven

knowledge discovery via OLAP manipulation In Actes des 17èmes journées Bases
de Données Avancées (BDA 2001), Agadir, Maroc, October 2001. pp.
311-323. Cepadues.

[CI-BOU-01b] BOULICAUT Jean-François, JEUDY Baptiste : Constraint-based discovery of a

condensed representation for frequent patterns. In: Proc. Workshop "Database
support for KDD", co-located with the co-located with the Fifth
European Conference on Principle and Practice of Knowledge Discovery
in Databases (PKDD'2001), Freiburg (G), September 7, 2001. pp. 3-13.

[CI-BOU-01c] BOULICAUT Jean-François, CREMILLEUX Bruno : Delta-strong classification

rules for predicting collagen diseases Proceedings of the « Discovery Challenge
on Thrombosis Data» co-located with the 5th European Conference on
Principles and Practice of Knowledge Discovery in Databases PKDD’01,
Freiburg (D), September 6, 2001. pp. 29-38.

[CI-BOU-01d] BOULICAUT Jean-François, CREMILLEUX Bruno : Delta-strong classification

rules for characterizing chemical carcinogens Proceedings of the « Predictive
Toxicology Challenge for 2000-2001 » co-located with the 5th
European Conference on Principles and Practice of Knowledge
Discovery in Databases PKDD’01, Freiburg (D), September 6, 2001. 12

[CI-ABD-01b] ABDENNADHER Slim, RIGOTTI Christophe : Generation of Propagation Rules for

Intentionally Defined Constraints In Proc. of the 13th IEEE Int. Conf. on Tools
with Artificial Intelligence (ICTAI 2001) Dallas, Texas, USA, November

[CI-ABD-01c] ABDENNADHER Slim, RIGOTTI Christophe : Toward Inductive Constraint Solving

In Proc. of the 7th Int. Conference on Principles and Practice of
Constraint Programming (CP 2001) Cyprus, November 2001. Springer-
Verlag Lecture Notes in Computer Science To appear.

[AU-LEL-01] LELEU Marion, BOULICAUT Jean-François, BREIDENSTEIN Timo : Recherche de

cas similaires en présence de données qualitatives et quantitatives par l'extraction de motifs
séquentiels. Actes des posters de la conférence CAP'01, Plate-Forme AFIA
2001, Grenoble (F), Juin 2001, 2 pages.

[CN-CRE-02] CREMILLEUX Bruno, BOULICAUT Jean-François : Utilisation de règles delta-

fortes pour caractériser des classes In : Actes du13e Congrès Francophone
AFRIF-AFIA de Reconnaissance des Formes et Intelligence Artificielle
RFIA'02, Angers (France), 8-10 Janvier 2002. A paraitre.

[CN-MAS-02] MASSON Cyrille, JACQUENET François : Extraction de séquences logiques sous

contraintes In : Actes du 13e Congrès Francophone AFRIF-AFIA de
Reconnaissance des Formes et Intelligence Artificielle RFIA'02, Angers
(France), 8-10 Janvier 2002. A paraitre.

[CN-LEL-02] LELEU Marion, BOULICAUT Jean-François : Signatures de situations boursières

représentées par des séquences d ‘événements In: Actes des Journées
francophones d’Extraction et de Gestion des Connaissances EGC'02,
Montpellier, 21-23 janvier 2002. Hermès. A paraître.

[CN-CAP-02] CAPELLE Matthieu, BOULICAUT Jean-François, MASSON Cyrille : Extraction de

motifs séquentiels sous contraintes de similarité In: Actes des Journées
francophones d’Extraction et de Gestion des Connaissances EGC'02,
Montpellier, 21-23 janvier 2002. Hermès. A paraître.

[RI-BOU-01] BOULICAUT Jean-François, BYKOWSKI Artur, RIGOTTI Christophe : Free-sets: a

condensed representation of boolean data for the approximation of frequency queries In: Data
Mining and Knowledge Discovery journal DMKD, Kluwer Academic
Publishers, Accepted for publication, November 2001.

S-ar putea să vă placă și