Sunteți pe pagina 1din 3

A) Les mthodes par modle Cette logique se base sur la modlisation des groupes et utilise des modles pour

classer des points. Par exemple, lalgorithme CobWeb se base sur une mthode de conceptual Clustering (cration de prototypes). Il a t propos par D. Fisher . Il travaille uniquement sur des attributs nominaux. Lalgorithme CobWeb nest pas trs performant pour le regroupement de donnes appartenant de grandes bases de donnes. Lordre dans lequel sont insrs les nouveaux objets peut faire varier les rsultats du tout au tout. [1] 1.Lalgorithme COBWEB Lalgorithme cobweb est un algorithme de classification incrmental, hirarchique, de formation de concepts. Les objets sont prsents un par un la hirarchie de concepts. Un objet x prsent la hirarchie sera insr dans le concept racine, puis rcursivement dans le concept le plus adapt, en modifiant larbre par diffrents oprateurs. Si le concept courant cest une feuille, lobjet est intgr au concept sil correspond suffisamment. Sil ne correspond pas, un nouveau concept est cr. Si ce nest pas une feuille, diffrents oprateurs sont alors tests sur le concept c pour voir si un nouveau concept est cre. Lalgorithme utilise lindice de prdictivit pour faire ce choix. Le meilleur rsultat est appliqu et lalgorithme se poursuit rcursivement avec le concept o x a t intgr. [2] COBWEB construit ses concepts de faon incrmentale hirarchique grce quatre oprateurs : Incorporate pour ajouter une instance un concept existant. Create pour construire un nouveau concept contenant linstance de la partition. Merge qui essaie de combiner deux noeuds qui sont identifis comme les meilleurs htes pour une nouvelle instance dentranement. Split qui ralise lopration inverse, cest dire qui tente de remplacer lhte par ses enfants pour spcialiser un concept. [3] Cet algorithme utilise un critre d'optimisation appel l'utilit ou Category Utility CU . L'utilit d'une classe C contenant le descripteur de valeur v se mesure par le produit des probabilits P(A = v), P(A = v|C) et P(C|A = v). P(A = v) est la probabilit que le descripteur A prenne la valeur v, P(A = v|C) est la probabilit que A prenne la valeur v dans la classe C et P(CjA = v) est la probabilit de rencontrer la classe C sachant que A = v. L'expression de l'utilit, aprs reformulation grce la loi de Bayes, est : U =1/n P(C) ( (Cc) (vdom(A) ( P(A = v|C) - P(A = v) ) ) O : n est le nombre de classes. C l'ensemble de toutes les classes. A l'ensemble de tous les descripteurs. dom(A) l'ensemble des valeurs (ou domaine) du descripteur A.

COBWEB : Algorithme incrmental de classification conceptuelle hirarchique. Entres : Le noeud courant N de la hirarchie de concepts et xi une nouvelle instance incorporer. Sortie : Une hirarchie de concepts classifiant l'instance xi. Procdure COBWEB(N,xi) Si N est un noeud terminal (feuille) alors : crer-nouveaux-noeuds-terminaux(N,xi) incorporer(N,xi) Sinon incorporer(N,xi) Pour chaque noeud fils C de N : Calculer le score d'intgration de xi dans C Soit P le noeud avec le plus haut score (SI ), Soit R le noeud avec le deuxime plus haut score, Soit SC le score correspondant la cration d'un nouveau noeud Q = {xi}, Soit SF le score correspondant la fusion des noeuds P et R, Soit SD le score correspondant la division du noeud P (remplac par ses fils), Si SI est le meilleur score alors : COBWEB(P,xi), Sinon si SC est le meilleur score alors : initialiser Q relativement xi, Sinon si SF est le meilleur score alors : O = fusionner(P,R,N) et COBWEB(O, xi), Sinon si SD est le meilleur score alors : diviser(P,N) et COBWEB(N,xi). Fig.1 L'algorithme COBWEB [4]. Crer un nouveau cluster, Fusionner deux clusters en un seul, Diviser un cluster en plusieurs clusters. Ces quatre oprations sont dtailles en figure 2 et viennent en complment de l'algorithme gnral COBWEB report en figure 1, selon le formalisme propos par [4]. fonction incorporer(N,xi) Mettre jour les probabilits de N, Pour chaque attribut A de xi : Pour chaque valeur V de A : Mettre jour la probabilit p(V|N). fonction crer-nouveaux-noeuds-terminaux(N,xi) Crer un nouveau noeud fils M au noeud N, Initialiser les probabilits de M partir des probabilits de N, Crer un nouveau fils O au noeud N, Initialiser les probabilits de O relativement xi. fonction fusionner(P,R,N) Crer un nouveau noeud fils O au noeud N, Mettre jour les probabilits de O par moyenne des probabilits de P et R, Supprimer les noeuds fils P et R de N, Ajouter P et R comme noeuds fils du noeud O, Retourner O. fonction Diviser(P,N) Supprimer le noeud fils P de N, Ajouter chaque noeud fils de P comme nouveau noeud fils de N. Fig. 2 Fonctions auxiliaires de COBWEB.

[1] ECOLE POLYTECHNIQUE DE LUNIVERSITE DE NANTES MASTER DE RECHERCHE INFORMATIQUE DE LYON ANNEE UNIVERSITAIRE 2004/2005 , Memoire du master recherche ECD en collaboration avec lquipe COD du LINA Elabor par : Houda EL ATTAR [2] Laboratoire des Sciences de lImage,de lInformatique et de la Tldtection, cole Doctorale Mathmatiques, Sciences de lInformation et de lIngnieur, UMR 7005 UDS/CNRS, par Germain Forestier, prsente pour obtenir le grade de Docteur de lUniversit de Strasbourg ,Discipline : Informatique . [3] UNIVERSIT DES SCIENCES ET TECHNOLOGIES DE LILLE U.F.R. DI.E.E.A. Numro dOrdre : 3368 Anne : 2003 , pour obtenir le grade de DOCTEUR DE LU.S.T.L. DISCIPLINE : INFORMATIQUE prsente et soutenue publiquement, le 26 Novembre 2003, Par LAETITIA JOURDAN [4] Une mthode de classification non-supervise pour l'apprentissage de rgles et la recherche d'information Thse prsente pour l'obtention du grade de Docteur de l'Universit d'Orlans, Discipline Informatique, par Guillaume Cleuziou, Soutenue le 8 dcembre 2004.

S-ar putea să vă placă și