Sunteți pe pagina 1din 73

1

PRIERE DE BIEN VOULOIR MODIFIER, COMPLETER, AVEC UNE POLICE COLOREE ET ENVOYER LE TOUT A Michel.Roux@medecine.univ-mrs.fr MERCI
Attention : les passages avec des ??? ainsi que les passages en rouge sont prciser ultrieurement. TABLE DES MATIERES REDUITE
I Chemin d'accs aux fichiers de travail : ............................................................................................... 5 II Suffixe des fichiers NooJ : ................................................................................................................ 5 III Elments composant l'environnement de travail : ............................................................................ 6 III.1 Pour travailler il faut : ................................................................................................................ 6 III.2 Pour "activer" cet environnement............................................................................................... 6 III.3 Pour mmoriser ........................................................................................................................ 12 IV Ouvertures de textes et corpus ........................................................................................................ 13 IV.1 Ouvertures des textes et corpus par "project" .......................................................................... 13 IV.2 Ouvertures directe des textes et corpus .................................................................................... 14 V Cration de textes et corpus ............................................................................................................ 19 V.1 Cration d'un texte. (File->New->text) ....................................................................................... 19 V.2 Cration d'un corpus. (File->New-> corpus)............................................................................... 19 VI Definir les preferences. ................................................................................................................... 22 VI.1 L'onglet "General".................................................................................................................... 22 VI.2 L'onglet "Lexical analysis"....................................................................................................... 22 VI.3 Onglet "Syntactic analysis". ..................................................................................................... 24 VII Linguistic analysis : Traitement lexical et syntaxique. ................................................................... 25 VII.1 Mise en place des ressources ncessaires :............................................................................... 26 VII.2 Lancement ................................................................................................................................ 26 VII.3 Rsultats ................................................................................................................................... 27 VIII Les dictionnaires.......................................................................................................................... 34 VIII.1 Diffrences par rapport INTEX.......................................................................................... 34 VIII.2 Format ................................................................................................................................... 35 VIII.3 Ouvrir un dictionnaire :......................................................................................................... 38 VIII.4 Compiler un dictionnaire. ..................................................................................................... 39 VIII.5 Les descriptions flexionnelles :............................................................................................. 40 VIII.6 Crer un dictionnaire :........................................................................................................... 44 IX Creation de grammaires .................................................................................................................. 46 IX.1 Les grammaires ........................................................................................................................ 46 IX.2 Bases communes des graphes des grammaires. ....................................................................... 46 IX.3 La construction d'une grammaire. ............................................................................................ 59 IX.4 Les spcificits des diffrentes grammaires............................................................................. 62 X Fonction : Locate Pattern ................................................................................................................ 65 X.1 Recherche d'une chane de caractres :........................................................................................ 66 X.2 PERL expression : ....................................................................................................................... 67 X.3 NooJ regular expression : ............................................................................................................ 67 X.4 NooJ grammar : utilisation des graphes syntaxiques................................................................... 69

Version 1.21 b1207

TABLE DES MATIERES


I Chemin d'accs aux fichiers de travail :............................................................................................... 5 II Suffixe des fichiers NooJ : ............................................................................................................... 5 III Elments composant l'environnement de travail : ............................................................................ 6 III.1 Pour travailler il faut : ................................................................................................................ 6 III.2 Pour "activer" cet environnement .............................................................................................. 6 III.2.1. Les "Preferences". ............................................................................................................... 6 III.2.2. Les "Properties"................................................................................................................... 8 III.3 Pour mmoriser........................................................................................................................ 12 III.3.1. Preferences ........................................................................................................................ 12 III.3.2. Properties........................................................................................................................... 13 IV Ouvertures de textes et corpus........................................................................................................ 13 IV.1 Ouvertures des textes et corpus par "project" .......................................................................... 13 IV.2 Ouvertures directe des textes et corpus.................................................................................... 14 IV.2.1. Ouverture directe d'un texte. (File->Open->text) ............................................................. 14 IV.2.1.1 Premier accs; ............................................................................................................... 14 IV.2.1.2 Texte dj prtrait........................................................................................................ 15 IV.2.2. Ouverture directe d'un corpus. .......................................................................................... 17 V Cration de textes et corpus............................................................................................................ 19 V.1 Cration d'un texte. (File->New->text)....................................................................................... 19 V.2 Cration d'un corpus. (File->New-> corpus) .............................................................................. 19 V.2.1. Eclatement d'un fichier...................................................................................................... 19 V.2.2. Cration du corpus. ........................................................................................................... 20 VI Definir les preferences.................................................................................................................... 22 VI.1 L'onglet "General" ................................................................................................................... 22 VI.2 L'onglet "Lexical analysis" ...................................................................................................... 22 VI.2.1. La fentre : ........................................................................................................................ 23 VI.2.2. Les dictionnaires : ............................................................................................................. 23 VI.2.3. Les graphes : ..................................................................................................................... 23 VI.2.4. Les priorits :..................................................................................................................... 24 VI.2.5. L'adjonction de dictionnaires ou de graphes morphologiques. ......................................... 24 VI.3 Onglet "Syntactic analysis"...................................................................................................... 24 VII Linguistic analysis : Traitement lexical et syntaxique. .................................................................. 25 VII.1 Mise en place des ressources ncessaires : .............................................................................. 26 VII.2 Lancement................................................................................................................................ 26 VII.3 Rsultats................................................................................................................................... 27 VII.3.1. Characters.......................................................................................................................... 27 VII.3.2. Tokens ............................................................................................................................... 28 VII.3.3. Annotations ( ancien Vocabulary) .................................................................................... 29 VII.3.3.1 Prsentation.................................................................................................................. 29 VII.3.3.2 Traitement du vocabulaire ........................................................................................... 31 VII.3.3.3 L'option Unknowns du menu:...................................................................................... 33 VII.3.3.4 Le rsultat de l'analyse syntaxique............................................................................... 34 VII.3.4. Exportation des rsultats de l'analyse lexicale. ................................................................. 34 VIII Les dictionnaires. ........................................................................................................................ 34 VIII.1 Diffrences par rapport INTEX. ........................................................................................ 34 VIII.2 Format................................................................................................................................... 35

Version 1.21 b1207

3 VIII.3 Ouvrir un dictionnaire :......................................................................................................... 38 VIII.3.1. Open->Dictionary : ........................................................................................................ 38 VIII.3.2. Lab->dictionary.............................................................................................................. 38 VIII.3.2.1 Bouton Edit : ............................................................................................................... 39 VIII.3.2.2 Bouton Sort : ............................................................................................................... 39 VIII.3.2.3 Bouton Inflect :............................................................................................................ 39 VIII.3.2.4 Bouton Compress :...................................................................................................... 39 VIII.4 Compiler un dictionnaire. ..................................................................................................... 39 VIII.5 Les descriptions flexionnelles :............................................................................................. 40 VIII.5.1. Le dictionnaire :.............................................................................................................. 40 VIII.5.2. Ouvrir un fichier de description des flexions : ............................................................... 41 VIII.5.3. description des flexions. ................................................................................................. 42 VIII.5.3.1 Les commandes :......................................................................................................... 42 VIII.5.3.2 Fonctionnement :......................................................................................................... 43 VIII.5.3.3 Mots composs :.......................................................................................................... 44 VIII.5.4. Affichage des formes flchies. ....................................................................................... 44 VIII.6 Crer un dictionnaire :........................................................................................................... 44 IX Creation de grammaires .................................................................................................................. 46 IX.1 Les grammaires ........................................................................................................................ 46 IX.2 Bases communes des graphes des grammaires. ....................................................................... 46 IX.2.1. Nuds. ............................................................................................................................... 47 IX.2.2. arcs..................................................................................................................................... 48 IX.2.3. Les codes de contraintes lexicales. .................................................................................... 50 IX.2.4. Les options de la fentre graphe. ....................................................................................... 52 IX.2.4.1 Show Exemples : ........................................................................................................... 52 IX.2.4.2 Show structure ............................................................................................................... 52 IX.2.4.3 Show History : ............................................................................................................... 54 IX.2.4.4 Alignement; Prsentation et Zoom ................................................................................ 54 IX.2.4.5 Lock/unlock : ................................................................................................................. 54 IX.2.4.6 New Graph :................................................................................................................... 54 IX.2.4.7 Delete Graph :................................................................................................................ 55 IX.2.4.8 Import Grammar : .......................................................................................................... 55 IX.2.4.9 Export Grammar : .......................................................................................................... 55 IX.2.5. Les variables dans les graphes........................................................................................... 55 IX.2.5.1 Dfinition/cration d'une variable.................................................................................. 55 IX.2.5.2 Valeur contenu dans une variable / Ecriture de la valeur d'une variable:...................... 56 IX.2.5.3 Expression des contraintes lexicales et autres sur les variables: ................................... 59 IX.3 La construction d'une grammaire. ............................................................................................ 59 IX.3.1. De haut en bas.................................................................................................................... 59 IX.3.1.1 C'est le graphe racine. .................................................................................................... 59 IX.3.1.2 Cration des sous graphes.............................................................................................. 60 IX.3.2. De bas en haut.................................................................................................................... 62 IX.3.3. Prcision sur les fichiers grammaires. ............................................................................... 62 IX.4 Les spcificits des diffrentes grammaires............................................................................. 62 IX.4.1. Les graphes syntaxiques. ................................................................................................... 62 IX.4.1.1 La syntaxe :.................................................................................................................... 62 IX.4.1.2 Les Concordances :........................................................................................................ 63 IX.4.1.3 Les "Annotations":......................................................................................................... 64

Version 1.21 b1207

4 IX.4.2. Les graphes morphologiques............................................................................................. 65 IX.4.3. Les graphes flexionnels..................................................................................................... 65 X Fonction : Locate Pattern................................................................................................................ 65 X.1 Recherche d'une chane de caractres : ....................................................................................... 66 X.2 PERL expression :....................................................................................................................... 67 X.3 NooJ regular expression :............................................................................................................ 67 X.3.1. Oprateurs. ........................................................................................................................ 68 X.3.2. Elments connects. .......................................................................................................... 68 X.4 NooJ grammar : utilisation des graphes syntaxiques. ................................................................. 69 X.4.1. Lancement ......................................................................................................................... 69 X.4.2. La fentre Concordance .................................................................................................... 70 X.4.2.1 Description:.................................................................................................................... 70 X.4.2.2 Les fonctions associes:................................................................................................. 73

Version 1.21 b1207

MANUEL D'UTILISATION
PRISE EN MAIN I CHEMIN D'ACCS AUX FICHIERS DE TRAVAIL :
L'excutable et les fichiers associs sont rangs dans un dossier "Program Files\NooJ" Ne pas y toucher, mais simplement crer un raccourci mettre sur le bureau. Les fichiers utilisateurs sont, par dfaut mis dans : C:\Documents and Setting\nom_utilisateur\NooJ\dossier_langue_choisie\

Dans ce dossier NooJ cre automatiquement trois sous dossiers : Lexical Analysis Projects Syntactic Analysis Lexical Analysis recevra les lments ncessaires pour l'analyse lexicale et morphologique. Syntactic Analysis recevra les lments ncessaires pour l'analyse syntaxique. Projects recevra la description d'environnements associant le texte (ou le corpus) rang dans le dossier Projects, les lments lexicaux et syntaxiques choisis pour une exploitation, parmi les lments rangs dans les 2 dossiers Lexical Analysis et Syntactic Analysis.

II SUFFIXE DES FICHIERS NOOJ :


Fichiers manipulables par l'utilisateur : Suffixe Nature du fichier .dic Dictionnaires non compils .nod Dictionnaires compils .nom Grammaires (graphes) morphologiques .def Descriptif colonnes fentre vocabulaire .nog .noj .nof .flx Grammaires (graphes) syntaxiques Preferences : mmorise les ressources Grammaires (graphes) flexionnels Informations, pour gnrer les flexions Dossier le contenant par dfaut C:\...\NooJ\langue\ Lexical Analysis C:\...\NooJ\langue\ Lexical Analysis C:\...\NooJ\langue\ Lexical Analysis C:\...\NooJ\langue\ Lexical Analysis C:\...\NooJ\langue\ Syntactic Analysis C:\...\NooJ\langue\Projects\Projects_dir C:\...\NooJ\langue\ Lexical Analysis C:\...\NooJ\langue\ Lexical Analysis

Version 1.21 b1207

6 Fichiers propres au systme Nooj, que l'utilisateur ne doit pas modifier: Suffixe Nature du fichier Dossier le contenant par dfaut .nop Projects : description des "outils" utiliser C:\...\NooJ\langue\Projects .noc Descriptif du Corpus traiter C:\...\NooJ\langue\ Lexical Analysis .xml Informations sur le contenu d'un corpus C:\...\NooJ\langue\ Projects\Corpus.noc_dir ATTENTION :tous les fichiers qui commencent par _ (Underscore) sont remis jour (cras par les nouveaux) chaque chargement d'une nouvelle version. Exemple : _properties. Si on veut conserver son propre fichier, il faut enlever le _ avant la mise jour et restituer ce "_" aprs avoir supprim le fichier recopi au lancement de la nouvelle version (Si on rpond oui la question : Update resources?). En effet le fichier utilis par NooJ est toujours _properties.

III

ELMENTS COMPOSANT L'ENVIRONNEMENT DE TRAVAIL :

III.1 POUR TRAVAILLER IL FAUT :


Un texte (ou plusieurs textes : Corpus) que l'on ouvre en dbut de travail. Rang par dfaut dans "Projects". Des dictionnaires et si besoin des graphes morphologiques rangs par dfaut dans le dossier "Lexical Analysis" Des graphes syntaxiques rangs dans le dossier "Syntactic Analysis". Cela suppose que l'on ait, au pralable slectionn la langue dans la quelle on veut travailler. Ces lments ne sont pas tous indispensable en fonction du travail que l'on veut effectuer : Une tude du vocabulaire, une analyse morphologique ne ncessite pas la prsence de graphes syntaxiques.

III.2 POUR "ACTIVER" CET ENVIRONNEMENT


III.2.1. LES "PREFERENCES". Cette "activation" est ralise par l'option "Preferences" du menu "Info". (Info->Preferences")

Version 1.21 b1207

Le premier choix faire est celui de la langue dans la quelle on veut travailler. En suite pour "activer" cet environnement, il faut slectionner dans les dossiers Lexical Analysis et Syntactic Analysis, les lments dont on veut se servir. Rappel : les dossiers Lexical Analysis et Syntactic Analysis sont par dfaut dans le dossier : C:\Documents and settings\Votre nom\NooJ\Langue utilise Ces dossiers peuvent, en effet, contenir des lments destins crer d'autres environnements de travail. Les ressources prises en compte sont celles qui ont t coches. EX. Lexical analysis : les fichiers dictionnaires compils (.nod) et les fichiers de grammaires morphologiques (.nom).

La construction de ces "Prfrences" est dtaille au paragraphe VI Seuls les lments cochs seront utiliss par NooJ.

Version 1.21 b1207

8 III.2.2. LES "PROPERTIES". On y accde par File->Open->Properties definition->fentre d'ouverture. Il faut choisir une des fichiers .def

Affichage du fichier "Properties" par dfaut. Cette fentre comporte la description des colonnes de la fentre prsentant le vocabulaire sous forme de table. La fentre "Annotation" est disponible en cliquant dans le menu droulant de la fentre texte. Elle affiche les rsultats de l'analyse linguistique d'un texte. Par dfaut le rsultat de l'analyse lexicale (le vocabulaire reconnu est prsent sous l'un des formats des dictionnaires NooJ. Dans cette presentation des rsultats lexicaux, les informations contenues dans "Properties" ne sont pas utilises.

Version 1.21 b1207

L'affichages sous forme de table est obtenu en cliquant (click droit) sur le bandeau de la fentre au format dictionnaire. On choisi l'option "View as table" du menu droulant.

Version 1.21 b1207

10 Le rsultat est :

Dans la fentre "Properties.def", la premire lettre (en majuscule) de chaque ligne est le code de la catgorie syntaxique, catgorie la quelle on affecte des proprits. Ces proprits sont celles que l'on a utilises dans les dictionnaires. Ces proprits sont dites "pertinentes" pour la catgorie syntaxique correspondante. Exemple : V_Nb = s + p V est le code de la catgorie syntaxique "verbe". Nb est le nom que l'on donne une colonne de la fentre "Vocabulary". Il correspond a la dclinaison du nombre du verbe. Les codes s et p sont les valeurs, exclusives entr'elles, qui codent les valeurs du nombre, s pour singulier, p pour pluriel. Exemple : N_Gender Cette ligne de la fentre "Properties" permet la colonne "Gender" de la fentre "Annotation" sous forme de table (pas encore enregistre d'o la mention "Untitle"), de regrouper les valeurs m (masculin), f (fminin) ou n (neutre). Exemple : N_Distribution. Cette ligne de la fentre "Properties" permet la colonne "Distribution" de la fentre "Annotation" sous forme de table de regrouper les valeurs listes dans la (les) ligne (s) N_Distribution de la fentre "Properties".

Version 1.21 b1207

11

Affichage d'un fichier "Properties" complt par des codes utilisateurs.

Version 1.21 b1207

12

III.3 POUR MMORISER


III.3.1. PREFERENCES Pour mmoriser les lments slectionns dans l'option "Preferences" et le (ou les) texte(s), dans le menu "Project", cliquez sur "Save Configuration as Project". Ainsi tous les lments de travail sont mmoriss, comme cela est indiqu sur la fentre " Project".

Si la fentre "Projet" comporte bien les lments souhaits, il faut la sauvegarder : File->Save (ou Save as). La fentre Windows d'enregistrement apparat. Donnez un nom au projet. Ainsi on peut rcuprer ultrieurement cette configuration en cliquant dans le menu "Project" sur l'option "Run Project". L'intrt est, entr'autre, d'avoir enregistr tout le contexte de travail, au moment de l'enregistrement. Lors de la restitution (Run Project), l'environement d'origine est celui enregistr, mme si depuis les fichiers ont t modifis (Dictionnaires, grammaires,) On quitte un projet (fin du travail) en cliquant dans le menu "Project" sur l'option "Close Project".

Version 1.21 b1207

13 III.3.2. PROPERTIES. Il faut enregistrer le fichier "Properties" aprs modification. Soit Ctrl+s; soit Fichier->Save Attention, lors des mises jour de NooJ, ce fichier est cras par le nouveau. Si vous avez complt ce fichier avec des informations qui vous sont propres, il faut faire une copie de ce fichier, en changeant le nom (Par Ex. en supprimant le "_").

IV

OUVERTURES DE TEXTES ET CORPUS

IV.1 OUVERTURES DES TEXTES ET CORPUS PAR "PROJECT"


Squence de clics "Project->Run Project". Fentre "Project"

Dans la fentre Windows d'ouverture, choisir un projet (.nop) existant. Par dfaut le dossier ouvert est le dossier "Project" Apparat alors la fentre du texte, la fentre documentation (o l'on note les remarques personnelles sur le travail en cours).

Version 1.21 b1207

14 Tous les lments ayant t utiliss au moment o a t enregistr le projet (toutes les ressources utilises) sont disponibles. Si vous cliquez "Info->Preferences", vous retrouvez la liste des ressources prcdemment slectionnes pour ce projet.

IV.2 OUVERTURES DIRECTE DES TEXTES ET CORPUS


IV.2.1. OUVERTURE DIRECTE D'UN TEXTE. (FILE->OPEN->TEXT) La fentre Windows d'ouverture de fichier comporte par dfaut le format de fichier ".not", c--d fichier dj prtrait, donc mis aux normes NooJ. Deux possibilits : IV.2.1.1 Premier accs; Soit le texte est ouvert pour la premire fois, ou dj ouvert mais non trait avec "Linguistic analysis", alors choisir le format de fichier : "Import Text", choisir le fichier, puis "ouvrir". La fentre "Import Text" apparat, elle introduit la possibilit de prtraitements. Dans cette fentre choisir la langue et le type de codage du texte utiliser (Attention les fichiers Windows.txt, doivent tre dcods avec le type :"Western European Windows 1252"). Dfinir aussi le dlimiteur des units de texte (Units linguistiques). ATTENTION le choix du dlimiteur est important, c'est le dcoupage du texte en units qui seront traits indpendamment. Cliquer sur "OK. C'est le prtraitement. Fentre de lancement du prtraitement.

Version 1.21 b1207

15 La nouvelle fentre, de type texte, porte le nom du fichier ouvert et correspond au fichier du texte prtrait au format NooJ : ".not". En cliquant sur le bouton droit un menu s'affiche : il liste les exploitations possibles sur le texte (Linguistic Analysis, Locate Pattern,). Si on ne lance pas d'exploitation, penser sauvegarder la fentre pour conserver le fichier ".not". Fentre d'affichage d'un texte

REMARQUE : Il y a deux ascenseurs. L'ascenseur intrieur permet de "petits" dplacements. L'extrieur permet de se dplacer dans tout le texte. IV.2.1.2 Texte dj prtrait. Soit le texte a t prtrait et il existe un fichier de mme nom suffix ".not". Le fichier .not est affich (Dans cette fentre de type texte) dans le dernier tat dans lequel il a t enregistr : soit simplement prtrait, soit trait linguistiquement. Dans ce cas les rsultats lexicaux sont affich dans le champ de fond blanc : Caracters, Tokens, Annotations, Unknowns, ce qui permet de consulter les listes de caractres, tokens (liste des mots recontrs et leur frquence), Digrams (liste de doublons et leur frquence), le vocabulaire reconnu et non reconnu pour ce texte. Pour les fentres Tokens et Digrams vous observez des boutons de couleurs. Un click sur l'un d'eux dclenche la constitution d'une "Concordance", c'est--dire la recherche dans le texte en cours de l'lment slectionn dans cette fentre (Tokens ou Digrams). Le texte retrouv est affich dans une fentre "Concordance", les caractres ayant la couleur du bouton choisi pour dclencher la recherche.

Version 1.21 b1207

16

Rsultat d'un click sur l'lment "bacterium fungus" de la fentre "Digrams".

Version 1.21 b1207

17 IV.2.2. OUVERTURE DIRECTE D'UN CORPUS. Un corpus est un ensemble de textes, textes qui seront traits simultanment. (Trs utile pour le traitement de textes de type dpches). File->Open-> corpus donne la fentre suivante Fentre corpus

Le "status OK" signifie que les textes (un par fichier) ont t prtraits. Ds lors on peut lancer les exploitations (Clic droit). Fentre Traitement de corpus

Version 1.21 b1207

18 ??????????????????????? La colonne "Status" peut comporter des XX. Cela indique que ces fichiers n'ont pas subit de traitement lexical. ??????????????????????? Le fichier: corpus.bin contient toutes les informations relatives au corpus : les noms des fichiers, les preferences et format, etc. En principe ce fichier est toujours mis a jour lorsquon ferme le corpus : il faut attendre que NooJ ferme le corpus proprement :

Version 1.21 b1207

19

V CRATION DE TEXTES ET CORPUS V.1 CRATION D'UN TEXTE. (FILE->NEW->TEXT)


Une fentre de type texte, de nom "Untitle" apparat. On y tape le texte que l'on veut. On est alors dans le premier cas ci-dessus d'un fichier ouvert pour la premire fois. Ne pas oublier de l'enregistrer.

V.2 CRATION D'UN CORPUS. (FILE->NEW-> CORPUS)


Soit les fichiers textes inclure dans le corpus existent dj, soit l'on veut "clater" un fichier texte en plusieurs fichiers. V.2.1. ECLATEMENT D'UN FICHIER. Cette procdure construit un corpus (voir le paragraphe suivant) l'aide des fichiers issus de l'clatement d'un fichier. Utiliser le menu "Lab->Split a file text". Fentre cration d'un corpus

Version 1.21 b1207

20 En cliquant sur "SPLIT", le fichier d'origine est dcoup en fonction du "Marqueur de fin de texte", indiqu dans le champ "Enter Perl-Style Regular Expression". Ce dernier, pour obtenir un rsultat correct, doit tre prsent la fin du texte d'origine. Une fentre indique la fin du traitement en indiquant le nombre de fichiers gnrs. Ces fichiers sont dans le dossier dsign dans le champ Result->Directory. Par dfaut c'est le dossier Project. Leurs noms sont gnrs par numrotation squentielle partir de zro, accol au nom gnrique donn dans le champ "Base Name". V.2.2. CRATION DU CORPUS. Cliquez sur le menu "File->New->Corpus". Dans la fentre "Create new corpus" qui apparat donnez le nom du corpus crer, cliquez sur "Enregistrer". Aprs l'avoir saisi la fentre suivante apparat:

Dans cette fentre choisir la langue et le type de codage des textes utiliser ainsi que le dlimiteur des units de texte. Cliquer sur "OK". .(Attention les fichiers Windows.txt, doivent tre dcods avec le type :"Western European Windows 1252"). C'est le prtraitement. La fentre qui apparat offre le bouton "Add". Il permet d'intgrer des fichiers textes dans le corpus: Fentre cration d'un corpus. Fentre de lancement du prtraitement. Elle porte le nom qui vient d'tre donn au corpus.

Version 1.21 b1207

21

Un clic sur le bouton Add fait apparatre la fentre Windows"Ouvrir". Slectionnez les fichiers dsirs et cliquez sur "Ouvrir". ??????????????????????????? Ces fichiers apparaissent dans la fentre qui porte le nom que vous avez donn au corpus. La colonne "Status" peut comporter des XX. Cela indique que ces fichiers n'ont pas subit de traitement lexical.

Version 1.21 b1207

22

VI

DEFINIR LES PREFERENCES.

(Info->Preferences) La fentre qui apparat comporte trois onglets.

VI.1 L'ONGLET "GENERAL"

On y choisi la langue par dfaut et les polices utiliser pour les textes et les dictionnaires.

VI.2 L'ONGLET "LEXICAL ANALYSIS"


Il permet de dfinir les ressources lexicales. La fentre "Preferences", onglet "Lexical analysis" affiche les prfrences dj enregistres condition que le contenu du dossier "Lexical Analysis" n'ait pas t modifi. Si les fichiers lexicaux n'ont pas t modifis, ils sont affichs tels qu'ils taient lors de la dernire sauvegarde des "Preferences". On peut slectionner ou dslectionner les ressources lexicales ncessaires au travail en cours. Cet onglet comporte deux parties : la suprieure affiche les dictionnaires sous leur forme "compile" (Suffixe .nod), l'infrieure affiche les graphes morphologiques. Si des fichiers lexicaux ont t supprims : ils ne sont plus affichs dans cette fentre. Si des fichiers lexicaux ont t ajouts : ils apparaissent dans la fentre, non slectionns (non cochs). Pour ces nouveaux fichiers : fixer les priorits en slectionnant un fichier aprs l'autre et en cliquant sur la lettre H, R ou L. Pour H et L, chaque click sur la lettre fait augmenter la priorit de 1. (Ex. 5 clicks sur H donne la priorit H5).

Version 1.21 b1207

23 VI.2.1. LA FENTRE :

Les ressources prises en compte sont celles qui ont t coches. Elles comportent des dictionnaires et des graphes morphologiques. Les priorits sont importantes. Voir ci-dessous. VI.2.2. LES DICTIONNAIRES : Nous les tudierons en dtails au chapitreVIII. On y accde par Lab->Dictionary. On n'accde qu' la version texte (suffixe .dic). On peut y accder aussi par File->Open->Dictionary, mais uniquement en consultation. On ne peut pas compiler. Plusieurs formats de lignes sont possibles 2 champs et 3 champs : VI.2.3. LES GRAPHES : Ce sont des graphes morphologiques (suffixe .nom) ou flexionnels (.nof). Nous les tudierons en dtails au chapitre (IX.4.2 et IX.4.3). Leur objectif est d'analyser les mots, de les dcomposer. Par exemple pour reprer les prfixes, suffixes, racines. Leurs "sorties" ont le format d'une ligne de dictionnaire. Leurs nuds peuvent comporter des contraintes lexicales.

Version 1.21 b1207

24 VI.2.4. LES PRIORITS : Les niveaux vont de H9 le plus prioritaire jusqu' L9, le moins prioritaire, en passant par le niveau "zro", cod "R". Ils dfinissent l'ordre de dclenchement des ressources lexicales. Pensez cocher la case de slection pour utiliser les fichiers que vous souhaitez. C'est le dernier "Preferences" utilis qui est activ par dfaut, sauf dans le cas ou ayant ouvert un projet, donc une " Preferences", on ferme le projet (Project->Close Project). C'est la " Preferences" active avant l'ouverture du projet qui redevient la " Preferences" active. Attention le rsultat de l'analyse lexicale dpend totalement des priorits donnes aux diffrents dictionnaires et aux graphes morphologiques. Que ce soit pour les dictionnaires ou les graphes morphologiques, les principes sont les mmes. Si les priorits sont les mmes, le rsultat est l'union des rsultats obtenus par la consultation des dictionnaires et les "sorties" des graphes morphologiques. Si la priorit d'un dictionnaire (ou d'un graphe) est suprieure celle d'un autre dictionnaire (ou d'un graphe), toute entre reconnue par le plus prioritaire, arrte la recherche. Les dictionnaires de priorits infrieures ne sont pas consults. (Idem pour les graphes). Usages courants. Si l'on dispose d'un dictionnaire spcialis destin l'analyse de textes correspondants, attribu ce dictionnaire une priorit suprieure au dictionnaire standard, permet de lever de nombreuses ambiguts. Les mots reconnus par ce dictionnaire ne sont pas soumis au dictionnaire standard. A oter que le dictionnaire standard comporte tous les lexmes possibles pour un mot. Exemple "la" : dterminant, pronom, nom (la note de musique). A l'oppos la plus part des graphes morphologiques ne sont mettre en uvre que si la recherche dans les dictionnaires est reste infructueuse. Exemple le graphe morphologique de reconnaissance des noms propres. VI.2.5. L'ADJONCTION DE DICTIONNAIRES OU DE GRAPHES MORPHOLOGIQUES. Dans l'onglet sont affichs les dictionnaires et graphes morphologiques prsents dans le dossier par dfaut : C:\Mes Documents\NooJ\langue\Lexical Analysis. Pour faire figurer un nouveau dictionnaire ou graphe dans l'onglet, soit on recopie ce nouvel lment depuis le dossier o il figure, dans le dossier par dfaut; soit on utilise le bouton "Import File" de l'onglet.

VI.3 ONGLET "SYNTACTIC ANALYSIS".


Cette fentre donne lessources syntaxiques possibles et/ou actives. Les manipulations d'ajout ou de suppression de fichiers (ici suffixs .nog) sont les mmes que pour l'onglet "Lexical Analysis". La colonne "Order" dfinit la hirarchie de lancement des grammaires. S'il n'y a pas de numro d'ordre la grammaire sans numro est ignore (elle n'est pas lance). Attention la notion de graphe diffre de celle d'INTEX. On a pu remarquer que dans les menus c'est le mot grammaire qui remplace le mot graphe. Une grammaire NooJ est un ensemble de graphes enregistrs dans un fichier unique qui porte le nom de la grammaire. Les grammaires et les graphes sont tudis en dtails dans le paragraphe (IX).

Version 1.21 b1207

25

Ici seul la grammaire "Type_Admit" sera lance lors de l'analyse linguistique. Dans le cas suivant, localisation_Spatiale est lance en premier, puis Localisation_Temporelle.

VII

LINGUISTIC ANALYSIS : TRAITEMENT LEXICAL ET SYNTAXIQUE.

Version 1.21 b1207

26

VII.1

MISE EN PLACE DES RESSOURCES NCESSAIRES :

Vrifier que l'on dispose des dictionnaires ncessaires au traitement. Attention ils doivent tre compils : extension .nod. Si non ouvrir les dictionnaires .dic au format NooJ (Lab>dictionary). Si ils sont au format INTEX les ouvrir en changeant "Fichier de type" de "NooJ dictionnary (.dic) en DELA/INTEX dictionary. Vrifier que les graphes morphologiques sont, avec les dictionnaires, dans le dossier "Lexical Analysis". Si l'ouverture du ou des textes ne s'est pas faite par l'ouverture d'un projet (dans ce cas les prfrences ont t sauvegardes), il faut vrifier si les "Preferences" ont bien t mmorises. Si non, slectionner les ressources lexicales dans Info-> Preferences. Cliquez sur "Import file" pour slectionner les fichiers ".nod" correspondant aux dictionnaires que vous souhaitez s'il n'y sont pas dj (et cochez la case de slection), puis les fichiers correspondant aux graphes morphologiques ".nom". Ouvrir, si ce n'est dj fait, soit un corpus, soit un texte unique (Voir ouverture de texte IV).

VII.2

LANCEMENT

Dans la fentre corpus ou texte, en cliquant sur le bouton droit de la souri quatre options apparaissent : Linguistic analysis et Locate Pattern, Export Annotations as XML tags, Modify text.

Cliquer sur Linguistic analysis : les ressources lexicales sont appliques, ainsi que les ressources syntaxiques. ATTENTION : Linguistic analysis se dcompose en deux tapes o La premire : analyse lexicale l'aide des dictionnaires (dans l'ordre impos par les priorits) et des grammaires morphologiques et flexionnelles. o La seconde : analyse syntaxique du texte l'aide des grammaires actives dans la fentre Infos->Preferences. Le numro d'ordre affect aux grammaires est celui dans le quel les grammaires sont lances les unes aprs les autres. o Les rsultats sont stocks avec les texte d'origine NON MODIFIE, dans fichiers de texte au format NooJ : .not Dans le cas d'un corpus le rsultat donne aussi des fichiers de texte au format NooJ : .not, et de statut "OK". Dans les deux cas, le champ droulant situ en haut (fond blanc) donne les accs aux rsultats : Characters, Tokens, Digrams, Annotations, Unknown.

Version 1.21 b1207

27

Pour modifier le texte, il faut cliquer sur le bouton correspondant. Ds lors, s'il y avait eu une analyse linguistique, les rsultats de celle-ci sont effacs. Pour afficher le rsultat de (ou des) analyse (s) syntaxique (s), cochez la case "Show Annotations: Y figurent les lemmes des mots reconnus avec leurs caractristiques trouves dans les dictionnaires, mais aussi les squences reconnues et traduites par le transducteur correspondant la grammaire lance. Ci-dessous LOCALISATION+Orientation(in)+ a t gnr par une grammaire syntaxique.

VII.3

RSULTATS

VII.3.1. CHARACTERS Aprs le click sur " Characters", la fentre suivante donne la frquence, le type et le code Unicode de chaque caractre trouv.

Version 1.21 b1207

28

VII.3.2. TOKENS

Version 1.21 b1207

29 Les "Tokens sont classs par ordre alphabtique, ainsi que les "Digrams". Ces derniers sont des couples de mots rencontrs dans le texte. En cliquant sur la colonne "Freq", ces rsultats sont classs par ordre dcroissant. En cliquant sur un des boutons colors on dclenche la recherche d'un doublons slectionn dans la fentre. Ce doublon apparat dans une fentre "Concordance", color de la mme couleur que le bouton dclencheur.

VII.3.3. ANNOTATIONS ( ANCIEN VOCABULARY) VII.3.3.1 Prsentation Le "calcul" des lments du vocabulaire se fait lors du lancement de "Linguistic analysis", par click droit sur le bandeau de la fentre du texte. L'affichage concerne le vocabulaire reconnu grce aux ressources lexicales dfinies dans la "Preferences". (Lexical Entry). A l'affichage, seule la mise en page est effectue, ce qui peut prendre plusieurs secondes s'il s'agit d'un vocabulaire volumineux. Dans les versions partir de V1.21 b1007, l'affichage du vocabulaire se fait par click sur le bouton "Annotations".

Le vocabulaire reconnu s'affiche au format dictionnaire.

Version 1.21 b1207

30

Si l'on veut afficher la table comportant tous les renseignements lexicaux, il faut faire apparatre par click droit le menu qui comporte l'option "View as table"

Version 1.21 b1207

31

Ces listes peuvent aussi tre ordonnes par ordre dcroissant. VII.3.3.2 Traitement du vocabulaire Cette fentre comporte un nombre de colonnes variables. (Agrandir la fentre si besoin). Colonnes toujours prsentes : l'entre lexicale elle-mme, le lemme, la catgorie syntaxique. Colonnes optionnelles : Elles reprsentes les diffrents attributs syntaxiques ou smantiques qui ont t prciss dans les dictionnaires (Ex. le temps d'un verbe, le genre, le nombre, la catgorie smantique,). Le nombre de ces colonnes peut tre rduit en utilisant des codes groups. (Voir le paragraphe sur "Properties" III.2.2). En cliquant sur la tte d'une colonne NooJ ordonne la fentre par ordre croissant dans cette colonne.(Les blancs en tte). Dans une colonne on peut trouver : o Rien : l'attribut (la proprit) n'est pas prsent pour ce mot et n'est pas une proprit qualifie de pertinente car dcrite dans "Properties". o - : l'attribut (la proprit) n'est pas prsent pour ce mot mais est une proprit qualifie de pertinente car dcrite dans "Properties". o + : l'attribut (la proprit) est prsent pour ce mot, proprit qui est une proprit pertinente. Par click droit sur cette fentre on obtient le menu suivant :

Version 1.21 b1207

32

Check Format : lance le contrle des lignes du dictionnaire : conformit avec la syntaxe des dictionnaires Nooj. Find/Replace/ C'est l'dition du dictionnaire des mots identifis dans le texte. Sort : classement des lignes par ordre alphabtique. View as Table / View as list : changement de la prsentation du vocabulaire.

Version 1.21 b1207

33 VII.3.3.3 L'option Unknowns du menu: On clique sur cette option:

Elle donne la liste des mots non reconnus, sous le format des dictionnaires.

Version 1.21 b1207

34 VII.3.3.4 Le rsultat de l'analyse syntaxique. Rappel : les grammaires qui figurent, avec un numro d'ordre, dans l'onglet "Syntactic Analysis" de la fentre "Preferences" sont automatiquement lances lors de l'analyse linguistique. Pour afficher les rsultats de cette analyse il faut cocher la case "Show annotation" de la fentre du texte:

Le rsultat donne les lments reconnus avec leurs caractristiques et le numro du caractre o commence l'lment reconnu. VII.3.4. EXPORTATION DES RSULTATS DE L'ANALYSE LEXICALE. Le vocabulaire reconnu et non reconnu peut tre export. Par dfaut il est mis au format des dictionnaires. Pour le vocabulaire reconnu, les attributs figurant dans les dictionnaires utiliss pour l'analyse, sont retranscrits.

VIII LES DICTIONNAIRES.


Il existe 2 chemins d'accs aux dictionnaires : File->Open->dictionary : pour une consultation, sans possibilit de compilation. Lab->dictionary : qui permet la plus part des manipulations.

VIII.1

DIFFRENCES PAR RAPPORT INTEX.

Par rapport INTEX, il n'y a plus de limite au nombre de dictionnaires actifs. Les dictionnaires de mots simples ou d'expression composes de plusieurs mots, n'ont plus tre spars. L'ordre alphabtique n'est plus exig, mais l'option tri par ordre alphabtique demeure possible, se qui est commode pour la maintenance des dictionnaires. Les blancs et les commentaires sont ignors par le tri; ils restent donc leur place, seul les mots sont classs.

Version 1.21 b1207

35

VIII.2

FORMAT

Les commentaires sont prcds en tte de ligne par le caractre # Attention : ne pas modifier les premires lignes : elles servent NooJ pour reconnatre un dictionnaire des autres fichiers. Les "." sont remplacs par "," et les ":" sont remplacs par "+" Les formats type : 2 et 3 champs Format 2 champs : o Constitution : Entre lexicale, attributs syntaxiques et smantiques. o Il n'y a qu'une virgule et pas de blans entre les lments.. o Le lemme retourn est identique l'entre lexicale si l'on n'a pas dclar de flexion. Au contraire d'INTEX, NooJ ne gre pas des DELAFs (dictionnaires de formes) mais des DELAS (dictionnaires de lemmes). Il faut donc entrer : Africa,N+Go+f+s Gabon,N+Go+m+s C'est l le grand intrt de NooJ par rapport INTEX : o Si l'entre est gale au lemme (i.e. il n'y a pas de flexion) alors rien a faire cela marche tout seul. o Si l'entre a une flexion, alors il faut ajouter une proprit FLX. Ex: stylo,N+FLX=Crayon Ce qui indique NooJ comment flchir l'entre (Ici mme flexion que pour le mot crayon). Ensuite il faut dcrire la flexion dans un autre fichier (File > open Inflectional description). Voir ci-dessous. La gnration des formes flchies est ralise lors de la consultation du dictionnaire pour la reconnaissance des mots. Lors de la compilation du dictionnaire, des informations relatives aux flexions ont t intgres dans le fichier .nod. Il est ncessaire de compiler les dictionnaires : la fonctionnalit "Lexical Analysis" n'utilise que les fichiers compils (.nod). De mme la fonctionnalit "Preferences" n'affiche que les fichiers compils. Format 3 champs : o Constitution : Entre lexicale,super-lemme, attributs syntaxiques et smantiques. o Il y a 2 virgules. o Le lemme retourn est le "super-lemme". o Les flexions possibles doivent tre dcrites dans un fichier .flx Donc ATTENTION les fichiers ".dic" comportent de plusieurs formats : Lemmes : Ex. aider,V+t+FLX=Aimer Entres lexicales : Ex. aiderais,aider,V+t+FLX=Aimer+C+1+s Si les fichiers d'entres lexicales ont t gnrs automatiquement, leurs noms comportent "-flx" accol la racine du nom.

Version 1.21 b1207

36

Les attributs particuliers : +FLX Il renvoi vers un fichier de descriptions des flexions possibles pour l'entre. +UNAMB : spcifie que si l'entre lexicale a t reconnu, il ne sera procd aucune autre recherche dans les autre dictionnaires et graphes morphologiques. (Attention aux priorits) Il n'y a pas de blanc entre les diffrents champs.

Version 1.21 b1207

37 Entre lexicale composes par plusieurs mots. Elles comportent les deux variantes 2 ou 3 champs:

Remarque : Nooj accepte que tous ces diffrents formats cohabitent dans un mme fichier dictionnaire. Il appartient l'utilisateur de fractionner, ou non, ses dictionnaires. Le fractionnement peut tre utile pour maintenir le vocabulaire jour, sans avoir manipuler des fichiers trop vomumineux.

Version 1.21 b1207

38

VIII.3

OUVRIR UN DICTIONNAIRE :
OPEN->DICTIONARY :

Deux possibilits : VIII.3.1. Ne permet que d'accder au fichier .dic, sans possibilit de compiler (ce qui est obligatoire pour que le dictionnaire soit utilisable) Par dfaut la fentre Windows d'ouverture s'ouvre dans le dossier : "Lexical Analysis" o se trouvent, par dfaut, tous les dictionnaires.

Check : pour vrifier le format des entres lexicales. Find/.: pour diter le dictionnaire Sort : pour trier les entres lexicales par ordre alphabtique. View as table : prsentation en colonnes dont la prsentation est dcrite dans le fichier _properties. En cliquant sur le bouton droit on voit apparatre un menu comportant 4 commandes. ATTENTION : toute modification apporte ici, au fichier dictionnaire doit tre compils.

VIII.3.2.

LAB->DICTIONARY

Deuxime solution pour traiter un dictionnaire: y accder par Lab->dictionary. La fentre suivante apparat :

Version 1.21 b1207

39

VIII.3.2.1 Bouton Edit : Il permet d'diter le dictionnaire, donc de la modifier. Ne pas oublier de le compiler aprs modification. VIII.3.2.2 Bouton Sort : Il permet de trier le dictionnaire par ordre alphabtique. Les lignes commentaires ne sont pas tries, elles restent dans leurs positions d'origine. VIII.3.2.3 Bouton Inflect : Permet d'afficher les formes flchies gnres automatiquement grce aux fichiers de flexions de suffixe .flx VIII.3.2.4 Bouton Compress : Utilisable pour la rcupration des dictionnaires INTEX. Large dictionary pour certains couples de (langues,ordinateur) il n'y a pas assez de mmoire pour compiler le dictionnaire en un seul morceau. Si NooJ n'y arrive pas, alors il faut cocher l'option "Large dictionary", et ca divise le dictionnaire par autant de premires lettres diffrentes pour les entres. Par exemple ca diviserait le dictionnaire du francais par 26 puisqu'il y a 26 entres.

VIII.4

COMPILER UN DICTIONNAIRE.

Gnre le fichier .nod qui comporte toutes les entres lexicales et les informations flexionnelles (s'il y en a) sous forme compile. Inflect : Permet de gnrer les formes flchies partir d'un fichier (.dic) ne comportant que des lemmes et les attributs smantiques. Les attributs syntaxiques sont gnrs automatiquement. Au nom du fichier ainsi transform, NooJ ajoute "-flx" avant le suffixe ".dic". Ces fichiers ne sont pas utiliss par Nooj. Ils sont utiles l'utilisateur pour vrifier la correction des flexions rsultant de l'application des fichiers .flx A chaque modification (diter, modifier automatiquement (REPLACE ALL), ) des dictionnaires on les sauvegarde, voire on fait toutes les sauvegardes (Info > Preferences > General > Multiple backups)

Version 1.21 b1207

40

VIII.5

LES DESCRIPTIONS FLEXIONNELLES :


LE DICTIONNAIRE :

VIII.5.1.

La prsence de l'attribut FLX renvoi vers un fichier de description des flexions. La gnration des flexions se fait lors de la compilation du dictionnaire. S'il y a plusieurs fichiers .flx, ils sont tous consults et le rsultat des flexions est stock dans le fichier compil .nod

On peut dcrire la flexion soit avec des fichiers .flx, soit avec des fichiers .nof. Les fichiers .nof sont des grammaires (collections de graphe) flexionnelles. Une particularit : pas besoin de graphe Main (puisque ce sont plutt des collections de graphes : un graphe par paradigme flexionnel). artiste se flchis selon le type Artiste. bonbon se flchis selon le type Crayon. Le nom d'un type de flexion renvoi vers la description du mcanisme des flexions, dans les fichiers .flx +UNAMB est utilis pour indiquer que si l'entre est reconnue, la recherche dans les autres dictionnaires ne doit pas tre poursuivie. On vite ainsi les ambiguts. Les flexions sont aussi prises en compte pour "les mots composs" : +FLX=nom d'un type de flexion :

Version 1.21 b1207

41

VIII.5.2.

OUVRIR UN FICHIER DE DESCRIPTION DES FLEXIONS :

Open->Inflexional Description. Ils sont contenus dans les fichiers suffixs .flx Ex. pour les verbes:

Ex. pour les noms:

Version 1.21 b1207

42

VIII.5.3.

DESCRIPTION DES FLEXIONS.

Le suffixe de ces fichiers est .flx. VIII.5.3.1 Les commandes :


# # # # # # # # # # # # # # # # # # # # # # Inflectional Description Generic Commands: <B>: keyboard Backspace <D>: Duplicate current char <E>: Empty string <L>: keyboard Left arrow <N>: go to end of Next word form <P>: go to end of Previous word form <R>: keyboard Right arrow <S>: delete/Suppress current char Arguments for commands <B>, <L>, <N>, <P>, <R>, <S>: xx number: repeat xx times W: whole word Examples <R3>: go right 3 times <LW>: go to begin. of word Language-Specific Commands: <A>: remove Accent <>: add acute accent <>: add grave accent

Version 1.21 b1207

43

VIII.5.3.2 Mots simples

Fonctionnement :

o FLX=PlurielIes Dans le fichier dictionnaire (.dic) le mot "city" est dfinit : city,N+FLX=PlurielIes+Go Dans le fichier de dfinition des flexions (.flx) on trouve : PlurielIes=<E>/s+<B1>ies/p; <E>/s signifie : Si le mot compar l'entre lexicale est identique (sans terminaison particulire) cela provoque la gnration de la proprit +s : singulier. <B1> ies/p signifie qu'aprs avoir fait "arrire" d'un caractre sur l'entre lexicale (city -> cit), on ajoute "ies" (cit->cities) pour obtenir la forme flchie comparer au mot reconnatre.

Version 1.21 b1207

44 o FLX=PlurielS Dans le fichier dictionnaire (.dic) le mot "city" est dfinit : america,N+FLX=PlurielS+Go Dans le fichier de dfinition des flexions (.flx) on trouve : PlurielS = <E>/s + s/p; <E>/s signifie : Si le mot compar l'entre lexicale est identique (sans terminaison particulire) cela provoque la gnration de la proprit +s : singulier. s/p signifie que si on ajoute "s" l'entre lexicale on obtient la forme flchie identique au mot reconnatre. VIII.5.3.3 Mots composs :

Soit reconnatre "cousins germains" avec dans le lexique : cousin germain,N+Hum+FLX=CousinGermain CousinGermain renvoi vers le fichier des flexions ci-dessus. Les commandes : s<P>s/m+p signifie que si on trouve "s" la fin du deuxime mot (germains) et un "s" la fin du mot prcdent (<P>) du mot reconnatre, c'est bien une forme flchie, masculin pluriel (m+p) de cousin germain. VIII.5.4. AFFICHAGE DES FORMES FLCHIES.

La compilation d'un dictionnaire n'affiche pas les formes flchies gnres. Pour les afficher il faut utiliser le menu "Lab", sous menu "Dictionary", bouton "Inflect". Cette option affiche l'ensemble du rsultat de la gnration des formes flchies du dictionnaire, mais ne gnre pas le fichier compil (.nod). Ce fichier contenant les flexions ne sert qu' visualiser les formes flchies qui sont, elles, incluses dans le fichier compil .nod.

VIII.6

CRER UN DICTIONNAIRE :

File->New->dictionnary : On commence par le choix de la langue.

Version 1.21 b1207

45

Aprs le click sur OK, apparat la fentre suivante affichant le contenu du dictionnaire en cours de cration. Il ne comporte, videment, aucune entre lexicale. Il comporte des commentaires d'en-tte. Ne pas modifier les premires lignes : elles permettent Nooj de vrifier la nature du fichier.

Il suffit de saisir ligne par ligne les entres lexicales et les attributs. Voir le paragraphe VIII.2

Version 1.21 b1207

46

IX

CREATION DE GRAMMAIRES

IX.1 LES GRAMMAIRES


Une grammaire est un ensemble de graphes qui sont regroups dans un fichier dont le nom est celui de la grammaire. Ces graphes sont hirarchiss. Le graphe "racine" est celui qui porte le nom de la grammaire et qui appelle, dans le cas o il n'est pas unique, des sous graphes. La structure est arborescente ou en rseau. Les grammaires et les graphes qui les composent sont de 3 types diffrents, (Hors les graphes d'INTEX .grf) : Morphologie Pour analyser (transducteurs) la morphologie d'un mot. (Suffixe : .nom) Inflexion Pour analyser (transducteurs) les flexions d'un mot. (Suffixe : .nof) Ces 2 types de graphes relvent des ressources lexicales, donc sont rangs dans Lexical Analysis. Grammar Pour analyser (transducteurs) les textes, donc sont rangs dans Syntactic Analysis. (Suffixe : .nog) Cration de grammaires : File->New->Grammar :

Trois types de grammaires sont possibles. Rappel : une grammaire est compose d'un ensemble de graphes.

IX.2 BASES COMMUNES DES GRAPHES DES GRAMMAIRES.


Quelque soit la catgorie d'un graphe, certains lments sont communs. Aprs un click sur l'un des 3 boutons (Inflexional, Morphological, Syntactic) : la fentre est nomme "Untitle". Lors de son enregistrement le nom qu'on lui donne devient le nom de la grammaire et ce graphe

Version 1.21 b1207

47 est le graphe racine. C'est par ce nom que la grammaire sera lance, commenant par l'excution du graphe racine. IX.2.1. NUDS. La fentre ouverte par un click sur l'un des boutons Inflexional, Morphological, Syntactic : On aperoit le nud d'entre dans le graphe et le nud de sortie. Crer un nud : Ctrl+Click. Un nud vide est cr l'emplacement du curseur : une petite fentre d'dition du nud est ouverte. Suppression d'un nud : On le slectionne en cliquant dessus. Puis on tape sur la touche "Suppr" du clavier. Dplacement d'un nud : cliquez sur le noeud, conservez le bouton de la souri enfonc et dplacez le curseur jusqu' l'endroit choisi. Relchez le bouton.

C'est dans la "petite" fentre que l'on donne les caractristiques du nud. Soit le texte exact que l'on veut reconnatre (Chane de caractres, sans les caractres "<" et ">"). Soit la catgorie syntaxique avec ou sans les attributs (Attributs figurant dans les lexiques). Ces renseignements doivent figurer entre les caractres "<" et ">" Soit un mot (entre lexicale ou forme flchie), suivi des renseignement syntaxiques ou smantiques choisis parmi ceux dfinis dans le dictionnaire servant l'analyse linguistique des textes traiter. Soit le lemme, avec ou sans contraintes lexicales. Soit le nom d'un sous graphe prcd (sans blanc) de ":" Quand la fentre est remplie, la validation se fait avec Ctrl+Entre. o Exemple : sans sous graphe.

Version 1.21 b1207

48 o Exemple : avec sous graphe: appel du sous graphe "Localisation"

IX.2.2. ARCS Pour crer l'arc entre 2 nuds : On slectionne le(s) nud(s) de dpart (Click gauche sur le nud, ou slection par click gauche en dcrivant la zone contenant les noeuds) puis le nud d'arriv. Ds qu'un graphe est modifi, la mention [Modified] apparat dans le bandeau de la fentre. Cette mention quand on enregistre la grammaire. Phase 1 : slection du nud d'origine:

Version 1.21 b1207

49 Phase 2 : slection du nud d'arrive :

Phase 1 avec slection de plusieurs nuds d'origine :

Phase 2 aprs slection de plusieurs nuds d'origine :

Version 1.21 b1207

50 A noter : s'il y a plusieurs chemins entre deux nuds, cela quivaut un "OU" logique. IX.2.3. LES CODES DE CONTRAINTES LEXICALES. Ce sont les codes que l'on peut retrouver dans les nuds. Grammaires morphologiques :
<A> <C> <E> <L> <N> <U> <V> <W> Codes morphologiques any accented letter any consonant empty string any letter any unaccented letter any upppercase letter any vowel any lowercase letter

Grammaires syntaxiques o Codes relatifs aux mots


# <CAP> <D> <E> <L> <LOW> <NB> <P> <U> <UPP> <W> <WF> Codes types de mots no space any word form in Capital any digit empty string any one-letter word form any word form in lowercase any number, i.e. sequence of digits any delimiter any one-letter word form in UPPERCASE any word form in UPPERCASE any one-letter word form in lowercase any word form

o Codes des catgories syntaxiques :


A ADV CONJC CONJS DET INT N PREP PRO V Codes syntaxiques adjectif adverbe conjonction de coordination conjonction de subordination Dterminant interjection nom prposition pronom verbe

o Codes relatifs aux temps des verbes (Franais)


Codes flexionnels pour verbes

Version 1.21 b1207

51
PR INF I F C S IS PP present infinitif imparfait futur conditionnel present du subjonctif imparfait du subjonctif participe pass

o Codes relatifs aux temps des verbes (Anglais)


Codes flexionnels pour verbes Nombre s Singulier p Pluriel Personne 1,2,3 1re, 2me, 3me personne Temps PR Prsent PT prtrite PP Participe pass G Grondif INf Infinitif

o Nombre s : Singulier p : Pluriel o Genre m masculin f : Fminin o Utilisation des attributs dfinis dans les dictionnaires. ?????????? You can write <$stem=DIC+base>. This symbol will match all the lexical entries (DIC) that are associated with the "+base" attribute o La ngation : Il y a plusieurs types de ngation dans NooJ : -- toutes les proprits (prfixes dans le dictionnaire par un + ) peuvent tre nies, laide du prfixe - . Par exemple <N-Hum>, ?????????<N-MP= e > etc. - la ngation de <DIC> (nimporte quelle entre lexicale) est <UNK> (toute forme inconnue). -- le prfixe ! peut tre utilis pour une ngation gnrale de la requte, par ex. : < !N+Hum> reconnat toutes les formes qui ne sont pas des noms humains. A ne pas confondre avec <N-Hum>) qui reconnat tous les noms qui ne sont pas humains.

Version 1.21 b1207

52 IX.2.4. LES OPTIONS DE LA FENTRE GRAPHE. Menu obtenu par click droit :

IX.2.4.1 Show Exemples : Permet de saisir des membres de phrases pour tester le graphe affich. On teste le graphe sur le texte ouvert en cliquant sur le bouton "Check" Les squences reconnues sont en caractres normaux, les squences non reconnues sont en caractres barrs.

IX.2.4.2 Show structure (Idem au bouton en haut droite de la fentre de la grammaire : liste les sous graphes d'une grammaire : tout l'arbre. On a ainsi une vue globale de la grammaire. o La fentre affichant la structure est ouverte sur le cot gauche de la fentre de la grammaire. On peut la dplacer (opration standard Windows). S'il y a sous graphe, Nooj affiche un + devant le nom du graphe qui contient un (ou des) sous graphes. Un click sur le + dveloppe l'arborescence. Le + est chang en -.Un click sur le - rduit l'arborescence.

Version 1.21 b1207

53

o En cliquant sur le nom d'un sous graphe (dans la colonne de droite), celui-ci apparat dans la fentre graphe

o On peut changer le nom des graphes en cliquant sur ce nom dans la fentre "Structure". Nooj effectue le changement du nom dans l'arborescence et les graphes.

Version 1.21 b1207

54 IX.2.4.3 Show History :

Toutes les modifications apportes au graphe depuis le dernier "Purge" sont affiches. IX.2.4.4 Alignement; Prsentation et Zoom Permettent de personnaliser l'apparence du graphe (Alignements, couleur, police de caractres,). IX.2.4.5 Lock/unlock : Permet de verrouiller un graphe avec un mot de passe qui protge soit la modification, soit l'affichage du graphe.

IX.2.4.6 New Graph : Cration d'un nouveau graphe.

Version 1.21 b1207

55 IX.2.4.7 Delete Graph : Dtruit le graphe affich. Mais comme ce graphe tait appel par un autre graphe, son nom, dans l'arborescence est inscrit en rouge. Cela veut dire : graphe appel mais non cr. IX.2.4.8 Import Grammar : Deux options. o Importation d'une grammaire avec tous ses graphes au format Nooj (.nog) o permet de rcuprer les graphes INTEX (.grf) et de les mettre au format (et la syntaxe) NooJ. IX.2.4.9 Export Grammar : Permet d'enregistrer un graphe au format INTEX (.grf).

Dans tous les cas, ne pas oublier de sauvegarder la grammaire aprs cration ou modifications : File->Save ou File->Save as Tant que la grammaire n'a pas t sauve, la mention [Modified] figure dans la barre titre de la fentre du graphe. Quand on sauvegarde (enregistre), c'est l'ensemble de graphes de la grammaires qui sont enregistrs dans le fichier dont le nom figure dans le bandeau suprieur de la fentre. IX.2.5. LES VARIABLES DANS LES GRAPHES. IX.2.5.1 Dfinition/cration d'une variable Une squence reconnue par un ou plusieurs nuds peut tre mmorise dans une variable qui sera utilise soit dans ce graphe, soit dans un graphe de niveau suprieur (et infrieur????) dans le cas de graphes embots. La squence que l'on veut mmoriser doit tre "encadre" par 2 nuds, l'un situ en tte de la squence, l'autre la fin. Celui de tte est de la forme : $(nomvariable ; celui de fin est : $) :

ATTENTION : Les noms de variables ne doivent pas comporter de caractres spciaux (Lettres ou chiffres).

Version 1.21 b1207

56 IX.2.5.2 Valeur contenu dans une variable / Ecriture de la valeur d'une variable: C'est au moment de l'criture que la forme dfinitive de la valeur de la variable est dtermine: Ecriture de la valeur de la variable telle qu'elle a t rcupre dans le texte : L'criture se dclare dans un nud "vide" (<E>) en sparant <E> et le nom de la variable par un "/". Le nom de la variable est ici accol au caractre "$". La syntaxe est la suivante.

Ecriture du lemme correspondant la valeur telle qu'elle a t rcupre dans le texte : On ajoute le caractre "_" au nom de la variable.

Version 1.21 b1207

57

Ecriture d'un texte avec la valeur de la variable :

Si cette grammaire analyse un texte et reconnat dans le sous graphe "admis" (au participe pass) et affecte cette valeur la variable Var1, cet exemple crira : Valeur:admettre Remarquez admettre l'infinitif. On a, en effet, demand le lemme

Version 1.21 b1207

58 Ecriture d'un texte entourant la valeur de la variable : Il faut dlimiter la squence des caractres appartenant au nom de la variable, par rapport au texte qui le suit. Ceci est ralis par le caractre spcial "#"

Dans les mme conditions que ci-dessus, la "sortie" du transducteur sera : Valeur(admettre) Valeur d'une variable, cas de plusieurs mots reconnus : Now if the variable's value is a sequence of word forms, then each of the word form will be lemmatized. For instance: $var correspond la squence reconnue : les beaux crayons Alors : $var_ = le beau crayon Attention: NooJ can only lemmatize word forms that have been recognized by a lexical constraint, such as <V> or <est,N>. If a word form was written as is in the grammar, e.g. "est", there is no way NooJ can know how to lemmatize it (i.e. the verb "tre" or the noun "est"). Sans contrainte de catgorie syntaxique. Ici on veut reconnatre le mot "est" comme la squence de lettre : e s t.

Version 1.21 b1207

59 Dans cette fentre "Concordance" on lit une squence qui prcde celle reconnue, la squence reconnue suivie de "/" et de la "sortie" du transducteur, puis de la squence qui suit. o Avec contrainte syntaxique:

IX.2.5.3 Expression des contraintes lexicales et autres sur les variables: Ce paragraphe sera complt avec l'aide de Max !

IX.3 LA CONSTRUCTION D'UNE GRAMMAIRE.


Elle peut se faire dans les deux sens : de haut en bas ou de bas en haut : De haut en bas : on cre. IX.3.1. DE HAUT EN BAS. On cre le premier graphe de la grammaire : il porte le nom de la grammaire. IX.3.1.1 C'est le graphe racine. S'il n'appelle pas de sous graphes, une fois construit, il ne reste qu' l'enregistrer (File->Save as) S'il appelle un ou plusieurs sous graphes, il faut donner dans la fentre du nud, le nom du sous graphe prcd de ":". A ce stade les sous graphes n'ont pas t crs. Mais en cliquant sur le bouton "Show Structure" le nom des sous graphes s'affiche en rouge. (Rouge car ils n'ont pas t cres).

Version 1.21 b1207

60

IX.3.1.2 Cration des sous graphes Ils peuvent tre construits ou imports. Construits : Cliquez sur le nom du sous graphe construire. La fentre suivante s'affiche.

La rponse non annule la procdure. La rponse oui provoque l'apparition de la fentre :

Version 1.21 b1207

61 Ici on trouve les symboles de dbut et de fin de graphe et dj not en titre, le nom du sous graphe. On le construit selon la procdure standard (Voir IX.2) Imports : Un click droit fait apparatre le menu des actions possibles dans la fentre du graphe racine. Attention le graphe qui sera import, le sera import AVEC TOUS ses sous graphes.

Le click sur "Import Grammar" affiche la fentre de choix avec le menu droulant qui permet le choix d'importation : Soit partir d'un graphe INTEX, soit d'une grammaire NooJ. o Pour un graphe INTEX: La fentre d'ouverture comporte en bas un menu droulant qui permet de choisir le type de graphe : NooJ ou INTEX. Option INTEX : aprs avoir slectionn cette option et le fichier .grf ouvrir, la fentre de choix de codage apparat.

Le click sur l'option "Syntactic Grammar" provoque l'affichage :

Version 1.21 b1207

62

La rponse "OK" provoque la conversion automatique de la syntaxe des graphes INTEX en syntaxe NooJ. Le graphe converti est inclus dans la grammaire NooJ. Dans la fentre "Show Structure", le nom du graphe import passe du rouge au noir. o Pour un graphe NooJ: Aprs avoir cliqu sur "Import Grammar" la grammaire choisie est incluse : le graphe dsign et ses sous graphes, dans la grammaire d'origine. Si aucun des graphes de la grammaire en cours sur la quelle on travaille) n'appelle le graphe inclus, celui-ci est au mme niveau hirarchique que la racine ("Main"). Quand on insre l'appel cette grammaire dans le graphe racine ("Main") ou dans un sous graphe, le positionnement dans la hirarchie des graphes se fait, ici aussi, automatiquement, comme le montre la fentre "Show Structure". Ce positionnement est aussi automatique quand on insre la nouvelle grammaire alors que l'appel cette grammaire figure dans un ou plusieurs sous graphes de la grammaire d'origine. IX.3.2. DE BAS EN HAUT. On cre une grammaire vide : File->New->Grammar, puis choix entre les 3 types de grammaires. On procde, en suite, en deux tapes : Importation des graphes INTEX (Un par un) ou de grammaires NooJ (Graphe racine et les sous graphes ventuellement appels par lui). Ces graphes ou grammaires figurent, dans la hirarchie ("Show Structure") au mme niveau que la racine vide. Cration des liens hirarchiques par cration des appels dans le graphe racine et les diffrents sous graphes. IX.3.3. PRCISION SUR LES FICHIERS GRAMMAIRES. Voir avec Max s'il faut dtailler

IX.4 LES SPCIFICITS DES DIFFRENTES GRAMMAIRES.


IX.4.1. LES GRAPHES SYNTAXIQUES. Remarque : qu'elles soient lances par "Locate Pattern" ou par "Linguistic Analysis" les grammaires n'altrent jamais le texte d'origine du fichier .txt (s'il ft import) et .not Les rsultats sont stocks soit dans la partie "Annotations" du fichier .not, soit dans la fentre "Concordance". IX.4.1.1 La syntaxe : Dans les nuds sont autoriss les expressions suivantes : o Les squences de mots qui slectionneront dans les textes les squences identiques. Ex. "admitted to" o Les contraintes lexicales comportant les symboles dcrits en IX.2.3. Ex. <N+Hum> qui slectionne tous les noms comportant l'attribut Hum dans le lexique. Ex. <admit,V> qui slectionne toutes les formes du verbe admit.

Version 1.21 b1207

63 IX.4.1.2 Les Concordances : Quand on a cre des variables dans un graphe (Voir IX.2.5), ainsi qu'un nud servant l'criture, le lancement de la grammaire produit une sortie pour les squences reconnues. Le lancement de la grammaire se fait par l'option "Locate Pattern" du menu droulant obtenu par click droit sur la fentre du texte. Les squences slectionnes et les sorties sont visibles dans la fentre "Concordance" (Voir $$$), mais les orties ne sont pas incluses dans le texte d'origine. Cela est donc diffrent du traitement d'INTEX.

Un click droit sur la fentre "Concordance" fait apparatre un menu droulant:

Le bouton "Export" recopie cette fentre dans un fichier texte (.txt).

Version 1.21 b1207

64 Si l'on veut ne conserver que le texte de la sortie, il faut dslectionner la case "Input". Rciproquement pour n'afficher que la squence du texte reconnu, sans les sorties, dslectionnez la case "Output" De plus ont peut modifier la prsentation en modifiant les nombre de caractres dans les champs "Before" et "After". IX.4.1.3 Les "Annotations": Si l'on coche la case "Show Annotations", les lments reconnus lors de l'analyse linguistique sont affichs : les lemmes et les caractristiques qui leurs ont t affectes dans les dictionnaires ou par les graphes morphologiques (En noir ci-dessous). Si, de plus, on a slectionn dans la fentre prfrences, onglet "Syntactic Analysis" une grammaire et qu'on lui est donn un numro d'ordre non vide, cette grammaire est dclenche l'analyse linguistique. Le rsultat est affich dans la fentre "Annotations" (En vert ci-dessous : LOCALISATION)

Mais ATTENTION, pour tre affiches, les sorties de la grammaire doivent obir la syntaxe des dictionnaires: la proprit juge principale doit tre en majuscules, les secondaires doivent tre prcdes du caractre "+", comme les proprits des dictionnaires:

Version 1.21 b1207

65

IX.4.2. LES GRAPHES MORPHOLOGIQUES. Rangs dans le dossier Lexical Analysis, leur suffixe est ".nom" Liste de codes d'attributs: Code Signification PR Nom propre

A complter Voir Marie Hlne Stfanini et Max. IX.4.3. LES GRAPHES FLEXIONNELS. A complter Voir Marie Hlne Stfanini et Max. Dictionnaires et morphologie : Soit dictionnaires par dfaut (de "mes documents\...\Lexical Analysis" Soit imports

X FONCTION : LOCATE PATTERN

Version 1.21 b1207

66 Apparat dans le menu, aprs un click droit dans la fentre du texte (ou du corpus) :

Les rsultat de Locate Pattern sont donns dans la fentre "Concordance" Quatre options :

X.1 RECHERCHE D'UNE CHANE DE CARACTRES :


Similaire aux recherches avec les outils classiques, c--d recherche d'une chane identique.

Version 1.21 b1207

67

X.2 PERL EXPRESSION :


A complter Voir Marie Hlne Stfanini et Max. Donner un exemple en Perl.

X.3 NOOJ REGULAR EXPRESSION :


Identique INTEX.

Version 1.21 b1207

68 X.3.1. OPRATEURS. o Conjonctions : deux lments crit la suite. o Disjonctions : deux lments crit la suite, mais spars par le caractre "+". X.3.2. ELMENTS CONNECTS. Ce sont soit des chanes de caractres, soit des lments lexicaux dfinis par, au choix, un ou plusieurs des lments caractrisant une entre lexicale des dictionnaires : catgorie syntaxique, proprit (prcde par le caractre "+"). Ci-dessous on demande de slectionner un nom suivit d'une prposition:

Un double click sur une ligne de la concordance colorie la squence reconnue dans la fentre texte. Ci-dessous on demande un nom ou un verbe, l'un ou l'autre suivis d'une prposition. Se sont les parenthses qui dlimitent: la porte du "+" (le "OU").

Version 1.21 b1207

69

X.4 NOOJ GRAMMAR : UTILISATION DES GRAPHES SYNTAXIQUES.


X.4.1. LANCEMENT En cliquant sur le bouton "Set" la fentre standard Windows d'ouverture de fichier apparat. Choisir la grammaire dsire:

Version 1.21 b1207

70 Un click sur l'un des boutons de couleur lance la grammaire slectionne. La couleur des caractres de la fentre "Concordance" (qui affiche les rsultats de l'application de la grammaire) est celle du bouton qui a dclench la grammaire. Les paramtres : o Sous fentre "Index" : choix du nombre des squences reconnues quand il y a plusieurs solutions. Soit la plus courte, soit la plus longue (le plus commun), soit tous les "matches". o Sous fentre "Limitation" : par dfaut le nombre de "reconnaissances" est limit 100 pour viter des excutions trop longues, non voulues. X.4.2. LA FENTRE CONCORDANCE

X.4.2.1 Description: Elle comporte les rsultats du lancement de la fonction "Locate Pattern", quelle que soit l'option choisie : Chane de caractres, Expression en Perl, Lancement d'une grammaire. Elle comporte 4 champs : Le nom du fichier texte dans le cas d'utilisation d'un corpus. Une partie du texte qui prcde la squence reconnue. La longueur de ce texte est donne par la petite fentre "charracters before". Ce nombre de caractres peut tre modifi par l'utilisateur. Ce nombre de caractres peut tre modifi par l'utilisateur. Pour que ces changements de longueur soient pris en compte il faut cliquer sur l'option "Reset" du menu par click droit la fentre "Concordance". La squence reconnue et la sortie correspondante (si la grammaire comporte des ordres d'critures).Trois options: Soit les deux cases "Input" et "Output" sont coches: La squence reconnue et la sortie correspondante sont affiches. (Voir image ci-dessus). Soit une seule est coche: est alors affich la squence reconnue ou la sortie correspondante. Squence reconnue seule:

Version 1.21 b1207

71

Sortie (criture provoques par la grammaire), seule:

Une partie du texte qui suit la squence reconnue. La longueur de ce texte est donne par la petite fentre "charracters after". Ce nombre de caractres peut tre modifi par l'utilisateur. Pour que ces changements de longueur soient pris en compte il faut cliquer sur l'option "Reset" du menu par click droit la fentre "Concordance" Le bouron "Clear Concordance" efface le contenu de la fentre. Un double click sur une ligne de cette fentre provoque la mise en surbrillance de la squence slectionne dans la fentre texte. Pour annuler cette action, il suffit de cliquer dans la fentre "Concordance", en dehors des lignes rsultats.

Version 1.21 b1207

72

ATTENTION : si on relance Locate Pattern sans avoir effac le contenu de la fentre "Concordance", les nouveaux rsultats sont affichs la suite des prcdents. Si l'on a choisi, pour relancer, le bouton de mme couleur que celle du lancement prcdent, il sera trs difficile de sparer les rsultats des deux lancements. C'est pourquoi il est conseill soit d'effacer le contenu de la fentre, soit de relancer la grammaire en cliquant sur un bouton de couleur diffrente. Cela permet de comparer les deux rsultats. ATTENTION : si on ne sauvegarde pas la fentre "Concordance" son effacement ou sa fermeture provoque la perte des rsultats.

Version 1.21 b1207

73 X.4.2.2 Les fonctions associes:

Reset : met jour les paramtres de la fentre, dont la longueur des champs. Select All : comme le nom l'indique cette fonction slectionne toutes les lignes de la fentre. Unselect All : fonction inverse de la prcdente. Filter out select lines : Filter out unselect lines : Color matching sequences in text : Colorie les squences reconnues dans le texte de la fentre texte. Export Concordance : exporte les rsultats au format .txt, une tabulation spare les 4 champs. Extract Matching text units : Contrairement l'affichage dans la fentre "Concordance" qui n'affiche que la squence reconnue, quelques caractres avant et aprs, l'extraction, ici, exporte toute l'unit linguistique (dfinie lors de la cration du texte par le dlimiteur) qui contient une (ou plusieurs) squence reconnue. Le fichier crer est de format .txt Extract Unatching text units : mme actions d'exportation pour les units linguistiques qui ne comportent aucune squences reconnues. Cette option est utile, entr'autre lors de la mise au point de grammaires, pour rprer les squences que l'on pensaient tre reconnues par la grammaire, et qui ne le sont pas. Built Statistical Report : A complter avec Max Annotate Text : Inclus les rsultats de l'application de la grammaire dans les "Annotatiuons" lies au texte, affiches quand on coche la case "Show Annotations" de la fentre texte. Le rsultat est le mme que celui obtenu lors du lancement de "Linguistic Analysis" avec cette mme grammaire dclare dans l'onglet "Syntactic Analysis" de la fentre "Preferences".

Version 1.21 b1207