Sunteți pe pagina 1din 19

Construire des champs lexicaux et des

champs sémantiques

Utlisation avancée du TLFi


http://atilf.atilf.fr/tlf.htm
Outils du CNRTL (Centre National de Ressources
Textuelles et Lexicales)
http://www.cnrtl.fr

6 – 8 octobre 2011 Séminaire de linguistique de


Corpus
Motivations

Un couple champ sémantique – champ lexical correspond
souvent à un thème d'un texte

Exploitation textuelle
− Créer des corpus thématiques en fonction d'un champ lexical
− Constraster les textes dans un corpus thématique en observant
l'environnement des éléments d'un champ lexical

Exemple : dans un corpus thématique sur les OGM, classer les textes du
corpus selon qu'ils sont pour les OGM ou contre leur développement

Exploitation lexicologique ou lexicographique
− Accéder à une vue d'ensemble pour décrire les sens des éléments
d'un champ lexical et pouvoir s'appuyer sur un corpus approprié

Par opposition à la description des mots d'une langue par ordre
alphabétique
6 – 8 octobre 2011 Séminaire de linguistique de
Corpus
Vocabulaire utilisé dans ce cours

Champ sémantique : Ensemble de sens réunis autour d'un
noyau sémantique commun

Champ lexical : Réalisation lexicale d'un champ
sémantique => ensemble de lexies

Lexie

Couple signifiant/signifié ; forme/sens ; lexème/sémème ;
vocable/acception
− Avocat1 (le métier) ; avocat2 (le fruit)

Une lexie a toujours une catégorie grammaticale
− Parler_N ≠ Parler_V

6 – 8 octobre 2011 Séminaire de linguistique de


Corpus
Vocabulaire utilisé dans ce cours

Noyau sémantique

Représenté à l'aide de "traits sémantiques"

Pratiquement dans ce cours :
− Les traits sémantiques sont issus manuellement des définitions du
TLFi
− Sont sélectionnés

Les adjectifs, les adverbes, les noms et les verbes

Mais en tenant compte des groupes qui signifient quelque chose de
précis
− Ex 1 : prise en compte ≠ /prise_N/, /compte_N/ mais = /prise_en_compte/
− Ex 2 : fruit comestible ≠ /fruit_N/, /comestible_Adj/ mais = /fruit_comestible/

=> 1 champ sémantique est construit autour d'un ou
plusieurs traits sémantiques communs
6 – 8 octobre 2011 Séminaire de linguistique de
Corpus
Construire un champ sémantique ?

Pratiquement, seuls les mots sont directement accessibles

=> on part souvent d'une ébauche de champ lexical

=> on analyse les contenus sémantiques des sens des mots
qui semblent appartenir à un même champ sémantique

=> on approfondit l'analyse et on étend le champ lexical de
manière contrôlée

Difficulté de cette méthodologie

Une ébauche de champ lexical peut être associé à plusieurs
champs sémantiques différents

Causes possibles : ambiguïté lexicale sémantique et
homonymie

6 – 8 octobre 2011 Séminaire de linguistique de


Corpus
Un champ lexical ébauché ; des champs
sémantiques associables
Vêtem
ents

Naviga
tion
Bateau
Fruit
Coque
Voile
Rame
Voie de
Pont
communica
tion

=> méthodologie fondée sur l'essai – erreur


=> travail coûteux en temps et en énergie
=> nécessité de se faciliter la tâche en exploitant les outils disponibles

6 – 8 octobre 2011 Séminaire de linguistique de


Corpus
Méthodologie : prise en main

Choisir un domaine dans lequel le champ sémantique et
son champ lexical associé vont s'insérer

Ex : alimentation, communication, économie, environnement,
etc.

Choisir un angle plus précis dans ce domaine

Ex : les fruits comestibles, la manière dont on s'exprime par la
parole, les transactions financières, les énergies renouvelables

Faire un première ébauche du champ lexical que l'on
pourrait associer

6 – 8 octobre 2011 Séminaire de linguistique de


Corpus
Première ébauche de champ lexical

Plusieurs solutions

Choisir un élément dont on suppose qu'il doit y figurer et
chercher ses synonymes

Établir manuellement une première liste

Partir d'une liste trouvée sur le web ou autrement

À partir d'un hyperonyme que l'on recherche dans le TLFi

Dans le cours

Synonymes

Recherche directe dans le TLFi

Articulation des deux méthodes

6 – 8 octobre 2011 Séminaire de linguistique de


Corpus
Première ébauche de champ lexical : des
synonymes

Domaine = alimentation

Angle = les fruits
comestibles

Élément choisi = "fruit"

Accès à ses synonymes

Portail lexical du CNRTL,
onglet "synonymie" (base
des synonymes de Caen,
DicoSyn)

6 – 8 octobre 2011 Séminaire de linguistique de


Corpus
Synonymes suite

Difficulté

Fruit est ambigu => on retrouve cette ambiguïté dans
l'ensemble des synonymes proposés

3 sens principaux se dégagent
− Les conséquences : ex. "être le fruit d'une décision", "porter ses
fruits"
− La descendance et la filiation : ex. "le fruit"
− Le fruit comestible

Dans l'ensemble des lexèmes renvoyés par la base de
synonymes, choisir ceux qui sont pertinents

6 – 8 octobre 2011 Séminaire de linguistique de


Corpus
Ébauche de champ lexical : compléter les
synonymes

Imaginer les sortes de fruit que l'on connaît

Datte, mangue, kiwi etc.

Chercher sur le net

Ex : chercher "sorte / espèce / type de fruit" ou même plus
simplement "fruits"
− http://tous-les-fruits.com/
− http://fr.wikipedia.org/wiki/Liste_de_fruits_comestibles

Etc.

6 – 8 octobre 2011 Séminaire de linguistique de


Corpus
Compléter les synonymes avec le TLFi

À l'aide la liste de synonymes de "fruit", complétée ou non,
examiner les emplois associés dans le TLFi

Isoler les éléments communs aux différents emplois appropriés
dans
− Les crochets
− Les indicateurs d'emploi
− Les domaines généraux et techniques
− Les textes de définition
− Les expressions typiques non définies (en italique après les
définitions, appelés "syntita enchaînés" dans la nommenclature des
objets du TLFi)

6 – 8 octobre 2011 Séminaire de linguistique de


Corpus
Compléter les synonymes avec le TLFi

Une méthode possible, pratiquement

Créer une liste dans l'interface du TLFi avec la liste de
synonymes de "fruit", complétée ou non
− ATTENTION : ne pas indiquer de lexèmes en plusieurs mots car
l'interface les divise

Ex : pomme de terre = 1. pomme, 2. de, 3. terre

=> explosion des résultats et du bruit

Utiliser ensuite l'affichage détaillé et colorier pour relever les
éléments communs

Les stocker dans un tableau excel pour :
− Y accéder facilement et de manière organisée
− Évaluer la proportion d'emplois que touche chaque élément relevé
6 – 8 octobre 2011 Séminaire de linguistique de
Corpus
Compléter les synonymes avec le TLFi

Un exemple intermédiaire du résultat de cette méthode
Type d'objet Eléments Couverture Expression dans
contenus l'interface
réguliers
Catégorie NOM 100,00% subst | &n adj
grammaticale
Début de Baie ou drupe ou 100,00% Appel de liste :
définition fruit debutdeffruit
&d2 &ldebutdeffruit
Domaine Botanique Une partie botanique

Indicateur Métonymie ou Une partie Appel de liste :


extension indicateurfruit
&lindicateurfruit
6 – 8 octobre 2011 Séminaire de linguistique de
Corpus
Compléter les synonymes avec le TLFi

Utilisation de ce résultat intermédiaire dans les recherches
complexes

Sélectionner uniquement les éléments communs valides à
100% et les éléments que l'on peut exclure
− Par exemple, rechercher des noms qui ne sont pas ambigus avec la
catégorie adjectif = subst | &n adj
− Mais pas une contrainte qui dirait "ne dépend pas du domaine
botanique" car ce type d'information ne peut pas être exprimé dans
l'interface.

Ok : dépend du domaine botanique ou dépend d'un domaine qui n'est
pas botanique

Rendre interdépendantes l'ensemble des contraintes
− Sinon explosion des résultats inappropriés du fait de l'héritage
6 – 8 octobre 2011 Séminaire de linguistique de
Corpus
Compléter les synonymes avec le TLFi

Problème de l'interdépendance
Recherche complexe
Dom = botanique 1. Code grammatical < nom
Définition 1 : fruit qui... 2. définition < "liste des débuts de définition de fruit"
3. domaine < botanique
Indicateur = métonymie
4. indicateur < méton.
Définition 2 : petit fruit qui... ET
4 et 3 dépendent de 2
2 dépend de 1

=> 2 résultats alors qu'un seul (définition 2) réunit l'ensemble des contraintes
Recherche complexe
DONC
2 dépend de 1, de 3 et de 4
3 dépend de 2 et de 4
4 dépend de 3 et de 2

6 – 8 octobre 2011 Séminaire de linguistique de


Corpus
Compléter les synonymes avec le TLFi

Approfondir l'analyse

Les informations fournies par le dictionnaire sont multiples et
peuvent donner lieu à différents sous-champs sémantiques et
donc différents sous-champs lexicaux

Éliminer les emplois inappropriés (ex. anse en géographie)

Classer les emplois et leur lexème associé selon qu'ils réfèrent
à
− Des classes de fruits : ex. les agrumes
− Des fruits consommables

Relever manuellement dans l'affichage détaillé les éléments qui réfèrent
à l'usage (par exemple médecine, pâtisserie) ou à la saveur, la cueillette,
etc.
− Des fruits issus de plantes, d'arbres, etc.
6 – 8 octobre 2011 Séminaire de linguistique de
Corpus
Partir directement du TLFi

Domaine = alimentation

Angle = fruits comestibles

Éléments choisis

"fruit" en début de définition

Catégorie grammaticale = nom (subst | &n adj)

Résultats similaires à la méthode précédente mais très
bruités au départ

=> l'idéal est d'articuler ressources lexicales (synonymie,
terminologies etc) et descriptions lexicographiques (TLFi)

6 – 8 octobre 2011 Séminaire de linguistique de


Corpus
TP

Démarrer avec un champ lexical et le champ sémantique
associé "simple"

Concret, même catégorie grammaticale

Avancer suffisamment dans l'analyse pour se faire une idée des
difficultés

Poursuivre avec un champ lexical approprié à vos
recherches

Probablement plus abstrait, mélangeant différentes catégories
grammaticales

Procéder progressivement et de manière organisée (par
exemple, catégorie par catégorie)

Ne pas construire entièrement le champ lexical mais le contrôler
régulièrement par des sondages dans le TLFi
6 – 8 octobre 2011 Séminaire de linguistique de
Corpus

S-ar putea să vă placă și