Documente Academic
Documente Profesional
Documente Cultură
A. C ULIOLI
J. P. D ESCLS
Traitement formel des langues naturelles. Premire partie :
mise en place des concepts partir dexemples
Mathmatiques et sciences humaines, tome 77 (1982), p. 93-125.
<http://www.numdam.org/item?id=MSH_1982__77__93_0>
Premire partie :
Mise en place des concepts partir dexemples .
AVERTISSEMENT
point de vue dune adquation avec les observations empiriques, sauf si lon
engendrs par des grammaires formelles dun cettain type, en fait les gram-
maires de tyloe 2 (ou non contextuelles) dans la hirarchie de Chomsky.
coulent pas
Les dfinitions proposes par la plupart des auteurs ne se
les notations
dans des critures mtalinguistiques qui reprsenteraient, par
le mcanisme de la constitution de lnonc effectue posant
en
employes,
des proprits rhmati-
dabord un terme (thme) pour ensuite lui attribuer
thme" est le rsultat dune opration mettant
ques. Chaque acte qui "pose un
de prdication. En
en jeu un nonciateur un instant pris pour origine sa
lnonciateur, ce qu
effet, le thme est pos symboliquement par rapport
attestent des expressions comme :soit, il y a, quant , en ce qui
concerne...
Il faut alors inventer des critures formelles dans lesquelles on puisse for-
muler des oprations de thmatisation. Or, lanalyse des agencements par th-
matisation ( divers degrs, du reste)fait apparatre des modes dorganisa-
tion qui diffrent de ceux qui sont obtenus par simple concatnation (obser-
vable directement au niveau linguistique), ou par agencement- markovien (avec
"pos" par lacte nonciatif, ce terme est ensuite insr dans dautres
relations o il est intriqu. Beaucoup de procds linguistiques, comme
concepts linguistiques lui faudra purer sans pour autant les dna-
turer. Ce mathmaticien est ensuite confront aux systmes de reprsenta-
tions mtalinguistiques quil doit "fabriquer" et enrichir sous le contrle
du linguiste pour leur adquation. Les systmes de reprsentation "classi-
ques ", en particulier le "calcul des prdicats" sont inadquats pour expri-
mer formellement les diverses thmatisations. La nature de cette inadqua-
tion se comprend ds que lon rappelle les finalits qui les ont motiv,
savoir lanalyse des fondements de larithmtique essentiellement; ils
ne sont pas destins tre des instruments danalyse des langues. On pour-
vent quun manque dhabitude, elle ne doit pas non plus surprendre puisquil
sagit dun systme en construction et non dun systme fig prsent selon
les canons traditionnels des manuels logiques. Le lecteur mathmaticien
discours.
97
prsentative pour dcrire des faits linguistique, aussi bien dans le~
langues indo-europennes que dans le domaine smiti~que, chinois,japonais,
rlous avons dj dit que les auteurs avaient prfr montrer, sur
Il serait bien entendu souhaitable de mieux les cerner par un discours plus
serr et mieux argument, Ceci montre en tout cas que lanalyse et le trai-
tement formel dun seul nonc linguistique impose en fait des ingrdients
conceptuels nombreux. Il en serait de mme pour traiter dexemples physiques
ou biologiques. Le rapport immdiat que nous entretenons avec notre langage
ne doit pas nous laisser croire quune apprhension naive des faits est
suffisante pour en dcouvrir les rgls de fonctionnement. Lobjection sui-
vante a t mise par des esprits qui ne croient quau simple immdiatement
comprhensible : "cest bien difficile ce que vous reprsentez ! Pourquoi
"
faire si compliqu ? sous-entendu "quand dautres collgues ont un .
discours plus transparent". Ceci est videmment rfutable : "Pourquoi le
98
langage sur 1 equel toutes les ci vil i sa tions, toutes les poques, se sont
comme ctait le cas avec des systmes agencs par substitution et concat-
nation ( "arbres de drivation" ou "arbres syntagmatiques" dans le modle
par une notation approprie,se laisse dcrire par une sous-classe de gra-
phes sans circuits que lun des auteurs avait avec M.C. Barbault propos
dappeler "treille" (cf. Transformations formelles et thories linguisti-
ques 1972 ). Quelle est la dfinition exacte de cette structure ? Comment
Dans le prochain numro, il sera donn une liste de quelques thses (de 3 me
cycle et dtat) portant sur des descriptions de langues (anglais, chinois,
franais, japonais, malgache, moor, portugais, tamoul...) et qui utilisent
les systmes de reprsentation et concepts thoriques dvelopps dans le
cadre de lERA 642.
prcdent.
reprsentants.
J.P. Descls
ples hors contexte (alors quil faut travailler contexte explicite), hors
quels que soient ses efforts thoriques pour rendre compte dune activit
1.2. Ceci nous fournit un second ensemble de donnes (parfois produit de fa-
duits et interprts, par des sujets nonciateurs (humains!), dans des si-
1.3. Ce danger est dautant plus rel que, premire vue, rien ne semble
groupe de donnes. Nous appelons ainsi ces textes quun sujet produit lors-
ver ce dernier terme une activit rgle, donc contrle par lobservateur
(sur ce point, voir plus bas), alors que la glose renvoie la pratique lan-
ques forment une bonne partie de notre discours quotidien et jouent un rle
important dans le discours explicatif dun informateur qui veut faire sai-
sir le sens dune phrase dans une langue trangre ou la signification dun
nonc mal interprt. Mais on nglige presque toujours ces gloses pilin-
Ainsi, la phrase Lhomme qui est venu hier portait bien un impermable beige
est peut-tre glos par "Eh bien, il y a quelquun qui est venu hier, et
dquivalences: on a affaire ici, non plus des termes simples, mais des
termes complexes ou noncs, et les proprits de ces familles sont fort dif-
jamais tudier une langue autre en soi (sauf si lon traite de langues de
duire terme terme, rendre le sens global en langue courante, mais surtout
ou alors, quelle peut tre glose par les expressions franaises " propos
de", "quant ", "entre autres",..., comme si lon pouvait utiliser de faon
neutre une seconde langue des fins mtalinguistiques (cest--dire pour
comme "datif" dans (ou faut-il dire sans?) une thorie gnrale des cas
(on dira, par exemple, que lui est "datif" dans i1 lui parle), que cela ne
quen utilisant des majuscules (CAUSE, BE, DO) on lve au rang dtres m-
se. Au mieux, elle tablira des correspondances tiquetes. Que lon consi-
dre par exemple les phrases suivantes, tires dun manuel de japonais* :
* in Modern Japanse for University Students I, Japanese Department, Interna-
tional Christian University, Revised Edition, pp. 117 sq.
103
stances. Les traductions proposes sont "As for Kazuko, her eyes are large"
("Quant Kazuko, ses yeux sont grands"); "Kazukos eyes are large" ("Les
yeux de Kazuko sont grands"); "Kazuko has large eyes" ("Kazuko a de grands
yeux"), et lon pourrait ajouter, pour le franais, "Il y a Kazuko, ses yeux
femme (qui est) malade"; "(Il y a) Monsieur Tanaka, sa femme est malade";
etc. Manifestement, le problme pos est dtablir une relation entre la
tel problme nest soluble que si lon construit les systmes de reprsen-
tations pour le japonais, pour le franais et pour langlais, la fois en
quil doit donc exister des correspondances entre les deux. Une seconde
condition est que lon doit pouvoir passer dun SR (spcifique une lan-
ides).
On sait que cela nest hlas pas le cas, surtout si est une langue de
Ll1
grande civilisation, avec une tradition grammaticale de surcrot. De mme,
on comprendra quil nexiste pas de relation directe L1---~ L2 ou
sur "toutes" les langues et sur "nimporte quelles" donnes. Aussi bien no-
1.4. Mais il existe un autre domaine o lexprimentation (au sens dune re-
production) donc au passage rgl dun systme mtalinguistique la suite
105
Nous parlerons dans ce cas de corpus contraint. En effet, il existe des si-
quelconque outil formel, les diffrences radicales qui existent entre les
dun corpus contraint. Cest donc sur le domaine (3) - gloses et paraphra-
ses - que nous nous efforons de mener nos observations en respectant les
aux dcisions subjectives des linguistes, des calculs qui puissent tre ex-
cadre thorique).
Lobservation, puis la conceptualisation du fonctionnement des langues
et les reprsentations mtalinguistiques font apparatre des rgularits
structurelles, mais aussi des procdures de traitement, ce qui permet de re-
ture ne peut donc pas formaliser les relations dintrication o un mme ob-
jet est en relation de dpendance avec plusieurs objets (un objet a plu-
plusieurs pres, alors que, dans larborescence, un objet a toujours au plus
un pre). Cest le cas, par exemple, des relations anaphoriques. Diverses
tentatives ont t proposes pour traiter, dans le formalisme des arbores-
vit langagire. Nous disons "invariants" pour marquer nos distances par rap-
ble de ces oprations. Les coordonnes nonciatives construites par les op-
rations nonciatives positionnent la relation prdicative par rapport aux
origines de lnonciation.
aise lorsque lon a recours des oprateurs et des oprations. Il faut ex-
comme primitives (comme le fait par exemple S. Lesnieski dans son ontologie
et dans sa
protothtique).
Il nous faut prciser, au moins de faon allusive, dorment nous
encore, lobservation des langues nous invite prendre pour notions primi-
tives des proprits intensionnelles.
tait quune notion dfinie intensionnellement est "en dualit" avec celle
*Note: Ainsi, pour les mdivistes: "Quo major extensio, eo minor comprehen- ,
sio, et quo major comprehensio, eo minor extensio".
110
ainsi :
ALORS p " E q
e
ALORS
p=eq
pliquent sont identiques. Ainsi la classe des bipdes sans plumes et celle
nous
apportent, propos de Socrate, des informations bien diffrentes quune
thorie non extensionnelle devrait essayer de formaliser.
car il est immense, Jean nest pas grand pour son ge. De mme, Je an ne
boit pas du caf mais du th; Jean ne boit as du caf mais le dguste
Ceci montre que la ngation nexprime pas toujours cette absence de rela-
tion entre le sujet et le prdicat (Jean et boire du caf) mais plus souvent
autre ct les objets nominaux qui peuvent tre arguments dun prdicat.
Pour fixer les ides, la proprit intensionnelle /tre - livre/,
nous associons le prdicat catgoris, en franais, en verbe: lire, et les
lecteur, livre, lecture... Remarquons quun prdicat nest pas toujours ca-
tgoris en verbe mais peut, selon les contextes, tre catgoris en adjec-
tif, en prposition etc...
que langue. Ainsi, la notion de /voir - avec - les -yeux/ implique une autre
la signification qui lui est attache et qui dpend non seulement des notions
Daprs ce qui prcde, une lexis est certes proche du concept de con-
divale ou encore du lekton stoicien, mais elle en diffre par les trois ca-
ment situe dans un espace nonciatif; (2) elle est comparable une notion
voir quelle est reprsentable par n ouvert); (3) elle est agence formel-
lement et, par l, est une forme gnratrice dautres formes drives aux-
cs.
xis partir desquelles sont drives les relations prdicatives. Les lexis
De mme que toute lexis doit tre situe dans un espace nonciatif,
ce qui revient affecter la lexis de coordonnes nonciatives, les re-
xis, chaque relation prdicative est alorx repre, dans lespace non-
ves.
comme :
Jean a dj eu un trou ,
--
sa poche
Jean aura bien un trou sa poche
Jean a peut-tre un trou sa poche
Hier, Jean avait un trou sa poche
La poche de Jean a bel et bien t troue
etc...
116
les valeurs rfrentielles ne sont plus identiques (bien que le contenu pro-
chang.
formellement de par a.
a
()) ~1j~ si et seulement si =
oc* (~) .
les oprateurs transformationnels agissent ici sur des lexis ou des rela-
EXEMPLE : Transformation de
Soit la lexis de localisation suivante :
qui se lit "lobjet x est repr par rapport lobjet y". Le symbole E
dsigne, pour linstant, un relateur de reprage binaire.(cf.3.4 pour son statut)
Nous nous plaons dans un Univers (au sens technique du terme); dsi-
sont diffrencis; soit ils nont rien voir lun avec lautre, on dira,
dans ce dernier cas, quils sont disjoints, ou en rupture .
entre eux; x E y > se lit alors : "x est repr par rapport y"; x est
cest trouver un objet y qui soit un repre pour lobjet x. Le reprage sef-
fectue donc au moyen dune opration qui sera constitutive dune relation ou
Il faut donc considrer non pas la relation constitue mais les op-
rations constitutives des diffrentes occurrences de la relation de reprage.
sign par E.
-i
"
pour tout objet x de son domaine, il existe un et un seul objet y
Laction de
----
loprateur E sur une oprande x de son domaine donne pour r-
-1
sultat un objet y.
119
Laction de E
-
sur x, donnant y pour rsultat, est constitutive dune occur-
W
Par dfinition nous avons (en reprsentant lopration par une flche) :t
Dune faon
gnrale, E 1-i
est
.."
dit avoir la propritJ si loccurrence
de la relation de reprage constitue possde la proprit,. Plus particu-
logie rudimentaire des divers types de reprage les plus abstraits selon
par le tableau :
asymtrique.
La ruption est constitutive dune relation essentiellement irrflexive
et symtrisable.
te que lon a loccurrence x = y > sans que pour autant x soit lidenti+
cation possde la proprit [T] alors celle-ci est constitutive dune rela-
tion dquivalence.
prend souvent la valeur didentification sans que les deux termes identi-
fis aient ncessairement des rles identifiables: de "a est A", on peut
dduire que a et A sont identifiables (dans certains cas) sans que lon
ait "A est a" (on retrouve les conditions imposes par S. Lesniewski lon-
vers.
loups sont des mammifres tantt la valeur didentification dont nous avons
logie ; voir J.B. Grize, o.c., p.80-82). Nous rappelons que lobjectif de
un objet x est en rupture avec y, alors x et y sont en rupture et, bien en-
langage.
Dune faon gnrale, nous dsignons par Di loprateur dual associ lop-
rateur de reprage Ei et nous posons par dfinition D en notant par :
cest-)dire "SI y situe ou dtermine un objet x ALORS cet objet x est re-
de reprage, savoir :
124
(Les hommes sont mortels), tantt la localisation (Jean est Paris). Les
Jean a
-
un chapeau / ? un
r chapeau -
est Jean
Il y a
-
un livre sur la table / Le livre est sur la table
-
thse de J.P. Descls [DES-CCc] montrerait que dune part les valeurs se
dautre part, les valeurs qui peuvent tre attribues loprateur dual ne
sont pas libres mais contraintes par les proprits gnrales du reprage.
*
* *