Sunteți pe pagina 1din 2

Analyses Laure sur le corpus anglais (hors Concorde) – 23 novembre 2017 ; en bleu, rqs suite au

décorticage du corpus français.

- la comparaison d’articles sur de mêmes référents, dans la même langue, sur le même événement
vient confirmer notre résultat Concorde : il ne suffit pas d’un référent commun, ni même d’un
événement commun, pour que les chaînes soient analogues. Car s’ajoutent des orientations, une
importance accordée au référent pour lui-même, pour ce qu’il est, ou alors comme élément au sein
d’enjeux plus larges.
Ex. E-Xiaobo prix Nobel : un article avec présence dans quasi-tous les paragraphes, l’autre où il figure
seulement dans la moitié, avec concurrence de la chaîne ‘Chine’.

- Le référent principal d’un article s’identifie-t-il comme celui qui a le plus de maillons ? Le plus
souvent, c’est le cas. Mais pour l’inanimé en particulier, il apparaît qu’à plusieurs reprises, la chaîne
principale est humaine (cuisine incendiée, manuscrit Jane Austen), ou au moins une autre chaîne que
le référent (ex. incendie plutôt que pub incendié ; F-iPhone4 txt 1 : Apple). Il peut même y avoir
anaphore décorative (variation juste pour varier, sans pertinence locale particulière, ex. ‘le groupe de
Steve Jobs’ pour Apple dans F-iPhone4 txt 1), si très concurrentiel. Comment savoir alors que ces
autres référents ne sont pas les principaux ? Le critère complémentaire est celui de la fonction
syntaxique : ex. Austen pas référent principal car minorité de fonction sujet.  permet de dire que
l’article sur la cuisine incendiée a un titre mal choisi, car le référent principal n’est PAS la cuisine, ni
même l’incendie, mais le couple (voir commentaires dans le fichier). Ceci suggère qu’on peut
prédire le titre, ou du moins le référent principal qui devrait y figurer, d’après des paramètres de
configuration des chaînes. + critère de la variété lexicale (voir plus bas).
Rq : le seul critère de ‘fonction sujet répétée/majoritaire’ ne suffirait pas à identifier le réft principal :
ex. RNLI (article sauvé noyade) toujours sujet ou F-iPhone 4 txt 1 plusieurs fois sujet.
Rq2 : il semble que la corrélation nombre de maillons – fonction sujet répétée – variété lexicale
permette de distinguer la thématique exacte des articles. Ex. les deux Polanski ont une densité forte
parce que les deux traitent vraiment de lui, de son parcours, de son arrestation ; vs. sur les deux
Xiaobo, malgré des titres très voisins (‘Nobel Peace Prize goes to Liu Xiaobo’/’Nobel Peace Prize
awarded to Liu Xiaobo’), on peut déduire des chaînes que l’un parle principalement de Xiaobo, l’autre
principalement du ‘fait que le prix nobel ait été attribué à Liu Xiaobo (par le comité Nobel)’.
A mettre en lien avec recherches sur la détection automatique de topiques.

- Va-t-on toujours de formes référentielles les plus étoffées dans titre/chapeau/1 er §, à des formes
allégées en informations ensuite ? C’est en fait plus compliqué, de même en français :
 le titre/chapeau (s’il y en a un)/1 er § ont souvent des formes proches, car ils sont des réécritures
les uns des autres, en quelque sorte (le titre est ajouté après, le chapeau détaille, et le 1 er § résume
l’article). Le 1er § semble être un lieu d’étoffement particulièrement important.
 mais il y a 2 cas dans le corpus anglais où le plus étoffé lexicalement arrive vers le milieu de
l’article (cas de condensation d’informations nouvelles), sans raison bien particulière visible.
 question de la place du nom propre par rapport aux anaphores en nom commun : cette question
concerne de nombreux référents du corpus : des humains (Xiaobo, Polanski, victimes de
l’incendie de la cuisine – vs. les sauvés de la noyade n’ont pas de nom, de même que leurs
sauveteurs), mais aussi des inanimés (iPhone 4, pub incendié, musées ouverts x2). Le corpus
anglais présente les caractéristiques suivantes :
 pour des référents connus (Xiaobo, Polanski, iPhone 4), le nom propre est donné dès le titre, et
l’appellation par défaut. Pour des sociétés référents secondaires (Apple, dans articles iPhone
4), le nom propre est l’appellation par défaut également, de même que pour des personnes
d’autorité (Mr Jagland, tête du comité Nobel, articles Xiaobo).
 en revanche, pour les non connus (victimes de l’incendie de la cuisine, pub incendié), le nom
est donné après, parfois après plusieurs paragraphes. Ce qui compte dans un premier temps est
leur trait distinctif (‘anniversary-wedding couple’, ‘Lord of the Rings themed pub’).
 la forme du nom propre est importante également : par défaut, première mention = prénom +
nom, puis seulement nom. Sauf ‘Mr Liu’ pour respect (un des articles Xiaobo) ou par
différence culturelle (locuteurs chinois).

- Variété lexicale :
 elle est faible généralement pour les référents secondaires, qu’ils soient humains ou pas (ex.
Austen, Chine). Mais s’ils arrivent à un nombre assez important de maillons, concurrentiel un peu
avec la présence du réft principal, on a plus de variété (Burns, // corpus français pour Apple [F-
iPhone4 txt 1] par exemple). – Ceci permet de dire là encore que l’article sur la cuisine
incendiée, où il y a grande variation pour les victimes, n’a pas pour réft principal la cuisine,
ni même l’incendie.
 la variété est rarement innovante : beaucoup d’alternances nom propre / collocation
conventionnelle / pronom personnel. Par conséquent, semble varier selon les réfts, en partie au
moins en fonction de la disponibilité de synonymes : ex. bcp de variété pour l’immeuble
d’habitation incendié (F-incendie imprimerie txt 1), vs. peu pour le Louvre Abu Dhabi (F-
inauguration musée txt 1).
 La plus grande variété lexicale apparaît pour 2 catégories : l’inanimé (articles iPhone, articles pub
incendié, un des articles ‘musée ouvre’), et humain s’il n’a pas de statut (les 2 articles ado sauvé
de la noyade : pas juste ‘victim’ car il n’y aurait pas d’empathie). Pas pour le français : grande
variété plus systématique, ex. Polanski, Liu Xiaobo aussi.
 il semble que les innovations dans la variété concernent surtout la première moitié des
articles (à affiner) ; vs. ensuite, revient à de l’allégé. Ex. F-iPhone4 texte 1 ; même si
occasionnellement, une nouveauté, ex. F-iPhone 4 txt 2 : ‘cet appareil à la mode’. Pas
d’innovations dans le titre (normal : il faut pouvoir identifier), vs. chapeau parfois et surtout
1er §, parfois 2e.
 grandes différences de variété lexicale d’un réft non principal à un autre ; à creuser pour voir si
récurrences. La disponibilité de synonymes semble favoriser, en français au moins, la diversité
(ex. bâtiment incendie imprimerie, F-incendie 1, vs. boutique Orange, F-iPhone txt 2).
Ceci pourra être étoffé grâce aux apports des autres langues. Notamment, est-ce que le français est
systématiquement plus riche ?

- Importance de l’humain (vision anthropocentrée du monde) :


 la densité référentielle pour les articles qui traitent d’inanimés paraît plus souvent peu forte (à
confirmer par chiffres, et par Concorde). vs. pour les articles qui traitent d’humains, elle peut être
forte ou non - il serait faux de conclure que les articles qui traitent d’un humain ont une plus forte
densité référentielle pour la chaîne principale : articles ‘sauvés de la noyade’ très peu denses, car
beaucoup d’autres acteurs (humains) interviennent : amis, secours.
 pour plusieurs des articles qui traitent d’inanimés, le référent de la chaîne principale est humain
(Austen manuscrit, victimes incendie cuisine)
 il semble y avoir plus de pronoms personnels dans les articles qui traitent d’humains (à confirmer
par chiffres)

S-ar putea să vă placă și