Documente Academic
Documente Profesional
Documente Cultură
Comme la statistique repose sur des données quantitatives, il s’agit dans cette
première partie d'explorer La base lexicale que nous avons constituée. Ce travail
d'exploration nous permettra de connaître davantage notre objet et de circonscrire le champ
d'investigation.
Certes nous rencontrerons un grand nombre de données numériques, mais la maîtrise du
logiciel d'exploitation limitera les fluctuations et les aléas statistiques. Cette première partie
sera divisée en quatre chapitres présentés selon un ordre imposé soit par les contraintes du
logiciel, soit par un souci de logique dans le traitement des données.
Nous expliquerons tout d’abord, dans le premier chapitre, les démarches suivies pour
arriver à la constitution de la base que nous utiliserons tout au long de ce travail. A ce
niveau, nous sommes confronté à une nuée de données constituant l'étendue quantitative de
notre corpus et qu'il s’agit, en fait, d’organiser. Une question se pose dès lors : ces données
numériques se prêtent-elles à une organisation quelconque ? C'est ce à quoi nous nous
proposons de répondre dans le deuxième chapitre.
Il s’agit ici de retrouver la structure du vocabulaire de Djaout. Nous entendons par
structure les caractéristiques du vocabulaire de l'auteur, concernant aussi bien la richesse
lexicale de l'œuvre que le contenu lexical représenté en fréquences. Certaines questions sont
Soulevées dans ce chapitre : Est-ce que le vocabulaire de l'auteur est riche ? Quelle est la
tendance du vocabulaire dans son évolution ? Assistons-nous à un corpus où les mots rares
ont un large pourcentage, témoignant de la richesse lexicale du corpus ? Quels sont les
groupes de fréquences que constitue le corpus ?
Ensuite, une fois l’approche quantitative épuisée, nous nous attarderons sur l'approche
Qualitative qui nous renseignera sur le contenu lexical du corpus. Ce chapitre nous amènera à
Clarifier certains points qui restent obscurs, que l'analyse quantitative n'est pas parvenue à
éclaircir, dans la mesure où ils dépendent plus de l'intuition que du calcul automatique. Il
s'agit de répondre à une question qui préoccupe la statistique linguistique : existe-t-il des
frontières étanches entre les divers textes constituant une œuvre ou sont-elles transcendées
21
CHAPITRE I: Analyse statistique du corpus
22
CHAPITRE I: Analyse statistique du corpus
23
CHAPITRE I: Analyse statistique du corpus
24
CHAPITRE I: Analyse statistique du corpus
25
CHAPITRE I: Analyse statistique du corpus
rapprochent également. Quant à Les Vigiles, son étendue lexicale est située en
moyenne par rapport aux deux couples de textes.
Par contre, l'évolution du lexique de Djaout nous paraît, au premier abord,
contradictoire. Effectivement, nous constatons une baisse dans le nombre des formes,
bien que, logiquement, nous nous attendions à un enrichissement du capital lexical.
Une première hypothèse sur cette évolution nous paraît être l'exigence de l'auteur
dans le choix des formes, ce qui exclut bon nombre de termes, mais aussi le fait que
les thèmes traités sont divers et nécessitent à des degrés différents l'emploi de tel ou
tel champ lexical. Enfin, nous pensons que l'auteur, en se consacrant à l'écriture
journalistique aux dépens de l'écriture littéraire, aurait réduit son lexique pour des
raisons relevant du discours journalistique.
Nous allons tenter de vérifier ces hypothèses dans le deuxième chapitre qui
sera consacré à l’organisation du vocabulaire dans l'œuvre de Djaout.
26