Sunteți pe pagina 1din 32

UNIVERSITE CHARLES DE GAULLE LILLE 3 UFR Humanits Dpartement sciences du langage Master SCIENCES HUMAINES ET SOCIALES

MENTION SCIENCES DU LANGAGE Spcialit Lexicographie, Terminographie et Traitement Automatique des Corpus

La formation LTTAC dbute le jeudi 12 septembre 2013 10h30 en salle A2 412. La prsence assidue des tudiants est ncessaire ds cette date.
La spcialit Lexicographie, Terminographie et Traitement Automatique des Corpus (LTTAC) est un parcours de deux annes (M1 et M2) qui, en fonction du projet de formation des tudiants, peuvent tre soit combines, soit suivies de manire indpendante. En combinant un M1 qui propose aux tudiants de dvelopper leurs comptences linguistiques et informatiques en les combinant une bonne connaissance des dictionnaires existants, puis un M2 plus spcifiquement consacr la Lexicographie, la Terminographie et au Traitement Automatique des Corpus, cette formation vise donner une qualification en ingnierie linguistique en phase avec les nouvelles technologies de linformation et de la communication (NTIC) dans les domaines suivants : rdaction de dictionnaires monolingues et bilingues et dencyclopdies, conception de bases de donnes pour la lexicographie et la terminologie, dveloppement de lexiques pour des systmes daide la rdaction ou de traduction automatique ou assiste, laboration de catalogues et de guides thmatiques, construction dontologies pour le traitement automatique des langues (TAL) et lintelligence artificielle (IA), intgration de ressources lexicales des moteurs de recherche et autres outils dextraction dinformations (par exemple des agents conversationnels) ou dindexation automatique de documents. Au terme de leur formation, les tudiants diplms, forms lanalyse linguistique du lexique et familiariss avec les technologies informatiques les plus rcentes, pourront prtendre une insertion professionnelle notamment en tant que : lexicographes (rdacteurs et chefs de projets) pour des diteurs spcialiss, terminologues au sein dinstitutions ou dentreprises industrielles ou commerciales, traducteurs terminologues dans des entreprises de traduction de logiciels, de didacticiels, de jeux, etc., rdacteurs de guides pratiques et de catalogues techniques ou commerciaux, informaticiens dans des quipes dinformatique ditoriale, linguistes informaticiens dans des entreprises informatiques relevant des industries de la langue. La responsable de la spcialit LTTAC est : Nathalie GASIGLIA Matre de confrences (habilite diriger des recherches) de Sciences du langage, UMR STL & UFR Humanits, dpartement Sciences du langage Tl. : 03.20.41.66.61 ou 06.11.44.20.33 Courriel : nathalie.gasiglia@univ-lille3.fr

1. Master 1 LTTAC
Pour plus dinformations consultez le site de la formation : http://stl.recherche.univ-lille3.fr/siteheberges/LTTAC/M1LTTAC.htm et le site du dpartement : http://www.univ-lille3.fr/ufr-humanites/sciences-langage/formations/masters/lttac/ Le M1 LTTAC est une plateforme originale de formation en sciences du langage, qui a pour objectif de fournir les bases dune qualification en ingnierie linguistique, ouvrant la porte dune part la recherche en linguistique descriptive et/ou formelle, dautre part une large gamme dinsertions professionnelles dans les domaines de ldition (en particulier douvrages de rfrence comme les dictionnaires), des industries de la langue (IDL) et des nouvelles technologies de linformation et de la communication (NTIC), auxquelles prpare ensuite de faon plus pousse le M2 LTTAC. Pour raliser ses objectifs, le M1 LTTAC articule 7 composantes, distribues en 12 UE (units denseignement) rparties sur 2 semestres : un enseignement de linguistique fondamentale, noyau par dfinition de toute formation en sciences du langage ; un panorama des domaines du traitement automatique des langues (TAL) et des types de rpertoires lexicaux produits pour le grand public et les industries de la langue ; une initiation aux ressources et aux outils informatiques exploitables pour les analyses linguistiques ; un renforcement en langues vivantes ; une spcialisation dans un domaine choisir entre la lexicographie, la linguistique, la traduction assiste par ordinateur ; la rdaction dun court mmoire sur une recherche originale, pouvant dboucher sur une application, pour renforcer les qualits de synthse et de crativit ; un stage de 3 mois minimum dans une entreprise ou un tablissement public spcialiss, pour familiariser avec les ralits de la vie professionnelle.

Conditions dadmission Public :


Le M1 LTTAC sadresse tous les tudiants ayant une excellente matrise de leur langue maternelle et une bonne connaissance dau moins une langue trangre, qui sont dsireux de mettre le langage au cur de leurs activits de recherche ou professionnelles, et qui veulent aborder celles-ci avec les techniques modernes de loutillage informatique, ou dvelopper de nouveaux outils de traitement automatique du langage. tous ceux qui se destinent une large gamme dactivits, allant de la linguistique fondamentale ou applique au dveloppement de produits multimdias, en passant par la lexicographie, la terminologie, la traduction automatique ou assiste par ordinateur, llaboration doutils de navigation, la didactique outille des langues ou les mtiers de ldition, le M1 LTTAC apporte des connaissances de base en matire de description et de formalisation linguistiques et dappropriation thorique et pratique doutils informatiques impliqus dans le traitement des langues, des textes et des connaissances, tels que : les logiciels de transcription aligne aux sons ou aux vidos ;

les outils dindexation automatique de documents ; les tiqueteurs morphosyntaxiques ; les systmes dalignement de corpus multilingues ; les concordanciers ; les outils de fouille de textes et dextraction dinformations ; les ontologies ; les dictionnaires lectroniques ; les mmoires de traduction ; etc. En formation initiale, le M1 LTTAC est ouvert tous les tudiants titulaires dune licence (ou dune quivalence). Il sinscrit de manire naturelle dans la filiation des licences comportant une composante linguistique et/ou de traitement automatique des langues (lettres modernes ou classiques, sciences du langage, franais langue trangre (FLE), langues vivantes, sciences humaines et sociales, informatique applique), mais est aussi accessible aux tudiants venant dautres filires. Selon leur parcours antrieur et leur projet de formation, il pourra tre propos certains tudiants de faire quelques lectures complmentaires en linguistique et/ou en traitement automatique du langage. La formation est ouverte aux tudiants francophones de toutes nationalits. La pratique de plusieurs langues langues de large diffusion mais aussi langues dextension plus restreinte est un atout particulirement apprci dans lensemble des activits professionnelles qui ont recours aux techniques du traitement automatique du langage. Les tudiants disponibilit rduite (salaris ou autres) pourront suivre la formation en chelonnant sur plus dune anne lassistance aux enseignements et la validation des contrles. Au titre de la formation continue, la formation est aussi ouverte aux professionnels des industries de la langue impliqus dans la constitution et la manipulation de ressources lexicales structures et de corpus qui souhaitent complter leur formation en suivant tout ou partie des enseignements dispenss.

Modalits de prinscription :
Lentre en M1 LTTAC ne fait pas lobjet dune slection. Le dossier de prinscription que nous vous demandons de nous adresser est donc une dclaration dintention, un engagement dans un projet de formation. Ce dossier nous permet de connatre votre parcours de formation et vos ventuelles expriences professionnelles afin que, ds notre premire rencontre ou nos premiers changes, nous puissions envisager les conditions de travail qui maximiseront vos chances de russite et vous permettront de tirer le meilleur profit des enseignements que nous vous proposons. Pour vous prinscrire, vous devez tlcharger le dossier1 ou le demander par mail N. Gasiglia, limprimer, le remplir, et ladresser N. Gasiglia ( ladresse indique sur le dossier), accompagn des documents utiles, avant lune des dates suivantes :

Cf. : http://stl.recherche.univ-lille3.fr/siteheberges/LTTAC/index.htm, menu de bas de page intitul Comment sinscrire .

candidats ayant des diplmes trangers : 29 mars 2013 (date fixe par la scolarit pour la rception des dossiers par le Bureau dAccueil des tudiants de lInternationale) 1e session de recrutement : dernier vendredi de juin (soit le 28 juin 2013) 2e session de recrutement : premier vendredi de septembre (soit le 6 septembre 2013) Une rponse sera donne chaque dossier reu dans les quelques jours suivant son arrive (sauf durant la fermeture estivale de luniversit). Si cette rponse tarde, nhsitez pas contacter N. Gasiglia. Attention : selon votre situation, le dossier de prinscription peut devoir tre accompagn dun autre dossier administratif. Vrifiez bien, sur le site web de luniversit ou auprs de N. Gasiglia, si vous relevez dun des cas appelant des dmarches particulires (tudiants ayant dbut leurs tudes suprieures ltranger, en reprise dtudes et dsireux de demander une validation VAP 85, en formation continue).

Structure des enseignements :


La formation comporte 346 heures de cours (de septembre mai), un stage de 3 mois minimum et la rdaction dun mmoire de recherche. Les 12 units denseignement (UE) reprsentent 60 crdits ECTS (Systme Europen de Transfert de Crdits) : 30 ECTS par semestre. Une prsence assidue tous les cours est indispensable. Les tudiants qui exercent une activit professionnelle pourront bnficier dun rgime amnag et valider leur M1 sur plus dune anne. Les cours dbuteront par deux journes intensives durant lesquelles les tudiants des nouvelles promotions assisteront entre autres choses aux soutenances de rapports de stage des tudiants qui terminent leur M1 ou leur M2. La prsence ces deux journes est strictement ncessaire pour une prise de repres professionnels. Pour chaque constituant dUE, la structure ci-aprs indique le cas chant sil est emprunt une autre formation. Les cours mutualiss avec le M2 LTTAC ont des contenus denseignement diffrents chaque anne. Les cours de spcialisation emprunts des formations autres que le M2 LTTAC et le M. Linguistique ne seront proposs que si la compatibilit horaire des cours le permet. Attention : Les tudiants dautres formations dsireux de suivre des cours du M1 ou du M2 LTTAC sont tenus de contacter N. GASIGLIA avant le dbut des cours. Si cette dmarche na pas t ralise avant la 2e sance du programme de formation choisi, celui-ci ne sera plus accessible.

Master 1 - S1 Intitul S1 UE1 Conditions de production des outils composante linguistique des Industries de la Langue a Diffrents aspects des activits du TAL (18 h) b Typologie des rpertoires lexicaux et conditions conomiques de leur production [emprunt au M2 LTTAC UE1 a] (18 h) S1 UE2 Linguistique a Thories linguistiques [emprunt au M1 Linguistique] (18 h + 18 h) b Option de linguistique : sminaire de linguistique choisir [emprunt au M2 LTTAC UE2 b ou au M1 Linguistique] (24 h) S1 UE3 Traitement Automatique des Corpus a Approche des ressources et outils informatiques pour la linguistique (24 h) b Algorithmique (18 h) c Programmation pour lextraction dinformations 1 (JavaScript) (18 h) d Structuration de textes pour lanalyse ou la publication 1 (18 h) 78 h 12 60 h 6 heures 36 h ECTS 3 minimum

Master 1 S2 Intitul S2 UE1 Stage de 3 mois heures ECTS 6

S2 UE2 Linguistique a Thories linguistiques [emprunt au M1 Linguistique] (18 h) b Option de linguistique : sminaire de linguistique choisir [emprunt au M1 Linguistique] (24 h) S2 UE3 Traitement Automatique des Corpus c Programmation pour lextraction dinformations 2 (JavaScript) [emprunt M2 LTTAC S4 UE3 c] (18 h) d Manipulations de textes structurs pour lanalyse ou la publication 1 (12 h)

42 h

30 h

Master 1 - S1 Intitul S1 UE4 Option de spcialisation Lexicographie OU Linguistique OU Traduction assiste par ordinateur [emprunt diverses formations, cf. descriptifs des enseignements ci-aprs] S1 UE5 Langue vivante S1 UE6 Mmoire de recherche (tape 1) Total 232 h 30 24 h 10 h 3 3 heures 24 h ECTS 3 S1 UE4 Option de spcialisation

Master 1 S2 Intitul heures 24 h ECTS 3

Lexicographie OU Linguistique OU Traduction assiste par ordinateur [emprunt diverses formations, cf. descriptifs des enseignements ci-aprs] S1 UE5 Langue vivante S2 UE6 Mmoire de recherche (tape 2) Total 114 h + stage 30 18 h 3 6

Programmes M1 semestre 1
UE 1 CONDITIONS DE PRODUCTION DES OUTILS COMPOSANTE LINGUISTIQUE DES INDUSTRIES DE LA LANGUE Responsable : Nathalie GASIGLIA Volume horaire : 2 fois 18 h soit 36 h 3 ECTS Coeff 1 2 enseignements obligatoires : a DIFFRENTS ASPECTS DES ACTIVITS DU TAL Enseignants : Antonio BALVET Une prsentation d'ensemble du domaine du TAL sera propose : historique, principaux domaines, principales applications et techniques, liens avec les disciplines connexes. Des intervenants professionnels complteront cette introduction par des prsentations de leurs activits et de leurs produits. Cet ensemble dinterventions doit permettre aux tudiants de se former une reprsentation concrte du domaine du TAL, et de mieux situer les tches auxquelles ils seront susceptibles de contribuer dans un environnement professionnel. b TYPOLOGIE DES RPERTOIRES LEXICAUX ET CONDITIONS CONOMIQUES DE LEUR PRODUCTION Enseignant : Pierre CORBIN Les rpertoires lexicaux sont accessibles au grand public (ils sont alors appels dictionnaires) mais ils sont galement employs dans le cadre de certaines activits professionnelles (il sagit en gnral de dictionnaires ou de rpertoires ne dcrivant que les usages de spcialistes dun domaine, les terminologies), et ils peuvent tre intgrs des applications informatiques (ce qui implique des adaptations des modes de prsentation des informations quils contiennent). Lenseignement vise prsenter les types de rpertoires lexicaux existants et les services quils rendent en fonction des informations quils fournissent et de leur mode dutilisation.

UE 2 LINGUISTIQUE Responsable : Nathalie GASIGLIA Volume horaire : 2 fois 18 h plus 24 h soit 60 h 6 ECTS Coeff 2 3 enseignements obligatoires : a1 THORIES LINGUISTIQUES (MORPHOLOGIE) Voir spcialit Linguistique : M1, S1, UE1 a2 THORIES LINGUISTIQUES (smantique) Voir spcialit Linguistique : M1, S1, UE1 b OPTION DE LINGUISTIQUE : sminaire de linguistique

choisir dans loffre de la mention SDL : UE2 du M2 LTTAC composant Linguistique pour la lexicographie et la terminographie, ou UE2 ou UE3 du M1 Linguistique. Choix dfinir avec la responsable de spcialit et le directeur de recherche, en fonction du sujet de mmoire et du projet de formation de ltudiant).

UE 3 TRAITEMENT AUTOMATIQUE DES CORPUS Responsable : Nathalie GASIGLIA Volume horaire : 24 h plus 3 fois 18 h soit 78 h 12 ECTS Coeff 4 4 enseignements obligatoires. a APPROCHE DES RESSOURCES ET OUTILS INFORMATIQUES POUR LA LINGUISTIQUE Enseignant : Antonio BALVET La description et la modlisation en linguistique, bases sur des exemples attests, collects dans des conditions contrles, se sont imposes comme un domaine complmentaire la linguistique thorique et formelle, dont la grammaire gnrative est un des exemples les plus connus. Par ailleurs, ds quune adquation descriptive forte, pouvant donner lieu des applications concrtes (ex : relevs terminologiques) est envisage, le recours aux mthodes de la linguistique de corpus simpose. Ce module denseignement vise donner aux tudiants les bases mthodologiques pour constituer un corpus exploitable pour un projet de description et de modlisation en linguistique, quel que soit le parcours envisag par la suite : recherche ou professionnel. Ces bases seront compltes par une prsentation des principaux corpus disponibles aujourdhui tant pour la modalit textuelle (Frantext, French Treebank, British National Corpus), orale (Phonologie du Franais Contemporain) que visuo-gestuelle (ECHOS, LS-Colin). Pour chaque modalit, les principaux outils informatiques permettant lexploitation des donnes seront prsents : concordanciers (ex : Unitex, Stella dans Frantext), logiciels de transcription et dexprimentation phontique (ex : Praat), logiciels de transcription pour la modalit gestuelle (ex : ELAN). Bibliographie : Habert B., Fabre C. & Issac F. (1998), De lcrit au numrique. Constituer, normaliser et exploiter les corpus lectroniques, Paris, Interditions. Habert B., Nazarenko A. & Salem A. (1997), Les linguistiques de corpus, Paris, Armand Colin. b ALGORITHMIQUE Enseignants : Nathalie GASIGLIA et Fabien TORRE Lalgorithmique va permettre aux tudiants dacqurir la capacit de concevoir de petits programmes et leur donner les moyens, ultrieurement, de sapproprier diffrents langages de programmation. Nous nous concentrerons sur des traitements de donnes langagires comme le reprage de certains types dunits lexicales (par exemple des noms drivs dun verbe) dans un fichier de texte, la formalisation de rgles de crations morphologiques ou de flexion, etc. Cet enseignement fournira loccasion dinsister sur limportance dune analyse minutieuse pralable toute programmation et sur le rle crucial de la dcomposition dun problme complexe en sous-tapes strictement

dfinies et ordonnes puis de leur modlisation, en employant un vocabulaire et une syntaxe appropris et prdfinis. Ce cours expliquera comment dcomposer diffrentes tches qui pourront tre programmes pour tre accomplies automatiquement, mais ces dcompositions de tches complexes en tches lmentaires programmables seront labores sans tenir compte des spcificits dun langage informatique particulier. c PROGRAMMATION POUR LEXTRACTION DINFORMATIONS 1 : JAVASCRIPT Enseignant : Fabien TORRE Cet enseignement propose une dcouverte de la programmation avec le langage JavaScript et une introduction la manipulation automatique de documents semi-structurs. JavaScript est un langage intrinsquement li aux documents (x)html (cest--dire en particulier la grande majorit des documents prsents sur le web), a priori documents statiques que JavaScript permet de rendre dynamiques. JavaScript se diffrencie des autres langages de programmation car la programmation se fait dans le document lui-mme et lexcution du programme se fait ct client, cest--dire par le navigateur de lutilisateur. Ces caractristiques autorisent lutilisateur interagir avec le document dans son navigateur, sans aller-retour avec le serveur web. JavaScript a rcemment connu un regain dintrt avec : le soutien dclar en 2009 du W3C au web multimdia avec html5 et au dtriment de xhtml, le refus par Apple en 2010 dutiliser Flash sur ses appareils, le couple html5-JavaScript apparat alors comme la seule alternative, la volont des diteurs traditionnels de proposer leurs livres sous forme de-books (dont les formats majeurs comme epub ou kindle sont bass sur html), en profitant du passage papier-numrique pour les rendre dynamiques ou interactifs. Le cours commencera par une mise niveau sur html, puis passera en revue les sujets suivants : mise en uvre en JavaScript du cours dalgorithmique, interaction entre JavaScript et lobjet graphique canvas de html5, modification des documents html travers lAPI DOM de JavaScript. Des ralisations concrtes illustreront le cours et seront demandes aux tudiants : productions automatiques de phrases, jeux graphiques et ludiques, manipulation de textes, aide ltiquetage de textes, extraction et visualisation automatique dinformations, etc. Cet enseignement pourra servir de bases dventuels apprentissages dans le cursus des tudiants ou dans leur future carrire professionnelle : lalgorithmique et la dcouverte du langage JavaScript faciliteront lapprentissage de tout autre langage de programmation, la modification de documents travers lAPI DOM pourra tre mise en uvre avec un autre langage de programmation que JavaScript, et pour des documents xml non ncessairement html. Les comptences acquises pendant ce cours sont galement reconnues dans le monde professionnel, en particulier avec lutilisation de html5/JavaScript dans les formats e-book. Les supports de cours et exercices seront disponibles en ligne.

d STRUCTURATION DE TEXTES POUR LANALYSE OU LA PUBLICATION 1 Enseignante : Nathalie GASIGLIA Pour tre explors avec efficacit, les documents textuels runis en corpus gagnent souvent tre enrichis dannotations de natures diverses (tiquetage grammatical des mots, indications smantiques, etc.). Pour que ces annotations ne se mlent pas indment aux donnes, il est important de structurer les corpus, et, cette fin, le langage XML fournit des solutions techniques dont des chercheurs ont su tirer profit pour proposer des principes de structuration de corpus : la TEI (Text Encoding Initiative). Par ailleurs, les diteurs dsireux de pouvoir utiliser les mmes contenus textuels dans diffrentes publications proposes sur supports imprims comme lectroniques structurent leurs productions textuelles directement ou en convertissant les styles mis en uvre dans les documents. Nous chercherons appliquer les propositions de la TEI comme les structurations partir de styles hrits des traitements de textes pour laborer des corpus baliss en XML en travaillant par exemple sur des textes scientifiques de linguistes dont nous souhaitons analyser lexpression et le vocabulaire, sur des textes traduits aligner pour constituer un corpus bilingue au sein desquels nous souhaitons tudier les quivalences traductionnelles, ou encore sur des ditions diffrentes de textes anciens aligns. Bibliographie Burnard L. & Sperberg-McQueen C.M. (1996), La TEI simplifie : une introduction au codage des textes lectroniques en vue de leur change , Cahiers GUTenberg n 24. Ray E.T. (2001), Introduction XML, traduction dAlain Ketterlin, Paris, OReilly. TEIP5 : http://www.tei-c.org/Guidelines/P5/

UE 4 OPTION DE SPCIALISATION Responsable : Nathalie GASIGLIA Volume horaire : 24 h 3 ECTS Coeff 1 En fonction du projet de formation de ltudiant, choix, dfinir avec les responsables de spcialit et le directeur de recherche (cf. UE6), entre : Lexicographie : voir M2 LTTAC S3 UE4 composant a Analyse structurelle des rpertoires lexicaux imprims et sur support lectronique. Linguistique : un sminaire (diffrent de celui choisi en UE2) choisir dans loffre de la mention SDL (UE2 du M2 LTTAC, composant Linguistique pour la lexicographie et la terminographie, ou UE2 et UE3 du M1 Linguistique). Traduction assiste par ordinateur : un enseignement du master LEA spcialit TSM. Cette liste est susceptible de varier chaque anne en fonction des compatibilits horaires des cours.

UE 5 LANGUE VIVANTE Responsable : Michael MARKEY Volume horaire : 24 h 3 ECTS Coeff 1 Dans toute la mesure du possible, les tudiants suivront un cours danglais appliqu aux sciences du langage. Seront travailles dans ce cours les comptences crites et orales, dans leur phase de comprhension et de production. Les cours en prsentiel seront complts par des sances en auto-formation obligatoires au Centre de Ressources en Langues (CRL). Les tudiants seront rpartis en groupes de niveau, aprs avoir pass un test de positionnement en dbut d'anne. Ils pourront prparer le CLES (Certificat de Comptences en langues de l'Enseignement Suprieur). Les tudiants de linternational hors programme (Erasmus, Crepuq, etc.) pourront suivre un enseignement de franais langue trangre au titre de la langue vivante.

UE 6 MMOIRE DE RECHERCHE (TAPE 1) Responsable : Nathalie GASIGLIA Volume horaire : 10 h de cadrage mthodologique + travail personnel 3 ECTS Coeff 1 Premire tape de la rdaction dun mmoire relatif une question de (mta)lexicographie, de terminographie, de traitement automatique des corpus, de linguistique ou de TAL : bibliographie, fiches de lectures, tat de lart et, si cest pertinent, tat du march des ouvrages ou des outils logiciels. La ralisation de ce travail implique le choix dun directeur de recherche, puis, avec ce dernier, celui dun sujet de mmoire (ce choix pouvant conduire envisager une co-direction de mmoire et donc solliciter la direction dun second directeur). Les tudiants dtermineront leur choix de directeur(s) de recherche en tout dbut danne, avec laide de la responsable de la spcialit et, naturellement, du ou des directeurs pressentis. Le sujet de mmoire doit imprativement tre diffrent du sujet de stage.

Programmes M1 semestre 2
UE 1 STAGE Responsable : Nathalie GASIGLIA Volume horaire : 3 mois minimum quivalent temps plein 6 ECTS Coeff 2 Stage en entreprise ou dans un tablissement public. Excution de missions correspondant aux contenus de formation. Ce stage constituera une premire exprience concrte dans les industries de la langue, le secteur ditorial ou un laboratoire de recherche. Il permettra chaque tudiant de construire un projet professionnel adapt ses motivations. Le sujet de stage doit diffrer du sujet de mmoire. Le stage pourra tre ralis aprs la fin des cours (en fin de second semestre) ou temps partiel paralllement aux cours (pour un quivalent temps plein de 3 mois minimum).

UE 2 LINGUISTIQUE Responsable : Nathalie GASIGLIA Volume horaire : 18 h plus 24 h soit 42 h 6 ECTS Coeff 2 2 enseignements obligatoires : a THORIES LINGUISTIQUES (SYNTAXE) Voir spcialit Linguistique : S2, UE1 b OPTION DE LINGUISTIQUE : sminaire de linguistique choisir dans loffre de la mention SDL (S2, UE2 et UE3 du M1 Linguistique ; choix dfinir avec la responsable de spcialit et le(s) directeur(s) de recherche, en fonction du projet de formation de ltudiant).

UE 3 TRAITEMENT AUTOMATIQUE DES CORPUS Responsable : Nathalie GASIGLIA Volume horaire : 18 h plus 12 h soit 30 h 6 ECTS Coeff 2 2 enseignements obligatoires : c PROGRAMMATION POUR LEXTRACTION DINFORMATIONS 2 : JAVASCRIPT Enseignant : Fabien TORRE Voir M1 LTTAC UE3 du S1 composant c Programmation pour lextraction dinformations 1 : JavaScript.

d MANIPULATIONS DE TEXTES STRUCTURS POUR LANALYSE OU LA PUBLICATION 2 Enseignante : Nathalie GASIGLIA Prolongement de lenseignement de M1 LTTAC S1 UE3 composant d Structuration de textes pour lanalyse ou la publication 1. Utilisation de la structuration en XML des corpus constitus afin dextraire des donnes au moyen de transformation XSLT. Les rfrences bibliographiques utiles seront indiques en cours.

UE 4 OPTION DE SPCIALISATION Responsable : Nathalie GASIGLIA Volume horaire : 24 h 3 ECTS Coeff 1 Le choix de loption de spcialisation du second semestre doit a priori tre le mme quau premier semestre. Si une rorientation est envisage, elle est soumise laccord du directeur de recherche, celui des responsables de la spcialit et de la nouvelle option choisie. Lexicographie : voir M2 LTTAC S4 UE2 (24 h sur les 42 h que compte lUE). Linguistique : un sminaire (diffrent de celui choisi en UE2) choisir dans loffre de la mention SDL (ou UE2 et UE3 du M1 Linguistique).

UE 5 LANGUE VIVANTE Responsable : Michael MARKEY Volume horaire : 18 h 3 ECTS Coeff 1 Dans toute la mesure du possible, les tudiants suivront un cours danglais appliqu aux sciences du langage. Seront travailles dans ce cours les comptences crites et orales, dans leur phase de comprhension et de production. Les cours en prsentiel seront complts par des sances en auto-formation obligatoires au Centre de Ressources en Langues (CRL). Les tudiants seront rpartis en groupes de niveau, aprs avoir pass un test de positionnement en dbut d'anne. Ils pourront prparer le CLES (Certificat de Comptences en langues de l'Enseignement Suprieur). Les tudiants de linternational hors programme (Erasmus, Crepuq, etc.) pourront suivre un enseignement de franais langue trangre au titre de la langue vivante.

UE 6 MMOIRE DE RECHERCHE (TAPE 2) Responsable : Nathalie GASIGLIA 6 ECTS Coeff 2 Deuxime tape de la rdaction du mmoire (suite de lUE6 du S1) : laboration dune recherche ou dun projet original en (mta)lexicographie, en terminographie, en traitement automatique des corpus, en linguistique ou en TAL. Le mmoire de M1 LTTAC pourra constituer le socle dune recherche de plus grande ampleur pour la rdaction du mmoire de projet ou du mmoire de recherche du M2 LTTAC (selon que ltudiant ambitionne en fin de M2 une insertion professionnelle ou une poursuite dtude en recherche donnant lieu la prparation dun doctorat qui peut tre ralis avec une insertion professionnelle, dans le cadre dun contrat CIFRE).

Modalits de contrle M1
En complment des indications ci-dessous, merci de consulter les modalits de contrle communes la mention ainsi que la note sur le plagiat valable pour lensemble des spcialits de la mention. Le M1 LTTAC ne sera valid que si chacune des 12 UE la t, cest--dire si la note obtenue en valuation pour chacune est suprieure 10, et que donc les 60 crdits sont cumuls. En cas dchec une ou plusieurs UE, si la moyenne pondre des notes est suprieure 10, une attestation dquivalence de matrise pourra tre dlivre. Les contrles des connaissances relatifs aux enseignements (UE1 UE5 du semestre 1 et UE2 UE5 du semestre 2) se font en contrle continu, au moyen de devoirs sur table, dexposs et/ou de dossiers. Le stage (UE1 du semestre 2) est valu sur la base dun rapport circonstanci du tuteur de stage (en fonction dune grille dvaluation), dun mmoire de rapport de stage rdig par ltudiant et dune soutenance. Le mmoire de recherche (UE6 de chaque semestre) est valu en fonction de la qualit de la recherche engage : celle de lavancement de ltat de lart et de la prsentation du projet la fin du semestre 1, puis celle du mmoire et de sa soutenance la fin du semestre 2.

Poursuite des tudes aprs le M1 LTTAC


Les maquettes denseignements depuis la rforme dite LMD (Licence, Master, Doctorat) regroupent en un Master les 4e et 5e annes de formation universitaire post-baccalaurat. En consquence, les parcours qui vous sont proposs sont conus de manire ce que les enseignements dispenss pendant ces deux annes sarticulent et senchanent de faon pleinement cohrente, tout en prservant une identit spcifique chacune des deux annes. lissue du M1 LTTAC, qui fixe un socle fondamental de connaissances thoriques et de savoir-faire pratiques en sciences du langage et en traitement automatique des langues et des corpus, les tudiants pourront choisir entre plusieurs voies pour mener terme leur master : le M2 LTTAC, formation professionnalisante unique en France, qui peut constituer une bonne formation galement pour ceux qui se destinent un doctorat dont le sujet sinscrit dans lun des domaines de la formation ; le M2 Linguistique, formation de la mention SDL plus spcifiquement oriente vers la recherche en linguistique ; un M2 de langue, luniversit Lille 3 ou dans une autre universit ; un M2 de sciences du langage dans une autre universit ; un M2 de TAL dans une autre universit.

2. Master 2 spcialit LTTAC


Pour plus dinformations consultez le site de la formation : http://stl.recherche.univ-

lille3.fr/siteheberges/LTTAC/M2LTTAC.htm ou le site du dpartement : humanites/sciences-langage/formations/masters/lttac/

http://www.univ-lille3.fr/ufr-

Le M2 Lexicographie, Terminographie et Traitement Automatique des Corpus (LTTAC) est une formation unique en France qui a pour objectif de dvelopper les comptences professionnelles utiles pour : lexercice de la lexicographie monolingue et bilingue, traditionnelle et lectronique, dans tous ses compartiments, chez des diteurs de dictionnaires privs ou publics ; la pratique de la terminographie, monolingue, bilingue et multilingue, traditionnelle et lectronique, dans des organismes officiels, des grandes entreprises industrielles ou commerciales et dans ldition prive ; linsertion dans diffrents secteurs des industries de la langue pour la conception et le dveloppement doutils bureautiques forte composante lexicale (dictionnaires lectroniques, systmes de traduction automatique ou assiste par ordinateur, logiciels de recherche documentaire, correcteurs grammaticaux ou orthographiques, bases de donnes linguistiques, bases de connaissances, etc.). de former la recherche les tudiants dsireux dengager un doctorat dont le sujet sinscrirait dans lun des domaines de la formation, que la recherche soit thorique ou applique (impliquant alors une entreprise o ltudiant serait salari dans le cadre dun contrat CIFRE). Le M2 LTTAC bnficie dune exprience de 22 annes et de la participation de professionnels reprsentant les intervenants majeurs des domaines couverts : maisons ddition de dictionnaires gnraux et spcialiss, tablissements publics impliqus dans la cration de ressources lexicographiques et terminologiques, entreprises dveloppant des outils informatiques composante linguistique. Pour raliser ses objectifs, le M2 LTTAC articule 5 composantes, distribues en 12 UE (units denseignement) rparties sur 2 semestres : un panorama complet des diffrentes composantes de lactivit lexicographique et de lensemble des pratiques mises en uvre dans la rdaction de dictionnaires, de rpertoires terminologiques et dencyclopdies, et dans llaboration de lexiques pour des applications informatiques ; une initiation mthodique aux principes et au maniement des diffrents outils informatiques pertinents pour lensemble des applications concernes par le traitement du lexique (langages de structuration de documents, bases de donnes, outils dextraction dinformation, certains types de programmation) ; un enseignement de linguistique fondamentale orient vers les besoins des traitements pratiques du lexique ; la rdaction dun mmoire dveloppant et illustrant un projet original de rpertoires, de ressources ou de produits multimdias susceptible de dboucher sur une application concrte ; un stage de 3 mois minimum dans une entreprise ou un tablissement public spcialis, pour renforcer lexprience pratique et approfondir la connaissance des ralits de la vie professionnelle.

Conditions dadmission Public :


Le M2 LTTAC sadresse tous les tudiants ayant une excellente matrise de leur langue maternelle et une bonne connaissance dau moins une langue trangre, qui veulent consolider leurs acquis et renforcer leurs comptences en sciences du langage et en traitement automatique des langues, et dvelopper leur qualification en vue dune insertion professionnelle dans une des diverses branches dactivit qui recourent un outillage informatique pour traiter des donnes linguistiques. tous ceux qui veulent sinvestir dans la lexicographie, la terminologie, llaboration doutils de navigation et dexploration de ressources informatises, la traduction automatique ou assiste par ordinateur, la didactique outille des langues ou les mtiers de ldition, le M2 LTTAC apporte les connaissances thoriques et pratiques avances ncessaires pour lidentification des objectifs, la familiarisation avec les mthodes et les outils de description et de formalisation linguistiques typiques de la large gamme des activits professionnelles concernes : rdaction de rpertoires lexicaux, gnraux ou spcialiss, monolingues ou bilingues ; dveloppement de dictionnaires lectroniques ou dencyclopdies multimdias ; gestion de bases de donnes ; structuration, exploration et indexation de documents ; conception dontologies ; laboration dagents conversationnels. Prolongement naturel du M1 LTTAC de Lille 3 dans une perspective professionnalisante ou de recherche, le M2 LTTAC offre aux tudiants issus de cette premire anne de master rellement motivs et de bon niveau lopportunit dun approfondissement des savoirs et des savoir-faire ncessaire pour une insertion professionnelle russie lissue du M2, dans le cadre dun doctorat ralis avec un contrat CIFRE, ou ventuellement diffre aprs la soutenance dune thse engage en fin de M2. Son statut de formation professionnalisante dexcellence prdispose aussi le M2 LTTAC accueillir comme par le pass un large vivier dtudiants venant dautres universits franaises et trangres dsireux dacqurir les comptences professionnelles auxquelles il prpare. La diversit des qualifications acqurir ouvre cette formation des tudiants se recrutant dans un large ventail de formations : lettres, sciences du langage, franais langue trangre (FLE), toutes langues vivantes ou anciennes, philosophie, documentation, informatique, etc., sans exclure des spcialistes de toute discipline scientifique ou technique qui seraient intresss par llaboration de dictionnaires de spcialit pour leur domaine. En consquence, mme si certains Masters 1e anne (ou quivalence) prdisposent mieux que dautres prparer ce diplme, les critres dadmission dterminants sont la qualit du dossier et la nature de la motivation. Les tudiants disponibilit rduite (salaris ou autres) pourront suivre la formation en chelonnant sur plus dune anne lassistance aux enseignements et la validation des contrles. Enfin, le M2 LTTAC est ouvert, au titre de la formation continue, aux professionnels de la lexicographie et de la terminographie dsireux de complter leur formation thorique, aux spcialistes de disciplines scientifiques et techniques qui souhaitent sinitier la mthodologie dlaboration de rpertoires disciplinaires et aux professionnels des industries de la langue impliqus dans la constitution et la manipulation de ressources lexicales structures et de corpus.

Conditions de candidature :
Lentre en M2 LTTAC fait lobjet dune slection. Le dossier de candidature que vous adresserez la responsable de la spcialit (et par son intermdiaire lquipe pdagogique) est donc une dclaration dintention, un projet dengagement argument dans une formation en vue dune insertion professionnelle dont vous vous faites probablement dj une reprsentation, mme si celle-ci est sujette voluer. Ce dossier nous permettra en outre de connatre votre parcours de formation et vos ventuelles expriences professionnelles afin que, ds lentretien de slection, nous puissions valuer ensemble votre motivation et vos chances de russite en formation dabord, dans le monde professionnel ensuite. Pour prsenter votre candidature, vous devez tlcharger lun des trois dossiers2 ou le demander N. Gasiglia, limprimer, le remplir, et ladresser N. Gasiglia ( ladresse indique sur le dossier), accompagn des documents utiles, avant lune des deux dates suivantes : 1e session de recrutement : dernier vendredi de juin (28 juin 2013), 2e session de recrutement : premier vendredi de septembre (6 septembre 2013). Un accus de rception sera adress chaque candidat(e) dans les quelques jours suivant larrive de son dossier (sauf durant la fermeture estivale de luniversit). Si cet accus de rception tarde, nhsitez pas contacter N. Gasiglia. Attention, selon votre situation, le dossier de candidature peut devoir tre accompagn dun dossier administratif. Vrifiez bien que vous ne relevez pas dun des cas appelant des dmarches particulires (tudiants ayant dbut leurs tudes suprieures ltranger, en reprise dtudes dsireux de demander une validation VAP 85 ou en formation continue). Les entretiens se drouleront tlphoniquement. Thmes abords : Parcours universitaire et/ou professionnel. Objectifs professionnels et motivation. Connaissances en sciences du langage, en lexicographie, en terminographie, en informatique, en langues, sur les mtiers de ldition et des industries de la langue. Une rponse sera donne chaque dossier reu dans les quelques jours suivant la date limite de recrutement de la session pour laquelle il aura t envoy. Si cette rponse tarde, nhsitez pas contacter N. Gasiglia. Si vous avez besoin dune rponse plus rapide (pour lobtention dune bourse ou dun visa par exemple), il est impratif que vous ayez mentionn cette contrainte sur votre dossier de candidature. Critres intervenant dans la slection : Qualit du dossier. Motivation. Projets professionnels.

Structure des enseignements


Les units de formation et les contrles couvrent toute la gamme des oprations constitutives de llaboration de ressources lexicales, avec utilisation de linformatique tous les niveaux de celle-ci.

Cf. : http://stl.recherche.univ-lille3.fr/siteheberges/LTTAC/index.html, menu de bas de page intitul Comment sinscrire .

La formation comporte 390 heures de cours (de septembre mai), un stage de 3 mois minimum et la rdaction dun mmoire de projet professionnel ou de recherche. Les 12 units denseignement reprsentent 60 crdits ECTS (Systme Europen de Transfert de Crdits) : 30 ECTS par semestre. Une prsence assidue tous les cours est indispensable. Les tudiants qui exercent une activit professionnelle pourront bnficier dun rgime amnag et valider leur M2 sur plus dune anne. Les cours dbuteront par deux journes intensives durant lesquelles les tudiants des nouvelles promotions assisteront entre autres choses aux soutenances de rapports de stage des tudiants qui terminent leur M1 ou leur M2. La prsence ces deux journes est strictement ncessaire pour une prise de repres professionnels. Pour chaque constituant dUE, la structure ci-aprs indique le cas chant sil est emprunt au M1 LTTAC. Ces enseignements ont des contenus denseignement diffrents chaque anne. Attention : Les tudiants dautres formations dsireux de suivre des cours du M1 ou du M2 LTTAC sont tenus de contacter N. GASIGLIA avant le dbut des cours. Si cette dmarche na pas t ralise avant la 2e sance du programme de formation choisi, celui-ci ne sera plus accessible. Semestre 3 Intitul S3 UE1 Conditions de production des rpertoires lexicographiques et terminographiques a Typologie des rpertoires lexicaux et conditions conomiques de leur production (18 h) b Gestion de la production de rpertoires lexicaux (36 h) S3 UE2 Linguistique a Profilage linguistique des rpertoires lexicaux (12 h) b Linguistique pour la lexicographie et la terminographie (24 h) 36 h 6 S4 UE2 Manipulation / dition de descriptions lexicales monolingues, bilingues et multilingues a Analyse des corrlations entre structuration et prsentation des rpertoires lexicaux (18 h) b Manipulation / dition informatiques (48 h) 66 h 6 heures 54 h ECTS 6 Intitul S4 UE1 Stage de 3 mois minimum Semestre 4 heures ECTS 6

Semestre 3 Intitul S3 UE3 Traitement Automatique des Corpus a Approche des corpus comme ressources documentaires (12 h) b Familiarisation avec des outils existants dextraction dinformations en corpus lectroniques (18 h) c Programmation pour lextraction dinformations 3 (JavaScript) [emprunt au M1 LTTAC S1 UE3 c] (18 h) d Structuration de textes pour lanalyse ou la publication 2 [emprunt au M1 LTTAC S1 UE3 d1] (18 h) S3 UE4 Structuration de rpertoires lexicaux monolingues, bilingues et multilingues a Analyse structurelle des rpertoires lexicaux imprims et sur support lectronique (24 h) b Structurations informatiques 1 (30 h) S3 UE5 Rdaction de descriptions lexicales monolingues, bilingues et multilingues a Drivation de textes (18 h) 18 h 3 54 h 6 heures 66 h ECTS 6 Intitul

Semestre 4 heures 30 h ECTS 3 S4 UE3 Traitement Automatique des Corpus c Programmation pour lextraction dinformations 4 (JavaScript) (18 h) d Manipulations de textes structurs pour lanalyse ou la publication 2 (12 h)

S4 UE4 Structuration de rpertoires lexicaux monolingues, bilingues et multilingues b Structurations informatiques 2 (24 h)

24 h

S4 UE5 Rdaction de descriptions lexicales monolingues, bilingues et multilingues b Rdaction de textes originaux pour divers types de rpertoires (42 h)

42 h

Semestre 3 Intitul S3 UE6 Mmoire de projet professionnel ou de recherche (tape 1) heures ECTS 3 Intitul

Semestre 4 heures ECTS 6 S4 UE6 Mmoire de projet professionnel ou de recherche (tape 2)

Total

228 h

30

Total

162 h + stage

30

Programmes M2 semestre 3
UE 1 CONDITIONS DE PRODUCTION DES RPERTOIRES LEXICOGRAPHIQUES ET TERMINOGRAPHIQUES Responsable : Nathalie GASIGLIA Volume horaire : 18 h plus 36 h soit 54 h 6 ECTS Coeff 2 2 enseignements obligatoires : a TYPOLOGIE DES RPERTOIRES LEXICAUX ET CONDITIONS CONOMIQUES DE LEUR PRODUCTION Enseignante : Pierre CORBIN Les rpertoires lexicaux peuvent tre accessibles au grand public (ils sont alors appels dictionnaires) mais ils peuvent galement tre employs dans le cadre de certaines activits professionnelles (il peut sagir alors de dictionnaires ou de rpertoires ne dcrivant que les usages de spcialistes dun domaine, les terminologies), et ils peuvent tre intgrs des applications informatiques (ce qui implique des adaptations des modes de prsentation des informations quils contiennent). Lenseignement vise prsenter les types de rpertoires lexicaux existants et les services quils rendent en fonction des informations quils fournissent et de leur mode dutilisation. b GESTION DE LA PRODUCTION DE RPERTOIRES LEXICAUX Enseignants : Intervenants professionnels et Nathalie GASIGLIA Aprs une prsentation gnrale, qui permettra de cadrer les notions de lexicologie et lexicographie, de terminologie et terminographie, cet enseignement traitera des conditions conomiques de production des dictionnaires et des composantes et les techniques dlaboration dun projet ditorial. Bibliographie : Bjoint H. & Thoiron P. (sous la direction de) (1996), Les dictionnaires bilingues, Louvain-la-Neuve, Duculot. Cabr M. T. (1998), La terminologie, Paris, Armand Colin. Corrard M.-H. (ed.) (2002), Lexicography and Natural Language Processing. A festschrift in honour of B.T.S. Atkins, Euralex. Lhomme M.-C. (2004), La terminologie : principes et techniques, Montral, Presses de lUniversit de Montral. Rey A. (1982), Dictionnaires et encyclopdies, Que sais-je ? 2000, Paris, Presses Universitaires de France. Richaudeau F. & Binisti O. (2005), Manuel de typographie et de mise en page, nouvelle dition, Paris, ditions Retz.

UE 2 LINGUISTIQUE Responsable : Nathalie GASIGLIA Volume horaire : 36 h 6 ECTS Coeff 2 2 enseignements obligatoires : a PROFILAGE LINGUISTIQUE DES RPERTOIRES LEXICAUX Enseignante : Delphine TRIBOUT Dans le cadre de cet enseignement, une analyse des informations linguistiques fournies par une slection darticles de diffrents dictionnaires ou lexiques et de leur mode de prsentation sera conduite dans le but de dfinir des principes de stockage de ces description dune slection de proprits linguistiques dans une base de donnes relationnelle (base SQL) puis dlaborer celle-ci et ses interfaces de consultation et denrichissement (des scripts PHP). b LINGUISTIQUE POUR LA LEXICOGRAPHIE ET LA TERMINOGRAPHIE Enseignante : Danile VAN DE VELDE Programme de smantique consacr en 2013-2014 lanalyse des prpositions. Un tiers du temps de travail sera consacr lexamen critique de quelques articles de dictionnaire la lumire des propositions thoriques avances dans le cours.

UE 3 TRAITEMENT AUTOMATIQUE DES CORPUS Responsable : Nathalie GASIGLIA Volume horaire : 12 h plus 3 fois 18 h soit 66 h 6 ECTS Coeff 2 4 enseignements obligatoires : a APPROCHE DES CORPUS COMME RESSOURCES DOCUMENTAIRES Enseignants : Delphine TRIBOUT et intervenants professionnels Cet enseignement vise aider les tudiants mieux connatre la diversit des sources documentaires (sources linguistiques vs mtalinguistiques, ressources crites vs orales, corpus textuels imprims vs informatiss). Le propos se concentre ensuite sur les problmes poss par la constitution de corpus lectroniques et leurs explorations compares au moyen de mthodes statistiques, linguistiques ou mixtes. Bibliographie: Bowker L. & Pearson J. (2002), Working with Specialized Language. A practical guide to using corpora, London / New York, Routledge. Habert B. (2005), Instruments et ressources lectroniques pour le franais, Paris, Ophrys. Habert B., Nazarenko A. & Salem A. (1997), Les linguistiques de corpus, Paris, Armand Colin. Habert B., Fabre C. & Issac F. (1998), De lcrit au numrique. Constituer, normaliser et exploiter les corpus lectroniques, Paris, Interditions.

Silberztein M. (1993), Dictionnaires lectroniques et analyses automatiques de textes. Le systme Intex, Paris, Masson. Vronis J. (sous la direction de) (2005), Le traitement automatique des corpus oraux , TAL 45/2. Vronis J. (d.) (2000), Parallel Text Processing: alignment and use of translation corpora, Dordrecht, Kluwer Academic Publishers. b FAMILIARISATION AVEC DES OUTILS EXISTANTS DEXTRACTION DINFORMATIONS EN CORPUS LECTRONIQUES Enseignants : Intervenants professionnels Dans le prolongement de ce qui est abord en M1 LTTAC UE3, cet enseignement ambitionne daider les tudiants se familiarisation avec les outils existants dextraction dinformations en corpus lectroniques (analyseurs morphosyntaxiques, concordanciers, extracteurs de candidats termes) travers les expriences demploi de ces outils relates par les partenaires professionnels qui interviennent. c PROGRAMMATION POUR LEXTRACTION DINFORMATIONS 3 : JAVASCRIPT Enseignant : Fabien TORRE Cet enseignement propose une dcouverte de la programmation avec le langage JavaScript et une introduction la manipulation automatique de documents semi-structurs. JavaScript est un langage intrinsquement li aux documents (x)html (cest--dire en particulier la grande majorit des documents prsents sur le web), a priori documents statiques que JavaScript permet de rendre dynamiques. JavaScript se diffrencie des autres langages de programmation car la programmation se fait dans le document lui-mme et lexcution du programme se fait ct client, cest--dire par le navigateur de lutilisateur. Ces caractristiques autorisent lutilisateur interagir avec le document dans son navigateur, sans aller-retour avec le serveur web. JavaScript a rcemment connu un regain dintrt avec : le soutien dclar en 2009 du W3C au web multimdia avec html5 et au dtriment de xhtml, le refus par Apple en 2010 dutiliser Flash sur ses appareils, le couple html5-JavaScript apparat alors comme la seule alternative, la volont des diteurs traditionnels de proposer leurs livres sous forme de-books (dont les formats majeurs comme epub ou kindle sont bass sur html), en profitant du passage papier-numrique pour les rendre dynamiques ou interactifs. Le cours commencera par une mise niveau sur html, puis passera en revue les sujets suivants : mise en uvre en JavaScript du cours dalgorithmique, interaction entre JavaScript et lobjet graphique canvas de html5, modification des documents html travers lAPI DOM de JavaScript. Des ralisations concrtes illustreront le cours et seront demandes aux tudiants : productions automatiques de phrases, jeux graphiques et ludiques, manipulation de textes, aide ltiquetage de textes, extraction et visualisation automatique dinformations, etc. Cet enseignement pourra servir de bases dventuels apprentissages dans le cursus des tudiants ou dans leur future carrire professionnelle :

lalgorithmique et la dcouverte du langage JavaScript faciliteront lapprentissage de tout autre langage de programmation, la modification de documents travers lAPI DOM pourra tre mise en uvre avec un autre langage de programmation que JavaScript, et pour des documents xml non ncessairement html. Les comptences acquises pendant ce cours sont galement reconnues dans le monde professionnel, en particulier avec lutilisation de html5/JavaScript dans les formats e-book. Les supports de cours et exercices seront disponibles en ligne. d STRUCTURATION DE TEXTES POUR LANALYSE OU LA PUBLICATION 2 Enseignante : Nathalie GASIGLIA Pour tre explors avec efficacit, les documents textuels runis en corpus gagnent souvent tre enrichis dannotations de natures diverses (tiquetage grammatical des mots, indications smantiques, etc.). Pour que ces annotations ne se mlent pas indment aux donnes, il est important de structurer les corpus, et, cette fin, le langage XML fournit des solutions techniques dont des chercheurs ont su tirer profit pour proposer des principes de structuration de corpus : la TEI (Text Encoding Initiative). Par ailleurs, les diteurs dsireux de pouvoir utiliser les mmes contenus textuels dans diffrentes publications proposes sur supports imprims comme lectroniques structurent leurs productions textuelles directement ou en convertissant les styles mis en uvre dans les documents. Nous chercherons appliquer les propositions de la TEI comme les structurations partir de styles hrits des traitements de textes pour laborer des corpus baliss en XML en travaillant par exemple sur des textes scientifiques de linguistes dont nous souhaitons analyser lexpression et le vocabulaire, sur des textes traduits aligner pour constituer un corpus bilingue au sein desquels nous souhaitons tudier les quivalences traductionnelles, ou encore sur des ditions diffrentes de textes anciens aligns. Cet enseignement tant mutualis avec le M1 LTTAC, les traitements mis en uvre diffrent dune anne sur lautre de manire permettre tous les tudiants den dcouvrir de nouveaux chaque anne. Bibliographie introductive : Burnard L. & Sperberg-McQueen C.M. (1996), La TEI simplifie : une introduction au codage des textes lectroniques en vue de leur change , Cahiers GUTenberg n 24. Ray E.T. (2001), Introduction XML, traduction dAlain Ketterlin, Paris, OReilly. TEIP5 : http://www.tei-c.org/Guidelines/P5/

UE 4 STRUCTURATION DE RPERTOIRES LEXICAUX MONOLINGUES, BILINGUES ET MULTILINGUES Responsable : Nathalie GASIGLIA Volume horaire : 24 h plus 30 h soit 54 h 6 ECTS Coeff 2 2 enseignements obligatoires : a ANALYSE STRUCTURELLE DES RPERTOIRES LEXICAUX IMPRIMS ET SUR SUPPORT LECTRONIQUE Enseignante : Nathalie GASIGLIA

Les analyses structurelles dveloppes dans le cadre de cet enseignement se situeront diffrents niveaux : La structure des ouvrages : texte et paratexte. La structure des nomenclatures : choix des adresses en fonction de plusieurs paramtres (nature des projets, critres linguistiques et extralinguistiques). La structure dadressage : macrostructures simples ou complexes, adressages microstructurels. La structure daccs et les dispositifs de flchage (titres courants, lettrines, renvois). La structure des articles : linarit et hirarchie. Bibliographie: Hausmann F. J. & Wiegand H. E. (1989), Componen parts and structures of general monolingual dictionaries: a survey, in Hausmann Franz Josef, Reichmann Oskar, Wiegand Herbert Ernst. & Zgusta Ladisav (eds), Wrterbcher / Dictionaries / Dictionnaires. Ein internationales Handbuch zur Lexikographie / An international encyclopedia of lexicography / Encyclopdie internationale de lexicographie, Berlin / New York, Walter de Gruyter, tome 1, art. 36, pp. 328-360. Pruvost J. & Sablayrolles J.-F. (2003), Les nologismes, Que sais-je ? 3674, Paris, Presses Universitaires de France. Rey-Debove J. (1971), tude linguistique et smiotique des dictionnaires franais contemporains, Paris / La Haye, Mouton. b STRUCTURATIONS INFORMATIQUES 1 Enseignants : Intervenants professionnels En cho aux analyses structurelles conduites dans le cadre des analyses de dictionnaires, cet enseignement prsentera deux modes de traitement des structurations de textes dictionnairiques : le balisage, au moyen dlments XML, des textes des articles et la distribution de leur contenu dans des bases de donnes SQL : pratique du balisage darticles de dictionnaires en XML : laboration de DTD, rdaction darticles baliss, rtroconversion de dictionnaires imprims ; conception et laboration de bases de donnes relationnelles en vue du stockage structur de donnes lexicographiques. Bibliographie : Amann B. & Rigaux P. (2002), Comprendre XSLT, Paris, OReilly. Habert B. (2009), Construire des bases de donnes pour le franais. Tome 1. Notions, coll. Lessentiel franais, Paris, Ophrys. Corrard M.-H. (ed.) (2002), Lexicography and Natural Language Processing. A festschrift in honour of B.T.S. Atkins, Euralex. Mangano S. (2003), XSLT en action, traduction d. Jacobini & A. Ketterlin, Paris, OReilly. Ray E. T. (2001), Introduction XML, traduction dA. Ketterlin, Paris, OReilly. Roman S. (1998), Bases de donnes MS-Access. Conception et programmation, traduction de J. Gurin, Paris, OReilly.

UE 5 RDACTION DE DESCRIPTIONS LEXICALES MONOLINGUES, BILINGUES ET MULTILINGUES Responsable : Nathalie GASIGLIA Volume horaire : 18 h 3 ECTS Coeff 1 1 enseignement : a DRIVATION DE TEXTES Enseignante : Nathalie GASIGLIA Le plus souvent, les crations de dictionnaires ne donnent pas lieu des rdactions intgrales de leur texte, mais la reprise de texte darticles existants, voire de segments de textes issus dune slection de sources dictionnairiques. Le travail dharmonisation des sources textuelles avec ce quil faut laborer dans le cadre dun nouveau projet implique cependant souvent des rcritures locales. Cet enseignement sensibilise les tudiants cet art de la retouche textuelle.

UE 6 MMOIRE DE PROJET PROFESSIONNEL OU DE RECHERCHE (TAPE 1) Responsable : Nathalie GASIGLIA 3 ECTS Coeff 1 Premire tape de la rdaction dun mmoire relatif une question de (mta)lexicographie, de terminographie, de traitement automatique des corpus, de linguistique ou de TAL : bibliographie, fiches de lectures et, selon ce qui est pertinent, tat de lart ou tat du march des ouvrages ou des outils logiciels. ce stade du travail, la diffrence entre un mmoire de projet professionnel et un mmoire de recherche peut ntre perceptible que par la nature du sujet trait et la couverture relative des recherches bibliographiques. Dans le cadre dun mmoire de projet professionnel, qui dfend un projet ditorial par exemple, il convient dtablir un tat de la concurrence et des sources documentaires, dans le cadre dun mmoire de recherche, il convient de constituer une bibliographie scientifique aussi exhaustive et analytique que le permet le sujet trait. La ralisation de ce travail implique le choix dun directeur de projet ou de recherche, puis, avec ce dernier, celui dun sujet de mmoire (ce choix pouvant conduire envisager une co-direction de mmoire et donc solliciter la direction dun second directeur). Vous devrez dterminer votre choix de directeur(s) de projet ou de recherche en tout dbut danne, ce sera fait avec laide de la responsable de la spcialit et, naturellement, du ou des directeurs pressentis. Le sujet de mmoire doit imprativement tre diffrent du sujet de stage. Programmes M2 semestre 4 UE1 STAGE Responsable : Nathalie GASIGLIA Volume horaire : 3 mois quivalent temps plein minimum 6 ECTS Coeff 2 Stage en entreprise ou dans un tablissement public.

Excution de missions correspondant aux contenus de formation. Ce stage constituera une seconde exprience concrte dans le secteur ditorial, les industries de la langue ou un laboratoire de recherche. Il permettra chaque tudiant de construire un projet professionnel adapt ses motivations. Le sujet de stage doit diffrer du sujet de mmoire. Le stage pourra tre ralis aprs la fin des cours (en fin de second semestre) ou temps partiel paralllement aux cours (pour un quivalent temps plein de 3 mois minimum).

UE 2 MANIPULATION / DITION DE DESCRIPTIONS LEXICALES MONOLINGUES, BILINGUES ET MULTILINGUES Responsable : Nathalie GASIGLIA Volume horaire : 18 h plus 48 h soit 66 h 6 ECTS Coeff 2 2 enseignements obligatoires : a ANALYSE DES CORRLATIONS ENTRE STRUCTURATION ET PRSENTATION DES RPERTOIRES LEXICAUX Enseignants : Pierre CORBIN et Nathalie GASIGLIA La lisibilit des textes dictionnairique dpend de la bonne articulation entre lieux et modes dexpression des informations linguistiques qui sont fournies. Chaque type dinformation ntant gnralement pas fourni dans un seul composant darticle ni dune seule manire, il est important que de futurs lexicographes ou utilisateurs de ressources lexicales aient une reprsentation de la diversit des usages observables et de lincidence des choix ditoriaux oprs sur le confort des lecteurs, voire sur la comprhensibilit des textes. b MANIPULATION / DITION INFORMATIQUES Enseignants : Nathalie GASIGLIA et intervenants professionnels Structurer les textes constitue pour les diteurs un moyen de prvoir des remploi de ceux-ci. Encore faut-il que les structurations mises en uvre permettent les manipulations venir, et donc quelles soient conues en fonction des futurs projets ou au moins de manire conservatoire. Outre les connaissances techniques relatives la manipulation de documents structurs en XML au moyen de transformation XSLT et dans un diteur de mise en page professionnel (InDesign), cest lexprience concrte la plus actuelle des intervenants professionnels invits quil nous importe de transmettre afin que les futurs porteurs de projets ditoriaux soient capables, le moment venu, de prvoir des ditions multiples pour leurs productions.

UE 3 TRAITEMENT AUTOMATIQUE DES CORPUS Responsable : Nathalie GASIGLIA Volume horaire : 18 h plus 12 h soit 30 h 3 ECTS Coeff 1 2 enseignements obligatoires :

c PROGRAMMATION POUR LEXTRACTION DINFORMATIONS 4 : JAVASCRIPT Enseignant : Fabien TORRE Voir M2 LTTAC UE3 du S1 composant c Programmation pour lextraction dinformations 3 : JavaScript. d MANIPULATIONS DE TEXTES STRUCTURS POUR LANALYSE OU LA PUBLICATION 2 Enseignante : Nathalie GASIGLIA Prolongement de lenseignement de M2 LTTAC S1 UE3 composant d Structuration de textes pour lanalyse ou la publication 1. Utilisation de la structuration en XML des corpus constitus afin dextraire des donnes au moyen de transformation XSLT. Les rfrences bibliographiques utiles seront indiques en cours.

UE 4 STRUCTURATION DE RPERTOIRES LEXICAUX MONOLINGUES, BILINGUES ET MULTILINGUES Responsable : Nathalie GASIGLIA Volume horaire : 24 h 3 ECTS Coeff 1 1 enseignement : b2 STRUCTURATIONS INFORMATIQUES 2 Enseignants : Intervenants professionnels Quand il ne sagit pas dditions imprimes mais lectroniques, qui permettent doffrir les mmes segments informationnels dans plusieurs combinaisons textuelles, il peut tre plus opratoire de ne pas rdiger des textes darticles suivis, mais des segments de textes stocks dans des bases de donnes SQL. En sappuyant sur la connaissance des principes de structuration darticle dj acquise par les tudiants en particulier durant les cours dUE3 du S3 et sur la sensibilisation aux problmes de lisibilit des textes traits en UE2 du S4, lobjectif de cet enseignement est denvisager la cration dune base dictionnairique et llaboration de son interface de consultation en ligne (au moyen de scripts PHP).

UE 5 RDACTION DE DESCRIPTIONS LEXICALES MONOLINGUES, BILINGUES ET MULTILINGUES Responsable : Nathalie GASIGLIA Volume horaire : 42 h 6 ECTS Coeff 2 1 enseignement : b RDACTION DE TEXTES ORIGINAUX POUR DIVERS TYPES DE RPERTOIRES Enseignants : Nathalie GASIGLIA et intervenants professionnels Bien que les crations de rpertoires sans exploitation de donnes textuelles prexistantes soient actuellement rares dans les maisons ddition gnralistes, elles peuvent sobserver et mobiliser les comptences

rdactionnelles dauteurs pour des projets dambitions plus modestes (en particulier des rpertoires thmatiques ou spcialement consacrs certains types dinformations, comme les tymologies, les expressions, etc.). La comptence rdactionnelle des collaborateurs est galement cruciale en cas damplification dun ouvrage pour lequel des articles et/ou des slections dinformations viendront enrichir ceux qui sont dj existant. Si les crations discursives de certains composants darticles qui reoivent des textes codifis ne prsentent pas de difficults rdactionnelles particulires, dautres, dont en particulier les dfinitions et les exemples, impliquent un savoir faire tout particulier.

UE 6 MMOIRE DE PROJET PROFESSIONNEL OU DE RECHERCHE (TAPE 2) Responsable : Nathalie GASIGLIA 6 ECTS Coeff 2 Deuxime tape de la rdaction du mmoire (suite de lUE6 du S1) : laboration dun projet professionnel ou dune recherche original(e) en (mta)lexicographie, en terminographie, en traitement automatique des corpus ou en TAL. Selon que, en fin de M2, ltudiant ambitionne une insertion professionnelle ou une poursuite dtude en recherche dans le cadre dun doctorat qui peut tre ralis avec une insertion professionnelle, dans le cadre dun contrat CIFRE , le mmoire de M2 LTTAC pourra consister en un projet ditorial ou de dveloppement de logiciel suffisamment avanc dans sa conception et soign dans le texte de sa prsentation pour tre susceptible dtre soumis un diteur ou offert en ligne, ou le fruit dune recherche thorique ou applique qui prpare le projet de thse par le choix du sujet, la mthodologie dtude mise en uvre, le travail bibliographique ralis, et le cas chant les dmarches engages auprs des entreprises qui pourraient tre les meilleurs partenaires en cas de projet de thse avec contrat CIFRE.

Modalits de contrle M2
En complment des indications ci-dessous, merci de consulter les modalits de contrle communes la mention ainsi que la note sur le plagiat valable pour lensemble des spcialits de la mention. Le M2 LTTAC ne sera valid que si chacune des 12 UE la galement t, cest--dire si la note obtenue en valuation pour chacune est suprieure 10, et que donc les 60 crdits sont cumuls. Les contrles des connaissances relatifs aux enseignements (UE1 UE5 du semestre 3 et UE2 UE5 du semestre 4) se font en contrle continu, au moyen de devoirs sur table, dexposs et/ou de dossiers. Le stage (UE1 du semestre 4) est valu sur la base dun rapport circonstanci du tuteur de stage (en fonction dune grille dvaluation), dun mmoire de rapport de stage rdig par ltudiant et dune soutenance. Le mmoire de projet professionnel ou de recherche (UE6 de chaque semestre) est valu en fonction de lavancement de lanalyse des produits conscurrents ou de ltat de lart, et de la prsentation du projet la fin du semestre 3, puis celle du mmoire et de sa soutenance la fin du semestre 4.

S-ar putea să vă placă și