Sunteți pe pagina 1din 4

FI Ş A UN IT Ă ŢI I D E CU R S/ M O D U LU L UI

MD-2045, CHIŞ INĂ U, STR. STUDENȚ ILOR, 9/7, TEL: 022 50-99-01 | FAX: 022 50-99-05, www.utm.md

INGINERIA LIMBAJULUI

1. Date despre unitatea de curs/modul


Facultatea Calculatoare, Informatică și Microelectronică
Departamentul Informatică Aplicată
Ciclul de studii Studii superioare de licenţă, ciclul I
Programul de studiu 0613.5 Informatică aplicată
Anul de studiu Semestrul Tip de Categoria Categoria de Credite
evaluare formativă opţionalitate ECTS
II (învăţământ cu frecvenţă) 3 E fundamentală obligatorie 3

2. Timpul total estimat


Din care
Total ore în
Ore auditoriale Lucrul individual
planul de
Proiect de Studiul materialului
învăţământ Curs Laborator/seminar Pregătire aplicaţii
an teoretic
90 30 15 - 30 15

3. Precondiţii de acces la unitatea de curs/modul


Conform planului Lingvistică teoretică descriptivă, gramatică, informatică, aplicații Windows.
de învăţământ
Conform Să fie capabili să soluţioneze diverse probleme computaţionale legate de aplicarea
competenţelor cunoştinţelor din domeniul modelării limbajului şi a proceselor de comunicare verbală;
să poată utiliza în cadrul activităţii sale aparatul logico-formal matematic.

4. Condiţii de desfăşurare a procesului educaţional pentru


Curs Pentru prezentarea materialului teoretic în sala de curs este nevoie de proiector şi calculator.
Nu vor fi tolerate întârzierile studenţilor, precum şi convorbirile telefonice în timpul cursului.
Laborator/ Studenţii vor perfecta rapoarte conform condiţiilor impuse de indicaţiile metodice. Termenul de
seminar predare a lucrării de laborator – o săptămână după finalizarea acesteia. Pentru predarea cu
întârziere a lucrării aceasta se depunctează cu 1pct./săptămână de întârziere.

5. Competenţe specifice acumulate


Competenţe CP4. Soluţionarea problemelor reale folosind instrumentele matematicii şi informaticii
profesionale aplicate.
 Înţelegerea conceptului de modelare a limbajului natural şi proiectarea sistemelor
 automatizate de analiză şi procesare a textului.
 Abilităţi de programare iniţială şi explorare a datelor din text.
 Manipularea unui corpus mare de date, explorarea modelelor lingvistice şi testarea
problemelor empirice.
 Construirea unor sisteme robuste pentru realizarea sarcinilor lingvistice cu aplicaţii
 tehnologice.
 Abilităţi de utilizare a tehnicilor de modelare a datelor, de extragere a datelor şi de
acumulare a cunoştinţelor pentru analiza limbajului natural.
 Abilităţi de utilizare a algoritmilor şi structurilor de date în softurile robuste de procesare
a limbajului.
FI Ş A UN IT Ă ŢI I D E CU R S/ M O D U LU L UI

 Analiza cerinţelor pieţei şi tendinţelor contemporane privind dezvoltarea produselor soft


din domeniul informaticii aplicate.

Competenţe CT1. Realizarea lucrărilor de laborator cu utilizarea corectă a surselor bibliografice şi


transversale metodelor specifice, în condiţii de autonomie restrânsă şi asistenţă calificată, precum
şi susţinerea acestora cu demonstrarea capacităţii de evaluare calitativă şi cantitativă
a unor soluţii inginerești din domeniu.
CT3. Identificarea nevoii de formare profesională, cu analiza critică a propriei activităţi de
formare şi a nivelului de dezvoltare profesională şi utilizarea eficientă a resurselor de
comunicare şi formare profesională (Internet, e-mail, baze de date, cursuri on-line
etc.), inclusiv folosind limbi străine.

6. Obiectivele unităţii de curs/modulului


Obiectivul Scopul disciplinei este de a oferi studenţilor un cadru pragmatic pentru a studia PL în contextul
general învăţării programării. Cursul întruneşte necesităţile profesioniştilor şi cercetătorilor din toate
domeniile procesării computaţionale a limbajului natural.
Obiectivele  Manipularea şi analiza datelor lingvistice cu ajutorul unor programe simple şi scrierea
specifice acestor programe.
 Utilizarea conceptelor de bază din PLN şi lingvistică în descrierea şi analiza limbajului.
 Utilizarea structurilor de date şi a algoritmilor în PLN.

7. Conţinutul unităţii de curs/modulului


Numărul de ore
învăţământ învăţământ
Tematica activităţilor didactice
cu cu frecvenţă
frecvenţă redusă
Tematica prelegerilor
T1. Introducere. Noţiune de ILN. Aplicaţii ILN. 2
T2. Traducerea automată: scurt istoric, aspecte generale, abordări şi metodologii 2
T3. Regăsirea informaţiei (IR). Componente ale sistemelor de regăsire a 2
informaţiei. Impactul PLN asupra IR.
T4. Extragerea Informației (IE). Identificarea și clasificarea numelor (denumirilor). 2
T5. Sistemele de întrebare – răspuns (QA). Potenţialul tehnologiei QA.
Clasificarea sistemelor de întrebare – răspuns. 2
T6. Sumarizarea textelor. Etapele sumarizării automate a textelor.
Metode de sumarizare. 2
T7. Extragerea termenilor şi indexarea lor automată. Ingineria 4
terminologică. Noțiune de termen și terminologie.
T8. Explorarea datelor din text (text data mining). TDM vs. IR. TM și 4
lingvistica computațională.
T9. Interfețe în limbaj natural. Componentele interfețelor în limbaj natural. 4
T10. Limbajul natural în sisteme multimedia şi multimodale. Tehnologia 4
limbajului natural ca bază pentru analiza multimodală.
Total prelegeri: 30
Tematica lucrărilor de laborator
LL1. Traducerea automată și traducerea asistată de computer. Elaborarea unui 4
mini-program de TA bazat pe memoria de traducere.
LL2. Elaborarea unui sistem de întrebare-răspuns pentru un domeniu aparte. 4
LL3. Extragerea termenilor din textele specializate și indexarea lor automată. 4
FI Ş A UN IT Ă ŢI I D E CU R S/ M O D U LU L UI

LL4. Elaborarea unui sistem de instruire automată a unei limbi străine. 3


Total lucrări de laborator: 15

8. Referinţe bibliografice
Principale 1. Jurafsky, D., J. H. Martin. Speech and Language Processing: An Introduction to
Natural Language Processing, Computational Linguistics, and Speech
Recognition. Prentice-Hall, 2000; www.cs.colorado.edu/~martin/slp.html .
2. Mitkov Ruslan. The Oxford Hadbook on Computational Lingustics.
http://www.oxfordhandbooks.com/view/10.1093/oxfordhb/9780199276349.00
1.0001/oxfordhb-9780199276349
3. Igor A. Bolshakov and Alexander Gelbukh. Computational Linguistics. Models,
Resources, Applications. In www.Gelbukh.com/clbook.
4. Ionescu, Emil. Manual de lingvistică generală. Editura ALL, Bucureşti 1997.
5. An introduction to NLP. http://www.cs.bham.ac.uk/~pxc/nlpa/2002/AI-HO-
IntroNLP.html
6. Allen, J. Natural Language Understanding. The Benjamin / Cummings Publ.,
Amsterdam, Bonn, Sidney, Singapore, Tokyo, Madrid, 1995.
7. Steele, J. (ed). Meaning–Text Theory. Linguistics, Lexicography, and
Implications. University of Ottawa Press, Ottawa, 1990.
8. BUSUIOC, Ileana; CUCU, Mădălina. Introducere în terminologie.
http://www.unibuc.ro/eBooks/filologie/terminologie/frameset.htm
9. Victoria Fromkin, Robert Rodman, Nina Hyams. An introduction to language. ©
2014, 2011, 2007 Wadsworth, Cengage Learning, USA.
http://uploadkon.ir/uploads/An%20Introduction%20to%20Language%202013.pdf
Suplimentare 10. Machine translation. From Wikipedia the free encyclopedia
https://en.wikipedia.org/wiki/Machine_translation
11. \SDL \TRADOS What is mashine translation.
http://www.translationzone.com/solutions/machine-translation/
12. SYSTRAN Solutions. http://www.systransoft.com/lp/machine-translation/
13. Dan Klein . Statistical NLP. https://people.eecs.berkeley.edu/~klein/cs294-
7/SP07%20cs294%20lecture%2010%20--%20word%20alignment%20(2pp).pdf
14. Information retrieval. From Wikipedia the free encyclopedia
https://en.wikipedia.org/wiki/Information_retrieval
15. Boolean retrieval. http://nlp.stanford.edu/IR-book/pdf/01bool.pdf
16. https://en.wikipedia.org/wiki/Information_extraction
17. https://homes.cs.washington.edu/~soderlan/OpenIE-ijcai07.pdf
18. https://en.wikipedia.org/wiki/Question_answering
19. http://web.stanford.edu/class/cs224n/handouts/cs224n-QA-2013.pdf
20. http://start.csail.mit.edu/index.php
21. https://www.quora.com/How-do-I-make-a-natural-language-processing-question-
answering-system-What-software-or-toolkits-can-be-used
22. https://en.wikipedia.org/wiki/Automatic_summarization
23. https://www.quora.com/Natural-Language-Processing-What-are-algorithms-for-
auto-summarize-text
24. http://www.cs.cmu.edu/~nasmith/LS2/das-martins.07.pdf
25. https://en.wikipedia.org/wiki/Terminology_extraction
FI Ş A UN IT Ă ŢI I D E CU R S/ M O D U LU L UI

https://ro.wikipedia.org/wiki/Sisteme_de_tip_%C3%AEntrebare_-_r%C4%83spuns
26. http://termcoord.eu/discover/free-term-extractors/
27. http://wortschatz.uni-leipzig.de/~fwitschel/papers/TKEIndexing.pdf
28. https://perso.limsi.fr/jacquemi/FTP/JacBourHandbookCL.pdf
29. https://en.wikipedia.org/wiki/Text_mining
30. http://libereurope.eu/text-data-mining/
31. http://www.artificial-solutions.com/natural-language-interaction/
32. https://en.wikipedia.org/wiki/Natural_language_user_interface
33. http://people.ict.usc.edu/~traum/cs599s04/andre-3-2001.pdf
34. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.47.9329&rep=rep1&type=pdf
35. http://dl.acm.org/citation.cfm?id=142641
36. http://www.let.rug.nl/nerbonne/papers/nlp-hndbk-call.pdf
37. http://www.activ-traduceri.ro/traduceri-gratuite-online-9.htm

9. Evaluare
Curentă
Lucrări de laborator Examen final
Atestarea 1 Atestarea 2
15% 15% 30% 40%
Standard minim de performanţă
Prezenţa şi activitatea la prelegeri şi lucrări de laborator;
Obţinerea notei minime de „5” la fiecare dintre atestări şi lucrări de laborator;
Obţinerea notei minime de „5” la proiectul de an;
Demonstrarea în lucrarea de examinare finală a cunoaşterii condiţiilor de aplicare a tehnologiilor limbajului
natural.

S-ar putea să vă placă și