Documente Academic
Documente Profesional
Documente Cultură
Proiect
la disciplina
Aplicațiile procesării limbajului natural
Chișinău 2020
Inițierea și realizarea unui proiect informațional, APLN Master anul 1
Cuprins
Introducere……………………………………………………………………………………3
Scopul………………………………………………………………………………………...4
Noțiuni generale……………………………………………………………………………..4
Chat-bot……………………………………………………………………………………...7
PLANUL……………………………………………………………………………………...9
Concluzii……………………………………………………………………………………..17
Introducere
În ziua de azi putem caracteriza societatea actuală ca una informațională unde informaţiei îi
revine un rol tot mai important. Accesul non stop la informație a devenit o necesitate pentru
fiecare persoană. Deseori căutarea unei informației poate dezorienta sau duce în eroare pe
majoritatea persoanelor din cauza volumului imens de date referitoare la problema lor.
Sistemul elaborat este un sistem de informare, care prelucrează întrebările formulate de
către utilizator în limba româna (propoziţii interogative) şi extrage răspunsul din textele
relevante.
Sistemele automatizate de informare a populaţiei pot fi utilizate pe larg de orice instituţie
guvernamentală şi non-guvernamentală, în departamentele de relaţii cu publicul în scopul
maximizării volumului informaţiei obţinute de populaţie şi minimizarea cheltuielilor de timp și
răspunsurilor și informațiilor greșite. În acest mod, persoanele interesate se vor putea
documenta în domeniul solicitat, vor putea primi răspuns la întrebările apărute. De exemplu,
primirea informației referitor la sănatatea personal cum ar fi: care sunt măsurile de protecție
în situația epidemiologică actuală, Cum se poat de făcut testele necesare, la cine pot să mă
adresez în caz de apariția simptomelor. etc.
Pentru construirea unui sistem de tip întrebare-răspuns se folosesc două metode:
- Abordare de tip shallow, bazată pe cuvinte cheie. În această metodă se folosesc
cuvinte cheie pentru a găsi pasaje şi propoziţii în text care ar putea reprezenta
răspunsuri valide la întrebări.
- Abordarea de tip deep, ce implică o analiză mai sofisticată, o procesare sintactică,
semantică şi contextuală. Alegerea unuia dintre cele două modele depinde de
complexitatea întrebărilor ce vor fi formulate şi de gradul de performanţă dorit de la
sistem. Este clar că sistemele din cea de-a doua categorie sunt superioare primelor.
Scopul:
Inițierea și realizarea unui mini proiect informațional, urmărind etapele:
Noțiuni generale:
Sistemele de tip QA sunt caracterizate prin faptul că primesc un set de întrebări în limbaj
natural și, pe baza unei colecții de documente, trebuie să extragă răspunsul sau
răspunsurile. Această colecție poate varia de la o simplă colecție locală până la întregul
World Wide Web.
● BASEBALL (Green, 1963), răspunde la întrebări legate de scoruri, echipe, date ale
meciurilor de baseball;
● LUNAR (Woods, 1977), accesează date din domeniul chimic despre roci lunare,
găsite în timpul misiunilor Appolo;
● PHLIQA1 (Scha, 1980), dezvoltat de firma Phillips răspunde la întrebări scurte
despre datele stocate într-o bază de date ce conține o serie de informații specifice
ale firmei.
Sistemele date erau eficiente în domeniile în care activau. LUNAR a fost prezentat la o
conferință în 1971 și a reușit să răspundă la 90% din întrebările formulate de oameni care nu
erau special pregătiți pentru a lucra cu acest sistem.
În anii 1960, cercetătorii erau fascinați de ideea de a putea construi sisteme capabile să
răspundă la întrebări aparținând unor domenii restrânse (closed domains), în prezent
dezvoltarea Internetului și pașii făcuți în ceea ce privește recuperării informației (information
retrieval - IR) și a tehnicilor de prelucrare a limbajului natural (natural language processing -
NLP), precum și cererea pentru acces facil la informație, a dus la creșterea interesului
pentru sisteme care să ofere răspunsuri din domenii largi (open domains).
Un sistem de răspuns la întrebări bazat pe o colecție de documente are, în mod tipic, trei
componente principale:
Scopul proiectului constă în crearea unui prototip a unui Chat-Bot, care poate fi implementat
și folosit în domeniul Sănătății publice, ce ține de informarea corectă a populației ce ține de
sănătatea proprie și răspunderea la întrebările apărute referitor la situația epidemiologică.
Cu ajutorul Chat-Boutului se va putea rapid și ușor de răspuns la cele mai frecvent întâlnite
întrebări.
Această aplicație este destinată în primul rând pentru sistemul sănătății publice. Aplicația va
fi folosită în domeniul sănătății publice ca instrument de informare a populației despre
situația epidemiologică creată de Covid-19.
Aplicația Chat - Bot va comunica cu oamenii care vor avea întrebări la situația
epidemiologică și măsurile de protecție.
Ulterior această aplicație cu unele modificări poate fi folosită și de alte instituții de sănătate.
6. Scenariu alternativ utilizare (în cazul apariției unor erori, cum ar fi: a fost adresată o
întrebare care nu a fost recunoscută, etc…)
În cazul când utilizatorul acordă o întrebare care nu este înțeleasă de ChatBot, Chat - Botul
îl va anunța că nu poate răspunde la întrebarea dată și va cere ca utilizatorul să reformuleze
întrebarea. Chatbot nu va prezenta informația pe care nu o cunoaște și nu va prezenta
informație eronată.
7. Cerințe speciale (de exemplu, caz de blocare a aplicației în timpul utilizării)
Astfel de cerințe nu sunt necesare. În caz că apare o eroare în timpul comunicări cu
ChatBotul se recomandă de restartat pagina.
9. Identificarea tuturor factorilor care ar avea un impact pozitiv sau negativ asupra
proiectului și documentarea acestora (unul din membrii echipei se îmbolnăvește,
neînțelegerea între membrii echipei, lipsa motivațională, accesul la serverul
universității este interzis, refuzul clientului de a primi proiectul, neînțelegerea
clientului, produsul nu este cel așteptat, neajunsul de cunoștințe a membrilor echipei,
securizare slabă a produsului, riscul că produsul nu va putea fi integrat în sistemul
existent al companiei clientului, riscul interfeței de a nu permite utilizatorului să
execute toate sarcinile, una după alta, interfața utilizatorului este blocată, lentă sau
dificil de utilizat, riscul general în caz când utilizatorii for respinge total produsul)
Un factor care ar putea avea un impact negativ este ca utilizatorul aplicației ar putea crea o
întrebare eronată sau prea generală care ar putea să nu fie înțeleasă de către aplicație
(Chat-Bot) și ar putea da un răspuns eronat sau în cel mai bun caz să nu deie niciun
răspuns. Această problemă ar putea fi rezolvat prin creare și implimentarea a rețelelor
neuronale mai complexe. Acest fapt îi va da posibilitatea Chat-Botului să înțeleagă
întrebările mai complexe și să acorde un răspuns potrivit pentru ele.
Un factor pozitiv ar putea fi utilitatea acestui chatbot pentru care va micșora rutina
specialiștilor de a răspunde la întrebările generale pe tema pandemiei Covid-19, și paralele
ar putea fi posibil comunicare informației corecte unui public de oameni foarte mare în
același timp paralel.
10. Estimarea costului proiectului (echipament tehnic, soft licențiat, număr de
persoane implicate în proiect, birotică, curent electric, internet).
Concluzii
Efectuând proiectul informațional la disciplina Aplicațiile procesării limbajului natural am avut
ca tema “Sisteme de întrebare – răspuns. Dezvoltarea și implementarea unui Chat-Bot
pentru sistemele de sănătate publică”. În urmă elaborării acestui proiect am acumulat un set
important de cunoștințe.
Am făcut cunoștință cu aplicațiile procesării limbajului natural și le-am folosit în practică în
timpul executări proiectului-prototip de Chat-Bot pentru sistemele de sănătate publică.
Consider că acest proiect mi-a dat o viziune mai bună a importanței folosirei limbajului
natural în crearea sistemelor de întrebare - răspuns.