Sunteți pe pagina 1din 17

MINISTERUL ЕDUСАŢIЕI, CULTURII ŞI СЕRСЕTĂRII AL RЕРUBLІСI MOLDOVA

Universitatea Tеhniсă а Moldovei

Fасultаtеа Саlсulаtоаrе, Infоrmаtiсă şi Miсrоеlесtrоniсă

Proiect
la disciplina
Aplicațiile procesării limbajului natural

Tema: Sisteme de întrebare – răspuns. Dezvoltarea și


implementarea unui Chat-Bot pentru sistemele de sănătate publică.

Chișinău 2020
Inițierea și realizarea unui proiect informațional, APLN Master anul 1

Cuprins
Introducere……………………………………………………………………………………3

Scopul………………………………………………………………………………………...4

Noțiuni generale……………………………………………………………………………..4

Sisteme de întrebare – răspuns…………………………………………………………...4

Metode folosite în dezvoltarea sistemelor de tip întrebare-răspuns…………………..5

Arhitectura generală a unui sistem de tip întrebare-răspuns…………………………..6

Chat-bot……………………………………………………………………………………...7

PLANUL……………………………………………………………………………………...9

Analiza dezvoltării programului software………………………………………………....10

Concluzii……………………………………………………………………………………..17
Introducere
În ziua de azi putem caracteriza societatea actuală ca una informațională unde informaţiei îi
revine un rol tot mai important. Accesul non stop la informație a devenit o necesitate pentru
fiecare persoană. Deseori căutarea unei informației poate dezorienta sau duce în eroare pe
majoritatea persoanelor din cauza volumului imens de date referitoare la problema lor.
Sistemul elaborat este un sistem de informare, care prelucrează întrebările formulate de
către utilizator în limba româna (propoziţii interogative) şi extrage răspunsul din textele
relevante.
Sistemele automatizate de informare a populaţiei pot fi utilizate pe larg de orice instituţie
guvernamentală şi non-guvernamentală, în departamentele de relaţii cu publicul în scopul
maximizării volumului informaţiei obţinute de populaţie şi minimizarea cheltuielilor de timp și
răspunsurilor și informațiilor greșite. În acest mod, persoanele interesate se vor putea
documenta în domeniul solicitat, vor putea primi răspuns la întrebările apărute. De exemplu,
primirea informației referitor la sănatatea personal cum ar fi: care sunt măsurile de protecție
în situația epidemiologică actuală, Cum se poat de făcut testele necesare, la cine pot să mă
adresez în caz de apariția simptomelor. etc.
Pentru construirea unui sistem de tip întrebare-răspuns se folosesc două metode:
- Abordare de tip shallow, bazată pe cuvinte cheie. În această metodă se folosesc
cuvinte cheie pentru a găsi pasaje şi propoziţii în text care ar putea reprezenta
răspunsuri valide la întrebări.
- Abordarea de tip deep, ce implică o analiză mai sofisticată, o procesare sintactică,
semantică şi contextuală. Alegerea unuia dintre cele două modele depinde de
complexitatea întrebărilor ce vor fi formulate şi de gradul de performanţă dorit de la
sistem. Este clar că sistemele din cea de-a doua categorie sunt superioare primelor.
Scopul:
Inițierea și realizarea unui mini proiect informațional, urmărind etapele:

- Planificarea. Reprezentarea planului și a programului calendaristic;


- Identificarea metodelor şi mijloacelor tehnice
- Metodele utilizate în analiza sistemului (interviul, chestionarul, JAD, prototipare)

Noțiuni generale:

Sisteme de întrebare – răspuns.

Sistemele de tip QA sunt caracterizate prin faptul că primesc un set de întrebări în limbaj
natural și, pe baza unei colecții de documente, trebuie să extragă răspunsul sau
răspunsurile. Această colecție poate varia de la o simplă colecție locală până la întregul
World Wide Web.

Fig.1 Sistem de întrebare - răspuns


Primele sisteme de tip întrebare-răspuns au fost realizate în anii 1960 și erau, de fapt, doar
niște interfețe care foloseau limbajul uman pentru a interoga sisteme expert create pentru
diferite domenii.

Aceste sisteme erau:

● BASEBALL (Green, 1963), răspunde la întrebări legate de scoruri, echipe, date ale
meciurilor de baseball;
● LUNAR (Woods, 1977), accesează date din domeniul chimic despre roci lunare,
găsite în timpul misiunilor Appolo;
● PHLIQA1 (Scha, 1980), dezvoltat de firma Phillips răspunde la întrebări scurte
despre datele stocate într-o bază de date ce conține o serie de informații specifice
ale firmei.

Sistemele date erau eficiente în domeniile în care activau. LUNAR a fost prezentat la o
conferință în 1971 și a reușit să răspundă la 90% din întrebările formulate de oameni care nu
erau special pregătiți pentru a lucra cu acest sistem.

Metode folosite în dezvoltarea sistemelor de tip întrebare-răspuns.


Pentru construirea unui sistem de răspuns la întrebări există două variante:
● Abordare de tip shallow, bazată pe cuvinte cheie. În această metodă se folosesc
cuvinte cheie pentru a găsi pasaje și propoziții în text care ar putea reprezenta
răspunsuri valide la întrebări. Aceste potențiale răspunsuri urmează să fie
analizate apoi mai în profunzime pentru a se stabili dacă sunt răspunsuri reale
sau nu. Această metodă poate fi folosită cu succes în cazul întrebărilor scurte,
factuale, când se caută nume, date, locații, cantități.

● Abordarea de tip deep, ce implică o analiză mai sofisticată, o procesare


sintactică, semantică și contextuală. Există o serie de metode ce pot fi încadrate
în această categorie: abduction, named-entity recognition, relation detection
etc.
Alegerea unuia dintre cele două modele depinde de complexitatea întrebărilor ce vor fi
formulate și de gradul de performanță dorit de la sistem. Este clar că sistemele din cea de-a
doua categorie sunt superioare primelor.
Arhitectura generală a unui sistem de tip întrebare-răspuns

În anii 1960, cercetătorii erau fascinați de ideea de a putea construi sisteme capabile să
răspundă la întrebări aparținând unor domenii restrânse (closed domains), în prezent
dezvoltarea Internetului și pașii făcuți în ceea ce privește recuperării informației (information
retrieval - IR) și a tehnicilor de prelucrare a limbajului natural (natural language processing -
NLP), precum și cererea pentru acces facil la informație, a dus la creșterea interesului
pentru sisteme care să ofere răspunsuri din domenii largi (open domains).

Un sistem de răspuns la întrebări bazat pe o colecție de documente are, în mod tipic, trei
componente principale:

1. Modulul de analiză a întrebării – transformă întrebările formulate în limbaj natural uman


în interogări pentru motorul de achiziție de documente;

2. Modulul de achiziție de articole – caută în colecția de articole articolele relevante pentru


întrebarea formulată de utilizator, pe baza datelor primite de la modulul de analiză a
întrebării;

3. Modulul de extragere a răspunsului – din colecția de articole returnate de modulul de


achiziție de articole, extrage un răspuns succint și care constituie răspunsul în limbaj natural
uman la întrebarea utilizatorului. Dacă un astfel de răspuns nu există în colecția de
documente considerată de modulul de achiziție de articole, sistemul nu va răspunde la
întrebare, în loc să transmită un răspuns eronat.
Chat-bot
Un chatbot este o aplicație software utilizată pentru a conduce o conversație de chat online
prin text sau text-to-speech, în loc să ofere contact direct cu un agent uman în direct.
Concepute pentru a simula în mod convingător modul în care un om s-ar comporta ca
partener de conversație, sistemele de chatbot necesită în mod obișnuit o reglare și o testare
continue, iar multe în producție rămân incapabile să converseze în mod adecvat sau să
treacă testul Turing standard din industrie. Termenul „ChatterBot” a fost inițial creat de
Michael Mauldin (creatorul primului Verbot ) în 1994 pentru a descrie aceste programe de
conversație.
Chatbot-urile sunt utilizate în sistemele de dialog în diverse scopuri, inclusiv servicii pentru
clienți, rutare de cereri sau colectare de informații. În timp ce unele aplicații de chatbot
utilizează procese extinse de clasificare a cuvintelor, procesoare de limbaj natural și AI
sofisticate, altele pur și simplu caută cuvinte cheie generale și generează răspunsuri folosind
fraze comune obținute dintr-o bibliotecă sau o bază de date asociată.

Fig.2. Strategia de conversație a unui chatbot


Descriere
Chat-Botul a fost creat cu ajutorul instrumentelor specializate de creare a Chat-Boturilor pe
platforma ManyChat. Pentru crearea botului a fost necesar de creat o pagină specială pe
contul de Facebook (deoarece botul era prevăzut să fie folosit pe Messenger) care mai apoi
a fost conectat cu instrumentele platformei ManyChat.
După tot procesul de logare a urmat crearea blocurilor logice cu potențialele întrebări și
răspunsurile la aceste întrebări.

Fig .3 . Creare blocurilor logice a întrebărilor și răspunsurilor Chat-Botului.


PLANUL:

1. Stabilirea persoanelor implicate în proiect


Alexandru Iacoban

2. Definirea subiectului/temei proiectului

Sisteme de întrebare - răspuns. Dezvoltarea și implementarea unui Chat-Bot pentru


sistemele de sănătate publică.

3. Stabilirea scopului proiectului

Scopul proiectului constă în crearea unui prototip a unui Chat-Bot, care poate fi implementat
și folosit în domeniul Sănătății publice, ce ține de informarea corectă a populației ce ține de
sănătatea proprie și răspunderea la întrebările apărute referitor la situația epidemiologică.
Cu ajutorul Chat-Boutului se va putea rapid și ușor de răspuns la cele mai frecvent întâlnite
întrebări.

4. Stabilirea planului și modului de lucru Planul și modul de lucru:

1) Stabilirea principalelor obiective a Chat - Botului


2) Stabilirea termenilor și condițiilor de realizare
3) Stabilirea domeniului de lucru
4) Stabilirea instrumentelor folosite
5) Colectarea de informații
6) Proiectarea blocurilor logice a Chat - Botului
7) Crearea Chat - Botului
8) Testarea Chat - Botului
9) Evaluarea și analiza rezultatelor
10) Prezentarea Chat - Botului

5. Identificarea metodelor și mijloacelor tehnice necesare pentru realizarea proiectului


Instrumentele și mijloacele tehnice folosite pentru realizarea proiectului a fost un calculator,
platforma cu instrumentelor prestabilite de creare a Chat - Boturilor “ManyChat” și chat-ul
“Messenger” de la Facebook.
Analiza dezvoltării programului software
1. Contextul aplicației create (instituția unde va fi utilizată, domeniul, noutatea pe care
o prezintă aplicația dată)

Această aplicație este destinată în primul rând pentru sistemul sănătății publice. Aplicația va
fi folosită în domeniul sănătății publice ca instrument de informare a populației despre
situația epidemiologică creată de Covid-19.
Aplicația Chat - Bot va comunica cu oamenii care vor avea întrebări la situația
epidemiologică și măsurile de protecție.
Ulterior această aplicație cu unele modificări poate fi folosită și de alte instituții de sănătate.

2. Cerințe funcționale (ceea ce va prezenta softul, ceea ce va fi capabil sa efectueze)

Softul va reprezenta un Chat - Bot creat pe platforma ManyChat și folosit pe rețelele de


socializare precum Facebook și Messenger. Aplicația va oferi posibilitatea instituțiilor de
sănătate publică să informeze populația și să răspundă la cele mai des întrebări date.

3. Erori posibile (cazuri care pot apărea în curs de utilizare).

1) Lipsă conexiunii la Internet


2) Mesaj cu context general
3) Greșeli gramaticale
4) Date eronate

4. Descrierea cazului de utilizare (descrierea pe pași)


Aplicația chat - Bot poate fi utilizată de oricine și în timp real,
Accesând Chat-ul va apărea un mesajul “Salut {{first_name}} Noi ne bucurăm că ai accesat
pagina noastră de Facebook.” După care în dependență de întrebările pe care le va acorda
utilizatorul, ChatBot-ul îi va comunica informația dorită.
5. Scenariu utilizare reușită (lansare aplicație, selectarea diferitor opțiuni, deschiderea
diferitor ferestre noi, după descărcare este afișat un mesaj de reușită, etc…

5.1 Lansarea aplicației – la pornirea aplicației utilizatorul va vedea:

Fig .4 . Lansarea aplicației, primul mesaj.


5.2. La selectarea unei opțiunii, ca exemplu “Covid-19” va apărea un mesaj în care
va fi o informație despre virusul Covid-19 și următoarele variante de întrebări (cele
mai posibile).

Fig.5 . O variantă de răspuns a Chat - Botului, după selectarea întrebări.


5.3. În continuare noi putem selecta alte întrebări pe care ne interesează, ca
exemplu “Care sunt simptomele” îmbolnăviri cu Covid-19.

Fig.6 . Descrierea simptomelor ale virusului Covid-19


5.4. La selectarea opțiunii “Am simptomele date” de către utilizator, îi se va propune
să telefoneze medicului pentru a primi un ajutor medical.

Fig.7 . Recomandarea, ce ar trebui să facă persoana cu simptomele date.

6. Scenariu alternativ utilizare (în cazul apariției unor erori, cum ar fi: a fost adresată o
întrebare care nu a fost recunoscută, etc…)
În cazul când utilizatorul acordă o întrebare care nu este înțeleasă de ChatBot, Chat - Botul
îl va anunța că nu poate răspunde la întrebarea dată și va cere ca utilizatorul să reformuleze
întrebarea. Chatbot nu va prezenta informația pe care nu o cunoaște și nu va prezenta
informație eronată.
7. Cerințe speciale (de exemplu, caz de blocare a aplicației în timpul utilizării)
Astfel de cerințe nu sunt necesare. În caz că apare o eroare în timpul comunicări cu
ChatBotul se recomandă de restartat pagina.

8. Construirea diagramei Gantt (http://www.diagramme-de-gantt.fr), care va include


echipa proiectului, timpul de realizare a acestuia, analiza întregului proiect, de la
început și monitorizarea acestuia. (Numărul de persoane, sarcinile și rolul fiecăruia în
proiect, timpul de execuție pentru fiecare sarcină).

Fig.8 . Tabelul Gantt


Fig.9 . Diagrama Gantt

9. Identificarea tuturor factorilor care ar avea un impact pozitiv sau negativ asupra
proiectului și documentarea acestora (unul din membrii echipei se îmbolnăvește,
neînțelegerea între membrii echipei, lipsa motivațională, accesul la serverul
universității este interzis, refuzul clientului de a primi proiectul, neînțelegerea
clientului, produsul nu este cel așteptat, neajunsul de cunoștințe a membrilor echipei,
securizare slabă a produsului, riscul că produsul nu va putea fi integrat în sistemul
existent al companiei clientului, riscul interfeței de a nu permite utilizatorului să
execute toate sarcinile, una după alta, interfața utilizatorului este blocată, lentă sau
dificil de utilizat, riscul general în caz când utilizatorii for respinge total produsul)

Un factor care ar putea avea un impact negativ este ca utilizatorul aplicației ar putea crea o
întrebare eronată sau prea generală care ar putea să nu fie înțeleasă de către aplicație
(Chat-Bot) și ar putea da un răspuns eronat sau în cel mai bun caz să nu deie niciun
răspuns. Această problemă ar putea fi rezolvat prin creare și implimentarea a rețelelor
neuronale mai complexe. Acest fapt îi va da posibilitatea Chat-Botului să înțeleagă
întrebările mai complexe și să acorde un răspuns potrivit pentru ele.

Un factor pozitiv ar putea fi utilitatea acestui chatbot pentru care va micșora rutina
specialiștilor de a răspunde la întrebările generale pe tema pandemiei Covid-19, și paralele
ar putea fi posibil comunicare informației corecte unui public de oameni foarte mare în
același timp paralel.
10. Estimarea costului proiectului (echipament tehnic, soft licențiat, număr de
persoane implicate în proiect, birotică, curent electric, internet).

Echipament tehnic – 2 calculatoare (laptopuri) ≈ 12 000 lei


Soft licențiat – ManyChat (platformă pentru crearea Chat-Bot) – versiunea standartă (gratis)
Număr de persoane implicate în proiect – 1 persoane.
Birotică – 3 pixuri, 3 carnete, 15 foi A4 ≈ 100 lei.
Curent electric ≈ 100 lei
Internet ≈ 150 lei
Total ≈ 12 350 lei

Concluzii
Efectuând proiectul informațional la disciplina Aplicațiile procesării limbajului natural am avut
ca tema “Sisteme de întrebare – răspuns. Dezvoltarea și implementarea unui Chat-Bot
pentru sistemele de sănătate publică”. În urmă elaborării acestui proiect am acumulat un set
important de cunoștințe.
Am făcut cunoștință cu aplicațiile procesării limbajului natural și le-am folosit în practică în
timpul executări proiectului-prototip de Chat-Bot pentru sistemele de sănătate publică.
Consider că acest proiect mi-a dat o viziune mai bună a importanței folosirei limbajului
natural în crearea sistemelor de întrebare - răspuns.

S-ar putea să vă placă și