Documente Academic
Documente Profesional
Documente Cultură
Scris de Mihaiela
Mari, 08 Martie 2011 13:46 - Ultima actualizare Luni, 21 Martie 2011 22:35
SISTEMELOR DE NVARE
The article depicts the way computers and humans work together in order to analyze different
texts. We can easily see that a computer is able to elaborate certain methods for learning and
can apply them to text mining, but the importance of a human operator must not be minimized,
because it is necessary that this person programs the computer to process input data in order to
obtain new knowledge. The article displays learning techniques that are used by machine
learning and describes a few of the possible uses of text mining.
1 / 12
Articolul prezint modul de colaborare dintre calculator i om, n scopul analizei textului. Dei
este uor observabil c un calculator poate realiza anumite metode de nvare i le poate
aplica pentru analiza textului, importana omului nu poate fi minimalizat, deoarece este
necesar ca acesta s programeze calculatorul pentru a provcesa datele de intrare n scopul
obinerii de noi cunotine. Sunt expuse tehnicile de nvare specifice sistemelor, precum i o
comparaie a acestora i o descriere a aplicabilitilor posibile.
- nvare transductiv
2 / 12
- nvare cu ntrire.
De-a lungul timpului, muli autori au studiat, n domeniul vast al Inteligenei Artificiale, separat:
abducia i nvarea. Ei au artat importana lor n dezvoltarea sistemelor cu capaciti
avansate cum ar fi: abilitatea de a achiziiona i asimila informaiile n mod inteligent, de a
nelege i a se adapta factorilor externi, a planifica aciunile i a comunica cu alte sisteme.
Studiile recente au avut ca rezultat apropierea celor dou direcii n diverse contexte pentru a
mbunti capabilitile sistemelor. De aceea
este important nelegerea de ansamblu a relaiei ntre cele dou direcii i studierea
posibilitilor de aplicare i integrare efectiv.
(1)TUH=>O i
Exprimarea sub aceast form nu permite o modalitate riguroas de a gsi setul de enunuri H.
3 / 12
O teorie abductiv <T, A, IO poate fi privit ca reprezentnd o colecie de stri posibile ale
problemelor. Aceste stri sunt caracterizate de subseturi ale predicatelor abductibile, care
satisfac integritatea constrngerilor IC. n aceast perspectiv, o
soluie viabil din teoria T este corect dac exist un enun care s rspund
problemei n cauz, astfel nct s fie condiionat de acel set de predicate abductibile
care definesc starea. Mai mult, aceast perspectiv ne permite s considerm o
teorie abductiv ca un obiect dinamic care evolueaz pe msur ce apar noi
informaii sub forma observaiilor (O). Aceste informaii pot fi asimilate prin
schimbarea coleciei de presupuneri abductibile acceptate i a enunurilor
corespunztoare n teoria abductiv, acceptndu
-le
numai pe acelea pentru care O este
adevrat.
nvatarea inductiv nu asigur corectitudine matematic. Inducia apare cnd punem cap la
4 / 12
Principala problem care poate apare n cadrul etapei de achiziie a cunotinelor unui sistem
expert const n transferul ct mai fidel al cunotinelor experilor umani
n baza de cunotine. Astfel, succesul sistemului expert va depinde n buna msur de
existena unei baze de cunotine complete, coerente i neredundante.
Cele dou inferene, abducia i inducia, utilizate n mod frecvent n domeniul Inteligenei
Artificiale, au la baz aceleai specificaii: considernd domeniul
problemei avnd la baz o teorie T i o observaie (sau un set de observaii) notat
O, sa determinm ipoteza H care satisface urmtoarea relaie:
TUH=>O(1)
Totui cele dou inferene difer n mod semnificativ prin modalitatea n care satisfac relaia de
mai sus i extind aceasta relaie n diferite direcii:
5 / 12
Conceptul de transducie a fost introdus de Vladimir Vapnik n cartea sa publicat n 1995: "The
Nature of Statistical Learning Theory". El propune un nou mod de inferen, transducia, n locul
inferenei inductive. Figura de mai jos ilustreaz principiul transduciei:
6 / 12
Scop: minimizarea erorii ateptate pentru orice exemplu generat de aceeai distribuie ca
mulimea de intrare
Filtrarea tirilor pe internet: n fiecare zi sunt publicate multe articole pe internet. Pornind de la
cteva exemple clasificate de utilizator n zilele precedente, se dorete aflarea celor mai
interesante tiri pentru respectivul utilizator.
7 / 12
Folosind nvarea la maini, obiectivul este de a nva clasificatorii din exemple care
asigneaz automat categoriile. Pentru a facilita o nvare eficient, fiecare categorie este
tratat ca o problem separat de clasificare binar. Fiecare astfel de problem rspunde la
ntrebarea: "Acest document trebuie plasat n aceast categorie?". Documentele, care de
obicei sunt iruri de caractere, trebuie trecute ntr-o reprezentare ce poate fi utilizat de
algoritmul de nvare i de procesul de clasificare.
Exist multe probleme nerezolvate pe care computerul le poate rezolva cu ajutorul programelor.
nvarea cu ntrire este o apropiere de maina inteligent care
combin cu success dou discipline ce rezolv probleme pe care alte discipline nu le
pot rezolva individual. Programarea dinamic este un cmp al matematicii care este
folosit pentru a rezolva probleme de optimizare i control. Programarea dinamic
tradiional este limitat ca mrime i complexitate nvarea supervizat este o
metod general pentru un aproximator de funcie parametrizat, ca reelele neurale,
pentru a reprezenta funcii. Cu toate acestea, nvarea supervizat are nevoie de
perechi intrare-iesire ale funciei de nvare. Adic, nvatarea supervizat necesit
un set de ntrebri cu rspunsurile corecte.
8 / 12
Text mining-ul transmite identificarea automat i indexarea conceptelor din cadrul textelor,
prezint o imagine la nivel nalt a scopului ntregului text, cu abilitatea de a "fora" pentru
obinerea detaliilor relevante.
Tehnicile de text-mining permit utilizatorilor s fac noi asocieri i relaii, ducnd la noi ci
pentru inovare i explorare.
9 / 12
Aplicaiile de text mining se pot clasifica n aplicaii online i aplicatii offline. n prezent, cele mai
cunoscute aplicaii de text mining sunt:
- cutarea inteligent pe Internet, care presupune analiza de coninut (cu ajutorul tehnicilor de
text mining documentele regsite de un motor de cutare sunt filtrate, fiind pstrate doar
rezultatele cu sensul cautat), dezvoltarea unui profil al utilizatorului (documentele sunt aduse
automat fr o solicitare expres din partea utilizatorului, plecnd de la un profil al preferinelor
conform crora programul caut independent documente relevante).
- regsirea tirilor interesante: selectarea de tiri de pe Usenet este o provocare care apare n
viaa de zi cu zi a multor utilizatori de Internet.
- regsirea de rspunsuri la ntrebri: exist ntrebri frecvente la care altcineva poate rspunde
sau a rspuns deja. Acestea se numesc frequently asked questions i se gsesc mpreun cu
rspunsurile lor n baze de date.
10 / 12
- concatenarea documentelor (de exemplu crearea de relatri ale unor stiri pe baza informaiilor
preluate din mai multe surse)
Aplicaiile sunt folosite pentru anumite funcii sau procese. Pot fi dependente sau independente
de domeniu . Soluiile de tipul explorrii datelor ndeplinescu cerine multiple din cadrul
domeniilor de aplicabilitate. Ramurile n care se poate aplica explorarea datelor sunt:
- Descoperirea substanelor chimice, a medicamentelor, a simptomelor
Sursele de informaii includ literatur tiinific i medical, reetele de tratament, bazele de date
de compui chimici, medicamente i simptome medicale. Are rolul de a observa relaiile ntre
entitile biomedicale i chimice i indicatorii genetici, de exemplu proteine i gene-secvene de
baz-simptom, tipare de genul A activeaz B sau A se asociaz cu B. Este necesar
determinarea relaiilor i asociaiilor temporare.
- Managementul ngrijirii sntii
11 / 12
Domeniile de afaceri, academice i guvernamentale vor fi printre primele care vor beneficia de
instrumente sofisticate de detectare a cunotinelor, cum este explorarea textului. Explorarea
textului poate juca un rol important n cadrul multor funcii referitoare la mediul de afaceri. Lista
include Managementul Relaiilor cu Clienii, unde sursele sunt reprezentate de e-mail-uri i
scrisori, notri i stenograme ale centrului de consultan ct i date din baza de date a
serviciului de management, i are ca scop identificarea problemelor referitoare la calitatea
produselor i serviciilor, pentru a ghida designul i pentru a ncheia numai anumite contracte.
Bibliografie
1. http://www.revistaie.ase.ro/content/23/Flavian.pdf
2. http://portal.acm.org/citation.cfm?id=998547&dl=GUIDE&coll=GUIDE
12 / 12