Documente Academic
Documente Profesional
Documente Cultură
(Machine Learning)
Curs 1
Obiective
• Originile și aplicațiile practice ale învățării automate
• Definirea și reprezentarea cunoștințelor de către computer
• Concepte de bază care diferențiază diversele abordări ale învățării
automate
Originile învățării automate
• Încă de la naștere suntem înconjurați de date.
• Primele baze de date au înregistrat informații din mediul observabil.
• Apariția senzorilor electronici a contribuit în mod suplimentar la
creșterea bogăției datelor înregistrate.
• Trăim înconjurați de baze de date și senzori, multe aspecte ale vieții
noastre sunt înregistrate.
• Ceea ce face unică această perioadă este ușurința cu care accesăm și
procesăm vastele cantități de date (Big Data).
Ce este învățarea automată?
• Domeniul de studiu interesat de dezvoltarea algoritmilor pentru
transformarea datelor în acțiuni inteligente este cunoscut sub numele
de învățare automată.
Date
disponibile
Putere de Metode
calcul statistice
Învățarea automată – uz
• Învățarea automată poate avea aplicații multiple:
• Predicția rezultatelor alegerilor/referendumurilor
• Identificarea și filtrarea mesajelor de spam
• Prevenirea activităților criminale
• Semaforizarea automată în funcție de condițiile de trafic
• Examinarea coșului de cumpărături
• Avioane și mașini autonome
• Publicitate direcționată/țintită pe client
• etc.
Învățarea automata – eșec
• În anumite situații modelele construite pot eșua deoarece nu iau în
calcul anumite variabile complexe cum ar fi, de exemplu,
comportamentul uman.
• Cele mai întâlnite motive includ:
• pre-procesare/pregătirea inadecvată a datelor
• validare inadecvată a modelului
• extrapolare nejustificată
• supra-antrenarea modelului cu datele existente.
Învățarea automată - abuz
• Câteva considerații etice:
• trebuie exercitată prudență atunci când se obțin sau se utilizează date pentru
a evita
• încălcarea legii
• violarea clauzelor contractuale sau de utilizare a datelor,
• abuzul de încredere
• violarea intimității clienților sau publicului larg
• ”don’t be evil” – motto-ul Google
• Faptul că se pot utiliza anumite date nu înseamnă întotdeauna că ar trebui
făcut acest lucru.
Cum funcționează învățarea?
• Indiferent dacă cel care învață este om sau mașină, procesul de
învățare de bază este similar:
• introducerea datelor – utilizează observarea, stocarea în memorie și
reamintirea pentru a furniza o bază de fapte pentru raționamentul următor
• abstractizarea – implică traducerea datelor într-o reprezentare mai largă
• generalizarea – utilizează datele abstractizate pentru a forma o bază pentru
acțiune
Abstractizare Generalizare
Date
Abstractizarea și reprezentarea cunoștințelor
• Atribuirea unei semnificații pentru date apare în procesul de
abstractizare.
• În timpul procesului de reprezentare a cunoștințelor, computerul
rezumă datele de intrare într-un model, o descriere explicită a
tiparelor structurate din date.
• Există numeroase tipuri de modele:
• ecuații
• diagrame (arbori sau grafuri)
• reguli dacă/atunci
• grupări de date cunoscute sub numele de roiuri sau clustere
Antrenarea
• Este procesul de asociere a unui anumit model cu un set de date.
• Nu este același lucru cu învățarea!
• Exprimă faptul că modelul de învățare automată este impus de
instructorul uman mașinii student, furnizând computerului o
structură pe care să o modeleze după aceea.
• După ce modelul a fost antrenat, datele au fost transformate într-o
formă abstractă care sumarizează informația inițială.