Sunteți pe pagina 1din 2

1.

Modele KPD

2.Categorii de date utilizate in DM

Date categoriale – acele date care impart obiectele in diferite categorii(nominale – grupa sanguina,
culoarea ochilor/ ordinale – fumator amator/inrait, durere mica/medie/mare)

Date numerice – se impart in date disscrete – numere intreg(nr copii familie) si date numerice
continue – se obtin in urma unor amsuratori – inaltime, greutate

3.Pregatirea datelor

Se pune problema calitatii datelor (eliminarea valorilor extreme/aberante), a valorilor lipsa, a


datelot duplicat, a datelor introduce incorrect, a datelor expirate, etc. In functie de problemele
detectate privind calitatea datelor se procedeaza la rezolvarea acestora prin diferite metode. Pt
vaorile externe aberrante de aplica proceduri de filtrare, se pot elimina valorile ce se abat mult de la
medie. De oibcei exista valori lipsa, unde se aplica estimarea valorilor lipsa sau eliminarea valorilor
ce au atribute lipsa. Pt datele duplicat se sterg duplciatele.

4. Strategii de tratare a datelor lipsa

5.Regresie liniara simpla – prez generala

6.Rezolvare modelului de regresie simpla

7.Utilizarea modelului de regresie simpla pt predictie

8.Modelul de regresie liniara

9.Validarea mdelului de regresie

10.Regresia logística

11.Analiza discriminanta liniara

12.Casificatorul Naive Baise

13.Clasificatorul KNN

14.Arbori de decizie – algoritmul TDIDT

15.Utilizarea entropiei pt selectarea atributelor de dezvoltare

16.Overfitting

17.Subiect 17
18.Estimarea de

19.Perceptronul liniar – cibertronul si toti robotii din Transformers

20.Perceptronul simple si generalizat

21.Retele neuronale – prez generala

22. Clusteri ierarhici si neierarhici