Documente Academic
Documente Profesional
Documente Cultură
Learning
Proiect
Proiectul se va realiza individual!
Aplicatie + powerpoint. Aplicaţia trebuie să fie
implementată în limbajul Python si pentru a avea nota de
trecere la examen, aplicatia trebuie sa functioneze.
Powerpoint-ul reprezinta de fapt o documentatie a
aplicatiei si include:
• Titlul proiectului
• Ideea proiectului / abstract
• Descrierea datelor și a tehnicilor folosite
Proiect. • Software-ul si pachetele folosite
Informaţii • Rezultate experimentale obtinute
generale • Concluzii
Agenda
Când primești un proiect ML (problema expusă)
Explorarea datelor
Modele
Testare
Tipuri de învățare/probleme
Topic 1. Când primești un proiect
ML (problema expusă)
⚫ ce încerc să prezic
⚫ Statistici descriptive : min, max, percentile, numărători, frecvențe, topX, medie, std
⚫ Descriptive plots
⚫ Boxploturi
⚫ Histograme
5
⚫ Împartirea setului de date Antrenare-Validare-Testare
⚫ drop
⚫ Guardian values
⚫ Feature encoding
Topic 3.
⚫ LabelEncoding ( .., "a" -> 4, "b" -> 5...)
⚫ Pearson / Spearman
⚫ Undersampling / oversampling
Topic 4. Modele
(iterate)
GridSearchCV / RandomSearchCV
7
Topic 5. Măsurarea performanțelor
(metrici)
• utilizați unele valori pentru a măsura setul de date de validare
Metrici de utilizat
8
Topic 6. Testare
Regularisation ( L1, L2 )
Confusion matrix
Vizualizați un DecisionTree
Topic 7. Tipuri de învățare
LinearRegession
LogisticRegression
NaiveBayes, k-NN
⚫ Titanic dataset
⚫ Iris dataset
⚫ ....
Aplicabilitate
12
13
The way to get
started is to quit
talking and
begin doing.
Walt Disney
• http://archive.ics.uci.edu/ml/
proiect • www.kaggle.com
15