Bine ați venit la Scribd!

Săriți peste schemele de tip carusel

Proiect

Încărcat de

Gall Zoltan

0% au considerat acest document util (0 voturi)

10 vizualizări15 pagini

Machine Learning Proiect

Titlu original

proiect

Drepturi de autor

Formate disponibile

PDF, TXT sau citiți online pe Scribd

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Raportați acest document

Machine Learning Proiect

Drepturi de autor:

Formate disponibile

Descărcați ca PDF, TXT sau citiți online pe Scribd

Indicator pentru conținut neadecvat

0% au considerat acest document util (0 voturi)

10 vizualizări15 pagini

Proiect

Încărcat de

Gall Zoltan

Machine Learning Proiect

Drepturi de autor:

Formate disponibile

Descărcați ca PDF, TXT sau citiți online pe Scribd

Indicator pentru conținut neadecvat

Salt la pagina

Sunteți pe pagina 1din 15

Căutați în document

Machine

Learning
Proiect
Proiectul se va realiza individual!
Aplicatie + powerpoint. Aplicaţia trebuie să fie
implementată în limbajul Python si pentru a avea nota de
trecere la examen, aplicatia trebuie sa functioneze.
Powerpoint-ul reprezinta de fapt o documentatie a
aplicatiei si include:
• Titlul proiectului
• Ideea proiectului / abstract
• Descrierea datelor și a tehnicilor folosite
Proiect. • Software-ul si pachetele folosite
Informaţii • Rezultate experimentale obtinute
generale • Concluzii
Agenda
Când primești un proiect ML (problema expusă)

Explorarea datelor

Procesarea datelor (transformarea tuturor

valorilor în numere)

Modele

Măsurarea performanțelor (metrici)

Testare

Tipuri de învățare/probleme
Topic 1. Când primești un proiect

ML (problema expusă)

⚫ ce încerc să prezic

⚫ ce caracteristici ar trebui sa folosesc?

⚫ Utilizați date brute!

⚫ Utilizați date obiective (scală clară).

⚫ Chiar am nevoie de ML?!

Topic 2. Explorarea datelor

⚫ Statistici descriptive : min, max, percentile, numărători, frecvențe, topX, medie, std

⚫ Descriptive plots

⚫ Boxploturi

⚫ Histograme

⚫ Grafice (Line plots)

⚫ Diagrame (Scatter plots)

⚫ Dendograme (eliminarea coloanelor duplicate)

5
⚫ Împartirea setului de date Antrenare-Validare-Testare

⚫ Gestionați valorile lipsă (np.NaN, np.inf, None)

⚫ drop

⚫ Imputation (mean, iterative, ..)

⚫ Guardian values

⚫ Feature encoding

Topic 3.
⚫ LabelEncoding ( .., "a" -> 4, "b" -> 5...)

One-hot-encoding ( "a" -> 0001000, "b" -> 0000100)

Procesarea datelor
⚫

⚫ Normalizați datele continue

⚫ StandardScalar / MinMaxScaler (transformarea tuturor valorilor în numere)

⚫ Remove the outliers

⚫ Prin calculul 1.5 * IQR (boxplot method)

⚫ Prin calculul scorului Z-score ( z = (x-mean) / std) <-3, >3

⚫ Eliminați funcțiile redundante (outliers prin corelarea caracteristicilor)

⚫ Pearson / Spearman

⚫ Balancing the dataset

⚫ Undersampling / oversampling
Topic 4. Modele

(iterate)

începe cu modele liniare

Pipelines / Caracteristici polinomiale

Optimizarea hiperparametrilor (learning-to-learn)

GridSearchCV / RandomSearchCV

7
Topic 5. Măsurarea performanțelor

(metrici)
• utilizați unele valori pentru a măsura setul de date de validare

• modele fictive pentru validarea setului de date

• utilizați o metodologie consecventă pentru compararea modelelor

Metrici de utilizat

• mean squared error, R2 score (MSE)

• F1-score, AuROC, Precision, Recall

8
Topic 6. Testare

Overfitting vs. Underfitting

Regularisation ( L1, L2 )

Confusion matrix

Calculați importanța caracteristicilor

⚫ folosind RandomForest / DecisionTree / model bazat pe arbore

(.feature_imporances_)

⚫ folosind abordarea de amestecare aleatoare a caracteristicilor (feature shuffling),

antrenează un model liniar și uită-te la weights

Vizualizați un DecisionTree
Topic 7. Tipuri de învățare

LinearRegession

LogisticRegression

NaiveBayes, k-NN

DecisionTrees, RandomForests, GradientBoosting

Ensambling methods: Boosting, Model averaging

Topic 8. Seturi de date utilizate

⚫ Piața imobiliară/ Boston housing

⚫ Titanic dataset

⚫ Rossman sales data

⚫ Iris dataset

⚫ ....
Aplicabilitate

12
13
The way to get
started is to quit
talking and
begin doing.
Walt Disney

Tuesday, February 2, 20XX Sample Footer Text 14

Linkuri utile:

Sugestii pentru • http://cs229.stanford.edu/projects2013.html

• http://archive.ics.uci.edu/ml/
proiect • www.kaggle.com

S-ar putea să vă placă și

DataMining2020 Lab1
Document12 pagini
DataMining2020 Lab1
mihayyyd
Încă nu există evaluări
Cursul 1 Managementul Datelor Brute
Document23 pagini
Cursul 1 Managementul Datelor Brute
Nico Nicoleta
Încă nu există evaluări
4b.curs CIP
Document55 pagini
4b.curs CIP
verdescu mihaita
Încă nu există evaluări
Curs 5
Document46 pagini
Curs 5
Duta Cosmin
Încă nu există evaluări
PProiectAD Voloh Padure Apetrei
Document85 pagini
PProiectAD Voloh Padure Apetrei
Delia Radu
Încă nu există evaluări
Curs2 - Comunicare Intreprindere
Document18 pagini
Curs2 - Comunicare Intreprindere
Iulian
Încă nu există evaluări
Curs 1
Document39 pagini
Curs 1
Daniel Popa
Încă nu există evaluări
Proiectare Pe Unitati Cl.8
Document8 pagini
Proiectare Pe Unitati Cl.8
indigott3970
Încă nu există evaluări
Instruirea de Performanta La Disciplina PDF
Document6 pagini
Instruirea de Performanta La Disciplina PDF
Eugenia Maria Ohota
Încă nu există evaluări
IAC5 Analiza Statica 2020
Document11 pagini
IAC5 Analiza Statica 2020
Theodora Stefan
Încă nu există evaluări
Regresie Liniara
Document14 pagini
Regresie Liniara
toiaemilia853
Încă nu există evaluări
Lpowerpoiititi
Document45 pagini
Lpowerpoiititi
Степа Попов
Încă nu există evaluări
Isa Lucrări
Document218 pagini
Isa Lucrări
Bianca Andreea
Încă nu există evaluări
Examen Multimedia Ase
Document37 pagini
Examen Multimedia Ase
Anca Vochescu
100% (1)
Curs 7 Intro ML
Document37 pagini
Curs 7 Intro ML
Oana Drăgan
100% (1)
Cursuri Ad
Document369 pagini
Cursuri Ad
Deria Mahmudie
Încă nu există evaluări
Capitolul 1 - Slide
Document11 pagini
Capitolul 1 - Slide
Elena Andronache
Încă nu există evaluări
Cursul 1 - Managementul Datelor Brute
Document23 pagini
Cursul 1 - Managementul Datelor Brute
Craciun Catalina
Încă nu există evaluări
Isa Cap 3
Document61 pagini
Isa Cap 3
Teodora Grigore
Încă nu există evaluări
Curs DW&BI - 3 - Proiectarea Depozitului de Date
Document15 pagini
Curs DW&BI - 3 - Proiectarea Depozitului de Date
raduvm
Încă nu există evaluări
Plexitateaalg PDF
Document24 pagini
Plexitateaalg PDF
Sebastian Oglage
Încă nu există evaluări
Informatica Clasa A Ix A Ciclul Inferior
Document6 pagini
Informatica Clasa A Ix A Ciclul Inferior
Soreanu Dumitru-Paul
100% (1)
L. Laborator Nr. 1
Document14 pagini
L. Laborator Nr. 1
TîmburŞtefan
Încă nu există evaluări
Planificare A 11 A INFO
Document21 pagini
Planificare A 11 A INFO
Giovanna Stanica
Încă nu există evaluări
Curs Java Software Development - Modul Junior Developer - Devmind PDF
Document4 pagini
Curs Java Software Development - Modul Junior Developer - Devmind PDF
CristianaMilitaru
Încă nu există evaluări
Curs Java Software Development - Modul Junior Developer - Devmind PDF
Document4 pagini
Curs Java Software Development - Modul Junior Developer - Devmind PDF
Andrei Stoe
Încă nu există evaluări
MMR8099
Document7 pagini
MMR8099
Iuliana Moise
Încă nu există evaluări
C2 Mgro
Document54 pagini
C2 Mgro
Salty D0ge
Încă nu există evaluări
MSB-TDM An II
Document6 pagini
MSB-TDM An II
Andreea Borodea
Încă nu există evaluări
Curs2 SQL
Document29 pagini
Curs2 SQL
Adrian Paraschiv
Încă nu există evaluări
Data Science DM
Document6 pagini
Data Science DM
Florin Cojocaru
Încă nu există evaluări
Lucrarea de Laborator nr6 - C++
Document9 pagini
Lucrarea de Laborator nr6 - C++
Андрей Пырлог
Încă nu există evaluări
Curs 1
Document27 pagini
Curs 1
Patricia Isabell
Încă nu există evaluări
PS Indrumar Fiod PDF
Document106 pagini
PS Indrumar Fiod PDF
Amarfii Sergiu
Încă nu există evaluări
Curs1 - Comunicare de Intreprindere
Document22 pagini
Curs1 - Comunicare de Intreprindere
Iulian
Încă nu există evaluări
Python102 Curs3
Document43 pagini
Python102 Curs3
Duta Cosmin
Încă nu există evaluări
Curs Java Software Development - Modul Incepatori - Devmind
Document4 pagini
Curs Java Software Development - Modul Incepatori - Devmind
Elena Elena
0% (1)
PCLP - Curs 5 PDF
Document26 pagini
PCLP - Curs 5 PDF
Danut Radu
Încă nu există evaluări
Curiculum Inf Zi
Document6 pagini
Curiculum Inf Zi
iura_1999
Încă nu există evaluări
I1I2102
Document4 pagini
I1I2102
wewqewqfdth45
Încă nu există evaluări
Test Curs 3 - Attempt Review
Document4 pagini
Test Curs 3 - Attempt Review
Oprea Theodor
Încă nu există evaluări
Isi SC4
Document29 pagini
Isi SC4
Miruna -Alondra
Încă nu există evaluări
MODELARE
Document21 pagini
MODELARE
tudor dragomir
Încă nu există evaluări
Python 2
Document31 pagini
Python 2
luca ioan
Încă nu există evaluări
Proiect Didactic
Document11 pagini
Proiect Didactic
Ilie Oana
100% (2)
Cerinte Proiect RNA
Document2 pagini
Cerinte Proiect RNA
Mihail Radu
0% (1)
Curs 2
Document11 pagini
Curs 2
Chioran Mălina
Încă nu există evaluări
Proiectarea de Lunga Durata La Informatica Xreal
Document6 pagini
Proiectarea de Lunga Durata La Informatica Xreal
Marina Zima
Încă nu există evaluări
POO - Tema 1
Document5 pagini
POO - Tema 1
Ana-Maria David
Încă nu există evaluări
Curs 13
Document28 pagini
Curs 13
Daniel Popa
Încă nu există evaluări
Matlab
Document48 pagini
Matlab
Alessandra Di
Încă nu există evaluări
Cursuri SDA Curs 1
Document28 pagini
Cursuri SDA Curs 1
Tht Wolfeschlegel Vlad
Încă nu există evaluări
Fisa Calcul Stiintific MFIC Ani Romana
Document4 pagini
Fisa Calcul Stiintific MFIC Ani Romana
Ion popescu
Încă nu există evaluări
5 - Utilizarea Calculatorului
Document5 pagini
5 - Utilizarea Calculatorului
DanyMay Hope
Încă nu există evaluări
Test Initial Clasa A XI
Document4 pagini
Test Initial Clasa A XI
Alex Z
Încă nu există evaluări
Comp W
Document3 pagini
Comp W
BIANCA MARIA VOICULESCU
Încă nu există evaluări
Java Coding Bootcamp
Document6 pagini
Java Coding Bootcamp
Andreea Kaeya
Încă nu există evaluări
Indrumar
Document160 pagini
Indrumar
verginarojnita
Încă nu există evaluări
Curs 1 - Simularea
Document13 pagini
Curs 1 - Simularea
BanciuRomulus
Încă nu există evaluări
Diagrama Ishikawa pentru gestionarea riscurilor: Anticiparea și rezolvarea problemelor din cadrul afacerii
De la Everand
Diagrama Ishikawa pentru gestionarea riscurilor: Anticiparea și rezolvarea problemelor din cadrul afacerii
Ariane de Saeger
Încă nu există evaluări
Serviciul World Wide Web
Document3 pagini
Serviciul World Wide Web
Gall Zoltan
Încă nu există evaluări
Dieta Alcalină
Document10 pagini
Dieta Alcalină
Gall Zoltan
100% (1)
PowerPoint - Reguli Prezentari Academice
Document2 pagini
PowerPoint - Reguli Prezentari Academice
Gall Zoltan
Încă nu există evaluări
PCI Hemoragii Severe PDF
Document40 pagini
PCI Hemoragii Severe PDF
Alexandru Merticaru
Încă nu există evaluări
Legea 295
Document166 pagini
Legea 295
mihalamimi
Încă nu există evaluări
Timofte
Document3 pagini
Timofte
Gall Zoltan
Încă nu există evaluări