Documente Academic
Documente Profesional
Documente Cultură
1. Regresie multivariată
2. Implementare:
• Gradient Descent
• Normal Equation
3. Overfitting, Regularizare
Regresia Liniară Univariată
Regresia Liniară Multivariată
Notații:
m - numărul de randuri (samples) de date de antrenare – training set
(x(i),y(i)) – index in setul de date de antrenare, al i-lea rand i=1,2, 3...m
Generalizand avem:
Implementare Gradient Descent pentru
multiple variabile – Batch GD
Care e panta (slope) pe care trebuie sa cobor ?
θ =(XTX)-1XTy
θ vector Rn+1
θ =(XTX)-1XTy
Soluții:
-ștergerea unei caracteristici care este dependentă liniar de alta
-ștergerea uneia sau mai multor caracteristici atunci când există prea multe
caracteristici.
Gradient Descent -Normal Equation
n- numarul de features/variabile m – numar de instante (sample)
Underfitting sau High bias - modelul h(θ) prea simplu, prea putini
parametrii sa capteze structura datelor
L (n+1)x (n+1)
Concluzii Regularizare
Ridge Regression
Lasso Regression
Elastic Net
Bibliografie