Documente Academic
Documente Profesional
Documente Cultură
Scopul acestui model este de a prezice prețurile acțiunilor pe baza unui set de
caracteristici utilizând o abordare care include reducerea dimensionalității prin PCA
și apoi aplicarea regresiei liniare pentru antrenarea unui model care ne va ajuta la
prezicerea prețurilor.
Evoluția datelor folosite
Procesul de Construire a Modelului
1. Procesarea datelor
2. Implementarea algoritmului SVD
3. Aplicarea algoritmul PCA
4. Standardizarea datelor
5. Construirea modelului de regresie liniară
6. Evaluarea modelului
7. Vizualizarea datelor
Standardizarea Datelor
Analiza Componentelor Principale (PCA) este o tehnică în analiza datelor care are ca
scop reducerea dimensionalității, păstrând în același timp informațiile esențiale. În esență,
PCA transformă seturi de date complexe într-un format mai simplu, astfel încât să poată
fi mai ușor de înțeles și de analizat.
Regresia liniară este o metodă statistică utilizată pentru a modela relația liniară între o
variabilă dependentă (țintă) și una sau mai multe variabile independente (caracteristici). În
cazul regresiei linare simplă avem o singură variabilă independentă, iar în cazul regresiei
liniare multiple, avem mai multe variabile independente.
Antrenarea unui model liniar înseamnă ajustarea coeficienților sau parametrilor modelului pentru a se
potrivi cât mai bine datelor de antrenare. În contextul unei regresii liniare, procesul de antrenare constă în găsirea
valorilor optime ale coeficienților care minimizează eroarea dintre valorile observate și cele prezise de model.
Ytest_prediction = Xtest࠰ ꞵ
Evaluarea Performanței
Calcularea erorii
MSEtrain = 1/ntrain࠰Σ(Ytrain-Ytrain_predicted)2
MSEtest = 1/ntestΣ(Ytest-Ytest_predicted)2
Interpretarea erorii
● MSE mic: Modelul are o bună potrivire cu datele și face predicții precise.
● MSE mare: Modelul are o potrivire slabă cu datele și face predicții imprecise.
Calculând diferența dintre valorile reale și cele
● Eficiența modelului: PCA poate contribui la eliminarea caracteristicilor redundante sau mai puțin informative,
ceea ce poate duce la un model de regresie liniară mai eficient și mai ușor de interpretat
● Motivul pentru utilizarea regresiei liniare: presupunem că există o relație liniară între caracteristicile reduse
prin PCA și prețurile acțiunilor. În acest caz, regresia liniară poate să fie o alegere potrivită, deoarece este
simplă și ușor de interpretat.
Mulțumesc!