Sunteți pe pagina 1din 15

2.

Metode, tehnici și
instrumente pentru SISD
Studii de caz
[1] Segmentarea clientilor si a produselor prin clustering
(unsupervised model)
[2] Analiza cosului de cumparaturi prin algoritmi de asociere
(unsupervised model)
[3] Estimarea preturilor de vanzare [supervised model]
• Seturi de date:
http://www.claudiubrandas.ro/master/msmd/sisd/sc/dm/clustering/

• Instrumente:
• WEKA ( http://www.cs.waikato.ac.nz/ml/weka/ )
• R ( https://www.r-project.org/ )
• MS Azure Machine Learning Studio (https://studio.azureml.net/)
[1] Segmentarea • Setul de date: clienti_e-commerce.csv
clientilor si a produselor • WEKA:
prin clustering
(unsupervised model)
• Setul de date: clienti_e-commerce.csv
• R:

Setarea spatiului de lucru:


• getwd() – afiseaza locatia spatiului de lucru
• Setul de date: date_vanzari_2016.csv
• R:

- Incarcarea datelor din


fisier (“date_vanzari_2016.csv”) in
tabloul de lucru (date_vanzari_2016)
prin comanda read.csv()

- Afisarea unor indicatori statistici generali


cu privire la datele incarcate prin comanda
summary()
- Pentru clusterizarea prin
Simple K-means se procedeaza astfel:
• Se seteaza variabila SEED prin
comanda set.seed() cu valoare 1234
set.seed(1234)
• Se clusterizeaza datele prin
comanda kmeans() cu parametrii
(date_vanzari_2016, centers=5).
centers reprezinta numarul de clustere.
kmeans(date_vanzari_2016, centers=5)
• Rezultatul clusterizarii este incarcat in
tabloul date.clustere.
• Se afiseaza centrele clusterelor
(clusters centroids) prin
parametrul $centers.
date.clustere$centers
- Afisarea numarului punctelor de date
din fiecare cluster se face prin comanda
table(date.clustere$cluster)

- Afisarea clusterelor se face prin


date.clustere
- Pentru vizualizarea grafica a rezultatelor clusterizarii se utilizeaza comanda clusplot() din pachetul (libraria) cluster

- library(cluster)
- clusplot(date_vanzari_2016[,3:9], date.clustere$cluster, color = TRUE, shade = TRUE, labels=0, lines=0)
[2] Analiza cosului de cumparaturi prin algoritmi de
asociere (unsupervised model)
• Setul de date:
http://www.claudiubrandas.ro/master/msmd/sisd/date/vanzari2016_3.arff

• Instrument de lucru: WEKA


- Se utilizeaza algoritmul Apriori de asociere

S-ar putea să vă placă și