Sunteți pe pagina 1din 3

MINISTERUL EDUCAȚIEI ȘI CERCETĂRII

Universitatea Tehnică a Moldovei


Facultatea Calculatoare Informatică și Microelectronică
Departamentul Ingineria Software și Automatică
Programul de studii: Securitate Informațională

Examen
La disciplina: Data Mining

Student: Ciubotaru Vadim, SI-211M


Evaluator: Grozavu Nistor
.

Chișinău, 2022
Exercițiul 1
Let A be a set of 10 individuals X1 to X10 described by 8 variables V1 to V8:

Write the R code for:


1. Extract : a. individuals X2, X3 and X10, b. all variables with values between 15 and 40, c. all
variables except V1 and V3, d. individuals with values greater than 56 for all variables.
2. Carry out a PCA using as additional variables the variables V6 and V8.
3. Visualize all the factorial planes of the individuals and the circles of the correlations from axes
1, 2 and 3.
4. Create a function that will allow you to center and reduce the proposed dataset using the
apply() function.
5. Create a function that removes rows from a data.frame (matrix) with at least one missing
value.
1. a A[c(2,3,10),]
b A[A<40 & A>15]
c A[,c(-1,-3)]
d A[A>56]
2. prcomp(A[,c(6,8)] ,scale=FALSE)
3.
4.
5. A[complete.cases(A), ]
Exercițiul 2
Check the properties that are respected by the k-means algorithm:
1. Interpretability of results
2. Scalability
3. Ability to handle large databases
4. Complexity of execution time
5. Minimum need for domain knowledge to determine the parameters
K-means respectă doar aceste proprietăți, în mare parte interprează foarte ușpr rezultatele
deoarece sunt prezente grupurile și centrele grupurilor a căror aparțin aceste date, în cazul
scalibilități și abilitatea de a manipula baze de date mari în cazul dat k-means este mediu, ultima
proprietate permite tratarea mai ușor a datelor.
Exercițiul 3
Interpret PCA results from the correlation circle and the first factorial plane:

Rezultatul corelației dintre cerc și planul factorial este: un unghi mic indică faptul că
reprezentarea celor două variabile pe planul factorial este corelată pozitiv. Mai sus vedem că
predarea și cercetarea sunt corelate pozitiv pe acest plan factorial. Un unghi de 90 de grade
indică nicio corelație, iar un unghi de 180 de grade indică o corelație negativă.
Exercițiul 4
Let P be the matrix of the distances of the 5 points (A, B, C, D, E). From this matrix P, apply the
ascending hierarchical classification algorithm using the minimum link as the aggregation
criterion and draw the corresponding dendrogram.

S-ar putea să vă placă și