Documente Academic
Documente Profesional
Documente Cultură
cantitative
calitative
mixte
Matrici de proximitate (de tip obiecte x obiecte) = matrici patratice de dimensiune nxn,
utilizate pt reprezentarea datelor cu privire la similaritatea sau nesimilaritatea unor obiecte.
Ordinul acestor matrici e determinat de nr obiectelor supuse studiului.
Exemplificare: Un element xij masoara gradul de proximitate dintre obiectul i si obiectul j
7. Definiti principalii indicatori (unidimensionali) cu ajutorul carora este sintetizata tendinta
centrala sau locatia sau pozitia (inclusiv relatii de calcul si proprietati). Aratati ca media
este o sinteza optimala pentru o multime de observatii
a) Media
b) Mediana
c) Modul
8. Definiti principalii indicatori (unidimensionali) cu ajutorul carora este sintetizata
variabilitatea (inclusiv relatii de calcul si proprietati).
Proprietati:
Marime nescalata
Nu are o margine superioara (in valoare absoluta, covarianta are o
margine inferioara, reprezentata de valoarea 0 = lipsa asociere de tip
liniar)
12. Definiti datele de tip profil, de tip chronologic (serii de timp) si de tip panel. Exemplificati
fiecare dintre cele trei tipuri
Date de tip profil (= date de tip secventa/ sectiune)=informatii obtinute prin masuratori
de natura statica, efectuate asupra caracteristicilor unor unitati ale unei populatii, la acelasi
moment de timp.
Exemplificare: date referitoare la salariul individual dintr-o luna al lucratorilor unei firme.
Date de tip cronologic = informatii obtinute prin masuratori de natura dinamica, efectuate
asupra caracteristicilor unei unitati a unei populatii la momente sau intervale succesive de timp.
Exemplificare: date care se refera la evolutia in timp a starii unei gospodarii
Date de tip panel = informatii obtinute prin masuratori mixte (static + diamic), efectuate
asupra caracteristicilor acelorasi unitati ale unei populatii la momente sau in intervale
succesive de timp.
Exemplificare: bugetul de familie
13. Definiti datele de tip observational si de tip experimental. Exemplificati fiecare categorie
Date experimentale = informatii obtinute prin organizarea unor experimente controlate, in
care influentele factorilor asupra efectului sunt controlate in mod direct, prin fixarea unor
combinatii precise de influente.
Exemplificare: date caracteristice unor domenii de cercetare (in care se fac experimente)
domeniul stiintelor natural, date de laborator
Date non-experimentale (observationale) = informatii obtinute prin observarea libera a
miscarii fenomenelor si proceselor studiate, fara interventia directa a investigatorului asupra
conditiilor in care se desfasoara aceasta miscare.
Exemplificare: caracteristice domeniului economico-social, observarea atitudinii consumatorilor
cand apare un nou tip de produs pe raftul din supermarket.
14. Care sunt principalele tipuri de transformari preliminare ale datelor. Interpretati marimile
rezultate n urma acestor transformari si mentionati proprietatile acestora
o Operatia de centrare a datelor originale
Fie n variabile si T observatii => operatia de centrare a observatiilor variabilei xi
consta in calculul noilor observatii, adica al valorilor centrate, dupa relatia:
Media celei de-a i-a variabile
o Operatia de standardizare a datelor originale
o Matricea de covarianta
Daca nr de variabile analizate este n, covariantele dintre orice 2 variabile pot fi aranjate
sub forma unei matrici patrate si simetrice, de dim nxn, numita matrice de covarianta.
o Matricea de corelatie
16. Ce este analiza componentelor principale. Evidentiati cinci categorii de probleme care pot fi
solutionate cu ajutorul tehnicilor de analiza a componentelor principale
Analiza componentelor principale = tehnica de analiza multidimensionala care are ca scop
descompunerea variabilitatii totale din spatial cauzal initial sub forma unui nr redus de
componente si fara ca aceasta descompunere sa contina redundante informationale.
Analiza componentelor principale poate rezolva urmatoarele categorii de probleme:
- eliminarea redundantelor informationale;
- reducerea dimensionalitatii spatiului causal ;
- compresia si restaurarea datelor;
- simplificarea modelelor matematice;
- selectarea variabilelor de influenta;
17. Interpretati logica analizei componentelor principale (inclusiv din punct de vedere geometric)
n acest sens, vom considera contextul numeric oferit de exemplul urmtor, context care va servi
ca referin pentru multe din interpretrile i exemplificrile ulterioare.
Exemplu:
Vom considera cazul unui numr de 10 obiecte sau observaii, referitoare la dou
variabile, X1 i X2. Tabelul urmtor conine observaiile iniiale disponibile pentru cele dou
variabile, precum i valorile centrate ce corespund acestor observaii.
Valori iniiale
X1
7,0
5,0
10,0
2,0
5,0
6,0
7,0
9,0
7,0
6,0
6,4
4,933
Valori centrale
X2
10,0
11,0
15,0
5,0
10,0
13,0
12,0
11,0
8,0
10,0
10,5
7,389
0,6
-1,4
3,6
-4,4
-1,4
-0,4
0,6
2,6
0,6
-0,4
0
4,933
-0,5
0,5
4,5
-5,5
-0,5
2,5
1,5
0,5
-2,5
-0,5
0
7,389
Variana individual pentru fiecare din cele dou variabile este 4,933, respectiv 7,389, iar
variana total, corespunztoare celor dou variabile, X1 i X2 este 12,322:
S11 = 4,933;
S22 = 7,389;
VT = 12,322.
n aceste condiii, se poate spune c rolul informaional al celor dou variabile este
aproximativ acelai, c cele dou variabile au aproximativ aceeai contribuie la formarea
variabilitii totale ce caracterizeaz spaiul cauzal iniial. Prima variabil are o contribuie la
formarea varianei totale de 46,45%, iar cea de-a doua variabil contribuie cu 53,55% la
formarea varianei totale:
= 46,45%;
= 53,55%.
S=
R=
S=
R=
Dup cum se poate observa, n urma operaiei de centrare se modific doar matricea
produselor ncruciate, matricea de covarian i matricea de corelaie rmnnd neschimbate.
Matricea de corelaie evideniaz faptul c cele dou variabile sunt corelate, la nivelul unui
coeficient de corelaie de 0,736, adic:
25. Detaliati modul n care pot fi interpretate componentele principale n termeni cu semnificatie
concreta. Exemplificati
26. Criterii de alegere a numarului de componente principale
27. Ce este analiza factoriala si ce tipuri de probleme pot fi rezolvate cu ajutorul acesteia
28. Structura generala a modelului de analiza factoriala
29. Definiti si interpretati descompunerea variabilitatii n contextul analizei factoriale
30. Ce sunt scorurile factor, cum se calculeaza si cum se interpreteaza acestea
31. Metode de estimarea modelului factorial
32. Definiti recunoasterea formelor si exemplificati cteva dintre aplicatiile acesteia n domeniul
economico-financiar.
33. Definiti principalele concepte ale recunoasterii formelor
34. Formulati problema generala a clasificarii
35. Definiti sistemele de recunoastere controlata si necontrolata
36. Ce este analiza cluster, care sunt conceptele fundamentale ale acesteia si care sunt domeniile
utilizarii ei
37. Definiti scopurile analizei cluster si descrieti tipul informatiilor utilizate n analiza cluster
38. Definiti analiza cluster si aratati cum se clasifica metodele de analiza cluster
39. Definiti conceptul de distanta si descrieti cateva modalitati de evaluare a distantelor dintre
forme
40. Formulati criteriul general al clasificarii si aratati cum se evalueaza variabilitatea inter si intra
cluster (cazul uni-dimens)
41. Formulati criteriul general al clasificarii si aratati cum se evalueaza variabilitatea inter si intra
cluster (cazul n-dimens)
42. Metode de evaluare a distantelor dintre clustere
43. Descrieti analiza cluster de tip ierarhic si mentionati care sunt cele doua categorii de
clasificare ierarhica
44. Descrieti metoda agregarii simple de analiza cluster
45. Descrieti metoda agregarii complete de analiza cluster
46. Descrieti metoda agregarii medii de analiza cluster
47. Descrieti metoda centroidului de analiza cluster
48. Decrieti metoda lui Ward de analiza cluster
49. Descrieti algoritmul k-means
50. Ce este dendrograma (arborele de clasificare ierarhica) si cum se construieste aceasta
51. Cum se alege numarul de clustere n cazul clasificarilor de tip ierarhic
52. Formulati problema generala a recunoasterii supervizate a formelor si mentionati cateva
domenii de utilizare
53. Definiti scopurile recunoasterii supervizate a formelor si descrieti tipul informatiilor utilizate
n recunoasterea supervizata
54. Ce sunt clasificatorii de tip liniar. Descrieti logica discriminarii liniare si spatiul discriminat
55. Definiti functiile discriminant liniare, variabilele discriminant si scorurile discriminant
56. Descrieti clasificatorul Bayesian si aratati cum poate fi utilizat acesta in predictia
apartenentei formelor
57. Descrieti forma clasificatorului Bayesian in cazul normalitatii si homoscedasticitatii claselor
58. Descrieti clasificatorul liniar Fisher si aratati cum poate fi utilizat acesta in predictia
apartenentei formelor
59. Descrieti clasificatorul Mahalanobis si aratati cum poate fi utilizat acesta in predictia
apartenentei formelor
60. Descrieti modul de stabilire a abilitatii predictive a unui clasificator si matricea corectitudinii
clasificarii