Sunteți pe pagina 1din 9

Analiza statistic multidimensional

Curs 2, 14 Octombrie 2014


Titular de curs: Conf.univ.dr.Cristina BOBOC
Email: cristina.boboc@csie.ase.ro
WEB page: www.cristinaboboc.wordpress.com

Noiuni introductive

prima referin la medotele de analiz factorial a fcut-o


n anul 1901 Karl Pearson

n anul 1933 a fost integrat statisticii matematice de


ctre Harold Hotelling

a nceput s fie utilizat efectiv dup dezvoltarea


metodelor actuale de calcul cu ajutorul calculatoarelor

Noiuni introductive

Configurarea norului
de punte n spaiu

vizualizarea punctelor
n cel mai bun spaiu
redus (ACP, ACM)

regruparea punctelor
n spaiu
(metode de clasificare)

1. Datele i caracteristicile lor:


Tabelul de date
Utilizatorii metodelor
factoriale pleac de la un
tablou de msuri, pe coloane
figurnd variabilele numerice
continue, liniile fiind indivizii ei
pentru care sunt msurate
variabilele xj

valoarea variabilei j
pentru individul i

Vectorul linie

vector coloan

= 1 , ,
1
=

n puncte n Rp

p puncte n Rn

1. Datele si caracteristicile lor:


Matricea ponderilor; Centrul de greutate

= 1g=(I-11D)X

1. Datele si caracteristicile lor:


Matricea dispersie covarian

Matricea dispersie-covarian:

= =

unde =

Matricea diagonal a inverselor abaterilor medii ptratice:


/
/ =

Notaii:

Matricea diagonal a inverselor dispersiilor:


/ =

Tabelul datelor centrate i reduse


j xj
x
i
= /
cu z j i =
sj

1. Datele si caracteristicile lor:


Matricea de corelatie

R matricea care grupeaz toi coeficienii de corelaie liniar ntre p variabile luate
dou :cte dou se numete matricea de corelaie:

1
R=
1

12 1
1 = 1/ 1/ =ZDZ
1

Observatie: Matricea de corelatie R este matricea dispersie covarianta S pentru date


centrate si reduse

2. Spaiul indivizilor

Fiecare individ este un punct definit prin p coordonate, element al unui spaiu
vectorial FRp denumit spaiul indivizilor.

Mulimea de n indivizi este atunci un nor de puncte n F i g este centrul de


greutate al norului

Metrica folosit pentru definirea distanei dintre doi indivizi este M = / unde /

este matricea diagonal a inverselor dispersiilor

Ineria total a norului de puncte este media ponderat a ptratelor distanelor


punctelor fa de centrul de greutate

=
=1

3. Spaiul variabilelor

Fiecare variabil xj este o list de n valori numerice. Ea va fi considerat ca un vector


xj al unui spaiu ERn numit spaiul variabilelor.

Pentru a studia deosebirile dintre variabile este folosit metrica D, matricea ponderilor.
0
p1

p2

pn
0

pi 1
i=1

Produsul scalar a dou variabile xj i xk este:


=1

care este covariana sjk dintre cele dou


variabile, dac acestea sunt centrate

Observaie: Lungimea unei variabile centrate este egal cu abaterea sa medie


ptratic

Unghiul dintre dou variabile centrate este:

< ; >
=

fiind coeficientul de corelaie liniar

S-ar putea să vă placă și