Documente Academic
Documente Profesional
Documente Cultură
x1 x2 1 2 … j … q Total
1 k11 k12 … k1 j … k 1q k1
2 k 21 k 22 … k2 j … k 2q k 2
… … … … … … … …
i k i1 ki2 … k ij … k iq k i
… … … … … … … …
p k p1 k p2 … k pj … k pq k p
Total k 1 k 2 … k j … k q k k
Tabelul 2.1.a. Tabelul de contingenţă de dimensiune p q
2 Analiza Datelor. Teorie şi aplicaţii
unde:
q p p q
k i k ij ; k j k ij şi k k k ij .
j 1 i 1 i 1 j 1
M ( xi , wi ) / i 1, m
unde cu M s-a notat norul de puncte.
Definiţia 2.1. Se numeşte baricentrul punctelor xi , afectate de ponderile wi ,
sau centrul de greutate al norului de puncte M, care coincide de fapt cu vectorul
mediilor aritmetice ale celor n-variabile:
Capitolul 2. Reprezentări, descriptori şi metrici la nivelul datelor multidimensionale 3
t
m 1
t
xi wi
xi1 im1
2 xi2 wi
xi i 1
... ...
m m
m j ~
g xi wi xij wi xi wi X t W 1
i 1 i 1
... i 1
n 1 m ...
xi x n 1 w
xn i 1
i i
i m n
xi wi
i 1
~
xi j xij x j , cu i 1, m , j 1, n
X ~
xi j i 1,m xij x j i 1,m
~
j 1, n j 1, n
1
A se vedea şi Capitolul 4, & 2.1.2.1. Centrarea datelor primare.
4 Analiza Datelor. Teorie şi aplicaţii
unde:
2
x x j wi
m
S(x j ) i
j
i 1
1
W 1 diag j
, j 1, n este matricea diagonală a inverselor abaterilor
S S(x )
standard.
i 1
t
~ ~~ ~ ~ ~ ˆt ~ˆ
R W 1 VW 1 W 1 X t WXW 1 XW 1 W XW 1
X WX
S S S S S S
unde:
v jk
r jk , cu j , k 1, n . (forma analitică a elementelor matricei R)
S(x ) S(xk )
j
i 1
x x j wi
m
2
S(x j ) i
j
i 1
sau explicit:
Capitolul 2. Reprezentări, descriptori şi metrici la nivelul datelor multidimensionale 5
x x j xik x k wi
m
j
v jk i
r jk i 1
S(x j ) S(xk )
x x j wi x x k wi
m m
j 2 k 2
i i
i 1 i 1
x x j xik x k
m
j
v jk i
r jk i 1
S(x j ) S(xk )
x xj x xk
m m
j 2 k 2
i i
i 1 i 1
x y x
unde:
“ ” - reprezintă semnul pentru compunere
Observaţie: Avem astfel că noua variabilă este definită de forma:
x : E
cu proprietatea că:
6 Analiza Datelor. Teorie şi aplicaţii
x y x
y
E
Figura 2.1. Schema de obţinere a noii variabile
unde:
E - este înzestrată cu structura S;
E - este înzestrată cu structura S ;
- aplicaţia s : R ;
() ( , ) , rezultă că s ( , ) s ( , ) ;
s ( , ) s ( , ) s ( , ) .
- aplicaţia d S : R ;
Capitolul 2. Reprezentări, descriptori şi metrici la nivelul datelor multidimensionale 7
() ( , ) , rezultă că d S ( , ) d S ( , ) ;
- () , rezultă că d S ( , ) 0 .
t
xi1
2
xi
...
xi xi j
...
n 1
xi
xn
i
x i xi1 x i2 ... x ij ... x in 1
x in , cu i 1, m
x1j
j
x2
...
x xi j
j
...
j
xm1
xj
m
Definiţia 2.12.
1. Se spune că doi indivizi i , k au acelaşi profil dacă:
2
A se vedea şi 2.5.1. Distanţa euclidiană, & Distanţa euclidiană în spaţiul variabilelor
Capitolul 2. Reprezentări, descriptori şi metrici la nivelul datelor multidimensionale 9
xij x kj
, () j 1, n
xi x k
xij xik
, () i 1, m
xj xk
1/ p
n
d Min ( xi , x k ) xij x kj
p
j 1
unde:
t
xl1
2
xl
...
xl xlj , cu l i, k , iar i, k 1, m
...
n 1
xl
xn
l
1/ p
n
d Ceb ( xi , x k ) lim xij x kj
p
max xij x kj
p
j 1 j
x x
n n
j 2 j 2
i k
j 1 j 1
d cos ( xi , x k ) n
x j 1
i
j
x kj
- forma 1:
n xij x kj
d Cam ( xi , x k )
1
j 1 xij x kj
- forma 2:
n xij x kj
d Cam ( xi , x k )
2
j 1 xij x kj
d : G1 G2 R
d (G1 , G 2 ) min d ( i , j )
i G1
j G2
d (G1 , G 2 ) max d ( i , j )
i G1
j G2
d (G1 , G 2 ) d ( ,
i K1
i j )
j K 2
d ( , )
K j i G j
i
d (G1 , G2 ) d ( K 1 , K 2 ) d ( ,
i K1
i j )
j K 2
unde:
K j - reprezintă nucleul mulţimii de indivizi G j , cu cardK 1 cardK 2 .
3
Mulţimi G j - ce formează grupe de indivizi.
12 Analiza Datelor. Teorie şi aplicaţii
d (G1 , G 2 ) d ( g 1 , g 2 )
unde g j - reprezintă punctul ale cărui coordonate sunt mediile celor m indivizi din
grupul G j respectiv, cu j 1,2 .
w (G ) w( )
G
E E1 E 2 E3 ... E n .
mG mG mG
I ( G j ) I (G j ) d ( g (G j ), x ( )) w(G j ) (teorema lui Huygens)
j 1
j 1 j 1
unde:
G j - reprezintă părţi disjuncte ale mulţimii ;
mG - reprezintă numărul de părţi G j .