Sunteți pe pagina 1din 16

Analiza statistică multidimensională

Analiza de
corespondente
Noiembrie 2022

Titular de curs: Prof.univ.dr.Cristina BOBOC


Email: cristina.boboc@csie.ase.ro
WEB page: www.cristinaboboc.wordpress.com
Analiza statistică multidimensională

Sumar
• I. Definire şi utilizare

• II. Analiza simplă de corespondențe

• III. Analiza de corespondențe multiplă

• IV. Interpretarea axelor factoriale


Analiza statistică multidimensională

Definire și utilizare
• metodă de studiu a legăturilor existente între mai multe variabile calitative
• studiază corespondenţa între modalităţile variabilelor
• pentru 2 variabile calitative: Analiza de Corespondenţe Simplă
• pentru mai mult de două variabile calitative: Analiza de Corespondenţe Multiplă
Analiza statistică multidimensională
II. Analiza de corespondenţe simplă

• se formează tabelul de asociere N= n ij ( )


i =1, m1 , j=1, m 2
• nij – numărul observaţiilor care au modalitatea i a variabilei 1 şi modalitatea j a variabilei 2
• se construiesc matricile frecvenţelor cumulate pe linii şi frecvenţelor cumulate pe coloane:
n1. 0 0 0  n.1 0 0 0 
0 n 0 0  0 n 0 0 
D1 =   D2 =  
2 . .2
0 0  0  0 0  0 
   
0 0 0 n  0 0 0 n 2

 m1.  .m

• unde m1 numărul modalităţilor primei variabile şi ni.=  n ij


j
• unde m2 numărul modalităţilor variabilei a doua şi n.j=  n ij
i
Analiza statistică multidimensională
II. Analiza de corespondenţe simplă

• ACP pentru tabelul pofilelor linii


• tabelul de date: D1−1N
−1
• metrica: M= nD 2
• ponderile: D=D1/n

• ACP pentru tabelul pofilelor coloane


• tabelul de date: ND −2 1
−1
• metrica: M= 1nD
• ponderile: D=D2/n
Analiza statistică multidimensională
III. Analiza de corespondenţe multiplă
• Se citesc datele şi apoi se construiesc tabelele de date disjunctive X1, X2, ..., Xp. Aceste tabele au n linii şi mk
coloane, pe fiecare linie (i) existând o singură valoare diferită de zero, pe coloana corepunzătoare modalităţii
alese de individul i.
• Apoi se construieşte tabelul lui Burt, B, un tabel de contingenţă:
X1T X1 X1T X 2  X1T X p 
 T 
X 2 X1 X T2 X 2  XT2 X p 
B= 
     
XTp X1 X Tp X 2  XTp X p 

• Matricea D este tabelul diagonal de totaluri marginale ale celor m=m1+ m2+…+mp categorii:
 D1 0 0 0
0 D2 0 0 
D =
0 0  0
 
 0 0 0 D p 
Analiza statistică multidimensională
III. Analiza de corespondenţe multiplă

• Ecuaţia coordonatelor categoriilor : 1 D −1 Bu = u


1 p
• cu convenţia de normalizare : u' Du = 
np
Fie z=z1,...,zn vectorul cu n componente reprezentând coordonatele celor n indivizi pe o
axă factorială

• Ecuaţia coordonatelor indivizilor : 1 XD −1 X' z = z


p
• cu convenţia de normalizare : 1 z' z = 
n
Analiza statistică multidimensională
IV. Analiza de corespondenţe. Interpretarea procentului de inerție
explicată de axe
Analiza statistică multidimensională
IV. Analiza de corespondenţe: Interpretarea axelor factoriale
• Contribuţia unei modalități la formarea axei factoriale:
• calitatea reprezentării elementului, prin proiecţie pe axa factorială
• contribuţia categoriei j, de total nj, cu coordonata aj, pe axa factorială:
nj
(a j )2
np
CTR ( j) =

• Modalităţile interesante sunt cele care au o contribuţie superioară ponderii lor nj/np

• Contribuţia cumulată a lui Xi este:

m1 1 mi n j
CTR (Xi) =  CTR (j) =  (a j )2
j=1  j=1 np

• Contribuţiile indivizilor:
2
1 (z i )
CTRI(i)= 
n 
Analiza statistică multidimensională
IV. Analiza de corespondenţe: Interpretarea axelor factoriale

• OBSERVAȚII:

• 1. Se recomandă evitarea diferenţelor prea mari între numărul de categorii ale variabilelor Xi

• 2. La interpretarea unei axe factoriale în funcţie de contribuţia unei modalităţi active la inerţia totală a norului

proiectat se vor clasa modalităţile în ordine descrescătoare în funcţie de contribuţia lor


Analiza statistică multidimensională
IV. Analiza de corespondenţe Interpretarea axelor factoriale

• REGULI DE INTERPRETARE

• În planul Rn în norul de puncte-modalităţi, două modalităţi sunt depărtate (în sensul distanţei 2) atunci
când ele sunt foarte puţin asociate, adică ele nu au fost alese în acelaşi timp de indivizi.

• În cazul proiecţiei norului de puncte în spaţiul R2 format de axele factoriale, două modalităţi sunt foarte
apropiate atunci când ele sunt alese sau respinse în acelaşi timp de o mare parte din indivizi.

• Este posibilă reprezentarea simultană a indivizilor şi categoriilor

• Indivizii care sunt apropiaţi de anumite categorii, sunt cei care au selectat categoriile respective. Prin
această reprezentare grafică poate fi realizată o clasificare a indiviziilor şi cunoaşterea caracteristicilor
fiecărei clase. Aceasta este folositoare mai ales în cazurile în care indivizii nu sunt anonimi.
Analiza statistică multidimensională

EXEMPLU
• Observarea modului de viață al șomerilor

• Variabile:
• Variabile de opinie:
• stflife: Cat de satisfacut sunteti cu viata dvs. per total ?
• stfgov: Cat de satisfacut sunteti de actualul guvern al tarii ?
• sclmeet: Cat de des socializati cu prietenii, rudele sau colegii ?
• mainact: Principala activitate in ultimele 7 zile

• Variabile socio-demografice:
• edulvla: Care este cel mai inalt nivel de educatie atins de dvs. ?
• maritala: Statutul marital legal
• regionro: Regiunea
• gndr: sex
Analiza statistică multidimensională

EXEMPLU SAS
Analiza statistică multidimensională

EXEMPLU SAS
Analiza statistică multidimensională

EXEMPLU SAS
Analiza statistică multidimensională

EXEMPLU SAS

S-ar putea să vă placă și