Documente Academic
Documente Profesional
Documente Cultură
Analiza corespondenţelor
NOTAȚII
- volumul eşantionului utilizat este n
- matricea inițială a frecvenţelor va fi compusă din elemente nij . –
- 2 variabile catgoriale, prima cu I categorii iar a doua cu J categorii,
această matrice va avea I linii și J coloane. Analiza se dezvoltă pe o
matrice a corespondențelor, notată P, ale cărei elemente se obţin
folosind relaţia:
nij
pij =
n
Capitolul 3, Analiza datelor, 2019
I n. j
p. j = pij = = cj
i =1 n
Ipoteza nulă a testului chi pătrat, conform căreia cele două variabile
categoriale analizate sunt independente, se scrie astfel:
pij = rc
i j
Capitolul 3, Analiza datelor, 2019
( n − n ˆ ) 2
2 = ij ij
i j nˆij
unde
ni. n. j
nˆij =
n
Capitolul 3, Analiza datelor, 2019
2 ( pij − pˆ ij ) 2
=
n i j pˆ ij
unde:
𝑆 = 𝑈Σ𝑉 𝑇
𝑆𝑆 𝑇 = 𝑈Σ𝑉 𝑇 𝑉Σ𝑈 𝑇 = 𝑈Σ 2 𝑈 𝑇
Pătratul valorilor singulare din matricea Σ 2 reprezintă valorile proprii ale
matricii 𝑆 𝑇 𝑆 sau 𝑆𝑆 𝑇 redate în matricea diagonală Λ. Aceste valori 𝜆 se
numesc inerţii principale iar suma lor reprezintă inerţia totală.
Pentru o hartă cu două dimensiuni se vor folosi primele două coloane ale
matricilor F şi G şi procentul inerţiei explicate de cele 2 dimensiuni va fi
(𝜆1 + 𝜆2 )⁄𝑖𝑛𝑒𝑟ţ𝑖𝑒 𝑡𝑜𝑡𝑎𝑙ă.
Capitolul 3, Analiza datelor, 2019
EXEMPLU
Frecvenţe relative
UK SUA Rusia Spania Franta Medie
1 29.64 34.84 58.96 17.72 28.19 36.37
2 42.40 41.03 30.94 56.35 36.91 40.34
3 22.81 20.64 8.23 18.34 23.55 17.61
4 4.38 2.44 1.23 6.35 3.86 3.38
5 0.77 1.05 0.64 1.23 7.49 2.31
Total 100.0 100.0 100.0 100.0 100.0 100.0
Capitolul 3, Analiza datelor, 2019
Referinţe
Greenacre, M., & Blasius, J. (2006). Multiple correspondence analysis and related methods. Chapman and Hall/CRC.
Nenadic, O., Greenacre, M. (2007) Correspondence Analysis in R, with two- and three-dimensional graphics: The ca package. Journal of
Statistical Software 20(3):1-13.