Documente Academic
Documente Profesional
Documente Cultură
Analiza Cluster
Analiza Cluster
Analiza cluster are propria metodologie de grupare, dar n acelai timp poate s
apeleze i la alte metode, ca de exemplu analiza componentelor principale, analiza
varianei. Aceast metod, prin obiectivul su, se aseamn cu alte metode de analiz a
datelor, dar exist i diferene care justific folosirea acesteia.
Astfel Analiza cluster seamn destul de mult cu segmentare, care are ca obiectiv
costituirea de clase n raport cu una sau mai multe variabile de explicat. Fiecare clas
poate fi caracterizat de o serie de variabile explicative, n special socio-demografice. n
schimb Analiza cluster va conduce la constituirea de clase omogene n raport cu toate
variabilele luate n considerare.
De asemenea analiza discriminant vizeaz repartizarea unitilor n clase
determinate de strile unei variabile nominale, de exemplu, clienii unei societi pot fi
grupai n clieni permaneni sau ocazionali, un nou client, pe baza variabilelor
explicative va putea fi alocat unei anumite clase. Analiza cluster permite constituirea de
clase independent de orice grupare a priori. Astfel ea poate fi utilizat naintea oricrei
analize discriminante pentru a confirma sau a infirma categoriile a priori stabilite.
Fa de analiza componentelor principale care are ca scop reducerea numrului de
variabile, Analiza cluster vizeaz reducerea unitilor prin gruparea cestora.
Analiza cluster accept n descriere att variabile cantitative, ct i variabile ordinale
i nominale, ceea ce este foarte important avnd n vedere numrul foarte mare de
variabile utilizate n cercetrile de marketing, ct i diversitatea lor din punctul de vedere
al formei de exprimare.
Utilizarea metodelor de clasterizare presupune parcurgerea urmatoarelor etape:
formularea problemei;
alegerea distanei de msurare;
alegerea procedurii de clasificare:
stabilirea numrului de segmente;
examinarea i interpretarea profilelor segmentelor;
validarea soluiei rezultate.
1. Formularea problemei
ncercarea de realizare a unei clasterizari poate fi formulat astfel: fiind date n uniti
pentru fiecare dispunnd de nregistrri a p variabile, trebuie s se constituie grupe de
uniti astfel nct unitile dintr-o grup s semene ntr ele, dar sfie diferite de la o
grup la alta, asemnarea unitilor fiind definit plecnd de la cele p variabile.
Realizarea unei clasterizari se bazeaz implicit pe existena unei grupri n cadrul
populaiei studiate. Astfel dac vizualizm datele iniiale sub forma unui nor de n puncte
ntr-un spaiu cu p dimensiuni, trebuie s existe zone unde densitatea punctelor este mare,
respectiv punctele sunt apropiate unele de altele. Aceast ipoteza trebuie verificat
naintea efecturii unei clasificri.
Ca atare cea mai mare importan n aceast etap trebuie acordat alegerii
variabilelor pe baza crora se va efectua Analiza cluster . Este de dorit ca setul de
variabile selectat s descrie asemnarea dintre unitai, n termeni ce sunt relevani pentru
problema studiat. Variabilele se vor alege pe baza unor cercetri, a unor testri de
ipoteze sau pe baza intuiiei cercettorilor.
2. Alegerea distanei de msurare
Analiza cluster prezint marele avantaj c permite analiza variabilelor cantitative ct
i a celor calitative. Alegerea distanei se face n funcie de tipul variabilelor supuse
studiului. Dac ne situm n contextul c avem n uniti caracterizate de p variabile,
pentru msurarea apropierii dintre uniti se folosesc dou categorii de indicatori, i
anume :
Distana
Indicele de similaritate
Alegerea unuia sau a altuia depinde n primul rnd de tipul de variabile utilizate n
clasificare, ct i de constrngerile impuse de proprietile indicatorilor.
In cazul variabilelor cantitative se va utiliza una din urmatoarele distante:
- distanta euclidiana,
X
p
2
d i, i ' ik X i 'k
k 1