Documente Academic
Documente Profesional
Documente Cultură
Analiza Cluster
Analiza Cluster
Analiza cluster are propria metodologie de grupare, dar în acelaşi timp poate să
apeleze şi la alte metode, ca de exemplu analiza componentelor principale, analiza
varianţei. Această metodă, prin obiectivul său, se aseamănă cu alte metode de analiză a
datelor, dar există şi diferenţe care justifică folosirea acesteia.
Astfel Analiza cluster seamănă destul de mult cu segmentare, care are ca obiectiv
costituirea de clase în raport cu una sau mai multe variabile de explicat. Fiecare clasă
poate fi caracterizată de o serie de variabile explicative, în special socio-demografice. În
schimb Analiza cluster va conduce la constituirea de clase omogene în raport cu toate
variabilele luate în considerare.
De asemenea analiza discriminantă vizează repartizarea unităţilor în clase
determinate de stările unei variabile nominale, de exemplu, clienţii unei societăţi pot fi
grupaţi în clienţi permanenţi sau ocazionali, un nou client, pe baza variabilelor
explicative va putea fi alocat unei anumite clase. Analiza cluster permite constituirea de
clase independent de orice grupare a priori. Astfel ea poate fi utilizată înaintea oricărei
analize discriminante pentru a confirma sau a infirma categoriile a priori stabilite.
Faţă de analiza componentelor principale care are ca scop reducerea numărului de
variabile, Analiza cluster vizează reducerea unităţilor prin gruparea cestora.
Analiza cluster acceptă în descriere atât variabile cantitative, cât şi variabile ordinale
ţi nominale, ceea ce este foarte important având în vedere numărul foarte mare de
variabile utilizate în cercetările de marketing, cât şi diversitatea lor din punctul de vedere
al formei de exprimare.
Utilizarea metodelor de clasterizare presupune parcurgerea urmatoarelor etape:
formularea problemei;
alegerea distanţei de măsurare;
alegerea procedurii de clasificare:
stabilirea numărului de segmente;
examinarea şi interpretarea profilelor segmentelor;
validarea soluţiei rezultate.
1. Formularea problemei
Încercarea de realizare a unei clasterizari poate fi formulată astfel: fiind date n unităţi
pentru fiecare dispunând de înregistrări a p variabile, trebuie să se constituie grupe de
unităţi astfel încât unităţile dintr-o grupă să semene într ele, dar săfie diferite de la o
grupă la alta, asemănarea unităţilor fiind definită plecând de la cele p variabile.
Realizarea unei clasterizari se bazează implicit pe existenţa unei grupări în cadrul
populaţiei studiate. Astfel dacă vizualizăm datele iniţiale sub forma unui nor de n puncte
într-un spaţiu cu p dimensiuni, trebuie să existe zone unde densitatea punctelor este mare,
respectiv punctele sunt apropiate unele de altele. Această ipoteza trebuie verificată
înaintea efectuării unei clasificări.
Ca atare cea mai mare importanţă în această etapă trebuie acordată alegerii
variabilelor pe baza cărora se va efectua Analiza cluster . Este de dorit ca setul de
variabile selectat să descrie asemănarea dintre unitaţi, în termeni ce sunt relevanţi pentru
problema studiată. Variabilele se vor alege pe baza unor cercetări, a unor testări de
ipoteze sau pe baza intuiţiei cercetătorilor.
2. Alegerea distanţei de măsurare
Analiza cluster prezintă marele avantaj că permite analiza variabilelor cantitative cât
şi a celor calitative. Alegerea distanţei se face în funcţie de tipul variabilelor supuse
studiului. Dacă ne situăm în contextul că avem n unităţi caracterizate de p variabile,
pentru măsurarea apropierii dintre unităţi se folosesc două categorii de indicatori, şi
anume :
Distanţa
Indicele de similaritate
Alegerea unuia sau a altuia depinde în primul rând de tipul de variabile utilizate în
clasificare, cât şi de constrângerile impuse de proprietăţile indicatorilor.
In cazul variabilelor cantitative se va utiliza una din urmatoarele distante:
- distanta euclidiana,