Sunteți pe pagina 1din 25

Analiza discriminanta

Analiza Discriminanta se foloseste in mai


multe domenii cum ar fi: Medicina, Marketing,
Arheologie, Meteorologie etc.
Aceasta analiza ajuta la perfectionarea in
multe domenii.
Analiza discriminant este o metoda ce
face parte din grupa metodelor explicative de
analiz a datelor. Ea utilizeaz o variabil de
explicat (Y) i mai multe variabile explicative
(X1, X2,,Xp) cantitative sau binare.
Analiza are ca principal avantaj ca nu
lucreaza cu elemente medii, generatoare de
erori. Tehnica de baza a analizei este estimarea
pozitiei unui element fata de o linie care separa
cel mai bine doua clase de populatii distincte.
n analiza discriminant se disting dou
aspecte:
a) descriptiv: se caut combinaiile liniare de
variabile care permit mprirea cel mai bine
posibil n cele k categorii i dau o reprezentare
grafic (ca n analizafactorial), care ine
seama cel mai bine de aceast mprire.
b) decizional: un nou individ apare, pentru care
se cunosc valorile predictorilor.
Cu ajutorul metodei se pot:
- face estimatii asupra apartenentei unor
elemente la una sau mai multe categorii;
- se poate testa daca grupurile dintr-un esantion
apar intr-o singura populatie sau in mai multe.
Scop identificarea functiilor (variabilelor latente)
care permit predictia apartenentei de grup.
Este utila :
pentru a defini profilul unei tipologii (clasificari)
functie de un set de variabile cantitative,
regrupate in factori;
pentru a permite atribuirea unor noi cazuri la o
clasificare predeterminata careia i pot fi asociate
functii de discriminare.
Principiile pe baza carora functioneaza metoda
sunt o combinatie ntre ANOVA , regresie
multipla si factoriala.
Algoritmul asociat analizei discriminante are ca
secvente esentiale:
calcularea coeficientilor pentru functiile de
clasificare (discriminare);
pentru fiecare caz se calculeaza un scor de
clasificare corespunzator fiecarei functii de
discriminare;
cazul se atribuie grupei pentru care scorul de
clasificare este maxim;
comparatia intre clasificarile corecte (teoretic
plasate n aceeasi clasa n care cazul a fost
empiric identificat) si cele incorecte indica
relevanta variabilelor de discriminare.
n concluzie analiza discriminant are trei
obiective, respectiv:
S determine variabilele explicative care
contribuie cel mai mult la diferenierea claselor
definite de variabila de explicat, astfel se
identific ponderea influenei variabilelor
explicative n variaia variabilei de explicat
construind mai multe combinaii liniare, alegnd-
o pe cea mai bun.
De exemplu, o societate productoare, are
informaii privind distribuitorii si, care sunt
mprii n 3 grupe in funcie de cantitatea pe
care o cumpr lunar, astfel: 1-cumpr in
cantiti mici, 2-cumpr in cantiti medii, 3-
cumpr in cantiti mari. Se impune
identificarea variabilelor ce conduc la aceast
difereniere, cum ar fi cifra de afaceri, mrimea
forei de vnzare, numr de ani de activitate n
acest domeniu etc.
S se construiasc un spaiu discriminant . n
cazul analizei discriminante simpl (Y are
dou stri) se determin o ax discriminant Z
care explic apartenena unei uniti la o clas
sau alta. n cazul analizei discriminante
multipl se determin mai multe combinaii
liniare independente (axe discriminante) de
variabile explicative i trebuie analizat spaiu
determinat de acele axe care separ cel mai
bine unitile studiate, in clasele determinate
de strile variabilei Y.
n exemplul prezentat vom avea dou funcii
discriminante, dar trebuie s le cutm pe acelea
care repartizeaz ct mai exact unitatile
distribuitoare n cele 3 grupe. Aprecierea
calitii discriminrii se realizeaz cu ajutorul
scorului discriminant (acesta trebuie s fie ct
mai aproape de 1).
S repartizeze la o clas existent unitile ce nu
au fost clasate. Respectiv, cunoscnd nivelul
variabilelor explicative i utiliznd funciile
discriminante vor fi repartizate noile uniti in
clasele deja formate. Aceast se poate realiza
prin dou procedee: unul determinist, care
repartizeaz unitatea la clasa pentru care
distana la centroid este cea mai mic i unul
probabilist, unde se calculeaz probabiliti de
apartenen la diferite clase, unitatea se aloc la
clasa care are probabilitatea cea mai mare.
Analiza Discriminanta

Este utilizata pentru a prezice daca un


angajat este sau nu fumator
Variabilele predictor:
Varsta
Numarul de zile in care a absentat in anul
precedent
Conceptul de sine
Anxietate
Atitudinea anti-fumat la locul de munca
Pasii:
Grupurile difera foarte mult intre ele
din punct de vedere al
caracteristicilor studiate. Variabilele
independente exercita o influenta
semnificativa asupra celei
dependente
In acest caz log deterninat
sunt similari.
Nr max de functii = nr de stari var dep 1 => o
Modelul explica
singura functie
64,32% din
informatie.

Indica o semnificatie ridicata a


35,6% proportia
functiei.
variabilelor totale
neexplicate.
Arata contributia unica a
fiecarui predictor si furnizeaza
informatii asupra importantei
relative a fiecarei variabile.

Conceptul de sine cel mai


puternic, urmat de anxietate.
Nefumatorii au o medie de
1,125, in timp ce fumatorii au o
medie de -1,598.
Arata faptul ca 91,8% din respondenti au fost clasati corect in cele doua grupe
de fumatori si nefumatori. Nefumatorii au fost prezisi cu mai multa acuratete
(92,6%) decat fumatorii (90,6%).
Histograma:
Concluzii:
Diferentele semnificative ale mediilor au fost observate
pentru toti predictorii;
In timp ce log determinants au fost similari, Boxs M indica
faptul ca ipoteza nula a fost respinsa, dar avand in vedere
ca avem o baza de date mare, aceasta problema nu este
tocmai importanta;
Functia discriminanta arata o asociere semnificativa intre
grupe si toti predictorii, varianta intre grupe fiind de
64,32%.
Cu toate ca tabelul: structure matrix ne prezinta doar 2
predictori ca fiind importanti conceptul de sine (0.76) si
anxietatea (-0.527), 91,8% din totalul respondentilor au fost
corect clasificati.
Va multumim!!!

Buchmuller
Melinda
Georgiu Monica
Negrea Alina