Sunteți pe pagina 1din 2

ANDAS: Analiza datelor sociale - optional SAS, an III

L10. Analiza discriminanta AD

Scop – identificarea functiilor (variabilelor latente) care permit predictia apartenentei de grup.
Este utila :
• pentru a defini profilul unei tipologii (clasificari) functie de un set de variabile cantitative,
regrupate in factori
• pentru a permite atribuirea unor noi cazuri la o clasificare predeterminata careia îi pot fi
asociate functii de discriminare.

Principiile pe baza carora functioneaza metoda sunt o combinatie între ANOVA , regresie
multipla si factoriala.

Algoritmul asociat are ca secvente esentiale:


• calcularea coeficientilor pentru functiile de clasificare (discriminare)
• pentru fiecare caz se calculeaza un scor de clasificare corespunzator fiecarei functii de
discriminare
• Cazul se atribuie grupei pentru care scorul de clasificare este maxim
• Comparatia intre clasificarile „corecte” (teoretic plasate în aceeasi clasa în care cazul a fost
empiric identificat) si cele incorecte indica relevanta variabilelor de discriminare.

Premise ale aplicarii AD „ Cases should be independent. Predictor variables should have a
multivariate normaldistribution, and within-group variance-covariance matrices should be equal
across groups. Group membership is assumed to be mutually exclusive (that is, no case belongs to
more than one group) and collectively exhaustive (that is, all cases are members of a group).”1
(SPSS15UG:386)

Termeni cheie în AD

functie discriminanta combinatie liniara de variabile care functioneaza ca predictori


ai apartenentei de grup. Este similara cu structura si functiile
pe care le are partea dreapta a unei ecuatii de regresie
multipla. Numarul de functii este mai mic cu 1 fata de
numarul de grupari din variabila dependenta (cea care
defineste clasele). Functiile de discriminare permit realizarea
unor distante maxime între grupari.
coeficientii functiei pentru cazul predictorilor masurati în unitati diferite este
canonice standardizate de indicata selectarea optiunii de coeficienti standardizati . Sunt
discriminare echivalenti ca semnificatie cu coeficientii beta din regresia
multipla 2
coeficientii structurali au semnificatia coeficien’ilor de corela’ie din matricea
(Structure coefficients) structurala pentru factorialele oblice. Etichetarea functiilor de
discriminare se face prin raportare la coeficientii structurali
semnificativi/maximi
indicele lambda Wilks este calculat pentru fiecare predictor ca raport între variatia

1
Citatele în engleza sunt din SPSS Base 15.0 User’s Guide , SPSS Inc. 2006 , desemnat în
continuare în text prin SPSS15UG
2
Pentru comentarii la un output de AD in SPSS vezi David Garsson Discriminant Function Analysis
(Three Groups): SPSS Output , la aderesa http://www2.chass.ncsu.edu/garson/pa765/discrim3.htm,
consultat decembrie 2006

Dumitru Sandu 12/31/2006


intragrupala si variatia totala . Variaza între 0 si 1. Cu cât are o
valoare mai apropiata de 0 cu atât predictorul este mai
important pentru discriminare. Complementul la 1 pentru
lambda este egal cu eta patrat din ANOVA.
corelatia canonica este o masura a gradului de asociere între scorul de
discriminare si apartenenta la grupa. Pentru numai doua grupe
are semnificatia corelatiei dintre scor si variabila fictiva a
apartenentei la grup. Pentru mai mult de doua grupe are
semnificatia coeficientului eta ca radacina patrata din raportul
variatiei intergrupale fata de variatia totala
eigenvaloarea raport între variatia intergrupala si cea intragrupala
Testul casetei M (Box’s M) masura a egalitatii matricilor de covarianta specifice
grupurilor. O valoare p mai mica decât 0.05 indica incalcarea
premisei egalitatii covariantelor de grup

Referinte

David Garsson Discriminant Function Analysis (Three Groups): SPSS Output , la aderesa
http://www2.chass.ncsu.edu/garson/pa765/discrim3.htm, consultat decembrie 2006
Sandu, Dumitru, 1996. Sociologia tranzitiei. Valori si tipuri sociale în România. Bucuresti: Staff,
cap. 5
SPSS Base 15.0 User’s Guide , SPSS Inc. 2006

Dumitru Sandu 12/31/2006