Sunteți pe pagina 1din 4

Laborator 6 Analiza discriminant.

Scopul
Cunoa terea nodulSAS Code. poceduriidiscrim utilizat pentru Analize Discriminante (AD)i
TM implementarea codurilor utilizate n cadrul diagramelor Enterprise Miner folosind SAS SAS

Cuprins
1. ANALIZA DISCRIMINANT...........................1 1.1. Introducere.......................................1 1.2. Implementarea codurilor SAS............2 1.2.1. Importul bazei de date.....................2 1.2.2. Aplicarea procedurii discrim.............3 1.2.3. Realizarea bazei de date pentru testare.......................................................3 1.2.4. Realizarea analizei discriminante pe baza datelor test.........................................3 1.2.5. Afiarea datelor obinute..................4 1.3. Implementarea n SAS Enterprise MinerTM..................................................4

1 . A n aliza

D iscrim in an t

1.1.IN T R O D U C E R E

Analiza Discriminant (Discriminante Analyis - DA), este o tehnica de statistic multivariat frecvent utilizat pentru a construi un model /descriptiv al separrii predictiv (discriminrii) pe grupuri bazat pe variabilele predictor observate i de a clasifica fiecare observaie ntr-unul din grupuri. n Analiza Discriminant (AD) sunt utilizate mai multe atribute cantitative pentru a separa o singur variabil de clasificare. Analiza Discriminant (AD) este diferit deAnaliza Cluster cauza unor cunotine anterioare ale claselor, de obicei este necesar din un eantion din fiecare clas pentru a realiza o Analiza Discriminant. Obiectivelor principale ale Analizei Discriminante sunt: a) pentru a investiga diferene ntre grupuri,

b) pentru separarea eficient a grupurilor, c) pentru a identifica variabile importante discriminatorii, d) pentru a efectua testarea ipotezelor legate de diferenele dintre grupuri, e) pentru a clasifica noi observaii n grupuri pre-existente.

1.2.IM P L E M E N T A R E A C O D U R IL O R S A S

1.2.1. Importul bazei de date

Fiecare coloan reprezint codificarea unei anumite caracteristici (de exemplu costul mediu al unit ii de mas calculat n patru luni consecutive) a produselor mpr ite n cinci categorii: porumb, soia, bumbac, sfecl i gru.
data Cer; title 'Analiza Discriminanta'; input Cereale $ 4-13 x1-x4 xvalues $ 14-24; datalines; Porumb 16 27 31 33 Porumb 15 23 30 30 Porumb 16 27 27 26 Porumb 18 20 25 23 Porumb 15 15 31 32 Porumb 15 32 32 15 Porumb 12 15 16 73 Soia 20 23 23 25 Soia 24 24 25 32 Soia 21 25 23 24 Soia 27 45 24 12 Soia 12 13 15 42 Soia 22 32 31 43 Bumbac 31 32 33 34 Bumbac 29 24 26 28 Bumbac 34 32 28 45 Bumbac 26 25 23 24 Bumbac 53 48 75 26 Bumbac 34 35 25 78 Sfecla 22 23 25 42 Sfecla 25 25 24 26 Sfecla 34 25 16 52 Sfecla 54 23 21 54 Sfecla 25 43 32 15 Sfecla 26 54 2 54 Grau 12 45 32 54 Grau 24 58 25 34 Grau 87 54 61 21 Grau 51 31 31 16 Grau 96 48 54 62

Grau Grau Grau Grau Grau Grau ;

31 56 32 36 53 32

31 13 13 26 08 32

11 13 27 54 06 62

11 71 32 32 54 16

1.2.2. Aplicarea procedurii discrim


proc discrim data=Cer outstat=StatCer method=normal pool=yes list crossvalidate; class Cereale; priors prop; id xvalues; var x1-x4; title2 'Utilizarea functiei discriminante liniare'; run;

Observa ii
- method=normal

se utilizeaz o metod parametric bazat pe o distribuie cu mai multe

variaii normale din cadrul fiecrei categorii pentru a obine o funcie discriminant liniar sau ptrat.
- pool=yes

procedura discrim folose te matricea covariant cumulat n calcularea probabilitatea prioritara folosita este cea proportionala
1.2.3. Realizarea bazei de date pentru testare

(generalizate) distan elor ptratice.


- priors prop

data test; input Cereale $ datalines; Porumb 16 27 31 Soia 21 25 23 Bumbac 29 24 26 Sfecla 54 23 21 Grau 32 32 62 ;

1-10 x1-x4 xvalues $ 11-21; 33 24 28 54 16

1.2.4. Realizarea analizei discriminante pe baza datelor test


proc discrim data=Statcer testdata=test testout=Outcer testlist; class Cereale; testid xvalues; var x1-x4; title2 'Classificarea datelor de test'; run;

1.2.5. Afiarea datelor obinute


proc print data=Outcer; title2 'Afisarea datelor'; run;
T 1.3.IM P L E M E N T A R E A N E A S E R P R IS E M INME R SNT

Se realizeaza diagrama din figura de mai jos si se implementeaza 1.2.1 si 1.2.2.

S-ar putea să vă placă și