Documente Academic
Documente Profesional
Documente Cultură
Scopul
Cunoa terea nodulSAS Code. poceduriidiscrim utilizat pentru Analize Discriminante (AD)i
TM implementarea codurilor utilizate n cadrul diagramelor Enterprise Miner folosind SAS SAS
Cuprins
1. ANALIZA DISCRIMINANT...........................1 1.1. Introducere.......................................1 1.2. Implementarea codurilor SAS............2 1.2.1. Importul bazei de date.....................2 1.2.2. Aplicarea procedurii discrim.............3 1.2.3. Realizarea bazei de date pentru testare.......................................................3 1.2.4. Realizarea analizei discriminante pe baza datelor test.........................................3 1.2.5. Afiarea datelor obinute..................4 1.3. Implementarea n SAS Enterprise MinerTM..................................................4
1 . A n aliza
D iscrim in an t
1.1.IN T R O D U C E R E
Analiza Discriminant (Discriminante Analyis - DA), este o tehnica de statistic multivariat frecvent utilizat pentru a construi un model /descriptiv al separrii predictiv (discriminrii) pe grupuri bazat pe variabilele predictor observate i de a clasifica fiecare observaie ntr-unul din grupuri. n Analiza Discriminant (AD) sunt utilizate mai multe atribute cantitative pentru a separa o singur variabil de clasificare. Analiza Discriminant (AD) este diferit deAnaliza Cluster cauza unor cunotine anterioare ale claselor, de obicei este necesar din un eantion din fiecare clas pentru a realiza o Analiza Discriminant. Obiectivelor principale ale Analizei Discriminante sunt: a) pentru a investiga diferene ntre grupuri,
b) pentru separarea eficient a grupurilor, c) pentru a identifica variabile importante discriminatorii, d) pentru a efectua testarea ipotezelor legate de diferenele dintre grupuri, e) pentru a clasifica noi observaii n grupuri pre-existente.
1.2.IM P L E M E N T A R E A C O D U R IL O R S A S
Fiecare coloan reprezint codificarea unei anumite caracteristici (de exemplu costul mediu al unit ii de mas calculat n patru luni consecutive) a produselor mpr ite n cinci categorii: porumb, soia, bumbac, sfecl i gru.
data Cer; title 'Analiza Discriminanta'; input Cereale $ 4-13 x1-x4 xvalues $ 14-24; datalines; Porumb 16 27 31 33 Porumb 15 23 30 30 Porumb 16 27 27 26 Porumb 18 20 25 23 Porumb 15 15 31 32 Porumb 15 32 32 15 Porumb 12 15 16 73 Soia 20 23 23 25 Soia 24 24 25 32 Soia 21 25 23 24 Soia 27 45 24 12 Soia 12 13 15 42 Soia 22 32 31 43 Bumbac 31 32 33 34 Bumbac 29 24 26 28 Bumbac 34 32 28 45 Bumbac 26 25 23 24 Bumbac 53 48 75 26 Bumbac 34 35 25 78 Sfecla 22 23 25 42 Sfecla 25 25 24 26 Sfecla 34 25 16 52 Sfecla 54 23 21 54 Sfecla 25 43 32 15 Sfecla 26 54 2 54 Grau 12 45 32 54 Grau 24 58 25 34 Grau 87 54 61 21 Grau 51 31 31 16 Grau 96 48 54 62
31 56 32 36 53 32
31 13 13 26 08 32
11 13 27 54 06 62
11 71 32 32 54 16
Observa ii
- method=normal
variaii normale din cadrul fiecrei categorii pentru a obine o funcie discriminant liniar sau ptrat.
- pool=yes
procedura discrim folose te matricea covariant cumulat n calcularea probabilitatea prioritara folosita este cea proportionala
1.2.3. Realizarea bazei de date pentru testare
data test; input Cereale $ datalines; Porumb 16 27 31 Soia 21 25 23 Bumbac 29 24 26 Sfecla 54 23 21 Grau 32 32 62 ;