Sunteți pe pagina 1din 8

Assignment 6

Nama : Nadia
NIM : 1703122194
Mata Kuliah : Analisis Data Kategorik

SOAL

1. Lakukan analisis denagan data turtle menggunakan PCA. Lakukan dengan coding;
a. SAS
b. R Studio

2. Buat summary tentang Linear Discriminat, kemudian analysis, gunakan contoh data ikan
salmon di buku John Wiley. Cantumkan nama penulis jika mengambil rujukan pada paper
orang lain.
Assignment 6

JAWAB

1. Lebih jelasnya kita lihat permasalahan untuk soal no 1.


Jolicoeur dan Mosimann mempelajari mengenai hubungan antara ukuran dan bentuk
sejenis kura-kura. Pada penelitiannya mereka mengambil sampel sebanyak 24 kura-kura
jantan dan 24 kura-kura betina dan diukur panjang, lebar dan tinggi kura-kura tersebut.
(data diambil dari Johnson & Wichern, 2002 halaman 339)

a. Kode SAS
Sebelum melakukan analisis kita input dulu data diatas menggunakan software SAS,
dan kita lanjutkan kode nya seperti berikut.

Lampiran 1. Kode dari SAS


data lengkap;
input f1 f2 f3 length width height;
cards;
98 81 38 93 74 37
103 84 38 94 78 35
103 86 42 96 80 35
105 86 42 101 84 39
109 88 44 102 85 38
Assignment 6

123 92 50 103 81 37
123 95 46 104 83 39
133 99 51 106 83 39
133 102 51 107 82 38
133 102 51 112 89 40
134 100 48 113 88 40
136 102 49 114 86 40
138 98 51 116 90 43
138 99 51 117 90 41
141 105 53 117 91 41
147 108 57 119 93 41
149 107 55 120 89 40
153 107 56 120 93 44
155 115 63 121 95 42
155 117 60 125 93 45
158 115 62 127 96 45
159 118 63 128 95 45
162 124 61 131 95 46
177 132 67 135 106 47
;
data baru;
set lengkap;
drop f1 f2 f3;
run;
roc print data=baru;
run;

proc princomp data=baru cov n=3


out=scores prefix=prin;
var length width height;
run;
proc print data=baru; run;
proc plot data=baru ;
plot prin1*prin2 / hpos=56;
plot prin1*(length width height)=id / hpos=56; run;
proc corr data=baru;
var prin1 prin2 prin3 length width height;
run;
proc princomp data=baru out=pcorr
prefix=pcorr; var length width height;
run;
proc plot data=pcorr;
plot pcorr1*pcorr2=id / hpos=56;
run
;
Assignment 6
Assignment 6
Assignment 6

b. Kode R

Sebelum melakukan analisis dengan definisikan variabel x1 = length, x2 = width, x3 =


height dan X4 = sex kemudian input dulu data tersebut menggunakan software R sebagai
berikut.

Lampiran 1.1 Input data turtle

> x1<-c(98,103,103,105,109,123,123,133,133,133,134,136,138,138,141,147,
149,153,155,155,158,159,162,177,93,94,96,101,102,103,104,106,107,112,11
3,114,116,117,117,119,120,120,121,125,127,128,131,135)
> x2<-c(81,84,86,86,88,92,95,99,102,102,100,102,98,99,105,108,107,107,1
15,117,115,118,124,132,74,78,80,84,85,81,83,83,82,89,88,86,90,90,91,93,
89,93,95,93,96,95,95,106)
> x3<-c(38,38,42,42,44,50,46,51,51,51,48,49,51,51,53,57,55,56,63,60,62,
63,61,67,37,35,35,39,38,37,39,39,38,40,40,40,43,41,41,41,40,44,42,45,45
,45,46,47)
> x4<-rep(c(”F”,”M”),each=24)

Lakukan transformasi sederhana terhadap data (x1, x2 dan x3) tersebut menggunakan log
seperti pada Lampiran 1.2

Lampiran 1.2 Transformasi data


> x1t<-log(x1)
> x2t<-log(x2)
> x3t<-log(x3)
> y<-data.frame(x1t,x2t,x3t)
> Y<-y[25:48,]

Selanjutny akita lakukan analisis data kura-kura jantan menggunakan fungsi princom(),
fungsi princomp menganalisis komponen utama dari data berupa matriks numerik dan
menghasilkan nilai-nilai berupa suatu objek dalam kelas princomp. Kode nya seperti pada
Lampiran 1.3 berikut;
Lampiran 1.3 Analisis dengan Fungsi princomp
Turtle<-princomp(Y, cor=FALSE)
summary(turtle)

Lampiran 1.4 Output


Importance of components:
Comp.1 Comp.2 Comp.3
Standard deviation 0.1494402 0.02394526 0.01856994
Proportion of Variance 0.9605077 0.02466069 0.01483157
Cumulative Proportion 0.9605077 0.98516843 1.00000000
Assignment 6

Interpretasi Output

Berdasatkan output pada Lampiran 1.4 Terlihat dari proporsi varians kumulatif
Komponen pertama dapat menjelaskan 96% total varians dan bila ditambahkan
komponen kedua menjadi 98%. Artinya apabila kita hanya mengambil satu komponen
saja yaitu komponen pertama sudah mencukupi. Nilai simpangan baku (standard
deviation) pada baris pertama hasil diatas diperoleh dari akar positif nilai eigen (eigen
value) matriks kovarians dari log(y1), log(y2) dan log(y3).
Assignment 6

2. Summary

Analisis diskriminan linear (linear discriminant analysis, disingkat LDA) adalah


generalisasi diskriminan linear Fisher, yaitu sebuah metode yang digunakan dalam ilmu
statistika, pengenalan pola dan pembelajaran mesin untuk mencari kombinasi linear fitur
yang menjadi ciri atau yang memisahkan dua atau beberapa objek atau peristiwa. Kombinasi
yang diperoleh dapat dijadikan pengklasifikasi linear, atau biasanya digunakan untuk proses
reduksi dimensionalitas sebelum pengklasifikasian.

Dalam buku (fukunaga), Linear Discriminat Analysis merupakan salah satu analisis
diskriminan dengan statistic multivariate yang terkait dengan pemisahan (separating) atau
alokasi/klasifikasi sekelompok objek ke dalam kelompok yang sudah didefinisikan terlebih
dahulu. Tujuan pengenalan objek, metode ini mencoba menemukan suatu diskriminan atau
kelompok yang nilainya secara numeris sedemikian sehingga mampu memisahkan objek
yang karakterisasinya telah diketahui. Tujuan dari klasifikasi objek, pada metode ini
mensortir objek (observasi) ke dalam dua atau lebih (Fukunaga, 1990).

Analisis diskriminan merupakan salah satu teknik statistik yang bisa digunakan pada
hubungan despensi (hubungan antar variabel yang bisa 22 membedakan varabel respon dan
variabel penjelas). Variabel respon biasanya berupa data kualtitatif sedangkan variabel
penjelas berupa data kuantitatif (Varmuza, 2002). Asumsi-asumsi analisis diskriminan dalam
tiap kelompok:

1. Variabel bebas berdistribusi normal multivariat


2. Matrik kovarien variabel bebas sama untuk setiap kelompok

Sumber;

Fukunaga,K1990.Introduction to Statistical Pattern RecognitonSecond.Boston:


Harcourt BraceJovanovich

https://id.wikipedia.org/wiki/Analisis_diskriminan_linear
diakses pada tanggal 22/12/2019 pukul 23.33 WIB
https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=2ahUKEwjh
x62X18nmAhXEX3wKHS0LBfwQFjAAegQIAhAC&url=http%3A%2F%2Fetheses.uin-
malang.ac.id%2F14217%2F1%2F14640001.pdf&usg=AOvVaw0koZ0fqRnddArtEWn3QoaI
diakses pada tanggal 22/12/2019 pukul 23.35 WIB