Sunteți pe pagina 1din 22

PAPPER

“ANALISIS DISKRIMINAN”

Disusun oleh:
Mashadi Dwi M.
0910950049

PROGRAM STUDI STATISTIKA


JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS BRAWIJAYA
MALANG
2015
BAB I
PENDAHULUAN

1.1 Latar Belakang

Salah satu analisis statistik peubah ganda yang bertujuan untuk membagi beberapa
kelompok data yang telah terkelompokkan dengan membentuk fungsi diskriminan, adalah
analisis diskriminan. Analisis diskriminan dapat digunakan untuk menganalisis hubungan antar
peubah yang telah diketahui mana peubah respon dan peubah prediktornya. Dapat juga
digunakan untuk menganalisis data dimana peubah respon berupa data kualitatif, sedangkan
peubah prediktornya berupa data kuantitatif.
Pada analisis diskriminan peubah respon merupakan data kategorik nominal dan ordinal,
sedangkan peubah prediktor berupa data interval atau rasio. Terdapat dua metode dalam analisis
multivariat yaitu metode dependensi dan metode interdenpendensi. Metode dependensi yaitu
peubah-peubahnya tidak saling bergantung satu sama lain, sedangkan metode interdenpendensi
adalah antar peubahnya ada saling ketergantungan. Data kategorik yang terdiri dari dua
kelompok atau kategori disebut two-group discriminant analysis, sedangkan jika lebih dari dua
kategori disebut dengan multiple discriminant analysis.
Latar belakang penulisan makalah ini adalah terkait dengan peranan dan aplikasi analisis
diskriminan yang merupakan salah satu dari teknik statistik multivariat yang banyak digunakan
dalam berbagai bidang ilmu yang terjadi dalam sebuah fenomena sosial, keuangan dan ekonomi.
contohnya seperti pada penelitian skripsi fakultas ekonomi dan bisnis ini dengan tujuan
penelitian yaitu untuk menganalisis faktor-faktor yang berpengaruh terhadap pengambilan
keputusan migran bekerja di dalam negeri dan luar negeri. Suatu fungsi diskriminan layak untuk
dibentuk, bila terdapat perbedaan nilai rataan di antara kelompok-kelompok yang ada. Pada
prinsipnya Analisis Diskriminan hampir sama dengan Analisis Regresi, karena termasuk dalam
Dependence Method yang memiliki variabel respon (dependent variable) dan variabel prediktor
(Independent variable). Ciri khusus dari Analisis Diskriminan adalah variabel dependen harus
berupa data kategori, sedangkan data independen harus non kategori
1.2 Tujuan
1.2.1 Untuk mengetahui tipe data yang termasuk ke dalam analisis diskriminan
1.2.2 Untuk mengetahui langkah pengerjaan analisis diskriminandengan software
statistika
1.2.3 Untuk mengetahui interpretasi dari output hasil analisis data menggunakan
software statistik
BAB II
TINJAUAN PUSTAKA

2.1. Pengertian Analisis Diskriminan

Analisis diskriminan adalah teknik statistika yang dipergunakan untuk


mengklasifikasikan suatu individu atau observasi ke dalam suatu kelas atau kelompok
berdasarkan sekumpulan variabel-variabel (Johnson & Wichern 2007). Analisis diskriminan
memiliki ciri khusus dengan data variabel dependen harus berupa data kategori, sedangkan data
untuk variabel independen justru berupa data rasio. Secara teknis, analisis diskriminan mirip
dengan analisis regresi, karena keduanya mempunyai variabel dependen dan variabel independen
dalam modelnya. Hanya pada analisis regresi (sederhana maupun berganda), variabel dependen
harus data rasio; sedangkan pada analisis diskriminan, jenis data untuk variabel dependen harus
kategori. Karena mempunyai model yang sama, secara dasar kegunaan, analisis diskriminan
sama dengan analisis regresi. Dengan demikian, kegunaan utama dari analisis diskriminan ada
dua. Pertama adalah kemampuan memprediksi terjadinya variabel dependen dengan masukan
data variabel independen. Kedua adalah kemampuan memilih mana variabel independen yang
secara nyata memengaruhi variabel dependen dan mana yang tidak. Persamaan yang
menunjukkan suatu kombinasi linier dari berbagai variabel independen yaitu:

D = b0 + b1 X1 + b2 X2 + … + bk Xk (1.1.1)
Dengan:
D = skor diskriminan
b = koefisien diskriminasi atau bobot
X = prediktor atau variabel independent

Yang diestimasi adalah koefisien ‘b’, sehingga nilai ‘D’ setiap grup sedapat mungkin
berbeda. Ini terjadi pada saat rasio jumlah kuadrat antargrup (betweengroup sum of squares)
terhadap jumlah kuadrat dalam grup (within-group sum of square) untuk skor diskriminan
mencapai maksimum. Berdasarkan nilai D itulah keanggotaan suatu objek diprediksi.

2.2. Tujuan Analisis Diskriminan


Menurut Supranto (2004), tujuan analisis diskriminan adalah sebagai berikut:
1. Membuat suatu fungsi diskriminan atau kombinasi linier, dari prediktor atau variabel
bebas yang bisa mendiskriminasi atau membedakan kategori variabel tak bebas atau
criterion atau kelompok, artinya mampu membedakan suatu objek (responden) masuk
kelompok/ kategori yang mana.
2. Menguji apakah ada perbedaan signifikan antara kategori/ kelompok, dikaitkan
dengan variabel bebas atau prediktor.
3. Menentukan prediktor/ variabel bebas yang mana yang memberikan sumbangan
tebesar terhadap terjadinya perbedaan antar kelompok.
4. Mengelompokkan objek/ kasus/ responden ke dalam suatu kelompok/ kategori
didasarkan pada nilai variabel bebas.
5. Mengevaluasi keakuratan klasifikasi (the accuracy of classification).

2.3. Uji Asumsi Untuk Analisis Diskriminan

Membentuk fungsi diskriminan yang optimal diperlukan beberapa asumsi terhadap data
yang digunakan. Asumsi ini antara lain adalah data pada variabel bebas seharusnya berdistribusi
normal multivariat dan adanya kesamaan matriks varians -kovarians antar kelompok serta tidak
adanya multikolinieritas pada data.

2.3.1. Pengujian Normal Multivariat


Uji normalitas bertujuan untuk mengetahui apakah masing-masing variabel
berdistribusi normal atau tidak. Uji normalitas diperlukan karena untuk
melakukan pengujian-pengujian variabel lainnya dengan mengasumsikan bahwa
nilai residual mengikuti distribusi normal. Jika asumsi ini dilanggar maka uji
statistik menjadi tidak valid dan statistik parametrik tidak dapat digunakan, hal ini
akan menyebabkan masalah pada ketepatan fungsi (model) diskriminan. Regresi
Logistik (Logistic Regression) bisa dijadikan alternatif metode jika memang data
tidak berdistribusi normal. Menurut Johnson dan Wichern (2007), untuk
memeriksa data apakah merupakan normal multivariat, dapat dilihat dari plot
antara d²j dengan chi-square apakah hasil plot menggambarkan garis lurus

maka data tersebut dapat dinyatakan sebagai normal multivariat. Statistik uji yang
digunakan:
d²j = , j = 1, 2, …, n (1.3.1)

Hipotesis yang digunakan adalah


H0: data berdistribusi multivariat normal.
H1: data tidak berdistribusi multivariat normal.
Pemeriksaan normal multivariat dilakukan dengan algoritma sebagai berikut :
1. Menghitung d²j
2. Mendaftar d²j sedemikian hingga d²1 ≤ d²2 ≤ … ≤ d²n

3. Membuat plot (d²j , χ²p, )

2.3.2. Uji Multikolinieritas


Uji multikolinearitas bertujuan untuk menguji apakah ditemukan adanya korelasi
antar variabel bebas (independen).Karena data yang baik seharusnya tidak terjadi
korelasi di antara variabel independen.Uji multikolinearitas dilakukan dengan
melihat tolerance value dan variance inflation factor (VIF). Multikolinearitas
terjadi bila nilai VIF diatas nilai 10 atau tolerance value dibawah 0, 10.
Multikolinearitas tidak terjadi bila nilai VIF dibawah nilai 10 atau tolerance value
diatas 0, 10.

2.3.3. Pengujian Kesamaan Matrik Kovarian


Uji ini bertujuan untuk melihat apakah terdapat ketidaksamaan varians dari
residual satu pengamatan ke pengamatan yang lain. Dalam analisis diskriminan
diasumsikan bahwa varians bersyarat dari E (εi²) = Var (εi²) = σ², apabila varians
bersyarat σi² = σi² untuk setiap 1, ini berarti variansnya homogen atau
homokedastisitas. Menurut Morisson (1967) untuk pengujian kehomogenan
matriks kovarian dapat dilakukan dengan uji Box’s M. Uji Box’s M dapat
dirumuskan sebagai berikut
(1.3.2)

(1.3.3)

(1.3.4)

Dengan hipotesis sebagai berikut:


H0:Σ1 = Σ2 = … = Σk = Σ
H1: minimal ada satu Σi ≠ Σ
i = 1, 2, …, k
Daerah penolakan untuk hipotesis nol dapat dihampiri dengan menggunakan
sebaran chi-squere sebagai berikut: M > χ²α,db’

2.3.4. Tidak adanya data yang sangat ekstrim (outlier) pada variabel independen.
Jika ada outlier yang tetap diproses, hal ini bisa berakibat berkurangnya ketepatan
klarifikasi dari fungsi diskriminan. (Santosa, 2002).
BAB III
METODOLOGI

3.1. Langkah Pengolahan Data

1. Inputkan data yang dimiliki pada software SPSS dengan memberi nama variabel pada
window variabel view. Selanjutnya ubah kolom Measure sesuai dengan sifat data yang
dimiliki

2. Kembalikan pada window Data View


3. Lakukan analisis data dengan menguji asumsi kenormalan data dan
kenonmultikolinieritas data dengan Klik Analyze  Non parametrik 1 Sample KS

4. Akan muncul kotak dialog. Selanjutnya isi kotak dialog hanya dengan variabel yang
ingin kita uji kenormalannya  Test Variable List OK

5. Akan dihasilkan output seperti berikut :

One-Sample Kolmogorov-Smirnov Test

X1 (%) X2 (%) X3 (%)

N 38 38 38
Mean 14.8421 6.4037 4.5371
Normal Parametersa,b
Std. Deviation 6.31434 .89794 2.24707
Absolute .086 .203 .161
Most Extreme Differences
Positive .086 .203 .161
Negative -.062 -.135 -.091
Kolmogorov-Smirnov Z .527 1.254 .991
Asymp. Sig. (2-tailed) .944 .086 .279

a. Test distribution is Normal.


b. Calculated from data.

6. Untuk menganalisis data diskriminan juga dengan menguji homogenitas, Klik Analyze 
Classify  Discriminant
Akan muncul kotak dialog

7. Klik Define Range untuk memasukkan nilai kategori pada variabel Y  Continue

8. Klik Statistics  Centang Means, Univariates ANOVAs, Box,s M pada point Descriptives
 Fishers dan Unstandardized pada poin Function Coefficients  Continue  OK
9. Klik Clasify Centang Summary table  Continue

10. Klik Save  Centang Predicted group membership  Continue


BAB IV
HASIL DAN PEMBAHASAN

Sebelum data dianalisis menggunakan analisis diskriminan. Sebaiknya uji terlebih dahulu
dengan asumsi diskriminan. Hasil output untuk uji asumsi diskriminan adalah sebagai berikut :

a. Asumsi dan Syarat Analisis Diskriminan


1) Asumsi Kenormalan
Hipotesis yang diuji:
H0 : data menyebar normal
vs H1: data tidak menyebar normal

One-Sample Kolmogorov-Smirnov Test

X1 (%) X2 (%) X3 (%)

N 38 38 38
Mean 14.8421 6.4037 4.5371
Normal Parametersa,b
Std. Deviation 6.31434 .89794 2.24707
Absolute .086 .203 .161
Most Extreme Differences Positive .086 .203 .161
Negative -.062 -.135 -.091
Kolmogorov-Smirnov Z .527 1.254 .991
Asymp. Sig. (2-tailed) .944 .086 .279
a. Test distribution is Normal.
b. Calculated from data.

Interpretasi:
untuk ketiga variabel prediktor (X1,X2,X3) memiliki Asymp. Sig. (2-tailed) >0.05. Hal ini
menunjukkan bahwa asumsi data menyebar normal terpenuhi.

2) Asumsi Homoskedastisitas
Hipotesis yang diuji:
Ho: data homogeny
H1: data tidak homogeny

Log Determinants

Y Rank Log
Determinant

y (IPM rendah) 3 2.059

y (IPM tinggih ) 3 3.992

Pooled within-groups 3 4.084

The ranks and natural logarithms of determinants


printed are those of the group covariance matrices.

Test Results

Box's M 20.726
Approx. 2.992

df1 6
F
df2 1749.828

Sig. .007

Tests null hypothesis of equal


population covariance matrices.
Interpretasi:

Berdasarkan output tersebut, didapatkan nilai Sig. untuk uji Box’s M adalah
sebesar 0.007. Nilai ini ebih besar drai taraf nyata 0.05 sehingga diputuskan untuk
menerima Ho. Jadi, asumsi kehomegenan tidak ragam terpenuhi.

Tests of Equality of Group Means

Wilks' Lambda F df1 df2 Sig.

X1 (%) .616 22.421 1 36 .000


X2 (%) .870 5.382 1 36 .026
X3 (%) .758 11.475 1 36 .002
Selain kedua asumsi tersebut, dalam analisis diskriminan juga harus dipenuhi syarat
bahwa harus ada perbedaaan yang signifikan dari variabel X antar kategori variabel Y.
Dari table Tests of Equality of Group Means, diperoleh bahwa nilai Sig. untuk semua
variabel predictor bernilai kurang dari 0.05. Hal ini menunjukkan bahwa ketiga predictor
tersebut (X1,X2dan X3) bersifat signifikan terhadap variabel respon kesejahteraan
masyarakat. Analisis diskriminan ini tetap dapat dianalisis walaupun asumsi homogenitas
tidak terpenuhi, dengan syarat data tidak outlier. (Ghozali, 2002).

.
b. Fungsi Diskriminan
Banyaknya fungsi diskriminan yang terbentuk ditentukan oleh min= (g-1,p). Pada kasus
ini, g=2 dan p=3. Sehingga jumlah fungsi diskriminan yang terbentuk adalah min(1,2) yaitu 1.

Canonical Discriminant
Function Coefficients
Function
1
X1 (%) -.143
X2 (%) .519
X3 (%) .167
(Constant) -1.955
Unstandardized
coefficients

Fungsi diskriminan yang terbentuk yaitu :


Y = -1.955 - 0.143 X1 + 0.519 X2 0.167 X3
yang mana,
Y = kesejahteraan masyarakat
X1 = Persentase penduduk miskin
X2 = Laju pertumbuhan ekonomi
X3 =Tingkat Pengangguran terbuka

Berdasarkan table eigenvalues tersebut, diperoleh nilai eigen sebesar 0.680 Nilai ini
kurang dari 1, sehingga mengindikasikan tidak adanya multikolinearitas antar variabel predictor.
Selain itu, juga diperoleh nilai korelasi kanonik sebesar 0.680 (dikuadratkan)-R-squared (68%).
Nilai tersebut menunjukkan bahwa variabel predictor X1, X2 dan X3 berkontribusi terhadap
variabel respon Y sebesar 67.6%.
Sedangkan dari table Wilk’s Lambda, diperoleh nilai Sig. sebesar 0.000. Nilai ini kurang
dari 0.05, sehingga dapat dikatakan bahwa fungsi diskriminan yang terbentuk dan diskriminan
sisaan bersifat nyata.
Standardized
Canonical
Discriminant
Function
Coefficients
Function
1
X1 (%) -.721
X2 (%) .441
X3 (%) .332

Dari table Standardized Canonical Discriminant Function Coefficients tersebut, dapat


ditentukan variabel predictor mana yang menjadi pembeda terbesar. Karena nilai koefisien untuk
variabel X2 (laju pertumbuhan ekonomi) adalah yang terbesar (0.441), maka dapat dinyatakan
bahwa X2 (laju pertumbuhan ekonomi) adalah variabel yang memiliki pembeda terkuat terhadap
variabel respon kesejahteraan masyarakat.

c. Klasifikasi Diskriminan
Salah satu manfaat dari analisis diskriminan adalah sebagai peramalan/prediksi. Dalam
hal ini, hasil dari analisis diskriminan dapat digunakan untuk mengklasifikasikan objek-objek
dengan karakteristik tertentu.
Dari table Classification Function Coefficients, dapat dibuat fungsi diskriminan yang
berguna untuk prediksi yaitu:
Y1 = -40.036 + 1.158 X1 + 8.256 X2 + 2.048 X3
Y2 = -43.047 + 0.864 X1 9.321 X2 + 2.391 X3

Classification Resultsa
Y Predicted Group Membership Total
y (IPM rendah) y (IPM tinggih )
y (IPM rendah) 8 2 10
Count
y (IPM tinggih ) 3 25 28
Original
y (IPM rendah) 80.0 20.0 100.0
%
y (IPM tinggih ) 10.7 89.3 100.0
a. 86.8% of original grouped cases correctly classified.

Berdasarkan nilai Hitt ratio tersebut sebesar 86.8%, menunjukkan bahwa model
diskriminan yang terbentuk memiliki ketepatan prediksi sekitar 86.8%. Nilai tersebut cukup
besar karena lebih dari 50%, sehingga dapat dikatakan bahwa model diskriminan yang terbentuk
adalah baik.
BAB V
KESIMPULAN

Berdasarkan pembahasan di atas, dapat disimpulkan bahwa:


1. Data indek pembanguna manusia di Jawa Timur tahun 2010 memenuhi asumsi normal
multivariate. Sedangkan asumsi homogenitas data tidak terpenuhi. Hal tersebut tetap
dapat dilanjutkan, dan akan berpengaruh pada pengklasifikasian data yang kurang tepat.
2. Sedangkan dari table Wilk’s Lambda, diperoleh nilai Sig. sebesar 0.000. Nilai ini kurang
dari 0.05, sehingga dapat dikatakan bahwa fungsi diskriminan yang terbentuk dan
diskriminan sisaan bersifat nyata..
3. Hasil uji keeratan fungsi diskriminan menghasilkan nilai cukup tinggi pada nilai
canonical correlation, yaitu sebesar 0,680atau 68%.
4. Fungsi diskriminan yang dapat dibentuk adalah :
Y = -1.955 - 0.143 X1 + 0.519 X2 0.167 X3
Dari fungsi tersebut juga dapat dijelaskan bahwa variabel (X1) berkorelasi negative,
sedangkan variabel(X2) dan (X3) berkorelasi positif.
5. Ketepatan prediksi dari model diskriminan sebesar 86,8%. Ketepatan ini dapat dikatakan
cukup tinggi, karena sudah melebihi nilai ketepatan 50%.
DAFTAR PUSTAKA

Santoso, Singgih. 2010. Statistik Multivariate Konsep dan Aplikasi dengan SPSS. Jakarta: PT
Elex Media Komputindo.

Simamora, Bilson. 2005. Analisis Multivariat Pemasaran. Jakarta: PT Gramedia Pustaka


Utama.

Johnson, R. A. dan Whichern, D. W., (2007), Applied Multivariate Statistical Analisys, Sixth
Edition. United States of America: Prentice-Hall, Inc.,

Morrison, Donald F. 1976. Multivariate Statistical Methods. Second Edition. New York:
McGraw-Hill.

Ghozali, I. 2002. Aplikasi Analisis Multivariate dengan Program SPSS. Semarang: Badan
Penerbit Universitas Diponegoro Semarang.

Supranto, J. 2004. Analisis Multivariat Arti dan Intepretasi. Jakarta: Rineka Cipta.

Santosa, Singgih. 2002. Buku Latihan SPSS Statistik Multivariat. Jakarta: PT Elex Media
Komptindo.
LAMPIRAN

1. Data sekunder dari Skripsi :


Judul : KAJIAN MODEL REGRESI LOGISTIK, GEOGRAPHICALLY WEIGHTED
LOGISTIC REGRESSION (GWLR) DENGAN FUNGSI PEMBOBOT ADAPTIVE
GAUSSIAN KERNEL DAN GWLR DENGAN FUNGSI PEMBOBOT ADAPTIVE
BISQUARE KERNEL
Penyusun : Lintang Asdya Rakhmasanti
Tahun : 2013
Fakultas : MIPA

Dengan variabel yang terpilih yaitu:


Y = kesejahteraan masyarakat (IPM rendah =1 dengan IPM tinggih= 2)
X1 = Persentase penduduk miskin
X2 = Laju pertumbuhan ekonomi
X3 =Tingkat Pengangguran terbuka
Semua variabel predictor satuanya persen
Y X1 (%) X2 (%) X3 (%)
1 19.5 6.66 0.87
1 13.22 5.89 3.83
2 15.98 6.16 2.15
2 10.64 6.65 3.5
2 12.14 6.12 2.24
2 15.52 6.07 3.75
2 12.54 6.57 4.49
2 13.98 5.94 3.17
1 13.27 6.16 2.71
2 11.25 6.26 3.92
1 17.89 5.69 1.59
1 16.23 5.89 3.13
1 25.22 6.25 2.02
2 13.18 6.23 3.49
2 7.45 5.92 8.35
2 12.23 6.87 4.84
2 13.84 6.65 5.27
2 14.91 6.32 3.64
2 15.45 5.96 5.55
2 12.95 5.81 2.41
2 18.26 6.19 4.8
2 18.78 10.97 3.29
2 20.19 6.3 2.86
2 18.7 6.86 3.62
2 16.42 6.89 7.7
1 28.12 5.47 5.79
1 32.47 5.4 1.77
1 22.48 5.77 3.53
1 24.61 5.51 1.89
2 9.31 5.99 7.39
2 7.63 6.66 6.66
2 5.9 6.6 8.68
2 19.03 6.41 6.85
2 9 5.99 7.23
2 7.42 6.66 7.52
2 6.11 6.97 9.52
2 7.07 7.47 6.84
2 5.11 7.16 5.55

S-ar putea să vă placă și