Documente Academic
Documente Profesional
Documente Cultură
Abstract Spam email is the term used to menyebabkan tingkat akurasi prediksi rendah.
describe the messages sent in mass emails or Oleh karena itu, dalam penelitian ini menciptakan
incoming email received without approval. Spam algoritma Model dan Support Vector Machine
Email Filtering is a program used to detect Support Vector Machine Model algoritma
unwanted email and prevent unsolicited email and berdasarkan Particle Swarm Optimization untuk
to get into the inbox of email users. Many of the mendapatkan spam email aturan dalam
techniques used to create spam email filtering , one memprediksi akurasi dan memberikan nilai yang
of them by using classification techniques. Support lebih akurat. Setelah menguji dua model, yaitu
Vector Machine classifier is a supervised learning Support Vector Algoritma Mesin dan Support
method is used to classify the data. But the Support Vector Machine berbasis Particle Swarm
Vector Machine has a weakness on the difficulty of Optimization, hasil yang diperoleh dengan
selecting the appropriate features and optimal demikian diperoleh menguji algoritma
attribute weights are used to cause a degree of menggunakan Support Vector Machine yang
prediction accuracy is low. Therefore, in this study merupakan nilai yang diperoleh akurasi 85,75%
created a model algorithm and Support Vector dan nilai AUC adalah 0,901, sedangkan Tes
Machine Support Vector Machine algorithm model menggunakan Support Vector Machine berbasis
based Particle Swarm Optimization to get email Particle Swarm Optimization nilai yang diperoleh
spam rule in predicting accuracy and provide a akurasi 89,24% dan nilai AUC adalah 0,935
more accurate value. After testing the two models, dengan tingkat yang baik klasifikasi diagnostik.
namely Support Vector Machine Algorithm and Sehingga kedua metode memiliki berbagai
Support Vector Machine -based Particle Swarm tingkat akurasi yaitu sebesar 03:49% dan nilai-
Optimization, the results obtained are thus nilai AUC 0,034 perbedaan.
obtained testing the algorithm using Support
Vector Machine which is the value obtained 85.75 Kata Kunci: Feature Selection, Particle Swarm
% accuracy and AUC value was 0.901, whereas the Optimization, Spam Email, Support Vector
test using Support Vector Machine-based Particle Machine Algorithm.
Swarm Optimization value obtained 89.24 %
accuracy and AUC value was 0.935 with a good PENDAHULUAN
level of diagnostic classification. So that both
methods have different levels of accuracy that is Spam adalah email yang tidak diminta oleh
equal to 3:49 % and AUC values of 0.034 difference pengguna (unsolicitied email) yang dikirim ke
banyak orang. Spam email adalah istilah yang
Intisari Spam email adalah istilah yang digunakan untuk menggambarkan pesan terkirim
digunakan untuk menggambarkan pesan yang dalam email massal atau email masuk yang
dikirim dalam email massal atau email yang diterima tanpa persetujuan. Spam email biasanya
masuk diterima tanpa persetujuan. Spam Email datang dalam bentuk penawaran obat, proposal
Filtering adalah program yang digunakan untuk bisnis haram, pesan hoax atau iklan produk. Oleh
mendeteksi email yang tidak diinginkan dan karena itu email perlu diprediksi dengan akurat,
mencegah email yang tidak diminta dan untuk karena hasil prediksi yang akurat sangat penting
masuk ke inbox pengguna email. Banyak teknik untuk mengurangi spam.
yang digunakan untuk membuat email Klasifikasi adalah salah satu teknik dalam
penyaringan spam, salah satunya dengan data mining yang digunakan untuk memprediksi
menggunakan teknik klasifikasi. Support Vector kelompok keanggotaan (class) dari setiap
Machine classifier adalah metode pembelajaran instance data. Teknik klasifikasi yang biasa
terawasi digunakan untuk mengklasifikasikan digunakan untuk membangun e-mail spam
data. Tapi Support Vector Machine memiliki filtering diantaranya Naïve Bayes, Support Vector
kelemahan pada kesulitan memilih fitur yang Machine (SVM) dan k-nearest neighbor (kNN).
tepat dan bobot atribut optimal digunakan untuk Dari beberapa teknik tersebut yang paling sering
digunakan untuk klasifikasi data adalah Support oleh penerimanya. Pada akhirnya, spam dapat
Vector Machine (SVM). menimbulkan ketidaknyamanan bagi para
Support Vector Machine (SVM) adalah pengguna situs web. Orang yang menciptakan
suatu metode supervised learning yang digunakan spam elektronik disebut spammers.
untuk melakukan klasifikasi data. Support Vector 1) Spam yang masuk ke inbox user
Machine (SVM) adalah kasus khusus dari Spam yang masuk ke inbox biasanya berjenis:
keluarga algoritma yang kita sebut sebagai a. Phising email ini akan berpura-pura
regularized metode klasifikasi linier dan metode sebagai or
yang kuat untuk minimalisasi resiko (Weiss, b. Hoax : email peringatan atau nasehat
Indurkhya & Zhang, 2010). Dan kelebihan SVM palsu yang biasanya diakhiri dengan
lainnya adalah dapat meminimalkan kesalahan himbauan agar menyebarkannya seluas-
melalui memaksimalkan margin dengan luasnya.
memisahkan antara hyper-lane dan satu set data 2) Account user yang disalahgunakan spammer
bahkan dengan jumlah sample yang kecil untuk mengirim spam
(Chunjiang & Yan, 2009). Namun demikian Dalam hal ini spammer biasanya akan
masalah aplikasi tertentu, tidak semua fitur ini berusaha menebak user dan password email
sama-sama penting dan kinerja yang lebih baik anda untuk bisa mengirim spam dari akun
dapat dicapai dengan membuang beberapa fitur anda. Bila hal ini terjadi, maka efeknya sangat
dengan begitu fitur dalam SVM memiliki buruk untuk akun anda maupun reputasi
pengaruh penting dalam akurasi klasifikasi network secara keseluruhan. Bila akun anda
(Zhao, Fu, Ji, Tang & Zhou, 2011). Dataset yang telah terbukti mengirim spam, maka mail adm
tidak penting, fitur yang banyak atau sangat akan mem-blacklist alamat email anda dan
berhubungan secara signifikan akan mengurangi mengirimkan notifikasi ke mail administrator
tingkat akurasi klasifikasi dengan menghapus domain anda.
fitur ini, dengan begitu tingkat akurasi efisiensi 3) Penyebab email kita kebanjiran spam
dan klasifikasi dapat diperoleh (Lin a, Shiue b & Biasanya spam email yang masuk
Chen, 2009). menggunakan layanan autoresponder yang
Particle Swarm Optimization (PSO) sangat memang memiliki kemampuan untuk
menarik untuk pemilihan fitur dimana kawanan mengirimkan email secara massal dan
partikel akan menemukan kombinasi fitur otomatis, mulai ratusan hingga puluhan ribu
terbaik pada saat pencarian ruang masalah dana email terkirim sekaligus.
Particle Swarm Optimization (PSO) dapat
menemukan solusi yang optimal dengan cepat b. Support Vector Machine
(Parimala & Nallaswamy, 2012). Particle Swarm Support Vector Machine adalah sebuah
Optimization (PSO) banyak digunakan untuk metode seleksi yang membandingkan parameter
memecahkan masalah optimasi, serta sebagai standar seperangkat nilai diskrit yang disebut
masalah seleksi fitur (Liu, Wang, Chen, Dong, Zhu kandidat set, dan mengambil salah satu yang
& Wang, 2011). Dalam teknik Particle Swarm memiliki akurasi klasifikasi terbaik (Dong, Xia,
Optimization (PSO) terdapat beberapa cara untuk Tu, & Xing, 2007). Support Vector Machine adalah
melakukan pengoptimasian diantaranya: salah satu alat yang paling berpengaruh dan kuat
meningkatkan bobot atribut (attribute weight) untuk memecahkan klasifikasi (Burges, 1998).
terhadap semua atribut atau variabel yang Support Vector Machines (SVM) adalah
dipakai, menseleksi atribut (attribute selection) seperangkat metode yang terkait untuk suatu
dan feature selection. metode pembelajaran, untuk kedua masalah
Pada penelitian ini Particle Swarm Optimization klasifikasi dan regresi (Maimon, 2010). Dengan
(PSO) akan diterapkan untuk pemilihan berorientasi pada tugas, kuat, sifat komputasi
parameter Support Vector Machine (SVM) yang mudah dikerjakan, Support Vector Machine telah
sesuai dan optimal, sehingga hasil prediksi lebih mencapai sukses besar dan dianggap sebagai
akurat. state-of-the-art classifier saat ini (Huang, Yang,
King, & Lyu, 2008).
BAHAN DAN METODE Pada Conference on Learning Theory
(COLT), Boser, Bernhard, Guyon, dan Vapnik
a. Spam Email tahun 1992, memperkenalkan Support Vector
Spam email atau bisa juga berbentuk junk Machine (Premanode, Tzoumazou 2012) yaitu
mail adalah penyalahgunaan sistem pesan sebuah teknik supervised learning dari bidang
elektronik untuk mengirim berita iklan dan machine learning yang dapat di aplikasikan
keperluan lainnya secara massal. Umumnya, kedalam clasifikasi dan regresi (Sewell, Taylor
spam menampilkan berita secara bertubi-tubi 2012). Support Vector Machine merupakan salah
tanpa diminta dan sering kali tidak dikehendaki satu teknik yang relatif baru untuk melakukan
menguji besarnya error pada data test (santosa, Berikut adalah persamaan model confusion
2007). matrix :
Kita gunakan k-1 sampel untuk training a. nilai akurasi (acc) adalah proporsi jumlah
dan 1 sampel sisanya untuk testing. Misalnya ada prediksi yang benar. Dapat dihitung dengan
10 subset data, kita menggunakan 9 subset untuk menggunakan persamaan :
training dan 1 subset sisanya untuk testing. Ada
10 kali training dimana pada masing-masing …………..(1)
training ada 9 subset data untuk training dan 1 b. tingkat negatif benar (tn) didefinisikan
subset digunakan untuk testing. Setelah itu sebagai proporsi kasus negatif yang
kemudian dihitung rata-rata error dan standar diklasifikasikan dengan benar, yang dihitung
deviasi error (Santosa, 2007). Setiap bagian k dengan menggunakan persamaan :
pada gilirannya digunakan sebagai ujian
menetapkan dan k lainnya -1 bagian digunakan ………….(2)
sebagai training set (Bramer, 2007). c. tingkat negatif palsu (fn) adalah proporsi
kasus positif yang salah diklasifikasikan
sebagai negatif, yang dihitung dengan
menggunakan persamaan :
……………(3)
d. tingkat negatif palsu (fp) adalah proporsi
kasus negatif yang salah diklasifikasikan
sebagai positif, yang dihitung dengan
menggunakan persamaan :
………….(4)
Gambar 2. K-Fold Cross-validation e. penarikan kembali (recall) atau tingkat positif
benar (tp) adalah proporsi kasus positif yang
e. Confusion Matrix diklasifikasikan dengan benar, yang dihitung
Confusion matrix merupakan dataset hanya dengan menggunakan persamaan :
memiliki dua kelas, kelas yang satu sebagai
positif dan kelas yang lain sebagai negatif ……………(5)
(Bramer, 2007). Metode ini menggunakan tabel f. presisi (p) adalah proporsi prediksi kasus
matrix. positif yang benar, yang dihitung dengan
menggunakan persamaan :
Tabel 1. Model Confusion Matrix (Vercellis, 2009)
Predictions ………….(6)
-1 -1 Tota
(negatif (positif l f. Kurva ROC (Receiver Operating
) ) Characteristic)
-1 p q p+q Grafik kurva ROC (Receiver Operating
(negatif Characteristic) digunakan untuk mengevaluasi
Example ) akurasi classifier dan untuk membandingkan
s +1 u v u+v klasifikasi yang berbeda model (Vercellis, 2009).
(positif) Sebuah grafik ROC adalah grafik dua dimensi
Total p+u q+v m dengan proporsi negatif pada sumbu horisontal
dan proporsi positif yang benar di sumbu vertikal
Keterangan : (Vercellis, 2009). Kegunaan kurva ROC (Receiver
a. p adalah jumlah prediksi yang tepat bahwa Operating Characteristic) adalah (Gorunescu,
instance bersifat negatif 2011) adalah untuk radar selama Perang Dunia II
b. q adalah jumlah prediksi yang salah bahwa untuk mendeteksi benda-benda musuh di medan
instance bersifat positif perang, teori deteksi sinyal, dalam psikologi ke
c. u adalah jumlah prediksi yang salah bahwa rekening untuk deteksi sinyal persepsi, penelitian
instance bersifat negatif medis dan dalam mesin pembelajaran dan
d. v adalah jumlah prediksi yang tepat bahwa penelitian data mining, serta masalah klasifikasi.
instance bersifat positif. Dalam masalah klasifikasi menggunakan
kelas keputusan dua (klasifikasi biner), masing-
masing objek dikelompokkan dalam (P, N), yaitu
positif atau negatif. Sementara model klasifikasi
beberapa (misalnya, pohon keputusan)
menghasilkan label kelas diskrit (menunjukkan dengan menggunakan Support Vector Machine
hanya kelas diprediksi objek), pengklasifikasi berbasis Particle Swarm Optimization (PSO).
lainnya (misalnya, naive bayes, jaringan saraf)
menghasilkan output yang berkesinambungan, Metode Penelitian
yang ambang batas yang berbeda mungkin Pengertian penelitian dalam akademik
diterapkan untuk memprediksi keanggotaan yaitu digunakan untuk mengacu pada aktivitas
kelas, secara teknis, ROC kurva, juga dikenal yang rajin dan penyelidikan sistematis atau
sebagai grafik ROC, dua-dimensi grafik dimana investigasi di suatu daerah, dengan tujuan
tingkat TP diplot pada sumbu Y- dan tingkat FP menemukan atau merevisi fakta, teori, aplikasi
diplot pada X- sumbu (Gorunescu, 2011). dan tujuannya adalah untuk menemukan dan
menyebarkan pengetahuan baru (Berndtsson,
Olsson, & Lundell, 2008).
Menurut (Dawson, 2009) ada empat
metode penelitian yang umum digunakan yaitu
tindakan penelitian, eksperimen, studi kasus dan
survey. Dalam konteks penelitian, metode yang
dilakukan mengacu kepada pemecahan masalah
yang meliputi mengumpulkan data, merumuskan
hipotesis atau proposisi, pengujian hipotesis,
menafsirkan hasil, dan kesimpulan (Berndtssom,
Gambar 3. Grafik ROC (discrete/continuous case) Hansson, Olsson, & Lundell, 2008).
Dalam penelitian ini dilakukan beberapa
Pada gambar 3 garis diagonal membagi ruang langkah yang dilakukan dalam proses penelitian.
ROC, yaitu : 1. Pengumpulan Data
1. (a) poin diatas garis diagonal merupakan hasil Pada tahap ini ditentukan data yang akan
klasifikasi yang baik. diproses. Mencari data yang tersedia,
2. (b) point dibawah garis diagonal merupakan memperoleh data tambahan yang dibutuhkan,
hasil klasifikasi yang buruk mengintegrasikan semua data ke dalam data
Dapat disimpulkan bahwa, satu point pada kurva set, termasuk variabel yang diperlukan dalam
ROC adalah lebih baik dari pada yang lainnya jika proses. Data untuk eksperimen ini
arah garis melintang dari kiri bawah ke kanan dikumpulkan, kemudian diseleksi dari data
atas didalam grafik. yang tidak sesuai.
2. Pengolahan Awal Data
Untuk keakurasian nilai AUC dalam klasifikasi Ditahap ini dilakukan penyeleksian data,
data mining dibagi menjadi lima kelompok ditransformasikan kebentuk yang diinginkan
(Gorunescu, 2011), yaitu : sehingga dapat dilakukan persiapan dalam
a. 0.90 – 1.00 = klasifikasi sangat baik (excellent pembuatan model. Model dipilih berdasarkan
classification) kesesuaian data dengan metode yang paling
b. 0.80 – 0.90 = klasifikasi baik (good baik dari beberapa metode pengklasifikasian
classification) yang sudah digunakan. Model yang digunakan
c. 0.70 – 0.80 = klasifikasi cukup (fair adalah algoritma Support Vector Machine.
classification) 3. Metode Yang Diusulkan
d. 0.60 – 0.70 = klasifikasi buruk (poor Untuk meningkatkan akurasi dari Algoritma
classification) Support Vector Machine, maka dilakukan
e. 0.50 – 0.60 = klasifikasi salah (failure) penambahan dengan menambahkan metode
Particle Swarm Optimization.
g. Kerangka Pemikiran 4. Eksperimen dan Pengujian Metode
Model kerangka pemikiran yang Untuk eksperimen data penelitian, penulis
digunakan adalah method improvement menggunakan RapidMiner 5.3 untuk
(perbaikan metode), yang sering digunakan pada mengolah data.
penelitian di bidang sains dan teknik, termasuk 5. Evaluasi dan Validasi Hasil
bidang computing di dalamnya. Komponen dari Evaluasi dilakukan untuk mengetahui akurasi
model kerangka pemikiran perbaikan metode model Algoritma Support Vector Machine.
(methode improvement) adalah indicators, Validasi digunakan untuk melihat
proposed method, objectives dan perbandingan hasil akurasi dari model yang
measurements (Polancic, 2007). Kerangka digunakan dengan hasil yang telah ada
pemikiran pada penelitian ini dimulai dari sebelumnya. Teknik validasi yang digunakan
prediksi hasil pemilihan umum. Maka dengan ini adalah cross validation.
penulis mencoba membuat sebuah soft computing
Vector Machine dengan menentukan nilai weight Tabel 3. Eksperiment penentuan nilai training
terlebih dahulu. Setelah didapatkan nilai akurasi cycle SVM berbasis PSO
dan AUC terbesar, nilai weight tersebut akan C Epsilon SVM Population SVM-PSO
Accuracy AUC size Accuracy AUC
dijadikan nilai yang akan digunakan untuk 0.0 0.0 84.25% 0.915 5 86.47% 0.916
mencari nilai akurasi dan AUC tertinggi. 0.6 0.6 85.25% 0.892 5 89.24% 0.935
0.7 0.7 84.00% 0.870 5 87.72% 0.920
Sedangkan penerapan algoritma Support Vector 0.8 0.8 83.75% 0.844 5 86.69% 0.907
Machine berbasis Particle Swarm Optimization 0.9 0.9 81.00% 0.823 5 85.73% 0.891
1.0 0.0 85.75% 0.901 5 88.47% 0.928
beracuan pada nilai weight pada algoritma
tersebut. Setelah ditemukan nilai akurasi yang Hasil terbaik pada eksperiment SVM
paling ideal dari parameter tersebut langkah berbasis PSO diatas adalah dengan C=1.0 dan
selanjutnya adalah menentukan nilai weight. Epsilon=0.0 serta population size=5 yang
Setelah ditemukan nilai akurasi yang paling ideal dihasilkan accuracy 88.47% dan AUCnya 0.928
dari parameter tersebut langkah selanjutnya dan dengan C=0.6 dan Epsilon=0.6 serta
adalah menentukan weight sehingga terbentuk population size=5 untuk SVM berbasis PSO
struktur algoritma yang ideal untuk pemecahan dihasilkan accuracy 89.24% dan AUCnya 0.935.
masalah tersebut.
Evaluasi dan Validasi Hasil
HASIL DAN PEMBAHASAN Hasil dari pengujian model yang dilakukan
adalah memprediksi spam email dengan Support
Support Vector Machine Vector Machine dan Support Vector Machine
Nilai Training cycles dalam penelitian ini berbasis Particle Swarm Optimization untuk
ditentukan dengan cara melakukan uji coba menentukan nilai accuracy dan AUC. Dalam
memasukkan C, epsilon. Berikut ini adalah hasil menentukan nilai tingkat keakurasian dalam
dari percobaan yang telah dilakukan untuk model Support Vector Machine dan Algoritma
penentuan nilai Training cycles: neural network berbasis Particle Swarm
Optimization. Metode pengujiannya
Tabel 2. Eksperiment Penentuan Nilai Training menggunakan cross validation dengan desain
Cycles SVM modelnya sebagai berikut :
C Epsilon SVM
accuracy AUC
0.0 0.0 84.25% 0.915
0.6 0.6 85.25% 0.892
0.7 0.7 84.00% 0.870
0.8 0.8 83.75% 0.844
0.9 0.9 81.00% 0.823
1.0 0.0 85.75% 0.901
Nilai accuracy, precision, dan recall dari Hasil Pengujian Model Support Vector Machine
data training dapat dihitung dengan berbasis Algoritma Particle Swarm
menggunakan RapidMiner. Hasil pengujian Optimization (PSO).
dengan menggunakan model Support Vector Pada penelitian penentuan hasil spam
Machine didapatkan hasil pada tabel 3 email menggunakan Algoritma Support Vector
Machine berbasis Particle Swarm Optimization
1. Confusion Matrix (PSO) pada framework RapidMiner sebagai
Tabel 4 data training yang digunakan berikut :
terdiri dari 200 data spam dan 200 data non
spam. Untuk data spam, 161 diklasifikasikan , 161
diklasifikasikan ya sesuai dengan prediksi yang
dilakukan dengan metode SVM, dan 39 data
diprediksi ya tetapi ternyata hasil prediksinya
tidak. Untuk data non spam, 182 diklasifikasikan
ya sesuai dengan prediksi yang dilakukan dengan
metode SVM, dan 18 data diprediksi tidak
ternyata hasil prediksinya ya.
Tabel 5. Model Confusion Matrix untuk metode Untuk evaluasi menggunakan ROC curve
Support Vector Machine berbasis Particle Swarm sehingga menghasilkan nilai AUC (Area Under
Optimization Curve) untuk model Algoritma SVM menghasilkan
Accuracy: 89.24% +/-4.76% (mikro: 89.24%) nilai 0.901 dengan nilai diagnosa Fair
True Ya True Class Classification, sedangkan untuk Algoritma
Tidak Precission Support Vector Machine (SVM) berbasis Particle
Pred. Ya 171 14 92.43% Swarm Optimization (PSO) menghasilkan nilai
Pred. 29 185 86.45% 0.935 dengan nilai diagnosa Fair Classification,
Tidak dan selisih nilai keduanya sebesar 0.034 dapat
Class 85.50% 92.96% dilihat pada Gambar 11 dibawah ini
Recall
2. Kurva ROC
Hasil perhitungan divisualisasikan dengan
kurva ROC. Perbandingan kedua metode
komparasi bisa dilihat pada Gambar 4.4 yang
merupakan kurva ROC untuk Algoritma Support
Vector Machine berbasis Particle Swarm
Optimization (PSO). Kurva ROC pada gambar 9
mengekspresikan confusion matrix dari Tabel 5
Garis horizontal adalah false positives dan garis
vertikal true positives. Gambar 11. Kurva ROC dengan Support Vector
Machine dan Support Vector Machine berbasis
Particle Swarm Optimization
Gorunescu, F. (2011). Data Mining Shukla, A., Tiwari, R., & Kala, R. (2010). Real Life
Concepts,Models And Techniques. Verlag Applications Of Soft Computing. New York:
Berlin Heidelberg: Springer. Taylor & Francis Group.
G. Sudipto, M. Adam, M. Nina, M. Rajeev, O. techterms@whatis.com,what is spam filter?,
Liadan, 2003, Clustering Data Streams: http://searchmidmarketsecurity.techtarge
Theory and Practice, Radical Eye Software, t.com/sDefinition/0,,sid198_gci931766,00.
pages 1-4. html,midmarket IT security definition,
Han, J., & Kamber, M. (2007). Data Mining diakses pada tanggal 20 oktober 2009.
Concepts and Techniques. Vercellis, C. (2009). Business Intelligence Data
Haupt, R. L., & Haupt, S. E. (2004). Practical Mining And Optimization For Decision
Genetic Algorithms. Untied States Of Making . United Kingdom: A John Wiley
America: A John Wiley & Sons Inc And Sons, Ltd., Publication.
Publication. Weiss, S. M., Indurkhya, N., & Zhang, T. (2010).
https://nic.itb.ac.id/mail/spam-dan-kiat- Fundamentals Of Predictive Text Mining.
mengatasinya London: Springer.
http://sinaga17.wordpress.com/2014/02/26/so Witten, I. H., Frank, E., & Hall, M. A. (2011). Data
ftware-anti-spamming-terbaik/ Mining Practical Machine Learning Tools
Huang, K., Yang, H., King, I., & Lyu, M. (2008). And Techniques. Burlington, Usa: Morgan
Machine Learning Modeling Data Locally Kaufmann Publishers.
And Globally. Berlin Heidelberg: Zhejiang Zhao, M., Fu, C., Ji, L., Tang, K., & Zhou, M. (2011).
University Press, Hangzhou And Springer- Feature Selection And Parameter
Verlag Gmbh. Optimization For Support Vector
Larose, D. T. (2007). Data Mining Methods And Machines: A New Approach Based On
Models. New Jersey: A John Wiley & Sons. Genetic Algorithm With Feature
Liu, Y., Wang, G., Chen, H., Dong, H., Zhu, X., & Chromosomes. School Of Computer Science
Wang, S. (2011). An Improved Particle And Technology , 5197–5204.
Swarm Optimization for Feature Selection.
Journal of Bionic Engineering Vol 8 , 1-10.
Maimon, O. (2010). Data Mining And Knowledge BIODATA PENULIS
Discovery Handbook. New York Dordrecht
Heidelberg London: Springer. Eni Pudjiarti, M.Kom. Lahir
Moertini, V. S. (2002). Data Mining Sebagai Solusi di Jakarta 4 Oktober 1985.
Bisnis. Integral, Vol. 7 No. 1, April 2002 , 4. Sebagai Dosen Tetap di AMIK
Nugroho, A. S. (2008). Support Vector Machine: BSI Jakarta dan STMIK Nusa
Paradigma Baru Dalam Softcomputing. Mandiri Jakarta. Tahun 2008
Konferensi Nasional Sistem Dan Lulus Program Diploma Tiga
Informatika, 92-99. (DIII) dari AMIK BSI Jakarta
Parimala, R., & Nallaswamy, R. (2012). Feature Program Studi Komputerisasi
Selection using a Novel Particle Swarm Akuntansi. Tahun 2011 Lulus
Optimization and It’s Variants. I.J. S1 dari STMIK Nusa Mandiri Jakarta Jurusan
Information Technology and Computer Sistem Informasi. Tahun 2014 Lulus S2 dari
Science, , 16-24. Pasca Sarjana Magister Ilmu Komputer STMIK
Ren, Qinqing. (2010). Feature-Fusion Framework Nusa Mandiri Jakarta Konsentrasi Management
for Spam Filtering Based on SVM. Information System.