OPTIMASI SUPPORT VECTOR MACHINE MENGGUNAKAN PARTICLE SWARM OPTIMIZATION UNTUK KLASIFIKASI MULTICLASS DATASET

##plugins.themes.academic_pro.article.main##

Rissa Nurfitriana Handayani
Djajasukma Tjahjadi

Abstract

Data mining merupakan proses pengembangan model yang bertujuan untuk memahami pola dari hasil analisis data dan prediksi. Kumpulan data atau yang biasa disebut dataset terdiri dari atribut, data dan kelas. Salah satu permasalahan yang terdapat pada dataset yaitu multiclass dataset. Multiclass merupakan dataset yang memiliki kelas klasifikasi polynominal. Algoritma Support Vector Machine (SVM) banyak digunakan oleh peneliti untuk metode klasifikasi. SVM dipilih karena mampu menentukan hyperplane terpisah untuk memaksimalkan margin antara 2 kelas yang berbeda. Namum, SVM terdapat kekurangan pada saat dilakukan pemilihan parameter, untuk itu diterapkan Particle Swarm Optimization (PSO) untuk meningkatkan hasil akurasi. PSO digunakan untuk optimasi bobot sedangkan SVM digunakan untuk klasifikasi. Dataset yang digunakan merupakan dataset dari UCI Machine Learning Repository. Penerapan SVM menghasilkan nilai akurasi sebesar 78.30% pada breast tissue dataset, 85.81% pada vertebral column dataset, 50.50% pada obesity levels dataset, 92.58% pada hepatitis C virus (HCV) dataset, dan sebesar 52.63% pada exasens dataset. Kemudian setelah dilakukan penerapan optimasi PSO terhadap algoritma SVM diperoleh hasil 83.96% pada breast tissue dataset, 87.42% pada vertebral column dataset, 59.64% pada obesity levels dataset, 96.59% pada hepatitis C virus (HCV) dataset, dan sebesar 56.40% pada exasens dataset. Setelah diterapkan PSO terhadap SVM diperoleh peningkatan akurasi sebesar 1% - 9%. Hasil percobaan menghasilkan bahwa metode yang digunakan mampu menghasilkan kinerja yang baik, dibandingkan dengan hasil klasifikasi lain dengan peningkatan yang signifikan dengan nilai p uji-t 0.019.

##plugins.themes.academic_pro.article.details##

References

Azis, A. I. S., Suhartono, V., & Himawan, H. (2017). Model Multi-Class SVM Menggunakan Strategi 1V1 Untuk Klasifikasi Wall-Following Robot Navigation Data. 13, 18.
Barreto, G. de A., Neto, A. R. da R., & Filho, H. A. F. da M. (2011). Vertebral Column Data Set. UCI Machine Learning Repository. http://archive.ics.uci.edu/ml/datasets/vertebral+column
Basari, A. S. H., Hussin, B., Ananta, I. G. P., & Zeniarja, J. (2013). Opinion mining of movie review using hybrid method of support vector machine and particle swarm optimization. Procedia Engineering, 53, 453–462.
Couceiro, M., & Ghamisi, P. (2016). Fractional Order Darwinian Particle Swarm Optimization: Applications and Evaluation of an Evolutionary Algorithm. Springer International Publishing. https://doi.org/10.1007/978-3-319-19635-0
Indrayuni, E. (2016). Analisa Sentimen Review Hotel Menggunakan Algoritma Support Vector Machine Berbasis Particle Swarm Optimization. EVOLUSI: Jurnal Sains Dan Manajemen, 4(2).
Jamsa, K. (2021). Introduction to Data Mining and Analytics. Jones & Bartlett Learning LLC.
Jayadeva, Khemchandani, R., & Chandra, S. (2017). Twin Support Vector Machines (Vol. 659). Springer International Publishing. https://doi.org/10.1007/978-3-319-46186-1
Kantardzic, M. (2020). Data Mining Concept, Model, Method, and Algorithm (3rd ed.). Wiley-IEEE Press.
Lichtinghagen, R., Klawonn, H., & Hoffmann, G. (2020). HCV Data. UCI Machine Learning Repository. https://archive.ics.uci.edu/ml/datasets/HCV+data
Listiana, E., & Muslim, M. A. (2017). PENERAPAN ADABOOST UNTUK KLASIFIKASI SUPPORT VECTOR MACHINE GUNA MENINGKATKAN AKURASI PADA DIAGNOSA CHRONIC KIDNEY DISEASE.
Liu, Y., Wen, K., Gao, Q., Gao, X., & Nie, F. (2018). SVM based multi-label learning with missing labels for image annotation. 78, 307–317. https://doi.org/10.1016/j.patcog.2018.01.022
Marques, J., & Jossinet, J. (2010). Breast Tissue Data Set. UCI Machine Learning Repository. http://archive.ics.uci.edu/ml/datasets/breast+tissue#
Maurya, R., Singh, S. K., Maurya, A. K., & Kumar, A. (2014). GLCM and Multi Class Support Vector Machine based Automated Skin Cancer Classificaion. 2014 International Conference on Computing for Sustainable Global Development (INDIACom). https://doi.org/10.1109/IndiaCom.2014.6828177
Murty, M. N., & Raghava, R. (2016). Support Vector Machines and Perceptrons: Learning, Optimization, Classification, and Application to Social Networks. Springer International Publishing. https://doi.org/10.1007/978-3-319-41063-0
Nugroho, I. (2020). Perbandungan Prediksi Fasies Melalui Beberapa Machine Learning. Pertamina University.
Palechor, F. M., & Manotas, A. de la H. (2019). Estimation of Obesity Levels based on Eating Habits and Physical Condition Data Set. UCI Machine Learning Repository. http://archive.ics.uci.edu/ml/datasets/Estimation+of+obesity+levels+based+on+eating+habits+and+physical+condition+
Prasetio, R. T. (2020). Genetic Algorithm to Optimize k-Nearest Neighbor Parameter for Benchmarked Medical Datasets Classification. Jurnal Online Informatika, 5(2), 153. https://doi.org/10.15575/join.v5i2.656
Prasetio, R. T., & Ripandi, E. (2019). Optimasi Klasifikasi Jenis Hutan Menggunakan Deep Learning Berbasis Optimize Selection. Jurnal Informatika, 6(1), 100–106. https://doi.org/10.31311/ji.v6i1.5176
Sucipto, Kusrini, & Taufiq, E. L. (2016). Classification Method of Multi-class on C4.5 Algorithm for Fish Diseases. 5.
Zarrin, P. S., & Roeckendorf, N. (2020). Exasens Data Set. UCI Machine Learning Repository. http://archive.ics.uci.edu/ml/datasets/breast+tissue#