Komparasi Metode Seleksi Fitur Dalam Prediksi Keterlambatan Pembayaran Biaya Kuliah
DOI:
https://doi.org/10.34148/teknika.v12i1.601Keywords:
Data Mining, Klasifikasi, Mutual Information, Forward Selection, Backward Elimination, Recursive EliminationAbstract
Penelitian data mining pada keterlambatan pembayaran SPP telah banyak dilakukan namun mayoritas penelitian memiliki dataset yang berdimensi rendah. Hal ini dapat menjadi bahan kajian bagi para peneliti selanjutnya dikarenakan penelitian terkait dataset keterlambatan biaya SPP yang berdimensi tinggi hanya mendapatkan akurasi dibawah 60%. Ditambah lagi penelitian klasifikasi data mining yang menguji hubungan antar atribut-atribut yang digunakan pada pemodelan terhadap label data relatif masih minim. Penelitian ini bertujuan untuk menganalisis peningkatan akurasi algoritma klasifikasi yakni K-Nearest Neighbor, Naive Bayes, C4.5, Random forest, dan Logistic Regression dalam memprediksi keterlambatan biaya kuliah yang dioptimasi dengan beberapa perbandingan algoritma seleksi fitur diantaranya Mutual Information, Forward Selection, Backward, dan Recursive Elimination. Data yang digunakan adalah data pembayaran SPP mahasiswa dari tahun 2019 - 2021 dengan teknik pembagian data menggunakan metode 5-fold cross validation. Hasil dari penelitian ini ditemukan bahwa algoritma Backward Elimination memberikan peningkatan akurasi tertinggi dengan nilai rata-rata 0,52%, sedangkan algoritma klasifikasi yang memiliki akurasi tertinggi terdapat pada random forest dan C4.5 dengan nilai akurasi sebesar 62,6%, precision 65%, recall 63% dan f1-score 61%.
Downloads
References
Ropidin and S. Riyanto, “Dampak Pemutusan Hubungan Kerja Pada Perusahaan Farmasi Terkait Covid-19 Di Indonesia,” J. Syntax Transform., vol. 1, no. 5, pp. 167—174, 2020, doi: 10.46799/jst.v1i5.63.
E. Buulolo, Data Mining Untuk Perguruan Tinggi. Sleman: Deepublish, 2020.
R. W. Abdullah, Kusrini, and E. T. Luthfii, “Prediksi Keterlambatan Pembayaran Spp Sekolah Dengan Metode K-Nearest Neighbor (Studi Kasus Smk Al-Islam Surakarta),” J. Inf. Interaktif, vol. 4, no. 3, pp. 160—164, 2019.
V. S. Ginting, K. Kusrini, and E. T. Luthfi, “Penerapan Algoritma C4.5 Dalam Memprediksi Keterlambatan Pembayaran Uang Sekolah Menggunakan Python,” JurTI (Jurnal Teknol. Informasi), 2020, [Online]. Available: http://jurnal.una.ac.id/index.php/jurti/article/view/1101.
F. Firman, Pemodelan Klasifikasi Keterlambatan Pembayaran UKT Mahasiswa IPB dengan Random Forest dan AdaBoost. 202.124.205.241, 2021.
T. H. Apandi, R. B. Maulana, R. Piarna, and D. Vernanda, “Menganalisis Kemungkinan Keterlambatan Pembayaran Spp Dengan Algoritma C4. 5 (Studi Kasus Politeknik Tedc Bandung),” J. Techno Nusa Mandiri, vol. 16, no. 2, pp. 93—98, 2019, [Online]. Available: https://core.ac.uk/download/pdf/229771622.pdf.
F. Firman, Pemodelan Klasifikasi Keterlambatan Pembayaran UKT Mahasiswa IPB dengan Random Forest dan AdaBoost. 202.124.205.241, 2021.
D. Rohmayani, “Analysis of Student Tuition Fee Pay Delay Prediction Using Naive Bayes Algorithm With Particle Swarm Optimation Optimazation (Case Study : Politeknik Tedc Bandung),” J. Teknol. Inf. dan Pendidik., vol. 13, no. 2, pp. 1—8, 2020, doi: 10.24036/tip.v13i2.317.
M. Muqorobin, K. Kusrini, and E. T. Luthfi, “Optimasi Metode Naive Bayes Dengan Feature Selection Information Gain Untuk Prediksi Keterlambatan Pembayaran Spp Sekolah,” J. Ilm. SINUS, 2019, [Online]. Available: https://p3m.sinus.ac.id/jurnal/index.php/e-jurnal_SINUS/article/view/378.
R. Rukminingsih, G. Adnan, and M. A. Latief, Metode Penelitian Pendidikan (Kuantitatif, Kualitatif & Penelitian Tindakan Kelas). Yogyakarta: Erhaka Utama, 2020.
D. Nofriansyah, Konsep Data Mining Vs Sistem Pendukung Keputusan. Yogyakarta: Deepublish, 2015.
A. Rohman, V. Suhartono, and C. Supriyanto, “Penerapan Agoritma C4.5 Berbasis Adaboost Untuk Prediksi Penyakit Jantung,” J. Teknol. Inf., vol. 13, pp. 13—19, 2017.
J. Suntoro, Data mining : algoritma dan implementasi dengan pemrograman PHP. Jakarta: Elex Media Komputindo, 2019.
R. Primartha, Algoritma Machine Learning. Informatika, 2021.
M. I. Putra, “Sistem Rekomendasi Kelayakan Kredit Menggunakan Metode Random Forest pada BRI Kantor Cabang Pelaihari,” Universitas Islam Negeri Sunan Ampel Surabaya, 2019.
R. Tyasnurita and A. Y. M. Pamungkas, “Deteksi Diabetik Retinopati menggunakan Regresi Logistik,” Ilk. J. Ilm., vol. 12, no. 2, pp. 130—135, 2020, doi: 10.33096/ilkom.v12i2.578.130-135.
J. Ling, I. P. E. N. Kencana, and T. B. Oka, “Analisis Sentimen Menggunakan Metode Naive Bayes Classifier Dengan Seleksi Fitur Chi Square,” E-Jurnal Mat., vol. 3, no. 3, pp. 92—9, 2014, doi: 10.24843/mtk.2014.v03.i03.p070.
M. Hasan, “Prediksi Tingkat Kelancaran Pembayaran Kredit Bank Menggunakan Algoritma Naïve Bayes Berbasis Forward Selection,” Ilk. J. Ilm., vol. 9, no. 3, pp. 317—324, 2017, doi: 10.33096/ilkom.v9i3.163.317-324.
A. Bode, “K-Nearest Neighbor Dengan Feature Selection Menggunakan Backward Elimination Untuk Prediksi Harga Komoditi Kopi Arabika,” Ilk. J. Ilm., vol. 9, no. 2, pp. 188—195, 2017, doi: 10.33096/ilkom.v9i2.139.188-195.
A. R. I. Pratama, S. A. Latipah, and B. N. Sari, “Optimasi Klasifikasi Curah Hujan Menggunakan Support Vector Machine (SVM) Dan Recursive Feature Elimination (RFE),” JIPI (Jurnal Ilm. Penelit. dan Pembelajaran Inform., vol. 07, no. 02, pp. 314—324, 2022, [Online]. Available: http://jurnal.stkippgritulungagung.ac.id/index.php/jipi/article/view/2675%0Ahttps://jurnal.stkippgritulungagung.ac.id/index.php/jipi/article/download/2675/1166.
J. C. Jeong, “Enhanced Recursive Feature Elimination,” in Proceedings - 6th International Conference on Machine Learning and Applications, ICMLA 2007, 2007, no. January 2008, pp. 429—435, doi: 10.1109/ICMLA.2007.35.
I. H. Written and E. Frank, Data Mining: Practical Machine Learning Tools and Techniques, 2nd ed. San Francisco: Morgan Kaufmann, 2005.
R. Ramadhan, “Perbandingan Produk Smartphone Berdasarkan Klasifikasi Komentar Website Menggunakan Metode Naive Bayes Classification,” Universitas Islam Negeri Sultan Syarif Kasim Riau, 2017.
I. D. Id, Machine Learning: Teori, Studi Kasus dan Implementasi Menggunakan Python. Riau: UR Press, 2021.
J. Indriyanto, Algoritma K-Nearrest Neighbor Untuk Prediksi Nasabah Asuransi. Pekalongan: PT Nasya Expanding Management, 2021.
D. Kurniawan, Pengenalan Machine Learning dengan Python. Jakarta: Elex Media Komputindo, 2020.