Aplikasi Klasifikasi SMS Berbasis Web Menggunakan Algoritma Logistic Regression

  • Fitran Dwi Pramakrisna Program Studi Rekayasa Perangkat Lunak, Institut Teknologi Telkom Purwokerto, Jawa Tengah
  • Faisal Dharma Adhinata Program Studi Rekayasa Perangkat Lunak, Institut Teknologi Telkom Purwokerto, Jawa Tengah
  • Nia Annisa Ferani Tanjung Program Studi Rekayasa Perangkat Lunak, Institut Teknologi Telkom Purwokerto, Jawa Tengah
Keywords: SMS, Spam, Machine learning, Logistic Regression, Flask, Web

Abstract

Jenis SMS spam adalah jenis pesan teks yang tidak diinginkan atau tidak diminta yang dikirim ke ponsel pengguna, seringkali untuk tujuan komersial. Untuk mengatasi masalah spam, diperlukan teknik untuk memilah kata atau kalimat termasuk spam atau bukan spam. Pada penelitian ini diusulkan menggunakan machine learning untuk mengklasifikasikan pesan mana yang spam dan mana yang tidak spam. Data yang digunakan pada penelitian ini terdiri dari 1140 pesan, dimana sudah diberi label 0 untuk pesan yang tidak spam dan 1 untuk pesan yang spam. Algoritma yang digunakan untuk kasus ini adalah Logistic Regression. Hasil penelitian menunjukkan model memiliki tingkat akurasi untuk mengklasifikasi pesan, sebesar 97%. Aplikasi yang dikembangkan untuk menerapkan hasil pemodelan machine learning menggunakan bentuk sebuah website sederhana dengan bantuan Flask framework dari Python. Hasil akhir dari aplikasi ini adalah model machine learning yang dapat dibuka melalui website.

Downloads

Download data is not yet available.

References

S. Kushwaha, S. Bahl, A. K. Bagha, K. S. Parmar, M. Javaid, A. Haleem, and R. P. Singh, “Significant applications of machine learning for COVID-19 pandemic,” Journal of Industrial Integration and Management, vol. 05, no. 04, pp. 453—479, 2020.

“What is SMS and how does it work?,” Android Authority, 30-Aug-2021. [Online]. Available: https://www.androidauthority.com/what-is-sms-280988/. [Accessed: 27-Aug-2021].

“SMS SPAM: Security against SMS spam,” T. [Online]. Available: https://www.t-mobile.com/privacy-center/education-and-resources/sms-spam. [Accessed: 25-Dec-2021].

C. C. Aggarwal, “Machine learning for text,” 2018.

A. Dilip Patel and V. N. Pandya, “Web page classification based on context to the content extraction of articles,” 2017 2nd International Conference for Convergence in Technology (I2CT), 2017.

A. A. Mohammed, R. Basa, A. K. Kuchuru, S. P. Nandigama, and M. Gangolla, “Random Forest Machine Learning technique to predict Heart disease ,” European Journal of Molecular & Clinical Medicine, vol. 7, no. 4, pp. 2453—2459 , 2020.

M. I. Gunawan, D. Sugiarto, and I. Mardianto, “Peningkatan Kinerja Akurasi prediksi penyakit diabetes mellitus menggunakan metode grid Seacrh Pada algoritma logistic regression,” Jurnal Edukasi dan Penelitian Informatika (JEPIN), vol. 6, no. 3, p. 280, 2020.

L. Wu and M. Li, “Applying the CG-logistic regression method to predict the customer churn problem,” 2018 5th International Conference on Industrial Economics System and Industrial Security Engineering (IEIS), 2018.

K. Polat, “Freezing of gait (fog) detection using logistic regression in parkinson's disease from acceleration signals,” 2019 Scientific Meeting on Electrical-Electronics & Biomedical Engineering and Computer Science (EBBT), 2019.

L. Liu, “Research on logistic regression algorithm of breast cancer diagnose data by machine learning,” 2018 International Conference on Robots & Intelligent System (ICRIS), 2018.

M. Saw, T. Saxena, S. Kaithwas, R. Yadav, and N. Lal, “Estimation of prediction for getting heart disease using logistic regression model of machine learning,” 2020 International Conference on Computer Communication and Informatics (ICCCI), 2020.

M. R. Romadhon and F. Kurniawan, “A comparison of naive bayes methods, logistic regression and KNN for predicting healing of covid-19 patients in Indonesia,” 2021 3rd East Indonesia Conference on Computer and Information Technology (EIConCIT), 2021.

F. Rahmi, “APLIKASI SMS SPAM FILTERING PADA ANDROID MENGGUNAKAN ALGORITMA NAÃVE BAYES,” thesis, 2017.

Z. Zhu, J. Liang, D. Li, H. Yu, and G. Liu, “Hot topic detection based on a refined TF-IDF algorithm,” IEEE Access, vol. 7, pp. 26996—27007, 2019.

U. Bhattacharjee, P. K. Srijith, and M. S. Desarkar, “Term specific TF-IDF boosting for detection of rumours in social networks,” 2019 11th International Conference on Communication Systems & Networks (COMSNETS), 2019.

“Classification: Accuracy | machine learning crash course | google developers,” Google. [Online]. Available: https://developers.google.com/machine-learning/crash-course/classification/accuracy. [Accessed: 01-Dec-2021].

Published
2022-06-22
How to Cite
Pramakrisna, F. D., Adhinata, F. D., & Tanjung, N. A. F. (2022). Aplikasi Klasifikasi SMS Berbasis Web Menggunakan Algoritma Logistic Regression. Teknika, 11(2), 90-97. https://doi.org/10.34148/teknika.v11i2.466
Section
Articles