Perbaikan Akurasi Random Forest Dengan ANOVA Dan SMOTE Pada Klasifikasi Data Stunting

  • Ari Ahmad Dhani Program Studi Teknik Informatika, Universitas Muhammadiyah, Kalimantan Timur
  • Taghfirul Azhima Yoga Siswa Program Studi Teknik Informatika, Universitas Muhammadiyah, Kalimantan Timur
  • Wawan Joko Pranoto Program Studi Teknik Informatika, Universitas Muhammadiyah, Kalimantan Timur
Keywords: Klasifikasi, Random Forest, ANOVA, SMOTE, High Dimensional

Abstract

Stunting terus menjadi isu kesehatan masyarakat yang kritis di Indonesia, khususnya di Kota Samarinda yang mencatat prevalensi sebesar 25,3% pada tahun 2022, menjadi yang tertinggi kedua di Provinsi Kalimantan Timur. Di tengah prioritas nasional untuk riset 2020-2024, penggunaan data mining untuk klasifikasi stunting memperlihatkan potensi yang signifikan namun tetap menghadapi tantangan dalam menangani data berdimensi tinggi dan ketidakseimbangan kelas. Penelitian ini bertujuan untuk meningkatkan akurasi klasifikasi stunting menggunakan metode Random Forest (RF) yang diintegrasikan dengan seleksi fitur ANOVA dan teknik SMOTE untuk menyeimbangkan kelas. Data yang digunakan dalam penelitian ini bersumber dari Dinas Kesehatan Kota Samarinda, meliputi 26 Puskesmas dengan 21 atribut dan total 150.466 record. Teknik validasi yang dipakai adalah cross-validation k =10. Hasil menunjukkan peningkatan akurasi dari 98,83% menjadi 99,77% naik sebesar 0,94% setelah penerapan seleksi fitur ANOVA. Fitur ZS TB/U, ZS BB/U, dan BB/U diidentifikasi sebagai yang paling berpengaruh. Peningkatan ini menunjukkan efektivitas integrasi metode dalam mengatasi masalah stunting pada dataset yang kompleks dan tidak seimbang, ini diharapkan dapat mendukung kebijakan dan intervensi kesehatan lebih lanjut di kawasan tersebut.

Downloads

Download data is not yet available.

References

M. A. Cindy, “Daftar Prevalensi Balita Stunting di Indonesia pada 2022,” Katadata Media Netw., no. 2022, pp. 1–11, 2023.

Cindy Mutia Annur, “Calon Ibu Kota Baru, Bagaimana Angka Balita Stunting di Wilayah di Kalimantan Timur? Layanan konsumen & Kesehatan,” Katadata.Co.Id, pp. 2023–2024, 2023, [Online]. Available: https://databoks.katadata.co.id/datapublish/2023/02/27/calon-ibu-kota-baru-bagaimana-angka-balita-stunting-di-wilayah-di-kalimantan-timur

H. Apriyani and K. Kurniati, “Perbandingan Metode Naïve Bayes Dan Support Vector Machine Dalam Klasifikasi Penyakit Diabetes Melitus,” J. Inf. Technol. Ampera, vol. 1, no. 3, pp. 133–143, 2020, doi: 10.51519/journalita.volume1.isssue3.year2020.page133-143.

M. Hakimah, C. N. Prabiantissa, N. F. Rozi, L. N. Yamani, and I. Puspitasari, “Determination of Relevant Feature Combinations for Detection Stunting Status of Toddlers,” 2022 5th Int. Semin. Res. Inf. Technol. Intell. Syst. ISRITI 2022, pp. 324–329, 2022, doi: 10.1109/ISRITI56927.2022.10053069.

L. G. Gebeye, E. Y. Dessie, and J. A. Yimam, “Predictors of micronutrient deficiency among children aged 6–23 months in Ethiopia: a machine learning approach,” Front. Nutr., vol. 10, no. January, pp. 1–13, 2023, doi: 10.3389/fnut.2023.1277048.

H. Luo, X. Pan, Q. Wang, S. Ye, and Y. Qian, “Logistic Regression And Random Forest For Effective Imbalanced Classification,” Proc. - Int. Comput. Softw. Appl. Conf., vol. 1, pp. 916–917, 2019, doi: 10.1109/COMPSAC.2019.00139.

A. Talukder and B. Ahammed, “Machine learning algorithms for predicting malnutrition among under-five children in Bangladesh,” Nutrition, vol. 78, p. 110861, 2020, doi: 10.1016/j.nut.2020.110861.

S. A. Hemo, and M. I. Rayhan, “Classification tree and random forest model to predict under-five malnutrition in Bangladesh,” Biometrics Biostat. Int. J., vol. 10, no. 3, pp. 116–123, 2021, doi: 10.15406/bbij.2021.10.00337.

O. N. Chilyabanyama et al., “Performance of Machine Learning Classifiers in Classifying Stunting among Under-Five Children in Zambia,” Children, vol. 9, no. 7, 2022, doi: 10.3390/children9071082.

A. Nugroho, H. L. H. S. Warnars, F. L. Gaol, and T. Matsuo, “Trend of Stunting Weight for Infants and Toddlers Using Decision Tree,” IAENG Int. J. Appl. Math., vol. 52, no. 1, 2022.

T. A. Yoga Siswa, “Komparasi Optimasi Chi-Square, CFS, Information Gain dan ANOVA dalam Evaluasi Peningkatan Akurasi Algoritma Klasifikasi Data Performa Akademik Mahasiswa,” Inform. Mulawarman J. Ilm. Ilmu Komput., vol. 18, no. 1, p. 62, 2023, doi: 10.30872/jim.v18i1.11330.

S. Sutarmi, W. Warijan, T. Indrayana, D. P. P. B, and I. Gunawan, “Machine Learning Model For Stunting Prediction,” J. Heal. Sains, vol. 4, no. 9, pp. 10–23, 2023, doi: 10.46799/jhs.v4i9.1073.

R. Mburu, “Comparison of Elastic Net and Random Forest in identifying risk factors of stunting in children under rve years of age in Kenya,” no. 51, pp. 1–44, 2020.

R. Sasmita, M. Sam’an, L. Assafaat, A. Faturrohman, and Safuan, “Improved Malnutrition Classification: A Grey Wolf Optimization-Based Feature Selection Approach with Random Forest Model,” 2023 8th Int. Conf. Informatics Comput. ICIC 2023, pp. 1–7, 2023, doi: 10.1109/ICIC60109.2023.10381980.

H. Hafid, “Penerapan K-Fold Cross Validation untuk Menganalisis Kinerja Algoritma K-Nearest Neighbor pada Data Kasus Covid-19 di Indonesia,” J. Math., vol. 6, no. 2, pp. 161–168, 2023, [Online]. Available: http://www.ojs.unm.ac.id/jmathcos

M. M. Mafa’atiih, “Implementasi Artificial Intelligence Untuk Memprediksi Harga Sewa Airbnb Menggunakan Metode Random Forest Dan Penerapan Web Application Menggunakan Flask,” pp. 83–99, 2020, doi: 10.1007/978-3-030-29761-9_6.

Kemal Musthafa Rajabi, W. Witanti, and Rezki Yuniarti, “Penerapan Algoritma K-Nearest Neighbor (KNN) Dengan Fitur Relief-F Dalam Penentuan Status Stunting,” Innov. J. Soc. Sci. Res., vol. 3, pp. 3555–3568, 2023.

M. Yunus, Muhammad Kunta Biddinika, and A. Fadlil, “Optimasi Algoritma Naïve Bayes Menggunakan Fitur Seleksi Backward Elimination untuk Klasifikasi Prevalensi Stunting,” Decod. J. Pendidik. Teknol. Inf., vol. 3, no. 2, pp. 278–285, 2023, doi: 10.51454/decode.v3i2.188.

Published
2024-07-01
How to Cite
Dhani, A. A., Siswa, T. A. Y., & Pranoto, W. J. (2024). Perbaikan Akurasi Random Forest Dengan ANOVA Dan SMOTE Pada Klasifikasi Data Stunting. Teknika, 13(2), 264-272. https://doi.org/10.34148/teknika.v13i2.875
Section
Articles