Penggunaan Metode K-Means dan K-Means++ Sebagai Clustering Data Covid-19 di Pulau Jawa

  • Nursatio Nugroho Teknik Informatika, Institut Teknologi Telkom Purwokerto, Indonesia
  • Faisal Dharma Adhinata Rekayasa Perangkat Lunak, Institut Teknologi Telkom Purwokerto, Indonesia
Keywords: K-Means, K-Means , Clustering, Covid-19, Vaksin Pertama, Vaksin Kedua, Silhouette Coefficient

Abstract

Virus Corona (Covid-19) merupakan penyakit menular yang dapat ditularkan antara hewan dan manusia. Pada akhir Desember 2019, virus itu teridentifikasi di Provinsi Wuhan, Cina. Saat ini, seluruh dunia sedang berjuang, mencegah, dan akhirnya menaklukkan penyebaran virus corona. Penelitian ini bertujuan untuk mengklaster data penyebaran Covid-19 di setiap kabupaten di Pulau Jawa sehingga menghasilkan klaster zona yang harus dilaksanakan PPKM berdasarkan kasus positif, vaksin dosis pertama, dan dosis kedua. vaksin. Metode K-Means digunakan dengan cara menentukan jumlah cluster (K), mengatur pusat cluster secara arbitrer, mengelompokkan data ke dalam cluster dengan jarak terpendek, menghitung pusat cluster, dan mengulangi langkah 2-4 sampai tidak ada data yang berpindah ke lokasi yang berbeda. gugus. K-Means++ digunakan dengan cara memilih secara acak nilai k pertama dari pusat cluster pertama titik data, mengelompokkan data berdasarkan jarak minimum ke centroid, memperbarui nilai titik centroid dengan menentukan rata-rata setiap cluster, dan ulangi langkah 2 dan 3 sampai tidak ada yang bergerak. Berdasarkan jumlah kasus positif, sembuh, dan meninggal, kasus tersebut dikategorikan. Setelah dilakukan pengelompokan dan mendapatkan klaster pada masing-masing kelompok, setiap klaster akan dievaluasi kualitasnya menggunakan koefisien siluet untuk memilih yang terbaik. Hasil kajian tersebut diharapkan dapat mengungkap sejauh mana penyebaran virus Covid-19 di setiap kabupaten/kota di Pulau Jawa, serta cluster dengan skor Silhouette Coefficient tertinggi. Untuk hasil pengujian menggunakan Silhouette Coefficient, metode K-Means K=3 menghasilkan 0,825, K=4 menghasilkan 0,873, dan K=5 menghasilkan 0,862; untuk metode K-Means++, k=3 menghasilkan 0,822, K=4 menghasilkan 0,865, dan K = 5 menghasilkan 0,882. Hasil penelitian menunjukkan bahwa K-Means++ lebih unggul dalam memberikan informasi sejauh mana penyebaran virus Covid-19, dan uji Silhouette Coefficient digunakan untuk menentukan kualitas cluster yang optimal.

Downloads

Download data is not yet available.

References

A. Solichin and K. Khairunnisa, “Klasterisasi Persebaran Virus Corona (covid-19) di DKI Jakarta Menggunakan Metode K-Means,” Fountain of Informatics Journal, vol. 5, no. 2, p. 52, 2020.

D. D. Darmansah, “Analisis Penyebaran Penularan Virus Covid-19 di Provinsi Jawa Barat Menggunakan Algoritma K-Means Clustering,” JATISI (Jurnal Teknik Informatika dan Sistem Informasi), vol. 8, no. 3, pp. 1188—1199, 2021.

D. T. Utari, “Analisis Karakteristik Wilayah Transmisi Covid-19 Dengan Menggunakan Metode K-Means Clustering,” Jurnal Media Teknik dan Sistem Industri, vol. 5, no. 1, p. 25, 2021.

S. F. Mandang and B. N. Sari, “Penerapan K-Means Cluster Pada Daerah Penggunaan Teknologi di Indonesia,” JOINS (Journal of Information System), vol. 6, no. 1, pp. 131—138, 2021.

D. Sari and Y. Sukestiyarno, “Analisis Cluster Dengan Metode K-Means Pada Persebaran Kasus COVID-19 Berdasarkan Provinsi di Indonesia”, prisma, vol. 4, pp. 602-610, Feb. 2021.

Sharon, S. Defit, and G. W. Nurcahyo, “Tingkat Efisiensi Penggunaan Resep Dokter Spesialis Menggunakan Metode K-Means Clustering,” Jurnal Informasi dan Teknologi, pp. 121—127, 2021.

D. A. Dewi and D. A. Pramita, “Analisis Perbandingan Metode Elbow dan Silhouette Pada Algoritma Clustering K-Medoids Dalam Pengelompokan Produksi Kerajinan Bali,” Matrix : Jurnal Manajemen Teknologi dan Informatika, vol. 9, no. 3, pp. 102—109, 2019.

F. M. Falahi, “Penerapan Metode Clustering Untuk Pengelompokan Mahasiswa Potensial Drop Out Menggunakan Algoritma K-Means ++,” thesis, Universitas Islam Negeri Sunan Ampel, Surabaya, 2019.

R. A. Indraputra and R. Fitriana, “K-Means Clustering Data Covid-19,” Jurnal Teknik Industri, vol. 10, no. 3, pp. 275—282, 2020.

N. Ulinnuha and S. A. Sholihah, “Analisis Cluster Untuk Pemetaan Data Kasus Covid-19 Di Indonesia Menggunakan K-Means,” Jurnal MSA ( Matematika dan Statistika serta Aplikasinya ), vol. 9, no. 2, 2021.

Published
2022-10-20
How to Cite
Nugroho, N., & Adhinata, F. D. (2022). Penggunaan Metode K-Means dan K-Means++ Sebagai Clustering Data Covid-19 di Pulau Jawa. Teknika, 11(3), 170-179. https://doi.org/10.34148/teknika.v11i3.502