Seleksi Atribut Menggunakan Information Gain Untuk Clustering Penduduk Miskin Dengan Validity Index Xie Beni

  • Femi Dwi Astuti Program Studi Teknik informatika, STMIK AKAKOM
Keywords: clustering, information gain, kemiskinan, fuzzy c-means, xie-beni

Abstract

Di wilayah Kecamatan Bantul, seorang warga disebut sebagai keluarga miskin berdasarkan beberapa aspek seperti aspek pangan, sandang, papan, penghasilan, kesehatan, pendidikan, kekayaan, air bersih, listrik maupun jumlah jiwa. Aspek-aspek tersebut akan digunakan sebagai atribut dalam proses clustering. Masing-masing atribut memiliki nilai yang akan diolah. Penelitian ini dikerjakan menggunakan seleksi atribut information gain sebelum proses clustering untuk melihat atribut mana yang sebenarnya berpengaruh dan tidak, sehingga hanya atribut yang berpengaruh saja yang akan digunakan, metode Fuzzy C-Means untuk clustering penduduk miskin dan Xie Beni untuk menentukan jumlah klaster terbaik. Hasil penelitian menunjukkan penggunaan information gain dengan threshold 0.0001 untuk clustering dengan menghilangkan atribut penghasilan memiliki hasil cluster yang sama dengan menggunakan atribut penghasilan. Pengujian terhadap 23, 500, 1000 dan 1313 untuk jumlah cluster 2, 3, 4, 5, 6 dan 7 menunjukkan bahwa nilai dari Xie-Beni Index terkecil adalah 5 dengan nilai 0,1343, sehingga cluster yang paling optimal adalah 5.

References

[1] Azhagusundari, B. dan Thanamani, A.S. (2013). Feature Selection Based on Information Gain. International Journal of Innovative Technology and Exploring Engineering (IJITEE) ISSN:2278-3075, Volume-2, Issue-2, pp. 18-21.

[2] Chandani, V., Wahono, R.S., dan Purwanto. (2015). Komparasi Algoritma Klasifikasi Machine Learning dan Feature Selection pada Analisis Sentimen Review Film. Journal of Intelligent Systems. Vol.1, No.1, February 2015, pp. 55-59.

[3] Duo, C., Xue, L., dan Du-Wu, C.. (2007). An Adaptive Cluster Validity Index for the Fuzzy C-Means. International Journal of Computer Science and Network Security. Vol. 7, No.2. 146-156.

[4] Purnamasari, S.B., Yasin, H. dan Wuryandari, T. (2014). Pemilihan Cluster optimum pada Fuzzy C-Means (Studi Kasus : Pengelompokan Kabupaten/Kota di provinsi Jawa Trngah Berdasarkan Indikator Indeks Pembangunan Manusia). Jurnal Gaussian, volume 3. Nomor 3. Halaman 491-498.

[5] Sela, E.I. (2015). Penentuan Indikator yang Berperan Pada Identifikasi Kemiskinan Menggunakan Data Mining. Jurnal Riset Daerah Edisi Khusus, hal 16-32.

[6] Redjeki, S., Guntara, M., dan Anggoro, P. (2014). Perancangan Sistem Identifikasi dan Pemetaan Potensi Kemiskinan untuk Optimalisasi Program Kemiskinan. Jurnal Sistem Informasi (JSI). Vol.6, No.2 Oktober 2014. ISSN : 2085-1588. hlm 731-743.

[7] Essra, A., Rahmadani, Safriadi. (2016). Analisis Information Gain Attribute Evaluation untuk Klasifikasi Serangan Intrusi. Jurnal ISD Vol.2 No.2 Juli-Desember. ISSN : 2528-5114. hal 9-14.

[8] Marcelloni, F., (2003). Feature Selection Based on A Modified Fuzzy C-Means Algorithm With Supervision, Information Sciences. 151. pp.201-206.

[9] Sen, A., Foster, J. (1997). On Economic Inequality. Clarendon Paperback. New York: Oxford University Press.
Published
2018-01-09
Section
Articles