Analisis Sentimen Multi-Kelas Untuk Film Berbasis Teks Ulasan Menggunakan Model Regresi Logistik
DOI:
https://doi.org/10.34148/teknika.v11i2.461Keywords:
Ulasan, Prediksi, Sentiment Analysis, Regresi LogistikAbstract
Pengutaraan pendapat atau pengutaraan pemikiran secara sukarela terhadap suatu film pada situs pengulas film merupakan hal yang sering dilakukan oleh pengguna. Beberapa pengguna kadang-kadang memberikan ulasan yang ambigu terhadap sebuah film, yaitu dengan memberikan komentar yang buruk tetapi memberikan rating yang baik atau sebaliknya. Hal ini dapat berpengaruh pada citra film tersebut. Maka dari itu, diperlukan sistem yang dapat memprediksi rating agar sesuai dengan komentar yang diberikan atau sistem pembenaran rating. Penelitian ini bertujuan untuk memprediksi rating suatu film berdasarkan ulasan yang diberikan oleh pengguna menggunakan model Regresi Logistik. Dataset yang digunakan pada penelitian ini adalah data ulasan 10 film yang berbeda dari Mendeley Data. Tahap pra-pemrosesan dilakukan dengan penghapusan kata umum, tanda baca, pengurangan dimensi, dan pengekstrakan ciri dari teks ulasan menggunakan library scikit-learn. Dengan 80% data sebagai training dan sisanya digunakan untuk testing, hasil perhitungan akurasi prediksi 10 kelas rating yang didapatkan dari feature extraction CountVectorize adalah 36% dan TfidfVectorizer sebesar 32%. Sedangkan hasil dari perhitungan akurasi prediksi 2 class sentiment, didapatkan hasil tertinggi sebesar 83% oleh feature extraction CountVectorizer dan feature extraction TfidfVectorizer sebesar 76%.
Downloads
References
E. Setiawan, “Kamus Besar Bahasa Indonesia (KBBI),” Arti kata pendapat - Kamus Besar Bahasa Indonesia (KBBI) Online. [Online]. Available: https://kbbi.web.id/pendapat. [Accessed: 03-Jun-2021].
P. McCullagh and J. A. Nelder, “Generalized linear models,” 1989.
R. N. Sucky, “Multiclass classification algorithm from scratch with a project in Python: Step by step guide,” Medium, 03-Nov-2020. [Online]. Available: https://towardsdatascience.com/multiclass-classification-algorithm-from-scratch-with-a-project-in-python-step-by-step-guide-485a83c79992. [Accessed: 06-Sep-2020].
N. Asghar, “Yelp Dataset Challenge: Review Rating Prediction,” arXiv preprint, 2016.
M. Umer, I. Ashraf, A. Mehmood, S. Ullah, and G. S. Choi, “Predicting numeric ratings for Google Apps using text features and Ensemble Learning,” ETRI Journal, vol. 43, no. 1, pp. 95—108, 2020.
A. Benlahbib, “ 1000 Movie Reviews (Review + Attached rating + Sentiment polarity) for Reputation Generation,” Mendeley Data, 2019.
R. Qiao, “Yelp review rating prediction: Sentiment analysis and the neighborhood-based recommender,” dissertation, 2019