Analisis Sentimen Multi-Kelas Untuk Film Berbasis Teks Ulasan Menggunakan Model Regresi Logistik

Authors

  • Anasthasya Averina Program Studi Teknik Informatika, Universitas Surabaya, Jawa Timur
  • Helen Hadi Program Studi Teknik Informatika, Universitas Surabaya, Jawa Timur
  • Joko Siswantoro Program Studi Teknik Informatika, Universitas Surabaya, Jawa Timur

DOI:

https://doi.org/10.34148/teknika.v11i2.461

Keywords:

Ulasan, Prediksi, Sentiment Analysis, Regresi Logistik

Abstract

Pengutaraan pendapat atau pengutaraan pemikiran secara sukarela terhadap suatu film pada situs pengulas film merupakan hal yang sering dilakukan oleh pengguna. Beberapa pengguna kadang-kadang memberikan ulasan yang ambigu terhadap sebuah film, yaitu dengan memberikan komentar yang buruk tetapi memberikan rating yang baik atau sebaliknya. Hal ini dapat berpengaruh pada citra film tersebut. Maka dari itu, diperlukan sistem yang dapat memprediksi rating agar sesuai dengan komentar yang diberikan atau sistem pembenaran rating. Penelitian ini bertujuan untuk memprediksi rating suatu film berdasarkan ulasan yang diberikan oleh pengguna menggunakan model Regresi Logistik. Dataset yang digunakan pada penelitian ini adalah data ulasan 10 film yang berbeda dari Mendeley Data. Tahap pra-pemrosesan dilakukan dengan penghapusan kata umum, tanda baca, pengurangan dimensi, dan pengekstrakan ciri dari teks ulasan menggunakan library scikit-learn. Dengan 80% data sebagai training dan sisanya digunakan untuk testing, hasil perhitungan akurasi prediksi 10 kelas rating yang didapatkan dari feature extraction CountVectorize adalah 36% dan TfidfVectorizer sebesar 32%. Sedangkan hasil dari perhitungan akurasi prediksi 2 class sentiment, didapatkan hasil tertinggi sebesar 83% oleh feature extraction CountVectorizer dan feature extraction TfidfVectorizer sebesar 76%.

Downloads

Download data is not yet available.

References

E. Setiawan, “Kamus Besar Bahasa Indonesia (KBBI),” Arti kata pendapat - Kamus Besar Bahasa Indonesia (KBBI) Online. [Online]. Available: https://kbbi.web.id/pendapat. [Accessed: 03-Jun-2021].

P. McCullagh and J. A. Nelder, “Generalized linear models,” 1989.

R. N. Sucky, “Multiclass classification algorithm from scratch with a project in Python: Step by step guide,” Medium, 03-Nov-2020. [Online]. Available: https://towardsdatascience.com/multiclass-classification-algorithm-from-scratch-with-a-project-in-python-step-by-step-guide-485a83c79992. [Accessed: 06-Sep-2020].

N. Asghar, “Yelp Dataset Challenge: Review Rating Prediction,” arXiv preprint, 2016.

M. Umer, I. Ashraf, A. Mehmood, S. Ullah, and G. S. Choi, “Predicting numeric ratings for Google Apps using text features and Ensemble Learning,” ETRI Journal, vol. 43, no. 1, pp. 95—108, 2020.

A. Benlahbib, “ 1000 Movie Reviews (Review + Attached rating + Sentiment polarity) for Reputation Generation,” Mendeley Data, 2019.

R. Qiao, “Yelp review rating prediction: Sentiment analysis and the neighborhood-based recommender,” dissertation, 2019

Downloads

Published

2022-06-27

Issue

Section

Articles

How to Cite

Analisis Sentimen Multi-Kelas Untuk Film Berbasis Teks Ulasan Menggunakan Model Regresi Logistik. (2022). Teknika, 11(2), 123-128. https://doi.org/10.34148/teknika.v11i2.461