Analisis Komparatif Multinomial Naïve Bayes dan Logistic Regression untuk Klasifikasi Sentimen Ulasan Pengguna Aplikasi TIX ID
DOI:
https://doi.org/10.35968/jsi.v13i1.1723Kata Kunci:
Analisis sentimen, Multinomial Naïve Bayes, Logistic Regression, TIX ID, Klasifikasi Multi-kelasAbstrak
Penelitian ini bertujuan untuk membandingkan performa algoritma Multinomial Naïve Bayes (MNB) dan Logistic Regression (LR) dalam klasifikasi sentimen multi-kelas pada ulasan pengguna aplikasi TIX ID. Sebanyak 2.500 ulasan dikumpulkan melalui proses scraping dari Google Play Store dan diproses melalui tahapan preprocessing, yang meliputi pembersihan teks, case folding, tokenisasi, stopword removal, dan stemming. Dua teknik ekstraksi fitur digunakan, yaitu CountVectorizer dan TF-IDF, sebelum model dilatih menggunakan kedua algoritma. Proses hyperparameter tuning dilakukan menggunakan GridSearchCV dengan lima lipatan cross-validation untuk memperoleh konfigurasi parameter terbaik. Hasil penelitian menunjukkan bahwa MNB dengan CountVectorizer pada tahap sebelum tuning memberikan performa paling unggul, dengan akurasi mencapai 84,80% dan F1-score macro tertinggi dibandingkan kombinasi lainnya. Sementara tuning meningkatkan stabilitas performa model, nilai akurasi tidak melampaui model awal tersebut. Temuan ini menunjukkan bahwa kombinasi MNB dan CountVectorizer lebih sesuai untuk karakteristik teks ulasan aplikasi berbahasa Indonesia yang bersifat sparse dan memiliki pola repetitif. Model terbaik kemudian diimplementasikan dalam sistem analisis sentimen berbasis web yang mampu memproses ulasan secara real time. Penelitian ini memberikan kontribusi pada pengembangan metode analisis sentimen di Indonesia dan penerapannya pada aplikasi layanan digital.Referensi
Arief, M. R., & Samsudin, R. (2023). Hybrid approach with VADER and Multinomial Logistic Regression for multiclass sentiment analysis in online customer review. International Journal of Advanced Computer Science and Applications, 14(2). https://doi.org/10.14569/IJACSA.2023.0140210
Awaludin, M., Nuryadi, H., & Pribadi, G. N. (2024). Sistem Otomatisasi Laporan untuk Optimalisasi Pelaporan Data Penelitian dan Pengabdian kepada Masyarakat di Universitas Dirgantara Marsekal Suryadarma. 9675, 1–7.
Awaludin, M., & Wahono, R. S. (2015). Penerapan Metode Distance Transform Pada Linear Discriminant Analysis Untuk Kemunculan Kulit Pada Deteksi Kulit. Journal of Intelligent Systems, 1(1), 48–54.
Awaludin, M., Yasin, V., & Risyda, F. (2024). The Influence of Artificial Intelligence Technology, Infrastructure and Human Resource Competence on Internet Access Networks. Inform; 9(2), 111–120. https://doi.org/10.25139/inform.v9i2.8109
Averina, N., Nurmalasari, Y., & Nugroho, A. (2022). Analisis sentimen multi-kelas untuk film berbasis teks ulasan menggunakan model regresi logistik. Teknika, 8(2), 101–110. https://doi.org/10.34148/teknika.v8i2.625
Bahtiar, S., Kurniawan, D., & Rahmawati, H. (2023). Comparison of Naïve Bayes and Logistic Regression in sentiment analysis on marketplace reviews using rating-based labeling. Journal of Information Systems and Informatics, 5(1), 35–45. https://doi.org/10.33557/journalisi.v5i1.198
Cahyani, D., Fajri, I., & Saputra, R. (2022). Penerapan preprocessing teks pada analisis sentimen berbahasa Indonesia. Jurnal Teknologi Informasi dan Komputer, 8(3), 245–253. https://doi.org/10.33330/jutik.v8i3.1568
Hanafi, M. R., & R. K., R. (2024). Analisis sentimen pada ulasan aplikasi Sirekap di Google Play menggunakan algoritma Naïve Bayes. MALCOM, 4(4), 112–121. https://doi.org/10.57152/malcom.v4i4.1693
Herjanto, Y. A., & Carudin, C. (2024). Analisis sentimen ulasan pengguna aplikasi Sirekap pada Play Store menggunakan algoritma Random Forest Classifier. Jurnal Informatika dan Teknik Elektro Terapan, 12(2), 210–218. https://doi.org/10.23960/jitet.v12i2.4192
Insan, M. T., Rakhman, A., & Wibowo, F. S. (2023). Analisis sentimen aplikasi Brimo pada ulasan pengguna di Google Play menggunakan algoritma Naïve Bayes. JATI (Jurnal Mahasiswa Teknik Informatika), 11(1), 50–58. https://doi.org/10.36040/jati.v11i1.6377
Kundana, D., & Chairani, C. (2023). Data driven analysis of Borobudur ticket sentiment using Naïve Bayes. Aptisi Transactions on Technopreneurship, 5(2), 170–178. https://doi.org/10.34306/att.v5i2sp.353
Mandasari, A. F., Pratama, D., & Yazid, M. (2022). Analisis sentimen pengguna transportasi online terhadap layanan Grab Indonesia menggunakan Multinomial Naïve Bayes Classifier. J-SISKO TECH, 5(1), 55–63. https://doi.org/10.53513/jsk.v5i1.3832
Mary, S., & Rose, J. (2023). Multifaceted sentiment detection system to avoid dropout in virtual learning environment using multi-class classifiers. International Journal of Advanced Computer Science and Applications, 14(3), 41–49. https://doi.org/10.14569/IJACSA.2023.0140305
Nadira, S., Ramadhan, J., & Fauzi, A. (2023). Analisis sentimen pada ulasan aplikasi mobile banking menggunakan metode Naïve Bayes dengan kamus Inset. Informatic and Computational Intelligent Journal, 5(2), 80–90. https://doi.org/10.32764/icij.v5i2.1291
Novantika, L. (2022). Analisis sentimen ulasan pengguna aplikasi video conference Google Meet menggunakan metode SVM dan Logistic Regression. Prosiding Seminar Nasional Matematika, 9(1), 77–84. https://doi.org/10.31227/osf.io/h6a2g
Putri, L. D., & Kharisudin, A. (2022). Analisis sentimen pengguna aplikasi marketplace Tokopedia pada situs Google Play menggunakan metode SVM, Naïve Bayes, dan Logistic Regression. Prosiding Seminar Nasional Matematika, 8(1), 120–127. https://doi.org/10.31227/osf.io/58mdu
Rahman, M. A., Nurlaila, R., & Lubis, N. (2023). Multi-tier sentiment analysis of social media text using supervised machine learning. Computers, Materials & Continua, 74(1), 1301–1317. https://doi.org/10.32604/cmc.2023.034821
Rahman, R. N., Rahim, A., & Pranoto, W. J. (2025). Analisis sentimen ulasan game eFootball 2024 pada Playstore menggunakan algoritma Naïve Bayes. Jurnal Ilmiah Informatika, 13(1), 45–54. https://doi.org/10.33884/jif.v13i01.9913
Siregar, M. Y., Wiranata, A. D., & Saputra, R. A. (2024). Analisis sentimen pada ulasan pengguna aplikasi streaming Vidio menggunakan metode Naïve Bayes. KLIK, 4(5), 302–310. https://doi.org/10.30865/klik.v4i5.1787
Syafrizal, S., Afdal, M., & Novita, R. (2024). Analisis sentimen ulasan aplikasi PLN Mobile menggunakan Naïve Bayes Classifier dan K-Nearest Neighbor. MALCOM, 4(1), 50–60. https://doi.org/10.57152/malcom.v4i1.983
Triana, T. (2023). Implementasi algoritma Naïve Bayes untuk klasifikasi sentimen ulasan pengguna KAI Access. JUTISI: Jurnal Ilmiah Teknik Informatika dan Sistem Informasi, 14(1), 18–25. https://doi.org/10.35889/jutisi.v14i1.2437
Yuyun, S., Arifin, B., & Putra, R. (2021). Algoritma Multinomial Naïve Bayes untuk klasifikasi sentimen pemerintah terhadap penanganan Covid-19 menggunakan data Twitter. Jurnal RESTI, 5(2), 229–236. https://doi.org/10.29207/resti.v5i2.3363
