Klasifikasi Judul Berita Online Menggunakan Multinomial Naïve Bayes

Authors

  • Lilis Laome Program Studi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Halu Oleo, Indonesia
  • Dian Christien Arisona Program Studi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Halu Oleo, Indonesia
  • Zelianti Program Studi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Halu Oleo, Indonesia
  • Gusti Ngurah Adhi Wibawa Program Studi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Halu Oleo, Indonesia
  • Irma Yahya Program Studi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Halu Oleo, Indonesia
  • Mukhsar Program Studi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Halu Oleo, Indonesia

DOI:

https://doi.org/10.24256/jpmipa.v13i1.6486

Keywords:

AUC, Berita Onlien, Multinomial Naive Bayes, SMOTE

Abstract

Abstract:

News is defined as stories or information about current events. News can be classified into two categories, namely hard news and soft news. Generally, hard news refers to news topics that are timely, important and consequential. Meanwhile, soft news refers to information that is interesting, unique and entertaining. This research investigates online news headline classification using an enhanced Multinomial Naïve Bayes approach combined with SMOTE (Synthetic Minority Oversampling Technique) to address class imbalance issues. The results showed that out of 4,122 data collected, 3821 or 92.70% of news headlines were classified as hard news categories and 301 or 7.30% of other news headlines were classified as soft news categories. With an accuracy value of 91.5%, precision of 96.8%, recall of 93.8%, F1-Score of 95.2% and AUC value of 0.78 which shows Multinomial Naïve Bayes is good enough in distinguishing hard news and soft news categories, although it has not reached the optimal level.

Abstract:

Berita didefinisikan sebagai cerita atau informasi tentang peristiwa terkini. Berita dapat diklasifikasikan ke dalam dua kategori, yaitu berita keras (hard news) dan berita lunak (soft news). Umumnya, berita keras mengacu pada topik berita yang tepat waktu, penting, dan konsekuen. Sementara itu, berita lunak mengacu pada informasi yang menarik, unik, dan menghibur. Penelitian ini menyelidiki klasifikasi judul berita online menggunakan pendekatan Multinomial Naïve Bayes yang disempurnakan yang dikombinasikan dengan SMOTE (Synthetic Minority Oversampling Technique) untuk mengatasi masalah ketidakseimbangan kelas. Hasil penelitian menunjukkan bahwa dari 4.122 data yang dikumpulkan, 3821 atau 92,70% judul berita diklasifikasikan sebagai kategori hard news dan 301 atau 7,30% judul berita lainnya diklasifikasikan sebagai kategori soft news. Nilai akurasi sebesar 91.5%, precision sebesar 96.8%, recall sebesar 93.8%, F1-Score sebesar 95.2% dan nilai AUC sebesar 0.78 yang menunjukkan Multinomial Naïve Bayes sudah cukup baik dalam membedakan kategori hard news dan soft news, meskipun belum mencapai tingkat optimal.

References

Dhuhita, Windha Mega P., and Fritz Zone. ‘Perbandingan Kinerja Algoritma Multinomial dan Bernoulli Naïve Bayes dalam Mengklasifikasikan Komentar Cyberbullying’. Komputika : Jurnal Sistem Komputer 12, no. 2 (4 October 2023): 109–17. https://doi.org/10.34010/komputika.v12i2.9767.

Gusthvi, Wickly, Afrionaldi A. Roza, and Caecilia Bintang Girik Allo. ‘Perbandingan Metode Klasifikasi Decision Tree, Naïve Bayes, K-Nearest-Neighbor, Dan Logistic Regression Pada Dataset Phishing’. CENDRAWASIH: Journal of Statistics and Data Science 1, no. 2 (2023): 72–76.

Hidayah, Nurul, and Dodiman Dodiman. ‘Implementasi Algoritma Multinomial Naïve Bayes, TF-IDF dan Confusion Matrix dalam Pengklasifikasian Saran Monitoring dan Evaluasi Mahasiswa Terhadap Dosen Teknik Informatika Universitas Dayanu Ikhsanuddin’. Jurnal Akademik Pendidikan Matematika 10, no. 2 (5 May 2024): 8–15. https://doi.org/10.55340/japm.v10i1.1491.

Mahendra, Dicky Satria, Basuki Rahmat, and Retno Mumpuni. ‘Implementasi Metode Multinomial Naive Bayes Dalam Klasifikasi Judul Berita Clickbait’. Neptunus: Jurnal Ilmu Komputer Dan Teknologi Informasi 2, no. 3 (18 July 2024): 303–16. https://doi.org/10.61132/neptunus.v2i3.249.

Mayasari, Lydia, and Dina Indarti. ‘Klasifikasi Topik Tweet Mengenai Covid Menggunakan Metode Multinomial Naive Bayes Dengan Pembobotan TF-IDF’. Jurnal Ilmiah Informatika Komputer 27, no. 1 (2022): 43–53. https://doi.org/10.35760/ik.2022.v27i1.6184.

Normawati, Dwi, and Surya Allit Prayogi. ‘Implementasi Naïve Bayes Classifier Dan Confusion Matrix Pada Analisis Sentimen Berbasis Teks Pada Twitter’. J-SAKTI (Jurnal Sains Komputer Dan Informatika) 5, no. 2 (30 September 2021): 697–711. https://doi.org/10.30645/j-sakti.v5i2.369.

Oktafiani, Rian, Arief Hermawan, and Donny Avianto. ‘Pengaruh Komposisi Split Data Terhadap Performa Klasifikasi Penyakit Kanker Payudara Menggunakan Algoritma Machine Learning’. Jurnal Sains Dan Informatika 9, no. 1 (30 June 2023): 19–28. https://doi.org/10.34128/jsi.v9i1.622.

Prawira, I Made Riartha, Adiwijaya, and Mohamad Syahrul Mubarok. ‘Klasifikasi Multi-Label Pada Topik Berita Berbahasa Indonesia Menggunakan Multinomial Naive Bayes’. In E-Proceeding of Engineering, 5:7774–81, 2018. https://doi.org/oai:openlibrary.telkomuniversity.ac.id:18.04.2507.

Rahman, Amelia, Wiranto Wiranto, and Afrizal Doewes. ‘Online News Classification Using Multinomial Naive Bayes’. ITSMART: Jurnal Teknologi dan Informasi 6, no. 1 (10 August 2017): 32–38. https://doi.org/10.20961/itsmart.v6i1.11310.

Riyanto, Umbar. ‘Analisis Perbandingan Algoritma Naive Bayes Dan Support Vector Machine Dalam Mengklasifikasikan Jumlah Pembaca Artikel Online’. JIKA (Jurnal Informatika) 2, no. 2 (9 October 2019): 62–72. https://doi.org/10.31000/.v2i2.1521.

Sabrani, Alif, I Gede Wirarama Wedashwara W, and Fitri Bimantoro. ‘Multinomial Naïve Bayes Untuk Klasifikasi Artikel Online Tentang Gempa Di Indonesia’. Jurnal Teknologi Informasi, Komputer, Dan Aplikasinya (JTIKA ) 2, no. 1 (31 March 2020): 89–100. https://doi.org/10.29303/jtika.v2i1.87.

Sanrilla, Natalis Ransi, La Surimi, Andi Tenriawaru Andi Tenriawaru, and La Ode Saidi. ‘Analisis Sentimen Masyarakat Terhadap Toko Online Aplikasi Shopee Menggunakan Metode Multinomial Naïve Bayes’. Jurnal Matematika Komputasi Dan Statistika 2, no. 2 (24 August 2022): 68–75. https://doi.org/10.33772/jmks.v2i2.9.

Shevira, Sheila, I. Made Agus Dwi Suarjaya, and Putu Wira Buana. ‘Pengaruh Kombinasi Dan Urutan Pre-Processing Pada Tweets Bahasa Indonesia’. JITTER : Jurnal Ilmiah Teknologi Dan Komputer 3, no. 2 (12 July 2022): 1074–81. https://doi.org/10.24843/JTRTI.2022.v03.i02.p06.

Taslim, Taslim, Susi Handayani, and Fajrizal Fajrizal. ‘Kinerja Komparatif Optimasi Algoritma Naive Bayes dalam Klasifikasi Teks untuk Uji Klinis Kanker’. Jurnal Eksplora Informatika 13, no. 1 (30 September 2023): 113–23. https://doi.org/10.30864/eksplora.v13i1.994.

Wijayanti, Ni Putu Yulika Trisna, Eka N. Kencana, and I Wayan Sumarjaya. ‘Smote: Potensi Dan Kekurangannya Pada Survei’. E-Jurnal Matematika 10, no. 4 (30 November 2021): 235–40. https://doi.org/10.24843/MTK.2021.v10.i04.p348.

Downloads

Published

28-03-2025

How to Cite

Laome, L., Dian Christien Arisona, Zelianti, Gusti Ngurah Adhi Wibawa, Irma Yahya, & Mukhsar. (2025). Klasifikasi Judul Berita Online Menggunakan Multinomial Naïve Bayes. Al-Khwarizmi : Jurnal Pendidikan Matematika Dan Ilmu Pengetahuan Alam, 13(1), 76–86. https://doi.org/10.24256/jpmipa.v13i1.6486

Citation Check