Klasifikasi Sentimen Judul Berita Pemberitaan COVID-19 Tahun 2021 pada Media DetikHealth

Main Article Content

Fahri Delfariyadi
Afrida Helen
Susi Yuliawati

Abstract

Penelitian ini merupakan penelitian linguistik terapan yang mengombinasikan linguistik dan ilmu komputasi dan berfokus di bidang natural language processing (NLP). Fenomena yang dikaji adalah klasifikasi sentimen pada judul berita pemberitaan COVID-19 di media DetikHealth selama tahun 2021 sehingga orientasi penelitian ini adalah mengklasifikasikan sentimen pada fenomena tersebut. Pengumpulan data dilaksanakan dengan memanfaatkan fitur saring yang disediakan media tersebut dan analisis data dilakukan dalam dua tahap besar, yaitu text preprocessing dan klasifikasi sentimen. Algoritma yang diimplementasikan dalam penelitian ini adalah algoritma MultinomialNB yang merupakan bagian dari naïve bayes classifier. Hasil dari penelitian ini adalah diperolehnya tingkat akurasi prediksi sentimen sebesar 72.5%. Selain itu, uji coba dengan tanpa melakukan salah satu atau keseluruhan tahapan preprocessing data memberikan dampak terhadap tingkat akurasi mesin. Penurunan tingkat akurasi paling menonjol terlihat pada uji coba tanpa stemming. Uji coba tanpa stemming menunjukkan adanya pemahaman linguistik yang berbeda jika tahapan stemming dilakukan dan penurunan tingkat akurasi mesin. Temuan lain adalah label sentimen netral adalah label sentimen berita dengan prediksi benar tertinggi dan label positif adalah label yang relatif salah diprediksi mesin. Implikasi dari hal ini adalah label positif merupakan label yang berpotensi mengalami kekeliruan prediksi.


Kata Kunci—klasifikasi sentimen, text preprocessing, NLP

Article Details

Section
Articles