Klasifikasi Sentimen Judul Berita Pemberitaan COVID-19 Tahun 2021 pada Media DetikHealth
Main Article Content
Abstract
Penelitian ini merupakan penelitian linguistik terapan yang mengombinasikan linguistik dan ilmu komputasi dan berfokus di bidang natural language processing (NLP). Fenomena yang dikaji adalah klasifikasi sentimen pada judul berita pemberitaan COVID-19 di media DetikHealth selama tahun 2021 sehingga orientasi penelitian ini adalah mengklasifikasikan sentimen pada fenomena tersebut. Pengumpulan data dilaksanakan dengan memanfaatkan fitur saring yang disediakan media tersebut dan analisis data dilakukan dalam dua tahap besar, yaitu text preprocessing dan klasifikasi sentimen. Algoritma yang diimplementasikan dalam penelitian ini adalah algoritma MultinomialNB yang merupakan bagian dari naïve bayes classifier. Hasil dari penelitian ini adalah diperolehnya tingkat akurasi prediksi sentimen sebesar 72.5%. Selain itu, uji coba dengan tanpa melakukan salah satu atau keseluruhan tahapan preprocessing data memberikan dampak terhadap tingkat akurasi mesin. Penurunan tingkat akurasi paling menonjol terlihat pada uji coba tanpa stemming. Uji coba tanpa stemming menunjukkan adanya pemahaman linguistik yang berbeda jika tahapan stemming dilakukan dan penurunan tingkat akurasi mesin. Temuan lain adalah label sentimen netral adalah label sentimen berita dengan prediksi benar tertinggi dan label positif adalah label yang relatif salah diprediksi mesin. Implikasi dari hal ini adalah label positif merupakan label yang berpotensi mengalami kekeliruan prediksi.
Kata Kunci—klasifikasi sentimen, text preprocessing, NLP
Article Details
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Submission of an original manuscript to the journal will be taken to mean that it represents originality work not previously published. Please see JIEET (Journal of Information Engineering and Educational Technology) originality guidelines for details. Use this in conjunction with the points below about references, before submission i.e. always attribute clearly using either indented text or quote marks as well as making use of the preferred IEEE style of formatting. Authors submitting articles for publication warrant that the work is not an infringement of any existing copyright and will indemnify the publisher against any breach of such warranty. For ease of dissemination and to ensure proper policing of use, papers and contributions become the legal copyright of the publisher unless otherwise agreed.
The editor may make use of Thurnitin software for checking the originality of submissions received.