Klasterisasi Keyword Terkait Pornografi pada Media Sosial Twitter Menggunakan Latent Dirichlet Allocation
Main Article Content
Abstract
Media sosial adalah saluran komunikasi bersifat online sebagai media yang digunakan untuk berbagi berbasis komunitas. Media sosialmemungkinkan seseorang terhubung satu dengan yang lain tanpa harus bertemu secara tatap muka. Twitter merupakan salah satu media sosial yang memberikan kebebasan bagi para penggunanya untuk membuat, mengunggah, dan membaca unggahan yang disebut tweet dengan jumlah pengguna di Indonesia mencapai 18,45 juta di tahun 2022. Twitter ternyata ramai digunakan sebagai media penyebarluasan konten asusila seperti pornografi. Pada penelitian ini, penulis mencari tahu beberapa kata kunci yang sering digunakan dalam penyebar luasan konten pornografi di Twitter dengan menggunakan metode Latent Dirichlet Allocation (LDA) untuk menemukan topik yang dominan dari kata kunci yang digunakan dan mengelompokkan kata kunci secara otomatis. Pada penerapan LDA, fitur stopword digunakan untuk mengeliminasi kata-kata yang tidak diperlukan. Cara menentukan jumlah topik yang optimal yaitu dengan melihat nilai perplexity dan topik coherence. Dari total data 15.135 unggahan yang didapatkan dari data crawling, selanjutnya dipetakan menjadi lima topik dan topik yang paling banyak digunakan menggunakan kata kunci sange, nonton, dan bokepindo.
Article Details
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Submission of an original manuscript to the journal will be taken to mean that it represents originality work not previously published. Please see JIEET (Journal of Information Engineering and Educational Technology) originality guidelines for details. Use this in conjunction with the points below about references, before submission i.e. always attribute clearly using either indented text or quote marks as well as making use of the preferred IEEE style of formatting. Authors submitting articles for publication warrant that the work is not an infringement of any existing copyright and will indemnify the publisher against any breach of such warranty. For ease of dissemination and to ensure proper policing of use, papers and contributions become the legal copyright of the publisher unless otherwise agreed.
The editor may make use of Thurnitin software for checking the originality of submissions received.