Perbandingan Algoritma Naïve Bayes Dan Random Forest Dalam Klasifikasi Obesitas Berdasarkan Faktor Gaya Hidup

Main Article Content

Rizkya Nanda Prakoso
Shidqi Ikmal Rochim
Ari Subarnas
Muhammad Erfan Kurniawan

Abstract

Abstrak— Obesitas merupakan salah satu permasalahan kesehatan yang berkaitan erat dengan pola hidup modern. Tujuan dari penelitian ini adalah untuk mengevaluasi dan membandingkan kinerja algoritma Naïve Bayes dan Random Forest dalam mengelompokkan tingkat obesitas berdasarkan pola gaya hidup. Dataset diperoleh dari platform Kaggle yang memuat berbagai atribut terkait kebiasaan hidup, seperti pola makan dan aktivitas fisik. Penelitian dimulai dengan tahapan data preprocessing meliputi penghapusan atribut yang tidak relevan, transformasi label kelas menjadi bentuk kategorikal, serta pembersihan data kosong. Data kemudian dibagi menjadi data latih dan data uji. Model klasifikasi dibangun menggunakan aplikasi RapidMiner dengan algoritma Naïve Bayes dan Random Forest. Evaluasi dilakukan menggunakan metrik akurasi, presisi, recall, dan classification error. Berdasarkan hasil pengujian, algoritma Random Forest menghasilkan akurasi 83,23%, precision 83,93%, dan recall 82,46% pada kelas Obesity, dengan classification error sebesar 16,77%. Sementara itu, Naïve Bayes mencatat akurasi 76,09%, precision 73,21% dan recall 71,93% pada kelas Obesity, sementara itu, hasil classification error sebesar 23,91%. Hasil analisis dari Weight by Information Gain menunjukkan bahwa atribut dengan bobot tertinggi adalah usia (0,290), diikuti frekuensi konsumsi sayuran (0,272) dan jumlah makan utama per hari (0,232) yang berperan penting dalam klasifikasi obesitas. Penelitian ini menyimpulkan bahwa algoritma Random Forest lebih unggul dibandingkan Naïve Bayes dalam memprediksi obesitas berdasarkan faktor gaya hidup dan faktor lainnya yang dapat memicu obesitas.


 


Kata Kunci— Obesitas, Gaya Hidup, Naive Bayes, Random Forest, Rapidminer.

Article Details

Section
Articles

References

[1] D. Hermawan et al., Mengenal Obesitas. Penerbit Andi, 2020.

[2] T. Sudargo, H. Freitag, N. A. Kusmayanti, and F. Rosiyani, Pola Makan dan Obesitas. UGM PRESS, 2018.

[3] I. Maryani and I. Irmayansyah, “Penerapan Algoritma Naïve Bayes Untuk Penentuan Diagnosa Obesitas Pada Peserta Sosialisasi Deteksi Dini Penyakit Tidak Menular (PTM),” TeknoIS J. Ilm. Teknol. Inf. dan Sains, vol. 13, no. 2, pp. 234–248, Jul. 2023, doi: 10.36350/jbs.v13i2.200.

[4] A. Rifaldi, I. D. Satrio, and L. A. M. Huda, “Implementasi Algoritma K-nearest neighbor (KNN), Random Forest, Naive Bayes dan Decision Tree untuk mengklasifikasikan tingkat obesitas,” Researchgate.Net, pp. 01–05, 2022, doi: http://dx.doi.org/10.13140/RG.2.2.29928.03841.

[5] A. B. Putri and A. Makmun, “Pola Makan terhadap Obesitas,” Indones. J. Heal., vol. 02, no. 01, pp. 68–76, 2021, doi: 10.33368/inajoh.v2i1.39.

[6] S. K. Saraswati et al., “Literature Review : Faktor Risiko Penyebab Obesitas,” MEDIA Kesehat. Masy. Indones., vol. 20, no. 1, pp. 70–74, Feb. 2021, doi: 10.14710/mkmi.20.1.70-74.

[7] A. Susanto, E. N. Sari, and R. S. Prastiwi, “Analisis Hubungan Perilaku Merokok dengan Obesitas Sentral Pada Orang Dewasa Sehat di Suradadi Kabupaten Tegal,” PREPOTIF J. Kesehat. Masy., vol. 5, no. 2, pp. 1193–1198, Oct. 2021, doi: 10.31004/prepotif.v5i2.2461.

[8] C. Zai, “Implementasi Data Mining Sebagai Pengolahan Data,” J. Portal Data, vol. 2, no. 3, pp. 1–12, 2022.

[9] A. F. Watratan, A. Puspita. B, and D. Moeis, “IMPLEMENTASI AlGORITMA NAIVE BAYES UNTUK MEMPREDIKSI TINGKAT PENYEBARAN COVID,” J. Appl. Comput. Sci. Technol., vol. 1, no. 1, pp. 7–14, 2020, doi: 10.55606/jurritek.v1i1.127.

[10] E. Adhi Guna et al., “Implementasi Algoritma Decision Tree untuk Klasifikasi Data Evaluation Car Menggunakan Python,” J. Sist. Inf. dan Ilmu Komput., vol. 1, no. 4, pp. 167–177, 2023, doi: https://doi.org/10.59581/jusiik-widyakarya.v1i4. 1793.

[11] S. Mahmuda, “Implementasi Metode Random Forest pada Kategori Konten Kanal Youtube,” J. Jendela Mat., vol. 2, no. 01, pp. 21–31, 2024, doi: 10.57008/jjm.v2i01.633.

[12] N. Novianti, S. P. A. Alkadri, and I. Fakhruzi, “Klasifikasi Penyakit Hipertensi Menggunakan Metode Random Forest,” Progresif J. Ilm. Komput., vol. 20, no. 1, p. 380, 2024, doi: 10.35889/progresif.v20i1.1663.

[13] Ainurrohma, “Akurasi Algoritma Klasifikasi pada Software Rapidminer dan Weka,” Prism. Pros. Semin. Nas. Mat., vol. 4, pp. 493–499, 2021.

[14] E. Dwi et al., “Penggunaan Data Mining untuk Prediksi tingkat Obesitas di Meksiko Menggunakan Metode Random Forest,” Agustus, vol. 8, pp. 2549–7952, 2024.

[15] Y. Aulia, A. Andriyansyah, S. Suharjito, and S. W. Nensi, “Analisis Prediksi Stroke dengan Membandingkan Tiga Metode Klasifikasi Decision Tree, Naïve Bayes, dan Random Forest,” J. Ilmu Komput. dan Inform., vol. 3, no. 2, pp. 89–98, 2024, doi: 10.54082/jiki.90.

[16] C. E. Sukmawati, A. Fitri, N. Masruriyah, and A. R. Juwita, “Efektivitas algoritma AdaBoost dan XGBoost pada dataset obesitas populasi dewasa,” vol. 6, no. 2, pp. 101–111, 2024, doi: 10.37905/jji.

[17] K. Maharana, S. Mondal, and B. Nemade, “A review: Data pre-processing and data augmentation techniques,” Glob. Transitions Proc., vol. 3, no. 1, pp. 91–99, 2022, doi: 10.1016/j.gltp.2022.04.020.

[18] V. R. Joseph, “Optimal ratio for data splitting,” Stat. Anal. Data Min., vol. 15, no. 4, pp. 531–538, 2022, doi: 10.1002/sam.11583.

[19] V. Diukarev and Y. Starukhin, “Proposed Methods for Preventing Overfitting in Machine Learning and Deep Learning,” vol. 17, no. 10, pp. 85–94, 2024.