PENGARUH TEKNIK OVERSAMPLING PADA ALGORITMA MACHINE LEARNING DALAM KLASIFIKASI BODY MASS INDEX (BMI)

Isi Artikel Utama

Isnayni Feby Hawari
Mohamad Khoirun Najib
Sri Nurdiati
Yosef Felix Ygga Marpaung
Nindi Kusumawati
Meyliana Nurfadila
Kathleen Rabika Sijabat
Banissa Fathimatuzzahra Hernawan

Abstrak

BMI menjadi dasar klasifikasi berat badan seseorang yang dapat mengindikasikan adanya penyakit berbahaya seperti obesitas. Banyak penelitian yang melakukan klasifikasi BMI menggunakan berbagai algoritma machine learning. Berbagai teknik dilakukan untuk meningkatkan akurasi model, salah satunya penerapan teknik oversampling untuk menangani ketidakseimbangan data. Penelitian ini bertujuan untuk membandingkan pengaruh ada dan tidaknya teknik oversampling pada algoritma KNN, random forest, dan SVM. Data yang digunakan merupakan data real klasifikasi BMI yang mencakup informasi seperti jenis kelamin, tinggi badan, berat badan, dan indeks BMI. Tahapan yang dilakukan dalam penelitian ini meliputi data pre-processing, eksplorasi data, pelatihan dan pengujian model, evaluasi model, tuning hyperparameter, serta mengidentifikasi feature importance. Tahap eksplorasi data menunjukkan bahwa berat badan merupakan variabel yang memiliki korelasi paling kuat dengan indeks BMI yaitu sebesar 0.8 serta tidak ada multikolinearitas antar variabel. Hasil evaluasi model menggunakan confusion matrix yang didasarkan pada nilai F1-score menunjukkan bahwa model SVM tanpa penerapan teknik oversampling yang telah dilakukan tuning hyperparameter merupakan model terbaik pada penelitian ini dengan nilai F1-score lebih dari 0.95. Identifikasi feature importance dengan metode PFI pada model terbaik menunjukkan bahwa berat badan merupakan variabel yang paling mempengaruhi indeks BMI.

Rincian Artikel

Bagian
Algebra