Implementasi Teknik Ensemble Stacking pada Klasifikasi Penyakit Anemia
Main Article Content
Abstract
Abstrak— Anemia adalah penyakit yang disebabkan oleh kondisi seseorang yang memiliki kadar hemoglobin (Hb) darah dibawah normal. Deteksi penyakit dapat menggunakan bantuan data mining untuk mengklasifikasikan penyakit. Algoritma yang digunakan dalam penelitian ini adalah Gaussian Naive Bayes, K-Nearest Neighbor dan Support Vector Machine yang kemudian diterapkan pada teknik ensemble stacking. Penerapan Ensemble bertujuan untuk mendapatkan nilai keakurasian yang lebih baik dari klasifikasi individu. Pengujian algoritma ini menggunakan dua teknik pengujian yaitu percentage split dan k-fold cross validation. Untuk percentage split menggunakan ukuran split sebesar 80% data training dan 20% data uji dan pada k-fold cross validation dipilih nilai k=10. Hasil klasifikasi dari algoritma-algoritma tersebut memperoleh bahwa percentage split mendapatkan hasil akurasi yang lebih baik dibandingkan k-fold cross validation. Algoritma Support Vector Machine (SVM), Gaussian Naive Bayes dan k-Nearest Neighbor (kNN) dengan teknik pengujian percentage split memperoleh hasil akurasi secara berturut-turut sebesar 90,16%, 94,61% dan 96,49%. K-Nearest Neighbor (kNN) menghasilkan nilai akurasi tertinggi dari ketiga algoritma tersebut, namun dengan penerapan teknik ensemble memberikan kenaikan akurasi sebesar 1.05% dari hasil k-Nearest Neighbor (kNN). Ensemble dengan model stacking memperoleh hasil akurasi sebesar 97,19%. Berdasarkan hasil yang diperoleh dapat disimpulkan bahwa ensemble dengan model stacking dengan teknik pengujian percentage split memperoleh kinerja yang terbaik dari algoritma lainnya pada klasifikasi penyakit anemnia.
Kata Kunci— Ensemble Learning, Support Vector Machine, Gaussian Naive Bayes, K-Nearest Neighbor, Anemia
Article Details

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
References
[1] M. Yuichi and Y. A. Susetyo, “Klasifikasi Penyakit Migrain dengan Metode Naïve Bayes pada Dataset Kaggle,” J. Indones. Manaj. Inform. dan Komun., no. 1, pp. 139–151, 2025.
[2] N. Fatimah Indrianti, A. Kania Ningsih, and R. Ilyas, “Implementasi Data Mining Untuk Klasifikasi Penyakit Gagal Ginjal Kronis Menggunakan Metode K-Nearest Neighbor,” JATI (Jurnal Mhs. Tek. Inform., vol. 8, no. 2, pp. 2255–2260, 2024, doi: 10.36040/jati.v8i2.9464.
[3] H. Apriyani and K. Kurniati, “Perbandingan Metode Naïve Bayes Dan Support Vector Machine Dalam Klasifikasi Penyakit Diabetes Melitus,” J. Inf. Technol. Ampera, vol. 1, no. 3, pp. 133–143, 2020, doi: 10.51519/journalita.volume1.isssue3.year2020.page133-143.
[4] A. Tangkelayuk, “The Klasifikasi Kualitas Air Menggunakan Metode KNN, Naïve Bayes, dan Decision Tree,” JATISI (Jurnal Tek. Inform. dan Sist. Informasi), vol. 9, no. 2, pp. 1109–1119, 2022, doi: 10.35957/jatisi.v9i2.2048.
[5] W. Ramdhani, D. Bona, R. B. Musyaffa, and C. Rozikin, “Klasifikasi Penyakit Kangker Payudara Menggunakan Algoritma K-Nearest Neighbor,” J. Ilm. Wahana Pendidik., vol. 8, no. 12, pp. 445–452, 2022.
[6] M. D. F. Tino, Herliyani Hasanah, and Tri Djoko Santosa, “Perbandingan Algoritma Support Vector Machines (Svm) Dan Neural Network Untuk Klasifikasi Penyakit Jantung,” INFOTECH J., vol. 9, no. 1, pp. 232–235, 2023, doi: 10.31949/infotech.v9i1.5432.
[7] A. M. Siregar, “Klasifikasi Untuk Prediksi Cuaca Menggunakan Esemble Learning,” Petir, vol. 13, no. 2, pp. 138–147, 2020, doi: 10.33322/petir.v13i2.998.
[8] V. H. Alves Ribeiro, S. Moritz, F. Rehbach, and G. Reynoso-Meza, “A novel dynamic multi-criteria ensemble selection mechanism applied to drinking water quality anomaly detection.,” Sci. Total Environ., vol. 749, p. 142368, Dec. 2020, doi: 10.1016/j.scitotenv.2020.142368.
[9] A. M. Majid and I. Nawangsih, “Perbandingan Metode Ensemble Untuk Meningkatkan Akurasi Algoritm Machine Learning Dalam Memprediksi Penyakit Breast Cancer (Kanker Payudara),” J. SAINTIKOM (Jurnal Sains Manaj. Inform. dan Komputer), vol. 23, no. 1, p. 97, 2024, doi: 10.53513/jis.v23i1.9563.
[10] I.- Ati and A. Kusyanti, “Metode Ensemble Classifier untuk Mendeteksi Jenis Attention Deficit Hyperactivity Disorder (SDHD) pada Anak Usia Dini,” J. Teknol. Inf. dan Ilmu Komput., vol. 6, no. 3, pp. 301–308, 2019, doi: 10.25126/jtiik.2019631313.
[11] E. Cicekyurt, “Anemia Classification with EDA (100% Acc),” Kaggle. [Online]. Available: https://www.kaggle.com/code/emreiekyurt/anemia-classification-with-eda-100-acc/input
[12] Adi Nugroho, Agustinus Bimo Gumelar, Adri Gabriel Sooai, Dyana Sarvasti, and Paul L Tahalele, “Perbandingan Performansi Kinerja Algoritma Pengklasifikasian Terpandu Untuk Kasus Penyakit Kardiovaskular,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 4, no. 5, pp. 998–1006, 2020, doi: 10.29207/resti.v4i5.2316.
[13] S. Prusty, S. Patnaik, and S. K. Dash, “SKCV: Stratified K-fold cross-validation on ML classifiers for predicting cervical cancer,” Front. Nanotechnol., vol. 4, no. August, pp. 1–12, 2022, doi: 10.3389/fnano.2022.972421.
[14] K. Khadijah and R. Kusumaningrum, “Ensemble Classifier untuk Klasifikasi Kanker Payudara,” It J. Res. Dev., vol. 4, no. 1, pp. 61–71, 2019, doi: 10.25299/itjrd.2019.vol4(1).3540.
[15] A. Desiani, M. Akbar, I. Irmeilyana, and A. Amran, “Implementasi Algoritma Naïve Bayes dan Support Vector Machine (SVM) Pada Klasifikasi Penyakit Kardiovaskular,” J. Tek. Elektro dan Komputasi, vol. 4, no. 2, pp. 207–214, 2022, [Online]. Available: http://jurnal.unmuhjember.ac.id/index.php/ELKOM/article/view/7691
[16] A. Zalvadila, “Klasifikasi Penyakit Tanaman Bawang Merah Menggunakan Metode SVM dan CNN,” J. Inform. J. Pengemb. IT, vol. 8, no. 3, pp. 255–260, 2023, doi: 10.30591/jpit.v8i3.5341.
[17] Nurul A’ayunnisa, Y. Salim, and H. Azis, “Analisis Performa Metode Gaussian Naïve Bayes untuk Klasifikasi Citra Tulisan Tangan Karakter Arab,” Indones. J. Data Sci., vol. 3, no. 3, pp. 115–121, 2022, doi: 10.56705/ijodas.v3i3.54.
[18] D. Cahyanti, A. Rahmayani, and S. A. Husniar, “Analisis performa metode Knn pada Dataset pasien pengidap Kanker Payudara,” Indones. J. Data Sci., vol. 1, no. 2, pp. 39–43, 2020, doi: 10.33096/ijodas.v1i2.13.
[19] B. Sunarko et al., “Penerapan Stacking Ensemble Learning untuk Klasifikasi Efek Kesehatan Akibat Pencemaran Udara,” Edu Komputika J., vol. 10, no. 1, pp. 55–63, 2023, doi: 10.15294/edukomputika.v10i1.72080.
[20] S. Wulan Dari and J. Triloka, “Kajian Algoritme Mask Region-Based Convolutional Neural Network (Mask R-CNN) dan You Look Only Once (YOLO) Untuk Deteksi Penyakit Kulit Akibat Infeksi Jamur,” Semin. Nas. Has. Penelit. dan Pengabdi. Masy., pp. 132–138, 2022.