PERBANDINGAN ALGORITMA HDBSCAN DAN AGGLOMERATIVE HIERARCHICAL CLUSTERING DALAM KLASTERISASI PADA DATA YANG MENGANDUNG PENCILAN
Isi Artikel Utama
Abstrak
Penelitian ini membandingkan performa algoritma HDBSCAN dan tiga metode hierarki agglomerative yaitu ward, rataan dan lengkap dalam mengelompokkan data Produk Domestik Regional Bruto Atas Dasar Harga Konstan (PDRB ADHK) Provinsi Jawa Timur Tahun 2023 yang mengandung pencilan. Data tersebut meliputi 17 variabel dengan 234 observasi. Metode ward, rata-rata dan lengkap hanya mampu menghasilkan gerombol tanpa penciri khas untuk amatan pencilan berbeda dengan metode HDBSCAN. Hasil evaluasi model HDBSCAN memiliki nilai terbaik pada semua ukuran evaluasi dan mampu mendeteksi pencilan secara otomatis. Sebaliknya, metode ward, rata-rata dan lengkap belum mampu menangani pencilan secara khusus. Berdasarkan hal tersebut, disimpulkan bahwa untuk data berpencilan, HDBSCAN lebih optimal dibanding metode hierarki agglomerative lainnya karena mampu mengelompokkan data secara konsisten serta mendeteksi dan mengelola pencilan secara efektif.
Kata Kunci: HDBSCAN, Gerombol, PDRB, Pencilan
Rincian Artikel

Artikel ini berlisensiCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.