Klasifikasi Kualitas Air Layak Minum Menggunakan Algoritma Genetika dan Random Forest
DOI:
https://doi.org/10.24843/Keywords:
random forest, klasifikasi, kualitas air, algoritma genetika, seleksi fitur, machine learningAbstract
Akses terhadap air minum yang aman merupakan kebutuhan dasar yang krusial bagi kesehatan masyarakat, namun pemantauan kualitas air secara manual melalui laboratorium sering terkendala biaya dan waktu. Penelitian ini bertujuan mengimplementasikan model artificial intelligence untuk klasifikasi kualitas air layak minum (potable) dan tidak layak minum (non-potable) dengan mengoptimalkan Random Forest melalui seleksi fitur menggunakan Algoritma Genetika. Penggunaan Algoritma Genetika dimaksudkan untuk mengatasi tantangan pemilihan fitur yang relevan. Penelitian menggunakan Water Quality Dataset dengan 3.276 data dan 10 atribut. Tahapan pengolahan meliputi penanganan missing value, Winsorization, Min-Max Normalization, Random Oversampling, seleksi fitur dengan Algoritma Genetika, dan klasifikasi Random Forest. Hasil menunjukkan seleksi fitur menghasilkan subset terbaik dengan fitness 73,76%. Hasil klasifikasi ini kemudian dilakukan validasi K-Fold Cross Validation, mendapatkan hasil model dengan seleksi fitur mengalami penurunan akurasi dari 68,57% menjadi 66,58% dan presisi dari 64,86% menjadi 60,00%. Namun, recall meningkat dari 48,45% menjadi 51,66% serta F1-score dari 55,28% menjadi 55,47%, menunjukkan peningkatan kemampuan mengenali kelas minoritas meskipun berdampak pada penurunan performa pada kelas mayoritas.