Klasifikasi Kualitas Air Layak Minum Menggunakan Algoritma Genetika dan Random Forest

Authors

  • Ni Made Ayu Pranasanthi Dewi Universitas Udayana Author
  • I Made Widiartha Universitas Udayana Author
  • I Dewa Made Bayu Atmaja Darmawan Universitas Udayana Author
  • I Gusti Agung Gede Arya Kadyanan Universitas Udayana Author

DOI:

https://doi.org/10.24843/

Keywords:

random forest, klasifikasi, kualitas air, algoritma genetika, seleksi fitur, machine learning

Abstract

Akses terhadap air minum yang aman merupakan kebutuhan dasar yang krusial bagi kesehatan masyarakat, namun pemantauan kualitas air secara manual melalui laboratorium sering terkendala biaya dan waktu. Penelitian ini bertujuan mengimplementasikan model artificial intelligence untuk klasifikasi kualitas air layak minum (potable) dan tidak layak minum (non-potable) dengan mengoptimalkan Random Forest melalui seleksi fitur menggunakan Algoritma Genetika. Penggunaan Algoritma Genetika dimaksudkan untuk mengatasi tantangan pemilihan fitur yang relevan. Penelitian menggunakan Water Quality Dataset dengan 3.276 data dan 10 atribut. Tahapan pengolahan meliputi penanganan missing value, Winsorization, Min-Max Normalization, Random Oversampling, seleksi fitur dengan Algoritma Genetika, dan klasifikasi Random Forest. Hasil menunjukkan seleksi fitur menghasilkan subset terbaik dengan fitness 73,76%. Hasil klasifikasi ini kemudian dilakukan validasi K-Fold Cross Validation, mendapatkan hasil model dengan seleksi fitur mengalami penurunan akurasi dari 68,57% menjadi 66,58% dan presisi dari 64,86% menjadi 60,00%. Namun, recall meningkat dari 48,45% menjadi 51,66% serta F1-score dari 55,28% menjadi 55,47%, menunjukkan peningkatan kemampuan mengenali kelas minoritas meskipun berdampak pada penurunan performa pada kelas mayoritas.

Downloads

Published

2026-06-12