IMPLEMENTASI FRAMEWORK CRISP-DM UNTUK PREDIKSI KUALITAS AIR SUNGAI DI KOTA YOGYAKARTA MENGGUNAKAN ALGORITMA RANDOM FOREST

FADHILA, HASNA LUTHFIANA (2024) IMPLEMENTASI FRAMEWORK CRISP-DM UNTUK PREDIKSI KUALITAS AIR SUNGAI DI KOTA YOGYAKARTA MENGGUNAKAN ALGORITMA RANDOM FOREST. Diploma thesis, UPN Veteran Yogyakarta.

[thumbnail of 1. COVER.pdf] Text
1. COVER.pdf

Download (126kB)
[thumbnail of 2. ABSTRAK.pdf] Text
2. ABSTRAK.pdf

Download (235kB)
[thumbnail of 3. LEMBAR PENGESAHAN.pdf] Text
3. LEMBAR PENGESAHAN.pdf

Download (516kB)
[thumbnail of 4. DAFTAR ISI.pdf] Text
4. DAFTAR ISI.pdf

Download (254kB)
[thumbnail of 5. DAFTAR PUSTAKA.pdf] Text
5. DAFTAR PUSTAKA.pdf

Download (188kB)
[thumbnail of 6. FULL SKRIPSI_124200060_HASNA LUTHFIANA FADHILA.pdf] Text
6. FULL SKRIPSI_124200060_HASNA LUTHFIANA FADHILA.pdf
Restricted to Repository staff only

Download (3MB)

Abstract

Proses analisis dan klasifikasi kualitas air sungai yang digunakan oleh DLH Kota
Yogyakarta sangat panjang. Selain itu, data historis kualitas air sungai yang dimiliki oleh
DLH Kota Yogyakarta hanya digunakan untuk pelabelan status mutu air, tanpa eksplorasi
lebih lanjut mengenai pola-pola yang ada. Penelitian ini bertujuan untuk memberikan
alternatif baru kepada DLH Kota Yogyakarta dengan membangun sistem prediksi kualitas
air sungai menggunakan algoritma Random Forest dan kerangka kerja CRISP-DM, serta
memberikan analisis terkait pola-pola data yang ditemukan selama proses pembuatan model
prediksi.
Penelitian ini menggunakan kerangka kerja CRISP-DM yang terdiri dari tahapan
business understanding, data understanding, data preparation, modeling, evaluation, dan
deployment. Data yang digunakan dalam penelitian ini adalah data kualitas air sungai Kota
Yogyakarta tahun 2022–2023, yang telah dilabeli dengan status mutu oleh DLH Kota
Yogyakarta berdasarkan PermenLHK No. 27 tahun 2021. Dataset ini terdiri dari 342 baris
data dengan delapan parameter sebagai fitur dan satu atribut sebagai label. Empat skenario
data preprocessing diterapkan untuk menangani missing values dan outlier. Algoritma
Random Forest digunakan untuk membangun model prediksi, dan hasil modeling dievaluasi
menggunakan confusion matrix.
Hasil penelitian menunjukkan bahwa algoritma Random Forest menghasilkan akurasi
sebesar 95% dalam prediksi kualitas air sungai. Fecal Coliform adalah parameter yang
paling signifikan dalam menentukan kualitas air, diikuti oleh pH dan Chemical Oxygen
Demand (COD). Dissolved Oxygen (DO), Biochemical Oxygen Demand (BOD), Fosfat,
Total Suspended Solids (TSS), dan Nitrat (N) juga berkontribusi terhadap prediksi kualitas
air, namun dengan pengaruh yang lebih kecil. Model dengan delapan fitur sesuai dengan
PermenLHK No. 27 tahun 2021 terbukti lebih optimal dibandingkan dengan model yang
menggunakan pengurangan fitur. Sistem prediksi kualitas air sungai yang dibangun berbasis
website memungkinkan DLH Kota Yovyakarta untuk melakukan prediksi kualitas air secara
mandiri dan efisien tanpa memerlukan keahlian teknis yang mendalam dalam machine
learning atau pemrograman.

Kata kunci: kualitas air sungai, CRISP-DM, random forest, prediksi

Item Type: Thesis (Diploma)
Uncontrolled Keywords: kualitas air sungai, CRISP-DM, random forest, prediksi
Subjects: Q Science > Q Science (General)
Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Q Science > QA Mathematics > QA76 Computer software
Divisions: Faculty of Engineering, Science and Mathematics > School of Electronics and Computer Science
Depositing User: Bayu Setya Pambudi
Date Deposited: 24 Jul 2024 02:59
Last Modified: 24 Jul 2024 02:59
URI: http://eprints.upnyk.ac.id/id/eprint/40375

Actions (login required)

View Item View Item