IMPLEMENTASI ALGORITMA PARTITION AROUND MEDOIDS (PAM) UNTUK PENGELOMPOKAN PENYEBARAN PENYAKIT DIARE DI YOGYAKARTA

PRAKASA, RAKHMADI BANGKIT (2022) IMPLEMENTASI ALGORITMA PARTITION AROUND MEDOIDS (PAM) UNTUK PENGELOMPOKAN PENYEBARAN PENYAKIT DIARE DI YOGYAKARTA. UNSPECIFIED thesis, UPN "Veteran" Yogyakarta.

[thumbnail of COVER.pdf]
Preview
Text
COVER.pdf

Download (426kB) | Preview
[thumbnail of DAFTAR ISI.pdf]
Preview
Text
DAFTAR ISI.pdf

Download (189kB) | Preview
[thumbnail of DAFTAR PUSTAKA.pdf]
Preview
Text
DAFTAR PUSTAKA.pdf

Download (305kB) | Preview
[thumbnail of PENGESAHAN PEMBIMBING.pdf]
Preview
Text
PENGESAHAN PEMBIMBING.pdf

Download (546kB) | Preview
[thumbnail of Full-Skripsi-Rakhmadi-Bangkit-P-123140185.pdf] Text
Full-Skripsi-Rakhmadi-Bangkit-P-123140185.pdf
Restricted to Repository staff only

Download (1MB)

Abstract

ABSTRAK
Diare merupakan penyakit yang tidak asing terdengar dikalangan masyarakat
Indonesia, termasuk Yogyakarta. Penyakit ini bisa terjadi kapan saja dan pada siapa saja,
mulai dari kalangan anak-anak sampai kalangan dewasa. Diare merupakan sebuah penyakit
gangguan pada saluran pencernaan tubuh, dimana tinja atau feses berubah menjadi cair dan
terjadi 4 kali atau lebih dalam kurun waktu 24 jam. Penyakit ini disertai dengan rasa sakit
perut, mulas yang berkepanjangan, dehidrasi dan sering mual serta muntah. Penyakit diare
dapat disebabkan dari pola konsumsi makanan yang terkontaminasi oleh beberapa bakteri,
dan virus yang muncul di tempat yang kurang bersih. Sudah sewajarnya kebersihan
lingkungan dan makanan menjadi perhatian utama bagi masyarakat, agar terhindar dari
penyakit diare.
Penerapan Algoritma PAM untuk mengelompokan penyebaran penyakit diare
diwilayah Yogyakarta. Algoritma PAM merupakan sebuah algoritma yang
merepresentasikan cluster yang dibentuk menggunakan medoids. Proses pembentukan
cluster dimulai dengan menentukan k objek dari dataset secara acak sebagai medoid,
selanjutnya hitung cost setiap objek non-medoid dengan k objek, cost terkecil setiap objek
non-medoid terhadap medoid akan masuk dalam cluster dimana medoid tersebut berada.
Perhitungan euclidean memproses cluster berupa data mentah penyakit diare. Menghitung
jumlah kasus, jumlah kasus untuk cluster tinggi dan jumlah kasus untuk cluster rendah. Dan
sebelum itu memproses data cleanning untuk menghilangkan data yang tidak perlu.
Selanjutnya transformasi data dimana menginisialisasi data ke dalam bentuk numerik,
kemudian normalisasi data min-max agar data jatuh dalam range tertentu. Proses terakhir
adalah seleksi data atribut untuk memilih atribut mana yang digunakan menggunakan PCA
(Principal component analysis). Setelah mendapatkan hasil dari Algoritma PAM
perhitungan Euclidean maka dilakukan uji validasi dengan Silhoutte Index.
Perbedaan penelitian ini dengan penelitian sebelumnya adalah pada proses clustering
dimana menggunakan perhitungan Euclidean. Algoritma PAM adalah salah satu metode
clustering dari data mining yang digunakan untuk mengelompokkan suatu data. Berdasarkan
dari hasil analisis, perancangan dan hasil pengujian yang telah dilakukan, maka dapat
simpulan yang dapat diambil dari penelitian ini antara lain, Data mining dengan algoritma
PAM (euclidean) dapat diterapkan untuk mengelompokan penyebaran penyakit diare,
Sistem dapat mengetahui cluster tinggi dan cluster rendah dari sample data penduduk
Yogyakarta 2020. Pada penelitian selanjutnya dapat membandingkan hasil yang diperoleh
dengan memanfaatkan algoritma PAM (euclidean) lainya seperti algoritma PAM (chebyshev
atau manhattan) sehingga dapat disimpulkan metode yang paling tepat untuk menganalisa
data yang sangat besar.
Kata Kunci: Diare, Clustering, Algoritma PAM, Euclidean Distance.ABSTRACT
Diarrhea is a disease that is familiar to the people of Indonesia, including Yogyakarta.
This disease can occur at any time and to anyone, from children to adults. Diarrhea is a
disease of the digestive tract of the body, where the stool or feces turns into liquid and occurs
4 or more times within 24 hours. The disease is accompanied by abdominal pain, prolonged
heartburn, dehydration and frequent nausea and vomiting. Diarrhea can be caused by
consumption patterns of food contaminated by several bacteria and viruses that appear in
less clean places. It is natural that environmental and food hygiene is the main concern for
the community, in order to avoid diarrheal diseases.
Application of the PAM Algorithm to classify the spread of diarrheal diseases in the
Yogyakarta region. The PAM algorithm is an algorithm that represents clusters formed using
medoids. The cluster formation process begins by randomly determining k objects from the
dataset as medoids, then calculating the cost of each non-medoid object with k objects, the
smallest cost of each non-medoid object to the medoid will be included in the cluster where
the medoid is located. Using the clustering datamining method using the PAM (Partition
Around Medoids) algorithm to classify the spread of diarrhea in the Yogyakarta area.
Euclidean calculations process clusters in the form of raw data for diarrheal diseases.
Counting the number of cases, the number of cases for the high cluster and the number of
cases for the low cluster. And before that process data cleaning to remove unnecessary data.
Furthermore, data transformation which initializes data into numeric form, then normalizes
min-max data so that the data falls within a certain range. The last process is the selection of
attribute data to choose which attributes to use using PCA (Principal component analysis).
After getting the results from the Euclidean PAM Algorithm, a validation test is carried out
with the Silhouette Index.
The difference between this research and previous research is in the clustering
process which uses Euclidean calculations. The PAM algorithm is one of the clustering
methods of data mining that is used to group data. Based on the results of the analysis, design
and test results that have been carried out, conclusions can be drawn from this study, among
others, Data mining with the PAM (Euclidean) algorithm can be applied to classify the
spread of diarrheal disease, the system can determine the high and low clusters of sample
data for the population of Yogyakarta 2020. In future research, we can compare the results
obtained using other PAM (euclidean) algorithms such as the PAM algorithm (chebyshev or
manhattan) so that it can be concluded that the most appropriate method for analyzing very
large data.
Keywords: Diarrhea, Clustering, PAM Algorithm, Euclidean Distance.

Item Type: Thesis (UNSPECIFIED)
Uncontrolled Keywords: ABSTRAK Diare merupakan penyakit yang tidak asing terdengar dikalangan masyarakat Indonesia, termasuk Yogyakarta. Penyakit ini bisa terjadi kapan saja dan pada siapa saja, mulai dari kalangan anak-anak sampai kalangan dewasa. Diare merupakan sebuah penyakit gangguan pada saluran pencernaan tubuh, dimana tinja atau feses berubah menjadi cair dan terjadi 4 kali atau lebih dalam kurun waktu 24 jam. Penyakit ini disertai dengan rasa sakit perut, mulas yang berkepanjangan, dehidrasi dan sering mual serta muntah. Penyakit diare dapat disebabkan dari pola konsumsi makanan yang terkontaminasi oleh beberapa bakteri, dan virus yang muncul di tempat yang kurang bersih. Sudah sewajarnya kebersihan lingkungan dan makanan menjadi perhatian utama bagi masyarakat, agar terhindar dari penyakit diare. Penerapan Algoritma PAM untuk mengelompokan penyebaran penyakit diare diwilayah Yogyakarta. Algoritma PAM merupakan sebuah algoritma yang merepresentasikan cluster yang dibentuk menggunakan medoids. Proses pembentukan cluster dimulai dengan menentukan k objek dari dataset secara acak sebagai medoid, selanjutnya hitung cost setiap objek non-medoid dengan k objek, cost terkecil setiap objek non-medoid terhadap medoid akan masuk dalam cluster dimana medoid tersebut berada. Perhitungan euclidean memproses cluster berupa data mentah penyakit diare. Menghitung jumlah kasus, jumlah kasus untuk cluster tinggi dan jumlah kasus untuk cluster rendah. Dan sebelum itu memproses data cleanning untuk menghilangkan data yang tidak perlu. Selanjutnya transformasi data dimana menginisialisasi data ke dalam bentuk numerik, kemudian normalisasi data min-max agar data jatuh dalam range tertentu. Proses terakhir adalah seleksi data atribut untuk memilih atribut mana yang digunakan menggunakan PCA (Principal component analysis). Setelah mendapatkan hasil dari Algoritma PAM perhitungan Euclidean maka dilakukan uji validasi dengan Silhoutte Index. Perbedaan penelitian ini dengan penelitian sebelumnya adalah pada proses clustering dimana menggunakan perhitungan Euclidean. Algoritma PAM adalah salah satu metode clustering dari data mining yang digunakan untuk mengelompokkan suatu data. Berdasarkan dari hasil analisis, perancangan dan hasil pengujian yang telah dilakukan, maka dapat simpulan yang dapat diambil dari penelitian ini antara lain, Data mining dengan algoritma PAM (euclidean) dapat diterapkan untuk mengelompokan penyebaran penyakit diare, Sistem dapat mengetahui cluster tinggi dan cluster rendah dari sample data penduduk Yogyakarta 2020. Pada penelitian selanjutnya dapat membandingkan hasil yang diperoleh dengan memanfaatkan algoritma PAM (euclidean) lainya seperti algoritma PAM (chebyshev atau manhattan) sehingga dapat disimpulkan metode yang paling tepat untuk menganalisa data yang sangat besar. Kata Kunci: Diare, Clustering, Algoritma PAM, Euclidean Distance.ABSTRACT Diarrhea is a disease that is familiar to the people of Indonesia, including Yogyakarta. This disease can occur at any time and to anyone, from children to adults. Diarrhea is a disease of the digestive tract of the body, where the stool or feces turns into liquid and occurs 4 or more times within 24 hours. The disease is accompanied by abdominal pain, prolonged heartburn, dehydration and frequent nausea and vomiting. Diarrhea can be caused by consumption patterns of food contaminated by several bacteria and viruses that appear in less clean places. It is natural that environmental and food hygiene is the main concern for the community, in order to avoid diarrheal diseases. Application of the PAM Algorithm to classify the spread of diarrheal diseases in the Yogyakarta region. The PAM algorithm is an algorithm that represents clusters formed using medoids. The cluster formation process begins by randomly determining k objects from the dataset as medoids, then calculating the cost of each non-medoid object with k objects, the smallest cost of each non-medoid object to the medoid will be included in the cluster where the medoid is located. Using the clustering datamining method using the PAM (Partition Around Medoids) algorithm to classify the spread of diarrhea in the Yogyakarta area. Euclidean calculations process clusters in the form of raw data for diarrheal diseases. Counting the number of cases, the number of cases for the high cluster and the number of cases for the low cluster. And before that process data cleaning to remove unnecessary data. Furthermore, data transformation which initializes data into numeric form, then normalizes min-max data so that the data falls within a certain range. The last process is the selection of attribute data to choose which attributes to use using PCA (Principal component analysis). After getting the results from the Euclidean PAM Algorithm, a validation test is carried out with the Silhouette Index. The difference between this research and previous research is in the clustering process which uses Euclidean calculations. The PAM algorithm is one of the clustering methods of data mining that is used to group data. Based on the results of the analysis, design and test results that have been carried out, conclusions can be drawn from this study, among others, Data mining with the PAM (Euclidean) algorithm can be applied to classify the spread of diarrheal disease, the system can determine the high and low clusters of sample data for the population of Yogyakarta 2020. In future research, we can compare the results obtained using other PAM (euclidean) algorithms such as the PAM algorithm (chebyshev or manhattan) so that it can be concluded that the most appropriate method for analyzing very large data. Keywords: Diarrhea, Clustering, PAM Algorithm, Euclidean Distance.
Subjects: Z Bibliography. Library Science. Information Resources > ZA Information resources
Divisions: Faculty of Engineering, Science and Mathematics > School of Engineering Sciences
Depositing User: Eko Yuli
Date Deposited: 18 May 2022 06:35
Last Modified: 21 Nov 2022 08:53
URI: http://eprints.upnyk.ac.id/id/eprint/27963

Actions (login required)

View Item View Item