Pengelompokan Lagu Berdasarkan Lirik Menggunakan Metode K-Means Clustering

Putra, Arief Satyatma (2024) Pengelompokan Lagu Berdasarkan Lirik Menggunakan Metode K-Means Clustering. Other thesis, UPN Veteran Yogyakarta.

[thumbnail of ABSTRAK.pdf] Text
ABSTRAK.pdf

Download (129kB)
[thumbnail of COVER.pdf] Text
COVER.pdf

Download (269kB)
[thumbnail of DAFTAR ISI.pdf] Text
DAFTAR ISI.pdf

Download (361kB)
[thumbnail of DAFTAR PUSTAKA.pdf] Text
DAFTAR PUSTAKA.pdf

Download (237kB)
[thumbnail of Halaman_Pengesahan_Pembimbing.pdf] Text
Halaman_Pengesahan_Pembimbing.pdf

Download (1MB)
[thumbnail of Halaman_Pengesahan_Penguji.pdf] Text
Halaman_Pengesahan_Penguji.pdf

Download (970kB)
[thumbnail of SKRIPSI FULL_ARIEF SATYATMA PUTRA_123180107.pdf] Text
SKRIPSI FULL_ARIEF SATYATMA PUTRA_123180107.pdf
Restricted to Repository staff only

Download (2MB)

Abstract

vi
ABSTRAK
Di era digital saat ini, manusia sangat mudah bila ingin mendengarkan sebuah
lagu. Kemudahan tersebut didukung dengan banyaknya platform yang menyediakan
layanan streaming atau download dan dapat dilakukan dimana saja. Platform online
yang dimaksud adalah platform yang memerlukan koneksi internet untuk
mengaksesnya seperti, Youtube Music, Spotify, Joox, SoundCloud, dsbg. Sedangkan
untuk platform offline merupakan platform yang menggunakan sinyal untuk
mengaksesnya, seperti radio. Dalam hal ini terdapat salah satu lembaga yang memiliki
wewenang untuk mengatur dan melakukan pengawasan konten, yaitu KPI (Komisi
Penyiaran Indonesia). Beberapa lagu yang disiarkan di radio, memiliki lirik yang
terkesan cabul, vulgar, mengandung unsur seksual, dan kasar terutama pada lagu
berbahasa asing. K-Means Clustering merupakan metode yang digunakan untuk
mempartisi data ke dalam sebuah kelompok. Metode ini akan mempartisi data yang
memiliki ciri yang sama kedalam sebuah cluster atau kelompok, dan begitu juga
sebaliknya. K-Means Clustering juga memiliki kelemahan, yaitu hasil
pengelompokkan dari K-Means Clustering sangat bergantung dengan inisialisasi awal
dalam proses pengelompokkannya. Unuk melihat kekuatan struktur dari cluster yang
telah terbentuk, maka metode Silhouette Coefficient dipilih. Pada penelitian ini
dilakukan tiga skenario pengujian yang berfokus untuk melakukan imporvisasi dan
melihat pengaruh inisialisasi terhadap metode K-Means Clustering, serta mencari
inisialisasi mana yang memiliki nilai Silhouette Coefficient terbaik. Pengujian skenario
pertama akan menggunakan penentuan insialisasi titik centroid yang telah ditentukan.
Kemudian pengujian skenario kedua akan menggunakan inisialisasi acak dengan
parameter ‘k-means++’ dengan perhitungan jarak yang lebih cerdas. Untuk pengujian
skenario ketiga akan menggunakan inisialisasi dengan parameter default dari K-Means
Clustering ‘random’ yaitu secara acak. Dari 3 skenario yang dilakukan menghasilkan
nilai silhouette sebesar 0,67 pada skenario pertama, kemudian skenario kedua 0,668,
kemudian skenario ketiga menghasilkan 0,665. Ketiganya termasuk kedalam cluster
yang memiliki kekuatan struktur yang baik, namun skenario pertama menghasilkan
hasil yang paling baik.
Kata Kunci : Pengelompokan lagu, Klustering, Silhouette Coefficient, K-Means
Clustering
vii
ABSTRACT
In the current digital era, it is very easy for people to listen to a song. This convenience
is supported by the many platforms that provide streaming or download services and
can be done anywhere. The online platforms in question are platforms that require an
internet connection to access them, such as YouTube Music, Spotify, Joox,
SoundCloud, etc. Meanwhile, offline platforms are platforms that use signals to access
them, such as radio. In this case, there is one institution that has the authority to
regulate and supervise content, namely KPI (Indonesian Broadcasting Commission).
Several songs broadcast on the radio have lyrics that seem obscene, vulgar, contain
sexual elements and are rude, especially in foreign language songs. K-Means
Clustering is a method that is suitable for partitioning data into one or more clusters
or groups. This method will partition data that is similar and has the same
characteristics into a cluster or group, and data that has different characteristics will
be grouped into other groups. K-Means Clustering also has a weakness, namely that
the grouping results from K-Means Clustering are very dependent on the initial
initialization in the grouping process. To see the structural strength of the clusters that
have been formed, the Silhouette Coefficient method was chosen. In this research, three
test skenarios were carried out which focused to improve and seeing the effect of
initialization on the K-Means Clustering method, as well as finding which initialization
had the best Silhouette Coefficient value. The first skenario test will use the
initialization of the centroid points that have been determined. Then the second
skenario test will use random initialization with 'k-means++' parameters with smarter
distance calculations. For testing the third skenario we will use initialization with the
default parameters of K-Means Clustering 'random', namely randomly. The 3
skenarios carried out resulted in a silhouette value of 0.67 in the first skenario, then in
the second skenario 0.668, then in the third skenario it resulted in 0.665. All three are
included in the cluster that has good structural strength, but the first skenario produces
the best results.
Keywords: Song grouping, Clustering, Silhouette Coefficient, K-Means Clustering

Item Type: Thesis (Other)
Uncontrolled Keywords: Song grouping, Clustering, Silhouette Coefficient, K-Means Clustering
Subjects: Z Bibliography. Library Science. Information Resources > ZA Information resources
Divisions: Faculty of Engineering, Science and Mathematics > School of Engineering Sciences
Depositing User: Eko Yuli
Date Deposited: 20 May 2024 03:34
Last Modified: 20 May 2024 03:34
URI: http://eprints.upnyk.ac.id/id/eprint/39465

Actions (login required)

View Item View Item