PENERAPAN NATURAL LANGUAGE PROCESSING (NLP) UNTUK KLASIFIKASI MULTI-LABEL DESKRIPSI GAME BERDASARKAN GENRE MENGGUNAKAN METODE BIDIRECTIONAL ENCODER REPRESENTATIONS FROM TRANSFORMERS (BERT)

Bagaskara, Reza Pramudya (2023) PENERAPAN NATURAL LANGUAGE PROCESSING (NLP) UNTUK KLASIFIKASI MULTI-LABEL DESKRIPSI GAME BERDASARKAN GENRE MENGGUNAKAN METODE BIDIRECTIONAL ENCODER REPRESENTATIONS FROM TRANSFORMERS (BERT). Other thesis, UPN "Veteran" Yogyajarta.

[thumbnail of ABSTRAK.pdf] Text
ABSTRAK.pdf

Download (111kB)
[thumbnail of COVER.pdf] Text
COVER.pdf

Download (91kB)
[thumbnail of DAFTAR ISI.pdf] Text
DAFTAR ISI.pdf

Download (259kB)
[thumbnail of DAFTAR PUSTAKA.pdf] Text
DAFTAR PUSTAKA.pdf

Download (115kB)
[thumbnail of PENGESAHAN PEMBIMBING.pdf] Text
PENGESAHAN PEMBIMBING.pdf

Download (160kB)
[thumbnail of PENGESAHAN PENGUJI.pdf] Text
PENGESAHAN PENGUJI.pdf

Download (212kB)
[thumbnail of SKRIPSI FULL_REZA PRAMUDYA BAGASKARA_123190103.pdf] Text
SKRIPSI FULL_REZA PRAMUDYA BAGASKARA_123190103.pdf
Restricted to Repository staff only

Download (3MB)

Abstract

vi
ABSTRAK
Ketidaktersediaan standar dalam menulis deskripsi game mengakibatkan
ketidaksesuaian antara penjelasan dan genre serta gameplay yang dimiliki. Kurangnya
pedoman menulis deskripsi menciptakan kebebasan bagi pengembang game, namun
seringkali menghasilkan deskripsi yang tidak mencerminkan esensi permainan,
membingungkan konsumen, dan menciptakan ekspektasi yang tidak sesuai. Absennya
standar juga menghambat perbandingan game serupa, menyulitkan konsumen dalam
membuat pilihan, dan berpotensi mengakibatkan kekecewaan serta keputusan
pembelian yang kurang optimal bagi pemain.
Pada penelitian kali ini akan melakukan klasifikasi teks multi label dengan
menggunakan metode BERT (Bidirect Encoder Representations from Transformers).
Penelitian sebelumnya telah mengungkap efektivitas BERT dalam berbagai konteks,
termasuk klasifikasi dan analisis sentimen. Metodologi penelitian terdiri dari studi
literatur, pengumpulan data, pelabelan data, pembagian data, pra-pemrosesan,
penyematan BERT, pemodelan, pengujian. Tujuan dari metode ini adalah untuk
mengembangkan sistem klasifikasi multilabel untuk deskripsi game berdasarkan
genre yang dapat mengidentifikasi genre game dari deskripsi secara akurat.
Data diolah dengan cara membersihkan, mengubah dan membagi data menjadi
data latih dan data uji. Model yang digunakan terdiri dari BERT Embedding, 12
BERT Layer, BERT Pooler, Dropout Layer, dan 6 Linear Layer. Hasil pelatihan
model menunjukkan tingkat akurasi kategorikal dan akurasi validasi yang baik
sehingga mencapai hasil yang positif. Metode BERT memberikan akurasi untuk
setiap kelas berada diatas 0.70, presisi 0.76, recall 0.74, dan F1 0.74. Hasil pengujian
mengkonfirmasi bahwa metode BERT berhasil menangani klasifikasi multi-label
deskripsi game berdasarkan genre.
Kata kunci : Deskripsi Game, Genre, Klasifikasi Multi-label, BERT
vii
ABSTRACT
The lack of standards in writing game descriptions results in a mismatch between
the description and the genre and gameplay. The lack of description writing
guidelines creates freedom for game developers, but often results in descriptions that
do not reflect the essence of the game, confuse consumers, and create inappropriate
expectations. The absence of standards also hinders comparisons of similar games,
making it difficult for consumers to make choices, and potentially resulting in
disappointment and sub-optimal purchase decisions for players.
This research will perform multi-label text classification using the BERT
(Bidirect Encoder Representations from Transformers) method. Previous research
has revealed the effectiveness of BERT in various contexts, including classification
and sentiment analysis. The research methodology consists of literature study, data
collection, data labeling, data sharing, pre-processing, BERT embedding, modeling,
testing. The purpose of this method is to develop a multilabel classification system for
game descriptions based on genre that can accurately identify game genres from
descriptions.
The data is processed by cleaning, transforming and dividing the data into
training data and test data. The model used consists of BERT Embedding, 12 BERT
Layer, BERT Pooler, Dropout Layer, and 6 Linear Layer. The results of the model
training show a high level of categorical accuracy and validation accuracy.
Keywords: Game Description, Genre, Multi-label Classification, BERT

Item Type: Thesis (Other)
Uncontrolled Keywords: Game Description, Genre, Multi-label Classification, BERT
Subjects: H Social Sciences > H Social Sciences (General)
Divisions: Faculty of Engineering, Science and Mathematics > School of Engineering Sciences
Depositing User: Eko Yuli
Date Deposited: 11 Dec 2023 04:04
Last Modified: 11 Dec 2023 04:04
URI: http://eprints.upnyk.ac.id/id/eprint/38317

Actions (login required)

View Item View Item