OPTIMASI SUPPORT VECTOR MACHINE (SVM) UNTUK KLASIFIKASI AKUN PALSU PADA MEDIA SOSIAL INSTAGRAM DENGAN SELEKSI FITUR PRINCIPAL COMPONENT ANALYSIS (PCA

Aziz, Waffiq (2023) OPTIMASI SUPPORT VECTOR MACHINE (SVM) UNTUK KLASIFIKASI AKUN PALSU PADA MEDIA SOSIAL INSTAGRAM DENGAN SELEKSI FITUR PRINCIPAL COMPONENT ANALYSIS (PCA. Other thesis, UPN "Veteran" Yogyajarta.

[thumbnail of ABSTRAK.pdf] Text
ABSTRAK.pdf

Download (202kB)
[thumbnail of COVER.pdf] Text
COVER.pdf

Download (190kB)
[thumbnail of DAFTAR ISI.pdf] Text
DAFTAR ISI.pdf

Download (194kB)
[thumbnail of DAFTAR PUSTAKA.pdf] Text
DAFTAR PUSTAKA.pdf

Download (225kB)
[thumbnail of PENGESAHAN PEMBIMBING.pdf] Text
PENGESAHAN PEMBIMBING.pdf

Download (465kB)
[thumbnail of PENGESAHAN PENGUJI.pdf] Text
PENGESAHAN PENGUJI.pdf

Download (405kB)
[thumbnail of SKRIPSI FULL_WAFFIQ AZIZ_123190070.pdf] Text
SKRIPSI FULL_WAFFIQ AZIZ_123190070.pdf
Restricted to Repository staff only

Download (5MB)

Abstract

iv
ABSTRAK
Instagram merupakan media sosial yang memiliki jumlah pengguna aktif tiap
bulannya mencapai dua juta pengguna. Fitur yang ditawarkan oleh instagram tidak hanya
dapat memberikan dampak positif namun dapat dimanfaatkan oleh segelintir orang untuk
kepentingan pribadi yang biasanya dilakukan oleh akun palu. Banyaknya pengguna
instagram berbanding lurus dengan jumlah akun palsu yang beredar dimana akun palsu ini
memiliki dampak negatif terhadap pengguna lainnya diantaranya penipuan, cyberbullying,
spamming, serta penyebaran berita dan informasi palsu. Untuk menjaga kepentingan
pengguna lain serta mengurangi dampak negatif yang diberikan dari banyaknya akun palsu,
penting untuk dilakukan klasifikasi akun palsu menggunakan sistem kecerdasan mesin.
Terdapat beberapa penelitian sebelumnya mengenai topik klasifikasi akun palsu
menggunakan berbagai algoritma diantaranya K-NN, neural network, naive bayes, support
vector machine (SVM), dan model linear. Dari hasil penelitian sebelumnya SVM memiliki
performa yang baik diantara algoritma lainnya, sehingga pada penelitian ini menggunakan
algoritma SVM. Metode SVM memiliki kekurangan dimana kinerjanya sangat bergantung
pada pemilihan fitur. Untuk mengatasi hal tersebut dilakukan optimasi dengan menggunakan
seleksi fitur principal component analysis (PCA) untuk menghilangkan fitur yang tidak atau
kurang penting dengan tujuan meningkatkan kinerja generalisasi, efisiensi, dan akurasi dari
model klasifikasi. Dataset yang digunakan bersumber dari penelitian sebelumnya dengan
topik yang sama mengenai klasifikasi akun palsu yang dibagikan secara publik melalui
GitHub dan digunakan oleh beberapa peneliti lainnya. Dataset tersebut memiliki jumlah data
sebanyak 1194 data.
Dari hasil penelitian dan percobaan yang dilakukan, seleksi fitur menggunakan PCA
didapatkan dari fitur original yang berjumlah sembilan fitur, menjadi enam fitur penting
yakni follower_following_ratio, user_is_private, username_length, user_has_profil_pic,
user_biography_length, dan username_digit_count. Pengujian menggunakan metode 10-
fold cross validation terhadap model SVM dengan kernel RBL, C 10, dan gamma 0.1 yang
dioptimasi dengan seleksi fitur principal component analysis (PCA) dihasilkan akurasi
meningkat sebanyak 2% dengan akurasi sebesar 94.7%.
Kata Kunci : Instagram, akun palsu, support vector machine, principal component analysis,
klasifikasi.
v
ABSTRACK
Instagram is a social media platform with a monthly active user base reaching two
million users. The features offered by Instagram not only have a positive impact but can also
be exploited by some individuals for personal gain, typically carried out by fake accounts.
The increasing number of Instagram users is directly proportional to the proliferation of fake
accounts, which have negative effects on other users, including fraud, cyberbullying,
spamming, and the dissemination of fake news and information. To safeguard the interests
of other users and reduce the negative impact caused by the abundance of fake accounts, it
is important to classify fake accounts using machine learning systems.
Several previous studies have explored the topic of fake account classification using
various algorithms, including K-NN, neural network, naive bayes, support vector machine
(SVM), and linear models. From the results of previous research, SVM has shown good
performance among other algorithms, leading to its selection for this study. The SVM method
has a drawback where its performance heavily relies on feature selection. To address this
issue, optimization was carried out using principal component analysis (PCA) for feature
selection, aiming to eliminate unimportant features and enhance the overall performance,
efficiency, and accuracy of the classification model. The dataset used in this study is sourced
from previous research on the same topic of fake account classification, shared publicly
through GitHub and utilized by several other researchers. The dataset comprises a total of
1194 data points.
From the results of the research and experiments conducted, feature selection using
PCA was obtained from the original features, which amounted to nine features, reduced to
six important features, namely follower_following_ratio, user_is_private, username_length,
user_has_profil_pic, user_biography_length, and username_digit_count. Testing using the
10-fold cross-validation method on the SVM model with RBF kernel, C 10, and gamma 0.1
optimized with principal component analysis (PCA) feature selection resulted in an accuracy
increase of 2%, with an accuracy of 94.7%..
Keyword : Instagram, fake account, support vector machine, principal component analysis,
classification.

Item Type: Thesis (Other)
Uncontrolled Keywords: Instagram, fake account, support vector machine, principal component analysis, classification.
Subjects: Z Bibliography. Library Science. Information Resources > ZA Information resources
Divisions: Faculty of Engineering, Science and Mathematics > School of Engineering Sciences
Depositing User: Eko Yuli
Date Deposited: 14 Dec 2023 03:09
Last Modified: 14 Dec 2023 03:09
URI: http://eprints.upnyk.ac.id/id/eprint/38342

Actions (login required)

View Item View Item