Implementasi SVM Untuk Deteksi Komentar Negatif Berbahasa Indonesia di Twitter

Authors

  • Abdul Rahman Iqbal Teknik Informatika, Institut Teknologi Nasional Bandung
  • Yusup Miftahuddin Teknik Informatika, Institut Teknologi Nasional Bandung

Keywords:

SVM, OCR, Sosial Media, Komentar Negatif, Klasifikasi, Negative Comment

Abstract

ABSTRAK
Perkembangan media sosial sudah semakin pesat, mengingat peran teknologi sudah tidak dapat dilepaskan dari setiap kehidupan manusia. Perbedaan latar belakang pengguna media sosial dapat menimbulkan perbedaan dalam cara berkomunikasi, menyampaikan pendapat, dan cara memandang pendapat dari perspektif yang berbeda, apakah pendapat tersebut positif atau negatif. Tahap awal yang dilakukan dalam penelitian ini adalah proses OCR dimana mengidentifikasi tulisan maupun angka dalam bentuk gambar yang dikonversi menjadi bentuk file teks. Selanjutnya pengolahan text preprocessing meliputi tokenizing, case folding, stopword removal and stemming. Kemudian feature selection bertujuan untuk mendapatkan fitur pada setiap kata untuk dijadikan parameter klasifikasi. Untuk pengambilan keputusan apakah komentar mengandung makna positif atau negatif menggunakan kernel SVM. Data diambil dari media sosial twitter dengan jumlah data komentar 254 data. Berdasarkan hasil dari eksperimen yang dilakukan, kernel Radial Basis Function (RBF) dengan nilai gamma= 0.05, cost= 10 menghasilkan accuracy sebesar 88%, precision 100%, recall 50% dan f1-Score 67%.

ABSTRACT
The development of social networks is increasing rapidly, because the role of technology cannot but update in each person's life. Different backgrounds of social media users can lead to differences in the way you communicate, express different opinions and points of view, whether those opinions are positive or negative. pole. The step taken in this search is the OCR process that identifies the text and numbers as images that originally appeared as a text file. In addition, the word processor preprocessing includes encoding, folding, stopping word deletion, and rooting. Next, object selection is to get the objects in each word to use as the classification parameter. To decide if comments contain positive or negative connotations using the SVM kernel. The data is taken from the social network Twitter with a total of 254 comment data. Based on the results of the experiments performed, the kernel of the radius basis function (RBF) with gamma = 0.05, cost = 10 gives 88% accuracy, 100% precision, 50% recall and f1-Score is 67%.

Published

2022-06-21 — Updated on 2022-07-06

Versions