Akurasi dan Presisi Pengklasifikasian Abstrak Paper Informatika Menggunakan TF-IDF dan Multiclass Support Vector Machine (SVM)
Kata Kunci:
paper, TF-IDF, svm, multiclass, accuracy, precisionAbstrak
ABSTRAK
Pencarian paper membutuhkan waktu yang cukup lama dikarenakan masih banyaknya paper penelitian yang belum diklasifikasikan berdasarkan topik yang dibutuhkan. Text mining merupakan proses untuk menemukan informasi penting pada sekumpulan abstrak sehingga dapat digunakan untuk melakukan klasifikasi paper. Tahapan penelitian dimulai dari pengumpulan abstrak paper, preprocessing, kemudian seleksi fitur menggunakan metode TF-IDF dan terakhir klasifikasi menggunakan metode Support Vector Machine (SVM) dengan teknik multiclass One Against All. Penelitian ini bertujuan untuk mengukur nilai akurasi, dan presisi pada sistem klasifikasi abstrak paper informatika menggunakan metode Support Vector Machine (SVM) dengan teknik multiclass One Against All. Hasil pengujian menggunakan metode split data memperoleh nilai akurasi dan presisi sebesar 96% dan 97%, sementara pengujian data perkelas memperoleh nilai rata-rata akurasi dan presisi secara beruntun sebesar 98% and 96%.
ABSTRACT
Paper trackings require a quite time because there are many paper that has not been classified based on topics needed. Text mining is a process to get information that is essential in a set of abstracts so it could be used to classify paper. Research stages are began by collect paper abstract, preprocessing, then feature selection using TF-IDF method and the last stage is classification using Support Vector Machine (SVM) method with multiclass One Against All technique. This study aims to measure the system classification accuracy and precision in the informatic abstract paper by using Support Vector Machine (SVM) method with multiclass One Against All technique. According the results of research using the split data method obtained accuracy and precision values of 96% and 97% while testing the class data obtains successive accuracy and precision values of 98% and 93%.