Sistem Automatic Speech Recognition Menggunakan PCA dan VQ Untuk Deteksi Kemiripan Kata Bahasa Sunda

Authors

  • Ni Komang Intan Tri Pujiani Teknik Informatika, Institut Teknologi Nasional Bandung
  • Yusup Miftahuddin Teknik Informatika, Institut Teknologi Nasional Bandung

Keywords:

Voice Recognition, Principal Component Analysis, Vector Quantization

Abstract

ABSTRAK
Teknologi pengenalan ucapan dapat diimplementasikan dalam mengenali apa yang diucapkan oleh seseorang. Dalam penelitian ini, teknologi akan diimplementasikan dalam pengenalan ucapan untuk mengenali bila seseorang salah dalam mengucapkan sebuah kata yang mempunyai tingkat kemiripan relatif tinggi. Untuk itu diperlukan suatu sistem yang bisa mengidentifikasi kata yang sudah diucapkan menggunakan dan memanfaatkan teknologi (voice recognition). Sistem dalam mengenali suara yang telah diucapkan dengan menggunakan cara mendapatkan masukkan suara menggunakan format *.wav yang nantinya akan diekstraksi cirinya memakai metode Principal Component Analysis (PCA) kemudian diidentifikasi suara memakai metode Vector Quantization (VQ). Pada penelitian ini, pengujian dilakukan dengan menggunakan codebook ukuran 32, 64, 128, 256, 512, dan 1024. Pengujian dilakukan menggunakan 8 pasangan kata pada Bahasa sunda menggunakan tingkat kemiripan yang tinggi dan sering kali tertukar. Hasil pengujian ini dapat disimpulkan bahwa penggunaan codebook dapat mempengaruhi tingkat akurasinya, penggunaan ukuran codebook 128 memiliki tingkat akurasi rata-rata terbesar dari setiap pasangan kata yaitu 79,8%

ABSTRACT
Voice Recognition technology can be used to recognize what someone is saying. In this research technology will be used in speech recognition to detect when someone is pronouncing a word incorrectly due to a high degree of similarity. Therefore, we need a system capable of recognizing speech with the help of technology (speech recognition). The system detects the voice by taking input in *.wav format, extracting the voice using the Principal Component Analysis (PCA) approach, and then identifying it using the Vector Quantization (VQ) method. Testing was performed with codebook sizes of 32, 64, 128, 256, 512 dan 1024 in this study. The test was run in 8 sets of Sundanese switch a high degree of similarity. Codebook usage accuracy may vary depending on test results. Using code size 128 had the highest average accuracy rate for each word pair, 79.8%.

Published

2022-06-21 — Updated on 2022-07-06

Versions