Pengaruh Data Balancing Pada Klasifikasi Pneumonia Menggunakan VGG16

Penulis

  • MUHAMMAD HARITS RASYID RAMADHAN Program Studi Informatika, Institut Teknologi Nasional
  • YUSUP MIFTAHUDDIN Program Studi Informatika, Institut Teknologi Nasional

Kata Kunci:

Kecerdasan Buatan

Abstrak

With the development of technology, especially in the field of artificial intelligence, now diseases can be identified through pictures or images. One of them is that pneumonia can be classified using x-ray images of the lungs. However, the problem that is still an obstacle to achieving good classification results is the large number of datasets out there that do not have a balanced amount of data. This will result in classification results that tend towards classes that have more data. One way to overcome this problem is to perform data balancing on the dataset used, one of which is Random Oversampling (ROS). In this study, it is proposed to test the VGG16 model without data balancing and VGG16 with data balancing. The results show that the VGG16 model without data balancing has an average accuracy of 73% by experiencing many false positive classifications, while the VGG16 model with data balancing has succeeded in reducing the false positive classification rate and the average accuracy results are 83%.

Abstrak 

Dengan berkembangnya teknologi khususnya pada bidang artificial intelligence (kecerdasan buatan), kini penyakit dapat diidentifikasi melalui gambar atau citra. Salah satunya adalah penyakit pneumonia dapat diklasifikasikan dengan menggunakan citra x-ray paru-paru. Namun permasalahan yang masih menjadi halangan untuk mencapai hasil klasifikasi yang baik adalah banyaknya dataset diluar sana yang tidak mempunyai jumlah data seimbang. Hal ini akan mengakibatkan hasil klasifikasi yang kecenderungan terhadap kelas yang memiliki jumlah data lebih banyak. Salah satu cara untuk mengatasi masalah tersebut adalah dengan melakukan data balancing terhadap dataset yang digunakan, salah satunya adalah Random Oversampling (ROS). Pada penelitian ini diusulkan pengujian antara model VGG16 tanpa data balancing dengan VGG16 dengan data balancing. Hasil menunjukan bahwa model VGG16 tanpa data balancing memiliki rata-rata akurasi sebesar 73% dengan mengalami banyak klasifikasi false positive, sedangkan model VGG16 dengan data balancing berhasil menurunkan tingkat klasifikasi false positive dan hasil akurasi rata-rata 83%.

Diterbitkan

2024-12-09