Efektifitas SMOTE dalam Mengatasi Imbalanced Class Algoritma K-Nearest Neighbors pada Analisis Sentimen terhadap Starlink

Penulis

  • Candra Candra Informatika, Fakultas Ilmu Komputer dan Rekayasa, Universitas Multi Data Palembang, Indonesia
  • Kelvin William Chandra Informatika, Fakultas Ilmu Komputer dan Rekayasa, Universitas Multi Data Palembang, Indonesia
  • Hafiz Irsyad Informatika, Fakultas Ilmu Komputer dan Rekayasa, Universitas Multi Data Palembang, Indonesia

DOI:

https://doi.org/10.54082/jiki.132

Kata Kunci:

Analisa Sentimen, Imbalanced Class, K-Nearest Neighbors, Synthetic Minority Oversampling Technique, Starlink

Abstrak

Imbalanced class menjadi salah satu tantangan utama dalam melakukan analisis sentimen, khususnya antara ulasan positif dan negatif yang dapat menyebabkan bias prediksi. Penelitian ini bertujuan untuk mengetahui lebih lanjut apakah permasalahan imbalanced class pada algoritma K-Nearest Neighbors (KNN) dapat diatasi dengan menggunakan SMOTE (Synthetic Minority Over-sampling Technique) pada analisis sentimen terhadap layanan Starlink. SMOTE akan digunakan untuk menciptakan sampel sintetis dari kelas minoritas untuk mengatasi ketidakseimbangan data. Hasil penelitian menunjukkan bahwa sebelum menggunakan SMOTE performa model KNN menghasilkan 69,97% (Accuracy), 68,47% (Precission), 64,99% (Recall), 65,41% (F1-Score). Namun, setelah menggunakan SMOTE performa model KNN mengalami peningkatan menjadi 76,74% (Accuracy), 79,15% (Precission), 75,91% (Recall), 75,82% (F1-Score). Dengan peningkatan ini, dapat disimpulkan bahwa kombinasi antara algoritma KNN dan SMOTE berhasil meningkatkan akurasi dan keandalan model KNN dalam mengatasi imbalanced class pada analisis sentimen terhadap layanan Starlink.

Referensi

T. Walasary, “Survey Paper tentang Analisis Sentimen,” KONSTELASI Konvergensi Teknol. dan Sist. Inf., vol. 2, no. 1, pp. 201–206, 2022, doi: 10.24002/konstelasi.v2i1.5378.

J. W. Iskandar and Y. Nataliani, “Perbandingan Naïve Bayes, SVM, dan k-NN untuk Analisis Sentimen Gadget Berbasis Aspek,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 5, no. 6, pp. 1120–1126, 2021, doi: 10.29207/resti.v5i6.3588.

M. W. Pertiwi, “Analisis Sentimen Opini Publik Mengenai Sarana Dan Transportasi Mudik Tahun 2019 Pada Twitter Menggunakan Algoritma Naïve Bayes, Neural Network, Knn Dan Svm,” Inti Nusa Mandiri, vol. 14, no. 1, pp. 27–32, 2019, [Online]. Available: http://www.nusamandiri.ac.id

D. Nurmalasari, T. I. Hermanto, and I. M. Nugroho, “Perbandingan Algoritma SVM , KNN dan NBC Terhadap Analisis Sentimen Aplikasi Loan Service,” J. Media Inform. Budidarma, vol. 7, no. 3, pp. 1521–1530, 2023, doi: 10.30865/mib.v7i3.6427.

K. Karfindo, R. Turaina, and R. Saputra, “Optimalisasi Klasifikasi Umpan Balik Mahasiswa Terhadap Layanan Kampus dengan Sinergi Random Forest dan Smote,” J. Nas. Komputasi dan Teknol. Inf., vol. 6, no. 6, pp. 820–827, 2024, doi: 10.32672/jnkti.v6i6.7269.

E. Sutoyo and M. A. Fadlurrahman, “Penerapan SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Television Advertisement Performance Rating Menggunakan Artificial Neural Network,” J. Edukasi dan Penelit. Inform., vol. 6, no. 3, pp. 379–385, 2020, doi: 10.26418/jp.v6i3.42896.

A. Surya Firmansyah, A. Aziz, and M. Ahsan, “Optimasi K-Nearest Neighbor Menggunakan Algoritma Smote Untuk Mengatasi Imbalance Class Pada Klasifikasi Analisis Sentimen,” JATI (Jurnal Mhs. Tek. Inform., vol. 7, no. 6, pp. 3341–3347, 2024, doi: 10.36040/jati.v7i6.7257.

Kurnia, I. Purnamasari, and D. D. Saputra, “Analisis Sentimen Dengan Metode Naïve Bayes, SMOTE Dan Adaboost Pada Twitter Bank BTN,” J. JTIK (Jurnal Teknol. Inf. dan Komunikasi), vol. 7, no. 2, pp. 235–242, 2023, doi: 10.35870/jtik.v7i3.707.

A. F. Anjani, D. Anggraeni, and I. M. Tirta, “Implementasi Random Forest Menggunakan SMOTE untuk Analisis Sentimen Ulasan Aplikasi Sister for Students UNEJ,” J. Nas. Teknol. dan Sist. Inf., vol. 9, no. 2, pp. 163–172, 2023, doi: 10.25077/teknosi.v9i2.2023.163-172.

A. Y. Permana and M. M. Effendi, “Analisis Sentimen pada Teks Opini Penilaian Kinerja Dosen dengan Pendekatan Algoritma KNN,” J. Ilm. Komputasi, vol. 19, no. 1, pp. 39–50, 2020, doi: 10.32409/jikstik.19.1.154.

A. G. Pertiwi, N. Bachtiar, R. Kusumaningrum, I. Waspada, and A. Wibowo, “Comparison of performance of k-nearest neighbor algorithm using smote and k-nearest neighbor algorithm without smote in diagnosis of diabetes disease in balanced data,” J. Phys. Conf. Ser., vol. 1524, no. 1, pp. 1–9, 2020, doi: 10.1088/1742-6596/1524/1/012048.

A. Nurhopipah and C. Magnolia, “Perbandingan Metode Resampling Pada Imbalanced Dataset Untuk Klasifikasi Komentar Program Mbkm,” J. Publ. Ilmu Komput. dan Multimed., vol. 1, no. 2, pp. 9–22, 2022, doi: 10.55606/jupikom.v2i1.862.

D. Glez-Peña, A. Lourenço, H. López-Fernández, M. Reboiro-Jato, and F. Fdez-Riverola, “Web scraping technologies in an API world,” Brief. Bioinform., vol. 15, no. 5, pp. 788–797, 2013, doi: 10.1093/bib/bbt026.

T. Wolf et al., “Transformers: State-of-the-Art Natural Language Processing,” EMNLP 2020 - Conf. Empir. Methods Nat. Lang. Process. Proc. Syst. Demonstr., vol. 5, pp. 38–45, 2020, doi: 10.18653/v1/2020.emnlp-demos.6.

S. Bauskar, V. Badole, P. Jain, and M. Chawla, “Natural Language Processing based Hybrid Model for Detecting Fake News Using Content-Based Features and Social Features,” Int. J. Inf. Eng. Electron. Bus., vol. 11, no. 4, pp. 1–10, 2019, doi: 10.5815/ijieeb.2019.04.01.

T. Tarannum, “Cleaning of Web Scraped Data with Python,” Brac University, 2019.

P. Jeatrakul, K. W. Wong, and C. C. Fung, “Data Cleaning for Classification Using Misclassification Analysis,” IWACIII 2009 - Int. Work. Adv. Comput. Intell. Intell. Informatics, vol. 14, no. 3, pp. 297–302, 2010.

K. N. Sridevi and S. Prakasha, “Doc-To-Tokens based Pre-Processing in Information Retrieval System,” Webology, vol. 18, no. Special Issue, pp. 570–579, 2021, doi: 10.14704/WEB/V18SI05/WEB18247.

A. Guswandri, R. P. Cahyono, S. I. Akutansi, and T. Komputer, “Penerapan Sentimen Analis Menggunakan Metode Naïve Bayes Dan Svm,” Ilmudata.org, vol. 2, no. 12, pp. 1–16, 2022.

A. W. Pradana and M. Hayaty, “The Effect of Stemming and Removal of Stopwords on the Accuracy of Sentiment Analysis on Indonesian-language Texts,” Kinet. Game Technol. Inf. Syst. Comput. Network, Comput. Electron. Control, vol. 4, no. 4, pp. 375–380, 2019, doi: 10.22219/kinetik.v4i4.912.

Melita Ria, “Penerapan Metode Term Frequency Inverse Document Frequency (TF-IDF) dan Cosine Similarity pada Sistem Temu Kembali Informasi Untuk Mengetahui Syarah Hadits Berbasis Web,” Universitas Islam Negeri Syarif Hidayatullah Jakarta, 2018.

F. Heimerl, S. Lohmann, S. Lange, and T. Ertl, “Word cloud explorer: Text analytics based on word clouds,” Proc. Annu. Hawaii Int. Conf. Syst. Sci., pp. 1833–1842, 2014, doi: 10.1109/HICSS.2014.231.

Diterbitkan

14-07-2024

Cara Mengutip

Candra, C., Chandra, K. W. ., & Irsyad, H. (2024). Efektifitas SMOTE dalam Mengatasi Imbalanced Class Algoritma K-Nearest Neighbors pada Analisis Sentimen terhadap Starlink. Jurnal Ilmu Komputer Dan Informatika, 4(1), 31–42. https://doi.org/10.54082/jiki.132