FT ANALISIS PERBANDINGAN NAIVE BAYES DAN SVM DALAM KLASIFIKASI GENDER DI PLATFORM TWITTER

  • Ridzky Putra Dwitama Universitas Islam Indonesia
  • Irving Vitra Paputungan
Keywords: Machine Learning, Klasifikasi, Media Sosial, Naive Bayes, Support Vector Machine

Abstract

Munculnya media sosial telah menghasilkan sejumlah besar data tekstual yang rentan terhadap analisis untuk memahami perilaku pengguna. Penelitian ini melakukan analisis komparatif dari dua algoritma klasifikasi teks, Naive Bayes dan Support Vector Machine (SVM), dengan aplikasi untuk menentukan gender dari komentar pengguna di platform media sosial X (sebelumnya Twitter). Kumpulan data diperoleh dengan metode web scraping dan kemudian dipre-processing menggunakan mekanisme cleaning teks dan pengubahan singkatan bersama dengan ekstraksi fitur berbasis TF-IDF. Kuantitas data yang berbeda (1000, 3000, 5000) dan rasio pembagian data (70:30 dan 80:20) digunakan untuk mengevaluasi kedua algoritma. Hasilnya menunjukkan bahwa SVM mengungguli Naive Bayes dalam hal semua matriks pada dataset yang lebih besar, sementara Naive Bayes terus mempertahankan kualitasnya pada dataset yang lebih kecil. Temuan ini memiliki implikasi yang signifikan untuk pemilihan metode klasifikasi yang sesuai untuk analisis data komentar media sosial.

Downloads

Download data is not yet available.
Published
2025-08-18
How to Cite
Dwitama, R., & Paputungan, I. (2025). FT ANALISIS PERBANDINGAN NAIVE BAYES DAN SVM DALAM KLASIFIKASI GENDER DI PLATFORM TWITTER. EDUSAINTEK: Jurnal Pendidikan, Sains Dan Teknologi, 12(3). https://doi.org/10.47668/edusaintek.v12i3.1811
Section
Articles