Analisis Sentimen Terhadap Pembatalan Piala Dunia U-20 di Indonesia Menggunakan Algorima Naïve Bayes dan Genetika
Keywords:
klasifikasi, naive bayes, genetika, piala dunia, twitterAbstract
Pembatalan Piala Dunia U-20 di Indonesia menimbulkan berbagai reaksi masyarakat di media sosial, khususnya Twitter. Sebagian masyarakat menyayangkan keputusan tersebut karena dianggap merugikan Indonesia dalam kesempatan tampil di level dunia. Sebaliknya ada pihak yang mendukung pembatalan dengan alasan tertentu, seperti faktor politik atau prinsip nasional. Hal ini dapat dilakukan analisis sentimen terhadap permasalahan tersebut. Penelitian ini bertujuan untuk mengklasifikasikan sentimen masyarakat terhadap pembatalan Piala Dunia U-20 dengan menerapkan algoritma Naïve Bayes dengan seleksi fitur Algoritma Genetika. Data penelitian diperoleh melalui proses crawling di Twitter pada periode 30 Maret hingga 5 April 2023 dengan kata kunci “Pembatalan Piala Dunia U-20 Indonesia” dan memperoleh data sebanyak 14.807 tweet. Penelitian ini menggunakan data sebanyak 2.000 dan dilakukan pelabelan data data tersebut bisa digunakan untuk pelatihan model klasifikasi. Tahap preprocessing meliputi case folding, filtering, tokenizing dan stemming. Tahap pembobotan data menggunakan TF-IDF mengukur tingkat kepentingan atau bobot suatu kata dalam sebuah dokumen. Penelitian ini menggunakan seleksi fitur genetika untuk memilih fitur (kata) terbaik dan mengurangi kata yang kurang relevan. Naive bayes merupakan algoritma klasifikasi berbasis probabilitas untuk memprediksi sentimen positif atau negatif. Proses klasifikasi dilakukan dengan dua skenario, yaitu tanpa seleksi fitur dan dengan seleksi fitur menggunakan Algoritma Genetika. Hasil penelitian menunjukkan bahwa model Naïve Bayes tanpa seleksi fitur memperoleh akurasi sebesar 71,5% dan mengalami peningkatan menjadi 76,8% menggunakan seleksi fitur genetika. Peningkatan juga terjadi pada nilai presisi, recall, dan F1-score, masing-masing mencapai sekitar 75,99%, 76%, dan 75,98%.