Model Indo-BERT untuk Identifikasi Sentimen Kekerasan Verbal di Twitter
DOI:
https://doi.org/10.5281/zenodo.12788184Abstract
Munculnya kekerasan verbal di platform media sosial Twitter menjadi isu yang semakin memprihatinkan dalam beberapa tahun terakhir. Kekerasan verbal mencakup berbagai bentuk komunikasi yang merendahkan, menghina, dan mengancam, seringkali merugikan individu atau kelompok. Permasalahan utama yang dibahas dalam penelitian ini adalah identifikasi sentimen terkait perilaku kekerasan verbal di media sosial, khususnya Twitter. Penelitian ini bertujuan untuk mengembangkan model analisis sentimen Verbal Violence Behavior (VVB) di Twitter dengan menggunakan Indo-BERT. Keakuratan model akan dibandingkan dengan BERT. Penelitian ini diawali dengan pengumpulan data melalui web crawling dengan menggunakan kategori perilaku kekerasan verbal sebagai referensi. Pelabelan dataset dilakukan melalui kombinasi metode manual dan otomatis dengan pendekatan semi-supervised learning. Proses ini melibatkan pembelajaran mandiri, di mana data yang tidak berlabel secara otomatis diberi label menggunakan model yang telah dilatih sebelumnya. Dataset dikategorikan menjadi sentimen positif, sentimen negatif, dan sentimen netral. Model Indo-BERT digunakan sebagai kerangka analisis. Evaluasi hasil dilakukan dengan menerapkan matriks konfusi. Temuan dari percobaan ini menunjukkan bahwa model Indo-BERT memiliki kemampuan yang lebih unggul dengan tingkat akurasi mencapai 72% dalam memproses teks berbahasa Indonesia dibandingkan dengan model BERT dengan tingkat akurasi sebesar 69%.