Penentuan Entitas Tokoh Pada Satua Bali Menggunakan Algoritma Conditional Random Fields
Keywords:
conditional random fields, pengenalan entitas bernama, bahasa bali, regularisasi, satua baliAbstract
Pengenalan Entitas Bernama (NER) adalah proses untuk mengidentifikasi dan mengklasifikasi Entitas Bernama (NEs) pada suatu teks. Penelitian sebelumnya melakukan pengenalan entitas bernama pada bahasa bali menggunakan metode rule-based yang berfokus pada kelas person memberikan akurasi yang kurang memadai, karena data yang digunakan berfokus kepada fitur semantik dari kata pada kalimat(Kurniadi & ER, 2021). Tujuan dari penelitian ini adalah menerapkan fitur gramatikal dari kata berupa label part-of-speech, dan juga fitur lainnya untuk meningkatkan akurasi pada proses pengenalan entitas bernama yang berfokus pada entitas person. Metode Conditional Random Fields merupakan metode diskriminatif yang hanya berfokus kepada persebaran probabilitas bersyarat pada fitur ke label. Penelitian ini menggunakan 4 fitur, diantaranya: fitur semantik, fitur gramatikal, fitur transisi, serta fitur representasi embedding. Penelitian ini menggunakan data dari penelitian (Bimantara et al ea, 2024) yang telah dilabeli dengan label part-of-speech dan entitas bernama dengan skema labeling beginning-inside-outside (BIO). Penelitian ini menghasilkan accuracy 0.96 dengan precision sebesar 0.96, recall sebesar 0.96, dan total f1-score sebesar 0.96.