Pembangunan korpus bagi analisis sentimen dalam Bahasa Melayu secara separa selia

Ezuana Sukawai, and Nazlia Omar, (2020) Pembangunan korpus bagi analisis sentimen dalam Bahasa Melayu secara separa selia. Asia-Pacific Journal of Information Technology and Multimedia, 9 (1). pp. 94-109. ISSN 2289-2192

[img]
Preview
PDF
932kB

Official URL: http://www.ukm.my/apjitm/articles-year.php

Abstract

Kebelakangan ini, kajian tentang analisis sentimen semakin mendapat tempat dan banyak dijalankan. Walau bagaimanapun, kajian berkenaan analisis sentimen dalam Bahasa Melayu masih kurang. Tujuan kajian ini adalah untuk mencadangkan suatu kajian tentang pembangunan korpus analisis sentimen dalam Bahasa Melayu dengan menggunakan kaedah separa selia dijalankan. Korpus analisis sentimen yang menggunakan data daripada Twitter ini dibangunkan dengan menggunakan dua gabungan pendekatan iaitu sentimen leksikon dan pembelajaran mesin. Pemprosesan bahasa tabii digunakan pada peringkat awal. Pada peringkat ini, leksikon sentimen digunakan untuk membuat pengelasan data yang akan dijadikan benih data latihan. Selain itu, emotikon sentimen turut digunakan untuk membandingkan ketepatan keputusan antara leksikon sentimen dan emotikon sentimen. Selepas benih data latihan telah disediakan, proses penambahan data latihan baru yang lebih besar kuantitinya akan dijalankan dengan menggunakan kaedah pengelasan menggunakan benih data dan pembelajaran mesin. Secara ringkasnya, proses pengelasan yang dijalankan dengan menggunakan pembelajaran mesin adalah merangkumi pra-pemprosesan, pengekstrakan fitur dan pengelasan. Perbandingan antara pengelasan juga dijalankan dengan menggunakan lima jenis algoritma. Berdasarkan keputusan ekperimen yang telah dijalankan, penggunaan pendekatan leksikon sentimen dan algoritma pengelas Bayes Naif Multinomial adalah pengelas yang terbaik untuk pembangunan korpus analisis sentimen dalam Bahasa Melayu ini.

Item Type:Article
Keywords:Korpus; Analisis sentimen; Leksikon sentimen; Pengelasan; Separa selia; Twitter
Journal:Asia - Pasific Journal of Information Technology and Multimedia (Formerly Jurnal Teknologi Maklumat dan Multimedia)
ID Code:15421
Deposited By: ms aida -
Deposited On:20 Oct 2020 02:51
Last Modified:23 Oct 2020 03:26

Repository Staff Only: item control page