Pendekatan teknik pengecaman entiti nama bagi capaian berita jenayah bahasa Melayu

Saidah Saad, and Mohamed Kamil Mansor, (2018) Pendekatan teknik pengecaman entiti nama bagi capaian berita jenayah bahasa Melayu. GEMA: Online Journal of Language Studies, 18 (4). pp. 216-235. ISSN 1675-8021

[img]
Preview
PDF
1MB

Official URL: https://ejournal.ukm.my/gema/issue/view/1146

Abstract

Pengekstrakan maklumat merupakan satu proses bagi mendapatkan konsep penting dalam mewakili kandungan teks dari dokumen yang tidak berstruktur. Pada masa kini, terdapat banyak dokumen yang tidak berstruktur seperti teks berita, artikel blog, forum, tweet serta mikro blog dari rangkaian sosial. Dokumen-dokumen ini amat sukar untuk difahami oleh komputer. Oleh itu, kajian berkaitan pengekstrakan maklumat menjadi sangat penting bagi mengatasi permasalah ini. Salah satu teknik pengekstrakan yang banyak digunakan ialah pengecaman entiti nama. Kajian ini dijalankan bagi mengimplementasikan teknik pengecaman entiti nama dari sumber dokumen berita jenayah bahasa Melayu. Objektif utama kajian ini adalah untuk membangunkan sistem prototaip model pengekstrakan maklumat berita jenayah dalam bahasa Melayu dengan menggunakan teknik pengecaman entiti nama melalui pendekatan berasaskan peraturan. Kajian ini dilakukan dengan mewujudkan korpus berita jenayah dalam bahasa Melayu yang diperolehi dari sumber arkib berita BERNAMA. Korpus ini kemudiannya diteliti secara manual oleh pakar bahasa bagi mengecam entiti nama seperti individu, organisasi, lokasi, tarikh, masa, kewangan, peratusan, jenayah dan senjata. Dalam masa yang sama, sistem prototaip dibangunkan serta diuji dengan korpus yang sama dan hasil dari pengujian ini dibandingkan dengan keputusan pakar. Secara keseluruhannya, ujian sistem prototaip ini menunjukkan hasil yang baik dengan nilai dapatan bagi recall sebanyak 78.67%, manakala bagi precision ialah sebanyak 71.11% dan F-measure sebanyak 74.7%. Hasil dari kajian ini diharap dapat menyumbang kepada pengetahuan mengenai keberkesanan teknik pengecaman entiti nama bagi berita jenayah bahasa Melayu dan seterusnya dapat membantu para penyelidik, polis, peguam serta pihak berkuasa yang terlibat dalam bidang jenayah menyelesaikan jenayah dengan lebih cepat dan berkesan.

Item Type:Article
Keywords:Pengekstrakan maklumat; Pengecaman entiti nama; Bahasa Melayu; Berita jenayah; Pendekatan berasaskan peraturan
Journal:GEMA ; Online Journal of Language Studies
ID Code:17668
Deposited By: ms aida -
Deposited On:18 Nov 2021 04:13
Last Modified:24 Nov 2021 05:01

Repository Staff Only: item control page