Pengelasan sebutan huruf hijaiyah menggunakan teknik pembelajaran mesin

Nur Afini Natrah Mohd Ashril, and Afzan Adam, and Dahlila Putri Dahnil, (2023) Pengelasan sebutan huruf hijaiyah menggunakan teknik pembelajaran mesin. GEMA ; Online Journal of Language Studies, 23 (1). pp. 291-309. ISSN 1675-8021

[img]
Preview
PDF
660kB

Official URL: https://ejournal.ukm.my/gema/issue/view/1578

Abstract

Fitur Mel-frequency cepstral coefficients (MFCC) dan teknik pengelasan berdasarkan pembelajaran mesin sering digunakan dalam mengelaskan sebutan huruf-huruf hijaiyah. Walaupun begitu, berdasarkan kajian-kajian lepas, prestasi ketepatan pengelasan sebutan huruf hijaiyah masih lagi rendah walaupun dengan penggunaan algoritma pembelajaran mesin dan fitur MFCC. Oleh itu, kajian khas untuk menganalisis fitur dan teknik pembelajaran mesin yang sesuai akan dibincangkan dalam kertas kajian ini. Selain itu, bilangan huruf hijaiyah juga ditingkatkan kepada 30 huruf mengikut resam uthmani. Kajian ini mahu membuktikan bahawa penggunaan fitur dan teknik pengelasan yang sesuai mampu mengelaskan sebutan huruf hijaiyah dan memberikan prestasi ketepatan yang tinggi walaupun dengan jumlah huruf yang banyak. Kajian ini dilakukan berdasarkan kepada enam fasa utama dalam metodologi kajian ini termasuklah pemprosesan isyarat, penyarian fitur, pemprosesan dan pemilihan fitur, pengelasan dan akhir sekali pengujian, penilaian dan analisis. Kadar persampelan yang digunakan bagi kesemua modul pemprosesan isyarat pertuturan dalam kajian ini adalah 44.1 kHz. Dapatan kajian menunjukkan fitur MFCC merupakan fitur paling sesuai bagi mengelaskan sebutan huruf hijaiyah berbanding fitur-fitur lain yang telah diekstrak berdasarkan kepada ‘rank’ dalam hasil pemilihan fitur. Perbandingan prestasi ketepatan menunjukkan teknik pengelasan Random Forest (RF) mencapai ketepatan yang tinggi dengan menggunakan fitur MFCC, iaitu purata sebanyak 97~99% bagi setiap huruf hijaiyah berbanding teknik pengelasan lain yang telah diuji dalam kajian ini. Kesimpulannya, penggunaan fitur MFCC dan teknik pengelasan RF mampu memberikan prestasi ketepatan pengelasan sebutan huruf hijaiyah yang tinggi sekaligus meningkatkan prestasi pengelasan sebutan huruf hijaiyah kajian lepas, sehingga 98.29% secara purata untuk 30 huruf.

Item Type:Article
Keywords:Sebutan huruf hijaiyah; Pengelasan pertuturan; MFCC; Pembelajaran mesin; Pengecaman pertuturan
Journal:GEMA ; Online Journal of Language Studies
ID Code:21593
Deposited By: Noor Marina Yusof
Deposited On:16 May 2023 01:35
Last Modified:19 May 2023 08:48

Repository Staff Only: item control page