Dosen UTS Siapkan Basa Samawa Sebagai Bahasa Software

Kepedulian melestarikan Bahasa Sumbawa sebagai ciri khas, jati diri, kebanggaan, alat komunikasi, alat integritas, dan adaptasi sosial suku Sumbawa, Dosen Universitas Teknologi Sumbawa (UTS), Trienani Hariyanti mempresentasikan hasil riset dalam “2nd International Conference on Artifical Intelligence, Automation and Control Technologies (AIACT 2018)” dengan judul “Samawa Language: Part of Speech Tagset and Tagged Corpus for NLP Resources” di Osaka, Jepang,  beberapa waktu lalu.

Mengangkat topik riset pada bidang Pemrosesan Bahasa Alami (Natural Language Processing/NLP), yang merupakan salah satu cabang riset irisan ilmu komputer dan linguistik yang difokuskan mempelajari interaksi komputer dan bahasa manusia. Nani–panggilan akrabnya, membuat software (tagger) yang mampu memberi tanda/label dengan akurasi terbaik kelas-kelas kata (part of speech) pada kalimat dalam Basa Samawa.

Dalam papernya, ia mempublikasikan sumber daya dalam Basa Samawa yang sudah dikumpulkan dari berbagai sumber dan hasil dari melabelkan kata maupun tanda baca yang disebut token dengan 24 kelas kata yang didefinisikan sebelumnya secara manual. Proses pelabelan secara manual yang harus melabeli token sesuai dengan aturan leksikal dan aturan kontekstual tersebut menghasil keluaran dari proses manual tagging ini dalam bentuk format plain teks dan XML dengan standar Text Encoding Initiative (TEI) yakni standar yang digunakan untuk mengarsipkan teks dalam bentuk digital. “Untuk saat ini, saya berhasil menyelesaikan proses manual tagging untuk 50.000 token. Masih dibutuhkan proses tagging manual untuk 50.000 token lagi untuk dapat mencapai batas jumlah terbaik token yang digunakan untuk melatih tagger,” tutur wanita yang juga tergabung sebagai volunteer dalam project Japan for Muslim itu.

Dosen yang tengah menyelesaikan S2-nya di Tokyo University of Technology (TUT) Jepang, dengan bantuan beasiswa dari Lembaga Pengelola Dana Pendidikan (LPDP) itu juga menjelaskan dataset yang dihasilkan dari proses pelabelan secara manual (manual tagging) yang memakan waktu lama itu ke depannya akan dapat dimanfaatkan untuk proses pembuatan software-software NLP lainnya, sebagai contoh mesin translasi/penerjemah Basa Samawa. “Dengan ini, saya yakin Basa Samawa akan dikenal luas dan akan menjadi kebanggaan tersendiri bagi semua penuturnya di mana pun berada,” pungkasnya. (SR)

Share on facebook
Share on twitter
Share on linkedin