Wibisono, Setyawan and Utomo, Mardi Siswo
(2009)
IMPLEMENTASI STEMMER BAHASA
INDONESIA TANPA KAMUS BERBASIS WEB
UNTUK KEPERLUAN TEMU KEMBALI
INFORMASI.
[Experiment]
Abstract
Hampir setiap aplikasi termasuk berbasis web dengan pengelolaan basis data
membutuhkan proses temu kembali informasi. Pada proses temu kembali selain query
dan umpan balik pengguna terlebih dahulu dilakukan pengindekan pada data yang
ada, proses pengindekan data berbasis teks akan membutuhkan proses stemming.
Stemming adalah proses untuk mencari kata dasar pada suatu kata. Pada
analisa temu kembali informasi imbuhan merupakan bagian dari informasi yang tidak
bermakna, seperti halnya stop word. Sehingga imbuhan harus dihilangkan untuk
mempercepat proses pengindekan dan proses query.
Proses stemming dapat dilakukan dengan 2 cara yaitu dengan menggunakan
kamus dan menggunakan aturan-aturan imbuhan. Untuk mendapatkan tingkat
kebenaran hasil yang tinggi biasaya digunakan kamus seperti yang diperkenalkan
oleh Nazief dan Adriani, stemmer bahasa melayu oleh Ahmad, Yuso, dan Sembok.
tetapi teknik ini membutuhkan waktu komputasi yang tinggi karena ada proses
pengambilan data pada database. Sedang untuk aplikasi yang lebih sederhana dan
tidak membutuhkan akurasi yang tinggi teknik aturan imbuhan sangat mudah untuk
diimplementasikan dan tidak membutuhkan waktu komputasi yang tinggi.
Algoritma stemmer berbahasa indonesia tanpa menggunakan kamus
diperkenalkan oleh Vega VB dan Bressan S, dengan menghilangkan imbuhanimbuhan
pada kata-kata berbahasa Indonesia berimbuhan. Selain Vega, Tala juga
memperkenalkan porter like stemmer untuk bahasa Indonesia. Tala menggunakan
rule base untuk menghilangkan imbuhan kata.
Actions (login required)
|
View Item |