Februariyanti, Herny and Zuliarso, Eri and Utomo, Mardi Siswo
(2010)
PROTOTIPE MESIN PENCARI DOKUMEN TEKS.
[Experiment]
Abstract
Pada saat ini informasi sangatlah mudah didapat salah satunya adalah dari internet kita dapat mendapatkan informasi yang sangat luas. Dengan banyaknya informasi yang didapat maka akan menyulitkan dalam menemukan dokumen seperti yang diinginkan. Dengan semakin bertambahnya dokumen yang didapat, pendayagunaan sistem temu kembali dokumen menjadi penting agar dapat menghemat waktu dan kerja untuk mendapatkan dokumen yang mirip (similar) dengan kata kunci (query) yang diipuntkan oleh pengguna. Pada prinsipnya, penyimpanan dokumen teks dan proses pencarian kembali dokumen tersebut sifatnya sederhana, selama ada kumpulan dokumen yang disimpan dan pengguna yang memberikan pertanyaan ataupun kebutuhan. Maka sistem temu kembali dokumen dapat mengembalikan kumpulan dokumen yang mirip dengan menghitung similarity atau tingkat kesamaan antara dokumen dengan query yang diinputkan oleh pengguna.
Hasil pencarian query atau kombinasi kata yang diberikan pengguna dikembalikan oleh sistem temu kembali dokumen ketika kata-kata tersebut ditemukan pada kumpulan dokumen. Sehingga jumlah kemunculan dari query pada tiap dokumen dan posisi rinci kata (term) tersebut juga diperlukan. Oleh karena itu, lalu digunakanlah algoritma pencarian kata secara sequensial dan pattern matching karena sederhana dan mudah diimplementasikan. Namun pada implementasinya diharapkan algoritma yang digunakan untuk pencarian dokumen diharapkan dapat digunakan dapat menampung koleksi dokumen dengan ukuran besar atau banyak. Sehingga kemudian dipertimbangkanlah untuk membangun struktur data pada koleksi dokumen yang disebut indeks untuk mempercepat proses pencarian.
Perubahan ini sangatlah memuaskan dan mampu meningkatkan performansi pencarian sehingga lebih cepat untuk koleksi dokumen yang besar dan banyak jumlahnya. Implementasi dari teknik pengindeksan yang digunakan salah satunya adalah indeks inverted yang terdiri dari daftar kata-kata yang telah diekstraksi, posisi kemunculan kata secara rinci.
Actions (login required)
|
View Item |