Detail Karya Ilmiah
-
Penerapan Penghapusan Pola Kata dalam Rekonstruksi Stemming Bahasa IndonesiaPenulis : Ana Tsalitsatun Ni'mahDosen Pembimbing I : Firdaus Solihin, S.Kom., M.Kom.Dosen Pembimbing II :Iwan Santosa, S.T., M.T.Abstraksi
Stemming adalah penghapusan imbuhan untuk menentukan kata dasarnya. Penelitian mengenai stemming telah memunculkan beberapa algoritma stemming bahasa Indonesia. Di antara beberapa algoritma tersebut, penelitian ini mencoba menerapkan algoritma stemming bahasa Indonesia yang telah mengalami rekonstruksi. Algoritma tersebut adalah Indonesian Stemmer Reconstruction (ISR). Rekonstruksi yang diterapkan pada algoritma ini dapat dilihat pada cara penghapusannya. Jika algoritma lain menghapus imbuhan secara tidak bersamaan antara awalan dan akhiran, algoritma ini melakukan penghapusan secara bersamaan pada awalan dan akhirannya. Rumus penghapusan tersebut didapatkan dari penyusunan formula Reguler Ekspression yang lebih singkat dan tidak menghabiskan waktu dalam prosesnya. Formula tersebut disusun berdasarkan acuan penggunaan imbuhan dalam bahasa Indonesia. Hal ini tentunya menunjang untuk mendapatkan hasil stemming yang lebih baik. Penelitian ini melakukan uji coba pada 300 dokumen yang sebelumnya telah diuji coba pada penelitian Fadhila Tala dan 50 konten dari dokumen hasil Crawler RISE. Penelitian ini memberikan hasil yang cukup baik yaitu perhitungan kebenaran kata mencapai 72% dan kecepatan 0,0243 detik pada 300 dokumen Fadhila Tala. Sedangkan pada 50 konten/dokumen hasil Crawler RISE didapatkan kecepatan sebesar 0,0052 detik dengan persentase kebenaran kata sebesar 50%.
AbstractionStemming was deleting of an affix to decide on root of words. Research of stemming has already featured a lot of Indonesian stemming algorithms. Around them, the research try to apply Indonesian stemming algorithm that has been reconstructed. It was usually called Indonesian Stemmer Reconstruction (ISR). The algorithm of reconstruction was able to be seen on erasing method. If other algorithms delete an affix (prefix and suffix) was not at the same time, this algorithm executes a stemming together with prefix and suffix. The stemmer formula was founded by arranging regular expression formula that simple and not expend time on its process. The formula was arranged by references of used of Indonesian affix. Of course this situation support to get better stemming result. The research attempt on 300 documents that has been tested on Fadhila Tala research and 50 documents of Rise Crawler result. The research bring in better result which calculation of correctness about 72% and speed 0,0243 seconds on 300 Fadhila Tala documents. Although on 50 documents of Rise Crawler result get of speed 0,0052 seconds with correctness percentage of words 50%.