Detail Karya Ilmiah

  • PENERAPAN MODIFIKASI METODE ENHANCED CONFIX STRIPPING STEMMER PADA TEKS BERBAHASA MADURA
    Penulis : Andi Sholihin
    Dosen Pembimbing I : Firdaus Solihin, S.Kom.,M.Kom.
    Dosen Pembimbing II :Fika Hastarita Rachman, S.T., M.Eng
    Abstraksi

    Stemming adalah teknik untuk menemukan kata dasar dari sebuah kata yang telah mengalami imbuhan dengan cara menghilangkan atau menghapus imbuhan-imbuhan tersebut. Algoritma Enhanced Confix Stripping Stemmer adalah algoritma stemming yang akurat untuk mencari bentuk dasar dari suatu kata dalam Bahasa Indonesia. Bahasa Madura memiliki struktur morfologi yang mirip dengan Bahasa Indonesia. Bahasa Madura memiliki kata yang dapat dibentuk dari awalan (ter-ater), akhiran (panoteng) dan sisipan (sesselan) dan Kata Ulang (Rangkebbhan). Modifikasi algoritma Enhanced Confix Stripping Stemmer dilakukan pada tabel aturan pemenggalan, langkah-langkah algoritma dan penambahan langkah algoritma sesuai dengan morfologi Bahasa Madura. Dengan demikian dapat dihasilkan sebuah algoritma baru yang dikembangkan dari algoritma Enhanced Confix Stripping Stemmer. Setelah melakukan beberapa analisa dan pengujian dengan menggunakan sistem yang telah dibangun maka diperoleh hasil dari modifikasi algoritma Enhanced Confix Stripping Stemmer pada teks berbahasa Madura. Persentase kata Bahasa Madura yang berhasil distemming adalah 95,75 % dari 400 kata yang diuji. Dengan demikian modifikasi Enhanced Confix Stripping Stemmer pada teks berbahasa Madura dinilai efektif untuk diterapkan.

    Abstraction

    Stemming is a technique to find the root of a word that has been experienced by removing affixes. Enhanced Algorithm Confix Stripping Stemmer is accurate stemming algorithm to find the basic form of a word in Indonesian. Madurese language morphological structure similar to Indonesian. Madurese language has a word that can be formed from the prefix (ter-ater), suffix (panoteng) and insertions (sesselan) and Reduplication (Rangkebbhan). Modifications Enhanced Confix Stripping Stemmer algorithm performed on the table decapitation rules, measures and additional step algorithm according to the morphology of the Madurese Language. Thus it can be produced by a newly developed algorithm of algorithms Enhanced Confix Stripping Stemmer. After doing some analysis and testing using a system that has built the obtained results of the modified algorithm Confix Enhanced Stripping Stemmer in Madurese language text. The percentage of successful Madurese language word stemming is 95.75% of the 400 words that were tested. Thus the modification of Enhanced Confix Stripping Stemmer on Madura language text considered effective to implement.

Detail Jurnal