Detail Karya Ilmiah

  • RANCANG BANGUN APLIKASI SEARCH ENGINE DAN SISTEM PENDETEKSI PLAGIARISME MENGGUNAKAN METODE LSA-SOM
    Penulis : ARIS PRAMA AULIA
    Dosen Pembimbing I : Hermawan, ST., M.Kom
    Dosen Pembimbing II :Dr. Indah Agustien S, S.Kom, M.Kom.
    Abstraksi

    Plagiarisme adalah mencuri gagasan, kata-kata, kalimat atau hasil penelitian orang lain dan menyajikannya seolah-olah sebagai karya sendiri. Metode LSA merupakan salah satu metode dari beberapa metode untuk pendeteksian plagiarisme. Metode Latent Semantic Analysis (LSA) adalah sebuah teori dan metode untuk menggali dan mempresentasikan konteks yang digunakan sebagai sebuah arti kata dengan memanfaatkan komputasi statistik untuk sejumlah corpus yang besar. Penggunaan LSA konvensional bersifat sekuensial dikarenakan masih belum adanya klasterisasi sehingga proses analisa akan dilakukan secara global pada keseluruhan dokumen yang tentunya memerlukan waktu komputasi yang besar. Untuk itu dapat digunakan teknik klasifikasi tak terawasi seperti penggunaan Self Organizing Map (SOM) dan pengujian similaritas secara global hanya dilakukan pada centroid masing-masing kluster untuk kemudian dilakukan pengujian similaritas secara lokal pada klaster yang terpilih yang menjadi bagian dari klaster tersebut. Pada hasil penelitian LSA-SOM memiliki rata-rata precision 94.4% dan recall 64.04%. Kata kunci : Cosine Similarity, Latent Semantic Analysis, plagiarisme Self Organizing Map, Singular Value Decomposition

    Abstraction

    Plagiarism is stealing ideas, words, sentences or the research of others and presenting it as if it were his own works. LSA method is one method of several methods for the detection of plagiarism. Method of Latent Semantic Analysis (LSA) is a theory and a method to explore and present the context in which it is used as a meaning of the word by using statistical computing for a large corpus. The use of conventional LSA is still due to the sequential clustering so the analysis will be done globally on the whole document would require a huge computing time. It can be used unsupervised classification techniques such as the use of Self Organizing Map (SOM) and global similarity testing is only done on the centroid of each cluster for testing similarity then locally on the selected clusters that are part of the cluster. In LSA-SOM results have averaged 94.4% precision and recall of 64.04%. Kata kunci : Cosine Similarity, Latent Semantic Analysis, plagiarisme Self Organizing Map, Singular Value Decomposition

Detail Jurnal