Detail Karya Ilmiah

  • KLASIFIKASI BERITA PALSU PADA BERITA ONLINE BAHASA INDONESIA MENGGUNAKAN METODE SUPPORT VECTOR MACHINE DAN NAÏVE BAYES
    Penulis : Choirul Anam Nasrudin
    Dosen Pembimbing I : Mula'ab, S.Si., M.Kom.
    Dosen Pembimbing II :Eza Rahmanita, S.T., M.T.
    Abstraksi

    Penyebaran berita palsu atau berita hoax saat ini sudah semakin tak terbendung. Pesatnya pertumbuhan website yang tidak terverifikasi, semakin memperburuk masalah ini. Untuk itu, perlu adanya sebuah sistem yang dapat melakukan klasifikasi berita berdasarkan teks, yang dapat menjadi media penyaring berita-berita tersebut. Salah satu metode yang paling sering digunakan, ialah metode Naïve Bayes yang diketahui mampu memberikan hasil terbaik untuk klasifikasi berita palsu secara umum. Namun masih lemah untuk klasifikasi berita dengan topik tertentu. Untuk mengatasi kekurangan tersebut, pada penelitian ini sistem yang dibuat untuk melakukan klasifikasi terhadap topik berita terlebih dahulu menggunakan metode Support Vector Machine. Metode SVM dipilih karena sudah terbukti memiliki akurasi tinggi untuk klasifikasi berita berbahasa Indonesia. Kemudian, untuk menambah akurasi hasil klasifikasi ini, digunakan pula gabungan TF-IDF dan Mutual Information sebagai penyeleksi fitur. Hasil pengukuran performa penggunaan metode SVM dan Naive Bayes untuk klasifikasi berita palsu atau hoax dengan tiga kategori yang telah ditentukan yakni kesehatan dan makanan, politik, serta tokoh, memperoleh nilai rata-rata akurasi=81.33%, precission=75,31%, dan recall=96%.

    Abstraction

    The spreading of fake news or hoax news is now increasingly unstoppable. The rapid growth of unverified websites further, make this problem even worse. Because of this reason, it is necessary to have a system that can do news classification based on text, which can be a filtering media for the news. One of the most commonly used methods, is the Naïve Bayes. This method which is known to be able to provide the best results for the fake news classification in general topic. But it is still weak for the fake news classification certain topics. So, to overcome these shortcomings, this study have created a system to classify news topics first, using Support Vector Machine method. The SVM method was chosen because it has proven to have high accuracy for the classification of Indonesian news. Then, to increase the accuracy of the results of this classification, TF-IDF and Mutual Information are also used as feature selectors. The results of performance measurement using SVM and Naive Bayes methods for classification of fake news or hoax news with three predetermined categories of health and food, politics, and figures, obtain an average value of accuracy = 81.33%, precission = 75.31%, and recall = 96%.

Detail Jurnal