Detail Karya Ilmiah

  • KLASTERISASI BERITA OLAHRAGA BERBAHASA INDONESIA DENGAN METODE K-MEANS YANG DIMODIFIKASI
    Penulis : Wahit Abdulloh
    Dosen Pembimbing I : Sigit Susanto Putro, S.Kom, M.Kom
    Dosen Pembimbing II :Yoga Dwitya Pramudita, S.Kom, M.Cs
    Abstraksi

    Berbagai cabang olahraga seperti sepak bola, tenis meja, bulu tangkis, dan lainnya mengharuskan setiap berita olahraga untuk dikelompokkan sesuai dengan cabangnya. Oleh karena itu diperlukan cara untuk mengelompokkan berita olahraga yang memiliki kesamaan. Pengelompokkan dapat dilakukan dengan banyak metode. Metode yang bisa menangani permasalah ini salah satunya adalah k-means clustering. K-means clustering adalah metode pengelompokan yang bisa bekerja dengan dataset yang besar dengan efisien. Namun metode ini memiliki permasalahan disaat penentuan awal pusat cluster. Hasil akhir cluster dari k-means sangat bergantung pada penentuan awal ini. Metode cosine similairty dapat membantu k-means clustering mendapatkan pusat cluster yang baik. Pada penelitian ini pengelompokan berita olahraga berbahasa Indonesia dilakukan dengan metode k-means clustering yang telah dimodifikasi dengan cosine similarity. Hasil yang didapatkan dari percobaan adalah pusat cluster terbaik yang dihasilkan oleh metode k-means selalu terjadi perubahan, bergantung pada penentuan awal pusat cluster. Setelah dilakukan modifikasi pada penentuan awal, pusat cluster terbaik cenderung konstan, yaitu sebanyak 4 pusat cluster dengan nilai akurasi rata-rata 0.895.

    Abstraction

    Various sports such as soccer, table tennis, badminton, and others require each sports news be grouped according to its category. Therefore it is important to find ways to group sports news that have similarities.Grouping can be done with many methods. One method that can handle this problem is k-means clustering. K-means clustering is a grouping method that can work with large datasets efficiently. But this method has problems when determining the center of a cluster. The grouping results of k-means depend on this initial determination. The cosine similairty method can help k-means clustering get a good cluster center. In this study the grouping of Indonesian sports news is done by the k-means clustering method which has been modified by cosine similarity. The results obtained from the experiment are that the best cluster center produced by the kmeans method always changes, depending on the initial determination of the cluster center. After modifying the initial determination, the best cluster center tends to be constant, which is as much as 4 cluster centers with an average accuracy value 0.409.

Detail Jurnal