Detail Karya Ilmiah

  • Analisis Dampak Penerapan Metode Diskretisasi Data terhadap Performa Diagnosis Penyakit Liver Berbasis K-Nearest Neighbor
    Penulis : Candra Utomo Alatas
    Dosen Pembimbing I : Mula'ab, S.Si., M.Kom.
    Dosen Pembimbing II :Iwan Santosa, S.T., M.T.
    Abstraksi

    Akurasi adalah faktor terpenting yang harus dipertimbangkan dalam memilih metode klasifikasi data. Semakin tinggi akurasi suatu metode klasifikasi data, semakin layak metode tersebut diterapkan. Pada kasus diagnosis penyakit liver, metode k-Nearest Neighbor (KNN) menunjukkan akurasi yang tinggi. Di sisi lain, beberapa penelitian menunjukkan bahwa penerapan diskretisasi berbasis entropy sebagai metode preprocessing mampu meningkatkan akurasi klasifikasi data. Karenanya, dibangun sebuah hipotesis bahwa penerapan diskretisasi berbasis entropy juga mampu meningkatkan akurasi klasifikasi data pada kasus diagnosis penyakit liver. Dalam penelitian ini, diskretisasi berbasis entropy diterapkan sebagai metode preprocessing, sedangkan KNN digunakan sebagai metode klasifikasi. Klasifikasi dilakukan terhadap data set awal dan data set yang telah melalui proses diskretisasi berbasis entropy. Kemudian, akurasi yang dihasilkan oleh klasifikasi terhadap data set awal dibandingkan dengan akurasi yang dihasilkan oleh klasifikasi terhadap data set terdiskretisasi. Dari seluruh skenario uji coba yang telah dilakukan, terlihat bahwa akurasi klasifikasi pada data set terdiskretisasi lebih tinggi daripada akurasi klasifikasi pada data set awal. Hal ini terjadi pada seluruh nilai k yang diuji. Oleh karena itu, disimpulkan bahwa penerapan diskretisasi berbasis entropy dapat meningkatkan akurasi diagnosis penyakit liver berbasis KNN. Peningkatan akurasi yang diperoleh berkisar antara 1,03% hingga 4,8%.

    Abstraction

    Accuracy was the most important factor that must be considered when choosing data classification method. The higher the accuracy of a data classification method, the more appropriate it to be applied. In the case of liver disease diagnosis, k-Nearest Neighbor (KNN) method showed high accuracy. On the other hand, several researchs showed that application of entropy-based discretization as a preprocessing method could increase the accuracy of data classification. Because of that, it is constructed a hypothesis that application of entropy-based discretization could increase the accuracy of data classification in the case of liver disease diagnosis. In this research, entropy-based discretization was applied as the preprocessing method, while KNN used as the classification method. The classification did on the initial data set and on the data set that has been passed through entropy-based discretization process. Then, the accuracy resulted by classification on the initial data set compared by the accuracy resulted by classification on the discretized data set. From all of the experimental scenarios performed, it seemed that the classification accuracy on discretized data set was higher than the classification accuracy on initial data set. It happened to all of the values of k tested. Thus, it was concluded that the application of entropy-based discretization could increase the accuracy of KNN-based diagnosis of liver disease. The accuracy increasing obtained ranged from 1,03% to 4,8%.

Detail Jurnal