Detail Karya Ilmiah
-
IMPLEMENTASI SELEKSI FITUR F-SCORE DAN ALGORITMA C4.5 UNTUK DIAGNOSA PENYAKIT DIABETES MELLITUSPenulis : SITI MUNTAFIAHDosen Pembimbing I : Mula’ab, S.Si., M.Kom.Dosen Pembimbing II :Rosida Vivin Nahari, S.Kom., M.T.Abstraksi
Berdasarkan data Organisasi Kesehatan Dunia (WHO), Indonesia merupakan negara yang memiliki tingkat kematian keempat tertinggi didunia yang disebabkan oleh diabetes mellitus[1]. Diabetes mellitusmerupakan penyakit yang memiliki beberapa gejala yang wajib diwaspadai, misalnya banyaknya kehamilan, konsentrasi glukosa dan lainnya. Dari banyaknya fitur yang ada menimbulkan beberapa masalah salah satunya semakin lama proses diagnosa.Penyeleksian fitur yang kurang relevan dapat digunakan untuk mengurangi proses waktu diagnosa. Seleksi fitur f-score dapat digunakan untuk mengurangi gejala yang kurang relevan sehingga waktu untuk mendiagnosa lebih efektif dan akurasi lebih baik. Selain penyeleksian fitur, pengklasifikasian penyakit dapat dilakukan untuk mengetahui apakah pasien positif diabetes mellitus atau negatif diabetes mellitus. Algoritma C4.5 merupakan algoritma machine learning yang dapat digunakan untuk klasifikasi penyakit serta dapat menemukan pola dari suatu data.Tujuan dari penelitian ini untuk mengukur nilai akurasi yang dihasilkan dari klasifikasi diabetes menggunakan algoritma C4.5 dengan seleksi fitur dan tanpa seleksi fitur.Akurasi menggunakan metode seleksi fitur f-score dan algoritma C4.5 dengan jumlah data training sebanyak 80% menghasilkan nilai akurasi 72,791% dan precision 63, 924% dan recall 51,208 dengan waktu 12,99s
AbstractionBased on data from the World Health Organization (WHO), Indonesia is a country that has the fourth highest mortality rate in the world caused by diabetes mellitus [1]. Diabetes mellitus is a disease that has several symptoms that must be watched out for, for example the number of pregnancies, glucose concentrations and others. Of the many features that have caused several problems, one of them is the longer the diagnosis process. Selection of less relevant features can be used to reduce the time process of diagnosis. Selection of the f-score feature can be used to reduce symptoms that are less relevant so that the time to diagnose is more effective and accuracy is better. In addition to selecting features, classification of diseases can be done to determine whether the patient is positive for diabetes mellitus or negative diabetes mellitus. C4.5 algorithm is a machine learning algorithm that can be used for classification of diseases and can find patterns from a data. The purpose of this study is to measure the accuracy value generated from diabetes classification using the C4.5 algorithm with feature selection and without feature selection. Accuracy using f-score feature selection method and C4.5 algorithm with 80% training data results in an accuracy value of 72.71% and precision 63, 924% and recall 51.208 with a time of 12.99