Detail Karya Ilmiah
-
Sistem Rekomendasi Film Menggunakan Metode Hybrid (Content Based Dan Collaborative Filtering Item-Based)Penulis : Triyani Fatchur RahmanDosen Pembimbing I : Dr. Noor Ifada, S.T., MISD.Dosen Pembimbing II : Moch. Kautsar Sophan, S.Kom., M.MT.Abstraksi
Sistem rekomendasi adalah sistem yang memprediksi rating atau preferensi yang akan diberikan user ke suatu item.Tujuan dari sistem rekomendasi agar secara otomatis menghasilkan item yang disarankan untuk pengguna sesuai dengan preferensi historis mereka dan menghemat waktu pencarian mereka secara online dengan mengumpulkan data yang berhubungan dengan user atau item yang bermanfaat. Rekomendasi film adalah aplikasi yang paling populer digunakan ditambah dengan platform multimedia online. Dalam menghasilkan rekomendasi ada beberapa pendekatan metode tradisional yaitu metode Collaborative Filtering(CF) dan Content-Based (CB). Meskipun kedua metode memiliki kelebihan, mereka juga memiliki kelemahan tertentu pada masing-masing setiap metode. Secara umum pada pendekatan metode CF melaporkan kinerja yang lebih baik daripada pendekatan CB, tetapi keberhasilannya bergantung pada jumlah rating user yang mencukupi (Sparsity). Dalam situasi ini penggunaan pendekatan CB muncul sebagai alternatif. Namun demikian, pendekatan ini memiliki keterbatasannya sendiri. Misalnya, kata kunci yang digunakan untuk mewakili konten item mungkin tidak terlalu representatif. Salah satu algoritma yang sering digunakan pada metode CF ini yaitu item-based dan user-based. Item-based CF mempunyai akurasi yang lebih baik dibandingkan user-based CF. Maka solusi yang ditawarkan dengan menutupi kekurangan kedua metode pada penelitian ini dilakukanlah metode Hybrid(CB dan CF item-based). Pada CB akan dilakukan text mining untuk melakukan text prepocessing nya dan algoritma K-Means untuk melakukan clustering data karena metode ini telah dikenal sangat efisien dan diperhitungkan dalam melakukan clustering. Dala penelitian ini hasil evaluasi dengan pendekatan metode hybrid (CB dan CF item-based) dalam mengatasi sparsity data dan kelemahan pada metode CB dan CF item-based dalam menghasilkan suatu rekomendasi diperoleh hasil evaluasi DCG dengan menggunakan nilai parameter jumlah neighbour(Q) = 40, jumlah cluster(k) = 520 dan Top-10 adalah 0,03840.
AbstractionRecommendation system is a system that predicts the rating or preference that a user will give to an item. The purpose of the recommendation system is to automatically generate items recommended for users according to their historical preferences and save time searching them online by collecting data related to the user or useful item. Movie recommendations are the most popular applications used plus online multimedia platforms. In generating recommendations there are several approaches to traditional methods namely the Collaborative Filtering (CF) and Content-Based (CB) methods. Although both methods have advantages, they also have certain weaknesses in each of the methods. In general, the CF method approach reports better performance than the CB approach, but its success depends on the number of user ratings that are sufficient (Sparsity). In this situation the use of the CB approach appears as an alternative. However, this approach has its own limitations. For example, keywords used to represent item content might not be overly representative. One algorithm that is often used in this CF method is item-based and user-based. Item-based CFs have better accuracy than user-based CFs. Then the solution offered by covering the shortcomings of the two methods in this study carried out the Hybrid method (CB and CF item-based). In CB, text mining will be carried out to do the text prepocessing and K-Means algorithm to do data clustering because this method has been known to be very efficient and taken into account in conducting clustering. In this study the results of the evaluation using the hybrid method approach (CB and CF item-based) in overcoming sparsity data and weaknesses in the item-based CB and CF method in generating a recommendation obtained by the DCG evaluation results using the parameter value of the number of neighbors (Q) = 40 , the number of clusters (k) = 520 and Top-10 is 0.03840.