Detail Karya Ilmiah

  • Penerapan Regular Expression Untuk Mengelompokkan Niche Blog
    Penulis : Muhammad Darul Mukhlasin
    Dosen Pembimbing I : Firdaus Solihin S.Kom., M.Kom
    Dosen Pembimbing II :Bain Khusnul Khotimah S.T., M.Kom

    Internet merupakan kebutuhan pokok bagi banyak orang di era informasi. Informasi yang terdapat di internet sangat banyak. Search engine merupakan sistem yang mampu melakukan pencarian dan pengambilan informasi berdasarkan kata kunci yang dimasukkan oleh pengguna. Blog merupakan salah satu penyumbang informasi yang notabene dibuat oleh para blogger. Jumlah blogger di Indonesia semakin bertambah, berbanding lurus dengan jumlah informasi di internet. Dari kondisi tersebut diperlukan mekanisme mempercepat proses pengambilan informasi dari pemilahan blog berdasarkan kategori yang telah ditentukan sebelumnya. Web crawler aplikasi yang berfungsi mengambil informasi yang diperlukan dengan cara menjelajahi halaman situs blog kemudian disimpan dalam database. Proses pengambilan halaman web dilakukan pengecekan bahasa menggunakan regular expression dan daftar stopword untuk tujuh kategori yang ditentukan berdasarkan niche blog : tips dan trik komputer, kuliner nusantara, sepak bola, petualangan indonesia, kesehatan Ibu dan anak, handphone dan gadget, fashion wanita. Niche blog adalah aktivitas blogging yang dilakukan oleh para blogger untuk membuat blog bertopik spesifik. Dengan mengaplikasikan konsep web crawler, penelitian ini mampu menentukan niche blog sesuai dengan tujuh kategori yang telah ditentukan dengan mengujikan 10 kata kunci dan daftar stopword. Dari hasil ujicoba, dapat diambil kesimpulan penggunaan 3 kunci mendapatkan hasil paling maksimal. Keywords: Niche Blog, Regular Expression, Web Crawler, Search Engine


    ABSTRACT Internet is a basic requirement for many people in the information age . The information contained on the internet is very huge. Search engine is a system that is able to perform search and retrieval of information based on the keywords entered by the user . Blog is one of the contributors of information which is actually made by the blogger . The number of bloggers is increasing in Indonesia. This is directly proportional to the amount of information on the internet . This conditions needed a mechanism to accelerate the process of sorting the blog information retrieval based on a pre-determined categories . Web crawler application that serves the information they need by exploring the blog page of the site is then stored in a database . The process of making a web page to be checked using the regular expression language and stopword list for the seven categories defined by niche blog : tips and tricks of computer , culinary , soccer , adventure , mother and child health , mobile phones and gadgets , and ladies' fashion. Niche blogs are blogging activities undertaken by the bloggers to create blogs with specific stubs . By applying the concept of web crawlers , this study was able to determine the appropriate blog niche with seven categories that have been determined by testing out of 10 keywords and a list of stopwords . From the test results , it can be concluded uses 3 keys to get the maximum results . . Keywords: Niche Blog, Regular Expression, Web Crawler, Search Engine

Detail Jurnal