Detail Karya Ilmiah

  • Lokalisasi Teks pada Scene Text Image Menggunakan Directional Discrete Cosine Transform (DDCT)
    Penulis : Thuhri Mutya Amalia
    Dosen Pembimbing I : Rosida Vivin Nahari, S.Kom., M.T.
    Dosen Pembimbing II :Sigit Susanto Putro, S.Kom., M.Kom.
    Abstraksi

    Teks sering dijumpai di berbagai tempat seperti nama jalan, nama toko, spanduk, penunjuk jalan, peringatan, dan lain sebagainya. Deteksi teks terbagi menjadi tiga pendekatan yaitu pendekatan tekstur, pendekatan edge, dan pendekatan connected component. Pendekatan tekstur dapat mendeteksi teks dengan baik, namun membutuhkan data training yang banyak. Lokalisasi teks merupakan langkah dasar dalam banyak aplikasi komputer termasuk video Optical Character Recognition (OCR), untuk memahami konten video, dan lain-lain. Penelitian ini bertujuan untuk melokalisasi teks pada gambar. Metode yang digunakan dalam penelitian ini adalah Directional Discrete Cosine Transform (DDCT) dan connected component. Dataset yang digunakan adalah dataset Focused Scene Text Robust Reading Competition ICDAR2013 yang memiliki jumlah data sebanyak 233 pada data test. Hasil yang didapatkan dengan nilai rata-rata dari penelitian ini adalah precision 0.36, recall 0.91 dan f1 score 0.45. Nilai precision lebih rendah karena banyak komponen bukan teks ikut terlokalisasi. Sedangkan nilai recall lebih tinggi dan banyak teks yang terlokalisasi. Kata Kunci: Teks, Gambar, Scene Text Image, Directional Discrete Cosine Transform (DDCT)

    Abstraction

    Text is often found in various places such as street names, shop names, banners, signs, warnings, and so on. Text detection is divided into three approaches, namely the texture approach, the edge approach, and the connected component approach. The texture approach can detect text well, but requires a lot of training data. Text localization is a basic step in many computer applications including Optical Character Recognition (OCR) videos, to understand video content, and so on. This study aims to localize the text in the image. The method used in this study is Directional Discrete Cosine Transform (DDCT) and connected component. The dataset used is the Focused Scene Text Robust Reading Competition dataset ICDAR 2013 which has 233 data in the test data. The results obtained with the average value of this study are precision 0.36, recall 0.91 and F1 score 0.45. Precision values ??are lower because many non-text components are localized. While the recall value is higher and many texts are localized. Keywords: Text, Image, Scene Text Image, Directional Discrete Cosine Transform (DDCT)

Detail Jurnal