Detektor MSER dan OCR pada Pembacaan Rambu Petunjuk Jalan
DOI:
https://doi.org/10.36277/jteuniba.v10i2.1323Keywords:
MSER, OCR, Segmentasi Teks, Rambu Petunjuk Jalan, Pengolahan Citra, Kendaraan OtonomAbstract
Pengenalan teks pada rambu petunjuk jalan merupakan tantangan utama dalam pengolahan citra digital, terutama ketika menghadapi kondisi pencahayaan yang bervariasi, distorsi gambar, dan perbedaan ukuran font pada rambu. Artikel ini membahas penggunaan Maximally Stable Extremal Regions (MSER), sebuah metode deteksi fitur, untuk segmentasi teks pada gambar rambu jalan. Proses ini dilanjutkan dengan penerapan Optical Character Recognition (OCR) untuk mengenali karakter-karakter yang terdeteksi. MSER berfungsi untuk mengidentifikasi dan mengekstrak wilayah-wilayah stabil dalam gambar, yang membantu memisahkan teks dari latar belakang atau elemen non-teks. Teknik ini terbukti efisien dalam mengatasi tantangan visual yang muncul akibat bayangan, pantulan cahaya, dan kualitas gambar yang rendah. Setelah teks berhasil disegmentasi, OCR digunakan untuk mengonversi teks dalam gambar menjadi teks digital yang dapat diproses oleh komputer. Penerapan OCR yang tepat memungkinkan sistem untuk mengenali berbagai jenis font dan orientasi teks dengan lebih akurat. Pendekatan ini menawarkan solusi efektif untuk masalah segmentasi teks dalam kondisi lingkungan yang dinamis, seperti pada rambu lalu lintas yang sering terpengaruh oleh sudut pandang atau pencahayaan buruk. Hasil uji coba menunjukkan bahwa metode ini mampu meningkatkan akurasi pengenalan teks pada rambu petunjuk jalan dengan tingkat kesalahan yang rendah, serta berkontribusi pada pengembangan sistem pengenalan rambu otomatis yang dapat diintegrasikan dengan kendaraan otonom dan aplikasi berbasis pengolahan citra.
Downloads
References
H. P. Harahap, “Pendeteksian Objek Pada Citra Menggunakan Pencocokan Titik-Titik Fitur Berbasis Algoritma SURF dan MSER,” Komputasi J. Ilm. Ilmu Komput. dan Mat., vol. 13, no. 2, pp. 71–79, 2017.
K. Dutta, R. Sarkhel, M. Kundu, M. Nasipuri, and N. Das, “Natural scene text localization and detection using MSER and its variants: a comprehensive survey,” Multimed. Tools Appl., vol. 83, no. 18, pp. 55773–55810, 2024.
A. Marshanda, B. Harijanto, and C. Rahmad, “Implementasi Optical Character Recognition (OCR) untuk Meningkatkan Akurasi dan Kecepatan Input Data di Posyandu,” J. Inform. Polinema, vol. 11, no. 1, pp. 45–50, 2024.
E. Zhang, K. Wang, X. Xu, Z. Wang, and H. Shi, “Forget-me-not: Learning to forget in text-to-image diffusion models,” arXiv Prepr. arXiv2303.17591, 2023.
M. H. Irfani and G. Gasim, “Segmentasi teks pada citra tulisan tangan kalimat menggunakan metode Median Filtering dan Otsu,” Teknosains Media Inf. Sains dan Teknol., vol. 18, no. 1, pp. 88–97, 2024.
P. Widyarsa, “Optical Character Recognition (Ocr) Sastra Melayu Menggunakan Learning Vector Quantization.” Universitas Lancang Kuning, 2024.
F. I. Maulana, A. Rahayu, G. K. Zamahsari, P. D. P. Adi, R. Arifuddin, and W. Dirgantara, “Augmented Reality in Higher Education: Literature Review,” in 2024 International Seminar on Intelligent Technology and Its Applications (ISITIA), 2024, pp. 752–757.
M. Lotfy and G. Soliman, “CNN-optimized text recognition with binary embeddings for Arabic expiry date recognition,” J. Electr. Syst. Inf. Technol., vol. 11, no. 1, p. 11, 2024.
T. Liu, S. Liu, Z. Chen, and W.-Y. Ma, “An evaluation on feature selection for text clustering,” in Proceedings of the 20th international conference on machine learning (ICML-03), 2003, pp. 488–495.
E. Boulham, M. Taffar, and M. Bensouilah, “CRNN-based Word Recognition Model for Reading Algerian Drug Labels,” in 2024 8th International Conference on Image and Signal Processing and their Applications (ISPA), 2024, pp. 1–8.
R. R. Brillian, “Optimisasi Pencocokan Kata dalam Optical Character Recognition Menggunakan Metode Hamming Distance.” Universitas Muhammadiyah Gresik, 2024.
H. Siyuan, Y. Xiong, and W. Guibin, “LayoutPointer: A Spatial-Context Adaptive Pointer Network for Visual Information Extraction,” in Proceedings of the 2024 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (Volume 1: Long Papers), 2024, pp. 3737–3748.
T. Zhang et al., “VCR: Visual Caption Restoration,” arXiv Prepr. arXiv2406.06462, 2024.
W. Liao, J. Wang, H. Li, C. Wang, J. Huang, and L. Jin, “DocLayLLM: An Efficient Multi-modal Extension of Large Language Models for Text-rich Document Understanding,” in Proc. IEEE/CVF Conf. Computer Vision and Pattern Recognition (CVPR), June 2025, pp. 4038–4049.
S. Guan, M. Lin, C. Xu, X. Liu, J. Zhao, J. Fan, Q. Xu, and D. Greene, “PreP-OCR: A Complete Pipeline for Document Image Restoration and Enhanced OCR Accuracy,” in Proc. 63rd Annual Meeting of the Association for Computational Linguistics (ACL), July 2025, Vienna, Austria.
Z. Liu et al., “A Systematic Survey of Deep Learning for Scene Text Detection and Recognition,” Applied Sciences (MDPI), 2025.
S. Pagadala, “Improving Document Digitization with Machine Learning: hybrid OCR+MSER approach,” IJSAT (journal/proceedings), 2025.
S. Ahmed et al., “Towards Source-Free Machine Unlearning,” CVPR 2025 proceedings
R. Patel and S. Gupta, “Document Image Binarization and Region Selection for Improved OCR,” Pattern Recognition, vol. 133, 2025.
F. Ahmed, L. Sun, and B. Torres, “Preprocessing and Postprocessing Strategies to Reduce OCR CER in Noisy Scans,” IEEE Access, vol. 13, 2025, pp. 11234–11250.
W. A. L. Alves et al., “Multichannel image classification based on adaptive attribute profiles,” Pattern Recognition Letters, 187 (2025) 107–114.
Downloads
Published
Issue
Section
License
Copyright (c) 2026 Rahman Arifuddin, Subairi, Elta Sonalitha, Basitha Febrinda Hidayatullail, Resi Dwi jayanti Kartika Sari, Muhammad Darul Fatoni

This work is licensed under a Creative Commons Attribution 4.0 International License.















