Detektor MSER dan OCR pada Pembacaan Rambu Petunjuk Jalan

Rahman Arifuddin; Subairi Subairi; Elta  Sonalitha; Basitha Febrinda  Hidayatullail; Resi Dwi jayanti Kartika  Sari; Muhammad Darul  Fatoni

doi:10.36277/jteuniba.v10i2.1323

Authors

Rahman Arifuddin Universitas Merdeka Malang
Subairi Universitas Merdeka Malang
Elta Sonalitha Universitas Merdeka Malang
Basitha Febrinda Hidayatullail Universitas Merdeka Malang
Resi Dwi jayanti Kartika Sari Universitas Merdeka Malang
Muhammad Darul Fatoni Universitas Merdeka Malang

DOI:

https://doi.org/10.36277/jteuniba.v10i2.1323

Keywords:

MSER, OCR, Segmentasi Teks, Rambu Petunjuk Jalan, Pengolahan Citra, Kendaraan Otonom

Abstract

Pengenalan teks pada rambu petunjuk jalan merupakan tantangan utama dalam pengolahan citra digital, terutama ketika menghadapi kondisi pencahayaan yang bervariasi, distorsi gambar, dan perbedaan ukuran font pada rambu. Artikel ini membahas penggunaan Maximally Stable Extremal Regions (MSER), sebuah metode deteksi fitur, untuk segmentasi teks pada gambar rambu jalan. Proses ini dilanjutkan dengan penerapan Optical Character Recognition (OCR) untuk mengenali karakter-karakter yang terdeteksi. MSER berfungsi untuk mengidentifikasi dan mengekstrak wilayah-wilayah stabil dalam gambar, yang membantu memisahkan teks dari latar belakang atau elemen non-teks. Teknik ini terbukti efisien dalam mengatasi tantangan visual yang muncul akibat bayangan, pantulan cahaya, dan kualitas gambar yang rendah. Setelah teks berhasil disegmentasi, OCR digunakan untuk mengonversi teks dalam gambar menjadi teks digital yang dapat diproses oleh komputer. Penerapan OCR yang tepat memungkinkan sistem untuk mengenali berbagai jenis font dan orientasi teks dengan lebih akurat. Pendekatan ini menawarkan solusi efektif untuk masalah segmentasi teks dalam kondisi lingkungan yang dinamis, seperti pada rambu lalu lintas yang sering terpengaruh oleh sudut pandang atau pencahayaan buruk. Hasil uji coba menunjukkan bahwa metode ini mampu meningkatkan akurasi pengenalan teks pada rambu petunjuk jalan dengan tingkat kesalahan yang rendah, serta berkontribusi pada pengembangan sistem pengenalan rambu otomatis yang dapat diintegrasikan dengan kendaraan otonom dan aplikasi berbasis pengolahan citra.

Downloads

Download data is not yet available.

References

H. P. Harahap, “Pendeteksian Objek Pada Citra Menggunakan Pencocokan Titik-Titik Fitur Berbasis Algoritma SURF dan MSER,” Komputasi J. Ilm. Ilmu Komput. dan Mat., vol. 13, no. 2, pp. 71–79, 2017.

K. Dutta, R. Sarkhel, M. Kundu, M. Nasipuri, and N. Das, “Natural scene text localization and detection using MSER and its variants: a comprehensive survey,” Multimed. Tools Appl., vol. 83, no. 18, pp. 55773–55810, 2024.

A. Marshanda, B. Harijanto, and C. Rahmad, “Implementasi Optical Character Recognition (OCR) untuk Meningkatkan Akurasi dan Kecepatan Input Data di Posyandu,” J. Inform. Polinema, vol. 11, no. 1, pp. 45–50, 2024.

E. Zhang, K. Wang, X. Xu, Z. Wang, and H. Shi, “Forget-me-not: Learning to forget in text-to-image diffusion models,” arXiv Prepr. arXiv2303.17591, 2023.

M. H. Irfani and G. Gasim, “Segmentasi teks pada citra tulisan tangan kalimat menggunakan metode Median Filtering dan Otsu,” Teknosains Media Inf. Sains dan Teknol., vol. 18, no. 1, pp. 88–97, 2024.

P. Widyarsa, “Optical Character Recognition (Ocr) Sastra Melayu Menggunakan Learning Vector Quantization.” Universitas Lancang Kuning, 2024.

F. I. Maulana, A. Rahayu, G. K. Zamahsari, P. D. P. Adi, R. Arifuddin, and W. Dirgantara, “Augmented Reality in Higher Education: Literature Review,” in 2024 International Seminar on Intelligent Technology and Its Applications (ISITIA), 2024, pp. 752–757.

M. Lotfy and G. Soliman, “CNN-optimized text recognition with binary embeddings for Arabic expiry date recognition,” J. Electr. Syst. Inf. Technol., vol. 11, no. 1, p. 11, 2024.

T. Liu, S. Liu, Z. Chen, and W.-Y. Ma, “An evaluation on feature selection for text clustering,” in Proceedings of the 20th international conference on machine learning (ICML-03), 2003, pp. 488–495.

E. Boulham, M. Taffar, and M. Bensouilah, “CRNN-based Word Recognition Model for Reading Algerian Drug Labels,” in 2024 8th International Conference on Image and Signal Processing and their Applications (ISPA), 2024, pp. 1–8.

R. R. Brillian, “Optimisasi Pencocokan Kata dalam Optical Character Recognition Menggunakan Metode Hamming Distance.” Universitas Muhammadiyah Gresik, 2024.

H. Siyuan, Y. Xiong, and W. Guibin, “LayoutPointer: A Spatial-Context Adaptive Pointer Network for Visual Information Extraction,” in Proceedings of the 2024 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (Volume 1: Long Papers), 2024, pp. 3737–3748.

T. Zhang et al., “VCR: Visual Caption Restoration,” arXiv Prepr. arXiv2406.06462, 2024.

W. Liao, J. Wang, H. Li, C. Wang, J. Huang, and L. Jin, “DocLayLLM: An Efficient Multi-modal Extension of Large Language Models for Text-rich Document Understanding,” in Proc. IEEE/CVF Conf. Computer Vision and Pattern Recognition (CVPR), June 2025, pp. 4038–4049.

S. Guan, M. Lin, C. Xu, X. Liu, J. Zhao, J. Fan, Q. Xu, and D. Greene, “PreP-OCR: A Complete Pipeline for Document Image Restoration and Enhanced OCR Accuracy,” in Proc. 63rd Annual Meeting of the Association for Computational Linguistics (ACL), July 2025, Vienna, Austria.

Z. Liu et al., “A Systematic Survey of Deep Learning for Scene Text Detection and Recognition,” Applied Sciences (MDPI), 2025.

S. Pagadala, “Improving Document Digitization with Machine Learning: hybrid OCR+MSER approach,” IJSAT (journal/proceedings), 2025.

S. Ahmed et al., “Towards Source-Free Machine Unlearning,” CVPR 2025 proceedings

R. Patel and S. Gupta, “Document Image Binarization and Region Selection for Improved OCR,” Pattern Recognition, vol. 133, 2025.

F. Ahmed, L. Sun, and B. Torres, “Preprocessing and Postprocessing Strategies to Reduce OCR CER in Noisy Scans,” IEEE Access, vol. 13, 2025, pp. 11234–11250.

W. A. L. Alves et al., “Multichannel image classification based on adaptive attribute profiles,” Pattern Recognition Letters, 187 (2025) 107–114.