Обнаружение видеотекста с помощью текстовых границ и сверточной нейронной сети

Авторы

  • Авраменко Владислав Валерьевич ФГБОУ ВО «Донецкий государственный университет» Автор
  • Звягинцева Анна Викторовна ФГБОУ ВО «Донецкий государственный университет» Автор

Ключевые слова:

видеопоток, распознавание, глубокое обучение, эвристика, классификатор

Аннотация

В данной статье основное внимание уделено обнаружению текста в видеопотоке. Рассмотрена схема «от грубого к точному» для обнаружения видеотекста. На первом этапе используется метод на основе границ для быстрого обнаружения потенциальных областей текста с высокой запоминаемостью, затем применяются три эвристических правила (минимальная высота, минимальная ширина и минимальное отношение площади пикселя-кандидата к его ограничивающей рамке) для устранения ложных срабатываний. На втором этапе применяется обученный классификатор CNN для присвоения достоверной оценки каждому пикселю в регионе-кандидате, и, наконец, карта достоверности регионов–кандидатов разбивается на текстовые строки с помощью проекционного анализа. Эффективность предлагаемого метода оценивается с помощью двух общедоступных наборов данных для тестирования и предложенного набора данных из 300 видеокадров.

Загрузки

Опубликован

22.12.2023

Выпуск

Раздел

Информационные технологии и телекоммуникации

Как цитировать

[1]
2023. Обнаружение видеотекста с помощью текстовых границ и сверточной нейронной сети. Вестник Донецкого университета. Серия 04. Технические науки. 4 (Dec. 2023), 76–82.