Обнаружение видеотекста с помощью текстовых границ и сверточной нейронной сети
Ключевые слова:
видеопоток, распознавание, глубокое обучение, эвристика, классификаторАннотация
В данной статье основное внимание уделено обнаружению текста в видеопотоке. Рассмотрена схема «от грубого к точному» для обнаружения видеотекста. На первом этапе используется метод на основе границ для быстрого обнаружения потенциальных областей текста с высокой запоминаемостью, затем применяются три эвристических правила (минимальная высота, минимальная ширина и минимальное отношение площади пикселя-кандидата к его ограничивающей рамке) для устранения ложных срабатываний. На втором этапе применяется обученный классификатор CNN для присвоения достоверной оценки каждому пикселю в регионе-кандидате, и, наконец, карта достоверности регионов–кандидатов разбивается на текстовые строки с помощью проекционного анализа. Эффективность предлагаемого метода оценивается с помощью двух общедоступных наборов данных для тестирования и предложенного набора данных из 300 видеокадров.
Загрузки
Опубликован
Выпуск
Раздел
Лицензия

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») 4.0 Всемирная.
Статьи журнала «Вестник Донецкого университета. Серия 04. Технические науки» находятся в открытом доступе и распространяются в соответствии с условиями Лицензионного Договора с Донецким Государственным университетом, который бесплатно предоставляет авторам неограниченное распространение и самостоятельное архивирование.





