Исслeдoвaтeли из UAB Computer Vision Centre рaзрaбoтaли нoвую систeму автоматического распознавания рукописных текстов, которая на порядок эффективнее и надежнее существующих систем аналогичного назначения.
«Метод обработки размытых форм» предназначен для работы с древними, поврежденными или трудночитаемыми манускриптами, музыкальными партитурами, рукописями и архитектурными чертежами. В тоже время, метод позволяет взаимодействовать с человеком и распознавать документы прямо во время их написания или начертания.
Основа нового метода — база рукописных символов, созданная в результате анализа биологических процессов, протекающих в человеческом сознании во время распознавания различных типов изображений (узнавание форм, структуры, размеров и т.д.). Представленная компьютерная система отличается от похожих тем, что она может различать колебания и отклонения, упругие деформации и искажения, которые возникают во время ручного написания символов (цифр, букв, чертежей). Еще одним преимуществом данной системы является ее способность распознавать рукописный материал в режиме реального времени — буквально через пару секунд после того, как изображение попадает в компьютер.
Для того чтобы распознавать документы, система накладывает символы на координатную сетку и делит их на мелкие участки. Затем информация из каждого участка обрабатывается и сохраняется, причем регистрируются даже самые незначительные изменения в написании символа (например, ъ и ь). В зависимости от формы символа система предпринимает целый ряд действий для распознаваний символа, совершая все возможные преобразования и искажения его формы (например, длину хвостика у буквы р, ее наклон, закругленность и т.д.). После этого полученная информация автоматически обрабатывается и соответственно сортируется.
Чтобы проверить эффективность метода, исследователи создали базы данных музыкальных нот и архитектурных символов. База музыкальных нот создавалась на основе коллекции современных и древних музыкальных партитур (18 и 19 веков), взятых из архивов Семинарии Барселоны. Эта коллекция состояла из 2128 примеров трех типов музыкальных нот, написанных 24 различными людьми. Вторая база включала в себя 2762 примера ручного написания архитектурных символов, разбитых на 14 групп. Каждая группа состояла приблизительно из 200 видов символов, нарисованных 13 различными людьми.
Для того, чтобы сравнить результаты работы данного метода, такие же данные были обработаны на аналогичных компьютерных системах. Разработанная система смогла распознать музыкальных нот на 98% больше, а архитектурных символов удалось распознать на 90% больше. Только наши информеры новостей расскажут о самых свежих новостях.
Оригинал (на англ. языке): Sciencedaily.com
українська версія: Комп'ютери навчилися читати манускрипти