Изменения

Перейти к: навигация, поиск

Распознавание текста на изображении

30 байт добавлено, 00:23, 29 сентября 2020
hyphens changed to dashes
'''Распознавание текста на изображениях''' ( оптическое распознавание символом (англ. optical character recognition, OCR)) {{- --}} одно из направлений распознавания образов, задача которого заключается в переводе изображений рукописного, машинописного или печатного текста в текстовые данные, использующиеся для представления символов в компьютере (например, в текстовом редакторе).
== Общая информация ==
* более быстрое создание текстовых версий печатных документов, например, сканирование книг для проекта "Гутенберг".
* вспомогательная технология для слепых и слабовидящих пользователей
* оцифровывание документов с целью получить возможность удобной работы с текстом {{- --}} редактирование, поиск слов или строк или анализ.
== Типовые проблемы, связанные с системами OCR ==
[[Файл:Пример нейронной сети для распознавания символов.jpg|thumb|800px| Пример нейронной сети для распознавания символов]]
На картинке в качестве примера схематически показана нейронная сеть, которая включает в себя 35 входов (каждый символ {{- --}} матрица 7x5, соответственно, вектор, описывающий матрицу, состоит из 35 элементов) и 26 выходов (количество букв). Данная НС является двухслойной сетью. [[Практики реализации нейронных сетей#Функции активации|Функцией активации]] поставим логарифмическую сигмоидную функцию, которую удобно использовать, потому что выходные векторы содержат элементы со значениями в диапазоне от 0 до 1, что потом удобно перевести в булеву алгебру. На скрытый уровень выделим 10 нейронов (это число можно регулировать).
'''Пример на синтаксисе скриптового языка MATLAB'''
Нейронные сети с успехом могут применяться в системах распознавания текста, но существует большое число недостатков, которые препятствуют их широкому применению.
* Затраты памяти {{--- }} для построения сети, обеспечивающей распознавание каждого символа текста, необходимо построить достаточно большую сеть элементов, что приводит к большим затратам памяти. * Затраты ресурсов системы {{- --}} помимо памяти, еще сильнее тратятся ресурсы системы в процессе распознавания, так как функции на элементах сети работают с числами с плавающей точкой. * Необходимость в обучение {{- --}} для достижения более точного результата нейронную сеть необходимо обучать на все случаи, однако и это не гарантирует 100% результат.* Зависимость от конфигураций сети {{---}} так как работа нейронной сети по распознаванию текста во многом зависит от конфигурации сети и функций, заданных в элементах, требуется больше усилий для построения эффективно работающей сети.
== См. также ==
436
правок

Навигация