Изменения

Распознавание текста на изображении

30 байт добавлено, 00:23, 29 сентября 2020

hyphens changed to dashes

'''Распознавание текста на изображениях''' ( оптическое распознавание символом (англ. optical character recognition, OCR)) {{- --}} одно из направлений распознавания образов, задача которого заключается в переводе изображений рукописного, машинописного или печатного текста в текстовые данные, использующиеся для представления символов в компьютере (например, в текстовом редакторе).

== Общая информация ==

* более быстрое создание текстовых версий печатных документов, например, сканирование книг для проекта "Гутенберг".

* вспомогательная технология для слепых и слабовидящих пользователей

* оцифровывание документов с целью получить возможность удобной работы с текстом {{- --}} редактирование, поиск слов или строк или анализ.

== Типовые проблемы, связанные с системами OCR ==

[[Файл:Пример нейронной сети для распознавания символов.jpg|thumb|800px| Пример нейронной сети для распознавания символов]]

На картинке в качестве примера схематически показана нейронная сеть, которая включает в себя 35 входов (каждый символ {{- --}} матрица 7x5, соответственно, вектор, описывающий матрицу, состоит из 35 элементов) и 26 выходов (количество букв). Данная НС является двухслойной сетью. [[Практики реализации нейронных сетей#Функции активации|Функцией активации]] поставим логарифмическую сигмоидную функцию, которую удобно использовать, потому что выходные векторы содержат элементы со значениями в диапазоне от 0 до 1, что потом удобно перевести в булеву алгебру. На скрытый уровень выделим 10 нейронов (это число можно регулировать).

'''Пример на синтаксисе скриптового языка MATLAB'''

Нейронные сети с успехом могут применяться в системах распознавания текста, но существует большое число недостатков, которые препятствуют их широкому применению.

* Затраты ~~памяти~~ {{--- }} для построения сети, обеспечивающей распознавание каждого символа текста, необходимо построить достаточно большую сеть элементов, что приводит к большим затратам памяти. * Затраты ресурсов системы {{- --}} помимо памяти, еще сильнее тратятся ресурсы системы в процессе распознавания, так как функции на элементах сети работают с числами с плавающей точкой. * Необходимость в обучение {{- --}} для достижения более точного результата нейронную сеть необходимо обучать на все случаи, однако и это не гарантирует 100% результат.* Зависимость от конфигураций сети {{---}} так как работа нейронной сети по распознаванию текста во многом зависит от конфигурации сети и функций, заданных в элементах, требуется больше усилий для построения эффективно работающей сети.

== См. также ==

Cuciev

436

правок

Изменения

Распознавание текста на изображении

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты