Изменения

Обратное распространение ошибки

81 байт убрано, 16:08, 5 апреля 2019

Нет описания правки

==Обучение как задача оптимизации==

Чтобы понять математическое предназначение метода, требуется осознать взаимоотношения между действительными выходными значениями сети и требуемыми выходными значениями для конкретного примера из обучения. Рассмотрим простую нейронную сеть без скрытых слоев, с двумя входными вершинами и одной выходной, в которых каждый нейрон использует линейную [[Практики реализации нейронных сетей#Функции активации|функцию активации]],~~<ref group="заметка"> Обычно~~(обычно, многослойные нейронные сети используют нелинейные функции активации, линейные функции используются для упрощения понимания~~.</ref>~~ ) которая является взвешенной суммой входных данных. [[File:A simple neural network with two input units and one output unit.png|thumb|250px|Простая нейронная сеть с двумя входными вершинами и одной выходной

]]

==Дифференцирование для однослойной сети==

Метод градиентного спуска включает в себя вычисление дифференциала квадратичной функции ошибки относительно весов сети. Обычно это делается с помощью метода обратного распространения ошибки. Предположим, что выходной нейрон один,~~<ref group="заметка">Их~~ (их может быть несколько, тогда ошибка {{---}} это квадратичная норма вектора разницы~~.</ref>~~ ) тогда квадратичная функция ошибки:

: <math>E = \tfrac 1 2 (t - y)^2,</math> где <math>E</math> {{---}} квадратичная ошибка, <math>t</math> {{---}} требуемый ответ для обучающего образца, <math>y</math> {{---}} действительный ответ сети.

Градиентный спуск с обратным распространением ошибок гарантирует нахождение только локального минимума функции; также, возникают проблемы с пересечением плато на поверхности функции ошибки.

==~~Заметки~~Примечания==<references ~~group="заметка"~~ />

==См. также==

Xroms

32

правки

Изменения

Обратное распространение ошибки

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты