Изменения
→Sigmoid function
== Sigmoid function ==
У ступенчатых функций есть определенное количество ограничений, связанных с ее линейностью.Если функция активации является линейной, то независимо от количества складываемых скрытых слоев в нейронной сети, конечный результат по-прежнему будет являеться линейной комбинацией исходных входных данных.Эта линейность означает, что она не может реально охватить сложность нелинейных задач, таких как оператор XOR или различные паттерны, разделенные кривыми или кругами. Другой проблемой является то, что перцептрон с ступенчатой функцией не очень «стабилен», то есть может перейти из состояния 0 в 1 и из 0 в 1 при небольших изменениях в любом из весов входного слоя. Для того, чтобы избежать данных проблем, в нейронных сетях используется sigmoid function в качестве активационной. *сюда картинку* Sigmoid function, в отличие от ступенчатой функции, вводит нелинейность в выбранную модель нейронной сети. Нелинейность означает, что выход, получаемых из нейрона, который является произведением некоторых входов x <math>(x_1, x_2, ..., x_m)</math> и весов w <math>(w_1, w_2, ..., w_m)</math> плюс смещение, а затем помещаемый в sigmoid function, не может быть представлен линейной комбинацией входов x <math>(x_1, x_2, ..., x_m)</math>.
== Rectified Linear Units (ReLU) ==