Изменения

Переобучение

1024 байта убрано, 18:43, 15 октября 2018

Нет описания правки

== Примеры ==

=== ~~Недообучение на~~ На примере линейной регрессии ===

Представьте задачу предсказания y по x ∈ R. Рис 1 показывает результат использования модели <math>y=θ_0+θ_1*x</math> для представленного датасета. Как видно из Рис 1 данные не поддаются линейной зависимости и по этой причине модель не очень хороша.

{|align="center"

|-valign="top"

|[[Файл:High_bias_reg.png|200px|thumb|Рис 1. Недообучение]]

|}

Если же добавить дополнительный параметр x^2, и использовать модель <math>y=θ_0+θ_1*x+θ_2*x^2</math>, как представлено на Рис 2, то модель значительно лучше подходит для представленного датасета. Рис 3 показывает результат использования модели <math>y=θ_0+θ_1*x+θ_2*x^2+θ_3*x^3+θ_4*x^4</math> для представленного датасета. Как видно из Рис 3 данная модель слишком заточена для обучающего датасета и, веротяно, покажет плохой результат на тестовой.

=== ~~Недообучение на~~ На примере логистической регрессии ===Представьте задачу классификации размеченых точек. Рис 3 4 показывает результат использования модели <math>g(θ_0+θ_1*x_1+θ_2*x_2)</math> для представленного датасета. Как и в предыдущем примере , данные не поддаются классификации по линейной зависимости.

{|align="center"

|-valign="top"

|}

В случае же выбора модели <math>g(θ_0+θ_1*x_1+θ_2*x_2+θ_3*x_1^2+θ_4*x_2^2+θ_5*x_1*x_2)</math>, представленой на Рис 45, данные значительно лучше соответствуют модели. ~~=== Переобучение на примере линейной регрессии ===~~Представьте задачу предсказания y по x ∈ R. Рис 5 показывает результат использования модели <math>y=θ_0+θ_1*x+θ_2*x^2+θ_3*x^3+θ_4*x^4</math> для представленного датасета. Как видно из Рис 5 данная модель слишком заточена для обучающего датасета и, веротяно, покажет плохой результат на тестовой.~~{|align="center"~~ ~~|-valign="top"~~ ~~|[[Файл:High_variance_reg.png|200px|thumb|Рис 5. Переобучение]]~~ ~~|[[Файл:Normal_bias_reg.png|200px|thumb|Рис 6]]~~ |}~~Если же добавить упростить модель, и использовать функцию <math>y=θ_0+θ_1*x+θ_2*x^2</math>, как представлено на~~ Рис 6~~, то модель значительно лучше подходит для представленного датасета.~~ ~~=== Переобучение на примере логистической регрессии ===Представьте задачу классификации размеченых точек. Рис 7~~ показывает результат использования модели <math>g(θ_0+θ_1*x_1+θ_2*x_1^2+θ_3*x_2*x_1^2+θ_4*x_1^2*x_2^2 + ...)</math> для представленного датасета. ~~{|align="center"~~ |-~~valign="top"~~ ~~|[[Файл:High_variance_cla.png|200px|thumb|Рис 7. Переобучение]]~~ ~~|[[Файл:Normal_bias_cla.png|200px|thumb|Рис 8]]~~ |}В случае же выбора модели <math>g(θ_0+θ_1*x_1+θ_2*x_2+θ_3*x_1^2+θ_4*x_2^2+x_1*x_2)</math>, представленой на Рис 8, данные значительно лучше соответствуют моделиэто яркий пример явления переобучения.

== Кривые обучения ==

Анонимный участник

80.76.244.114

Изменения

Переобучение

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты