Переобучение

Переобучение (англ. overfitting) — негативное явление, возникающее, когда алгоритм обучения вырабатывает предсказания, которые слишком близко или точно соответствуют конкретному набору данных, и поэтому не подходят для применения алгоритма к дополнительным данным или будущим наблюдениям.

Недообучение (англ. underfitting) — негативное явление, возникающее, когда выбранная статистическая модель не может адекватно описать базовую структуру данных.

Содержание

1 Примеры
- 1.1 На примере линейной регрессии
- 1.2 На примере логистической регрессии
2 Кривые обучения
- 2.1 Кривые обучения при переобучении
- 2.2 Кривые обучения при недообучении
3 High variance и high bias
4 Возможные решения
- 4.1 Возможные решения при переобучении
- 4.2 Возможные решения при недообучении
5 См. также
6 Примечания
7 Источники информации

Примеры

На примере линейной регрессии

Представьте задачу предсказания [math]y[/math] по [math]x \in R[/math]. Рис 1 показывает результат использования модели [math]y=θ_0+θ_1*x[/math] для представленного датасета. Как видно из Рис 1 данные не поддаются линейной зависимости, и по этой причине модель не очень хороша.

Рис 1. Недообучение

Рис 2. Модель подходит

Рис 3. Переобучение

Если же добавить дополнительный параметр [math]x^2[/math], и использовать модель [math]y=θ_0+θ_1*x+θ_2*x^2[/math], как представлено на Рис 2, то модель значительно лучше подходит для представленного датасета. Рис 3 показывает результат использования модели для представленного датасета. Как видно из Рис 3 данная модель слишком заточена для обучающего датасета и, веротяно, покажет плохой результат на тестовой.

На примере логистической регрессии

Представьте задачу классификации размеченых точек. Рис 4 показывает результат использования модели [math]g(θ_0+θ_1*x_1+θ_2*x_2)[/math] для представленного датасета. Как и в предыдущем примере, данные не поддаются классификации по линейной зависимости.

Рис 4. Недообучение

Рис 5. Модель подходит

Рис 6. Переобучение

В случае же выбора модели , представленой на Рис 5, данные значительно лучше соответствуют модели. Рис 6 показывает результат использования модели для представленного датасета — это яркий пример явления переобучения.

Кривые обучения

Кривые обучения при переобучении

Кривые обучения при недообучении

High variance и high bias

...

Возможные решения

Возможные решения при переобучении

Увеличение количества данных в наборе
Уменьшение количества параметров модели
Добавление регуляризации / увеличение коэффициента регуляризации

Возможные решения при недообучении

Добавление новых параметров модели
Использование для описания модели функций с более высокой степенью
Уменьшение коэффициента регуляризации

См. также

Модель алгоритма и ее выбор^{[на 01.12.18 не создан]}
Оценка качества в задачах классификации и регрессии ^{[на 01.12.18 не создан]}
Оценка качества в задаче кластеризации ^{[на 01.12.18 не создан]}

Примечания

Источники информации

Overfitting - статься на Википедии
Переобучение - вводная статься на MachineLearning.ru
The Problem of Overfitting - курс Andrew Ng
Hastie, T., Tibshirani, R., Friedman, J. The Elements of Statistical Learning, 2nd edition. — Springer, 2009. — 533 p.
Vapnik V.N. Statistical learning theory. — N.Y.: John Wiley & Sons, Inc., 1998.
Воронцов, К. В. Комбинаторная теория надёжности обучения по прецедентам: Дис. док. физ.-мат. наук: 05-13-17. — Вычислительный центр РАН, 2010. — 271 с.

Переобучение

Содержание

Примеры

На примере линейной регрессии

На примере логистической регрессии

Кривые обучения

Кривые обучения при переобучении

Кривые обучения при недообучении

High variance и high bias

Возможные решения

Возможные решения при переобучении

Возможные решения при недообучении

См. также

Примечания

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты