Кросс-валидация — различия между версиями
(Перенос из статьи Модель алгоритма и ее выбор) |
|||
Строка 1: | Строка 1: | ||
− | == Алгоритм кросс-валидации == | + | '''Кросс-валидация''' или '''скользящий контроль''' это процедура оценивания обобщающей способности алгоритмов. |
+ | С помощью кросс-валидации эмулируется наличие тестовой выборки, которая не участвует в обучении, но для которой известны правильные ответы. | ||
+ | |||
+ | == Разновидности Кросс-валидации == | ||
+ | |||
+ | === Hold-out Validation === | ||
+ | Обучающая выборка разбивается на две части <tex> T^l = T^t \cup T^{l-t} </tex> | ||
+ | |||
+ | <tex> HO(\mu, T^t, T^{l-t}) = Q(\mu(T^t), T^{l-t}) \to min </tex> | ||
+ | |||
+ | == Алгоритм кросс-валидации == | ||
# Обучающая выборка разбивается на <tex> k </tex> непересекающихся одинаковых по объему частей; | # Обучающая выборка разбивается на <tex> k </tex> непересекающихся одинаковых по объему частей; | ||
# Производится <tex> k </tex> итераций. На каждой итерации происходит следующее: | # Производится <tex> k </tex> итераций. На каждой итерации происходит следующее: | ||
Строка 16: | Строка 26: | ||
# [https://automl.github.io/auto-sklearn/stable/ Автоматизированный выбор модели в библиотеке sklearn для Python] | # [https://automl.github.io/auto-sklearn/stable/ Автоматизированный выбор модели в библиотеке sklearn для Python] | ||
== Источники информации == | == Источники информации == | ||
− | # [http://www.machinelearning.ru/wiki/ | + | # [http://www.machinelearning.ru/wiki/index.php?title=%D0%A1%D0%BA%D0%BE%D0%BB%D1%8C%D0%B7%D1%8F%D1%89%D0%B8%D0%B9_%D0%BA%D0%BE%D0%BD%D1%82%D1%80%D0%BE%D0%BB%D1%8C Скользящий контроль] - статья на MachineLearning.ru |
# [http://jmlda.org/papers/doc/2016/no2/Efimova2016Reinforcement.pdf Применение обучения с подкреплением для одновременного выбора модели алгоритма классификации и ее структурных параметров] | # [http://jmlda.org/papers/doc/2016/no2/Efimova2016Reinforcement.pdf Применение обучения с подкреплением для одновременного выбора модели алгоритма классификации и ее структурных параметров] | ||
Версия 19:14, 17 января 2019
Кросс-валидация или скользящий контроль это процедура оценивания обобщающей способности алгоритмов. С помощью кросс-валидации эмулируется наличие тестовой выборки, которая не участвует в обучении, но для которой известны правильные ответы.
Содержание
Разновидности Кросс-валидации
Hold-out Validation
Обучающая выборка разбивается на две части
Алгоритм кросс-валидации
- Обучающая выборка разбивается на непересекающихся одинаковых по объему частей;
- Производится
- Модель обучается на части обучающей выборки;
- Модель тестируется на части обучающей выборки, которая не участвовала в обучении;
итераций. На каждой итерации происходит следующее:
- В результате можно посчитать различные метрики, показывающие, насколько модель удачная, например, среднюю ошибку на частях, которые не участвовали в обучающей выборке.
См. также
- Модель алгоритма и ее выбор
- Мета-обучение[на 16.01.19 не создан]
Примечания
- Кросс-валидация
- Автоматизированный выбор модели в библиотеке WEKA для Java
- Автоматизированный выбор модели в библиотеке TPOT для Python
- Автоматизированный выбор модели в библиотеке sklearn для Python