Кросс-валидация — различия между версиями

Версия 14:44, 22 января 2019

Кросс-валидация или скользящий контроль это процедура эмпирического оценивания обобщающей способности алгоритмов. С помощью кросс-валидации эмулируется наличие тестовой выборки, которая не участвует в обучении, но для которой известны правильные ответы.

Определения

- обучающая выборка.

[math]Q[/math] - мера качества.

- метод минимизации эмпирического риска.

Разновидности Кросс-валидации

Валидация на отложенных данных (Hold-Out Validation)

Обучающая выборка один раз случайным образом разбивается на две части [math] T^l = T^t \cup T^{l-t} [/math]

После чего решается задача оптимизации:

Метод Hold-out применяется в случаях больших датасетов, т.к. требует меньше вычислительных мощностей по сравнению с другими методами кросс-валидации. Недостатком метода является то, что оценка существенно зависит от разбиения, тогда как желательно, чтобы она характеризовала только алгоритм обучения.

Полная кросс-валидация (Complete cross-validation)

Выбирается значение [math]t[/math]
Выборка разбивается всеми возможными способами на две части [math] T^l = T^t \cup T^{l-t} [/math]

k-fold кросс-валидация

Обучающая выборка разбивается на [math] k [/math] непересекающихся одинаковых по объему частей
Производится [math] k [/math] итераций. На каждой итерации происходит следующее:
1. Модель обучается на [math] k - 1 [/math] части обучающей выборки;
2. Модель тестируется на части обучающей выборки, которая не участвовала в обучении;

Каждая из [math]k[/math] частей единожды используется для тестирования. Как правило [math]k = 10[/math] (5 в случае малого размера выборки)

В результате можно посчитать различные метрики, показывающие, насколько модель удачная, например, среднюю ошибку на частях, которые не участвовали в обучающей выборке.

t×k-fold кросс-валидация

Процедура выполняется [math]t[/math] раз:
1. Обучающая выборка случайным образом разбивается на [math]k[/math] непересекающихся одинаковых по объему частей
2. Производится [math] k [/math] итераций. На каждой итерации происходит следующее:
  1. Модель обучается на [math] k - 1 [/math] части обучающей выборки;
  2. Модель тестируется на части обучающей выборки, которая не участвовала в обучении;

Кросс-валидация по отдельным объектам (leave-one-out)

Выборка разбивается на [math]l-1[/math] и 1 объект [math]l[/math] раз.

, где [math]p_i = (x_i, y_i)[/math]

Случайные разбиения (Random subsampling)

Выборка разбивается в случайной пропорции. Процедура повторяется несколько раз.

Критерий целостности модели (Model consistency criterion)

Не переобученый алгоритм должен показывать одинаковую эффективность на каждой части

Метод может быть обобщен как аналог [math] CV_{t \times 2} [/math].

См. также

Общие понятия^{[на 17.01.19 не создан]}
Модель алгоритма и ее выбор
Мета-обучение^{[на 17.01.19 не создан]}

Примечания

Кросс-валидация

Источники информации

Скользящий контроль - статья на MachineLearning.ru
Model assessment and selection

@@ Строка 91: / Строка 91: @@
 == Примечания ==
 # [https://en.wikipedia.org/wiki/Cross-validation_(statistics) Кросс-валидация]
-# [https://www.ml4aad.org/wp-content/uploads/2018/07/automl_book_draft_auto-weka.pdf Автоматизированный выбор модели в библиотеке WEKA для Java]
-# [https://epistasislab.github.io/tpot/ Автоматизированный выбор модели в библиотеке TPOT для Python]
-# [https://automl.github.io/auto-sklearn/stable/ Автоматизированный выбор модели в библиотеке sklearn для Python]
 == Источники информации ==
 # [http://www.machinelearning.ru/wiki/index.php?title=%D0%A1%D0%BA%D0%BE%D0%BB%D1%8C%D0%B7%D1%8F%D1%89%D0%B8%D0%B9_%D0%BA%D0%BE%D0%BD%D1%82%D1%80%D0%BE%D0%BB%D1%8C Скользящий контроль] -  статья на MachineLearning.ru

Кросс-валидация — различия между версиями

Версия 14:44, 22 января 2019

Содержание

Определения

Разновидности Кросс-валидации

Валидация на отложенных данных (Hold-Out Validation)

Полная кросс-валидация (Complete cross-validation)

k-fold кросс-валидация

t×k-fold кросс-валидация

Кросс-валидация по отдельным объектам (leave-one-out)

Случайные разбиения (Random subsampling)

Критерий целостности модели (Model consistency criterion)

См. также

Примечания

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты