Кросс-валидация — различия между версиями

Версия 02:53, 30 января 2019

Кросс-валидация или скользящий контроль — процедура эмпирического оценивания обобщающей способности алгоритмов. С помощью кросс-валидации эмулируется наличие тестовой выборки, которая не участвует в обучении, но для которой известны правильные ответы.

Определения и обозначения

Пусть [math] X [/math] — множество признаков, описывающих объекты, а [math] Y [/math] — конечное множество меток.

— обучающая выборка,

[math]Q[/math] — мера качества,

[math]A[/math] — модель,

— алгоритм обучения.

Разновидности кросс-валидации

Валидация на отложенных данных (Hold-Out Validation)

Обучающая выборка один раз случайным образом разбивается на две части [math] T^l = T^t \cup T^{l-t} [/math]

После чего решается задача оптимизации:

,

Метод Hold-out применяется в случаях больших датасетов, т.к. требует меньше вычислительных мощностей по сравнению с другими методами кросс-валидации. Недостатком метода является то, что оценка существенно зависит от разбиения, тогда как желательно, чтобы она характеризовала только алгоритм обучения.

Полная кросс-валидация (Complete cross-validation)

Выбирается значение [math]t[/math];
Выборка разбивается всеми возможными способами на две части [math] T^l = T^t \cup T^{l-t} [/math].

,

Здесь число разбиений [math]C_l^{l-t}[/math] становится слишком большим даже при сравнительно малых значениях t, что затрудняет практическое применение данного метода.

k-fold кросс-валидация

Обучающая выборка разбивается на [math] k [/math] непересекающихся одинаковых по объему частей;
Производится [math] k [/math] итераций. На каждой итерации происходит следующее:
1. Модель обучается на [math] k - 1 [/math] части обучающей выборки;
2. Модель тестируется на части обучающей выборки, которая не участвовала в обучении.

Каждая из [math]k[/math] частей единожды используется для тестирования. Как правило, [math]k = 10[/math] (5 в случае малого размера выборки).

.

t×k-fold кросс-валидация

Процедура выполняется [math]t[/math] раз:
1. Обучающая выборка случайным образом разбивается на [math]k[/math] непересекающихся одинаковых по объему частей;
2. Производится [math] k [/math] итераций. На каждой итерации происходит следующее:
  1. Модель обучается на [math] k - 1 [/math] части обучающей выборки;
  2. Модель тестируется на части обучающей выборки, которая не участвовала в обучении.

,

.

Кросс-валидация по отдельным объектам (Leave-One-Out)

Выборка разбивается на [math]l-1[/math] и 1 объект [math]l[/math] раз.

, где [math]p_i = (x_i, y_i)[/math].

Преимущества LOO в том, что каждый объект ровно один раз участвует в контроле, а длина обучающих подвыборок лишь на единицу меньше длины полной выборки.

Недостатком LOO является большая ресурсоёмкость, так как обучаться приходится [math]L[/math] раз. Некоторые методы обучения позволяют достаточно быстро перенастраивать внутренние параметры алгоритма при замене одного обучающего объекта другим. В этих случаях вычисление LOO удаётся заметно ускорить.

Случайные разбиения (Random subsampling)

Выборка разбивается в случайной пропорции. Процедура повторяется несколько раз.

Критерий целостности модели (Model consistency criterion)

Не переобученый алгоритм должен показывать одинаковую эффективность на каждой части.

,

Метод может быть обобщен как аналог [math] CV_{t \times 2} [/math].

См. также

Примечания

Кросс-валидация

Источники информации

Скользящий контроль - статья на MachineLearning.ru
Model assessment and selection

@@ Строка 1: / Строка 1: @@
-'''Кросс-валидация''' или '''скользящий контроль''' это процедура оценивания обобщающей способности алгоритмов.
+'''Кросс-валидация''' или '''скользящий контроль''' {{---}} процедура эмпирического оценивания обобщающей способности алгоритмов.
 С помощью кросс-валидации эмулируется наличие тестовой выборки, которая не участвует в обучении, но для которой известны правильные ответы.
+=== Определения и обозначения ===
+Пусть <tex> X </tex> {{---}} множество [[Общие понятия | признаков]], описывающих объекты, а <tex> Y </tex> {{---}} конечное множество меток.
-== Разновидности Кросс-валидации ==
+<tex>T^l = {(x_i, y_i)}_{i=1}^{l}, x_i \in X, y_i \in Y</tex> {{---}} обучающая выборка,
-=== Контроль на отложенных данных (Hold-Out Validation) ===
+<tex>Q</tex> {{---}} мера качества,
+<tex>A</tex> {{---}} [[Модель алгоритма и ее выбор | модель]],
+<tex>\mu: (X \times Y)^l \to A, </tex> {{---}} алгоритм обучения.
+== Разновидности кросс-валидации ==
+=== Валидация на отложенных данных (Hold-Out Validation) ===
 Обучающая выборка один раз случайным образом разбивается на две части <tex> T^l = T^t \cup T^{l-t} </tex>
+[[Файл:Hold-out.png|500px]]
 После чего решается задача оптимизации:
-<tex>HO(\mu, T^t, T^{l-t}) = Q(\mu(T^t), T^{l-t}) \to min </tex>
+<tex>HO(\mu, T^t, T^{l-t}) = Q(\mu(T^t), T^{l-t}) \to min </tex>,
 Метод Hold-out применяется в случаях больших датасетов, т.к. требует меньше вычислительных мощностей по сравнению с другими методами кросс-валидации.
 Недостатком метода является то, что оценка существенно зависит от разбиения, тогда как желательно, чтобы она характеризовала только алгоритм обучения.
-=== Полная кросс-валидация (CVV) ===
-# Выбирается значение <tex>t</tex>
-# Выборка разбивается всеми возможными способами на две части <tex> T^l = T^t \cup T^{l-t} </tex>
-После чего решается задача оптимизации:
+=== Полная кросс-валидация (Complete cross-validation) ===
+# Выбирается значение <tex>t</tex>;
+# Выборка разбивается всеми возможными способами на две части <tex> T^l = T^t \cup T^{l-t} </tex>.
+[[Файл:CompleteCrossValidation.png|500px]]
 <tex>CVV_t = \frac{1}{C_l^{l-t}}
-\displaystyle\sum_{T^l = T^t \cup T^{l-t}} Q(\mu(T^t), T^{l-t}) \to min </tex>
+\displaystyle\sum_{T^l = T^t \cup T^{l-t}} Q(\mu(T^t), T^{l-t}) \to min </tex>,
+Здесь число разбиений <tex>C_l^{l-t}</tex> становится слишком большим даже при сравнительно малых значениях t, что затрудняет практическое применение данного метода.
 === k-fold кросс-валидация ===
-# Обучающая выборка разбивается на <tex> k </tex> непересекающихся одинаковых по объему частей
+# Обучающая выборка разбивается на <tex> k </tex> непересекающихся одинаковых по объему частей;
 # Производится <tex> k </tex> итераций. На каждой итерации происходит следующее:
 ## Модель обучается на <tex> k - 1 </tex> части обучающей выборки;
-## Модель тестируется на части обучающей выборки, которая не участвовала в обучении;
+## Модель тестируется на части обучающей выборки, которая не участвовала в обучении.
+Каждая из <tex>k</tex> частей единожды используется для тестирования.
+Как правило, <tex>k = 10</tex> (5 в случае малого размера выборки).
+[[Файл:K-fold-validation.png|500px]]
-<tex>T^l = F_1 \cup \dots \cup F_k, |F_i| \approx \frac{l}{k}  </tex>
+<tex>T^l = F_1 \cup \dots \cup F_k, |F_i| \approx \frac{l}{k},
-<tex> CV_k = \frac{1}{k} \sum_{i=1}^{k} Q(\mu(T^l \setminus F_i),F_i) \to min </tex>
+\\ CV_k = \frac{1}{k} \sum_{i=1}^{k} Q(\mu(T^l \setminus F_i),F_i) \to min </tex>.
-Каждая из <tex>k</tex> частей единожды используется для тестирования.
+=== t×k-fold кросс-валидация ===
-Как правило <tex>k = 10</tex> (5 в случае малого размера выборки)
+# Процедура выполняется <tex>t</tex> раз:
+## Обучающая выборка случайным образом разбивается на <tex>k</tex> непересекающихся одинаковых по объему частей;
+## Производится <tex> k </tex> итераций. На каждой итерации происходит следующее:
+### Модель обучается на <tex> k - 1 </tex> части обучающей выборки;
+### Модель тестируется на части обучающей выборки, которая не участвовала в обучении.
+<tex>T^l = F_{(1,1)} \cup \dots \cup F_{(k,1)} = \dots = F_{(1,t)} \cup \dots \cup F_{(k,t)}, |F_{(i,j)}| \approx \frac{l}{k}  </tex>,
+<tex> CV_{t \times k} = \frac{1}{tk} \sum_{j=1}^t \sum_{i=1}^{k} Q(\mu(T^l \setminus F_{(i,j)}),F_{(i,j)}) \to min </tex>.
+=== Кросс-валидация по отдельным объектам (Leave-One-Out) ===
+Выборка разбивается на <tex>l-1</tex> и 1 объект <tex>l</tex> раз.
+[[Файл:LeaveOneOut.png|500px]]
+<tex>LOO = \frac{1}{l} \sum_{i=1}^{l} Q(\mu(T^l \setminus p_i),p_i) \to min </tex>, где <tex>p_i = (x_i, y_i)</tex>.
+Преимущества LOO в том, что каждый объект ровно один раз участвует в контроле, а длина обучающих подвыборок лишь на единицу меньше длины полной выборки.
+Недостатком LOO является большая ресурсоёмкость, так как обучаться приходится <tex>L</tex> раз. Некоторые методы обучения позволяют достаточно быстро перенастраивать внутренние параметры алгоритма при замене одного обучающего объекта другим. В этих случаях вычисление LOO удаётся заметно ускорить.
+=== Случайные разбиения (Random subsampling) ===
+Выборка разбивается в случайной пропорции. Процедура повторяется несколько раз.
+[[Файл:CompleteCrossValidation.png|500px]]
-В результате можно посчитать различные метрики, показывающие, насколько модель удачная, например, среднюю ошибку на частях, которые не участвовали в обучающей выборке.
+=== Критерий целостности модели (Model consistency criterion) ===
+Не переобученый алгоритм должен показывать одинаковую эффективность на каждой части.
-=== t×k-fold кросс-валидация ===
+[[Файл:ModelConsistencyCriterion.png|500px]]
-Процедура выполняется <tex>t</tex> раз:
-<tex>T^l = F_{(1,1)} \cup \dots \cup F_{(k,1)} = \dots = F_{(1,t)} \cup \dots \cup F_{(k,t)}, |F_{(i,j)}| \approx \frac{l}{k}  </tex>
+<tex> D_1 = (\mu, T^{l-t}) = \frac{1}{l} \sum_{i=1}^l (\mu(T^t)(x_i)-\mu(T^{l-t})(x_i)) </tex>,
-<tex> CV_{t \times k} = \frac{1}{tk} \sum_{j=1}^t \sum_{i=1}^{k} Q(\mu(T^l \setminus F_{(i,j)}),F_{(i,j)}) \to min </tex>
+Метод может быть обобщен как аналог <tex> CV_{t \times 2} </tex>.
 == См. также ==
-* [[Общие понятия]]<sup>[на 17.01.19 не создан]</sup
+* [[Общие понятия]]
 * [[Модель алгоритма и ее выбор]]
-* [[Мета-обучение]]<sup>[на 17.01.19 не создан]</sup>
+* [[Мета-обучение]]
 == Примечания ==
 # [https://en.wikipedia.org/wiki/Cross-validation_(statistics) Кросс-валидация]
-# [https://www.ml4aad.org/wp-content/uploads/2018/07/automl_book_draft_auto-weka.pdf Автоматизированный выбор модели в библиотеке WEKA для Java]
-# [https://epistasislab.github.io/tpot/ Автоматизированный выбор модели в библиотеке TPOT для Python]
-# [https://automl.github.io/auto-sklearn/stable/ Автоматизированный выбор модели в библиотеке sklearn для Python]
 == Источники информации ==
 # [http://www.machinelearning.ru/wiki/index.php?title=%D0%A1%D0%BA%D0%BE%D0%BB%D1%8C%D0%B7%D1%8F%D1%89%D0%B8%D0%B9_%D0%BA%D0%BE%D0%BD%D1%82%D1%80%D0%BE%D0%BB%D1%8C Скользящий контроль] -  статья на MachineLearning.ru
-# [http://jmlda.org/papers/doc/2016/no2/Efimova2016Reinforcement.pdf Применение обучения с подкреплением для одновременного выбора модели алгоритма классификации и ее структурных параметров]
+# [https://drive.google.com/open?id=1p9CTAa1_gJpj94RXBEcQ09aVOa-KTlrd Model assessment and selection]
 [[Категория: Машинное обучение]]
 [[Категория: Автоматическое машинное обучение]]

Кросс-валидация — различия между версиями

Версия 02:53, 30 января 2019

Содержание

Определения и обозначения

Разновидности кросс-валидации

Валидация на отложенных данных (Hold-Out Validation)

Полная кросс-валидация (Complete cross-validation)

k-fold кросс-валидация

t×k-fold кросс-валидация

Кросс-валидация по отдельным объектам (Leave-One-Out)

Случайные разбиения (Random subsampling)

Критерий целостности модели (Model consistency criterion)

См. также

Примечания

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты