Изменения

Кросс-валидация

16 байт добавлено, 02:53, 30 января 2019

Нет описания правки

'''Кросс-валидация''' или '''скользящий контроль''' ~~это~~ {{---}} процедура эмпирического оценивания обобщающей способности алгоритмов.

С помощью кросс-валидации эмулируется наличие тестовой выборки, которая не участвует в обучении, но для которой известны правильные ответы.

Пусть <tex> X </tex> {{---}} множество [[Общие понятия | признаков]], описывающих объекты, а <tex> Y </tex> {{---}} конечное множество меток.

<tex>T^l = {(x_i, y_i)}_{i=1}^{l}, x_i \in X, y_i \in Y</tex> {{---}} обучающая выборка.,

<tex>Q</tex> {{---}} мера качества.,

<tex>A</tex> {{---}} [[Модель алгоритма и ее выбор | модель]].,

<tex>\mu: (X \times Y)^l \to A, </tex> {{---}} алгоритм обучения.

== Разновидности ~~Кросс~~кросс-валидации ==

=== Валидация на отложенных данных (Hold-Out Validation) ===

После чего решается задача оптимизации:

<tex>HO(\mu, T^t, T^{l-t}) = Q(\mu(T^t), T^{l-t}) \to min </tex>,

Метод Hold-out применяется в случаях больших датасетов, т.к. требует меньше вычислительных мощностей по сравнению с другими методами кросс-валидации.

=== Полная кросс-валидация (Complete cross-validation) ===

# Выбирается значение <tex>t</tex>;# Выборка разбивается всеми возможными способами на две части <tex> T^l = T^t \cup T^{l-t} </tex>.

[[Файл:CompleteCrossValidation.png|500px]]

<tex>CVV_t = \frac{1}{C_l^{l-t}}

\displaystyle\sum_{T^l = T^t \cup T^{l-t}} Q(\mu(T^t), T^{l-t}) \to min </tex>,

Здесь число разбиений <tex>C_l^{l-t}</tex> становится слишком большим даже при сравнительно малых значениях t, что затрудняет практическое применение данного метода.

=== k-fold кросс-валидация ===

# Обучающая выборка разбивается на <tex> k </tex> непересекающихся одинаковых по объему частей;

# Производится <tex> k </tex> итераций. На каждой итерации происходит следующее:

## Модель обучается на <tex> k - 1 </tex> части обучающей выборки;

## Модель тестируется на части обучающей выборки, которая не участвовала в обучении;.

Каждая из <tex>k</tex> частей единожды используется для тестирования.

Как правило , <tex>k = 10</tex> (5 в случае малого размера выборки).

[[Файл:K-fold-validation.png|500px]]

<tex>T^l = F_1 \cup \dots \cup F_k, |F_i| \approx \frac{l}{k} , \\ CV_k = \frac{1}{k} \sum_{i=1}^{k} Q(\mu(T^l \setminus F_i),F_i) \to min </tex>.

=== t×k-fold кросс-валидация ===

# Процедура выполняется <tex>t</tex> раз:

## Обучающая выборка случайным образом разбивается на <tex>k</tex> непересекающихся одинаковых по объему частей;

## Производится <tex> k </tex> итераций. На каждой итерации происходит следующее:

### Модель обучается на <tex> k - 1 </tex> части обучающей выборки;

### Модель тестируется на части обучающей выборки, которая не участвовала в обучении;.

<tex>T^l = F_{(1,1)} \cup \dots \cup F_{(k,1)} = \dots = F_{(1,t)} \cup \dots \cup F_{(k,t)}, |F_{(i,j)}| \approx \frac{l}{k} </tex> ,

<tex> CV_{t \times k} = \frac{1}{tk} \sum_{j=1}^t \sum_{i=1}^{k} Q(\mu(T^l \setminus F_{(i,j)}),F_{(i,j)}) \to min </tex>.

=== Кросс-валидация по отдельным объектам (Leave-One-Out) ===

[[Файл:LeaveOneOut.png|500px]]

<tex>LOO = \frac{1}{l} \sum_{i=1}^{l} Q(\mu(T^l \setminus p_i),p_i) \to min </tex>, где <tex>p_i = (x_i, y_i)</tex>.

Преимущества LOO в том, что каждый объект ровно один раз участвует в контроле, а длина обучающих подвыборок лишь на единицу меньше длины полной выборки.

=== Критерий целостности модели (Model consistency criterion) ===

Не переобученый алгоритм должен показывать одинаковую эффективность на каждой части.

[[Файл:ModelConsistencyCriterion.png|500px]]

<tex> D_1 = (\mu, T^{l-t}) = \frac{1}{l} \sum_{i=1}^l (\mu(T^t)(x_i)-\mu(T^{l-t})(x_i)) </tex>,

Метод может быть обобщен как аналог <tex> CV_{t \times 2} </tex>.

Dariyakovleva

77

правок

Изменения

Кросс-валидация

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты