Теоретическая оценка времени работы алгоритмов RMHC и (1+1)-ES для задач OneMax и MST — различия между версиями

Версия 14:47, 17 июня 2012

Содержание

1 Постановка задачи однокритериальной оптимизации
2 Методы решения
3 Примеры задач
- 3.1 OneMax
- 3.2 MST (Minimum spanning tree)
4 Оценка времени решения OneMax
- 4.1 Алгоритм RMHC
- 4.2 Алгоритм (1+1)-ES
5 Оценка времени работы алгоритмов с использованием Drift Analysis

Постановка задачи однокритериальной оптимизации

[math]S[/math] - пространство решений (дискретно),

- оценочная функция.

Задача: найти . При этом рассматривается black-box scenario, что означает, что получить информацию об [math]f[/math] можно только путем ее вычисления.

Методы решения

HC(Hill Climbing)

x [math]\leftarrow[/math] random
while(true)
  x' [math]\leftarrow[/math] neibor(x)
  f(x') [math]\geq[/math] f(x) [math] \Rightarrow [/math] x = x'

Итерации выполняются, пока не будет удовлетворен критерий останова. Возможны два варианта HC:

1) first ascent --- в качестве [math]x'[/math] выбирается первый из соседей, для которого [math]f(x') \geq f(x)[/math]

2) steepest ascent --- осуществляется перебор всех соседей, и в качестве [math]x'[/math] выбирается тот, для которого [math]f(x')-f(x)[/math] максимально

RMHC (Random Mutation Hill Climbing)

Та же схема, что и для HC, но [math] x'[/math] получают путем случайного изменения одного из компонентов решения [math] x [/math].

ES (Evolution Strategies)

1) [math](1+1)-ES [/math] --- после внесения случайного изменения в каждый из компонентов [math] x[/math], [math]x'[/math] может оказаться любым элементом [math]S[/math], но, чем он ближе к [math]x[/math], тем выше вероятность его выбора.

2) [math](1+\lambda)-ES[/math] --- генерируется [math]\lambda[/math] промежуточных решений, среди них выбирается лучшее.

3) [math](1+\lambda)-ES[/math] --- генерируется [math]\lambda[/math] промежуточных решений, среди них выбирается [math]\mu[/math] лучших.

Примеры задач

OneMax

Найти битовую строку длины [math]n[/math], состоящую из одних единиц. Оценочная функция:

MST (Minimum spanning tree)

Дан связный неориентированный граф [math] G = (V, E) [/math], с ребрами веса [math] w_e [/math]. Требуется найти минимальное остовное дерево [math]T = (V, E')[/math] минимального веса .

Оценка времени решения OneMax

Утверждение 1:

Доказательство:

Утверждение 2:

Доказательство:

1)

2)

Утверждение 3:

Доказательство:

по Утверждению 1, отсюда следует Утверждение 3.

Утверждение 4:

Доказательство:

по Утверждениям 1 и 4.

Утверждение 5 (Лемма об ожидании):

Если вероятность наступления события [math]A[/math] на каждом шаге равна [math]p[/math], то матожидание наступления этого события [math]E(t_A) = \frac{1}{p}[/math]

Доказательство:

Продиффиренцировав, получаем:

Алгоритм RMHC

На каждом шаге равномерно выбираем и инвертируем один бит из [math] n [/math]. Пусть [math] k [/math] --- значение [math] f [/math] в начале фазы. При [math] k + 1 = k' \gt k [/math] фаза заканчивается.

Оценим время работы алгоритма для данной задачи.

Вероятность окончания фазы [math] \frac{n - k}{n} [/math]. Тогда по Утверждению 5 [math] E(t) = \frac{n}{n-k} [/math] для конкретной фазы.

Отсюда ожидаемая продолжительность всех фаз:

Алгоритм (1+1)-ES

Независимо для каждого бита инвертируем его с вероятностью [math] p = \frac{1}{n} [/math]. Пусть [math] k [/math] --- значение [math] f [/math] в начале фазы. При [math] k' \gt k [/math] фаза заканчивается.

Оценим время работы алгоритма для данной задачи.

Вероятность окончания фазы по утверждению 3. Тогда по Утверждению 5 для конкретной фазы.

Отсюда ожидаемая продолжительность всех фаз меньше либо равна:

Оценка времени работы алгоритмов с использованием Drift Analysis

Drift theorem

Пусть [math]X_0, X_1, \dots[/math] --- неотрицательные целочисленные случайные величины и существует [math]\delta \gt 0[/math] такое что:

.

Тогда удовлетворяет

An Improved Drift theorem

Пусть [math]X_0, X_1, \dots[/math] --- случайные величины из [math]\{0\} \cup [1, \infty)[/math] и существует [math]\delta \gt 0[/math] такое что:

.

Тогда удовлетворяет

RMHC для OneMax

Пусть [math]X_t[/math] --- число нулевых бит после итерации [math]i[/math]: [math]X_t = f_{opt} - f(X_t)[/math]

Пусть [math]X_{t-1} = k[/math]. Тогда

, то есть [math] \delta = \frac{1}{n}[/math].

Отсюда по теореме о дрифте, с учетом того, что [math] X_0 \leq n [/math] получаем: [math] E(T) \leq n(\ln{n} + 1)[/math].

(1+1)-ES для OneMax

Пусть [math]X_t[/math] --- число нулевых бит после итерации [math]i[/math]: [math]X_t = f_{opt} - f(X_t)[/math]

Пусть [math]X_{t-1} = k[/math]. Тогда вероятность перевернуть один нулевых битов равна . Отсюда

, то есть [math] \delta = \frac{1}{e n}[/math].

Отсюда по теореме о дрифте, с учетом того, что [math] X_0 \leq n [/math] получаем: [math] E(T) \leq e n(\ln{n} + 1)[/math].

(1+1)-ES для MST

Решение представляет собой битовую строку [math]x[/math] длины [math]m = |E|[/math], где [math]x_e = 1[/math], если [math]e \in E'[/math], и [math]x_e = 0[/math] в обратном случае.

Мутация: независимо для каждого бита инвертируем его с вероятностью [math]\frac{1}{m}[/math].

Фитнес-функция: , где [math]\#comp[/math] --- число компонент связности в текущем [math] T [/math].

Теорема [Neumann, Wegener (2004)]

Ожидаемое время работы (1+1)-EA для задачи MST равно [math]O(m^2 \log(m w_{max}))[/math], где [math]w_{max}[/math] --- максимальный вес ребра.

Доказательство

1) Пусть после [math]O(m \log m)[/math] итераций [math]T[/math] связно: [math]X_t = {\#comp} - 1[/math] после итерации [math]t[/math].

Если [math]X_{t - 1} = k[/math], то существует как минимум [math]k[/math] ребер, которые не входят в [math]T[/math] и добавление которых уменьшает [math]X_t[/math]:

Применяя теорему о дрифте, получаем требуемый результат.

2) Пусть [math]T[/math] уже связно. Тогда оно остается связным и на дальнейших итерациях.

Пусть [math] X_t = w(T) - w_{opt} [/math] для [math]T[/math] после итерации [math]t[/math].

Если [math]X_{t-1} = D \gt 0[/math], то существуют [math]e_1, \dots, e_k[/math] из [math]T[/math] и [math]e'_1, \dots, e'_k[/math] из [math]E \setminus T[/math] такие, что

--- это MST,

следовательно , и для всех [math]i[/math]

[math]T_i = T - e_i + e'_i[/math] --- остовное дерево с [math]w(T_i) \lt w(T)[/math].

С верояностью [math]\geq 1/e m^2[/math], одна итерация обменяет в точности ребра [math]e_i[/math] и [math]e'_i[/math].

Используем теорему о дрифте, учитывая, что , и получаем требуемый результат.

@@ Строка 129: / Строка 129: @@
 <tex> \sum_{k=0}^{n-1} \frac{e n}{n-k} = e n \sum_{i=1}^{n} \frac{1}{i} = O(n \log n) </tex>
-==Оценка времени решения MST==
+==Оценка времени работы алгоритмов с использованием Drift Analysis==
 ===Drift theorem===
@@ Строка 147: / Строка 147: @@
 Тогда <tex>T = \min\{t \in \mathbb{N}_0 | X_t = 0\}</tex> удовлетворяет
-<tex>E(T) \leq (1/\delta)(\ln(X_0) + 1)</tex>
+<tex>E(T) \leq  \frac{1}{\delta}(\ln(X_0) + 1)</tex>
-<tex>\forall c > 0, Pr(T > (1/\delta)(\ln(X_0) + c)) \leq e ^ {-c}</tex>
+<tex>\forall c > 0, Pr(T >  \frac{1}{\delta}(\ln(X_0) + c)) \leq e ^ {-c}</tex>
+===RMHC для OneMax===
+Пусть <tex>X_t</tex> --- число нулевых бит после итерации <tex>i</tex>: <tex>X_t = f_{opt} - f(X_t)</tex>
+Пусть <tex>X_{t-1} = k</tex>. Тогда
+<tex>E(X_t | X_{t-1} = k) = (k-1)\frac{k}{n} + k \frac{n-1}{n} = k (1 - \frac{1}{n})</tex>, то есть <tex> \delta = \frac{1}{n}</tex>.
+Отсюда по теореме о дрифте, с учетом того, что <tex> X_0 \leq n </tex> получаем: <tex> E(T) \leq n(\ln{n} + 1)</tex>.
+===(1+1)-ES для OneMax===
+Пусть <tex>X_t</tex> --- число нулевых бит после итерации <tex>i</tex>: <tex>X_t = f_{opt} - f(X_t)</tex>
+Пусть <tex>X_{t-1} = k</tex>. Тогда вероятность перевернуть один нулевых битов равна <tex>k \frac{1}{n} ( 1 - \frac{1}{n})^{n-1} \geq \frac{k}{e n} </tex>. Отсюда
+<tex>E(X_t | X_{t-1} = k) \leq (k-1)\frac{k}{e n} + k (1 - \frac{k}{e n}) = k (1 - \frac{1}{e n})</tex>, то есть <tex> \delta = \frac{1}{e n}</tex>.
+Отсюда по теореме о дрифте, с учетом того, что <tex> X_0 \leq n </tex> получаем: <tex> E(T) \leq e n(\ln{n} + 1)</tex>.
 === (1+1)-ES для MST ===
@@ Строка 155: / Строка 173: @@
 Решение представляет собой битовую строку <tex>x</tex> длины <tex>m = |E|</tex>, где <tex>x_e = 1</tex>, если <tex>e \in E'</tex>, и <tex>x_e = 0</tex> в обратном случае.
-Мутация: независимо для каждого бита инвертируем его с вероятностью <tex>\frac{1}{m}</tex>
+Мутация: независимо для каждого бита инвертируем его с вероятностью <tex>\frac{1}{m}</tex>.
 Фитнес-функция: <tex>w(T) + c_{penalty} ({\#comp} - 1) </tex>, где <tex>\#comp</tex> --- число компонент связности в текущем <tex> T </tex>.
-Теорема. [Neumann, Wegener (2004)]:
+'''Теорема [Neumann, Wegener (2004)]'''
-Ожидаемое время работы (1+1)-EA для задачи MST <tex>O(m^2 \log(m w_{max}))</tex>, где <tex>w_{max}</tex> --- максимальный вес ребра.
+Ожидаемое время работы (1+1)-EA для задачи MST равно <tex>O(m^2 \log(m w_{max}))</tex>, где <tex>w_{max}</tex> --- максимальный вес ребра.
-Доказательство.
+'''Доказательство'''
 ) Пусть после <tex>O(m \log m)</tex> итераций <tex>T</tex> связно:
-<tex>X_t = {\#comp} - 1</tex> после итерации <tex>t</tex>
+<tex>X_t = {\#comp} - 1</tex> после итерации <tex>t</tex>.
-Если <tex>X_{t - 1} = k</tex>, то существует как минимум <tex>k</tex> ребер, которые не входят в <tex>T</tex> и добавление которых уменьшает <tex>X_t</tex>
+Если <tex>X_{t - 1} = k</tex>, то существует как минимум <tex>k</tex> ребер, которые не входят в <tex>T</tex> и добавление которых уменьшает <tex>X_t</tex>:
 <tex>E(X_t) \leq (1 - \frac{1}{e m})k</tex>
@@ Строка 183: / Строка 202: @@
 следовательно <tex>D = \sum_{i} (w(e_i) - w(e'_i))</tex>, и для всех <tex>i</tex>
-<tex>T_i = T - e_i + e'_i</tex> --- основное дерево с <tex>w(T_i) < w(T)</tex>.
+<tex>T_i = T - e_i + e'_i</tex> --- остовное дерево с <tex>w(T_i) < w(T)</tex>.
 С верояностью <tex>\geq 1/e m^2</tex>, одна итерация обменяет в точности ребра <tex>e_i</tex> и <tex>e'_i</tex>.

Теоретическая оценка времени работы алгоритмов RMHC и (1+1)-ES для задач OneMax и MST — различия между версиями

Версия 14:47, 17 июня 2012

Содержание

Постановка задачи однокритериальной оптимизации

Методы решения

HC(Hill Climbing)

RMHC (Random Mutation Hill Climbing)

ES (Evolution Strategies)

Примеры задач

OneMax

MST (Minimum spanning tree)

Оценка времени решения OneMax

Алгоритм RMHC

Алгоритм (1+1)-ES

Оценка времени работы алгоритмов с использованием Drift Analysis

Drift theorem

An Improved Drift theorem

RMHC для OneMax

(1+1)-ES для OneMax

(1+1)-ES для MST

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты