Теоретическая оценка времени работы алгоритмов RMHC и (1+1)-ES для задач OneMax и MST — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(+ drift analysis)
м
Строка 1: Строка 1:
=Теоретическая оценка времени работы алгоритмов RMHC и (1+1)-ES для задач OneMax и MST=
+
== Постановка задачи однокритериальной оптимизации==
 
 
 
 
=== Постановка задачи ===
 
  
 
<tex>S</tex> - пространство решений (дискретно),
 
<tex>S</tex> - пространство решений (дискретно),
Строка 10: Строка 7:
 
Задача: найти <tex>s \in S : f(s) \rightarrow max </tex>. При этом рассматривается black-box scenario, что означает, что получить информацию об <tex>f</tex> можно только путем ее вычисления.
 
Задача: найти <tex>s \in S : f(s) \rightarrow max </tex>. При этом рассматривается black-box scenario, что означает, что получить информацию об <tex>f</tex> можно только путем ее вычисления.
  
=== Методы решения ===
+
== Методы решения ==
 
+
==='''HC'''(Hill Climbing)===
'''RMHC''' --- Random Mutation Hill Climbing
+
 +
x <tex>\leftarrow</tex> random
 +
while(true)
 +
  x' <tex>\leftarrow</tex> neibor(x)
 +
  f(x') <tex>\geq</tex> f(x) <tex> \Rightarrow </tex> x = x'
 +
Итерации выполняются, пока не будет удовлетворен критерий останова. Возможны два варианта HC:
  
'''RLS''' --- Random Local Search
+
1) '''first ascent''' --- в качестве <tex>x'</tex> выбирается первый из соседей, для которого <tex>f(x') \geq f(x)</tex>
  
 +
2) '''steepest ascent''' --- осуществляется перебор всех соседей, и в качестве <tex>x'</tex> выбирается тот, для которого <tex>f(x')-f(x)</tex> максимально
  
Начальное решение <tex> x </tex> выбирается случайным образом. Выбор последующих <tex> x'</tex>  также осуществляется случайным образом.
+
==='''RMHC''' (Random Mutation Hill Climbing)===
  
'''ES''' --- Evolution Strategies
+
Та же схема, что и для HC, но <tex> x'</tex>  получают путем случайного изменения одного из компонентов решения <tex> x </tex>.
  
1) <tex>(1+1)-ES </tex>
+
==='''ES''' (Evolution Strategies)===
  
<tex>x'</tex> может оказаться любым элементом <tex>S</tex>, но, чем он ближе к <tex>x</tex>, тем выше вероятность его выбора.
+
1) <tex>(1+1)-ES </tex> --- после внесения случайного изменения в каждый из компонентов <tex> x</tex>, <tex>x'</tex> может оказаться любым элементом <tex>S</tex>, но, чем он ближе к <tex>x</tex>, тем выше вероятность его выбора.
  
 
2) <tex>(1+\lambda)-ES</tex> --- генерируется <tex>\lambda</tex> промежуточных решений, среди них выбирается лучшее.
 
2) <tex>(1+\lambda)-ES</tex> --- генерируется <tex>\lambda</tex> промежуточных решений, среди них выбирается лучшее.
Строка 30: Строка 33:
  
  
=== Примеры задач ===
+
== Примеры задач ==
  
1) '''OneMax''' --- найти битовую строку длины <tex>n</tex>, состоящую из одних единиц. Оценочная функция:
+
===OneMax===
 +
Найти битовую строку длины <tex>n</tex>, состоящую из одних единиц. Оценочная функция:
  
 
<tex>f(x_1, x_2, \dots , x_n) = OneMax(x_1, x_2, \dots , x_n) = x_1 + x_2, + \dots + x_n </tex>
 
<tex>f(x_1, x_2, \dots , x_n) = OneMax(x_1, x_2, \dots , x_n) = x_1 + x_2, + \dots + x_n </tex>
  
2) '''MST''' --- Minimum spanning tree
+
===MST (Minimum spanning tree)===
 
 
 
Дан связный неориентированный граф <tex> G = (V, E) </tex>, с ребрами веса <tex> w_e </tex>. Требуется найти минимальное остовное дерево <tex>T = (V, E')</tex> минимального веса <tex> w(T) = \sum_{e \in E'} w_e </tex>.
 
Дан связный неориентированный граф <tex> G = (V, E) </tex>, с ребрами веса <tex> w_e </tex>. Требуется найти минимальное остовное дерево <tex>T = (V, E')</tex> минимального веса <tex> w(T) = \sum_{e \in E'} w_e </tex>.
  
 +
== Оценка времени решения OneMax ==
 
'''Утверждение 1:'''
 
'''Утверждение 1:'''
  
Строка 99: Строка 103:
 
<tex> \frac{p}{ (1 - (1 - p)) ^ 2} = p \sum_{i=1}^\infty  i (1 - p)^{i-1} = \frac{1}{p} </tex>
 
<tex> \frac{p}{ (1 - (1 - p)) ^ 2} = p \sum_{i=1}^\infty  i (1 - p)^{i-1} = \frac{1}{p} </tex>
  
=== RMHC для OneMax ===
+
 
 +
=== Алгоритм RMHC ===
  
 
Решение: на каждом шаге равномерно выбираем и инвертируем один бит из <tex> n </tex>. Пусть <tex> k </tex> --- значение <tex> f </tex> в начале фазы. При <tex> k + 1 = k' > k </tex> фаза заканчивается.
 
Решение: на каждом шаге равномерно выбираем и инвертируем один бит из <tex> n </tex>. Пусть <tex> k </tex> --- значение <tex> f </tex> в начале фазы. При <tex> k + 1 = k' > k </tex> фаза заканчивается.
Строка 110: Строка 115:
 
<tex> \sum_{k=0}^{n-1} \frac{n}{n-k} = n \sum_{i=1}^{n} \frac{1}{i} = O(n \log n) </tex>
 
<tex> \sum_{k=0}^{n-1} \frac{n}{n-k} = n \sum_{i=1}^{n} \frac{1}{i} = O(n \log n) </tex>
  
=== (1+1)-ES для OneMax ===
+
=== Алгоритм (1+1)-ES ===
  
 
Решение: независимо для каждого бита инвертируем его с вероятностью <tex> p = \frac{1}{n} </tex>. Пусть <tex> k </tex> --- значение <tex> f </tex> в начале фазы. При <tex> k' > k </tex> фаза заканчивается.
 
Решение: независимо для каждого бита инвертируем его с вероятностью <tex> p = \frac{1}{n} </tex>. Пусть <tex> k </tex> --- значение <tex> f </tex> в начале фазы. При <tex> k' > k </tex> фаза заканчивается.
Строка 120: Строка 125:
 
Отсюда ожидаемая продолжительность всех фаз:  
 
Отсюда ожидаемая продолжительность всех фаз:  
 
<tex> \sum_{k=0}^{n-1} \frac{e n}{n-k} = e n \sum_{i=1}^{n} \frac{1}{i} = O(n \log n) </tex>
 
<tex> \sum_{k=0}^{n-1} \frac{e n}{n-k} = e n \sum_{i=1}^{n} \frac{1}{i} = O(n \log n) </tex>
 +
 +
==Оценка времени решения MST==
  
 
===Drift theorem===
 
===Drift theorem===
Строка 140: Строка 147:
  
 
<tex>\forall c > 0, Pr(T > (1/\delta)(\ln(X_0) + c)) \leq e ^ {-c}</tex>
 
<tex>\forall c > 0, Pr(T > (1/\delta)(\ln(X_0) + c)) \leq e ^ {-c}</tex>
 
 
  
 
=== (1+1)-ES для MST ===
 
=== (1+1)-ES для MST ===

Версия 13:28, 17 июня 2012

Постановка задачи однокритериальной оптимизации

[math]S[/math] - пространство решений (дискретно),

[math]f : S \rightarrow \mathbb{R}[/math] - оценочная функция.

Задача: найти [math]s \in S : f(s) \rightarrow max [/math]. При этом рассматривается black-box scenario, что означает, что получить информацию об [math]f[/math] можно только путем ее вычисления.

Методы решения

HC(Hill Climbing)

x [math]\leftarrow[/math] random
while(true)
  x' [math]\leftarrow[/math] neibor(x)
  f(x') [math]\geq[/math] f(x) [math] \Rightarrow [/math] x = x' 

Итерации выполняются, пока не будет удовлетворен критерий останова. Возможны два варианта HC:

1) first ascent --- в качестве [math]x'[/math] выбирается первый из соседей, для которого [math]f(x') \geq f(x)[/math]

2) steepest ascent --- осуществляется перебор всех соседей, и в качестве [math]x'[/math] выбирается тот, для которого [math]f(x')-f(x)[/math] максимально

RMHC (Random Mutation Hill Climbing)

Та же схема, что и для HC, но [math] x'[/math] получают путем случайного изменения одного из компонентов решения [math] x [/math].

ES (Evolution Strategies)

1) [math](1+1)-ES [/math] --- после внесения случайного изменения в каждый из компонентов [math] x[/math], [math]x'[/math] может оказаться любым элементом [math]S[/math], но, чем он ближе к [math]x[/math], тем выше вероятность его выбора.

2) [math](1+\lambda)-ES[/math] --- генерируется [math]\lambda[/math] промежуточных решений, среди них выбирается лучшее.

3) [math](1+\lambda)-ES[/math] --- генерируется [math]\lambda[/math] промежуточных решений, среди них выбирается [math]\mu[/math] лучших.


Примеры задач

OneMax

Найти битовую строку длины [math]n[/math], состоящую из одних единиц. Оценочная функция:

[math]f(x_1, x_2, \dots , x_n) = OneMax(x_1, x_2, \dots , x_n) = x_1 + x_2, + \dots + x_n [/math]

MST (Minimum spanning tree)

Дан связный неориентированный граф [math] G = (V, E) [/math], с ребрами веса [math] w_e [/math]. Требуется найти минимальное остовное дерево [math]T = (V, E')[/math] минимального веса [math] w(T) = \sum_{e \in E'} w_e [/math].

Оценка времени решения OneMax

Утверждение 1:

[math] ( 1 - \frac{1}{n} ) ^ {n-1} \geq \frac{1}{e}[/math]

Доказательство:

[math] lim_{n \to \infty}(1 + \frac{1}{n})^n = e [/math]

[math] (\frac {1} {1 + \frac{1}{n}})^n = (\frac {1} {\frac{n + 1}{n}})^n = (\frac {n} {n+1})^n \stackrel{ _{m = n + 1}}{=} (1 - \frac{1}{m}) ^ {m-1}[/math]


Утверждение 2:

[math] \frac{n^k}{k^k} \leq C_n^k[/math] (1)

[math] C_n^k \leq \frac{n^k}{k!} [/math] (2)

Доказательство:

1) [math] C_n^k = \frac{n!}{k!(n-k)!} \leq \frac{n^k}{k!}[/math]

2) [math]b \leq a \Rightarrow \frac{a}{b} \leq \frac{a - 1} {b - 1}, a,b \gt 1 \Rightarrow (1) [/math]


Утверждение 3:

[math] \frac{1}{n}^k (1 - \frac{1}{n})^{n - k} \geq \frac{1}{e n^k} [/math]

Доказательство:

[math] (1 - \frac{1}{n})^{n - k} \geq \frac{1}{e} [/math] по Утверждению 1, отсюда следует Утверждение 3.


Утверждение 4:

[math] C_n^k \frac{1}{n}^k(1 - \frac{1}{n})^{n - k} \geq \frac{1}{e k^k} [/math]

Доказательство:

Следует из вышедоказанного.


Утверждение 5 (Лемма об ожидании):

Если вероятность наступления события [math]A[/math] на каждом шаге равна [math]p[/math], то матожидание наступления этого события [math]E(t_A) = \frac{1}{p}[/math]


Доказательство:

[math]E(t_A) = 1 \cdot p + 2 (1-p) p + 3 (1 - p)^2 p + \dots + k (1 - p)^k p + \dots = \sum_{i=1}^\infty i p (1 - p) ^{i - 1} = p\sum_{i=1}^\infty i (1 - p) ^{i - 1}[/math]

[math] \frac{1}{1 - x} = \sum_{i=0}^\infty x^i [/math] Продиффиренцировав, получаем:

[math] \frac{1}{1 - x}' = \frac{1}{(1 - x) ^ 2} = \sum_{i=0}^\infty i x^{i - 1} [/math]

[math] \frac{p}{ (1 - (1 - p)) ^ 2} = p \sum_{i=1}^\infty i (1 - p)^{i-1} = \frac{1}{p} [/math]


Алгоритм RMHC

Решение: на каждом шаге равномерно выбираем и инвертируем один бит из [math] n [/math]. Пусть [math] k [/math] --- значение [math] f [/math] в начале фазы. При [math] k + 1 = k' \gt k [/math] фаза заканчивается.

Оценим время работы алгоритма для данной задачи.

Вероятность окончания фазы [math] \frac{n - k}{n} [/math]. Тогда по Утверждению 5 [math] E(t) = \frac{n}{n-k} [/math] для конкретной фазы.

Отсюда ожидаемая продолжительность всех фаз: [math] \sum_{k=0}^{n-1} \frac{n}{n-k} = n \sum_{i=1}^{n} \frac{1}{i} = O(n \log n) [/math]

Алгоритм (1+1)-ES

Решение: независимо для каждого бита инвертируем его с вероятностью [math] p = \frac{1}{n} [/math]. Пусть [math] k [/math] --- значение [math] f [/math] в начале фазы. При [math] k' \gt k [/math] фаза заканчивается.

Оценим время работы алгоритма для данной задачи.

Вероятность окончания фазы [math] (n - k)\frac{1}{n}(1 - \frac{1}{n}) ^ {n-1} \geq \frac{n - k}{e n}[/math] по утверждению 3. Тогда по Утверждению 5 [math] E(t) \leq \frac{e n}{n-k} [/math] для конкретной фазы.

Отсюда ожидаемая продолжительность всех фаз: [math] \sum_{k=0}^{n-1} \frac{e n}{n-k} = e n \sum_{i=1}^{n} \frac{1}{i} = O(n \log n) [/math]

Оценка времени решения MST

Drift theorem

Пусть [math]X_0, X_1, \dots[/math] --- неотрицательные целочисленные случайные величины и существует [math]\delta \gt 0[/math] такое что:

[math]\forall t \in \mathbb{N}, x \in \mathbb{N}_0 : E(X_t | X_{t-1} = x) \leq (1 - \delta) x[/math].

Тогда [math]T = \min\{t \in \mathbb{N}_0 | X_t = 0\}[/math] удовлетворяет

[math]E(T) \leq (1/\delta)(\ln(X_0) + 1)[/math]

An Improved Drift theorem

Пусть [math]X_0, X_1, \dots[/math] --- случайные величины из [math]\{0\} \cup [1, \infty)[/math] и существует [math]\delta \gt 0[/math] такое что:

[math]\forall t \in \mathbb{N}, x \in \mathbb{N}_0 : E(X_t | X_{t-1} = x) \leq (1 - \delta) x[/math].

Тогда [math]T = \min\{t \in \mathbb{N}_0 | X_t = 0\}[/math] удовлетворяет

[math]E(T) \leq (1/\delta)(\ln(X_0) + 1)[/math]

[math]\forall c \gt 0, Pr(T \gt (1/\delta)(\ln(X_0) + c)) \leq e ^ {-c}[/math]

(1+1)-ES для MST

Решение представляет собой битовую строку [math]x[/math] длины [math]m = |E|[/math], где [math]x_e = 1[/math], если [math]e \in E'[/math], и [math]x_e = 0[/math] в обратном случае.

Мутация: независимо для каждого бита инвертируем его с вероятностью [math]\frac{1}{m}[/math]

Фитнес-функция: [math]w(T) + c_{penalty} ({\#comp} - 1) [/math], где [math]\#comp[/math] --- число компонент связности в текущем [math] T [/math].

Теорема. [Neumann, Wegener (2004)]: Ожидаемое время работы (1+1)-EA для задачи MST [math]O(m^2 \log(m w_{max}))[/math], где [math]w_{max}[/math] --- максимальный вес ребра.

Доказательство.

1) Пусть после [math]O(m \log m)[/math] итераций [math]T[/math] связно: [math]X_t = {\#comp} - 1[/math] после итерации [math]t[/math]

Если [math]X_{t - 1} = k[/math], то существует как минимум [math]k[/math] ребер, которые не входят в [math]T[/math] и добавление которых уменьшает [math]X_t[/math]

[math]E(X_t) \leq (1 - \frac{1}{e m})k[/math]

Применяя теорему о дрифте, получаем требуемый результат.

2) Пусть [math]T[/math] уже связно. Тогда оно остается связным и на дальнейших итерациях.

Пусть [math] X_t = w(T) - w_{opt} [/math] для [math]T[/math] после итерации [math]t[/math].

Если [math]X_{t-1} = D \gt 0[/math], то существуют [math]e_1, \dots, e_k[/math] из [math]T[/math] и [math]e'_1, \dots, e'_k[/math] из [math]E \setminus T[/math] такие, что

[math]T' = T - \{e_1, \dots , e_k\} + \{e'_1, \dots , e'_k\}[/math] --- это MST,

следовательно [math]D = \sum_{i} (w(e_i) - w(e'_i))[/math], и для всех [math]i[/math]

[math]T_i = T - e_i + e'_i[/math] --- основное дерево с [math]w(T_i) \lt w(T)[/math].

С верояностью [math]\geq 1/e m^2[/math], одна итерация обменяет в точности ребра [math]e_i[/math] и [math]e'_i[/math].

[math]E(X_t) \leq D - \sum_{i} (1/e m^2) (w(e_i) - w(e'_i))= (1 - 1/e m^2) D [/math]

Используем теорему о дрифте, учитывая, что [math]X_0 \leq \sum_{e \in E} w(e) \leq m w_{max}[/math], и получаем требуемый результат.