Изменения

Теоретическая оценка времени работы алгоритмов RMHC и (1+1)-ES для задач OneMax и MST

14 708 байт добавлено, 14:30, 20 июня 2012

Нет описания правки

=~~Теоретическая оценка времени работы алгоритмов RMHC и (1+1)~~= Постановка задачи однокритериальной оптимизации==Пусть <tex>S</tex> {{-~~ES для задач OneMax и MST=~~--}} дискретное пространство решений, а<tex>f : S \rightarrow \mathbb{R}</tex> {{---}} оценочная функция.

Тогда задача однокритериальной оптимизации заключается в том, чтобы найти такое <tex>s \in S </tex>, что <tex> f(s)</tex> максимально. При этом рассматривается black-box scenario, что означает, что получить информацию об <tex>f</tex> можно только путем ее вычисления.

В случае эволюционных алгоритмов время их работы измеряется в количестве вычислений оценочной функции.

==Рассмотренные методы решения = ~~Постановка задачи~~ ===='''HC''' (Hill Climbing)===В русскоязычном варианте этот метод называется методом спуска. Общая схема данного алгоритма выглядит следующим образом: x <tex>\leftarrow</tex> random while(true) x' <tex>\leftarrow</tex> neighbour(x) f(x') <tex>\geq</tex> f(x) <tex> \Rightarrow </tex> x = x' Итерации выполняются, пока не будет удовлетворен критерий останова. Возможны два варианта HC:

1) '''first ascent''' {{---}} в качестве <tex>Sx'</tex> ~~- пространство решений~~ выбирается первый из соседей, для которого <tex>f(x') \geq f(~~дискретно~~x),</tex>;

2) '''steepest ascent''' {{---}} осуществляется перебор всех соседей, и в качестве <tex>x'</tex> выбирается тот, для которого <tex>f ~~: S \rightarrow \mathbb{R}~~(x')-f(x)</tex> ~~- оценочная функция~~максимально.

~~Задача: найти <tex>s \in S : f~~==='''RMHC''' (sRandom Mutation Hill Climbing) \rightarrow max </tex>. При этом рассматривается black-box scenario, что означает, что получить информацию об <tex>f</tex> можно только путем ее вычисления.===

~~=== Методы~~ В данном алгоритме применяется же схема, что и для метода спуска, но <tex> x'</tex> получают путем случайного изменения одного из компонентов решения ~~===~~<tex> x </tex>.

==='''~~RMHC~~ES''' (Evolution Strategies)===Это широкий класс алгоритмов поиска, основанных на идеях приспособления и эволюции<ref>Droste S., Jansen T., Wegener I.: [http://www.google.ru/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0CEcQFjAA&url=http%3A%2F%2Fwww.mpi-inf.mpg.de%2F~tfried%2Fteaching%2FSS08%2Fseminar%2Fpaper%2F7-~~- Random Mutation Hill Climbing~~DorsteJansenWegener.pdf&ei=92DfT6vnDMX6mAWz1fmtDA&usg=AFQjCNErEUu9L8x4PWFPofp3Y80hjE2_Ow&sig2=G9rsT_PDarYfL7LL4tLPvg On the analysis of the (1 + 1) evolutionary algorithm.] Theoretical Computer Science 276, 51–81 (2002) </ref>. Существуют различные вариации ES:

~~'''RLS'''~~ 1) (1+1)-ES {{--- ~~Random Local Search~~}} на каждой итерации существует одно исходное решение <tex> x</tex> и одно промежуточное решение <tex>x'</tex>. После внесения случайного изменения в каждый из компонентов <tex> x</tex>, <tex>x'</tex> может оказаться любым элементом <tex>S</tex>, но, чем он ближе к <tex>x</tex>, тем выше вероятность его выбора.

2) (1+<tex>\lambda</tex>)-ES {{---}} на каждой итерации генерируется <tex>\lambda</tex> промежуточных решений, среди них выбирается лучшее.

~~Начальное решение~~ 3) (<tex> x \mu</tex> +<tex>\lambda</tex>)-ES {{---}} на каждой итерации генерируется <tex>\lambda</tex> промежуточных решений, среди них выбирается ~~случайным образом. Выбор последующих~~ <tex> x'\mu</tex> ~~также осуществляется случайным образом~~лучших.

~~'''ES''' --- Evolution Strategies~~== Примеры задач ==

1) ===OneMax=== Задача состоит в том, чтобы найти битовую строку длины <tex>~~(1+1)-ES~~ n</tex>, состоящую из одних единиц. Оценочная функция {{---}} количество единиц в текущем решении:

<tex>xf(x_1, x_2, \dots , x_n) = OneMax(x_1, x_2, \dots , x_n) = x_1 + x_2, + \dots + x_n </tex> ===MST (Minimum spanning tree)===Известная задача на графах, формулируется следующим образом. Пусть дан связный неориентированный граф <tex> G = (V, E) </tex>. Для каждого ребра <tex>e \in E</tex> задан вес <tex> w_e </tex>. Требуется найти [[Дискретная математика, алгоритмы и структуры данных#Построение остовных деревьев|остовное дерево]] <tex>T = (V, E')</tex> ~~может оказаться любым элементом~~ минимального веса <tex>Sw(T) = \sum_{e \in E'} w_e </tex>. == Оценка времени работы для OneMax == Содержание данного раздела основано на работе <ref>Witt C.: [http://massivedatasets.files.wordpress.com/2010/03/slides-02283-20102.pdf Randomized Search Heuristics.] Algorithms for Massive Data Sets, ноDTU Informatik, ~~чем он ближе~~ Danmarks Tekniske Universitet (2010)</ref>. Чтобы оценить время работы вышеописанных алгоритмов на задаче OneMax необходимо доказать несколько утверждений. {{Утверждение|id=proposal1|about=1|statement=<tex> ( 1 - \frac{1}{n} ) ^ {n-1} \geq \frac{1}{e}</tex>|proof=Из курса математического анализа известно, что <tex> lim_{n \to \infty}(1 + \frac{1}{n})^n = e </tex>. Путем несложных преобразований получаем: <tex> (\frac {1} {1 + \frac{1}{n}})^n = (\frac {1} {\frac{n + 1}{n}})^n = (\frac {n} {n+1})^n \stackrel{ _{m = n + 1}}{=}(1 - \frac{1}{m}) ^ {m-1}</tex>. Чтобы перейти от предела к неравенству, докажем, что <tex>(1 + \frac{1}{n})^n \leq e</tex>. Известно, что <tex>1 + x \leq e^x</tex>. Пусть <tex>x= \frac{1}{n}</tex>, тогда <tex>1 + \frac{1}{n} \leq e^{\frac{1}{n}}</tex>. Возведем обе части в степень <tex>n</tex> и получим требуемое неравенство. }} {{Утверждение|id=proposal2|about=2|statement=<tex> \frac{n^k}{k^k} \leq C_n^k (1)</tex> <br> <tex> C_n^k \leq \frac{n^k}{k!} (2)</tex> |proof= 1) Из определения <tex> C_n^k </tex> сразу следует <tex> (2) </tex> : <tex> C_n^k = \frac{n!}{k!(n-k)!} \leq \frac{n^k}{k!}</tex>. 2) Известно, что для <tex> a,b > 1 </tex> справедливо <tex>b \leq a \Rightarrow \frac{a}{b} \leq \frac{a - 1} {b - 1}</tex>Отсюда, вновь воспользовавшись определением <tex> C_n^k </tex>, получаем <tex>(1) </tex>.}} {{Утверждение|id=proposal3|about=3|statement=<tex> (\frac{1}{n})^k (1 - \frac{1}{n})^{n - k} \geq \frac{1}{e n^k} </tex>.|proof=<tex> (1 - \frac{1}{n})^{n - k} \geq \frac{1}{e} </tex>по [[#proposal1|утверждению(1)]], ~~тем выше вероятность его выбора~~отсюда следует требуемый результат.}}

2) {{Утверждение|id=proposal4|about=4|statement=<tex>C_n^k (\frac{1+}{n})^k(1 - \~~lambda~~frac{1}{n})^{n -ESk} \geq \frac{1}{e k^k} </tex> ~~--- генерируется~~ .|proof=<tex>C_n^k (\frac{1}{n})^k(1 - \frac{1}{n})^{n - k} \geq \frac{n^k}{k^k} \~~lambda~~frac{1}{e n^k} = \frac{1}{e k^k}</tex> ~~промежуточных решений, среди них выбирается лучшее~~по [[#proposal2|утверждению(2)]] и [[#proposal3|утверждению(3)]].}}

3) {{Утверждение|id=proposal5|about=Лемма об ожидании|statement=Если вероятность наступления события <tex>~~(1+\lambda)-ES~~A</tex> ~~--- генерируется~~ на каждом шаге равна <tex>~~\lambda~~p</tex> ~~промежуточных решений~~, ~~среди них выбирается~~ то матожидание времени наступления этого события <tex>E(t_A) = \mufrac{1}{p}</tex> ~~лучших~~.|proof=По определению математического ожидания:

<tex>E(t_A) = 1 \cdot p + 2 (1-p) p + 3 (1 - p)^2 p + \dots + k (1 - p)^k p + \dots = \sum_{i=1}^\infty i p (1 - p) ^{i - 1} = p\sum_{i=1}^\infty i (1 - p) ^{i - 1}</tex>.

Из курса математического анализа известно, что <tex> \frac{1}{1 - x} =\sum_{i=~~= Примеры задач ===~~0}^\infty x^i </tex>, а также то, что этот ряд удовлетворяет условиям теоремы о почленном дифференцировании.

~~1) '''OneMax''' --- найти битовую строку длины <tex>n</tex>~~Воспользовавшись этим фактом, ~~состоящую из одних единиц. Оценочная функция~~получаем:

<tex> (\frac{1}{1 - x})' = \frac{1}{(1 - x) ^ 2} = \sum_{i=0}^\infty i x^{i - 1} </tex>. Отсюда видно, что: <tex> \frac{p}{ (1 - (1 - p)) ^ 2} = p \sum_{i=1}^\infty i (1 - p)^{i-1} = \frac{1}{p} </tex>.}}=== Алгоритм RMHC === Решение задачи OneMax с помощью алгоритма RMHC выглядит следующим образом. В качестве начального решения примем случайный вектор, а затем на каждой итерации равновероятно выбираем и инвертируем один бит из <tex> n </tex>. Пусть <tex> k </tex> {{---}} количество единиц в векторе (то есть значение <tex>f</tex>) в начале фазы. При <tex> k + 1 = k' > k </tex> фаза заканчивается. Оценим время работы алгоритма для данной задачи. Вероятность окончания фазы {{---}} это вероятность того, что будет выбран один из оставшихся <tex>n - k</tex> нулевых битов: <tex> \frac{n - k}{n} </tex>. Тогда по [[#proposal5|лемме об ожидании]] <tex> E(t) = \frac{n}{n-k} </tex> для конкретной фазы. Отсюда ожидаемая продолжительность всех фаз равна: <tex> \sum_{k=0}^{n-1} \frac{n}{n-k} = n \sum_{i=1}^{n} \frac{1}{i} = O(n \log n) </tex> === Алгоритм (~~x_1~~1+1)-ES === Применим (1+1)-ES к решению задачи OneMax. Для этого на каждой итерации независимо для каждого бита инвертируем его с вероятностью <tex> p = \frac{1}{n} </tex>. Пусть <tex> k </tex> {{---}} значение <tex> f </tex> в начале фазы. При <tex> k' > k </tex> фаза заканчивается. Оценим время работы алгоритма для данной задачи. Чтобы количество единиц увеличилось, необходимо из перевернуть хотя бы один из <tex>n - k</tex> нулевых битов, ~~x_2~~и при этом не затронуть единичных. С учетом того, что вероятность переворота <tex> \~~dots~~ frac{1}{n} </tex>, ~~x_n~~получаем вероятность окончания фазы <tex> (n - k)\frac{1}{n}(1 - \frac{1}{n}) ^ {n-1} \geq \frac{n - k}{e n}</tex> по [[#proposal3|утверждению(3) ]]. Тогда по [[#proposal5|лемме об ожидании]] <tex> E(t) \leq \frac{e n}{n-k} </tex> для конкретной фазы. Отсюда ожидаемая продолжительность всех фаз меньше либо равна: <tex> \sum_{k=0}^{n-1} \frac{e n}{n-k} = e n \sum_{i= ~~OneMax~~1}^{n} \frac{1}{i} = O(~~x_1, x_2,~~ n \~~dots~~ log n) </tex> ==Оценка времени работы с использованием Drift Analysis== [[Теорема о дрифте | Теорема о дрифте]] с успехом применяется для оценки времени работы эволюционных алгоритмов в различных ситуациях. Примеры можно найти в работе<ref>Doerr B.: [http://dl.acm.org/citation.cfm?id=2002138 Tutorial: Drift Analysis.] GECCO '11 Proceedings of the 13th annual conference companion on Genetic and evolutionary computation, ~~x_n~~1311-1320 (2011)</ref>. ===RMHC для OneMax===Пусть <tex>X_t</tex> {{---}} число нулевых бит после итерации <tex>i</tex>: <tex>X_t = f_{opt} - f(X_t)</tex> Пусть <tex>X_{t-1} = k</tex>. Тогда <tex>E(X_t | X_{t-1} = k) = ~~x_1~~ (k-1)\frac{k}{n} + ~~x_2~~k \frac{n-k}{n} = k (1 - \frac{1}{n})</tex>, + то есть <tex> \delta = \~~dots + x_n~~ frac{1}{n}</tex>.

2Отсюда по [[Теорема о дрифте|теореме о дрифте]], с учетом того, что <tex> X_0 \leq n </tex> получаем: <tex> E(T) ~~'''MST''' --- Minimum spanning tree~~\leq n(\ln{n} + 1)</tex>.

===(1+1)-ES для OneMax===

Пусть <tex>X_t</tex> {{---}} число нулевых бит после итерации <tex>i</tex>: <tex>X_t = f_{opt} - f(X_t)</tex>.

~~'''Утверждение~~ Пусть <tex>X_{t-1} = k</tex>. Тогда вероятность перевернуть один нулевых битов равна <tex>k \frac{1}{n} ( 1 - \frac{1}{n})^{n-1} \geq \frac{k}{e n} </tex>. Отсюда:~~'''~~

<tex> E( X_t | X_{t-1 } = k) \leq (k- 1)\frac{k}{e n} + k (1- \frac{k}{e n} ) ^ = k (1 - \frac{1}{e n-1} )</tex>, то есть <tex> \~~geq~~ delta = \frac{1}{en}</tex>.

~~'''Доказательство~~Применяем [[Теорема о дрифте|теорему о дрифте]], с учетом того, что <tex> X_0 \leq n </tex>, и получаем:~~'''~~<tex> E(T) \leq e n(\ln{n} + 1)</tex>.

~~<tex> lim_{n \to \infty}~~=== (1 + ~~\frac{~~1~~}{n}~~)^n -ES для MST === ~~e </tex>~~

~~<tex>~~ Рассмотрим в качестве более содержательного примера поиск минимального остовного дерева с помощью (~~\frac {1} {~~1 + ~~\frac{~~1~~}{n}}~~)^n -ES. Решение представляет собой битовую строку <tex>x</tex> длины <tex>m = ~~(\frac {1} {\frac{n + 1}{n}})^n~~ |E|</tex>, где <tex>x_e = ~~(\frac {n} {n+~~1~~})^n \stackrel{ _{m = n + 1}}{~~</tex>, если ребро <tex>e</tex> входит в текущий подграф <tex>T</tex>, и <tex>x_e =}~~(1 - \frac{1}{m}) ^ {m-1}~~0</tex>в обратном случае.

На каждой итерации независимо для каждого бита инвертируем его с вероятностью <tex>\frac{1}{m}</tex>.

~~'''Утверждение~~ В качестве оценочной функции возьмем <tex>w(T) + C_{penalty} (|T| - n + 1) + {C_{penalty}}^2~~:'''~~({\#comp} - 1) </tex>, где <tex>\#comp</tex> {{---}} число компонент связности в текущем <tex> T </tex>, а <tex> C_{penalty} > m w_{max}</tex>, где <tex>w_{max}</tex> {{---}} максимальный вес ребра.

{{Теорема |author=Neumann, Wegener (2004)|statement= Ожидаемое время работы (1+1)-ES для задачи MST равно <tex> O(m^2 \~~frac~~log(m w_{~~n^k~~max}))</tex>, где <tex>w_{~~k^k~~max} ~~\leq C_n^k~~</tex> ~~(1)~~{{---}} максимальный вес ребра.

~~<tex> C_n^k \leq \frac{n^k}{k!} </tex> (2)~~|proof=

~~'''Доказательство~~Разобьем доказательство теоремы на три этапа:~~'''~~получение связного подграфа, получение остовного дерева и получение минимального остовного дерева.

~~1) <tex> C_n^k = \frac{n!}{k!(n-k)!} \leq \frac{n^k}{k!}</tex>~~

21) Покажем, что после <tex>b O(m \~~leq a \Rightarrow \frac{a}~~log m)</tex> итераций <tex>T</tex> связно.Пусть <tex>X_t = {~~b} \leq~~ \~~frac{a - 1~~#comp} {b - 1~~}, a,b~~ </tex> после итерации <tex> ~~1 \Rightarrow (1)~~ t</tex>.

Если <tex>X_{t - 1} = k</tex>, то существует как минимум <tex>k</tex> ребер, которые не входят в <tex>T</tex> и добавление которых уменьшает <tex>X_t</tex>. По аналогии с решением задачи OneMax получаем:

~~'''Утверждение 3:'''~~<tex>E(X_t | X_{t-1} = k) \leq (1 - \frac{1}{e m})k</tex>.

~~<tex> \frac{1}{n}^k (1 - \frac{1}{n})^{n - k} \geq \frac{1}{e n^k} </tex>~~Применяя [[Теорема о дрифте|теорему о дрифте]], получаем требуемый результат.

~~'''Доказательство:'''~~

2) Пусть <tex>T</tex> уже связно. Тогда оно остается связным и на дальнейших итерациях, так как <tex> ~~(1 - \frac~~C_{~~1}{n})^{n - k} \geq \frac{1}{e~~penalty} </tex> ~~по Утверждению 1, отсюда следует Утверждение 3~~достаточно велико.

Покажем, что после <tex>O(m \log m)</tex> итераций <tex>T</tex> является деревом, то есть <tex>|T| = n - 1</tex>, где <tex>n = |V|</tex>.

Пусть <tex>X_t = |T| - (n - 1)</tex> после итерации <tex>t</tex> (количество "лишних" ребер в <tex>T</tex>).

~~'''Утверждение 4~~Если <tex>X_{t - 1} = k</tex>, то существует как минимум <tex>k</tex> ребер, удаление которых из <tex>T</tex> уменьшает <tex>X_t</tex>. По аналогии с решением задачи OneMax получаем:~~'''~~

<tex> ~~C_n^k \frac~~E(X_t | X_{t-1}~~{n}^~~= k) \leq (1 - \frac{1}{ne m})~~^{n - k} \geq \frac{1}{e~~ k~~^k}~~ </tex>.

~~'''Доказательство:'''~~Применяя [[Теорема о дрифте|теорему о дрифте]], получаем требуемый результат.

~~Следует из вышедоказанного.~~

3) Пусть <tex>T</tex> уже связно и является деревом. Тогда останется таковым и на дальнейших итерациях, так как <tex>C_{penalty}</tex> достаточно велико.

~~'''Утверждение 5~~ Пусть <tex> X_t </tex> для <tex>T</tex>{{---}} это разница между весом текущего дерева и оптимального: <tex> X_t = w(~~Лемма об ожидании~~T)~~:'''~~- w_{opt} </tex> после итерации <tex>t</tex>.

Если ~~вероятность наступления события~~ <tex>AX_{t-1} = D > 0</tex>, то существуют наборы ребер <tex>e_1, \dots, e_k</tex> ~~на каждом шаге равна~~ из <tex>pT</tex>и <tex>e'_1, ~~то матожидание наступления этого события~~\dots, e'_k</tex> из <tex>E~~(t_A) =~~ \~~frac{1}{p}~~setminus T</tex>такие, что

<tex>T' = T - \{e_1, \dots , e_k\} + \{e'_1, \dots , e'_k\}</tex> {{---}} это минимальное остовное дерево.

Следовательно <tex>D = \sum_{i} (w(e_i) - w(e'~~''Доказательство:'''~~_i))</tex>, и для всех <tex>i</tex>

<tex>~~E(t_A)~~ T_i = ~~1 \cdot p~~ T - e_i + ~~2 (1~~e'_i</tex> {{-~~p) p + 3 (1~~ - ~~p)^2 p + \dots + k (1~~ - ~~p)^k p + \dots = \sum_{i=1~~}~~^\infty i p~~ } остовное дерево с весом <tex>w(~~1 - p~~T_i) ~~^{i - 1} = p\sum_{i=1}^\infty i~~ < w(~~1 - p~~T) ~~^{i - 1}~~</tex>.

С верояностью <tex> \~~frac{~~geq 1~~}{1 - x} = \sum_{i=0}^\infty x~~/e m^i 2</tex> ~~Продиффиренцировав~~, ~~получаем~~одна итерация обменяет в точности ребра <tex>e_i</tex> и <tex>e'_i</tex>. Тогда:

<tex> ~~\frac~~E(X_t | X_{t-1}{1 = D) \leq D - ~~x}' =~~ \~~frac~~sum_{1i}{(1 /e m^2) (w(e_i) - xw(e'_i)) ~~^ 2}~~ = ~~\sum_{i=0}^\infty i x^{i~~ (1 - 1} /e m^2) D </tex>

Используем [[Теорема о дрифте|теорему о дрифте]], учитывая, что<tex> X_0 \~~frac{1}{ (1 - (1 - p)) ^ 2} = p~~ leq \sum_{~~i=1~~e \in E}~~^\infty i~~ w(~~1 - p~~e)^\leq m w_{~~i-1~~max} ~~= \frac{1~~</tex>, и получаем требуемый результат.}{p} ==Источники==<references /~~tex~~>

Fedor Tsarev

3

правки

Изменения

Теоретическая оценка времени работы алгоритмов RMHC и (1+1)-ES для задач OneMax и MST

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты