Cравнение RMHC и генетического алгоритма на Royal Road Function — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Экспериментальные результаты)
Строка 1: Строка 1:
 
{{В разработке}}
 
{{В разработке}}
 +
 +
== Royal Road Function ==
 +
 +
Simple Royal Road function, <tex>R_1</tex> состоит из списка частично определенных битовых строк (''схем'') <tex>s_i</tex>, где <tex>*</tex> обозначает символ <tex>0</tex> или <tex>1</tex>. Каждой схеме <tex>s_i</tex> соответствует коэффициент <tex>c_i</tex>. Порядком схемы называется число заданных битов. Битовая строка <tex>x</tex> называется экземпляром схемы <tex>s</tex>, <tex>x \in s </tex>, если биты  <tex>x</tex> совпадает с заданными битами <tex>s</tex> в соответствующих позициях.
 +
 +
Фитнесс функция <tex>R_1(x)=\sum_i c_i \delta_i(x)</tex>, где <tex>\delta_i(x)=\begin{cases}
 +
1,&x \in s_i;\\
 +
0,&x \notin s_i.\end{cases}</tex>
  
 
== Анализ RMHC и IGA ==
 
== Анализ RMHC и IGA ==
 +
 
=== Оценка для RMHC (Simple Hill-Climbing Algorithm) ===
 
=== Оценка для RMHC (Simple Hill-Climbing Algorithm) ===
  
Согласно [[Теоретическая оценка времени работы алгоритмов RMHC и (1+1)-ES для задач OneMax и MST|оценке времени работы алгоритмов RMHC]] ожидаемое время поиска всех требуемых блоков:
+
Воспользуемся алгоритмом RMHC для поиска строки, оптимальной для некоторой заданной Simple Royal Road функции <tex> R</tex>, с <tex>N</tex> блоками и <tex>K</tex> схемами.
 +
 
 +
Ожидаемое время поиска:
 +
 
 +
<tex>E(K, N)=E(K, 1)+E(K, 1)\frac{N}{N-1}+...+E(K, 1)\frac{N}{N-(N-1)}=E(K, 1)N[1 + \frac{1}{2} + \frac{1}{3} + ... + \frac{1}{N}]</tex>
  
<tex>E_N \approx 2^K N (\log N + \gamma)</tex>
+
<tex>E(K, N) \approx 2^K N (\log N + \gamma)</tex>
  
 
=== Оценка для IGA (Idealized Genetic Algorithm) ===
 
=== Оценка для IGA (Idealized Genetic Algorithm) ===
Строка 16: Строка 29:
 
Вероятность нахождения требуемых блоков точно в момент времени <tex>t</tex> есть <tex>P_{N}(t)=(1-(1-p)^t)^N - (1-(1-p)^{t-1})^N</tex>
 
Вероятность нахождения требуемых блоков точно в момент времени <tex>t</tex> есть <tex>P_{N}(t)=(1-(1-p)^t)^N - (1-(1-p)^{t-1})^N</tex>
  
Ожидаемое время поиска есть <tex>E_N=\sum_1^\infty t [ (1-(1-p)^t)^N - (1-(1-p)^{t-1})^N ]</tex>
+
Ожидаемое время поиска есть <tex>E_(K, N)=\sum_1^\infty t [ (1-(1-p)^t)^N - (1-(1-p)^{t-1})^N ]</tex>
  
Это значение можно аппроксимировать <tex>E_N \approx (1/p) \sum_{n=1}^N \frac{1}{N} \approx 2^K(\log N + \gamma)</tex>
+
Это значение можно аппроксимировать <tex>E_(K, N) \approx (1/p) \sum_{n=1}^N \frac{1}{N} \approx 2^K(\log N + \gamma)</tex>
  
 
==== IGA и Real GA ====
 
==== IGA и Real GA ====
Строка 24: Строка 37:
 
# Независимые выборки: размер популяции должен быть достаточно большой, процесс отбора должен быть достаточно медленным, и частоту мутаций должно быть достаточно, чтобы убедиться, что ни один бит не фиксируется в одном значении в большинстве строк в популяции
 
# Независимые выборки: размер популяции должен быть достаточно большой, процесс отбора должен быть достаточно медленным, и частоту мутаций должно быть достаточно, чтобы убедиться, что ни один бит не фиксируется в одном значении в большинстве строк в популяции
 
# Мгновенный кроссовер: скорость кроссовера должна быть такой, что время для скрещивания двух искомых схем мало по отношению ко времени их нахождения
 
# Мгновенный кроссовер: скорость кроссовера должна быть такой, что время для скрещивания двух искомых схем мало по отношению ко времени их нахождения
# Превосходство в скорости: Оценка скорости для RMHC: <tex>E_N \approx 2^K N (\log N + \gamma)</tex>, для IGA: <tex>E_N \approx (1/p)  2^K(\log N + \gamma)</tex>. Длина строки должна быть достаточно большой, чтобы фактор <tex>N</tex> давал превосходство в скорости
+
# Превосходство в скорости: Оценка скорости для RMHC: <tex>E_(K, N) \approx 2^K N (\log N + \gamma)</tex>, для IGA: <tex>E_(K, N) \approx (1/p)  2^K(\log N + \gamma)</tex>. Длина строки должна быть достаточно большой, чтобы фактор <tex>N</tex> давал превосходство в скорости
  
 
=== Результаты сравнения ===
 
=== Результаты сравнения ===

Версия 03:34, 18 июня 2012

Эта статья находится в разработке!

Royal Road Function

Simple Royal Road function, [math]R_1[/math] состоит из списка частично определенных битовых строк (схем) [math]s_i[/math], где [math]*[/math] обозначает символ [math]0[/math] или [math]1[/math]. Каждой схеме [math]s_i[/math] соответствует коэффициент [math]c_i[/math]. Порядком схемы называется число заданных битов. Битовая строка [math]x[/math] называется экземпляром схемы [math]s[/math], [math]x \in s [/math], если биты [math]x[/math] совпадает с заданными битами [math]s[/math] в соответствующих позициях.

Фитнесс функция [math]R_1(x)=\sum_i c_i \delta_i(x)[/math], где [math]\delta_i(x)=\begin{cases} 1,&x \in s_i;\\ 0,&x \notin s_i.\end{cases}[/math]

Анализ RMHC и IGA

Оценка для RMHC (Simple Hill-Climbing Algorithm)

Воспользуемся алгоритмом RMHC для поиска строки, оптимальной для некоторой заданной Simple Royal Road функции [math] R[/math], с [math]N[/math] блоками и [math]K[/math] схемами.

Ожидаемое время поиска:

[math]E(K, N)=E(K, 1)+E(K, 1)\frac{N}{N-1}+...+E(K, 1)\frac{N}{N-(N-1)}=E(K, 1)N[1 + \frac{1}{2} + \frac{1}{3} + ... + \frac{1}{N}][/math]

[math]E(K, N) \approx 2^K N (\log N + \gamma)[/math]

Оценка для IGA (Idealized Genetic Algorithm)

Вероятность нахождения требуемого блока [math]s[/math] в случайной строке [math]p=1/2^k[/math], вероятность нахождения [math]s[/math] за время [math]t[/math] равна [math]1-(1-p)^t[/math]

Вероятность нахождения всех требуемых [math]N[/math] блоков за время [math]t[/math] есть [math]P_{N}(t)=(1-(1-p)^t)^N[/math]

Вероятность нахождения требуемых блоков точно в момент времени [math]t[/math] есть [math]P_{N}(t)=(1-(1-p)^t)^N - (1-(1-p)^{t-1})^N[/math]

Ожидаемое время поиска есть [math]E_(K, N)=\sum_1^\infty t [ (1-(1-p)^t)^N - (1-(1-p)^{t-1})^N ][/math]

Это значение можно аппроксимировать [math]E_(K, N) \approx (1/p) \sum_{n=1}^N \frac{1}{N} \approx 2^K(\log N + \gamma)[/math]

IGA и Real GA

Выделим ряд особенностей IGA, которые можно соблюсти в реальном генетическом алгоритме:

  1. Независимые выборки: размер популяции должен быть достаточно большой, процесс отбора должен быть достаточно медленным, и частоту мутаций должно быть достаточно, чтобы убедиться, что ни один бит не фиксируется в одном значении в большинстве строк в популяции
  2. Мгновенный кроссовер: скорость кроссовера должна быть такой, что время для скрещивания двух искомых схем мало по отношению ко времени их нахождения
  3. Превосходство в скорости: Оценка скорости для RMHC: [math]E_(K, N) \approx 2^K N (\log N + \gamma)[/math], для IGA: [math]E_(K, N) \approx (1/p) 2^K(\log N + \gamma)[/math]. Длина строки должна быть достаточно большой, чтобы фактор [math]N[/math] давал превосходство в скорости

Результаты сравнения

В работе When Will a Genetic Algorithm Outperform Hill Climbing? были получены следующие экспериментальные результаты:

Сравнение осуществлялось между RMHC и GA на Royal Road Function [math]R_4[/math].

Royal Road Function [math]R_4[/math]:

Уровень 1: [math]s_1 s_2 s_3 s_4 s_5 s_6 s_7 s_8 s_9 s_{10} s_{11} s_{12} s_{13} s_{14} s_{15} s_{16}[/math]
Уровень 2: [math](s_1 s_2) (s_3 s_4) (s_5 s_6) (s_7 s_8) (s_9 s_{10}) (s_{11} s_{12}) (s_{13} s_{14}) (s_{15} s_{16})[/math]
Уровень 3: [math](s_1 s_2 s_3 s_4) (s_5 s_6 s_7 s_8) (s_9 s_{10} s_{11} s_{12}) (s_{13} s_{14} s_{15} s_{16})[/math]
Уровень 4: [math](s_1 s_2 s_3 s_4 s_5 s_6 s_7 s_8) (s_9 s_{10} s_{11} s_{12} s_{13} s_{14} s_{15} s_{16})[/math]

Экспериментальные результаты

В таблице 1 указаны среднее число вычислений оценочной функции для достижения первого, второго и третьего уровней. Уровень 4 не было достигнут ни одним алгоритмом за выбранный максимум [math]10^6[/math] для числа вычислений оценочной функции.

Таблица 1
Level 1 Level 2 Level 3
GA число вычислений 500 4486 86078
 % запусков 100 100 86
RMHC число вычислений 230 8619 95027
 % запусков 100 100 41

Как видно, время достижения первого уровня сравнимы для двух алгоритмов, но генетический алгоритм гораздо быстрее, при достижении уровня 2 и 3.

Источники