<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
		<id>http://neerc.ifmo.ru/wiki/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=178.67.58.50&amp;*</id>
		<title>Викиконспекты - Вклад участника [ru]</title>
		<link rel="self" type="application/atom+xml" href="http://neerc.ifmo.ru/wiki/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=178.67.58.50&amp;*"/>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A1%D0%BB%D1%83%D0%B6%D0%B5%D0%B1%D0%BD%D0%B0%D1%8F:%D0%92%D0%BA%D0%BB%D0%B0%D0%B4/178.67.58.50"/>
		<updated>2026-04-12T22:26:01Z</updated>
		<subtitle>Вклад участника</subtitle>
		<generator>MediaWiki 1.30.0</generator>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=Drift_theory_%D0%B8_Drift_theorem&amp;diff=25618</id>
		<title>Drift theory и Drift theorem</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=Drift_theory_%D0%B8_Drift_theorem&amp;diff=25618"/>
				<updated>2012-06-18T08:49:02Z</updated>
		
		<summary type="html">&lt;p&gt;178.67.58.50: /* Примеры использования */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Теория дрифта была впервые представленная в работах [1,2]. Ее центральный результат, ''теорема о дрифте'', успешно применяется для оценок времени работы различных эволюционных алгоритмов [3-7]. Тем не менее, многие исследователи критикуют ее использование. Основные причины &amp;amp;ndash; сложность доказательства самой теоремы и ее использования.&lt;br /&gt;
&lt;br /&gt;
В результате в работах [8,9] была предложена ''мультипликативная теорема о дрифте'', которая во многих случаях позволяет получать более естественные доказательства. Кроме того в работе [10] была получена оценка вероятности того, что реальное время работы алгоритма превысит ожидаемое на заданную величину.&lt;br /&gt;
&lt;br /&gt;
= Мультипликативная теорема о дрифте =&lt;br /&gt;
&lt;br /&gt;
{{Теорема&lt;br /&gt;
|id=theorem1&lt;br /&gt;
|about=Multiplicative Drift Theorem&lt;br /&gt;
|statement=&lt;br /&gt;
Пусть &amp;lt;tex&amp;gt;X_0, X_1, \ldots&amp;lt;/tex&amp;gt; &amp;amp;ndash; последовательность случайных величин, &amp;lt;tex&amp;gt;X_i \in \{0\} \cup [1, \infty)&amp;lt;/tex&amp;gt; и существует &amp;lt;tex&amp;gt;\delta &amp;gt; 0&amp;lt;/tex&amp;gt;, такое что &amp;lt;tex&amp;gt;\forall x \: : \: E(X_{i + 1} | X_{i} = x) \le \left( 1 - \delta \right)x&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Тогда для &amp;lt;tex&amp;gt;T = \min\{t | X_t = 0\}&amp;lt;/tex&amp;gt;&lt;br /&gt;
# &amp;lt;tex&amp;gt;E(T) \le \delta^{-1} \left(\ln X_0 + 1\right)&amp;lt;/tex&amp;gt;&lt;br /&gt;
# &amp;lt;tex&amp;gt;\forall c &amp;gt; 0 \: : \: P\left(T &amp;gt; \delta^{-1} (\ln X_0 + c)\right) \le e^{-c}&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof=&lt;br /&gt;
&lt;br /&gt;
{{Утверждение&lt;br /&gt;
|id=statement1&lt;br /&gt;
|about=1&lt;br /&gt;
|statement=&amp;lt;tex&amp;gt;E(X_t) \le e^{-\delta t} X_0&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof=&lt;br /&gt;
Здесь и далее &amp;lt;tex&amp;gt;X_0&amp;lt;/tex&amp;gt; &amp;amp;ndash; не случайная величина, а ее оценка сверху.&lt;br /&gt;
&amp;lt;tex&amp;gt;E(X_t) \le \left(1 - \delta\right)^t X_0 \le \left(1 - \delta\right)^t X_0 \le e^{-\delta t} X_0&amp;lt;/tex&amp;gt;&lt;br /&gt;
В последнем неравенстве мы использовали следующий факт: &amp;lt;tex&amp;gt;\forall x \in \mathbf{R} \: : \: 1 + x \le e^{x}&amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
{{Утверждение&lt;br /&gt;
|id=statement2&lt;br /&gt;
|about=2&lt;br /&gt;
|statement=&amp;lt;tex&amp;gt;E(T) = \sum\limits_{i = 0}^{\infty} P(T &amp;gt;= i)&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof=&lt;br /&gt;
Это утверждение достаточно известно в теории вероятностей.&lt;br /&gt;
&amp;lt;tex&amp;gt;E(T) = \sum\limits_{i = 0}^{\infty}iP(T = i) = \sum\limits_{i = 1}^{\infty}\sum\limits_{j = 1}^{i}P(T = i) = \sum\limits_{j = 1}^{\infty}\sum\limits_{i = j}^{\infty}P(T = i) = \sum\limits_{i = 0}^{\infty} P(T &amp;gt;= i)&amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
{{Утверждение&lt;br /&gt;
|id=statement3&lt;br /&gt;
|about=3&lt;br /&gt;
|statement=&amp;lt;tex&amp;gt;\forall K \in \mathbb{N} \: : \: E(T) \le K + \sum\limits_{t=K}^{\infty} E(X_t)&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof=&lt;br /&gt;
Так как из &amp;lt;tex&amp;gt;X_i = 0&amp;lt;/tex&amp;gt; следует &amp;lt;tex&amp;gt;T \le i&amp;lt;/tex&amp;gt;, то &amp;lt;tex&amp;gt;P(T \ge i) \le P(X_i &amp;gt; 0)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Следовательно, по [[#statement2|утверждению(2)]], &amp;lt;tex&amp;gt;E(T) = \sum\limits_{i = 0}^{\infty} P(T &amp;gt;= i) \le \sum\limits_{t = 0}^{\infty} P(X_t &amp;gt; 0)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Для произвольного натурального &amp;lt;tex&amp;gt;K&amp;lt;/tex&amp;gt;:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex&amp;gt;\parbox{0px}{\begin{align*}&lt;br /&gt;
E(T) &amp;amp;\le \sum\limits_{t = 0}^{\infty} P(X_t &amp;gt; 0) \le K + \sum\limits_{t=K}^{\infty} P(X_t &amp;gt; 0) =\\&lt;br /&gt;
&amp;amp;= K + \sum\limits_{t=K}^{\infty} P(X_t &amp;gt;= 1) \le K + \sum\limits_{t=K}^{\infty} E(X_t)&lt;br /&gt;
\end{align*}}&amp;lt;/tex&amp;gt;. &lt;br /&gt;
&lt;br /&gt;
Здесь мы использовали то, что &amp;lt;tex&amp;gt;X_t &amp;gt; 0 \Leftrightarrow X_t &amp;gt;= 1&amp;lt;/tex&amp;gt;, а также неравество Маркова: &amp;lt;tex&amp;gt;P(|X| \ge a) \le \frac{E(|X|)}{a}&amp;lt;/tex&amp;gt;.&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Положим теперь &amp;lt;tex&amp;gt;K = \lceil \delta^{-1} \ln X_0 \rceil = \delta^{-1} \ln X_0 + \epsilon&amp;lt;/tex&amp;gt; для некоторого &amp;lt;tex&amp;gt;0 \le \epsilon &amp;lt; 1 &amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Подставляя выбранное &amp;lt;tex&amp;gt;K&amp;lt;/tex&amp;gt; в [[#statement3|утверждение(3)]] получаем:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex&amp;gt;\parbox{0px}{\begin{align*}&lt;br /&gt;
E(T) &amp;amp;= K + \sum\limits_{t=K}^{\infty} E(X_t) =\\&lt;br /&gt;
&amp;amp;= \left(\delta^{-1} \ln X_0 + \epsilon\right) + \sum\limits_{t=K}^{\infty} E(X_t) \le_{(1)}\\&lt;br /&gt;
&amp;amp;\le_{(1)} \delta^{-1} \ln X_0 + \epsilon + (1 - \delta)^K X_0 \sum\limits_{i = 0}^{\infty}(1 - \delta)^i =_{(2)} \\&lt;br /&gt;
&amp;amp;=_{(2)} \delta^{-1} \ln X_0 + \epsilon + (1 - \delta)^K X_0 \delta^{-1} \le_{(3)} \\&lt;br /&gt;
&amp;amp;\le_{(3)} \delta^{-1} \ln X_0 + \epsilon + (1 - \delta)^\epsilon (1 - \delta)^{\delta^{-1} \ln X_0} X_0 \delta^{-1} =_{(4)}\\&lt;br /&gt;
&amp;amp;\le_{(4)} \delta^{-1} \ln X_0 + \epsilon + (1 - \delta)^\epsilon e^{- \delta (\delta^{-1} \ln X_0)} X_0 \delta^{-1} =_{(5)}\\&lt;br /&gt;
&amp;amp;=_{(5)} \delta^{-1} \ln X_0 + \epsilon + (1 - \delta)^{\epsilon}\delta^{-1} \le_{(6)}\\&lt;br /&gt;
&amp;amp;\le_{(6)} \delta^{-1} (\ln X_0 + 1)&lt;br /&gt;
\end{align*}}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Пояснение:&lt;br /&gt;
# Аналогично [[#statement1|утверждению(1)]].&lt;br /&gt;
# Используем формулу суммы геометрической прогрессии.&lt;br /&gt;
# Подставляем значение &amp;lt;tex&amp;gt;K&amp;lt;/tex&amp;gt;.&lt;br /&gt;
# По [[#statement1|утверждению(1)]].&lt;br /&gt;
# Упрощаем выражение.&lt;br /&gt;
# Находим экстремумы функции &amp;lt;tex&amp;gt;f(\epsilon) = \epsilon + (1 - \delta)^{\epsilon}\delta^{-1}&amp;lt;/tex&amp;gt; на интервале &amp;lt;tex&amp;gt;[0, 1)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
2. Докажем второе утверждение теоремы. Пусть &amp;lt;tex&amp;gt;T_c = \lceil \delta^{-1} (\ln X_0 + c) \rceil&amp;lt;/tex&amp;gt;. Тогда &lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex&amp;gt;\parbox{0px}{\begin{align*}&lt;br /&gt;
P(T &amp;gt; T_c) &amp;amp;\le_{(1)} P(X_{T_c} &amp;gt; 0) \le_{(1)}\\&lt;br /&gt;
&amp;amp;\le_{(1)} E(X_{T_c}) \le_{(2)}\\&lt;br /&gt;
&amp;amp;\le_{(2)} e^{-\delta T_c}X_0 \le_{(3)}\\&lt;br /&gt;
&amp;amp;\le_{(3)} e^{-\delta \left( \delta^{-1}(\ln X_0 + c)\right) } X_0 =_{(4)}\\&lt;br /&gt;
&amp;amp;=_{(4)} e^{-c}&lt;br /&gt;
\end{align*}}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Пояснение:&lt;br /&gt;
# Аналогично [[#statement3|утверждению(3)]]&lt;br /&gt;
# По [[#statement1|утверждению(1)]].&lt;br /&gt;
# Подставляем &amp;lt;tex&amp;gt;T_c&amp;lt;/tex&amp;gt;&lt;br /&gt;
# Упрощаем.&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
= Примеры использования =&lt;br /&gt;
Теорема о дрифте достаточно естественно применяется для эволюционных алгоритмов, оперирующих одной особью. Продемонстрируем это.&lt;br /&gt;
&lt;br /&gt;
Пусть в эволюционном алгоритме проcтранство поиска &amp;lt;tex&amp;gt;S_n&amp;lt;/tex&amp;gt;, а целевая функция &amp;amp;ndash; &amp;lt;tex&amp;gt;f: S_n \rightarrow \mathbb{N}&amp;lt;/tex&amp;gt;.&lt;br /&gt;
Пусть оптимальное значение целевой функции &amp;amp;ndash; &amp;lt;tex&amp;gt;f_{opt}&amp;lt;/tex&amp;gt;&lt;br /&gt;
Положим, что &amp;lt;tex&amp;gt;X_t = |f_{opt} - f(x_t)|&amp;lt;/tex&amp;gt;, где &amp;lt;tex&amp;gt;x_t \in S_n&amp;lt;/tex&amp;gt; &amp;amp;ndash; особь, полученная на шаге номер &amp;lt;tex&amp;gt;t&amp;lt;/tex&amp;gt;. Почти все условия [[#theorem1| теоремы о дрифте]] выполнены, последнее условие (оценка на &amp;lt;tex&amp;gt;E(X_{i+1}|X_i)&amp;lt;/tex&amp;gt;)доказывается для каждой задачи отдельно.&lt;br /&gt;
&lt;br /&gt;
Продемострируем использование теоремы о дрифте для оценки времени нахождения оптимального решения задачи [[Теоретическая оценка времени работы алгоритмов RMHC и (1+1)-ES для задач OneMax и MST#OneMax|OneMax]] при использовании [[Теоретическая оценка времени работы алгоритмов RMHC и (1+1)-ES для задач OneMax и MST#RMHC_.28Random_Mutation_Hill_Climbing.29|RMHC]] и [[Теоретическая оценка времени работы алгоритмов RMHC и (1+1)-ES для задач OneMax и MST#ES_.28Evolution_Strategies.29|(1+1)-ES]] стратегий. Пространство поиска &amp;lt;tex&amp;gt;S_n&amp;lt;/tex&amp;gt; &amp;amp;ndash; множество битовых строк длины &amp;lt;tex&amp;gt;n&amp;lt;/tex&amp;gt;, целевая функция &amp;lt;tex&amp;gt;f(x_1, x_2, \dots , x_n) = OneMax(x_1, x_2, \dots , x_n) = x_1 + x_2, + \dots + x_n &amp;lt;/tex&amp;gt;. В качестве оценки сверху на &amp;lt;tex&amp;gt;X_0&amp;lt;/tex&amp;gt; берем &amp;lt;tex&amp;gt;n&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Ниже приведены примеры оценки ожидаемого значения следующего элемента в зависимости от предыдущего (&amp;lt;tex&amp;gt;E(X_{i+1}|X_i)&amp;lt;/tex&amp;gt;).&lt;br /&gt;
&lt;br /&gt;
== Применение к Random Mutation Hill Climbing ==&lt;br /&gt;
Пусть &amp;lt;tex&amp;gt;X_i = k &amp;gt; 0&amp;lt;/tex&amp;gt;. С вероятностью &amp;lt;tex&amp;gt;(n - k)/n&amp;lt;/tex&amp;gt; будет перевернут единичный бит. Полученное решение будет хуже, чем предыдущее и будет отброшено. С вероятностью &amp;lt;tex&amp;gt;k/n&amp;lt;/tex&amp;gt; будет перевернут нулевой бит. Это приведет к &amp;lt;tex&amp;gt;X_{i + 1} = k - 1&amp;lt;/tex&amp;gt;. В итоге получаем: &amp;lt;tex&amp;gt;E(X_{i + 1} | X_i = k) = \frac{n - k}{n} k + \frac{k}{n} (k - 1) = (1 - \frac{1}{n})k&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Получаем, что &amp;lt;tex&amp;gt;\delta = \frac{1}{n}&amp;lt;/tex&amp;gt;, следовательно &amp;lt;tex&amp;gt;E(T) \le n (\ln n + 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Применение к (1+1)-ES ==&lt;br /&gt;
Пусть &amp;lt;tex&amp;gt;X_i = k &amp;gt; 0&amp;lt;/tex&amp;gt;. Вероятность того, что в результате мутации будет переверут ровно один нулевой бит (и только он) составляет &amp;lt;tex&amp;gt;k(1/n)(1 - 1/n)^{(n-1)} \ge \frac{k}{n}e^{-1}&amp;lt;/tex&amp;gt;. Во всех остальных случаях &amp;lt;tex&amp;gt;X_{i + 1} \le k&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Итог: &amp;lt;tex&amp;gt;E(X_{i + 1} | X_i = k) \le (1-\frac{k}{n}e^{-1}) k + \frac{k}{n}e^{-1} (k - 1) = (1 - \frac{1}{en})k&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Получаем, что &amp;lt;tex&amp;gt;\delta = \frac{1}{en}&amp;lt;/tex&amp;gt;, следовательно &amp;lt;tex&amp;gt;E(T) \le en (\ln n + 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
= Источники =&lt;br /&gt;
# He, J., Yao, X.: Drift analysis and average time complexity of evolutionary algorithms. Artificial Intelligence 127, 57–85 (2001)&lt;br /&gt;
# He, J., Yao, X.: A study of drift analysis for estimating computation time of evolutionary algorithms. Natural Computing 3, 21–35 (2004)&lt;br /&gt;
# Giel, O., Wegener, I.: Evolutionary algorithms and the maximum matching problem. In: Alt, H., Habib, M. (eds.) STACS 2003. LNCS, vol. 2607, pp. 415–426. Springer, Heidelberg (2003)&lt;br /&gt;
# Giel, O., Lehre, P.K.: On the effect of populations in evolutionary multi-objective optimization. In: Proceedings of GECCO 2006, pp. 651–658. ACM, New York (2006)&lt;br /&gt;
# Happ, E., Johannsen, D., Klein, C., Neumann, F.: Rigorous analyses of fitnessproportional selection for optimizing linear functions. In: Proceedings of GECCO 2008, pp. 953–960. ACM, New York (2008)&lt;br /&gt;
# Oliveto, P.S., Witt, C.: Simplified drift analysis for proving lower bounds in evolutionary computation. In: Rudolph, G., Jansen, T., Lucas, S., Poloni, C., Beume, N. (eds.) PPSN 2008. LNCS, vol. 5199, pp. 82–91. Springer, Heidelberg (2008)&lt;br /&gt;
# Neumann, F., Oliveto, P.S., Witt, C.: Theoretical analysis of fitness-proportional selection: landscapes and efficiency. In: Proceedings of GECCO 2009, pp. 835–842. ACM, New York (2009)&lt;br /&gt;
# Doerr, B., Johannsen, D., Winzen, C.: Drift analysis and linear functions revisited. In: Proceedings of CEC 2010. IEEE, Los Alamitos (to appear, 2010)&lt;br /&gt;
# Doerr, B., Johannsen, D., Winzen, C.: Multiplicative drift analysis. In: Proceedings of GECCO 2010. ACM, New York (to appear, 2010)&lt;br /&gt;
# B. Doerr, L.A. Goldberg, Drift analysis with tail bounds, Proceedings of the 11th international conference on Parallel problem solving from nature: Part I, September 11-15, 2010, Kraków, Poland&lt;/div&gt;</summary>
		<author><name>178.67.58.50</name></author>	</entry>

	</feed>