<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
		<id>http://neerc.ifmo.ru/wiki/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=77.222.96.22&amp;*</id>
		<title>Викиконспекты - Вклад участника [ru]</title>
		<link rel="self" type="application/atom+xml" href="http://neerc.ifmo.ru/wiki/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=77.222.96.22&amp;*"/>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A1%D0%BB%D1%83%D0%B6%D0%B5%D0%B1%D0%BD%D0%B0%D1%8F:%D0%92%D0%BA%D0%BB%D0%B0%D0%B4/77.222.96.22"/>
		<updated>2026-06-11T20:17:36Z</updated>
		<subtitle>Вклад участника</subtitle>
		<generator>MediaWiki 1.30.0</generator>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74162</id>
		<title>Участник:Mk17.ru</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74162"/>
				<updated>2020-05-19T11:14:08Z</updated>
		
		<summary type="html">&lt;p&gt;77.222.96.22: /* Вероятность смещения на d единиц вправо или влево */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;__TOC__&lt;br /&gt;
== Определение ==&lt;br /&gt;
&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Случайное блуждание''' (англ. ''Random walk'') {{---}} математическая модель процесса случайных изменений — шагов в дискретные моменты времени. При этом предполагается, что изменение на каждом шаге не зависит от предыдущих и от времени. В силу простоты анализа эта модель часто используется в разных сферах в математике, экономике, физике, но, как правило, такая модель является существенным упрощением реального процесса.&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Случайные блуждания по прямой ==&lt;br /&gt;
&lt;br /&gt;
Представим частицу, которая движется по целым точкам на прямой. Перемещение из одной точки&lt;br /&gt;
в другую происходит через равные промежутки времени. За один шаг частица из точки k с положительной вероятностью p перемещается в точку &amp;lt;tex&amp;gt;k + 1&amp;lt;/tex&amp;gt; и с положительной вероятностью &amp;lt;tex&amp;gt;q = 1 − p&amp;lt;/tex&amp;gt;&lt;br /&gt;
перемещается в точку k − 1. &lt;br /&gt;
Физической системе соответствует цепь Маркова:&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt;\xi_n = \xi_{n-1} + \eta_n = \xi_0 + S_n, \eta_n = \begin{cases} 1 &amp;amp;\text{с вероятностью p}\\-1 &amp;amp;\text{с вероятностью 1 - p}&lt;br /&gt;
 \end{cases}&amp;lt;/tex&amp;gt; &lt;br /&gt;
Заметим, что вернуться в какую-либо точку можно только за четное число шагов.&lt;br /&gt;
&lt;br /&gt;
==Вероятность смещения на d единиц вправо или влево==&lt;br /&gt;
&lt;br /&gt;
Выведем распределение случайной величины &amp;lt;tex&amp;gt;\xi_n&amp;lt;/tex&amp;gt;. Будем считать, что &amp;lt;tex&amp;gt;P(\xi_0 = m) = 1&amp;lt;/tex&amp;gt;. Это отвечает тому, что в начальный момент времени частица достоверно находилась в точке&lt;br /&gt;
&amp;lt;tex&amp;gt;x = m&amp;lt;/tex&amp;gt; (здесь &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt; — фиксированное число) и затем начала случайно блуждать в соответствии с описанными выше правилами. Пусть &amp;lt;tex&amp;gt;d&amp;lt;/tex&amp;gt; — смещение частицы за &amp;lt;tex&amp;gt;n&amp;lt;/tex&amp;gt; шагов.&lt;br /&gt;
Найдём &amp;lt;tex&amp;gt;P(\xi_n = m + d)&amp;lt;/tex&amp;gt; для каждого &amp;lt;tex&amp;gt;d ∈ Z&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Справедливо очевидное равенство:  &lt;br /&gt;
*&amp;lt;tex&amp;gt;P(\xi_n = m + d) = P(\xi_n = m + d | \xi_0 = m)&amp;lt;/tex&amp;gt;, если &amp;lt;tex&amp;gt;P(\xi_0 = m) = 1.&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Представление через условную вероятность удобно, если нам необходимо явно указать, где находилась частица в начальный момент времени.&lt;br /&gt;
&lt;br /&gt;
Наша физическая модель с математической точки зрения в точности отвечает&lt;br /&gt;
схеме независимых испытаний Бернулли с двумя исходами —- прыжком вправо, который мы будем называть успехом, и прыжком вправо (неудачей). В рамках этой&lt;br /&gt;
математической модели все вероятности рассчитываются на основании распределения Бернулли. Пусть частица сделала &amp;lt;tex&amp;gt;n&amp;lt;/tex&amp;gt; прыжков. Вероятность того, что среди&lt;br /&gt;
этих прыжков будет ровно &amp;lt;tex&amp;gt;k&amp;lt;/tex&amp;gt; прыжков вправо (или, что то же самое, &amp;lt;tex&amp;gt;n−k&amp;lt;/tex&amp;gt; прыжков&lt;br /&gt;
влево) задаётся формулой:&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt;P = {C_{n}^k} p^k q^{n−k}, k = 0, 1, . . . , n.&amp;lt;/tex&amp;gt;     (1)&lt;br /&gt;
&lt;br /&gt;
Смещение частицы и число прыжков влево и вправо связаны простейшим уравнением&lt;br /&gt;
*&amp;lt;tex&amp;gt;d = 1 · k + (−1) · (n − k) = 2k − n \quad&amp;lt;/tex&amp;gt;       (2)&lt;br /&gt;
&lt;br /&gt;
откуда &amp;lt;tex&amp;gt;k = (n + d)/2&amp;lt;/tex&amp;gt;. Понятно, что, поскольку частица сделала ровно n прыжков,&lt;br /&gt;
число прыжков вправо должно быть целым числом в интервале &amp;lt;tex&amp;gt;[0, n]&amp;lt;/tex&amp;gt;, другими словами, &amp;lt;tex&amp;gt;P(\xi_n = m + d) = 0,&amp;lt;/tex&amp;gt; если &amp;lt;tex&amp;gt;k = (n + d)/2 ∈ \{ / 0, 1, . . . , n\}&amp;lt;/tex&amp;gt;. Если же указанное&lt;br /&gt;
ограничение выполнено, то в рамках нашей модели блужданий мы можем воспользоваться распределением Бернулли (1):&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt; P(\xi_n = m + d) = {C_{n}^k} p^k q^{n−k}, \quad k = \frac{(n + d)}{2} &amp;lt;/tex&amp;gt;, при обязательном условии &amp;lt;tex&amp;gt;k ∈ {0, 1, . . . , n}.&amp;lt;/tex&amp;gt; (3)&lt;br /&gt;
&lt;br /&gt;
Замечание. Ограничение &amp;lt;tex&amp;gt;0 \leq k \leq n &amp;lt;/tex&amp;gt; по формуле (2) влечёт &amp;lt;tex&amp;gt;|d| \leq n&amp;lt;/tex&amp;gt;. Это&lt;br /&gt;
можно понять и без расчётов: если &amp;lt;tex&amp;gt;|d| &amp;gt; n&amp;lt;/tex&amp;gt;, то частица «не успевает» дойти из начальной в конечную точку за n шагов, даже двигаясь строго в одном направлении&lt;br /&gt;
(налево при &amp;lt;tex&amp;gt;d &amp;lt; 0&amp;lt;/tex&amp;gt; и направо при &amp;lt;tex&amp;gt;d &amp;gt; 0&amp;lt;/tex&amp;gt;). Ограничение на значения &amp;lt;tex&amp;gt;k&amp;lt;/tex&amp;gt; согласовано&lt;br /&gt;
и с (3): биномиальный коэффициент &amp;lt;tex&amp;gt;{C_{n}^k}&amp;lt;/tex&amp;gt; не определён при &amp;lt;tex&amp;gt; k /∈ {0, 1, . . . , n}&amp;lt;/tex&amp;gt;. Мы&lt;br /&gt;
можем даже считать формулу (3) верной при любом k, если положим по определению C&lt;br /&gt;
k&lt;br /&gt;
n = 0 для k /∈ {0, 1, . . . , n}. Число шагов n и смещение d должны иметь как&lt;br /&gt;
целые числа одну чётность. Вероятность (2.4) не зависит от начального положения m и определяется только числом шагов n (номером члена последовательности)&lt;br /&gt;
и смещением d.&lt;br /&gt;
&lt;br /&gt;
== Примеры ==&lt;br /&gt;
=== Энтропия честной монеты ===&lt;br /&gt;
Рассмотрим [[Вероятностное пространство, элементарный исход, событие|вероятностное пространство]] {{---}} честная монета. &lt;br /&gt;
Найдем для нее энтропию:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot \log_2 \dfrac{1}{2}} = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot (-1)} = 1&amp;lt;/tex&amp;gt;&lt;br /&gt;
Это означает что после броска честной монеты мы получим информацию в размере &amp;lt;tex&amp;gt;1&amp;lt;/tex&amp;gt; бит, уменьшив степень неопределенности вдвое.&lt;br /&gt;
&lt;br /&gt;
=== Энтропия нечестной монеты ===&lt;br /&gt;
Найдем энтропию для [[Вероятностное пространство, элементарный исход, событие|вероятностного пространства]] нечестная монета с [[Схема Бернулли| распределением Бернулли]] &amp;lt;tex&amp;gt;\{0,2; 0,8\}&amp;lt;/tex&amp;gt;:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -0.2\log_2(0.2)-0.8\log_2(0.8) \approx 0.722 &amp;lt; 1 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Ограниченность энтропии ==&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt;0 \leqslant  H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
1) Докажем первую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
Так как &amp;lt;tex&amp;gt; p_i\in[0,\;1]&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\log_2\dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;. Таким образом &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(p_1, p_2, \dots, p_n) = \sum\limits_{i=1}^{n} p_i\log_2 \dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
2) Докажем вторую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; f(x)=\log_2x &amp;lt;/tex&amp;gt; {{---}} выпуклая вверх функция, &amp;lt;tex&amp;gt; p_1,p_2,\ldots,p_n&amp;gt;0&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \sum \limits_{i=1}^{n} p_i = 1 &amp;lt;/tex&amp;gt;, тогда для нее выполняется неравенство Йенсена:&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; \sum\limits_{i=1}^{n} p_i f(\dfrac{1}{p_i}) \leqslant  f(\sum\limits_{i=1}^{n} (p_i \cdot\dfrac{1}{p_i})) &amp;lt;/tex&amp;gt;&lt;br /&gt;
Таким образом получаем, что &amp;lt;tex&amp;gt; H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
Тогда из теоремы и доказанной выше леммы следует, что для n исходов энтропия максимальна, если они все равновероятны.&lt;br /&gt;
== Условная и взаимная энтропия ==&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Условная энтропия''' (англ. ''conditional entropy'') {{---}} определяет количество остающейся энтропии (то есть, остающейся неопределенности) события &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; после того, как становится известным результат события &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;. Она называется ''энтропия &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; при условии &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;'', и обозначается &amp;lt;tex&amp;gt;H(A|B)&amp;lt;/tex&amp;gt;&lt;br /&gt;
}} &lt;br /&gt;
&amp;lt;tex&amp;gt;H(A|B)= - \sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Взаимная энтропия''' (англ. ''joint entropy'') {{---}} энтропия объединения двух событий &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;.  &lt;br /&gt;
}}&lt;br /&gt;
&amp;lt;tex&amp;gt; H(A \cap B) = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Утверждение&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt; H(A \cap B) = H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof= По формуле условной вероятности &amp;lt;tex dpi=&amp;quot;130&amp;quot;&amp;gt; p(a_j|b_i)=\dfrac{p(a_j \cap b_i)}{p(b_i)} &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(A|B)=-\sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt; &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= - \sum\limits_{i=1}^{m}p(b_i) \sum\limits_{j=1}^{n} \dfrac{p(a_j \cap b_i)}{p(b_i)}\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = &amp;lt;/tex&amp;gt; &lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) + \sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= H(A \cap B) +\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) = &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)\sum\limits_{j=1}^{n} p(a_j \cap b_i) = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)p(b_i) = &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(A \cap B) - H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Таким образом получаем, что: &amp;lt;tex&amp;gt; H(A \cap B)= H(A|B)+H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Аналогично: &amp;lt;tex&amp;gt;H(B \cap A)= H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Из двух полученных равенств следует, что &amp;lt;tex&amp;gt; H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== См. также ==&lt;br /&gt;
*[[Вероятностное пространство, элементарный исход, событие|Вероятностное пространство, элементарный исход, событие]]&lt;br /&gt;
*[[Условная вероятность|Условная вероятность]]&lt;br /&gt;
&lt;br /&gt;
== Источники информации ==&lt;br /&gt;
* Конспект лекций по теории случайных процессов А.А. Соловьев&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Random_walk &amp;quot;Википедия - Random_walk&amp;quot;]&lt;br /&gt;
* [https://www.youtube.com/watch?v=6wUD_gp5WeE &amp;quot;Лекция MIT Random Walks&amp;quot;] &lt;br /&gt;
[[Категория:Дискретная математика и алгоритмы]]&lt;br /&gt;
&lt;br /&gt;
[[Категория: Теория вероятности ]]&lt;/div&gt;</summary>
		<author><name>77.222.96.22</name></author>	</entry>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74161</id>
		<title>Участник:Mk17.ru</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74161"/>
				<updated>2020-05-19T11:05:32Z</updated>
		
		<summary type="html">&lt;p&gt;77.222.96.22: /* Вероятность смещения на d единиц вправо или влево */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;__TOC__&lt;br /&gt;
== Определение ==&lt;br /&gt;
&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Случайное блуждание''' (англ. ''Random walk'') {{---}} математическая модель процесса случайных изменений — шагов в дискретные моменты времени. При этом предполагается, что изменение на каждом шаге не зависит от предыдущих и от времени. В силу простоты анализа эта модель часто используется в разных сферах в математике, экономике, физике, но, как правило, такая модель является существенным упрощением реального процесса.&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Случайные блуждания по прямой ==&lt;br /&gt;
&lt;br /&gt;
Представим частицу, которая движется по целым точкам на прямой. Перемещение из одной точки&lt;br /&gt;
в другую происходит через равные промежутки времени. За один шаг частица из точки k с положительной вероятностью p перемещается в точку &amp;lt;tex&amp;gt;k + 1&amp;lt;/tex&amp;gt; и с положительной вероятностью &amp;lt;tex&amp;gt;q = 1 − p&amp;lt;/tex&amp;gt;&lt;br /&gt;
перемещается в точку k − 1. &lt;br /&gt;
Физической системе соответствует цепь Маркова:&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt;\xi_n = \xi_{n-1} + \eta_n = \xi_0 + S_n, \eta_n = \begin{cases} 1 &amp;amp;\text{с вероятностью p}\\-1 &amp;amp;\text{с вероятностью 1 - p}&lt;br /&gt;
 \end{cases}&amp;lt;/tex&amp;gt; &lt;br /&gt;
Заметим, что вернуться в какую-либо точку можно только за четное число шагов.&lt;br /&gt;
&lt;br /&gt;
==Вероятность смещения на d единиц вправо или влево==&lt;br /&gt;
&lt;br /&gt;
Выведем распределение случайной величины &amp;lt;tex&amp;gt;\xi_n&amp;lt;/tex&amp;gt;. Будем считать, что &amp;lt;tex&amp;gt;P(\xi_0 = m) = 1&amp;lt;/tex&amp;gt;. Это отвечает тому, что в начальный момент времени частица достоверно находилась в точке&lt;br /&gt;
&amp;lt;tex&amp;gt;x = m&amp;lt;/tex&amp;gt; (здесь &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt; — фиксированное число) и затем начала случайно блуждать в соответствии с описанными выше правилами. Пусть &amp;lt;tex&amp;gt;d&amp;lt;/tex&amp;gt; — смещение частицы за &amp;lt;tex&amp;gt;n&amp;lt;/tex&amp;gt; шагов.&lt;br /&gt;
Найдём &amp;lt;tex&amp;gt;P(\xi_n = m + d)&amp;lt;/tex&amp;gt; для каждого &amp;lt;tex&amp;gt;d ∈ Z&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Справедливо очевидное равенство:  &lt;br /&gt;
*&amp;lt;tex&amp;gt;P(\xi_n = m + d) = P(\xi_n = m + d | \xi_0 = m)&amp;lt;/tex&amp;gt;, если &amp;lt;tex&amp;gt;P(\xi_0 = m) = 1.&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Представление через условную вероятность удобно, если нам необходимо явно указать, где находилась частица в начальный момент времени.&lt;br /&gt;
&lt;br /&gt;
Наша физическая модель с математической точки зрения в точности отвечает&lt;br /&gt;
схеме независимых испытаний Бернулли с двумя исходами —- прыжком вправо, который мы будем называть успехом, и прыжком вправо (неудачей). В рамках этой&lt;br /&gt;
математической модели все вероятности рассчитываются на основании распределения Бернулли. Пусть частица сделала &amp;lt;tex&amp;gt;n&amp;lt;/tex&amp;gt; прыжков. Вероятность того, что среди&lt;br /&gt;
этих прыжков будет ровно &amp;lt;tex&amp;gt;k&amp;lt;/tex&amp;gt; прыжков вправо (или, что то же самое, &amp;lt;tex&amp;gt;n−k&amp;lt;/tex&amp;gt; прыжков&lt;br /&gt;
влево) задаётся формулой:&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt;P = {C_{n}^k} p^k q^{n−k}, k = 0, 1, . . . , n.&amp;lt;/tex&amp;gt;     (1)&lt;br /&gt;
&lt;br /&gt;
Смещение частицы и число прыжков влево и вправо связаны простейшим уравнением&lt;br /&gt;
*&amp;lt;tex&amp;gt;d = 1 · k + (−1) · (n − k) = 2k − n \quad&amp;lt;/tex&amp;gt;       (2)&lt;br /&gt;
&lt;br /&gt;
откуда &amp;lt;tex&amp;gt;k = (n + d)/2&amp;lt;/tex&amp;gt;. Понятно, что, поскольку частица сделала ровно n прыжков,&lt;br /&gt;
число прыжков вправо должно быть целым числом в интервале &amp;lt;tex&amp;gt;[0, n]&amp;lt;/tex&amp;gt;, другими словами, &amp;lt;tex&amp;gt;P(\xi_n = m + d) = 0,&amp;lt;/tex&amp;gt; если &amp;lt;tex&amp;gt;k = (n + d)/2 ∈ \{ / 0, 1, . . . , n\}&amp;lt;/tex&amp;gt;. Если же указанное&lt;br /&gt;
ограничение выполнено, то в рамках нашей модели блужданий мы можем воспользоваться распределением Бернулли (1):&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt; P(\xi_n = m + d) = {C_{n}^k} p^k q^{n−k}, \quad k = (n + d) / 2 &amp;lt;/tex&amp;gt;, при обязательном условии &amp;lt;tex&amp;gt;k ∈ {0, 1, . . . , n}.&amp;lt;/tex&amp;gt; (3)&lt;br /&gt;
&lt;br /&gt;
Замечание. Ограничение &amp;lt;tex&amp;gt;0 &amp;lt;= k &amp;lt;= n &amp;lt;/tex&amp;gt; по формуле (2) влечёт &amp;lt;tex&amp;gt;|d| &amp;lt;= n&amp;lt;/tex&amp;gt;. Это&lt;br /&gt;
можно понять и без расчётов: если |d| &amp;gt; n, то частица «не успевает» дойти из начальной в конечную точку за n шагов, даже двигаясь строго в одном направлении&lt;br /&gt;
(налево при d &amp;lt; 0 и направо при d &amp;gt; 0). Ограничение на значения k согласовано&lt;br /&gt;
и с (2.4): биномиальный коэффициент C&lt;br /&gt;
k&lt;br /&gt;
n не определён при k /∈ {0, 1, . . . , n}. Мы&lt;br /&gt;
можем даже считать формулу (2.4) верной при любом k, если положим по определению C&lt;br /&gt;
k&lt;br /&gt;
n = 0 для k /∈ {0, 1, . . . , n}. Число шагов n и смещение d должны иметь как&lt;br /&gt;
целые числа одну чётность. Вероятность (2.4) не зависит от начального положения m и определяется только числом шагов n (номером члена последовательности)&lt;br /&gt;
и смещением d.&lt;br /&gt;
&lt;br /&gt;
== Примеры ==&lt;br /&gt;
=== Энтропия честной монеты ===&lt;br /&gt;
Рассмотрим [[Вероятностное пространство, элементарный исход, событие|вероятностное пространство]] {{---}} честная монета. &lt;br /&gt;
Найдем для нее энтропию:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot \log_2 \dfrac{1}{2}} = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot (-1)} = 1&amp;lt;/tex&amp;gt;&lt;br /&gt;
Это означает что после броска честной монеты мы получим информацию в размере &amp;lt;tex&amp;gt;1&amp;lt;/tex&amp;gt; бит, уменьшив степень неопределенности вдвое.&lt;br /&gt;
&lt;br /&gt;
=== Энтропия нечестной монеты ===&lt;br /&gt;
Найдем энтропию для [[Вероятностное пространство, элементарный исход, событие|вероятностного пространства]] нечестная монета с [[Схема Бернулли| распределением Бернулли]] &amp;lt;tex&amp;gt;\{0,2; 0,8\}&amp;lt;/tex&amp;gt;:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -0.2\log_2(0.2)-0.8\log_2(0.8) \approx 0.722 &amp;lt; 1 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Ограниченность энтропии ==&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt;0 \leqslant  H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
1) Докажем первую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
Так как &amp;lt;tex&amp;gt; p_i\in[0,\;1]&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\log_2\dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;. Таким образом &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(p_1, p_2, \dots, p_n) = \sum\limits_{i=1}^{n} p_i\log_2 \dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
2) Докажем вторую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; f(x)=\log_2x &amp;lt;/tex&amp;gt; {{---}} выпуклая вверх функция, &amp;lt;tex&amp;gt; p_1,p_2,\ldots,p_n&amp;gt;0&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \sum \limits_{i=1}^{n} p_i = 1 &amp;lt;/tex&amp;gt;, тогда для нее выполняется неравенство Йенсена:&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; \sum\limits_{i=1}^{n} p_i f(\dfrac{1}{p_i}) \leqslant  f(\sum\limits_{i=1}^{n} (p_i \cdot\dfrac{1}{p_i})) &amp;lt;/tex&amp;gt;&lt;br /&gt;
Таким образом получаем, что &amp;lt;tex&amp;gt; H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
Тогда из теоремы и доказанной выше леммы следует, что для n исходов энтропия максимальна, если они все равновероятны.&lt;br /&gt;
== Условная и взаимная энтропия ==&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Условная энтропия''' (англ. ''conditional entropy'') {{---}} определяет количество остающейся энтропии (то есть, остающейся неопределенности) события &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; после того, как становится известным результат события &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;. Она называется ''энтропия &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; при условии &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;'', и обозначается &amp;lt;tex&amp;gt;H(A|B)&amp;lt;/tex&amp;gt;&lt;br /&gt;
}} &lt;br /&gt;
&amp;lt;tex&amp;gt;H(A|B)= - \sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Взаимная энтропия''' (англ. ''joint entropy'') {{---}} энтропия объединения двух событий &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;.  &lt;br /&gt;
}}&lt;br /&gt;
&amp;lt;tex&amp;gt; H(A \cap B) = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Утверждение&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt; H(A \cap B) = H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof= По формуле условной вероятности &amp;lt;tex dpi=&amp;quot;130&amp;quot;&amp;gt; p(a_j|b_i)=\dfrac{p(a_j \cap b_i)}{p(b_i)} &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(A|B)=-\sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt; &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= - \sum\limits_{i=1}^{m}p(b_i) \sum\limits_{j=1}^{n} \dfrac{p(a_j \cap b_i)}{p(b_i)}\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = &amp;lt;/tex&amp;gt; &lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) + \sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= H(A \cap B) +\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) = &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)\sum\limits_{j=1}^{n} p(a_j \cap b_i) = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)p(b_i) = &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(A \cap B) - H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Таким образом получаем, что: &amp;lt;tex&amp;gt; H(A \cap B)= H(A|B)+H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Аналогично: &amp;lt;tex&amp;gt;H(B \cap A)= H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Из двух полученных равенств следует, что &amp;lt;tex&amp;gt; H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== См. также ==&lt;br /&gt;
*[[Вероятностное пространство, элементарный исход, событие|Вероятностное пространство, элементарный исход, событие]]&lt;br /&gt;
*[[Условная вероятность|Условная вероятность]]&lt;br /&gt;
&lt;br /&gt;
== Источники информации ==&lt;br /&gt;
* Конспект лекций по теории случайных процессов А.А. Соловьев&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Random_walk &amp;quot;Википедия - Random_walk&amp;quot;]&lt;br /&gt;
* [https://www.youtube.com/watch?v=6wUD_gp5WeE &amp;quot;Лекция MIT Random Walks&amp;quot;] &lt;br /&gt;
[[Категория:Дискретная математика и алгоритмы]]&lt;br /&gt;
&lt;br /&gt;
[[Категория: Теория вероятности ]]&lt;/div&gt;</summary>
		<author><name>77.222.96.22</name></author>	</entry>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74160</id>
		<title>Участник:Mk17.ru</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74160"/>
				<updated>2020-05-19T11:02:07Z</updated>
		
		<summary type="html">&lt;p&gt;77.222.96.22: /* Вероятность смещения на d единиц вправо или влево */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;__TOC__&lt;br /&gt;
== Определение ==&lt;br /&gt;
&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Случайное блуждание''' (англ. ''Random walk'') {{---}} математическая модель процесса случайных изменений — шагов в дискретные моменты времени. При этом предполагается, что изменение на каждом шаге не зависит от предыдущих и от времени. В силу простоты анализа эта модель часто используется в разных сферах в математике, экономике, физике, но, как правило, такая модель является существенным упрощением реального процесса.&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Случайные блуждания по прямой ==&lt;br /&gt;
&lt;br /&gt;
Представим частицу, которая движется по целым точкам на прямой. Перемещение из одной точки&lt;br /&gt;
в другую происходит через равные промежутки времени. За один шаг частица из точки k с положительной вероятностью p перемещается в точку &amp;lt;tex&amp;gt;k + 1&amp;lt;/tex&amp;gt; и с положительной вероятностью &amp;lt;tex&amp;gt;q = 1 − p&amp;lt;/tex&amp;gt;&lt;br /&gt;
перемещается в точку k − 1. &lt;br /&gt;
Физической системе соответствует цепь Маркова:&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt;\xi_n = \xi_{n-1} + \eta_n = \xi_0 + S_n, \eta_n = \begin{cases} 1 &amp;amp;\text{с вероятностью p}\\-1 &amp;amp;\text{с вероятностью 1 - p}&lt;br /&gt;
 \end{cases}&amp;lt;/tex&amp;gt; &lt;br /&gt;
Заметим, что вернуться в какую-либо точку можно только за четное число шагов.&lt;br /&gt;
&lt;br /&gt;
==Вероятность смещения на d единиц вправо или влево==&lt;br /&gt;
&lt;br /&gt;
Выведем распределение случайной величины &amp;lt;tex&amp;gt;\xi_n&amp;lt;/tex&amp;gt;. Будем считать, что &amp;lt;tex&amp;gt;P(\xi_0 = m) = 1&amp;lt;/tex&amp;gt;. Это отвечает тому, что в начальный момент времени частица достоверно находилась в точке&lt;br /&gt;
&amp;lt;tex&amp;gt;x = m&amp;lt;/tex&amp;gt; (здесь &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt; — фиксированное число) и затем начала случайно блуждать в соответствии с описанными выше правилами. Пусть &amp;lt;tex&amp;gt;d&amp;lt;/tex&amp;gt; — смещение частицы за &amp;lt;tex&amp;gt;n&amp;lt;/tex&amp;gt; шагов.&lt;br /&gt;
Найдём &amp;lt;tex&amp;gt;P(\xi_n = m + d)&amp;lt;/tex&amp;gt; для каждого &amp;lt;tex&amp;gt;d ∈ Z&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Справедливо очевидное равенство:  &lt;br /&gt;
*&amp;lt;tex&amp;gt;P(\xi_n = m + d) = P(\xi_n = m + d | \xi_0 = m)&amp;lt;/tex&amp;gt;, если &amp;lt;tex&amp;gt;P(\xi_0 = m) = 1.&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Представление через условную вероятность удобно, если нам необходимо явно указать, где находилась частица в начальный момент времени.&lt;br /&gt;
&lt;br /&gt;
Наша физическая модель с математической точки зрения в точности отвечает&lt;br /&gt;
схеме независимых испытаний Бернулли с двумя исходами —- прыжком вправо, который мы будем называть успехом, и прыжком вправо (неудачей). В рамках этой&lt;br /&gt;
математической модели все вероятности рассчитываются на основании распределения Бернулли. Пусть частица сделала &amp;lt;tex&amp;gt;n&amp;lt;/tex&amp;gt; прыжков. Вероятность того, что среди&lt;br /&gt;
этих прыжков будет ровно &amp;lt;tex&amp;gt;k&amp;lt;/tex&amp;gt; прыжков вправо (или, что то же самое, &amp;lt;tex&amp;gt;n−k&amp;lt;/tex&amp;gt; прыжков&lt;br /&gt;
влево) задаётся формулой:&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt;P = {C_{n}^k} p^k q^{n−k}, k = 0, 1, . . . , n.&amp;lt;/tex&amp;gt;     (1)&lt;br /&gt;
&lt;br /&gt;
Смещение частицы и число прыжков влево и вправо связаны простейшим уравнением&lt;br /&gt;
*&amp;lt;tex&amp;gt;d = 1 · k + (−1) · (n − k) = 2k − n \quad&amp;lt;/tex&amp;gt;       (2)&lt;br /&gt;
&lt;br /&gt;
откуда &amp;lt;tex&amp;gt;k = (n + d)/2&amp;lt;/tex&amp;gt;. Понятно, что, поскольку частица сделала ровно n прыжков,&lt;br /&gt;
число прыжков вправо должно быть целым числом в интервале &amp;lt;tex&amp;gt;[0, n]&amp;lt;/tex&amp;gt;, другими словами, &amp;lt;tex&amp;gt;P(\xi_n = m + d) = 0,&amp;lt;/tex&amp;gt; если &amp;lt;tex&amp;gt;k = (n + d)/2 ∈ \{ / 0, 1, . . . , n\}&amp;lt;/tex&amp;gt;. Если же указанное&lt;br /&gt;
ограничение выполнено, то в рамках нашей модели блужданий мы можем воспользоваться распределением Бернулли (1):&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt; P(\xi_n = m + d) = {C_{n}^k} p^k q^{n−k}, \quad k = (n + d) / 2 &amp;lt;/tex&amp;gt;, при обязательном условии &amp;lt;tex&amp;gt;k ∈ {0, 1, . . . , n}.&amp;lt;/tex&amp;gt; (3)&lt;br /&gt;
&lt;br /&gt;
== Примеры ==&lt;br /&gt;
=== Энтропия честной монеты ===&lt;br /&gt;
Рассмотрим [[Вероятностное пространство, элементарный исход, событие|вероятностное пространство]] {{---}} честная монета. &lt;br /&gt;
Найдем для нее энтропию:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot \log_2 \dfrac{1}{2}} = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot (-1)} = 1&amp;lt;/tex&amp;gt;&lt;br /&gt;
Это означает что после броска честной монеты мы получим информацию в размере &amp;lt;tex&amp;gt;1&amp;lt;/tex&amp;gt; бит, уменьшив степень неопределенности вдвое.&lt;br /&gt;
&lt;br /&gt;
=== Энтропия нечестной монеты ===&lt;br /&gt;
Найдем энтропию для [[Вероятностное пространство, элементарный исход, событие|вероятностного пространства]] нечестная монета с [[Схема Бернулли| распределением Бернулли]] &amp;lt;tex&amp;gt;\{0,2; 0,8\}&amp;lt;/tex&amp;gt;:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -0.2\log_2(0.2)-0.8\log_2(0.8) \approx 0.722 &amp;lt; 1 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Ограниченность энтропии ==&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt;0 \leqslant  H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
1) Докажем первую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
Так как &amp;lt;tex&amp;gt; p_i\in[0,\;1]&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\log_2\dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;. Таким образом &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(p_1, p_2, \dots, p_n) = \sum\limits_{i=1}^{n} p_i\log_2 \dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
2) Докажем вторую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; f(x)=\log_2x &amp;lt;/tex&amp;gt; {{---}} выпуклая вверх функция, &amp;lt;tex&amp;gt; p_1,p_2,\ldots,p_n&amp;gt;0&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \sum \limits_{i=1}^{n} p_i = 1 &amp;lt;/tex&amp;gt;, тогда для нее выполняется неравенство Йенсена:&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; \sum\limits_{i=1}^{n} p_i f(\dfrac{1}{p_i}) \leqslant  f(\sum\limits_{i=1}^{n} (p_i \cdot\dfrac{1}{p_i})) &amp;lt;/tex&amp;gt;&lt;br /&gt;
Таким образом получаем, что &amp;lt;tex&amp;gt; H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
Тогда из теоремы и доказанной выше леммы следует, что для n исходов энтропия максимальна, если они все равновероятны.&lt;br /&gt;
== Условная и взаимная энтропия ==&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Условная энтропия''' (англ. ''conditional entropy'') {{---}} определяет количество остающейся энтропии (то есть, остающейся неопределенности) события &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; после того, как становится известным результат события &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;. Она называется ''энтропия &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; при условии &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;'', и обозначается &amp;lt;tex&amp;gt;H(A|B)&amp;lt;/tex&amp;gt;&lt;br /&gt;
}} &lt;br /&gt;
&amp;lt;tex&amp;gt;H(A|B)= - \sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Взаимная энтропия''' (англ. ''joint entropy'') {{---}} энтропия объединения двух событий &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;.  &lt;br /&gt;
}}&lt;br /&gt;
&amp;lt;tex&amp;gt; H(A \cap B) = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Утверждение&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt; H(A \cap B) = H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof= По формуле условной вероятности &amp;lt;tex dpi=&amp;quot;130&amp;quot;&amp;gt; p(a_j|b_i)=\dfrac{p(a_j \cap b_i)}{p(b_i)} &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(A|B)=-\sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt; &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= - \sum\limits_{i=1}^{m}p(b_i) \sum\limits_{j=1}^{n} \dfrac{p(a_j \cap b_i)}{p(b_i)}\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = &amp;lt;/tex&amp;gt; &lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) + \sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= H(A \cap B) +\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) = &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)\sum\limits_{j=1}^{n} p(a_j \cap b_i) = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)p(b_i) = &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(A \cap B) - H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Таким образом получаем, что: &amp;lt;tex&amp;gt; H(A \cap B)= H(A|B)+H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Аналогично: &amp;lt;tex&amp;gt;H(B \cap A)= H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Из двух полученных равенств следует, что &amp;lt;tex&amp;gt; H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== См. также ==&lt;br /&gt;
*[[Вероятностное пространство, элементарный исход, событие|Вероятностное пространство, элементарный исход, событие]]&lt;br /&gt;
*[[Условная вероятность|Условная вероятность]]&lt;br /&gt;
&lt;br /&gt;
== Источники информации ==&lt;br /&gt;
* Конспект лекций по теории случайных процессов А.А. Соловьев&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Random_walk &amp;quot;Википедия - Random_walk&amp;quot;]&lt;br /&gt;
* [https://www.youtube.com/watch?v=6wUD_gp5WeE &amp;quot;Лекция MIT Random Walks&amp;quot;] &lt;br /&gt;
[[Категория:Дискретная математика и алгоритмы]]&lt;br /&gt;
&lt;br /&gt;
[[Категория: Теория вероятности ]]&lt;/div&gt;</summary>
		<author><name>77.222.96.22</name></author>	</entry>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74159</id>
		<title>Участник:Mk17.ru</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74159"/>
				<updated>2020-05-19T11:01:24Z</updated>
		
		<summary type="html">&lt;p&gt;77.222.96.22: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;__TOC__&lt;br /&gt;
== Определение ==&lt;br /&gt;
&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Случайное блуждание''' (англ. ''Random walk'') {{---}} математическая модель процесса случайных изменений — шагов в дискретные моменты времени. При этом предполагается, что изменение на каждом шаге не зависит от предыдущих и от времени. В силу простоты анализа эта модель часто используется в разных сферах в математике, экономике, физике, но, как правило, такая модель является существенным упрощением реального процесса.&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Случайные блуждания по прямой ==&lt;br /&gt;
&lt;br /&gt;
Представим частицу, которая движется по целым точкам на прямой. Перемещение из одной точки&lt;br /&gt;
в другую происходит через равные промежутки времени. За один шаг частица из точки k с положительной вероятностью p перемещается в точку &amp;lt;tex&amp;gt;k + 1&amp;lt;/tex&amp;gt; и с положительной вероятностью &amp;lt;tex&amp;gt;q = 1 − p&amp;lt;/tex&amp;gt;&lt;br /&gt;
перемещается в точку k − 1. &lt;br /&gt;
Физической системе соответствует цепь Маркова:&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt;\xi_n = \xi_{n-1} + \eta_n = \xi_0 + S_n, \eta_n = \begin{cases} 1 &amp;amp;\text{с вероятностью p}\\-1 &amp;amp;\text{с вероятностью 1 - p}&lt;br /&gt;
 \end{cases}&amp;lt;/tex&amp;gt; &lt;br /&gt;
Заметим, что вернуться в какую-либо точку можно только за четное число шагов.&lt;br /&gt;
&lt;br /&gt;
==Вероятность смещения на d единиц вправо или влево==&lt;br /&gt;
&lt;br /&gt;
Выведем распределение случайной величины &amp;lt;tex&amp;gt;\xi_n&amp;lt;/tex&amp;gt;. Будем считать, что &amp;lt;tex&amp;gt;P(\xi_0 = m) = 1&amp;lt;/tex&amp;gt;. Это отвечает тому, что в начальный момент времени частица достоверно находилась в точке&lt;br /&gt;
&amp;lt;tex&amp;gt;x = m&amp;lt;/tex&amp;gt; (здесь &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt; — фиксированное число) и затем начала случайно блуждать в соответствии с описанными выше правилами. Пусть &amp;lt;tex&amp;gt;d&amp;lt;/tex&amp;gt; — смещение частицы за &amp;lt;tex&amp;gt;n&amp;lt;/tex&amp;gt; шагов.&lt;br /&gt;
Найдём &amp;lt;tex&amp;gt;P(\xi_n = m + d)&amp;lt;/tex&amp;gt; для каждого &amp;lt;tex&amp;gt;d ∈ Z&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Справедливо очевидное равенство:  &lt;br /&gt;
*&amp;lt;tex&amp;gt;P(\xi_n = m + d) = P(\xi_n = m + d | \xi_0 = m)&amp;lt;/tex&amp;gt;, если &amp;lt;tex&amp;gt;P(\xi_0 = m) = 1.&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Представление через условную вероятность удобно, если нам необходимо явно указать, где находилась частица в начальный момент времени.&lt;br /&gt;
&lt;br /&gt;
Наша физическая модель с математической точки зрения в точности отвечает&lt;br /&gt;
схеме независимых испытаний Бернулли с двумя исходами —- прыжком вправо, который мы будем называть успехом, и прыжком вправо (неудачей). В рамках этой&lt;br /&gt;
математической модели все вероятности рассчитываются на основании распределения Бернулли. Пусть частица сделала &amp;lt;tex&amp;gt;n&amp;lt;/tex&amp;gt; прыжков. Вероятность того, что среди&lt;br /&gt;
этих прыжков будет ровно &amp;lt;tex&amp;gt;k&amp;lt;/tex&amp;gt; прыжков вправо (или, что то же самое, &amp;lt;tex&amp;gt;n−k&amp;lt;/tex&amp;gt; прыжков&lt;br /&gt;
влево) задаётся формулой:&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt;P = {C_{n}^k} p^k q^{n−k}, k = 0, 1, . . . , n.&amp;lt;/tex&amp;gt;     (1)&lt;br /&gt;
&lt;br /&gt;
Смещение частицы и число прыжков влево и вправо связаны простейшим уравнением&lt;br /&gt;
*&amp;lt;tex&amp;gt;d = 1 · k + (−1) · (n − k) = 2k − n \quad&amp;lt;/tex&amp;gt;       (2)&lt;br /&gt;
&lt;br /&gt;
откуда &amp;lt;tex&amp;gt;k = (n + d)/2&amp;lt;/tex&amp;gt;. Понятно, что, поскольку частица сделала ровно n прыжков,&lt;br /&gt;
число прыжков вправо должно быть целым числом в интервале &amp;lt;tex&amp;gt;[0, n]&amp;lt;/tex&amp;gt;, другими словами, &amp;lt;tex&amp;gt;P(\xi_n = m + d) = 0,&amp;lt;/tex&amp;gt; если &amp;lt;tex&amp;gt;k = (n + d)/2 ∈ \{ / 0, 1, . . . , n\}&amp;lt;/tex&amp;gt;. Если же указанное&lt;br /&gt;
ограничение выполнено, то в рамках нашей модели блужданий мы можем воспользоваться распределением Бернулли (1):&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt; P(\xi_n = m + d) = {C_{n}^k} p^k q^{n−k}, \quad k = (n + d) / 2 &amp;lt;/tex&amp;gt;  при обязательном условии &amp;lt;tex&amp;gt;k ∈ {0, 1, . . . , n}.&amp;lt;/tex&amp;gt; (3)&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Примеры ==&lt;br /&gt;
=== Энтропия честной монеты ===&lt;br /&gt;
Рассмотрим [[Вероятностное пространство, элементарный исход, событие|вероятностное пространство]] {{---}} честная монета. &lt;br /&gt;
Найдем для нее энтропию:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot \log_2 \dfrac{1}{2}} = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot (-1)} = 1&amp;lt;/tex&amp;gt;&lt;br /&gt;
Это означает что после броска честной монеты мы получим информацию в размере &amp;lt;tex&amp;gt;1&amp;lt;/tex&amp;gt; бит, уменьшив степень неопределенности вдвое.&lt;br /&gt;
&lt;br /&gt;
=== Энтропия нечестной монеты ===&lt;br /&gt;
Найдем энтропию для [[Вероятностное пространство, элементарный исход, событие|вероятностного пространства]] нечестная монета с [[Схема Бернулли| распределением Бернулли]] &amp;lt;tex&amp;gt;\{0,2; 0,8\}&amp;lt;/tex&amp;gt;:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -0.2\log_2(0.2)-0.8\log_2(0.8) \approx 0.722 &amp;lt; 1 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Ограниченность энтропии ==&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt;0 \leqslant  H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
1) Докажем первую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
Так как &amp;lt;tex&amp;gt; p_i\in[0,\;1]&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\log_2\dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;. Таким образом &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(p_1, p_2, \dots, p_n) = \sum\limits_{i=1}^{n} p_i\log_2 \dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
2) Докажем вторую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; f(x)=\log_2x &amp;lt;/tex&amp;gt; {{---}} выпуклая вверх функция, &amp;lt;tex&amp;gt; p_1,p_2,\ldots,p_n&amp;gt;0&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \sum \limits_{i=1}^{n} p_i = 1 &amp;lt;/tex&amp;gt;, тогда для нее выполняется неравенство Йенсена:&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; \sum\limits_{i=1}^{n} p_i f(\dfrac{1}{p_i}) \leqslant  f(\sum\limits_{i=1}^{n} (p_i \cdot\dfrac{1}{p_i})) &amp;lt;/tex&amp;gt;&lt;br /&gt;
Таким образом получаем, что &amp;lt;tex&amp;gt; H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
Тогда из теоремы и доказанной выше леммы следует, что для n исходов энтропия максимальна, если они все равновероятны.&lt;br /&gt;
== Условная и взаимная энтропия ==&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Условная энтропия''' (англ. ''conditional entropy'') {{---}} определяет количество остающейся энтропии (то есть, остающейся неопределенности) события &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; после того, как становится известным результат события &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;. Она называется ''энтропия &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; при условии &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;'', и обозначается &amp;lt;tex&amp;gt;H(A|B)&amp;lt;/tex&amp;gt;&lt;br /&gt;
}} &lt;br /&gt;
&amp;lt;tex&amp;gt;H(A|B)= - \sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Взаимная энтропия''' (англ. ''joint entropy'') {{---}} энтропия объединения двух событий &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;.  &lt;br /&gt;
}}&lt;br /&gt;
&amp;lt;tex&amp;gt; H(A \cap B) = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Утверждение&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt; H(A \cap B) = H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof= По формуле условной вероятности &amp;lt;tex dpi=&amp;quot;130&amp;quot;&amp;gt; p(a_j|b_i)=\dfrac{p(a_j \cap b_i)}{p(b_i)} &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(A|B)=-\sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt; &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= - \sum\limits_{i=1}^{m}p(b_i) \sum\limits_{j=1}^{n} \dfrac{p(a_j \cap b_i)}{p(b_i)}\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = &amp;lt;/tex&amp;gt; &lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) + \sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= H(A \cap B) +\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) = &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)\sum\limits_{j=1}^{n} p(a_j \cap b_i) = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)p(b_i) = &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(A \cap B) - H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Таким образом получаем, что: &amp;lt;tex&amp;gt; H(A \cap B)= H(A|B)+H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Аналогично: &amp;lt;tex&amp;gt;H(B \cap A)= H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Из двух полученных равенств следует, что &amp;lt;tex&amp;gt; H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== См. также ==&lt;br /&gt;
*[[Вероятностное пространство, элементарный исход, событие|Вероятностное пространство, элементарный исход, событие]]&lt;br /&gt;
*[[Условная вероятность|Условная вероятность]]&lt;br /&gt;
&lt;br /&gt;
== Источники информации ==&lt;br /&gt;
* Конспект лекций по теории случайных процессов А.А. Соловьев&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Random_walk &amp;quot;Википедия - Random_walk&amp;quot;]&lt;br /&gt;
* [https://www.youtube.com/watch?v=6wUD_gp5WeE &amp;quot;Лекция MIT Random Walks&amp;quot;] &lt;br /&gt;
[[Категория:Дискретная математика и алгоритмы]]&lt;br /&gt;
&lt;br /&gt;
[[Категория: Теория вероятности ]]&lt;/div&gt;</summary>
		<author><name>77.222.96.22</name></author>	</entry>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74158</id>
		<title>Участник:Mk17.ru</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74158"/>
				<updated>2020-05-18T22:31:00Z</updated>
		
		<summary type="html">&lt;p&gt;77.222.96.22: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;__TOC__&lt;br /&gt;
== Определение ==&lt;br /&gt;
&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Случайное блуждание''' (англ. ''Random walk'') {{---}} математическая модель процесса случайных изменений — шагов в дискретные моменты времени. При этом предполагается, что изменение на каждом шаге не зависит от предыдущих и от времени. В силу простоты анализа эта модель часто используется в разных сферах в математике, экономике, физике, но, как правило, такая модель является существенным упрощением реального процесса.&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Случайные блуждания по прямой ==&lt;br /&gt;
&lt;br /&gt;
Представим частицу, которая движется по целым точкам на прямой. Перемещение из одной точки&lt;br /&gt;
в другую происходит через равные промежутки времени. За один шаг частица из точки k с положительной вероятностью p перемещается в точку &amp;lt;tex&amp;gt;k + 1&amp;lt;/tex&amp;gt; и с положительной вероятностью &amp;lt;tex&amp;gt;q = 1 − p&amp;lt;/tex&amp;gt;&lt;br /&gt;
перемещается в точку k − 1. &lt;br /&gt;
Физической системе соответствует цепь Маркова:&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt;\xi_n = \xi_{n-1} + \eta_n = \xi_0 + S_n, \eta_n = \begin{cases} 1 &amp;amp;\text{с вероятностью p}\\-1 &amp;amp;\text{с вероятностью 1 - p}&lt;br /&gt;
 \end{cases}&amp;lt;/tex&amp;gt; &lt;br /&gt;
Заметим, что вернуться в какую-либо точку можно только за четное число шагов.&lt;br /&gt;
&lt;br /&gt;
==Вероятность смещения на d единиц вправо или влево==&lt;br /&gt;
&lt;br /&gt;
Выведем распределение случайной величины &amp;lt;tex&amp;gt;\xi_n&amp;lt;/tex&amp;gt;. Будем считать, что &amp;lt;tex&amp;gt;P(\xi_0 = m) = 1&amp;lt;/tex&amp;gt;. Это отвечает тому, что в начальный момент времени частица достоверно находилась в точке&lt;br /&gt;
&amp;lt;tex&amp;gt;x = m&amp;lt;/tex&amp;gt; (здесь &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt; — фиксированное число) и затем начала случайно блуждать в соответствии с описанными выше правилами. Пусть &amp;lt;tex&amp;gt;d&amp;lt;/tex&amp;gt; — смещение частицы за &amp;lt;tex&amp;gt;n&amp;lt;/tex&amp;gt; шагов.&lt;br /&gt;
Найдём &amp;lt;tex&amp;gt;P(\xi_n = m + d)&amp;lt;/tex&amp;gt; для каждого &amp;lt;tex&amp;gt;d ∈ Z&amp;lt;/tex&amp;gt;.&lt;br /&gt;
{{Лемма&lt;br /&gt;
|statement = &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(n) = H(\dfrac{1}{n}, \dfrac{1}{n}, \dots, \dfrac{1}{n}) = -k \log_2 \dfrac{1}{n} = k \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
Будем рассматривать для &amp;lt;tex&amp;gt;k=1&amp;lt;/tex&amp;gt; (бит).&lt;br /&gt;
&lt;br /&gt;
Рассмотрим функцию &amp;lt;tex&amp;gt;g(mn)&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex&amp;gt;g(mn)=g(m)+ \sum\limits_{i=1}^{m} \dfrac{1}{m} g(n) = g(m)+g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Пусть: &amp;lt;tex&amp;gt;g(2)=1 \quad&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex&amp;gt;g(2^t)=t&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \quad g(n^t)=t \cdot g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Рассмотрим такое &amp;lt;tex&amp;gt; i &amp;lt;/tex&amp;gt;, что &amp;lt;tex&amp;gt;2^i \leqslant  n^t &amp;lt; 2^{i+1}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Можно заметить, что если &amp;lt;tex&amp;gt; i=[ \log_2 n^t ] &amp;lt;/tex&amp;gt;, то неравенство останется верным.&lt;br /&gt;
&lt;br /&gt;
По предыдущим рассуждениям получаем, что:&lt;br /&gt;
:&amp;lt;tex&amp;gt;g(2^i) \leqslant g(n^t) &amp;lt; g(2^{i+1})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex&amp;gt; i \leqslant t \cdot g(n) &amp;lt;i+1 \quad \quad &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Делим неравенство на &amp;lt;tex&amp;gt;t&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{i}{t} \leqslant g(n) &amp;lt; \dfrac{i+1}{t}&amp;lt;/tex&amp;gt;, то есть &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{[ \log_2 n^t ]}{t} \leqslant g(n) &amp;lt; \dfrac{[ \log_2 n^t ]+1}{t}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Отсюда ясно, что если &amp;lt;tex&amp;gt; t\rightarrow \infty&amp;lt;/tex&amp;gt;, то получаем &amp;lt;tex&amp;gt;g(n) = \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -k \sum\limits_{i=1}^{n} p_i\log_2p_i = k \sum\limits_{i=1}^{n} p_i\log_2\dfrac{1}{p_i}&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Теперь рассмотрим функцию &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Приведем дроби внутри функции к одному знаменателю, получаем: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n}) = H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Далее по свойству энтропии и доказанной лемме:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(b)= H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) + \sum\limits_{i=1}^{n} \dfrac{x_i}{b} g(x_i)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) = \log_2b - \sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2x_i = -\sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2 \dfrac{x_i}{b}&amp;lt;/tex&amp;gt;&lt;br /&gt;
При &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; p_i = \dfrac{x_i}{b} &amp;lt;/tex&amp;gt; получаем, что &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = \sum\limits_{i=1}^{n} p_i \log_2 \dfrac{1}{p_i}&amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Примеры ==&lt;br /&gt;
=== Энтропия честной монеты ===&lt;br /&gt;
Рассмотрим [[Вероятностное пространство, элементарный исход, событие|вероятностное пространство]] {{---}} честная монета. &lt;br /&gt;
Найдем для нее энтропию:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot \log_2 \dfrac{1}{2}} = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot (-1)} = 1&amp;lt;/tex&amp;gt;&lt;br /&gt;
Это означает что после броска честной монеты мы получим информацию в размере &amp;lt;tex&amp;gt;1&amp;lt;/tex&amp;gt; бит, уменьшив степень неопределенности вдвое.&lt;br /&gt;
&lt;br /&gt;
=== Энтропия нечестной монеты ===&lt;br /&gt;
Найдем энтропию для [[Вероятностное пространство, элементарный исход, событие|вероятностного пространства]] нечестная монета с [[Схема Бернулли| распределением Бернулли]] &amp;lt;tex&amp;gt;\{0,2; 0,8\}&amp;lt;/tex&amp;gt;:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -0.2\log_2(0.2)-0.8\log_2(0.8) \approx 0.722 &amp;lt; 1 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Ограниченность энтропии ==&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt;0 \leqslant  H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
1) Докажем первую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
Так как &amp;lt;tex&amp;gt; p_i\in[0,\;1]&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\log_2\dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;. Таким образом &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(p_1, p_2, \dots, p_n) = \sum\limits_{i=1}^{n} p_i\log_2 \dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
2) Докажем вторую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; f(x)=\log_2x &amp;lt;/tex&amp;gt; {{---}} выпуклая вверх функция, &amp;lt;tex&amp;gt; p_1,p_2,\ldots,p_n&amp;gt;0&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \sum \limits_{i=1}^{n} p_i = 1 &amp;lt;/tex&amp;gt;, тогда для нее выполняется неравенство Йенсена:&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; \sum\limits_{i=1}^{n} p_i f(\dfrac{1}{p_i}) \leqslant  f(\sum\limits_{i=1}^{n} (p_i \cdot\dfrac{1}{p_i})) &amp;lt;/tex&amp;gt;&lt;br /&gt;
Таким образом получаем, что &amp;lt;tex&amp;gt; H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
Тогда из теоремы и доказанной выше леммы следует, что для n исходов энтропия максимальна, если они все равновероятны.&lt;br /&gt;
== Условная и взаимная энтропия ==&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Условная энтропия''' (англ. ''conditional entropy'') {{---}} определяет количество остающейся энтропии (то есть, остающейся неопределенности) события &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; после того, как становится известным результат события &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;. Она называется ''энтропия &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; при условии &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;'', и обозначается &amp;lt;tex&amp;gt;H(A|B)&amp;lt;/tex&amp;gt;&lt;br /&gt;
}} &lt;br /&gt;
&amp;lt;tex&amp;gt;H(A|B)= - \sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Взаимная энтропия''' (англ. ''joint entropy'') {{---}} энтропия объединения двух событий &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;.  &lt;br /&gt;
}}&lt;br /&gt;
&amp;lt;tex&amp;gt; H(A \cap B) = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Утверждение&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt; H(A \cap B) = H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof= По формуле условной вероятности &amp;lt;tex dpi=&amp;quot;130&amp;quot;&amp;gt; p(a_j|b_i)=\dfrac{p(a_j \cap b_i)}{p(b_i)} &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(A|B)=-\sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt; &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= - \sum\limits_{i=1}^{m}p(b_i) \sum\limits_{j=1}^{n} \dfrac{p(a_j \cap b_i)}{p(b_i)}\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = &amp;lt;/tex&amp;gt; &lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) + \sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= H(A \cap B) +\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) = &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)\sum\limits_{j=1}^{n} p(a_j \cap b_i) = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)p(b_i) = &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(A \cap B) - H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Таким образом получаем, что: &amp;lt;tex&amp;gt; H(A \cap B)= H(A|B)+H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Аналогично: &amp;lt;tex&amp;gt;H(B \cap A)= H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Из двух полученных равенств следует, что &amp;lt;tex&amp;gt; H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== См. также ==&lt;br /&gt;
*[[Вероятностное пространство, элементарный исход, событие|Вероятностное пространство, элементарный исход, событие]]&lt;br /&gt;
*[[Условная вероятность|Условная вероятность]]&lt;br /&gt;
&lt;br /&gt;
== Источники информации ==&lt;br /&gt;
* Конспект лекций по теории случайных процессов А.А. Соловьев&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Random_walk &amp;quot;Википедия - Random_walk&amp;quot;]&lt;br /&gt;
* [https://www.youtube.com/watch?v=6wUD_gp5WeE &amp;quot;Лекция MIT Random Walks&amp;quot;] &lt;br /&gt;
[[Категория:Дискретная математика и алгоритмы]]&lt;br /&gt;
&lt;br /&gt;
[[Категория: Теория вероятности ]]&lt;/div&gt;</summary>
		<author><name>77.222.96.22</name></author>	</entry>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74157</id>
		<title>Участник:Mk17.ru</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74157"/>
				<updated>2020-05-18T22:30:16Z</updated>
		
		<summary type="html">&lt;p&gt;77.222.96.22: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;__TOC__&lt;br /&gt;
== Определение ==&lt;br /&gt;
&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Случайное блуждание''' (англ. ''Random walk'') {{---}} математическая модель процесса случайных изменений — шагов в дискретные моменты времени. При этом предполагается, что изменение на каждом шаге не зависит от предыдущих и от времени. В силу простоты анализа эта модель часто используется в разных сферах в математике, экономике, физике, но, как правило, такая модель является существенным упрощением реального процесса.&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Случайные блуждания по прямой ==&lt;br /&gt;
&lt;br /&gt;
Представим частицу, которая движется по целым точкам на прямой. Перемещение из одной точки&lt;br /&gt;
в другую происходит через равные промежутки времени. За один шаг частица из точки k с положительной вероятностью p перемещается в точку &amp;lt;tex&amp;gt;k + 1&amp;lt;/tex&amp;gt; и с положительной вероятностью &amp;lt;tex&amp;gt;q = 1 − p&amp;lt;/tex&amp;gt;&lt;br /&gt;
перемещается в точку k − 1. &lt;br /&gt;
Физической системе соответствует цепь Маркова:&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt;\xi_n = \xi_{n-1} + \eta_n = \xi_0 + S_n, \eta_n = \begin{cases} 1 &amp;amp;\text{с вероятностью p}\\-1 &amp;amp;\text{с вероятностью 1 - p}&lt;br /&gt;
 \end{cases}&amp;lt;/tex&amp;gt; &lt;br /&gt;
Заметим, что вернуться в какую-либо точку можно только за четное число шагов.&lt;br /&gt;
&lt;br /&gt;
==Вероятность смещения на d единиц вправо или влево==&lt;br /&gt;
&lt;br /&gt;
Выведем распределение случайной величины &amp;lt;tex&amp;gt;\xi_n&amp;lt;/tex&amp;gt;. Будем считать, что &amp;lt;tex&amp;gt;P(\xi_0 = m) = 1&amp;lt;/tex&amp;gt;. Это отвечает тому, что в начальный момент времени частица достоверно находилась в точке&lt;br /&gt;
&amp;lt;tex&amp;gt;x = m&amp;lt;/tex&amp;gt; (здесь &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt; — фиксированное число) и затем начала случайно блуждать в соответствии с описанными выше правилами. Пусть d — смещение частицы за n шагов.&lt;br /&gt;
Найдём &amp;lt;tex&amp;gt;P(\xi_n = m + d)&amp;lt;/tex&amp;gt; для каждого &amp;lt;tex&amp;gt;d ∈ Z&amp;lt;/tex&amp;gt;.&lt;br /&gt;
{{Лемма&lt;br /&gt;
|statement = &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(n) = H(\dfrac{1}{n}, \dfrac{1}{n}, \dots, \dfrac{1}{n}) = -k \log_2 \dfrac{1}{n} = k \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
Будем рассматривать для &amp;lt;tex&amp;gt;k=1&amp;lt;/tex&amp;gt; (бит).&lt;br /&gt;
&lt;br /&gt;
Рассмотрим функцию &amp;lt;tex&amp;gt;g(mn)&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex&amp;gt;g(mn)=g(m)+ \sum\limits_{i=1}^{m} \dfrac{1}{m} g(n) = g(m)+g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Пусть: &amp;lt;tex&amp;gt;g(2)=1 \quad&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex&amp;gt;g(2^t)=t&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \quad g(n^t)=t \cdot g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Рассмотрим такое &amp;lt;tex&amp;gt; i &amp;lt;/tex&amp;gt;, что &amp;lt;tex&amp;gt;2^i \leqslant  n^t &amp;lt; 2^{i+1}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Можно заметить, что если &amp;lt;tex&amp;gt; i=[ \log_2 n^t ] &amp;lt;/tex&amp;gt;, то неравенство останется верным.&lt;br /&gt;
&lt;br /&gt;
По предыдущим рассуждениям получаем, что:&lt;br /&gt;
:&amp;lt;tex&amp;gt;g(2^i) \leqslant g(n^t) &amp;lt; g(2^{i+1})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex&amp;gt; i \leqslant t \cdot g(n) &amp;lt;i+1 \quad \quad &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Делим неравенство на &amp;lt;tex&amp;gt;t&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{i}{t} \leqslant g(n) &amp;lt; \dfrac{i+1}{t}&amp;lt;/tex&amp;gt;, то есть &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{[ \log_2 n^t ]}{t} \leqslant g(n) &amp;lt; \dfrac{[ \log_2 n^t ]+1}{t}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Отсюда ясно, что если &amp;lt;tex&amp;gt; t\rightarrow \infty&amp;lt;/tex&amp;gt;, то получаем &amp;lt;tex&amp;gt;g(n) = \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -k \sum\limits_{i=1}^{n} p_i\log_2p_i = k \sum\limits_{i=1}^{n} p_i\log_2\dfrac{1}{p_i}&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Теперь рассмотрим функцию &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Приведем дроби внутри функции к одному знаменателю, получаем: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n}) = H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Далее по свойству энтропии и доказанной лемме:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(b)= H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) + \sum\limits_{i=1}^{n} \dfrac{x_i}{b} g(x_i)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) = \log_2b - \sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2x_i = -\sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2 \dfrac{x_i}{b}&amp;lt;/tex&amp;gt;&lt;br /&gt;
При &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; p_i = \dfrac{x_i}{b} &amp;lt;/tex&amp;gt; получаем, что &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = \sum\limits_{i=1}^{n} p_i \log_2 \dfrac{1}{p_i}&amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Примеры ==&lt;br /&gt;
=== Энтропия честной монеты ===&lt;br /&gt;
Рассмотрим [[Вероятностное пространство, элементарный исход, событие|вероятностное пространство]] {{---}} честная монета. &lt;br /&gt;
Найдем для нее энтропию:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot \log_2 \dfrac{1}{2}} = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot (-1)} = 1&amp;lt;/tex&amp;gt;&lt;br /&gt;
Это означает что после броска честной монеты мы получим информацию в размере &amp;lt;tex&amp;gt;1&amp;lt;/tex&amp;gt; бит, уменьшив степень неопределенности вдвое.&lt;br /&gt;
&lt;br /&gt;
=== Энтропия нечестной монеты ===&lt;br /&gt;
Найдем энтропию для [[Вероятностное пространство, элементарный исход, событие|вероятностного пространства]] нечестная монета с [[Схема Бернулли| распределением Бернулли]] &amp;lt;tex&amp;gt;\{0,2; 0,8\}&amp;lt;/tex&amp;gt;:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -0.2\log_2(0.2)-0.8\log_2(0.8) \approx 0.722 &amp;lt; 1 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Ограниченность энтропии ==&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt;0 \leqslant  H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
1) Докажем первую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
Так как &amp;lt;tex&amp;gt; p_i\in[0,\;1]&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\log_2\dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;. Таким образом &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(p_1, p_2, \dots, p_n) = \sum\limits_{i=1}^{n} p_i\log_2 \dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
2) Докажем вторую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; f(x)=\log_2x &amp;lt;/tex&amp;gt; {{---}} выпуклая вверх функция, &amp;lt;tex&amp;gt; p_1,p_2,\ldots,p_n&amp;gt;0&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \sum \limits_{i=1}^{n} p_i = 1 &amp;lt;/tex&amp;gt;, тогда для нее выполняется неравенство Йенсена:&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; \sum\limits_{i=1}^{n} p_i f(\dfrac{1}{p_i}) \leqslant  f(\sum\limits_{i=1}^{n} (p_i \cdot\dfrac{1}{p_i})) &amp;lt;/tex&amp;gt;&lt;br /&gt;
Таким образом получаем, что &amp;lt;tex&amp;gt; H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
Тогда из теоремы и доказанной выше леммы следует, что для n исходов энтропия максимальна, если они все равновероятны.&lt;br /&gt;
== Условная и взаимная энтропия ==&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Условная энтропия''' (англ. ''conditional entropy'') {{---}} определяет количество остающейся энтропии (то есть, остающейся неопределенности) события &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; после того, как становится известным результат события &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;. Она называется ''энтропия &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; при условии &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;'', и обозначается &amp;lt;tex&amp;gt;H(A|B)&amp;lt;/tex&amp;gt;&lt;br /&gt;
}} &lt;br /&gt;
&amp;lt;tex&amp;gt;H(A|B)= - \sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Взаимная энтропия''' (англ. ''joint entropy'') {{---}} энтропия объединения двух событий &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;.  &lt;br /&gt;
}}&lt;br /&gt;
&amp;lt;tex&amp;gt; H(A \cap B) = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Утверждение&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt; H(A \cap B) = H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof= По формуле условной вероятности &amp;lt;tex dpi=&amp;quot;130&amp;quot;&amp;gt; p(a_j|b_i)=\dfrac{p(a_j \cap b_i)}{p(b_i)} &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(A|B)=-\sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt; &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= - \sum\limits_{i=1}^{m}p(b_i) \sum\limits_{j=1}^{n} \dfrac{p(a_j \cap b_i)}{p(b_i)}\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = &amp;lt;/tex&amp;gt; &lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) + \sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= H(A \cap B) +\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) = &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)\sum\limits_{j=1}^{n} p(a_j \cap b_i) = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)p(b_i) = &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(A \cap B) - H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Таким образом получаем, что: &amp;lt;tex&amp;gt; H(A \cap B)= H(A|B)+H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Аналогично: &amp;lt;tex&amp;gt;H(B \cap A)= H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Из двух полученных равенств следует, что &amp;lt;tex&amp;gt; H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== См. также ==&lt;br /&gt;
*[[Вероятностное пространство, элементарный исход, событие|Вероятностное пространство, элементарный исход, событие]]&lt;br /&gt;
*[[Условная вероятность|Условная вероятность]]&lt;br /&gt;
&lt;br /&gt;
== Источники информации ==&lt;br /&gt;
* Конспект лекций по теории случайных процессов А.А. Соловьев&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Random_walk &amp;quot;Википедия - Random_walk&amp;quot;]&lt;br /&gt;
* [https://www.youtube.com/watch?v=6wUD_gp5WeE &amp;quot;Лекция MIT Random Walks&amp;quot;] &lt;br /&gt;
[[Категория:Дискретная математика и алгоритмы]]&lt;br /&gt;
&lt;br /&gt;
[[Категория: Теория вероятности ]]&lt;/div&gt;</summary>
		<author><name>77.222.96.22</name></author>	</entry>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74156</id>
		<title>Участник:Mk17.ru</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74156"/>
				<updated>2020-05-18T22:25:40Z</updated>
		
		<summary type="html">&lt;p&gt;77.222.96.22: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;__TOC__&lt;br /&gt;
== Определение ==&lt;br /&gt;
&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Случайное блуждание''' (англ. ''Random walk'') {{---}} математическая модель процесса случайных изменений — шагов в дискретные моменты времени. При этом предполагается, что изменение на каждом шаге не зависит от предыдущих и от времени. В силу простоты анализа эта модель часто используется в разных сферах в математике, экономике, физике, но, как правило, такая модель является существенным упрощением реального процесса.&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Случайные блуждания по прямой ==&lt;br /&gt;
&lt;br /&gt;
Представим частицу, которая движется по целым точкам на прямой. Перемещение из одной точки&lt;br /&gt;
в другую происходит через равные промежутки времени. За один шаг частица из точки k с положительной вероятностью p перемещается в точку &amp;lt;tex&amp;gt;k + 1&amp;lt;/tex&amp;gt; и с положительной вероятностью &amp;lt;tex&amp;gt;q = 1 − p&amp;lt;/tex&amp;gt;&lt;br /&gt;
перемещается в точку k − 1. &lt;br /&gt;
Физической системе соответствует цепь Маркова:&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt;\xi_n = \xi_{n-1} + \eta_n = \xi_0 + S_n, \eta_n = \begin{cases} 1 &amp;amp;\text{с вероятностью p}\\-1 &amp;amp;\text{с вероятностью 1 - p}&lt;br /&gt;
 \end{cases}&amp;lt;/tex&amp;gt; &lt;br /&gt;
Заметим, что вернуться в какую-либо точку можно только за четное число шагов.&lt;br /&gt;
&lt;br /&gt;
==Вероятность смещения на d единиц вправо или влево==&lt;br /&gt;
&lt;br /&gt;
Выведем распределение случайной величины ξn. Будем считать, что P(ξ0 = m) = 1. Это отвечает тому, что в начальный момент времени частица достоверно находилась в точке&lt;br /&gt;
x = m (здесь m — фиксированное число) и затем начала случайно блуждать в соответствии с описанными выше правилами. Пусть d — смещение частицы за n шагов.&lt;br /&gt;
Найдём P(ξn = m + d) для каждого d ∈ Z.&lt;br /&gt;
{{Лемма&lt;br /&gt;
|statement = &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(n) = H(\dfrac{1}{n}, \dfrac{1}{n}, \dots, \dfrac{1}{n}) = -k \log_2 \dfrac{1}{n} = k \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
Будем рассматривать для &amp;lt;tex&amp;gt;k=1&amp;lt;/tex&amp;gt; (бит).&lt;br /&gt;
&lt;br /&gt;
Рассмотрим функцию &amp;lt;tex&amp;gt;g(mn)&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex&amp;gt;g(mn)=g(m)+ \sum\limits_{i=1}^{m} \dfrac{1}{m} g(n) = g(m)+g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Пусть: &amp;lt;tex&amp;gt;g(2)=1 \quad&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex&amp;gt;g(2^t)=t&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \quad g(n^t)=t \cdot g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Рассмотрим такое &amp;lt;tex&amp;gt; i &amp;lt;/tex&amp;gt;, что &amp;lt;tex&amp;gt;2^i \leqslant  n^t &amp;lt; 2^{i+1}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Можно заметить, что если &amp;lt;tex&amp;gt; i=[ \log_2 n^t ] &amp;lt;/tex&amp;gt;, то неравенство останется верным.&lt;br /&gt;
&lt;br /&gt;
По предыдущим рассуждениям получаем, что:&lt;br /&gt;
:&amp;lt;tex&amp;gt;g(2^i) \leqslant g(n^t) &amp;lt; g(2^{i+1})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex&amp;gt; i \leqslant t \cdot g(n) &amp;lt;i+1 \quad \quad &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Делим неравенство на &amp;lt;tex&amp;gt;t&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{i}{t} \leqslant g(n) &amp;lt; \dfrac{i+1}{t}&amp;lt;/tex&amp;gt;, то есть &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{[ \log_2 n^t ]}{t} \leqslant g(n) &amp;lt; \dfrac{[ \log_2 n^t ]+1}{t}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Отсюда ясно, что если &amp;lt;tex&amp;gt; t\rightarrow \infty&amp;lt;/tex&amp;gt;, то получаем &amp;lt;tex&amp;gt;g(n) = \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -k \sum\limits_{i=1}^{n} p_i\log_2p_i = k \sum\limits_{i=1}^{n} p_i\log_2\dfrac{1}{p_i}&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Теперь рассмотрим функцию &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Приведем дроби внутри функции к одному знаменателю, получаем: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n}) = H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Далее по свойству энтропии и доказанной лемме:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(b)= H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) + \sum\limits_{i=1}^{n} \dfrac{x_i}{b} g(x_i)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) = \log_2b - \sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2x_i = -\sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2 \dfrac{x_i}{b}&amp;lt;/tex&amp;gt;&lt;br /&gt;
При &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; p_i = \dfrac{x_i}{b} &amp;lt;/tex&amp;gt; получаем, что &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = \sum\limits_{i=1}^{n} p_i \log_2 \dfrac{1}{p_i}&amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Примеры ==&lt;br /&gt;
=== Энтропия честной монеты ===&lt;br /&gt;
Рассмотрим [[Вероятностное пространство, элементарный исход, событие|вероятностное пространство]] {{---}} честная монета. &lt;br /&gt;
Найдем для нее энтропию:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot \log_2 \dfrac{1}{2}} = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot (-1)} = 1&amp;lt;/tex&amp;gt;&lt;br /&gt;
Это означает что после броска честной монеты мы получим информацию в размере &amp;lt;tex&amp;gt;1&amp;lt;/tex&amp;gt; бит, уменьшив степень неопределенности вдвое.&lt;br /&gt;
&lt;br /&gt;
=== Энтропия нечестной монеты ===&lt;br /&gt;
Найдем энтропию для [[Вероятностное пространство, элементарный исход, событие|вероятностного пространства]] нечестная монета с [[Схема Бернулли| распределением Бернулли]] &amp;lt;tex&amp;gt;\{0,2; 0,8\}&amp;lt;/tex&amp;gt;:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -0.2\log_2(0.2)-0.8\log_2(0.8) \approx 0.722 &amp;lt; 1 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Ограниченность энтропии ==&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt;0 \leqslant  H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
1) Докажем первую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
Так как &amp;lt;tex&amp;gt; p_i\in[0,\;1]&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\log_2\dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;. Таким образом &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(p_1, p_2, \dots, p_n) = \sum\limits_{i=1}^{n} p_i\log_2 \dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
2) Докажем вторую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; f(x)=\log_2x &amp;lt;/tex&amp;gt; {{---}} выпуклая вверх функция, &amp;lt;tex&amp;gt; p_1,p_2,\ldots,p_n&amp;gt;0&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \sum \limits_{i=1}^{n} p_i = 1 &amp;lt;/tex&amp;gt;, тогда для нее выполняется неравенство Йенсена:&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; \sum\limits_{i=1}^{n} p_i f(\dfrac{1}{p_i}) \leqslant  f(\sum\limits_{i=1}^{n} (p_i \cdot\dfrac{1}{p_i})) &amp;lt;/tex&amp;gt;&lt;br /&gt;
Таким образом получаем, что &amp;lt;tex&amp;gt; H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
Тогда из теоремы и доказанной выше леммы следует, что для n исходов энтропия максимальна, если они все равновероятны.&lt;br /&gt;
== Условная и взаимная энтропия ==&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Условная энтропия''' (англ. ''conditional entropy'') {{---}} определяет количество остающейся энтропии (то есть, остающейся неопределенности) события &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; после того, как становится известным результат события &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;. Она называется ''энтропия &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; при условии &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;'', и обозначается &amp;lt;tex&amp;gt;H(A|B)&amp;lt;/tex&amp;gt;&lt;br /&gt;
}} &lt;br /&gt;
&amp;lt;tex&amp;gt;H(A|B)= - \sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Взаимная энтропия''' (англ. ''joint entropy'') {{---}} энтропия объединения двух событий &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;.  &lt;br /&gt;
}}&lt;br /&gt;
&amp;lt;tex&amp;gt; H(A \cap B) = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Утверждение&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt; H(A \cap B) = H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof= По формуле условной вероятности &amp;lt;tex dpi=&amp;quot;130&amp;quot;&amp;gt; p(a_j|b_i)=\dfrac{p(a_j \cap b_i)}{p(b_i)} &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(A|B)=-\sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt; &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= - \sum\limits_{i=1}^{m}p(b_i) \sum\limits_{j=1}^{n} \dfrac{p(a_j \cap b_i)}{p(b_i)}\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = &amp;lt;/tex&amp;gt; &lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) + \sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= H(A \cap B) +\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) = &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)\sum\limits_{j=1}^{n} p(a_j \cap b_i) = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)p(b_i) = &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(A \cap B) - H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Таким образом получаем, что: &amp;lt;tex&amp;gt; H(A \cap B)= H(A|B)+H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Аналогично: &amp;lt;tex&amp;gt;H(B \cap A)= H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Из двух полученных равенств следует, что &amp;lt;tex&amp;gt; H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== См. также ==&lt;br /&gt;
*[[Вероятностное пространство, элементарный исход, событие|Вероятностное пространство, элементарный исход, событие]]&lt;br /&gt;
*[[Условная вероятность|Условная вероятность]]&lt;br /&gt;
&lt;br /&gt;
== Источники информации ==&lt;br /&gt;
* Конспект лекций по теории случайных процессов А.А. Соловьев&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Random_walk &amp;quot;Википедия - Random_walk&amp;quot;]&lt;br /&gt;
* [https://www.youtube.com/watch?v=6wUD_gp5WeE &amp;quot;Лекция MIT Random Walks&amp;quot;] &lt;br /&gt;
[[Категория:Дискретная математика и алгоритмы]]&lt;br /&gt;
&lt;br /&gt;
[[Категория: Теория вероятности ]]&lt;/div&gt;</summary>
		<author><name>77.222.96.22</name></author>	</entry>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74155</id>
		<title>Участник:Mk17.ru</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74155"/>
				<updated>2020-05-18T22:15:14Z</updated>
		
		<summary type="html">&lt;p&gt;77.222.96.22: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;__TOC__&lt;br /&gt;
== Определение ==&lt;br /&gt;
&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Случайное блуждание''' (англ. ''Random walk'') {{---}} математическая модель процесса случайных изменений — шагов в дискретные моменты времени. При этом предполагается, что изменение на каждом шаге не зависит от предыдущих и от времени. В силу простоты анализа эта модель часто используется в разных сферах в математике, экономике, физике, но, как правило, такая модель является существенным упрощением реального процесса.&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Двумерный случай случайных блужданий ==&lt;br /&gt;
&lt;br /&gt;
Представим частицу, которая движется по целым точкам на прямой. Перемещение из одной точки&lt;br /&gt;
в другую происходит через равные промежутки времени. За один шаг частица из точки k с положительной вероятностью p перемещается в точку &amp;lt;tex&amp;gt;k + 1&amp;lt;/tex&amp;gt; и с положительной вероятностью &amp;lt;tex&amp;gt;q = 1 − p&amp;lt;/tex&amp;gt;&lt;br /&gt;
перемещается в точку k − 1. &lt;br /&gt;
Физической системе соответствует цепь Маркова:&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt;\xi_n = \xi_{n-1} + \eta_n = \xi_0 + S_n, \eta_n = \begin{cases} 1 &amp;amp;\text{с вероятностью p}\\-1 &amp;amp;\text{с вероятностью 1 - p}&lt;br /&gt;
 \end{cases}&amp;lt;/tex&amp;gt; &lt;br /&gt;
Заметим, что вернуться в какую-либо точку можно только за четное число шагов.&lt;br /&gt;
&lt;br /&gt;
* &amp;lt;tex dpi =&amp;quot;130&amp;quot;&amp;gt;H(\underbrace{\dfrac{1}{n}, \dfrac{1}{n}, \dots, \dfrac{1}{n}}_\text{n}) &amp;lt; H(\underbrace{\dfrac{1}{n+1}, \dfrac{1}{n+1}, \dots, \dfrac{1}{n+1}}_\text{n+1})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
* &amp;lt;tex dpi =&amp;quot;130&amp;quot;&amp;gt; H(p_{1}q_{11}, p_{1}q_{12}, \dots, p_{n}q_{nk_n}) = H(p_1, p_2, \dots, p_n) + \sum\limits_{i=1}^{n} p_iH(q_{i1}, \dots, q_{ik_i})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&amp;lt;tex&amp;gt;\rhd&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Рассмотрим схему &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt; c &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt; исходами и вероятностями &amp;lt;tex&amp;gt;\{p_1, p_2, \dots, p_m\}&amp;lt;/tex&amp;gt; и схему &amp;lt;tex&amp;gt;\mathcal{R}_k&amp;lt;/tex&amp;gt; с &amp;lt;tex&amp;gt;k&amp;lt;/tex&amp;gt; исходами и вероятностями &amp;lt;tex&amp;gt;\{q_1, q_2, \dots, q_k\}&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Образуем комбинированную схему c &amp;lt;tex&amp;gt;m + k - 1&amp;lt;/tex&amp;gt; исходами следующим образом:&lt;br /&gt;
&lt;br /&gt;
Выбирается случайным образом один из исходов схемы &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt;, и если произошел &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt;-й исход, выбирается случайно один из исходов схемы &amp;lt;tex&amp;gt;\mathcal{R}_k&amp;lt;/tex&amp;gt;, а остальные &amp;lt;tex&amp;gt;m - 1&amp;lt;/tex&amp;gt; исходов схемы &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt; считаются окончательными.&lt;br /&gt;
&lt;br /&gt;
В этой комбинированной схеме &amp;lt;tex&amp;gt;\mathcal{PR}&amp;lt;/tex&amp;gt; мы получаем исходы &amp;lt;tex&amp;gt;1, 2, \dots, m - 1, (m, 1), (m, 2), \dots, (m, k)&amp;lt;/tex&amp;gt; с вероятностями &amp;lt;tex&amp;gt;p_1, p_2, \dots, p_{m-1}, p_mq_1, p_mq_2, \dots, p_mq_k&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Легко видеть, что &amp;lt;tex&amp;gt;H(\mathcal{PR}) = H(\mathcal{P}_m) + p_mH(\mathcal{R}_k)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
 &lt;br /&gt;
Потребуем выполнения этого свойства для любой меры неопределенности.&lt;br /&gt;
&amp;lt;tex&amp;gt;\lhd&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==Вычисление энтропии==&lt;br /&gt;
&lt;br /&gt;
Для доказательства формулы вычисления энтропии сначала докажем лемму.&lt;br /&gt;
{{Лемма&lt;br /&gt;
|statement = &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(n) = H(\dfrac{1}{n}, \dfrac{1}{n}, \dots, \dfrac{1}{n}) = -k \log_2 \dfrac{1}{n} = k \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
Будем рассматривать для &amp;lt;tex&amp;gt;k=1&amp;lt;/tex&amp;gt; (бит).&lt;br /&gt;
&lt;br /&gt;
Рассмотрим функцию &amp;lt;tex&amp;gt;g(mn)&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex&amp;gt;g(mn)=g(m)+ \sum\limits_{i=1}^{m} \dfrac{1}{m} g(n) = g(m)+g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Пусть: &amp;lt;tex&amp;gt;g(2)=1 \quad&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex&amp;gt;g(2^t)=t&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \quad g(n^t)=t \cdot g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Рассмотрим такое &amp;lt;tex&amp;gt; i &amp;lt;/tex&amp;gt;, что &amp;lt;tex&amp;gt;2^i \leqslant  n^t &amp;lt; 2^{i+1}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Можно заметить, что если &amp;lt;tex&amp;gt; i=[ \log_2 n^t ] &amp;lt;/tex&amp;gt;, то неравенство останется верным.&lt;br /&gt;
&lt;br /&gt;
По предыдущим рассуждениям получаем, что:&lt;br /&gt;
:&amp;lt;tex&amp;gt;g(2^i) \leqslant g(n^t) &amp;lt; g(2^{i+1})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex&amp;gt; i \leqslant t \cdot g(n) &amp;lt;i+1 \quad \quad &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Делим неравенство на &amp;lt;tex&amp;gt;t&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{i}{t} \leqslant g(n) &amp;lt; \dfrac{i+1}{t}&amp;lt;/tex&amp;gt;, то есть &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{[ \log_2 n^t ]}{t} \leqslant g(n) &amp;lt; \dfrac{[ \log_2 n^t ]+1}{t}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Отсюда ясно, что если &amp;lt;tex&amp;gt; t\rightarrow \infty&amp;lt;/tex&amp;gt;, то получаем &amp;lt;tex&amp;gt;g(n) = \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -k \sum\limits_{i=1}^{n} p_i\log_2p_i = k \sum\limits_{i=1}^{n} p_i\log_2\dfrac{1}{p_i}&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Теперь рассмотрим функцию &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Приведем дроби внутри функции к одному знаменателю, получаем: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n}) = H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Далее по свойству энтропии и доказанной лемме:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(b)= H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) + \sum\limits_{i=1}^{n} \dfrac{x_i}{b} g(x_i)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) = \log_2b - \sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2x_i = -\sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2 \dfrac{x_i}{b}&amp;lt;/tex&amp;gt;&lt;br /&gt;
При &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; p_i = \dfrac{x_i}{b} &amp;lt;/tex&amp;gt; получаем, что &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = \sum\limits_{i=1}^{n} p_i \log_2 \dfrac{1}{p_i}&amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Примеры ==&lt;br /&gt;
=== Энтропия честной монеты ===&lt;br /&gt;
Рассмотрим [[Вероятностное пространство, элементарный исход, событие|вероятностное пространство]] {{---}} честная монета. &lt;br /&gt;
Найдем для нее энтропию:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot \log_2 \dfrac{1}{2}} = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot (-1)} = 1&amp;lt;/tex&amp;gt;&lt;br /&gt;
Это означает что после броска честной монеты мы получим информацию в размере &amp;lt;tex&amp;gt;1&amp;lt;/tex&amp;gt; бит, уменьшив степень неопределенности вдвое.&lt;br /&gt;
&lt;br /&gt;
=== Энтропия нечестной монеты ===&lt;br /&gt;
Найдем энтропию для [[Вероятностное пространство, элементарный исход, событие|вероятностного пространства]] нечестная монета с [[Схема Бернулли| распределением Бернулли]] &amp;lt;tex&amp;gt;\{0,2; 0,8\}&amp;lt;/tex&amp;gt;:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -0.2\log_2(0.2)-0.8\log_2(0.8) \approx 0.722 &amp;lt; 1 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Ограниченность энтропии ==&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt;0 \leqslant  H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
1) Докажем первую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
Так как &amp;lt;tex&amp;gt; p_i\in[0,\;1]&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\log_2\dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;. Таким образом &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(p_1, p_2, \dots, p_n) = \sum\limits_{i=1}^{n} p_i\log_2 \dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
2) Докажем вторую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; f(x)=\log_2x &amp;lt;/tex&amp;gt; {{---}} выпуклая вверх функция, &amp;lt;tex&amp;gt; p_1,p_2,\ldots,p_n&amp;gt;0&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \sum \limits_{i=1}^{n} p_i = 1 &amp;lt;/tex&amp;gt;, тогда для нее выполняется неравенство Йенсена:&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; \sum\limits_{i=1}^{n} p_i f(\dfrac{1}{p_i}) \leqslant  f(\sum\limits_{i=1}^{n} (p_i \cdot\dfrac{1}{p_i})) &amp;lt;/tex&amp;gt;&lt;br /&gt;
Таким образом получаем, что &amp;lt;tex&amp;gt; H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
Тогда из теоремы и доказанной выше леммы следует, что для n исходов энтропия максимальна, если они все равновероятны.&lt;br /&gt;
== Условная и взаимная энтропия ==&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Условная энтропия''' (англ. ''conditional entropy'') {{---}} определяет количество остающейся энтропии (то есть, остающейся неопределенности) события &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; после того, как становится известным результат события &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;. Она называется ''энтропия &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; при условии &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;'', и обозначается &amp;lt;tex&amp;gt;H(A|B)&amp;lt;/tex&amp;gt;&lt;br /&gt;
}} &lt;br /&gt;
&amp;lt;tex&amp;gt;H(A|B)= - \sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Взаимная энтропия''' (англ. ''joint entropy'') {{---}} энтропия объединения двух событий &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;.  &lt;br /&gt;
}}&lt;br /&gt;
&amp;lt;tex&amp;gt; H(A \cap B) = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Утверждение&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt; H(A \cap B) = H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof= По формуле условной вероятности &amp;lt;tex dpi=&amp;quot;130&amp;quot;&amp;gt; p(a_j|b_i)=\dfrac{p(a_j \cap b_i)}{p(b_i)} &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(A|B)=-\sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt; &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= - \sum\limits_{i=1}^{m}p(b_i) \sum\limits_{j=1}^{n} \dfrac{p(a_j \cap b_i)}{p(b_i)}\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = &amp;lt;/tex&amp;gt; &lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) + \sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= H(A \cap B) +\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) = &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)\sum\limits_{j=1}^{n} p(a_j \cap b_i) = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)p(b_i) = &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(A \cap B) - H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Таким образом получаем, что: &amp;lt;tex&amp;gt; H(A \cap B)= H(A|B)+H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Аналогично: &amp;lt;tex&amp;gt;H(B \cap A)= H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Из двух полученных равенств следует, что &amp;lt;tex&amp;gt; H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== См. также ==&lt;br /&gt;
*[[Вероятностное пространство, элементарный исход, событие|Вероятностное пространство, элементарный исход, событие]]&lt;br /&gt;
*[[Условная вероятность|Условная вероятность]]&lt;br /&gt;
&lt;br /&gt;
== Источники информации ==&lt;br /&gt;
* Конспект лекций по теории случайных процессов А.А. Соловьев&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Random_walk &amp;quot;Википедия - Random_walk&amp;quot;]&lt;br /&gt;
* [https://www.youtube.com/watch?v=6wUD_gp5WeE &amp;quot;Лекция MIT Random Walks&amp;quot;] &lt;br /&gt;
[[Категория:Дискретная математика и алгоритмы]]&lt;br /&gt;
&lt;br /&gt;
[[Категория: Теория вероятности ]]&lt;/div&gt;</summary>
		<author><name>77.222.96.22</name></author>	</entry>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74154</id>
		<title>Участник:Mk17.ru</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74154"/>
				<updated>2020-05-18T22:13:06Z</updated>
		
		<summary type="html">&lt;p&gt;77.222.96.22: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;__TOC__&lt;br /&gt;
== Определение ==&lt;br /&gt;
&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Случайное блуждание''' (англ. ''Random walk'') {{---}} математическая модель процесса случайных изменений — шагов в дискретные моменты времени. При этом предполагается, что изменение на каждом шаге не зависит от предыдущих и от времени. В силу простоты анализа эта модель часто используется в разных сферах в математике, экономике, физике, но, как правило, такая модель является существенным упрощением реального процесса.&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Двумерный случай случайных блужданий ==&lt;br /&gt;
&lt;br /&gt;
Представим частицу, которая движется по целым точкам на прямой. Перемещение из одной точки&lt;br /&gt;
в другую происходит через равные промежутки времени. За один шаг частица из точки k с положительной вероятностью p перемещается в точку &amp;lt;tex&amp;gt;k + 1&amp;lt;/tex&amp;gt; и с положительной вероятностью &amp;lt;tex&amp;gt;q = 1 − p&amp;lt;/tex&amp;gt;&lt;br /&gt;
перемещается в точку k − 1. &lt;br /&gt;
Физической системе соответствует цепь Маркова:&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt;\xi_n = \xi_{n-1} + \eta_n = \xi_0 + S_n, \eta_n = \begin{cases} 1 &amp;amp;\text{с вероятностью p}\\-1 &amp;amp;\text{с вероятностью 1 - p}&lt;br /&gt;
 \end{cases}&amp;lt;/tex&amp;gt; &lt;br /&gt;
Заметим, что вернуться в какую-либо точку можно только за четное число шагов.&lt;br /&gt;
&lt;br /&gt;
* &amp;lt;tex dpi =&amp;quot;130&amp;quot;&amp;gt;H(\underbrace{\dfrac{1}{n}, \dfrac{1}{n}, \dots, \dfrac{1}{n}}_\text{n}) &amp;lt; H(\underbrace{\dfrac{1}{n+1}, \dfrac{1}{n+1}, \dots, \dfrac{1}{n+1}}_\text{n+1})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
* &amp;lt;tex dpi =&amp;quot;130&amp;quot;&amp;gt; H(p_{1}q_{11}, p_{1}q_{12}, \dots, p_{n}q_{nk_n}) = H(p_1, p_2, \dots, p_n) + \sum\limits_{i=1}^{n} p_iH(q_{i1}, \dots, q_{ik_i})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&amp;lt;tex&amp;gt;\rhd&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Рассмотрим схему &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt; c &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt; исходами и вероятностями &amp;lt;tex&amp;gt;\{p_1, p_2, \dots, p_m\}&amp;lt;/tex&amp;gt; и схему &amp;lt;tex&amp;gt;\mathcal{R}_k&amp;lt;/tex&amp;gt; с &amp;lt;tex&amp;gt;k&amp;lt;/tex&amp;gt; исходами и вероятностями &amp;lt;tex&amp;gt;\{q_1, q_2, \dots, q_k\}&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Образуем комбинированную схему c &amp;lt;tex&amp;gt;m + k - 1&amp;lt;/tex&amp;gt; исходами следующим образом:&lt;br /&gt;
&lt;br /&gt;
Выбирается случайным образом один из исходов схемы &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt;, и если произошел &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt;-й исход, выбирается случайно один из исходов схемы &amp;lt;tex&amp;gt;\mathcal{R}_k&amp;lt;/tex&amp;gt;, а остальные &amp;lt;tex&amp;gt;m - 1&amp;lt;/tex&amp;gt; исходов схемы &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt; считаются окончательными.&lt;br /&gt;
&lt;br /&gt;
В этой комбинированной схеме &amp;lt;tex&amp;gt;\mathcal{PR}&amp;lt;/tex&amp;gt; мы получаем исходы &amp;lt;tex&amp;gt;1, 2, \dots, m - 1, (m, 1), (m, 2), \dots, (m, k)&amp;lt;/tex&amp;gt; с вероятностями &amp;lt;tex&amp;gt;p_1, p_2, \dots, p_{m-1}, p_mq_1, p_mq_2, \dots, p_mq_k&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Легко видеть, что &amp;lt;tex&amp;gt;H(\mathcal{PR}) = H(\mathcal{P}_m) + p_mH(\mathcal{R}_k)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
 &lt;br /&gt;
Потребуем выполнения этого свойства для любой меры неопределенности.&lt;br /&gt;
&amp;lt;tex&amp;gt;\lhd&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==Вычисление энтропии==&lt;br /&gt;
&lt;br /&gt;
Для доказательства формулы вычисления энтропии сначала докажем лемму.&lt;br /&gt;
{{Лемма&lt;br /&gt;
|statement = &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(n) = H(\dfrac{1}{n}, \dfrac{1}{n}, \dots, \dfrac{1}{n}) = -k \log_2 \dfrac{1}{n} = k \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
Будем рассматривать для &amp;lt;tex&amp;gt;k=1&amp;lt;/tex&amp;gt; (бит).&lt;br /&gt;
&lt;br /&gt;
Рассмотрим функцию &amp;lt;tex&amp;gt;g(mn)&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex&amp;gt;g(mn)=g(m)+ \sum\limits_{i=1}^{m} \dfrac{1}{m} g(n) = g(m)+g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Пусть: &amp;lt;tex&amp;gt;g(2)=1 \quad&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex&amp;gt;g(2^t)=t&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \quad g(n^t)=t \cdot g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Рассмотрим такое &amp;lt;tex&amp;gt; i &amp;lt;/tex&amp;gt;, что &amp;lt;tex&amp;gt;2^i \leqslant  n^t &amp;lt; 2^{i+1}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Можно заметить, что если &amp;lt;tex&amp;gt; i=[ \log_2 n^t ] &amp;lt;/tex&amp;gt;, то неравенство останется верным.&lt;br /&gt;
&lt;br /&gt;
По предыдущим рассуждениям получаем, что:&lt;br /&gt;
:&amp;lt;tex&amp;gt;g(2^i) \leqslant g(n^t) &amp;lt; g(2^{i+1})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex&amp;gt; i \leqslant t \cdot g(n) &amp;lt;i+1 \quad \quad &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Делим неравенство на &amp;lt;tex&amp;gt;t&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{i}{t} \leqslant g(n) &amp;lt; \dfrac{i+1}{t}&amp;lt;/tex&amp;gt;, то есть &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{[ \log_2 n^t ]}{t} \leqslant g(n) &amp;lt; \dfrac{[ \log_2 n^t ]+1}{t}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Отсюда ясно, что если &amp;lt;tex&amp;gt; t\rightarrow \infty&amp;lt;/tex&amp;gt;, то получаем &amp;lt;tex&amp;gt;g(n) = \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -k \sum\limits_{i=1}^{n} p_i\log_2p_i = k \sum\limits_{i=1}^{n} p_i\log_2\dfrac{1}{p_i}&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Теперь рассмотрим функцию &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Приведем дроби внутри функции к одному знаменателю, получаем: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n}) = H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Далее по свойству энтропии и доказанной лемме:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(b)= H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) + \sum\limits_{i=1}^{n} \dfrac{x_i}{b} g(x_i)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) = \log_2b - \sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2x_i = -\sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2 \dfrac{x_i}{b}&amp;lt;/tex&amp;gt;&lt;br /&gt;
При &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; p_i = \dfrac{x_i}{b} &amp;lt;/tex&amp;gt; получаем, что &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = \sum\limits_{i=1}^{n} p_i \log_2 \dfrac{1}{p_i}&amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Примеры ==&lt;br /&gt;
=== Энтропия честной монеты ===&lt;br /&gt;
Рассмотрим [[Вероятностное пространство, элементарный исход, событие|вероятностное пространство]] {{---}} честная монета. &lt;br /&gt;
Найдем для нее энтропию:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot \log_2 \dfrac{1}{2}} = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot (-1)} = 1&amp;lt;/tex&amp;gt;&lt;br /&gt;
Это означает что после броска честной монеты мы получим информацию в размере &amp;lt;tex&amp;gt;1&amp;lt;/tex&amp;gt; бит, уменьшив степень неопределенности вдвое.&lt;br /&gt;
&lt;br /&gt;
=== Энтропия нечестной монеты ===&lt;br /&gt;
Найдем энтропию для [[Вероятностное пространство, элементарный исход, событие|вероятностного пространства]] нечестная монета с [[Схема Бернулли| распределением Бернулли]] &amp;lt;tex&amp;gt;\{0,2; 0,8\}&amp;lt;/tex&amp;gt;:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -0.2\log_2(0.2)-0.8\log_2(0.8) \approx 0.722 &amp;lt; 1 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Ограниченность энтропии ==&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt;0 \leqslant  H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
1) Докажем первую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
Так как &amp;lt;tex&amp;gt; p_i\in[0,\;1]&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\log_2\dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;. Таким образом &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(p_1, p_2, \dots, p_n) = \sum\limits_{i=1}^{n} p_i\log_2 \dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
2) Докажем вторую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; f(x)=\log_2x &amp;lt;/tex&amp;gt; {{---}} выпуклая вверх функция, &amp;lt;tex&amp;gt; p_1,p_2,\ldots,p_n&amp;gt;0&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \sum \limits_{i=1}^{n} p_i = 1 &amp;lt;/tex&amp;gt;, тогда для нее выполняется неравенство Йенсена:&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; \sum\limits_{i=1}^{n} p_i f(\dfrac{1}{p_i}) \leqslant  f(\sum\limits_{i=1}^{n} (p_i \cdot\dfrac{1}{p_i})) &amp;lt;/tex&amp;gt;&lt;br /&gt;
Таким образом получаем, что &amp;lt;tex&amp;gt; H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
Тогда из теоремы и доказанной выше леммы следует, что для n исходов энтропия максимальна, если они все равновероятны.&lt;br /&gt;
== Условная и взаимная энтропия ==&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Условная энтропия''' (англ. ''conditional entropy'') {{---}} определяет количество остающейся энтропии (то есть, остающейся неопределенности) события &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; после того, как становится известным результат события &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;. Она называется ''энтропия &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; при условии &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;'', и обозначается &amp;lt;tex&amp;gt;H(A|B)&amp;lt;/tex&amp;gt;&lt;br /&gt;
}} &lt;br /&gt;
&amp;lt;tex&amp;gt;H(A|B)= - \sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Взаимная энтропия''' (англ. ''joint entropy'') {{---}} энтропия объединения двух событий &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;.  &lt;br /&gt;
}}&lt;br /&gt;
&amp;lt;tex&amp;gt; H(A \cap B) = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Утверждение&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt; H(A \cap B) = H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof= По формуле условной вероятности &amp;lt;tex dpi=&amp;quot;130&amp;quot;&amp;gt; p(a_j|b_i)=\dfrac{p(a_j \cap b_i)}{p(b_i)} &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(A|B)=-\sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt; &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= - \sum\limits_{i=1}^{m}p(b_i) \sum\limits_{j=1}^{n} \dfrac{p(a_j \cap b_i)}{p(b_i)}\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = &amp;lt;/tex&amp;gt; &lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) + \sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= H(A \cap B) +\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) = &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)\sum\limits_{j=1}^{n} p(a_j \cap b_i) = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)p(b_i) = &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(A \cap B) - H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Таким образом получаем, что: &amp;lt;tex&amp;gt; H(A \cap B)= H(A|B)+H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Аналогично: &amp;lt;tex&amp;gt;H(B \cap A)= H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Из двух полученных равенств следует, что &amp;lt;tex&amp;gt; H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== См. также ==&lt;br /&gt;
*[[Вероятностное пространство, элементарный исход, событие|Вероятностное пространство, элементарный исход, событие]]&lt;br /&gt;
*[[Условная вероятность|Условная вероятность]]&lt;br /&gt;
&lt;br /&gt;
== Источники информации ==&lt;br /&gt;
* Конспект лекций по теории случайных процессов А.А. Соловьев&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Random_walk &amp;quot;Википедия - Random_walk&amp;quot;]&lt;br /&gt;
* [] &lt;br /&gt;
[[Категория:Дискретная математика и алгоритмы]]&lt;br /&gt;
&lt;br /&gt;
[[Категория: Теория вероятности ]]&lt;/div&gt;</summary>
		<author><name>77.222.96.22</name></author>	</entry>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74153</id>
		<title>Участник:Mk17.ru</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74153"/>
				<updated>2020-05-18T22:12:39Z</updated>
		
		<summary type="html">&lt;p&gt;77.222.96.22: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;__TOC__&lt;br /&gt;
== Определение ==&lt;br /&gt;
&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Случайное блуждание''' (англ. ''Random walk'') {{---}} математическая модель процесса случайных изменений — шагов в дискретные моменты времени. При этом предполагается, что изменение на каждом шаге не зависит от предыдущих и от времени. В силу простоты анализа эта модель часто используется в разных сферах в математике, экономике, физике, но, как правило, такая модель является существенным упрощением реального процесса.&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Двумерный случай случайных блужданий ==&lt;br /&gt;
&lt;br /&gt;
Представим частицу, которая движется по целым точкам на прямой. Перемещение из одной точки&lt;br /&gt;
в другую происходит через равные промежутки времени. За один шаг частица из точки k с положительной вероятностью p перемещается в точку *&amp;lt;tex&amp;gt;k + 1&amp;lt;/tex&amp;gt; и с положительной вероятностью *&amp;lt;tex&amp;gt;q = 1 − p&amp;lt;/tex&amp;gt;&lt;br /&gt;
перемещается в точку k − 1. &lt;br /&gt;
Физической системе соответствует цепь Маркова:&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt;\xi_n = \xi_{n-1} + \eta_n = \xi_0 + S_n, \eta_n = \begin{cases} 1 &amp;amp;\text{с вероятностью p}\\-1 &amp;amp;\text{с вероятностью 1 - p}&lt;br /&gt;
 \end{cases}&amp;lt;/tex&amp;gt; &lt;br /&gt;
Заметим, что вернуться в какую-либо точку можно только за четное число шагов.&lt;br /&gt;
&lt;br /&gt;
* &amp;lt;tex dpi =&amp;quot;130&amp;quot;&amp;gt;H(\underbrace{\dfrac{1}{n}, \dfrac{1}{n}, \dots, \dfrac{1}{n}}_\text{n}) &amp;lt; H(\underbrace{\dfrac{1}{n+1}, \dfrac{1}{n+1}, \dots, \dfrac{1}{n+1}}_\text{n+1})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
* &amp;lt;tex dpi =&amp;quot;130&amp;quot;&amp;gt; H(p_{1}q_{11}, p_{1}q_{12}, \dots, p_{n}q_{nk_n}) = H(p_1, p_2, \dots, p_n) + \sum\limits_{i=1}^{n} p_iH(q_{i1}, \dots, q_{ik_i})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&amp;lt;tex&amp;gt;\rhd&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Рассмотрим схему &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt; c &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt; исходами и вероятностями &amp;lt;tex&amp;gt;\{p_1, p_2, \dots, p_m\}&amp;lt;/tex&amp;gt; и схему &amp;lt;tex&amp;gt;\mathcal{R}_k&amp;lt;/tex&amp;gt; с &amp;lt;tex&amp;gt;k&amp;lt;/tex&amp;gt; исходами и вероятностями &amp;lt;tex&amp;gt;\{q_1, q_2, \dots, q_k\}&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Образуем комбинированную схему c &amp;lt;tex&amp;gt;m + k - 1&amp;lt;/tex&amp;gt; исходами следующим образом:&lt;br /&gt;
&lt;br /&gt;
Выбирается случайным образом один из исходов схемы &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt;, и если произошел &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt;-й исход, выбирается случайно один из исходов схемы &amp;lt;tex&amp;gt;\mathcal{R}_k&amp;lt;/tex&amp;gt;, а остальные &amp;lt;tex&amp;gt;m - 1&amp;lt;/tex&amp;gt; исходов схемы &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt; считаются окончательными.&lt;br /&gt;
&lt;br /&gt;
В этой комбинированной схеме &amp;lt;tex&amp;gt;\mathcal{PR}&amp;lt;/tex&amp;gt; мы получаем исходы &amp;lt;tex&amp;gt;1, 2, \dots, m - 1, (m, 1), (m, 2), \dots, (m, k)&amp;lt;/tex&amp;gt; с вероятностями &amp;lt;tex&amp;gt;p_1, p_2, \dots, p_{m-1}, p_mq_1, p_mq_2, \dots, p_mq_k&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Легко видеть, что &amp;lt;tex&amp;gt;H(\mathcal{PR}) = H(\mathcal{P}_m) + p_mH(\mathcal{R}_k)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
 &lt;br /&gt;
Потребуем выполнения этого свойства для любой меры неопределенности.&lt;br /&gt;
&amp;lt;tex&amp;gt;\lhd&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==Вычисление энтропии==&lt;br /&gt;
&lt;br /&gt;
Для доказательства формулы вычисления энтропии сначала докажем лемму.&lt;br /&gt;
{{Лемма&lt;br /&gt;
|statement = &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(n) = H(\dfrac{1}{n}, \dfrac{1}{n}, \dots, \dfrac{1}{n}) = -k \log_2 \dfrac{1}{n} = k \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
Будем рассматривать для &amp;lt;tex&amp;gt;k=1&amp;lt;/tex&amp;gt; (бит).&lt;br /&gt;
&lt;br /&gt;
Рассмотрим функцию &amp;lt;tex&amp;gt;g(mn)&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex&amp;gt;g(mn)=g(m)+ \sum\limits_{i=1}^{m} \dfrac{1}{m} g(n) = g(m)+g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Пусть: &amp;lt;tex&amp;gt;g(2)=1 \quad&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex&amp;gt;g(2^t)=t&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \quad g(n^t)=t \cdot g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Рассмотрим такое &amp;lt;tex&amp;gt; i &amp;lt;/tex&amp;gt;, что &amp;lt;tex&amp;gt;2^i \leqslant  n^t &amp;lt; 2^{i+1}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Можно заметить, что если &amp;lt;tex&amp;gt; i=[ \log_2 n^t ] &amp;lt;/tex&amp;gt;, то неравенство останется верным.&lt;br /&gt;
&lt;br /&gt;
По предыдущим рассуждениям получаем, что:&lt;br /&gt;
:&amp;lt;tex&amp;gt;g(2^i) \leqslant g(n^t) &amp;lt; g(2^{i+1})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex&amp;gt; i \leqslant t \cdot g(n) &amp;lt;i+1 \quad \quad &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Делим неравенство на &amp;lt;tex&amp;gt;t&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{i}{t} \leqslant g(n) &amp;lt; \dfrac{i+1}{t}&amp;lt;/tex&amp;gt;, то есть &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{[ \log_2 n^t ]}{t} \leqslant g(n) &amp;lt; \dfrac{[ \log_2 n^t ]+1}{t}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Отсюда ясно, что если &amp;lt;tex&amp;gt; t\rightarrow \infty&amp;lt;/tex&amp;gt;, то получаем &amp;lt;tex&amp;gt;g(n) = \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -k \sum\limits_{i=1}^{n} p_i\log_2p_i = k \sum\limits_{i=1}^{n} p_i\log_2\dfrac{1}{p_i}&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Теперь рассмотрим функцию &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Приведем дроби внутри функции к одному знаменателю, получаем: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n}) = H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Далее по свойству энтропии и доказанной лемме:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(b)= H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) + \sum\limits_{i=1}^{n} \dfrac{x_i}{b} g(x_i)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) = \log_2b - \sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2x_i = -\sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2 \dfrac{x_i}{b}&amp;lt;/tex&amp;gt;&lt;br /&gt;
При &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; p_i = \dfrac{x_i}{b} &amp;lt;/tex&amp;gt; получаем, что &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = \sum\limits_{i=1}^{n} p_i \log_2 \dfrac{1}{p_i}&amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Примеры ==&lt;br /&gt;
=== Энтропия честной монеты ===&lt;br /&gt;
Рассмотрим [[Вероятностное пространство, элементарный исход, событие|вероятностное пространство]] {{---}} честная монета. &lt;br /&gt;
Найдем для нее энтропию:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot \log_2 \dfrac{1}{2}} = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot (-1)} = 1&amp;lt;/tex&amp;gt;&lt;br /&gt;
Это означает что после броска честной монеты мы получим информацию в размере &amp;lt;tex&amp;gt;1&amp;lt;/tex&amp;gt; бит, уменьшив степень неопределенности вдвое.&lt;br /&gt;
&lt;br /&gt;
=== Энтропия нечестной монеты ===&lt;br /&gt;
Найдем энтропию для [[Вероятностное пространство, элементарный исход, событие|вероятностного пространства]] нечестная монета с [[Схема Бернулли| распределением Бернулли]] &amp;lt;tex&amp;gt;\{0,2; 0,8\}&amp;lt;/tex&amp;gt;:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -0.2\log_2(0.2)-0.8\log_2(0.8) \approx 0.722 &amp;lt; 1 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Ограниченность энтропии ==&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt;0 \leqslant  H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
1) Докажем первую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
Так как &amp;lt;tex&amp;gt; p_i\in[0,\;1]&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\log_2\dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;. Таким образом &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(p_1, p_2, \dots, p_n) = \sum\limits_{i=1}^{n} p_i\log_2 \dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
2) Докажем вторую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; f(x)=\log_2x &amp;lt;/tex&amp;gt; {{---}} выпуклая вверх функция, &amp;lt;tex&amp;gt; p_1,p_2,\ldots,p_n&amp;gt;0&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \sum \limits_{i=1}^{n} p_i = 1 &amp;lt;/tex&amp;gt;, тогда для нее выполняется неравенство Йенсена:&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; \sum\limits_{i=1}^{n} p_i f(\dfrac{1}{p_i}) \leqslant  f(\sum\limits_{i=1}^{n} (p_i \cdot\dfrac{1}{p_i})) &amp;lt;/tex&amp;gt;&lt;br /&gt;
Таким образом получаем, что &amp;lt;tex&amp;gt; H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
Тогда из теоремы и доказанной выше леммы следует, что для n исходов энтропия максимальна, если они все равновероятны.&lt;br /&gt;
== Условная и взаимная энтропия ==&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Условная энтропия''' (англ. ''conditional entropy'') {{---}} определяет количество остающейся энтропии (то есть, остающейся неопределенности) события &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; после того, как становится известным результат события &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;. Она называется ''энтропия &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; при условии &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;'', и обозначается &amp;lt;tex&amp;gt;H(A|B)&amp;lt;/tex&amp;gt;&lt;br /&gt;
}} &lt;br /&gt;
&amp;lt;tex&amp;gt;H(A|B)= - \sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Взаимная энтропия''' (англ. ''joint entropy'') {{---}} энтропия объединения двух событий &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;.  &lt;br /&gt;
}}&lt;br /&gt;
&amp;lt;tex&amp;gt; H(A \cap B) = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Утверждение&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt; H(A \cap B) = H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof= По формуле условной вероятности &amp;lt;tex dpi=&amp;quot;130&amp;quot;&amp;gt; p(a_j|b_i)=\dfrac{p(a_j \cap b_i)}{p(b_i)} &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(A|B)=-\sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt; &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= - \sum\limits_{i=1}^{m}p(b_i) \sum\limits_{j=1}^{n} \dfrac{p(a_j \cap b_i)}{p(b_i)}\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = &amp;lt;/tex&amp;gt; &lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) + \sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= H(A \cap B) +\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) = &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)\sum\limits_{j=1}^{n} p(a_j \cap b_i) = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)p(b_i) = &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(A \cap B) - H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Таким образом получаем, что: &amp;lt;tex&amp;gt; H(A \cap B)= H(A|B)+H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Аналогично: &amp;lt;tex&amp;gt;H(B \cap A)= H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Из двух полученных равенств следует, что &amp;lt;tex&amp;gt; H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== См. также ==&lt;br /&gt;
*[[Вероятностное пространство, элементарный исход, событие|Вероятностное пространство, элементарный исход, событие]]&lt;br /&gt;
*[[Условная вероятность|Условная вероятность]]&lt;br /&gt;
&lt;br /&gt;
== Источники информации ==&lt;br /&gt;
* Конспект лекций по теории случайных процессов А.А. Соловьев&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Random_walk &amp;quot;Википедия - Random_walk&amp;quot;]&lt;br /&gt;
* [] &lt;br /&gt;
[[Категория:Дискретная математика и алгоритмы]]&lt;br /&gt;
&lt;br /&gt;
[[Категория: Теория вероятности ]]&lt;/div&gt;</summary>
		<author><name>77.222.96.22</name></author>	</entry>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74152</id>
		<title>Участник:Mk17.ru</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74152"/>
				<updated>2020-05-18T22:11:39Z</updated>
		
		<summary type="html">&lt;p&gt;77.222.96.22: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;__TOC__&lt;br /&gt;
== Определение ==&lt;br /&gt;
&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Случайное блуждание''' (англ. ''Random walk'') {{---}} математическая модель процесса случайных изменений — шагов в дискретные моменты времени. При этом предполагается, что изменение на каждом шаге не зависит от предыдущих и от времени. В силу простоты анализа эта модель часто используется в разных сферах в математике, экономике, физике, но, как правило, такая модель является существенным упрощением реального процесса.&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Двумерный случай случайных блужданий ==&lt;br /&gt;
&lt;br /&gt;
Представим частицу, которая движется по целым точкам на прямой. Перемещение из одной точки&lt;br /&gt;
в другую происходит через равные промежутки времени. За один шаг частица из точки k с положительной вероятностью p перемещается в точку k + 1 и с положительной вероятностью q = 1 − p&lt;br /&gt;
перемещается в точку k − 1. &lt;br /&gt;
Физической системе соответствует цепь Маркова:&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt;\xi_n = \xi_{n-1} + \eta_n = \xi_0 + S_n, \eta_n = \begin{cases} 1 &amp;amp;\text{с вероятностью p}\\-1 &amp;amp;\text{с вероятностью 1 - p}&lt;br /&gt;
 \end{cases}&amp;lt;/tex&amp;gt; &lt;br /&gt;
Заметим, что вернуться в какую-либо точку можно только за четное число шагов.&lt;br /&gt;
&lt;br /&gt;
* &amp;lt;tex dpi =&amp;quot;130&amp;quot;&amp;gt;H(\underbrace{\dfrac{1}{n}, \dfrac{1}{n}, \dots, \dfrac{1}{n}}_\text{n}) &amp;lt; H(\underbrace{\dfrac{1}{n+1}, \dfrac{1}{n+1}, \dots, \dfrac{1}{n+1}}_\text{n+1})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
* &amp;lt;tex dpi =&amp;quot;130&amp;quot;&amp;gt; H(p_{1}q_{11}, p_{1}q_{12}, \dots, p_{n}q_{nk_n}) = H(p_1, p_2, \dots, p_n) + \sum\limits_{i=1}^{n} p_iH(q_{i1}, \dots, q_{ik_i})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&amp;lt;tex&amp;gt;\rhd&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Рассмотрим схему &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt; c &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt; исходами и вероятностями &amp;lt;tex&amp;gt;\{p_1, p_2, \dots, p_m\}&amp;lt;/tex&amp;gt; и схему &amp;lt;tex&amp;gt;\mathcal{R}_k&amp;lt;/tex&amp;gt; с &amp;lt;tex&amp;gt;k&amp;lt;/tex&amp;gt; исходами и вероятностями &amp;lt;tex&amp;gt;\{q_1, q_2, \dots, q_k\}&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Образуем комбинированную схему c &amp;lt;tex&amp;gt;m + k - 1&amp;lt;/tex&amp;gt; исходами следующим образом:&lt;br /&gt;
&lt;br /&gt;
Выбирается случайным образом один из исходов схемы &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt;, и если произошел &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt;-й исход, выбирается случайно один из исходов схемы &amp;lt;tex&amp;gt;\mathcal{R}_k&amp;lt;/tex&amp;gt;, а остальные &amp;lt;tex&amp;gt;m - 1&amp;lt;/tex&amp;gt; исходов схемы &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt; считаются окончательными.&lt;br /&gt;
&lt;br /&gt;
В этой комбинированной схеме &amp;lt;tex&amp;gt;\mathcal{PR}&amp;lt;/tex&amp;gt; мы получаем исходы &amp;lt;tex&amp;gt;1, 2, \dots, m - 1, (m, 1), (m, 2), \dots, (m, k)&amp;lt;/tex&amp;gt; с вероятностями &amp;lt;tex&amp;gt;p_1, p_2, \dots, p_{m-1}, p_mq_1, p_mq_2, \dots, p_mq_k&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Легко видеть, что &amp;lt;tex&amp;gt;H(\mathcal{PR}) = H(\mathcal{P}_m) + p_mH(\mathcal{R}_k)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
 &lt;br /&gt;
Потребуем выполнения этого свойства для любой меры неопределенности.&lt;br /&gt;
&amp;lt;tex&amp;gt;\lhd&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==Вычисление энтропии==&lt;br /&gt;
&lt;br /&gt;
Для доказательства формулы вычисления энтропии сначала докажем лемму.&lt;br /&gt;
{{Лемма&lt;br /&gt;
|statement = &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(n) = H(\dfrac{1}{n}, \dfrac{1}{n}, \dots, \dfrac{1}{n}) = -k \log_2 \dfrac{1}{n} = k \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
Будем рассматривать для &amp;lt;tex&amp;gt;k=1&amp;lt;/tex&amp;gt; (бит).&lt;br /&gt;
&lt;br /&gt;
Рассмотрим функцию &amp;lt;tex&amp;gt;g(mn)&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex&amp;gt;g(mn)=g(m)+ \sum\limits_{i=1}^{m} \dfrac{1}{m} g(n) = g(m)+g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Пусть: &amp;lt;tex&amp;gt;g(2)=1 \quad&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex&amp;gt;g(2^t)=t&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \quad g(n^t)=t \cdot g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Рассмотрим такое &amp;lt;tex&amp;gt; i &amp;lt;/tex&amp;gt;, что &amp;lt;tex&amp;gt;2^i \leqslant  n^t &amp;lt; 2^{i+1}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Можно заметить, что если &amp;lt;tex&amp;gt; i=[ \log_2 n^t ] &amp;lt;/tex&amp;gt;, то неравенство останется верным.&lt;br /&gt;
&lt;br /&gt;
По предыдущим рассуждениям получаем, что:&lt;br /&gt;
:&amp;lt;tex&amp;gt;g(2^i) \leqslant g(n^t) &amp;lt; g(2^{i+1})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex&amp;gt; i \leqslant t \cdot g(n) &amp;lt;i+1 \quad \quad &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Делим неравенство на &amp;lt;tex&amp;gt;t&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{i}{t} \leqslant g(n) &amp;lt; \dfrac{i+1}{t}&amp;lt;/tex&amp;gt;, то есть &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{[ \log_2 n^t ]}{t} \leqslant g(n) &amp;lt; \dfrac{[ \log_2 n^t ]+1}{t}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Отсюда ясно, что если &amp;lt;tex&amp;gt; t\rightarrow \infty&amp;lt;/tex&amp;gt;, то получаем &amp;lt;tex&amp;gt;g(n) = \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -k \sum\limits_{i=1}^{n} p_i\log_2p_i = k \sum\limits_{i=1}^{n} p_i\log_2\dfrac{1}{p_i}&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Теперь рассмотрим функцию &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Приведем дроби внутри функции к одному знаменателю, получаем: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n}) = H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Далее по свойству энтропии и доказанной лемме:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(b)= H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) + \sum\limits_{i=1}^{n} \dfrac{x_i}{b} g(x_i)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) = \log_2b - \sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2x_i = -\sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2 \dfrac{x_i}{b}&amp;lt;/tex&amp;gt;&lt;br /&gt;
При &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; p_i = \dfrac{x_i}{b} &amp;lt;/tex&amp;gt; получаем, что &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = \sum\limits_{i=1}^{n} p_i \log_2 \dfrac{1}{p_i}&amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Примеры ==&lt;br /&gt;
=== Энтропия честной монеты ===&lt;br /&gt;
Рассмотрим [[Вероятностное пространство, элементарный исход, событие|вероятностное пространство]] {{---}} честная монета. &lt;br /&gt;
Найдем для нее энтропию:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot \log_2 \dfrac{1}{2}} = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot (-1)} = 1&amp;lt;/tex&amp;gt;&lt;br /&gt;
Это означает что после броска честной монеты мы получим информацию в размере &amp;lt;tex&amp;gt;1&amp;lt;/tex&amp;gt; бит, уменьшив степень неопределенности вдвое.&lt;br /&gt;
&lt;br /&gt;
=== Энтропия нечестной монеты ===&lt;br /&gt;
Найдем энтропию для [[Вероятностное пространство, элементарный исход, событие|вероятностного пространства]] нечестная монета с [[Схема Бернулли| распределением Бернулли]] &amp;lt;tex&amp;gt;\{0,2; 0,8\}&amp;lt;/tex&amp;gt;:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -0.2\log_2(0.2)-0.8\log_2(0.8) \approx 0.722 &amp;lt; 1 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Ограниченность энтропии ==&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt;0 \leqslant  H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
1) Докажем первую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
Так как &amp;lt;tex&amp;gt; p_i\in[0,\;1]&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\log_2\dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;. Таким образом &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(p_1, p_2, \dots, p_n) = \sum\limits_{i=1}^{n} p_i\log_2 \dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
2) Докажем вторую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; f(x)=\log_2x &amp;lt;/tex&amp;gt; {{---}} выпуклая вверх функция, &amp;lt;tex&amp;gt; p_1,p_2,\ldots,p_n&amp;gt;0&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \sum \limits_{i=1}^{n} p_i = 1 &amp;lt;/tex&amp;gt;, тогда для нее выполняется неравенство Йенсена:&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; \sum\limits_{i=1}^{n} p_i f(\dfrac{1}{p_i}) \leqslant  f(\sum\limits_{i=1}^{n} (p_i \cdot\dfrac{1}{p_i})) &amp;lt;/tex&amp;gt;&lt;br /&gt;
Таким образом получаем, что &amp;lt;tex&amp;gt; H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
Тогда из теоремы и доказанной выше леммы следует, что для n исходов энтропия максимальна, если они все равновероятны.&lt;br /&gt;
== Условная и взаимная энтропия ==&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Условная энтропия''' (англ. ''conditional entropy'') {{---}} определяет количество остающейся энтропии (то есть, остающейся неопределенности) события &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; после того, как становится известным результат события &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;. Она называется ''энтропия &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; при условии &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;'', и обозначается &amp;lt;tex&amp;gt;H(A|B)&amp;lt;/tex&amp;gt;&lt;br /&gt;
}} &lt;br /&gt;
&amp;lt;tex&amp;gt;H(A|B)= - \sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Взаимная энтропия''' (англ. ''joint entropy'') {{---}} энтропия объединения двух событий &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;.  &lt;br /&gt;
}}&lt;br /&gt;
&amp;lt;tex&amp;gt; H(A \cap B) = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Утверждение&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt; H(A \cap B) = H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof= По формуле условной вероятности &amp;lt;tex dpi=&amp;quot;130&amp;quot;&amp;gt; p(a_j|b_i)=\dfrac{p(a_j \cap b_i)}{p(b_i)} &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(A|B)=-\sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt; &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= - \sum\limits_{i=1}^{m}p(b_i) \sum\limits_{j=1}^{n} \dfrac{p(a_j \cap b_i)}{p(b_i)}\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = &amp;lt;/tex&amp;gt; &lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) + \sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= H(A \cap B) +\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) = &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)\sum\limits_{j=1}^{n} p(a_j \cap b_i) = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)p(b_i) = &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(A \cap B) - H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Таким образом получаем, что: &amp;lt;tex&amp;gt; H(A \cap B)= H(A|B)+H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Аналогично: &amp;lt;tex&amp;gt;H(B \cap A)= H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Из двух полученных равенств следует, что &amp;lt;tex&amp;gt; H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== См. также ==&lt;br /&gt;
*[[Вероятностное пространство, элементарный исход, событие|Вероятностное пространство, элементарный исход, событие]]&lt;br /&gt;
*[[Условная вероятность|Условная вероятность]]&lt;br /&gt;
&lt;br /&gt;
== Источники информации ==&lt;br /&gt;
* Конспект лекций по теории случайных процессов А.А. Соловьев&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Random_walk &amp;quot;Википедия - Random_walk&amp;quot;]&lt;br /&gt;
* [] &lt;br /&gt;
[[Категория:Дискретная математика и алгоритмы]]&lt;br /&gt;
&lt;br /&gt;
[[Категория: Теория вероятности ]]&lt;/div&gt;</summary>
		<author><name>77.222.96.22</name></author>	</entry>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74151</id>
		<title>Участник:Mk17.ru</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74151"/>
				<updated>2020-05-18T22:10:56Z</updated>
		
		<summary type="html">&lt;p&gt;77.222.96.22: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;__TOC__&lt;br /&gt;
== Определение ==&lt;br /&gt;
&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Случайное блуждание''' (англ. ''Random walk'') {{---}} математическая модель процесса случайных изменений — шагов в дискретные моменты времени. При этом предполагается, что изменение на каждом шаге не зависит от предыдущих и от времени. В силу простоты анализа эта модель часто используется в разных сферах в математике, экономике, физике, но, как правило, такая модель является существенным упрощением реального процесса.&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Двумерный случай случайных блужданий ==&lt;br /&gt;
&lt;br /&gt;
Представим частицу, которая движется по целым точкам на прямой. Перемещение из одной точки&lt;br /&gt;
в другую происходит через равные промежутки времени. За один шаг частица из точки k с положительной вероятностью p перемещается в точку k + 1 и с положительной вероятностью q = 1 − p&lt;br /&gt;
перемещается в точку k − 1. Физической системе соответствует цепь Маркова&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt;\xi_n = \xi_{n-1} + \eta_n = \xi_0 + S_n, \eta_n = \begin{cases} 1 &amp;amp;\text{с вероятностью p}\\-1 &amp;amp;\text{с вероятностью 1 - p}&lt;br /&gt;
 \end{cases}&amp;lt;/tex&amp;gt; &lt;br /&gt;
Заметим, что вернуться в какую-либо точку можно только за четное число шагов.&lt;br /&gt;
&lt;br /&gt;
* &amp;lt;tex dpi =&amp;quot;130&amp;quot;&amp;gt;H(\underbrace{\dfrac{1}{n}, \dfrac{1}{n}, \dots, \dfrac{1}{n}}_\text{n}) &amp;lt; H(\underbrace{\dfrac{1}{n+1}, \dfrac{1}{n+1}, \dots, \dfrac{1}{n+1}}_\text{n+1})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
* &amp;lt;tex dpi =&amp;quot;130&amp;quot;&amp;gt; H(p_{1}q_{11}, p_{1}q_{12}, \dots, p_{n}q_{nk_n}) = H(p_1, p_2, \dots, p_n) + \sum\limits_{i=1}^{n} p_iH(q_{i1}, \dots, q_{ik_i})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&amp;lt;tex&amp;gt;\rhd&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Рассмотрим схему &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt; c &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt; исходами и вероятностями &amp;lt;tex&amp;gt;\{p_1, p_2, \dots, p_m\}&amp;lt;/tex&amp;gt; и схему &amp;lt;tex&amp;gt;\mathcal{R}_k&amp;lt;/tex&amp;gt; с &amp;lt;tex&amp;gt;k&amp;lt;/tex&amp;gt; исходами и вероятностями &amp;lt;tex&amp;gt;\{q_1, q_2, \dots, q_k\}&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Образуем комбинированную схему c &amp;lt;tex&amp;gt;m + k - 1&amp;lt;/tex&amp;gt; исходами следующим образом:&lt;br /&gt;
&lt;br /&gt;
Выбирается случайным образом один из исходов схемы &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt;, и если произошел &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt;-й исход, выбирается случайно один из исходов схемы &amp;lt;tex&amp;gt;\mathcal{R}_k&amp;lt;/tex&amp;gt;, а остальные &amp;lt;tex&amp;gt;m - 1&amp;lt;/tex&amp;gt; исходов схемы &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt; считаются окончательными.&lt;br /&gt;
&lt;br /&gt;
В этой комбинированной схеме &amp;lt;tex&amp;gt;\mathcal{PR}&amp;lt;/tex&amp;gt; мы получаем исходы &amp;lt;tex&amp;gt;1, 2, \dots, m - 1, (m, 1), (m, 2), \dots, (m, k)&amp;lt;/tex&amp;gt; с вероятностями &amp;lt;tex&amp;gt;p_1, p_2, \dots, p_{m-1}, p_mq_1, p_mq_2, \dots, p_mq_k&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Легко видеть, что &amp;lt;tex&amp;gt;H(\mathcal{PR}) = H(\mathcal{P}_m) + p_mH(\mathcal{R}_k)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
 &lt;br /&gt;
Потребуем выполнения этого свойства для любой меры неопределенности.&lt;br /&gt;
&amp;lt;tex&amp;gt;\lhd&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==Вычисление энтропии==&lt;br /&gt;
&lt;br /&gt;
Для доказательства формулы вычисления энтропии сначала докажем лемму.&lt;br /&gt;
{{Лемма&lt;br /&gt;
|statement = &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(n) = H(\dfrac{1}{n}, \dfrac{1}{n}, \dots, \dfrac{1}{n}) = -k \log_2 \dfrac{1}{n} = k \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
Будем рассматривать для &amp;lt;tex&amp;gt;k=1&amp;lt;/tex&amp;gt; (бит).&lt;br /&gt;
&lt;br /&gt;
Рассмотрим функцию &amp;lt;tex&amp;gt;g(mn)&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex&amp;gt;g(mn)=g(m)+ \sum\limits_{i=1}^{m} \dfrac{1}{m} g(n) = g(m)+g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Пусть: &amp;lt;tex&amp;gt;g(2)=1 \quad&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex&amp;gt;g(2^t)=t&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \quad g(n^t)=t \cdot g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Рассмотрим такое &amp;lt;tex&amp;gt; i &amp;lt;/tex&amp;gt;, что &amp;lt;tex&amp;gt;2^i \leqslant  n^t &amp;lt; 2^{i+1}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Можно заметить, что если &amp;lt;tex&amp;gt; i=[ \log_2 n^t ] &amp;lt;/tex&amp;gt;, то неравенство останется верным.&lt;br /&gt;
&lt;br /&gt;
По предыдущим рассуждениям получаем, что:&lt;br /&gt;
:&amp;lt;tex&amp;gt;g(2^i) \leqslant g(n^t) &amp;lt; g(2^{i+1})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex&amp;gt; i \leqslant t \cdot g(n) &amp;lt;i+1 \quad \quad &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Делим неравенство на &amp;lt;tex&amp;gt;t&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{i}{t} \leqslant g(n) &amp;lt; \dfrac{i+1}{t}&amp;lt;/tex&amp;gt;, то есть &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{[ \log_2 n^t ]}{t} \leqslant g(n) &amp;lt; \dfrac{[ \log_2 n^t ]+1}{t}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Отсюда ясно, что если &amp;lt;tex&amp;gt; t\rightarrow \infty&amp;lt;/tex&amp;gt;, то получаем &amp;lt;tex&amp;gt;g(n) = \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -k \sum\limits_{i=1}^{n} p_i\log_2p_i = k \sum\limits_{i=1}^{n} p_i\log_2\dfrac{1}{p_i}&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Теперь рассмотрим функцию &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Приведем дроби внутри функции к одному знаменателю, получаем: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n}) = H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Далее по свойству энтропии и доказанной лемме:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(b)= H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) + \sum\limits_{i=1}^{n} \dfrac{x_i}{b} g(x_i)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) = \log_2b - \sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2x_i = -\sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2 \dfrac{x_i}{b}&amp;lt;/tex&amp;gt;&lt;br /&gt;
При &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; p_i = \dfrac{x_i}{b} &amp;lt;/tex&amp;gt; получаем, что &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = \sum\limits_{i=1}^{n} p_i \log_2 \dfrac{1}{p_i}&amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Примеры ==&lt;br /&gt;
=== Энтропия честной монеты ===&lt;br /&gt;
Рассмотрим [[Вероятностное пространство, элементарный исход, событие|вероятностное пространство]] {{---}} честная монета. &lt;br /&gt;
Найдем для нее энтропию:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot \log_2 \dfrac{1}{2}} = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot (-1)} = 1&amp;lt;/tex&amp;gt;&lt;br /&gt;
Это означает что после броска честной монеты мы получим информацию в размере &amp;lt;tex&amp;gt;1&amp;lt;/tex&amp;gt; бит, уменьшив степень неопределенности вдвое.&lt;br /&gt;
&lt;br /&gt;
=== Энтропия нечестной монеты ===&lt;br /&gt;
Найдем энтропию для [[Вероятностное пространство, элементарный исход, событие|вероятностного пространства]] нечестная монета с [[Схема Бернулли| распределением Бернулли]] &amp;lt;tex&amp;gt;\{0,2; 0,8\}&amp;lt;/tex&amp;gt;:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -0.2\log_2(0.2)-0.8\log_2(0.8) \approx 0.722 &amp;lt; 1 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Ограниченность энтропии ==&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt;0 \leqslant  H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
1) Докажем первую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
Так как &amp;lt;tex&amp;gt; p_i\in[0,\;1]&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\log_2\dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;. Таким образом &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(p_1, p_2, \dots, p_n) = \sum\limits_{i=1}^{n} p_i\log_2 \dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
2) Докажем вторую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; f(x)=\log_2x &amp;lt;/tex&amp;gt; {{---}} выпуклая вверх функция, &amp;lt;tex&amp;gt; p_1,p_2,\ldots,p_n&amp;gt;0&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \sum \limits_{i=1}^{n} p_i = 1 &amp;lt;/tex&amp;gt;, тогда для нее выполняется неравенство Йенсена:&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; \sum\limits_{i=1}^{n} p_i f(\dfrac{1}{p_i}) \leqslant  f(\sum\limits_{i=1}^{n} (p_i \cdot\dfrac{1}{p_i})) &amp;lt;/tex&amp;gt;&lt;br /&gt;
Таким образом получаем, что &amp;lt;tex&amp;gt; H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
Тогда из теоремы и доказанной выше леммы следует, что для n исходов энтропия максимальна, если они все равновероятны.&lt;br /&gt;
== Условная и взаимная энтропия ==&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Условная энтропия''' (англ. ''conditional entropy'') {{---}} определяет количество остающейся энтропии (то есть, остающейся неопределенности) события &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; после того, как становится известным результат события &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;. Она называется ''энтропия &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; при условии &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;'', и обозначается &amp;lt;tex&amp;gt;H(A|B)&amp;lt;/tex&amp;gt;&lt;br /&gt;
}} &lt;br /&gt;
&amp;lt;tex&amp;gt;H(A|B)= - \sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Взаимная энтропия''' (англ. ''joint entropy'') {{---}} энтропия объединения двух событий &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;.  &lt;br /&gt;
}}&lt;br /&gt;
&amp;lt;tex&amp;gt; H(A \cap B) = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Утверждение&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt; H(A \cap B) = H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof= По формуле условной вероятности &amp;lt;tex dpi=&amp;quot;130&amp;quot;&amp;gt; p(a_j|b_i)=\dfrac{p(a_j \cap b_i)}{p(b_i)} &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(A|B)=-\sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt; &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= - \sum\limits_{i=1}^{m}p(b_i) \sum\limits_{j=1}^{n} \dfrac{p(a_j \cap b_i)}{p(b_i)}\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = &amp;lt;/tex&amp;gt; &lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) + \sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= H(A \cap B) +\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) = &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)\sum\limits_{j=1}^{n} p(a_j \cap b_i) = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)p(b_i) = &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(A \cap B) - H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Таким образом получаем, что: &amp;lt;tex&amp;gt; H(A \cap B)= H(A|B)+H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Аналогично: &amp;lt;tex&amp;gt;H(B \cap A)= H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Из двух полученных равенств следует, что &amp;lt;tex&amp;gt; H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== См. также ==&lt;br /&gt;
*[[Вероятностное пространство, элементарный исход, событие|Вероятностное пространство, элементарный исход, событие]]&lt;br /&gt;
*[[Условная вероятность|Условная вероятность]]&lt;br /&gt;
&lt;br /&gt;
== Источники информации ==&lt;br /&gt;
* Конспект лекций по теории случайных процессов А.А. Соловьев&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Random_walk &amp;quot;Википедия - Random_walk&amp;quot;]&lt;br /&gt;
* [] &lt;br /&gt;
[[Категория:Дискретная математика и алгоритмы]]&lt;br /&gt;
&lt;br /&gt;
[[Категория: Теория вероятности ]]&lt;/div&gt;</summary>
		<author><name>77.222.96.22</name></author>	</entry>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74150</id>
		<title>Участник:Mk17.ru</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74150"/>
				<updated>2020-05-18T22:03:49Z</updated>
		
		<summary type="html">&lt;p&gt;77.222.96.22: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;__TOC__&lt;br /&gt;
== Определение ==&lt;br /&gt;
&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Случайное блуждание''' (англ. ''Random walk'') {{---}} математическая модель процесса случайных изменений — шагов в дискретные моменты времени. При этом предполагается, что изменение на каждом шаге не зависит от предыдущих и от времени. В силу простоты анализа эта модель часто используется в разных сферах в математике, экономике, физике, но, как правило, такая модель является существенным упрощением реального процесса.&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Двумерный случай случайных блужданий ==&lt;br /&gt;
&lt;br /&gt;
''''''&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt;\xi_n = \xi_{n-1} + \eta_n = \xi_0 + S_n, \eta_n = \begin{cases} 1 &amp;amp;\text{с вероятностью p}\\-1 &amp;amp;\text{с вероятностью 1 - p}&lt;br /&gt;
 \end{cases}&amp;lt;/tex&amp;gt; определена и непрерывна для всех таких наборов &amp;lt;tex&amp;gt;p_i\in[0,\;1]&amp;lt;/tex&amp;gt;, что &amp;lt;tex&amp;gt; \sum\limits_{i = 1}^{n} p_i  = 1&amp;lt;/tex&amp;gt; &lt;br /&gt;
&lt;br /&gt;
* &amp;lt;tex dpi =&amp;quot;130&amp;quot;&amp;gt;H(\underbrace{\dfrac{1}{n}, \dfrac{1}{n}, \dots, \dfrac{1}{n}}_\text{n}) &amp;lt; H(\underbrace{\dfrac{1}{n+1}, \dfrac{1}{n+1}, \dots, \dfrac{1}{n+1}}_\text{n+1})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
* &amp;lt;tex dpi =&amp;quot;130&amp;quot;&amp;gt; H(p_{1}q_{11}, p_{1}q_{12}, \dots, p_{n}q_{nk_n}) = H(p_1, p_2, \dots, p_n) + \sum\limits_{i=1}^{n} p_iH(q_{i1}, \dots, q_{ik_i})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&amp;lt;tex&amp;gt;\rhd&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Рассмотрим схему &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt; c &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt; исходами и вероятностями &amp;lt;tex&amp;gt;\{p_1, p_2, \dots, p_m\}&amp;lt;/tex&amp;gt; и схему &amp;lt;tex&amp;gt;\mathcal{R}_k&amp;lt;/tex&amp;gt; с &amp;lt;tex&amp;gt;k&amp;lt;/tex&amp;gt; исходами и вероятностями &amp;lt;tex&amp;gt;\{q_1, q_2, \dots, q_k\}&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Образуем комбинированную схему c &amp;lt;tex&amp;gt;m + k - 1&amp;lt;/tex&amp;gt; исходами следующим образом:&lt;br /&gt;
&lt;br /&gt;
Выбирается случайным образом один из исходов схемы &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt;, и если произошел &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt;-й исход, выбирается случайно один из исходов схемы &amp;lt;tex&amp;gt;\mathcal{R}_k&amp;lt;/tex&amp;gt;, а остальные &amp;lt;tex&amp;gt;m - 1&amp;lt;/tex&amp;gt; исходов схемы &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt; считаются окончательными.&lt;br /&gt;
&lt;br /&gt;
В этой комбинированной схеме &amp;lt;tex&amp;gt;\mathcal{PR}&amp;lt;/tex&amp;gt; мы получаем исходы &amp;lt;tex&amp;gt;1, 2, \dots, m - 1, (m, 1), (m, 2), \dots, (m, k)&amp;lt;/tex&amp;gt; с вероятностями &amp;lt;tex&amp;gt;p_1, p_2, \dots, p_{m-1}, p_mq_1, p_mq_2, \dots, p_mq_k&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Легко видеть, что &amp;lt;tex&amp;gt;H(\mathcal{PR}) = H(\mathcal{P}_m) + p_mH(\mathcal{R}_k)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
 &lt;br /&gt;
Потребуем выполнения этого свойства для любой меры неопределенности.&lt;br /&gt;
&amp;lt;tex&amp;gt;\lhd&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==Вычисление энтропии==&lt;br /&gt;
&lt;br /&gt;
Для доказательства формулы вычисления энтропии сначала докажем лемму.&lt;br /&gt;
{{Лемма&lt;br /&gt;
|statement = &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(n) = H(\dfrac{1}{n}, \dfrac{1}{n}, \dots, \dfrac{1}{n}) = -k \log_2 \dfrac{1}{n} = k \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
Будем рассматривать для &amp;lt;tex&amp;gt;k=1&amp;lt;/tex&amp;gt; (бит).&lt;br /&gt;
&lt;br /&gt;
Рассмотрим функцию &amp;lt;tex&amp;gt;g(mn)&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex&amp;gt;g(mn)=g(m)+ \sum\limits_{i=1}^{m} \dfrac{1}{m} g(n) = g(m)+g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Пусть: &amp;lt;tex&amp;gt;g(2)=1 \quad&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex&amp;gt;g(2^t)=t&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \quad g(n^t)=t \cdot g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Рассмотрим такое &amp;lt;tex&amp;gt; i &amp;lt;/tex&amp;gt;, что &amp;lt;tex&amp;gt;2^i \leqslant  n^t &amp;lt; 2^{i+1}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Можно заметить, что если &amp;lt;tex&amp;gt; i=[ \log_2 n^t ] &amp;lt;/tex&amp;gt;, то неравенство останется верным.&lt;br /&gt;
&lt;br /&gt;
По предыдущим рассуждениям получаем, что:&lt;br /&gt;
:&amp;lt;tex&amp;gt;g(2^i) \leqslant g(n^t) &amp;lt; g(2^{i+1})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex&amp;gt; i \leqslant t \cdot g(n) &amp;lt;i+1 \quad \quad &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Делим неравенство на &amp;lt;tex&amp;gt;t&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{i}{t} \leqslant g(n) &amp;lt; \dfrac{i+1}{t}&amp;lt;/tex&amp;gt;, то есть &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{[ \log_2 n^t ]}{t} \leqslant g(n) &amp;lt; \dfrac{[ \log_2 n^t ]+1}{t}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Отсюда ясно, что если &amp;lt;tex&amp;gt; t\rightarrow \infty&amp;lt;/tex&amp;gt;, то получаем &amp;lt;tex&amp;gt;g(n) = \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -k \sum\limits_{i=1}^{n} p_i\log_2p_i = k \sum\limits_{i=1}^{n} p_i\log_2\dfrac{1}{p_i}&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Теперь рассмотрим функцию &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Приведем дроби внутри функции к одному знаменателю, получаем: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n}) = H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Далее по свойству энтропии и доказанной лемме:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(b)= H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) + \sum\limits_{i=1}^{n} \dfrac{x_i}{b} g(x_i)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) = \log_2b - \sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2x_i = -\sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2 \dfrac{x_i}{b}&amp;lt;/tex&amp;gt;&lt;br /&gt;
При &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; p_i = \dfrac{x_i}{b} &amp;lt;/tex&amp;gt; получаем, что &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = \sum\limits_{i=1}^{n} p_i \log_2 \dfrac{1}{p_i}&amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Примеры ==&lt;br /&gt;
=== Энтропия честной монеты ===&lt;br /&gt;
Рассмотрим [[Вероятностное пространство, элементарный исход, событие|вероятностное пространство]] {{---}} честная монета. &lt;br /&gt;
Найдем для нее энтропию:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot \log_2 \dfrac{1}{2}} = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot (-1)} = 1&amp;lt;/tex&amp;gt;&lt;br /&gt;
Это означает что после броска честной монеты мы получим информацию в размере &amp;lt;tex&amp;gt;1&amp;lt;/tex&amp;gt; бит, уменьшив степень неопределенности вдвое.&lt;br /&gt;
&lt;br /&gt;
=== Энтропия нечестной монеты ===&lt;br /&gt;
Найдем энтропию для [[Вероятностное пространство, элементарный исход, событие|вероятностного пространства]] нечестная монета с [[Схема Бернулли| распределением Бернулли]] &amp;lt;tex&amp;gt;\{0,2; 0,8\}&amp;lt;/tex&amp;gt;:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -0.2\log_2(0.2)-0.8\log_2(0.8) \approx 0.722 &amp;lt; 1 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Ограниченность энтропии ==&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt;0 \leqslant  H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
1) Докажем первую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
Так как &amp;lt;tex&amp;gt; p_i\in[0,\;1]&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\log_2\dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;. Таким образом &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(p_1, p_2, \dots, p_n) = \sum\limits_{i=1}^{n} p_i\log_2 \dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
2) Докажем вторую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; f(x)=\log_2x &amp;lt;/tex&amp;gt; {{---}} выпуклая вверх функция, &amp;lt;tex&amp;gt; p_1,p_2,\ldots,p_n&amp;gt;0&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \sum \limits_{i=1}^{n} p_i = 1 &amp;lt;/tex&amp;gt;, тогда для нее выполняется неравенство Йенсена:&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; \sum\limits_{i=1}^{n} p_i f(\dfrac{1}{p_i}) \leqslant  f(\sum\limits_{i=1}^{n} (p_i \cdot\dfrac{1}{p_i})) &amp;lt;/tex&amp;gt;&lt;br /&gt;
Таким образом получаем, что &amp;lt;tex&amp;gt; H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
Тогда из теоремы и доказанной выше леммы следует, что для n исходов энтропия максимальна, если они все равновероятны.&lt;br /&gt;
== Условная и взаимная энтропия ==&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Условная энтропия''' (англ. ''conditional entropy'') {{---}} определяет количество остающейся энтропии (то есть, остающейся неопределенности) события &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; после того, как становится известным результат события &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;. Она называется ''энтропия &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; при условии &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;'', и обозначается &amp;lt;tex&amp;gt;H(A|B)&amp;lt;/tex&amp;gt;&lt;br /&gt;
}} &lt;br /&gt;
&amp;lt;tex&amp;gt;H(A|B)= - \sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Взаимная энтропия''' (англ. ''joint entropy'') {{---}} энтропия объединения двух событий &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;.  &lt;br /&gt;
}}&lt;br /&gt;
&amp;lt;tex&amp;gt; H(A \cap B) = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Утверждение&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt; H(A \cap B) = H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof= По формуле условной вероятности &amp;lt;tex dpi=&amp;quot;130&amp;quot;&amp;gt; p(a_j|b_i)=\dfrac{p(a_j \cap b_i)}{p(b_i)} &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(A|B)=-\sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt; &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= - \sum\limits_{i=1}^{m}p(b_i) \sum\limits_{j=1}^{n} \dfrac{p(a_j \cap b_i)}{p(b_i)}\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = &amp;lt;/tex&amp;gt; &lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) + \sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= H(A \cap B) +\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) = &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)\sum\limits_{j=1}^{n} p(a_j \cap b_i) = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)p(b_i) = &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(A \cap B) - H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Таким образом получаем, что: &amp;lt;tex&amp;gt; H(A \cap B)= H(A|B)+H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Аналогично: &amp;lt;tex&amp;gt;H(B \cap A)= H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Из двух полученных равенств следует, что &amp;lt;tex&amp;gt; H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== См. также ==&lt;br /&gt;
*[[Вероятностное пространство, элементарный исход, событие|Вероятностное пространство, элементарный исход, событие]]&lt;br /&gt;
*[[Условная вероятность|Условная вероятность]]&lt;br /&gt;
&lt;br /&gt;
== Источники информации ==&lt;br /&gt;
* Конспект лекций по теории случайных процессов А.А. Соловьев&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Random_walk &amp;quot;Википедия - Random_walk&amp;quot;]&lt;br /&gt;
* [] &lt;br /&gt;
[[Категория:Дискретная математика и алгоритмы]]&lt;br /&gt;
&lt;br /&gt;
[[Категория: Теория вероятности ]]&lt;/div&gt;</summary>
		<author><name>77.222.96.22</name></author>	</entry>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74149</id>
		<title>Участник:Mk17.ru</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Mk17.ru&amp;diff=74149"/>
				<updated>2020-05-18T21:58:05Z</updated>
		
		<summary type="html">&lt;p&gt;77.222.96.22: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;__TOC__&lt;br /&gt;
== Определение ==&lt;br /&gt;
&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Случайное блуждание''' (англ. ''Random walk'') {{---}} математическая модель процесса случайных изменений — шагов в дискретные моменты времени. При этом предполагается, что изменение на каждом шаге не зависит от предыдущих и от времени. В силу простоты анализа эта модель часто используется в разных сферах в математике, экономике, физике, но, как правило, такая модель является существенным упрощением реального процесса.&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Двумерный случай случайных блужданий ==&lt;br /&gt;
&lt;br /&gt;
''''''&lt;br /&gt;
&lt;br /&gt;
*&amp;lt;tex&amp;gt;\xi_n = \xi_{n-1} + \eta_n = \xi_0 + S_n, \eta_n = \begin{cases} 1 &amp;amp;\text{se $\omega\in A$}\\1250 &amp;amp;\text{se $\omega \in A^c$}&lt;br /&gt;
 \end{cases}&amp;lt;/tex&amp;gt; определена и непрерывна для всех таких наборов &amp;lt;tex&amp;gt;p_i\in[0,\;1]&amp;lt;/tex&amp;gt;, что &amp;lt;tex&amp;gt; \sum\limits_{i = 1}^{n} p_i  = 1&amp;lt;/tex&amp;gt; &lt;br /&gt;
&lt;br /&gt;
* &amp;lt;tex dpi =&amp;quot;130&amp;quot;&amp;gt;H(\underbrace{\dfrac{1}{n}, \dfrac{1}{n}, \dots, \dfrac{1}{n}}_\text{n}) &amp;lt; H(\underbrace{\dfrac{1}{n+1}, \dfrac{1}{n+1}, \dots, \dfrac{1}{n+1}}_\text{n+1})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
* &amp;lt;tex dpi =&amp;quot;130&amp;quot;&amp;gt; H(p_{1}q_{11}, p_{1}q_{12}, \dots, p_{n}q_{nk_n}) = H(p_1, p_2, \dots, p_n) + \sum\limits_{i=1}^{n} p_iH(q_{i1}, \dots, q_{ik_i})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&amp;lt;tex&amp;gt;\rhd&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Рассмотрим схему &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt; c &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt; исходами и вероятностями &amp;lt;tex&amp;gt;\{p_1, p_2, \dots, p_m\}&amp;lt;/tex&amp;gt; и схему &amp;lt;tex&amp;gt;\mathcal{R}_k&amp;lt;/tex&amp;gt; с &amp;lt;tex&amp;gt;k&amp;lt;/tex&amp;gt; исходами и вероятностями &amp;lt;tex&amp;gt;\{q_1, q_2, \dots, q_k\}&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Образуем комбинированную схему c &amp;lt;tex&amp;gt;m + k - 1&amp;lt;/tex&amp;gt; исходами следующим образом:&lt;br /&gt;
&lt;br /&gt;
Выбирается случайным образом один из исходов схемы &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt;, и если произошел &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt;-й исход, выбирается случайно один из исходов схемы &amp;lt;tex&amp;gt;\mathcal{R}_k&amp;lt;/tex&amp;gt;, а остальные &amp;lt;tex&amp;gt;m - 1&amp;lt;/tex&amp;gt; исходов схемы &amp;lt;tex&amp;gt;\mathcal{P}_m&amp;lt;/tex&amp;gt; считаются окончательными.&lt;br /&gt;
&lt;br /&gt;
В этой комбинированной схеме &amp;lt;tex&amp;gt;\mathcal{PR}&amp;lt;/tex&amp;gt; мы получаем исходы &amp;lt;tex&amp;gt;1, 2, \dots, m - 1, (m, 1), (m, 2), \dots, (m, k)&amp;lt;/tex&amp;gt; с вероятностями &amp;lt;tex&amp;gt;p_1, p_2, \dots, p_{m-1}, p_mq_1, p_mq_2, \dots, p_mq_k&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Легко видеть, что &amp;lt;tex&amp;gt;H(\mathcal{PR}) = H(\mathcal{P}_m) + p_mH(\mathcal{R}_k)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
 &lt;br /&gt;
Потребуем выполнения этого свойства для любой меры неопределенности.&lt;br /&gt;
&amp;lt;tex&amp;gt;\lhd&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==Вычисление энтропии==&lt;br /&gt;
&lt;br /&gt;
Для доказательства формулы вычисления энтропии сначала докажем лемму.&lt;br /&gt;
{{Лемма&lt;br /&gt;
|statement = &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(n) = H(\dfrac{1}{n}, \dfrac{1}{n}, \dots, \dfrac{1}{n}) = -k \log_2 \dfrac{1}{n} = k \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
Будем рассматривать для &amp;lt;tex&amp;gt;k=1&amp;lt;/tex&amp;gt; (бит).&lt;br /&gt;
&lt;br /&gt;
Рассмотрим функцию &amp;lt;tex&amp;gt;g(mn)&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex&amp;gt;g(mn)=g(m)+ \sum\limits_{i=1}^{m} \dfrac{1}{m} g(n) = g(m)+g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Пусть: &amp;lt;tex&amp;gt;g(2)=1 \quad&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex&amp;gt;g(2^t)=t&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \quad g(n^t)=t \cdot g(n)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Рассмотрим такое &amp;lt;tex&amp;gt; i &amp;lt;/tex&amp;gt;, что &amp;lt;tex&amp;gt;2^i \leqslant  n^t &amp;lt; 2^{i+1}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Можно заметить, что если &amp;lt;tex&amp;gt; i=[ \log_2 n^t ] &amp;lt;/tex&amp;gt;, то неравенство останется верным.&lt;br /&gt;
&lt;br /&gt;
По предыдущим рассуждениям получаем, что:&lt;br /&gt;
:&amp;lt;tex&amp;gt;g(2^i) \leqslant g(n^t) &amp;lt; g(2^{i+1})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex&amp;gt; i \leqslant t \cdot g(n) &amp;lt;i+1 \quad \quad &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Делим неравенство на &amp;lt;tex&amp;gt;t&amp;lt;/tex&amp;gt;:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{i}{t} \leqslant g(n) &amp;lt; \dfrac{i+1}{t}&amp;lt;/tex&amp;gt;, то есть &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\dfrac{[ \log_2 n^t ]}{t} \leqslant g(n) &amp;lt; \dfrac{[ \log_2 n^t ]+1}{t}&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Отсюда ясно, что если &amp;lt;tex&amp;gt; t\rightarrow \infty&amp;lt;/tex&amp;gt;, то получаем &amp;lt;tex&amp;gt;g(n) = \log_2n&amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -k \sum\limits_{i=1}^{n} p_i\log_2p_i = k \sum\limits_{i=1}^{n} p_i\log_2\dfrac{1}{p_i}&amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Теперь рассмотрим функцию &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Приведем дроби внутри функции к одному знаменателю, получаем: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(\dfrac{a_1}{b_1}, \dfrac{a_2}{b_2}, \dots, \dfrac{a_n}{b_n}) = H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b})&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Далее по свойству энтропии и доказанной лемме:&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;g(b)= H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) + \sum\limits_{i=1}^{n} \dfrac{x_i}{b} g(x_i)&amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
: &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(\dfrac{x_1}{b}, \dfrac{x_2}{b}, \dots, \dfrac{x_n}{b}) = \log_2b - \sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2x_i = -\sum\limits_{i=1}^{n} \dfrac{x_i}{b} \log_2 \dfrac{x_i}{b}&amp;lt;/tex&amp;gt;&lt;br /&gt;
При &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; p_i = \dfrac{x_i}{b} &amp;lt;/tex&amp;gt; получаем, что &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(p_1, p_2, \dots, p_n) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = \sum\limits_{i=1}^{n} p_i \log_2 \dfrac{1}{p_i}&amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Примеры ==&lt;br /&gt;
=== Энтропия честной монеты ===&lt;br /&gt;
Рассмотрим [[Вероятностное пространство, элементарный исход, событие|вероятностное пространство]] {{---}} честная монета. &lt;br /&gt;
Найдем для нее энтропию:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot \log_2 \dfrac{1}{2}} = -\sum\limits_{i=1}^{2} {\dfrac{1}{2} \cdot (-1)} = 1&amp;lt;/tex&amp;gt;&lt;br /&gt;
Это означает что после броска честной монеты мы получим информацию в размере &amp;lt;tex&amp;gt;1&amp;lt;/tex&amp;gt; бит, уменьшив степень неопределенности вдвое.&lt;br /&gt;
&lt;br /&gt;
=== Энтропия нечестной монеты ===&lt;br /&gt;
Найдем энтропию для [[Вероятностное пространство, элементарный исход, событие|вероятностного пространства]] нечестная монета с [[Схема Бернулли| распределением Бернулли]] &amp;lt;tex&amp;gt;\{0,2; 0,8\}&amp;lt;/tex&amp;gt;:&lt;br /&gt;
:&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(X) = -\sum\limits_{i=1}^{n} p_i \log_2p_i = -0.2\log_2(0.2)-0.8\log_2(0.8) \approx 0.722 &amp;lt; 1 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Ограниченность энтропии ==&lt;br /&gt;
{{Теорема&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt;0 \leqslant  H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof =&lt;br /&gt;
1) Докажем первую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
Так как &amp;lt;tex&amp;gt; p_i\in[0,\;1]&amp;lt;/tex&amp;gt;, тогда &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;\log_2\dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;. Таким образом &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(p_1, p_2, \dots, p_n) = \sum\limits_{i=1}^{n} p_i\log_2 \dfrac{1}{p_i} \geqslant 0 &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
2) Докажем вторую часть неравенства:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; f(x)=\log_2x &amp;lt;/tex&amp;gt; {{---}} выпуклая вверх функция, &amp;lt;tex&amp;gt; p_1,p_2,\ldots,p_n&amp;gt;0&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt; \sum \limits_{i=1}^{n} p_i = 1 &amp;lt;/tex&amp;gt;, тогда для нее выполняется неравенство Йенсена:&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; \sum\limits_{i=1}^{n} p_i f(\dfrac{1}{p_i}) \leqslant  f(\sum\limits_{i=1}^{n} (p_i \cdot\dfrac{1}{p_i})) &amp;lt;/tex&amp;gt;&lt;br /&gt;
Таким образом получаем, что &amp;lt;tex&amp;gt; H(p_1, p_2, \dots, p_n) \leqslant  \log_2n &amp;lt;/tex&amp;gt;&lt;br /&gt;
}}&lt;br /&gt;
Тогда из теоремы и доказанной выше леммы следует, что для n исходов энтропия максимальна, если они все равновероятны.&lt;br /&gt;
== Условная и взаимная энтропия ==&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Условная энтропия''' (англ. ''conditional entropy'') {{---}} определяет количество остающейся энтропии (то есть, остающейся неопределенности) события &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; после того, как становится известным результат события &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;. Она называется ''энтропия &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; при условии &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;'', и обозначается &amp;lt;tex&amp;gt;H(A|B)&amp;lt;/tex&amp;gt;&lt;br /&gt;
}} &lt;br /&gt;
&amp;lt;tex&amp;gt;H(A|B)= - \sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Определение&lt;br /&gt;
|definition = '''Взаимная энтропия''' (англ. ''joint entropy'') {{---}} энтропия объединения двух событий &amp;lt;tex&amp;gt;A&amp;lt;/tex&amp;gt; и &amp;lt;tex&amp;gt;B&amp;lt;/tex&amp;gt;.  &lt;br /&gt;
}}&lt;br /&gt;
&amp;lt;tex&amp;gt; H(A \cap B) = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) &amp;lt;/tex&amp;gt;&lt;br /&gt;
{{Утверждение&lt;br /&gt;
|statement= &amp;lt;tex&amp;gt; H(A \cap B) = H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
|proof= По формуле условной вероятности &amp;lt;tex dpi=&amp;quot;130&amp;quot;&amp;gt; p(a_j|b_i)=\dfrac{p(a_j \cap b_i)}{p(b_i)} &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; H(A|B)=-\sum\limits_{i=1}^{m}p(b_i)\sum\limits_{j=1}^{n} p(a_j|b_i)\log_2p(a_j|b_i) &amp;lt;/tex&amp;gt; &amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= - \sum\limits_{i=1}^{m}p(b_i) \sum\limits_{j=1}^{n} \dfrac{p(a_j \cap b_i)}{p(b_i)}\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2 \dfrac {p(a_j \cap b_i)}{p(b_i)} = &amp;lt;/tex&amp;gt; &lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = -\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(a_j \cap b_i) + \sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;= H(A \cap B) +\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} p(a_j \cap b_i)\log_2p(b_i) = &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt; = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)\sum\limits_{j=1}^{n} p(a_j \cap b_i) = H(A \cap B) +\sum\limits_{i=1}^{m} \log_2p(b_i)p(b_i) = &amp;lt;/tex&amp;gt;&amp;lt;tex dpi=&amp;quot;140&amp;quot;&amp;gt;H(A \cap B) - H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Таким образом получаем, что: &amp;lt;tex&amp;gt; H(A \cap B)= H(A|B)+H(B) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Аналогично: &amp;lt;tex&amp;gt;H(B \cap A)= H(B|A)+H(A) &amp;lt;/tex&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Из двух полученных равенств следует, что &amp;lt;tex&amp;gt; H(A|B)+H(B)=H(B|A)+H(A) &amp;lt;/tex&amp;gt; &lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== См. также ==&lt;br /&gt;
*[[Вероятностное пространство, элементарный исход, событие|Вероятностное пространство, элементарный исход, событие]]&lt;br /&gt;
*[[Условная вероятность|Условная вероятность]]&lt;br /&gt;
&lt;br /&gt;
== Источники информации ==&lt;br /&gt;
* И.В. Романовский &amp;quot;Дискретный анализ&amp;quot;&lt;br /&gt;
* [http://ru.wikipedia.org/wiki/Информационная_энтропия Википедия {{---}} Информационная энтропия]&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Entropy_(information_theory) Wkipedia {{---}} Entropy(information_theory)] &lt;br /&gt;
[[Категория:Дискретная математика и алгоритмы]]&lt;br /&gt;
&lt;br /&gt;
[[Категория: Теория вероятности ]]&lt;/div&gt;</summary>
		<author><name>77.222.96.22</name></author>	</entry>

	</feed>