Эргодическая марковская цепь — различия между версиями

Текущая версия на 19:15, 4 сентября 2022

Определение:

Эргодическая марковская цепь (англ. ergodic Markov chain) — марковская цепь, целиком состоящая из одного эргодического класса.

Содержание

1 Стационарный режим
2 Классификация эргодических цепей
3 Эргодическая теорема
- 3.1 Для регулярных цепей
- 3.2 Для циклических цепей
  - 3.2.1 Следствия
4 Пример
5 См. также
6 Источники информации

Стационарный режим

Эргодические марковские цепи описываются сильно связным графом. Это означает, что в такой системе возможен переход из любого состояния [math]S_i[/math] в любое состояние за конечное число шагов.

Для эргодических цепей при достаточно большом времени функционирования ([math]t \to \infty[/math]) наступает стационарный режим, при котором вероятности [math]\alpha_i[/math] состояний системы не зависят от времени и не зависят от распределения вероятностей в начальный момент времени, то есть: [math]\alpha_i = const[/math].

Классификация эргодических цепей

Определение:

В эргодической цепи можно выделить циклические классы (англ. cyclic classes). Количество циклических классов называют периодом цепи (англ. period of Markov chain), если цепь состоит целиком из одного циклического класса, её называют регулярной. С течением времени текущее состояние движется по циклическим классам в определенном порядке, причем каждые шагов она оказывается в одном и том же циклическом классе.

Таким образом, эргодические цепи делятся на регулярные и циклические.

Эргодическая теорема

Определение:

Эргодическое (стационарное) распределение (англ. stationary distribution) — распределение , такое что и (где — вероятность оказаться в -ом состоянии, выйдя из -ого, через переходов).

Для регулярных цепей

Доказательство теоремы для случая регулярных цепей приведено в конспекте про регулярные цепи.

Для циклических цепей

Теорема (Эргодическая теорема):

Для любой эргодической цепи последовательность степеней суммируется по Эйлеру к предельной матрице , и эта предельная матрица имеет вид , где — положительный вероятностный вектор, - вектор-столбец из единиц.

Доказательство:

В случае циклической цепи переходы из одного циклического класса в другой возможны только при определенных значениях [math] n [/math], которые периодически повторяются. Таким образом, никакая степень матрицы переходов [math]P[/math] не является положительной матрицей, и различные степени содержат нули на различных местах. С увеличением степени расположение этих нулей периодически повторяется. Следовательно, последовательность [math]P^{n}[/math] не может сходиться в обычном смысле, для нее требуется так называемая суммируемость по Эйлеру.

Рассмотрим матрицу [math](kI + (1 - k)P)[/math] при некотором [math]k, ~ 0 \lt k \lt 1[/math]. Эта матрица является переходной матрицей. Она имеет положительные элементы на всех тех же местах, что и [math]P[/math], следовательно, она также задает эргодическую цепь. Также диагональные элементы этой матрицы положительны. Значит, в каждое состояние можно возвратиться за один шаг, а это значит, что [math]d = 1[/math]. Таким образом, новая цепь является регулярной.

Из эргодической теоремы для регулярных цепей следует, что [math](kI + (1 - k)P)^{n}[/math] стремится к матрице [math]A = \xi\alpha[/math], где [math]\alpha[/math] — положительный вероятностный вектор. Таким образом:

Но последнее равенство в точности означает, что последовательность суммируема по Эйлеру к , причем суммируема при каждом значении .

Следствия

Теорема:

Если — объекты из предыдущей теоремы. Тогда справедливы факты:

Для любого вероятностного вектора [math]\pi[/math] последовательность [math]\pi P^{n}[/math] суммируема по Эйлеру к [math]\alpha[/math]
Вектор [math]\alpha[/math] является единственным неподвижным вектором матрицы [math]P[/math]
[math]PA = AP = A[/math]

Доказательство:

Домножим [math](1)[/math] на [math]\pi[/math]. Таким образом, мы получим, что предел последовательности [math]\pi P^{n}[/math] в смысле Эйлера равен [math]\pi A = \pi \xi \alpha[/math]. Значит, первый факт доказан.

Так как вектор [math]\alpha[/math] был получен из предельной матрицы для [math](kI + (1 - k)P)[/math], являющейся регулярной переходной матрицей, то он будет её единственным неподвижным вероятностным вектором. Но матрица [math](kI + (1 - k)P)[/math] должна иметь те же неподвижные векторы, что и [math]P[/math], так как из соотношения

,

следует, что

и поскольку [math]k \ne 1[/math], то [math]\pi P = \pi[/math]. Получается, что второй факт доказан.

Третий факт следует из того, что для любой переходной матрицы и что .

Пример

Пример циклической цепи

Самым простым примером циклической цепи является цепь из двух состояний, с переходной матрицей:

.

Стационарным распределением этой цепи будет [math] \alpha = (0.5, 0.5) [/math].

См. также

Источники информации

Википедия — Эргодическое распределение
Википедия — Дискретное распределение
Wikipedia — Euler summation
Дж. Кемени, Дж. Снелл — Конечные цепи Маркова — изд. "Наука", 1970 г. — 129 c.

@@ Строка 1: / Строка 1: @@
-== Эргодическая цепь Маркова ==
 {{Определение
-|definition=Марковская цепь называется эргодической, если существует дискретное распределение (называемое эргодическим) <tex>\pi = (\pi_1,\pi_2,\ldots )^{\top}</tex>, такое что <tex>\pi_i > 0,\; i \in \mathbb{N}</tex> и
+|definition=
-:<tex>\lim\limits_{n \to \infty} p_{ij}^{(n)} = \pi_j, \quad \forall i=1,2, \ldots</tex>.
+'''Эргодическая''' [[Марковская цепь|марковская цепь]] (англ. ''ergodic Markov chain'') {{---}} марковская цепь, целиком состоящая из одного  [[Марковская цепь#sort_def| эргодического класса]].
 }}
-=== Пример: ===
-Рассмотрим эксперимент по бросанию честной монеты. Тогда соответствующая этому эксперименту марковская цепь будет иметь 2 состояния.
-Рассмотрим матрицу, следующего вида: <tex>p_{ij}=0.5, i,j=1,2</tex>.
-Такая матрица является стохастической, а, значит, корректно определяет марковскую цепь. Такая цепь является эргодической по определению эргодической марковской цепи.
+==Стационарный режим==
+Эргодические марковские цепи описываются [[Отношение связности, компоненты связности|сильно связным графом]]. Это означает, что в такой системе возможен переход из любого состояния <tex>S_i</tex> в любое состояние <tex>S_{j}, (i,j = 1,2,\ldots,n)</tex> за конечное число шагов.
-== См. также ==
+Для эргодических цепей при достаточно большом времени функционирования (<tex>t \to \infty</tex>) наступает '''стационарный режим''', при котором вероятности <tex>\alpha_i</tex> состояний системы не зависят от времени и не зависят от распределения вероятностей в начальный момент времени, то есть: <tex>\alpha_i = const</tex>.
-[http://ru.wikipedia.org/wiki/%D0%AD%D1%80%D0%B3%D0%BE%D0%B4%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B5_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5 Википедия: эргодическое распределение]
-[http://ru.wikipedia.org/wiki/%D0%94%D0%B8%D1%81%D0%BA%D1%80%D0%B5%D1%82%D0%BD%D0%BE%D0%B5_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5#.D0.94.D0.B8.D1.81.D0.BA.D1.80.D0.B5.D1.82.D0.BD.D1.8B.D0.B5_.D1.80.D0.B0.D1.81.D0.BF.D1.80.D0.B5.D0.B4.D0.B5.D0.BB.D0.B5.D0.BD.D0.B8.D1.8F Википедия: дискретное распределение]
+== Классификация эргодических цепей ==
-== Литература ==
+{{Определение
-Дж. Кемени, Дж. Снелл "Конечные цепи Маркова"
+|definition=
+В эргодической цепи можно выделить '''циклические классы''' (англ. ''cyclic classes''). Количество циклических классов <tex> d </tex> называют '''периодом цепи''' (англ. ''period of Markov chain''), если цепь состоит целиком из одного циклического класса, её называют [[Регулярная марковская цепь|регулярной]]. С течением времени текущее состояние движется по циклическим классам в определенном порядке, причем каждые <tex>d</tex> шагов она оказывается в одном и том же циклическом классе.
+}}
+Таким образом, эргодические цепи делятся на [[Регулярная марковская цепь|регулярные]] и '''циклические'''.
+== Эргодическая теорема ==
+{{Определение
+|definition=
+'''Эргодическое (стационарное) распределение''' (англ. ''stationary distribution'') {{---}} распределение <tex>\alpha = (\alpha_1 \ldots \alpha_n )</tex>, такое что <tex>\alpha_i > 0</tex> и
+<tex>\lim\limits_{n \to \infty} p_{ij}^{(n)} = \alpha_j</tex> (где <tex>p_{ij}^{(n)}</tex> {{---}} вероятность оказаться в <tex>j</tex>-ом состоянии, выйдя из <tex>i</tex>-ого, через <tex>n</tex> переходов).
+}}
+=== Для регулярных цепей ===
+Доказательство теоремы для случая регулярных цепей приведено в конспекте про [[Регулярная марковская цепь#Эргодическая теорема для регулярных цепей | регулярные цепи]].
+=== Для циклических цепей ===
+{{
+Теорема
+|about=Эргодическая теорема
+|statement=
+Для любой эргодической цепи последовательность степеней <tex>P^{n}</tex> [http://en.wikipedia.org/wiki/Euler_summation суммируется по Эйлеру] к предельной матрице <tex>A</tex>, и эта предельная матрица имеет вид <tex>A = \xi\alpha</tex>, где <tex>\alpha</tex> {{---}} положительный вероятностный вектор, <tex>\xi</tex> - вектор-столбец из единиц.
+|proof=
+В случае циклической цепи переходы из одного циклического класса в другой возможны только при определенных значениях <tex> n </tex>, которые периодически повторяются. Таким образом, никакая степень матрицы переходов <tex>P</tex> не является положительной матрицей, и различные степени содержат нули на различных местах. С увеличением степени расположение этих нулей периодически повторяется. Следовательно, последовательность <tex>P^{n}</tex> не может сходиться в обычном смысле, для нее требуется так называемая суммируемость по Эйлеру.
+Рассмотрим матрицу <tex>(kI + (1 - k)P)</tex> при некотором <tex>k, ~ 0 < k < 1</tex>. Эта матрица является ''переходной матрицей''. Она имеет положительные элементы на всех тех же местах, что и <tex>P</tex>, следовательно, она также ''задает эргодическую цепь''. Также диагональные элементы этой матрицы положительны. Значит, в каждое состояние можно возвратиться за один шаг, а это значит, что <tex>d = 1</tex>. Таким образом, новая цепь является регулярной.
+Из [[Регулярная марковская цепь#Эргодическая теорема для регулярных цепей | эргодической теоремы для регулярных цепей]] следует, что <tex>(kI + (1 - k)P)^{n}</tex> стремится к матрице <tex>A = \xi\alpha</tex>, где <tex>\alpha</tex> {{---}} положительный вероятностный вектор. Таким образом:
+: <tex> A = \lim\limits_{x\to \infty} (kI + (1 - k)P)^{n}</tex>
+: <tex> A = \lim\limits_{x\to \infty} \sum\limits_{i = 0}^{n} {n\choose i} k^{n - i} (1 - k)^{i} P^{i} ~~~~~ (1)</tex>
+Но последнее равенство в точности означает, что последовательность <tex>P^{n}</tex> суммируема по Эйлеру к <tex>A</tex>, причем суммируема при каждом значении <tex>k</tex>.
+}}
+==== Следствия ====
+{{Теорема
+|statement=Если <tex>P, A, \alpha</tex> {{---}} объекты из предыдущей теоремы. Тогда справедливы факты:
+* Для любого вероятностного вектора <tex>\pi</tex> последовательность <tex>\pi P^{n}</tex> суммируема по Эйлеру к <tex>\alpha</tex>
+* Вектор <tex>\alpha</tex> является единственным неподвижным вектором матрицы <tex>P</tex>
+* <tex>PA = AP = A</tex>
+|proof=
+Домножим <tex>(1)</tex> на <tex>\pi</tex>. Таким образом, мы получим, что предел последовательности <tex>\pi P^{n}</tex> в смысле Эйлера равен <tex>\pi A = \pi \xi \alpha</tex>. Значит, '''первый факт''' доказан.
+Так как вектор <tex>\alpha</tex> был получен из предельной матрицы для <tex>(kI + (1 - k)P)</tex>, являющейся регулярной переходной матрицей, то он будет её единственным неподвижным вероятностным вектором. Но матрица <tex>(kI + (1 - k)P)</tex> должна иметь те же неподвижные векторы, что и <tex>P</tex>, так как из соотношения
+:<tex>\pi (kI + (1 - k)P) = \pi</tex>,
+следует, что
+:<tex>\pi (1 - k) P = \pi (1 - k)</tex>
+и поскольку <tex>k \ne 1</tex>, то <tex>\pi P = \pi</tex>. Получается, что '''второй факт''' доказан.
+'''Третий факт''' следует из того, что <tex>P \xi = \xi</tex> для любой переходной матрицы и что <tex>\alpha P = \alpha</tex>.
+}}
+==Пример==
+[[File:Ergo.jpg‎|thumb|250px|Пример циклической цепи]]
+Самым простым примером циклической цепи является цепь из двух состояний, с переходной матрицей:
+:<tex>P = \begin{pmatrix}
+& 1 \\
+& 0
+\end{pmatrix}</tex> .
+Стационарным распределением этой цепи будет <tex> \alpha = (0.5, 0.5) </tex>.
+==См. также==
+*[[Марковская цепь]]
+*[[Регулярная марковская цепь]]
+*[[Примеры использования Марковских цепей]]
+== Источники информации ==
+*[http://ru.wikipedia.org/wiki/Эргодическое_распределение Википедия {{---}} Эргодическое распределение ]
+*[http://ru.wikipedia.org/wiki/Дискретное_распределение#.D0.94.D0.B8.D1.81.D0.BA.D1.80.D0.B5.D1.82.D0.BD.D1.8B.D0.B5_.D1.80.D0.B0.D1.81.D0.BF.D1.80.D0.B5.D0.B4.D0.B5.D0.BB.D0.B5.D0.BD.D0.B8.D1.8F Википедия {{---}} Дискретное распределение]
+*[http://en.wikipedia.org/wiki/Euler_summation Wikipedia {{---}} Euler summation]
+*Дж. Кемени, Дж. Снелл {{---}} Конечные цепи Маркова {{---}} изд. "Наука", 1970 г. {{---}} 129 c.
+[[Категория:Дискретная математика и алгоритмы]]
+[[Категория: Марковские цепи]]

Эргодическая марковская цепь — различия между версиями

Текущая версия на 19:15, 4 сентября 2022

Содержание

Стационарный режим

Классификация эргодических цепей

Эргодическая теорема

Для регулярных цепей

Для циклических цепей

Следствия

Пример

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты