Эргодическая марковская цепь

Определение:

Эргодическая марковская цепь (англ. ergodic Markov chain) — марковская цепь, целиком состоящая из одного эргодического класса.

Стационарный режим

Эргодические марковские цепи описываются сильно связным графом. Это означает, что в такой системе возможен переход из любого состояния [math]S_i[/math] в любое состояние за конечное число шагов.

Для эргодических цепей при достаточно большом времени функционирования ([math]t \to \infty[/math]) наступает стационарный режим, при котором вероятности [math]\alpha_i[/math] состояний системы не зависят от времени и не зависят от распределения вероятностей в начальный момент времени, то есть: [math]\alpha_i = const[/math].

Классификация эргодических цепей

Определение:

В эргодической цепи можно выделить циклические классы (англ. cyclic classes). Количество циклических классов называют периодом цепи (англ. period of Markov chain), если цепь состоит целиком из одного циклического класса, её называют регулярной. С течением времени текущее состояние движется по циклическим классам в определенном порядке, причем каждые шагов она оказывается в одном и том же циклическом классе.

Таким образом, эргодические цепи делятся на регулярные и циклические.

Эргодическая теорема

Определение:

Эргодическое (стационарное) распределение (англ. stationary distribution) — распределение , такое что и (где — вероятность оказаться в -ом состоянии, выйдя из -ого, через переходов).

Для регулярных цепей

Доказательство теоремы для случая регулярных цепей приведено в конспекте про регулярные цепи.

Для циклических цепей

Теорема (Эргодическая теорема):

Для любой эргодической цепи последовательность степеней суммируется по Эйлеру к предельной матрице , и эта предельная матрица имеет вид , где — положительный вероятностный вектор, - вектор-столбец из единиц.

Доказательство:

В случае циклической цепи переходы из одного циклического класса в другой возможны только при определенных значениях [math] n [/math], которые периодически повторяются. Таким образом, никакая степень матрицы переходов [math]P[/math] не является положительной матрицей, и различные степени содержат нули на различных местах. С увеличением степени расположение этих нулей периодически повторяется. Следовательно, последовательность [math]P^{n}[/math] не может сходиться в обычном смысле, для нее требуется так называемая суммируемость по Эйлеру.

Рассмотрим матрицу [math](kI + (1 - k)P)[/math] при некотором [math]k, ~ 0 \lt k \lt 1[/math]. Эта матрица является переходной матрицей. Она имеет положительные элементы на всех тех же местах, что и [math]P[/math], следовательно, она также задает эргодическую цепь. Также диагональные элементы этой матрицы положительны. Значит, в каждое состояние можно возвратиться за один шаг, а это значит, что [math]d = 1[/math]. Таким образом, новая цепь является регулярной.

Из эргодической теоремы для регулярных цепей следует, что [math](kI + (1 - k)P)^{n}[/math] стремится к матрице [math]A = \xi\alpha[/math], где [math]\alpha[/math] — положительный вероятностный вектор. Таким образом:

Но последнее равенство в точности означает, что последовательность суммируема по Эйлеру к , причем суммируема при каждом значении .

Следствия

Теорема:

Если — объекты из предыдущей теоремы. Тогда справедливы факты:

Для любого вероятностного вектора [math]\pi[/math] последовательность [math]\pi P^{n}[/math] суммируема по Эйлеру к [math]\alpha[/math]
Вектор [math]\alpha[/math] является единственным неподвижным вектором матрицы [math]P[/math]
[math]PA = AP = A[/math]

Доказательство:

Домножим [math](1)[/math] на [math]\pi[/math]. Таким образом, мы получим, что предел последовательности [math]\pi P^{n}[/math] в смысле Эйлера равен [math]\pi A = \pi \xi \alpha[/math]. Значит, первый факт доказан.

Так как вектор [math]\alpha[/math] был получен из предельной матрицы для [math](kI + (1 - k)P)[/math], являющейся регулярной переходной матрицей, то он будет её единственным неподвижным вероятностным вектором. Но матрица [math](kI + (1 - k)P)[/math] должна иметь те же неподвижные векторы, что и [math]P[/math], так как из соотношения

,

следует, что

и поскольку [math]k \ne 1[/math], то [math]\pi P = \pi[/math]. Получается, что второй факт доказан.

Третий факт следует из того, что для любой переходной матрицы и что .

Пример

Пример циклической цепи

Самым простым примером циклической цепи является цепь из двух состояний, с переходной матрицей:

.

Стационарным распределением этой цепи будет [math] \alpha = (0.5, 0.5) [/math].

См. также

Источники информации

Википедия — Эргодическое распределение
Википедия — Дискретное распределение
Wikipedia — Euler summation
Дж. Кемени, Дж. Снелл — Конечные цепи Маркова — изд. "Наука", 1970 г. — 129 c.

Эргодическая марковская цепь

Стационарный режим

Классификация эргодических цепей

Эргодическая теорема

Для регулярных цепей

Для циклических цепей

Следствия

Пример

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты