Эргодическая марковская цепь — различия между версиями
Ponomarev (обсуждение | вклад) м (→Классификация эргодических цепей) |
м (rollbackEdits.php mass rollback) |
||
(не показано 8 промежуточных версий 4 участников) | |||
Строка 5: | Строка 5: | ||
==Стационарный режим== | ==Стационарный режим== | ||
− | Эргодические марковские цепи описываются [[Отношение связности, компоненты связности|сильно связным графом]]. Это означает, что в такой системе возможен переход из любого состояния <tex>S_i</tex> в любое состояние <tex>S_{j}, (i,j = 1,2, | + | Эргодические марковские цепи описываются [[Отношение связности, компоненты связности|сильно связным графом]]. Это означает, что в такой системе возможен переход из любого состояния <tex>S_i</tex> в любое состояние <tex>S_{j}, (i,j = 1,2,\ldots,n)</tex> за конечное число шагов. |
Для эргодических цепей при достаточно большом времени функционирования (<tex>t \to \infty</tex>) наступает '''стационарный режим''', при котором вероятности <tex>\alpha_i</tex> состояний системы не зависят от времени и не зависят от распределения вероятностей в начальный момент времени, то есть: <tex>\alpha_i = const</tex>. | Для эргодических цепей при достаточно большом времени функционирования (<tex>t \to \infty</tex>) наступает '''стационарный режим''', при котором вероятности <tex>\alpha_i</tex> состояний системы не зависят от времени и не зависят от распределения вероятностей в начальный момент времени, то есть: <tex>\alpha_i = const</tex>. | ||
Строка 13: | Строка 13: | ||
{{Определение | {{Определение | ||
|definition= | |definition= | ||
− | В эргодической цепи можно выделить '''циклические классы''' (англ. ''cyclic classes''). Количество циклических классов <tex> d </tex> называют '''периодом цепи''' (англ. ''period of Markov chain''), если цепь состоит целиком из одного циклического класса, её называют [[Регулярная марковская цепь|регулярной]]. С течением времени текущее состояние движется по циклическим классам в определенном порядке, причем каждые | + | В эргодической цепи можно выделить '''циклические классы''' (англ. ''cyclic classes''). Количество циклических классов <tex> d </tex> называют '''периодом цепи''' (англ. ''period of Markov chain''), если цепь состоит целиком из одного циклического класса, её называют [[Регулярная марковская цепь|регулярной]]. С течением времени текущее состояние движется по циклическим классам в определенном порядке, причем каждые <tex>d</tex> шагов она оказывается в одном и том же циклическом классе. |
}} | }} | ||
Строка 21: | Строка 21: | ||
{{Определение | {{Определение | ||
|definition= | |definition= | ||
− | '''Эргодическое (стационарное) распределение''' {{---}} распределение <tex>\alpha = (\alpha_1 \ | + | '''Эргодическое (стационарное) распределение''' (англ. ''stationary distribution'') {{---}} распределение <tex>\alpha = (\alpha_1 \ldots \alpha_n )</tex>, такое что <tex>\alpha_i > 0</tex> и |
<tex>\lim\limits_{n \to \infty} p_{ij}^{(n)} = \alpha_j</tex> (где <tex>p_{ij}^{(n)}</tex> {{---}} вероятность оказаться в <tex>j</tex>-ом состоянии, выйдя из <tex>i</tex>-ого, через <tex>n</tex> переходов). | <tex>\lim\limits_{n \to \infty} p_{ij}^{(n)} = \alpha_j</tex> (где <tex>p_{ij}^{(n)}</tex> {{---}} вероятность оказаться в <tex>j</tex>-ом состоянии, выйдя из <tex>i</tex>-ого, через <tex>n</tex> переходов). | ||
}} | }} | ||
Строка 79: | Строка 79: | ||
Стационарным распределением этой цепи будет <tex> \alpha = (0.5, 0.5) </tex>. | Стационарным распределением этой цепи будет <tex> \alpha = (0.5, 0.5) </tex>. | ||
− | == | + | ==См. также== |
− | *[ | + | *[[Марковская цепь]] |
+ | *[[Регулярная марковская цепь]] | ||
+ | *[[Примеры использования Марковских цепей]] | ||
− | + | == Источники информации == | |
− | *[http://en.wikipedia.org/wiki/Euler_summation | + | *[http://ru.wikipedia.org/wiki/Эргодическое_распределение Википедия {{---}} Эргодическое распределение ] |
− | + | *[http://ru.wikipedia.org/wiki/Дискретное_распределение#.D0.94.D0.B8.D1.81.D0.BA.D1.80.D0.B5.D1.82.D0.BD.D1.8B.D0.B5_.D1.80.D0.B0.D1.81.D0.BF.D1.80.D0.B5.D0.B4.D0.B5.D0.BB.D0.B5.D0.BD.D0.B8.D1.8F Википедия {{---}} Дискретное распределение] | |
− | + | *[http://en.wikipedia.org/wiki/Euler_summation Wikipedia {{---}} Euler summation] | |
− | *Дж. Кемени, Дж. Снелл | + | *Дж. Кемени, Дж. Снелл {{---}} Конечные цепи Маркова {{---}} изд. "Наука", 1970 г. {{---}} 129 c. |
[[Категория:Дискретная математика и алгоритмы]] | [[Категория:Дискретная математика и алгоритмы]] | ||
[[Категория: Марковские цепи]] | [[Категория: Марковские цепи]] |
Текущая версия на 19:15, 4 сентября 2022
Определение: |
Эргодическая марковская цепь (англ. ergodic Markov chain) — марковская цепь, целиком состоящая из одного эргодического класса. |
Содержание
Стационарный режим
Эргодические марковские цепи описываются сильно связным графом. Это означает, что в такой системе возможен переход из любого состояния в любое состояние за конечное число шагов.
Для эргодических цепей при достаточно большом времени функционирования (
) наступает стационарный режим, при котором вероятности состояний системы не зависят от времени и не зависят от распределения вероятностей в начальный момент времени, то есть: .Классификация эргодических цепей
Определение: |
В эргодической цепи можно выделить циклические классы (англ. cyclic classes). Количество циклических классов регулярной. С течением времени текущее состояние движется по циклическим классам в определенном порядке, причем каждые шагов она оказывается в одном и том же циклическом классе. | называют периодом цепи (англ. period of Markov chain), если цепь состоит целиком из одного циклического класса, её называют
Таким образом, эргодические цепи делятся на регулярные и циклические.
Эргодическая теорема
Определение: |
Эргодическое (стационарное) распределение (англ. stationary distribution) — распределение | , такое что и (где — вероятность оказаться в -ом состоянии, выйдя из -ого, через переходов).
Для регулярных цепей
Доказательство теоремы для случая регулярных цепей приведено в конспекте про регулярные цепи.
Для циклических цепей
Теорема (Эргодическая теорема): |
Для любой эргодической цепи последовательность степеней суммируется по Эйлеру к предельной матрице , и эта предельная матрица имеет вид , где — положительный вероятностный вектор, - вектор-столбец из единиц. |
Доказательство: |
В случае циклической цепи переходы из одного циклического класса в другой возможны только при определенных значениях , которые периодически повторяются. Таким образом, никакая степень матрицы переходов не является положительной матрицей, и различные степени содержат нули на различных местах. С увеличением степени расположение этих нулей периодически повторяется. Следовательно, последовательность не может сходиться в обычном смысле, для нее требуется так называемая суммируемость по Эйлеру.Рассмотрим матрицу при некотором . Эта матрица является переходной матрицей. Она имеет положительные элементы на всех тех же местах, что и , следовательно, она также задает эргодическую цепь. Также диагональные элементы этой матрицы положительны. Значит, в каждое состояние можно возвратиться за один шаг, а это значит, что . Таким образом, новая цепь является регулярной.Из эргодической теоремы для регулярных цепей следует, что стремится к матрице , где — положительный вероятностный вектор. Таким образом: |
Следствия
Теорема: |
Если — объекты из предыдущей теоремы. Тогда справедливы факты:
|
Доказательство: |
Домножим на . Таким образом, мы получим, что предел последовательности в смысле Эйлера равен . Значит, первый факт доказан.
следует, что и поскольку , то . Получается, что второй факт доказан.
|
Пример
Самым простым примером циклической цепи является цепь из двух состояний, с переходной матрицей:
- .
Стационарным распределением этой цепи будет
.См. также
Источники информации
- Википедия — Эргодическое распределение
- Википедия — Дискретное распределение
- Wikipedia — Euler summation
- Дж. Кемени, Дж. Снелл — Конечные цепи Маркова — изд. "Наука", 1970 г. — 129 c.