Изменения

← Предыдущая правка

Эргодическая марковская цепь

5029 байт добавлено, 19:15, 4 сентября 2022

м

rollbackEdits.php mass rollback

{{Определение

|definition='''Эргодическая''' [[Марковская цепь|~~Марковская~~ марковская цепь]] ~~называется эргодической, если существует дискретное распределение~~ (~~называемое эргодическим) <tex>\pi = (\pi_1,\pi_2,\ldots~~ англ. ''ergodic Markov chain'')^{~~\top}</tex>, такое что <tex>\pi_i > 0,\; i \in \mathbb~~{N---}~~</tex> и:<tex>\lim\limits_{n \to \infty~~} ~~p_{ij}^{(n)} = \pi_j~~марковская цепь, ~~\quad \forall i=1,2, \ldots</tex>~~целиком состоящая из одного [[Марковская цепь#sort_def| эргодического класса]].

}}

==Стационарный режим==Эргодические марковские цепи описываются [[~~Файл:MarkovTriangle~~Отношение связности, компоненты связности|сильно связным графом]].~~png|thumb|350px|Примеры графов переходов для цепей Маркова:~~ ~~a) цепь не является слабо эргодической (не существует общего стока <ref>'''Общий сток''' - такая~~ Это означает, что в такой системе возможен переход из любого состояния <tex>kS_i</tex> ~~вершина графа, что для любых двух различных вершин графа переходов~~ в любое состояние <tex>i,S_{j \}, (i~~\neq~~ ,j~~)</tex>~~= 1, существуют ориентированные пути от вершины <tex>i</tex> к вершине <tex>k</tex> и от вершины <tex>j</tex> к вершине <tex>k</tex>.</ref> для состояний <tex>A_22, \ldots, ~~A_3~~n)</tex>); b) слабо эргодическая, но не эргодическая цепь (граф переходов является [[Отношение связности, компоненты связности|слабо-связным]]) ~~c) эргодическая цепь ([[Отношение связности, компоненты связности|сильно-связный]] граф переходов)~~за конечное число шагов.]]

Для эргодических цепей при достаточно большом времени функционирования (<tex>t \to \infty</tex>) наступает '''стационарный режим''', при котором вероятности <tex>\alpha_i</tex> состояний системы не зависят от времени и не зависят от распределения вероятностей в начальный момент времени, то есть: <tex>\alpha_i = const</tex>. ==Классификация эргодических цепей =~~Основная~~ = {{Определение|definition=В эргодической цепи можно выделить '''циклические классы''' (англ. ''cyclic classes''). Количество циклических классов <tex> d </tex> называют '''периодом цепи''' (англ. ''period of Markov chain''), если цепь состоит целиком из одного циклического класса, её называют [[Регулярная марковская цепь|регулярной]]. С течением времени текущее состояние движется по циклическим классам в определенном порядке, причем каждые <tex>d</tex> шагов она оказывается в одном и том же циклическом классе.}} Таким образом, эргодические цепи делятся на [[Регулярная марковская цепь|регулярные]] и '''циклические'''. == Эргодическая теорема ~~об эргодических распределениях~~=={{Определение|definition='''Эргодическое (стационарное) распределение''' (англ. ''stationary distribution'') {{---}} распределение <tex>\alpha = (\alpha_1 \ldots \alpha_n )</tex>, такое что <tex>\alpha_i > 0</tex> и<tex>\lim\limits_{n \to \infty} p_{ij}^{(n)} = \alpha_j</tex> (где <tex>p_{ij}^{(n)}</tex> {{---}} вероятность оказаться в <tex>j</tex>-ом состоянии, выйдя из <tex>i</tex>-ого, через <tex>n</tex> переходов).}} === Для регулярных цепей ===Доказательство теоремы для случая регулярных цепей приведено в конспекте про [[Регулярная марковская цепь#Эргодическая теорема для регулярных цепей | регулярные цепи]]. === Для циклических цепей ===

{{

Теорема

|about=~~Основная~~ Эргодическая теорема ~~об эргодических распределениях~~

|statement=

~~Пусть~~ Для любой эргодической цепи последовательность степеней <tex>~~\{X_n\}_~~P^{n ~~\ge 0~~}</tex> ~~- цепь Маркова с дискретным пространством состояний и матрицей переходных вероятностей~~ [http://en.wikipedia.org/wiki/Euler_summation суммируется по Эйлеру] к предельной матрице <tex>~~P = (p_{ij}),\; i,j=1,2,\ldots~~A</tex>~~. Тогда~~ , и эта ~~цепь является эргодической тогда и только тогда, когда она# Неразложима (т.е. цепь Маркова такова, что её состояния образуют лишь один неразложимый класс~~ предельная матрица имеет вид <~~ref~~tex>Свойство сообщаемости порождает на пространстве состояний [[Отношение эквивалентности|отношение эквивалентности]]. Порождаемые классы эквивалентности называются '''неразложимыми классами'''.A = \xi\alpha</~~ref~~tex>);~~# Положительно возвратна (т.е. находится в таком состоянии~~, ~~выйдя из которого возвращается в него за конечное время);# Апериодична.Эргодическое распределение~~ где <tex>\~~mathbf{\pi}~~alpha</tex> ~~тогда является единственным решением системы:~~ ~~:<tex>\sum\limits_~~{~~i=0}^~~{~~\infty} \pi_i = 1,\; \pi_j \ge 0,\; \pi_j = \sum\limits_{i=0~~---}~~^{\infty} \pi_i\, p_{ij~~}положительный вероятностный вектор,<tex>\~~quad \, j\in \mathbb{N}~~xi</tex>- вектор-столбец из единиц.}}|proof=

В случае циклической цепи переходы из одного циклического класса в другой возможны только при определенных значениях <tex> n </tex>, которые периодически повторяются. Таким образом, никакая степень матрицы переходов <tex>P</tex> не является положительной матрицей, и различные степени содержат нули на различных местах. С увеличением степени расположение этих нулей периодически повторяется. Следовательно, последовательность <tex>P^{n}</tex> не может сходиться в обычном смысле, для нее требуется так называемая суммируемость по Эйлеру. Рассмотрим матрицу <tex>(kI + (1 - k)P)</tex> при некотором <tex>k, ~ 0 < k < 1</tex>. Эта матрица является ''переходной матрицей''. Она имеет положительные элементы на всех тех же местах, что и <tex>P</tex>, следовательно, она также ''задает эргодическую цепь''. Также диагональные элементы этой матрицы положительны. Значит, в каждое состояние можно возвратиться за один шаг, а это значит, что <tex>d =~~=Пример==~~1</tex>. Таким образом, новая цепь является регулярной. Из [[~~File:Temp.gif|thumb|250px~~Регулярная марковская цепь#Эргодическая теорема для регулярных цепей |~~Пример~~ эргодической ~~цепи~~теоремы для регулярных цепей]]следует, что <tex>(kI + (1 - k)P)^{n}</tex> стремится к матрице <tex>A = \xi\alpha</tex>, где <tex>\alpha</tex> {{---}} положительный вероятностный вектор. Таким образом:: <tex> A = \lim\limits_{x\to \infty} (kI + (1 - k)P)^{n}</tex>~~Рассмотрим эксперимент~~ : <tex> A = \lim\limits_{x\to \infty} \sum\limits_{i = 0}^{n} {n\choose i} k^{n - i} (1 - k)^{i} P^{i} ~~~~~ (1)</tex>Но последнее равенство в точности означает, что последовательность <tex>P^{n}</tex> суммируема по ~~бросанию честной монеты~~Эйлеру к <tex>A</tex>, причем суммируема при каждом значении <tex>k</tex>.}} ==== Следствия ==== {{Теорема|statement=Если <tex>P, A, \alpha</tex> {{---}} объекты из предыдущей теоремы. Тогда ~~соответствующая этому эксперименту марковская цепь будет иметь 2 состояния~~справедливы факты: * Для любого вероятностного вектора <tex>\pi</tex> последовательность <tex>\pi P^{n}</tex> суммируема по Эйлеру к <tex>\alpha</tex>* Вектор <tex>\alpha</tex> является единственным неподвижным вектором матрицы <tex>P</tex>* <tex>PA = AP = A</tex>|proof=Домножим <tex>(1)</tex> на <tex>\pi</tex>.~~Рассмотрим матрицу~~Таким образом, мы получим, ~~следующего вида:~~ что предел последовательности <tex>p_\pi P^{ijn}</tex> в смысле Эйлера равен <tex>\pi A =0\pi \xi \alpha</tex>. Значит, '''первый факт''' доказан.5 Так как вектор <tex>\alpha</tex> был получен из предельной матрицы для <tex>(kI + (1 - k)P)</tex>, iявляющейся регулярной переходной матрицей, то он будет её единственным неподвижным вероятностным вектором. Но матрица <tex>(kI + (1 - k)P)</tex> должна иметь те же неподвижные векторы, что и <tex>P</tex>,jтак как из соотношения :<tex>\pi (kI + (1 - k)P) =\pi</tex>, следует, что :<tex>\pi (1- k) P = \pi (1 - k)</tex>и поскольку <tex>k \ne 1</tex>,2то <tex>\pi P = \pi</tex>. Получается, что '''второй факт''' доказан.

Такая матрица является стохастической, а, значит, корректно определяет марковскую цепь. Такая цепь является эргодической, так как существует эргодическое распределение <tex>\pi = (0.5,0.5)^{\top}</tex>, такое что <tex>\lim\limits_{n \to \infty} p_{ij}^{(n)} = \pi_j, i=1,2</tex>.

'''Третий факт''' следует из того, что <tex>P \xi =\xi</tex> для любой переходной матрицы и что <tex>\alpha P =См\alpha</tex>. ~~также==~~* [http://neerc.ifmo.ru/mediawiki/index.php/Марковская_цепь Марковская цепь]}}

* ==Пример==[~~http~~[File:~~//neerc~~Ergo.~~ifmo.ru/mediawiki~~jpg‎|thumb|250px|Пример циклической цепи]]Самым простым примером циклической цепи является цепь из двух состояний, с переходной матрицей::<tex>P = \begin{pmatrix}0 & 1 \\ 1 & 0\end{pmatrix}</~~index~~tex> .~~php/Регулярная_марковская_цепь Регулярная марковская цепь]~~

Стационарным распределением этой цепи будет <tex> \alpha =~~=Примечания==~~(0.5, 0.5) </tex>.

~~<references />~~==См. также==*[[Марковская цепь]]*[[Регулярная марковская цепь]]*[[Примеры использования Марковских цепей]]

==~~Ссылки~~Источники информации ==*[http://ru.wikipedia.org/wiki/Эргодическое_распределение Эргодическое распределение - Википедия]

*[http://ru.wikipedia.org/wiki/Эргодическое_распределение Википедия {{---}} Эргодическое распределение ]*[http://ru.wikipedia.org/wiki/Дискретное_распределение#.D0.94.D0.B8.D1.81.D0.BA.D1.80.D0.B5.D1.82.D0.BD.D1.8B.D0.B5_.D1.80.D0.B0.D1.81.D0.BF.D1.80.D0.B5.D0.B4.D0.B5.D0.BB.D0.B5.D0.BD.D0.B8.D1.8F Википедия {{---}} Дискретное распределение ]*[http://en.wikipedia.org/wiki/Euler_summation Wikipedia {{--- ~~Википедия~~}} Euler summation]*Дж. Кемени, Дж. Снелл {{---}} Конечные цепи Маркова {{---}} изд. "Наука", 1970 г. {{---}} 129 c.

~~==Литература==Дж. Кемени, Дж. Снелл "Конечные цепи Маркова" - Издательство "Наука", 1970 г - 129 c.~~[[Категория:Дискретная математика и алгоритмы]]

[[Категория: Марковские цепи]]

Maintenance script

1632

правки

Изменения

Эргодическая марковская цепь

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты