Изменения

Эргодическая марковская цепь

2374 байта добавлено, 15:39, 15 марта 2018

→‎См. также

{{Определение

|definition='''Эргодическая''' [[Марковская цепь|~~Марковская~~ марковская цепь]] ~~называется эргодической, если существует дискретное распределение~~ (~~называемое эргодическим) <tex>\pi = (\pi_1,\pi_2,\ldots~~ англ. ''ergodic Markov chain'')^{~~\top}</tex>, такое что <tex>\pi_i > 0,\; i \in \mathbb~~{N---}~~</tex> и:<tex>\lim\limits_{n \to \infty~~} ~~p_{ij}^{(n)} = \pi_j~~марковская цепь, ~~\quad \forall i=1,2, \ldots</tex>~~целиком состоящая из одного [[Марковская цепь#sort_def| эргодического класса]].

}}

Эргодические цепи могут быть [[Регулярная марковская цепь|регулярными]] или '''циклическими'''. Циклические цепи отличаются от регулярных тем, что в процессе переходов через определенное количество шагов (цикл) происходит возврат в какое-либо состояние. Регулярные цепи этим свойством не обладают.

==Стационарный режим==

Эргодические марковские цепи описываются [[Отношение связности, компоненты связности|сильно связным графом]]. Это означает, что в такой системе возможен переход из любого состояния <tex>S_i</tex> в любое состояние <tex>S_{j}, (i,j = 1,2,~~...~~\ldots,n)</tex> за конечное число шагов.

Для эргодических цепей при достаточно большом времени функционирования (<tex>t \to \infty</tex>) наступает '''стационарный режим''', при котором вероятности <tex>~~p_i~~\alpha_i</tex> состояний системы не зависят от времени и не зависят от распределения вероятностей в начальный момент времени, ~~т.е.~~ то есть: <tex>~~p_i~~ \alpha_i = const</tex>.

Для определения стационарных вероятностей <tex>p_i</tex> нахождения системы в состоянии <tex>S_{i}</tex> нужно составить систему <tex>n</tex> линейных однородных алгебраических уравнений с <tex>n</tex> неизвестными:== Классификация эргодических цепей ==

~~<tex>p_~~{~~i} = \sum\limits_~~{jОпределение|definition=~~1}^{n}~~В эргодической цепи можно выделить '''циклические классы''' (~~p_{j} \times p_{ji}~~англ. ''cyclic classes''). Количество циклических классов </tex>~~, где~~ d </tex>~~i = 1~~называют '''периодом цепи''' (англ. ''period of Markov chain''),2если цепь состоит целиком из одного циклического класса,её называют [[Регулярная марковская цепь|регулярной]]...С течением времени текущее состояние движется по циклическим классам в определенном порядке,nпричем каждые <tex>d</tex>шагов она оказывается в одном и том же циклическом классе.}}

~~Причем~~Таким образом, ~~искомые вероятности должны удовлетворять условию:~~эргодические цепи делятся на [[Регулярная марковская цепь|регулярные]] и '''циклические'''.

== Эргодическая теорема =={{Определение|definition='''Эргодическое (стационарное) распределение''' (англ. ''stationary distribution'') {{---}} распределение <tex>\~~sum\limits_{j~~alpha =~~1}^{n}~~(~~p_{i}~~\alpha_1 \ldots \alpha_n ) ~~= 1~~</tex> ~~или~~, такое что ~~равносильно,~~ <tex>~~p_{i} = 1 -~~ \~~sum~~alpha_i > 0</tex> и<tex>\lim\limits_{~~j=1, j~~ n \to \~~ne i~~infty} p_{ij}^{(n)}= \alpha_j</tex> (где <tex>p_{jij}^{(n)}</tex> {{---}} вероятность оказаться в <tex>j</tex>-ом состоянии, выйдя из <tex>i</tex>-ого, через <tex>n</tex> переходов).}}

~~Систему линейных алгебраических уравнений удобно составлять непосредственно по графу состояний. При этом~~ === Для регулярных цепей ===Доказательство теоремы для случая регулярных цепей приведено в левой части уравнения записывается вероятность состояния, соответствующего рассматриваемой вершине графа, а в правой части - сумма произведений. Число слагаемых соответствует числу дуг графа, входящих в рассматриваемое состояние. Каждое слагаемое представляет произведение вероятности того состояния, из которого выходит дуга графа, на переходную вероятность, которой помечена соответствующая дуга графаконспекте про [[Регулярная марковская цепь#Эргодическая теорема для регулярных цепей | регулярные цепи]].

==~~Основная теорема об эргодических распределениях~~= Для циклических цепей ===

{{

Теорема

|about=~~Основная~~ Эргодическая теорема ~~об эргодических распределениях~~

|statement=

~~Пусть~~ Для любой эргодической цепи последовательность степеней <tex>P^{n}</tex> [http://en.wikipedia.org/wiki/Euler_summation суммируется по Эйлеру] к предельной матрице <tex>A</tex>, и эта предельная матрица имеет вид <tex>A = \xi\alpha</tex>, где <tex>\alpha</tex> {~~X_n~~{---}} положительный вероятностный вектор, <tex>\}_xi</tex> - вектор-столбец из единиц.|proof= В случае циклической цепи переходы из одного циклического класса в другой возможны только при определенных значениях <tex> n </tex>, которые периодически повторяются. Таким образом, никакая степень матрицы переходов <tex>P</tex> не является положительной матрицей, и различные степени содержат нули на различных местах. С увеличением степени расположение этих нулей периодически повторяется. Следовательно, последовательность <tex>P^{n ~~\ge 0~~}</tex> не может сходиться в обычном смысле, для нее требуется так называемая суммируемость по Эйлеру. Рассмотрим матрицу <tex>(kI + (1 - k)P)</tex> при некотором <tex>k, ~ 0 < k < 1</tex>. Эта матрица является ''переходной матрицей''. Она имеет положительные элементы на всех тех же местах, что и <tex>P</tex>, следовательно, она также ''задает эргодическую цепь ~~Маркова с дискретным пространством состояний и~~ ''. Также диагональные элементы этой матрицы положительны. Значит, в каждое состояние можно возвратиться за один шаг, а это значит, что <tex>d = 1</tex>. Таким образом, новая цепь является регулярной. Из [[~~Марковская~~ Регулярная марковская цепь#Эргодическая теорема для регулярных цепей |~~матрицей переходных вероятностей~~эргодической теоремы для регулярных цепей]] следует, что <tex>(kI + (1 - k)P )^{n}</tex> стремится к матрице <tex>A = \xi\alpha</tex>, где <tex>\alpha</tex> {{---}} положительный вероятностный вектор. Таким образом:: <tex> A = \lim\limits_{x\to \infty} (p_kI + (1 - k)P)^{ijn}),</tex>: <tex> A = \lim\limits_{x\to \infty} \sum\; limits_{i,j=0}^{n} {n\choose i} k^{n - i} (1- k)^{i} P^{i} ~~~~~ (1)</tex>Но последнее равенство в точности означает,2что последовательность <tex>P^{n}</tex> суммируема по Эйлеру к <tex>A</tex>,~~\ldots~~причем суммируема при каждом значении <tex>k</tex>. ~~Тогда эта цепь является эргодической тогда и только тогда~~}} ==== Следствия ==== {{Теорема|statement=Если <tex>P, ~~когда она# Неразложима (т.е. цепь Маркова такова~~A, ~~что её состояния образуют лишь один неразложимый класс~~ \alpha<~~ref~~/tex>{{---}} объекты из предыдущей теоремы. Тогда справедливы факты:

~~Пусть~~ * Для любого вероятностного вектора <tex>\~~{X_n~~pi</tex> последовательность <tex>\}_pi P^{n ~~\ge 0~~}</tex> ~~— цепь Маркова с тремя состояниями~~ суммируема по Эйлеру к <tex>\~~{1,2,3\}~~alpha</tex>~~, и её матрица переходных вероятностей имеет вид~~: * Вектор <tex>~~P =~~ \~~left(\begin{matrix}0.5 & 0.5 & 0 \\0.1 & 0.9 & 0 \\0 & 0 & 1\end{matrix}\right).~~alpha</tex>~~Состояния этой цепи образуют два '''неразложимых класса''':~~ является единственным неподвижным вектором матрицы <tex>~~\{1,2\}~~P</tex> и * <tex>~~\{3\}~~PA = AP = A</tex> |proof=Домножим <tex>(1 )</tex> на <tex>\~~leftrightarrow 2~~pi</tex>. Таким образом, но мы получим, что предел последовательности <tex>1 \~~not\rightarrow 3~~pi P^{n}</tex> и в смысле Эйлера равен <tex>3 \~~not~~pi A = \~~rightarrow 1)~~pi \xi \alpha</tex>. ~~Т.е. если представить матрицу переходных вероятностей в виде графа~~Значит, ~~то он будет иметь две компоненты связности~~'''первый факт''' доказан.

~~</ref>);~~

# Положительно возвратна (т.е. находится в таком состоянии, выйдя из которого возвращается в него за конечное время);

# Апериодична (т.е. находится в таком состоянии, которое навещается цепью через промежутки времени, не кратные фиксированному числу).

~~Эргодическое распределение <tex>\mathbf{\pi}</tex> тогда является единственным решением системы:~~

~~:<tex>\sum\limits_{i=0}^{\infty} \pi_i = 1,\; \pi_j \ge 0,\; \pi_j = \sum\limits_{i=0}^{\infty} \pi_i\, p_{ij},\quad \, j\in \mathbb{N}</tex>.}}~~

Так как вектор <tex>\alpha</tex> был получен из предельной матрицы для <tex>(kI + (1 - k)P)</tex>, являющейся регулярной переходной матрицей, то он будет её единственным неподвижным вероятностным вектором. Но матрица <tex>(kI + (1 - k)P)</tex> должна иметь те же неподвижные векторы, что и <tex>P</tex>, так как из соотношения

:<tex>\pi (kI + (1 - k)P) = \pi</tex>,

следует, что

:<tex>\pi (1 - k) P = \pi (1 - k)</tex>

и поскольку <tex>k \ne 1</tex>, то <tex>\pi P = \pi</tex>. Получается, что '''второй факт''' доказан.

'''Третий факт''' следует из того, что <tex>P \xi = \xi</tex> для любой переходной матрицы и что <tex>\alpha P = \alpha</tex>.

}}

==Пример==

[[File:~~Temp~~Ergo.~~gif~~jpg‎|thumb|250px|Пример ~~эргодической~~ циклической цепи]]~~Рассмотрим эксперимент по бросанию честной монеты. Тогда соответствующая этому эксперименту марковская~~ Самым простым примером циклической цепи является цепь ~~будет иметь 2 состояния. Состояние меняется на противоположное, при бросании монеты~~из двух состояний, с ~~вероятностью <tex>p = 0.5</tex>.~~переходной матрицей:~~Рассмотрим матрицу, следующего вида~~: <tex>p_P = \begin{ijpmatrix}=0~~.5, i,j=~~& 1,2</tex>. Такая матрица является стохастической, а, значит, корректно определяет марковскую цепь. Такая цепь является эргодической, так как существует эргодическое распределение <tex>\~~pi = (~~\ 1 & 0~~.5,0.5)^{~~\~~top}</tex>, такое что <tex>\lim\limits_{n \to \infty} p_~~end{ijpmatrix}~~^{(n)} = \pi_j, i=1,2~~</tex>.

Стационарным распределением этой цепи будет <tex> \alpha =~~=Примечания==~~(0.5, 0.5) </tex>.

~~<references />~~==См. также==*[[Марковская цепь]]*[[Регулярная марковская цепь]]*[[Примеры использования Марковских цепей]]

==~~Ссылки~~Источники информации ==*[http://ru.wikipedia.org/wiki/Эргодическое_распределение Эргодическое распределение - Википедия]

*[http://ru.wikipedia.org/wiki/Эргодическое_распределение Википедия {{---}} Эргодическое распределение ]*[http://ru.wikipedia.org/wiki/Дискретное_распределение#.D0.94.D0.B8.D1.81.D0.BA.D1.80.D0.B5.D1.82.D0.BD.D1.8B.D0.B5_.D1.80.D0.B0.D1.81.D0.BF.D1.80.D0.B5.D0.B4.D0.B5.D0.BB.D0.B5.D0.BD.D0.B8.D1.8F Википедия {{---}} Дискретное распределение ]*[http://en.wikipedia.org/wiki/Euler_summation Wikipedia {{--- ~~Википедия~~}} Euler summation]*Дж. Кемени, Дж. Снелл {{---}} Конечные цепи Маркова {{---}} изд. "Наука", 1970 г. {{---}} 129 c.

~~==Литература==Дж. Кемени, Дж. Снелл "Конечные цепи Маркова" - Издательство "Наука", 1970 г - 129 c.~~[[Категория:Дискретная математика и алгоритмы]]

[[Категория: Марковские цепи]]

Анонимный участник

94.19.239.249

Изменения

Эргодическая марковская цепь

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты