Регулярная марковская цепь — различия между версиями

Текущая версия на 19:17, 4 сентября 2022

Определение:

Марковская цепь называется регулярной (англ. regular Markov chain), если она целиком состоит из одного циклического класса.

Теорема:

Цепь регулярна тогда и только тогда, когда существует такое , что в матрице все элементы ненулевые, то есть из любого состояния можно перейти в любое за переходов.

Содержание

1 Лемма
2 Эргодическая теорема для регулярных цепей
3 Следствия
4 Примеры
5 См. также
6 Источники информации

Лемма

Лемма:

Пусть — матрица перехода регулярной цепи, — минимальный элемент этой матрицы. Пусть — произвольный -мерный вектор-столбец, имеющий максимальный элемент и минимальный . Пусть и — максимальный и минимальный элементы .
Тогда , и

Доказательство:

Пусть [math]x'[/math] — вектор, полученный из [math]x[/math] заменой всех элементов, кроме [math]m_0[/math] на [math]M_0[/math]. Тогда [math]x \leqslant x'[/math]. Каждый элемент [math]Px'[/math] имеет вид

, где [math]a[/math] — элемент [math]P[/math], который домножается на [math]m_0[/math], причем [math]a \geqslant \varepsilon[/math]. Поэтому наше выражение не превосходит . Отсюда и из неравенства [math]x \leqslant x'[/math] получается: .

Применяя те же рассуждения для вектора [math]-x[/math], получим: .

Складывая эти два неравенства, получаем .

Эргодическая теорема для регулярных цепей

Теорема:

Регулярная марковская цепь эргодична. Другими словами:

Пусть [math]P[/math] — регулярная переходная матрица. Тогда:
;

каждая строка А представляет собой один и тот же вероятностный вектор

Доказательство:

Рассмотрим вектор-столбец [math]e_j[/math], у которого [math]j[/math]-й элемент равен [math]1[/math], а все остальные равны [math]0[/math]. Пусть [math]M_n[/math] и [math]m_n[/math] — минимальный и максимальный элементы столбца [math]P^n e_j[/math]. Так как , то из леммы следует, что и и

. Пусть [math]d_n = M_n - m_n[/math], тогда

.

Значит [math]P^n e_j[/math] сходится к вектору, все элементы которого равны между собой. Пусть [math]a_j[/math] — их общее значение. Тогда . Заметим, что [math]P^n e_j[/math] — [math]j[/math]-тый столбец матрицы [math]P^n[/math]. Рассмотрим все [math]e_j[/math] для [math]j = 1, 2, \ldots[/math]. Тогда [math]P^n[/math] сходится к матрице [math]A[/math], у которой по строкам стоит один и тот же вектор .

Так как в каждой матрице сумма элементов в строке равна , то то же самое справедливо и для предельной матрицы . Теорема доказана.

Определение:

Матрица называется предельной матрицей (англ. limiting matrix), вектор — предельным распределением (англ. limiting distribution).

Следствия

Теорема:

Пусть — объекты из предыдущей теоремы.

Тогда справедливы факты:

для любого вероятностного вектора
[math]\alpha[/math] — единственный вектор, для которого [math]\alpha P = \alpha[/math]
[math]AP = PA = A[/math]

Доказательство:

Пусть [math]\xi[/math] — вектор-столбец, состоящий из единиц.

[math]\pi[/math] — вероятностный вектор, значит [math]\pi \xi = 1 [/math] ( сумма его элементов равна [math]1[/math] ), значит . Но — первый пункт доказан.
Пусть . Тогда . Второй пункт доказан.
. Третий пункт доказан.

Таким образом у регулярных цепей есть свойство: через достаточно большое количество ходов будет существовать постоянная вероятность нахождения цепи в состоянии [math]s_i[/math], и эта вероятность не зависит от начального распределения, а зависит только от матрицы [math]P[/math].

Примеры

Пример регулярной цепи (черным цветом обозначена вероятность, красным - выпавшая сторона монеты)

Самый очевидный и тривиальный пример регулярной цепи:

Пусть у нас есть два состояния — [math]1[/math] и [math]2[/math]. Каждый ход мы кидаем честную монету — если выпал [math]0[/math], то цепь остается в предыдущем состоянии, если [math]1[/math] — цепь меняет свое состояние.

Матрица переходов будет выглядеть так:

Тогда то есть через достаточно большое количество ходов наша система будет равновероятно находится как в состоянии [math]1[/math], так и в состоянии [math]2[/math], независимо от начального распределения.

Более интересный пример — если мы будем управлять переходом состояний с помощью нечестной монеты. Пусть [math]a[/math] — вероятность выпадения [math]0[/math] на монете.

Матрица переходов будет выглядеть так:

Тогда при возведении [math]P[/math] в степень [math]n[/math] элементы будут стремится к [math]\dfrac{1}{2}[/math] с разных сторон. То есть вектор [math]\alpha = \{ 0.5, 0.5 \}[/math], таким образом от честности монеты ничего не зависит.

См. также

Источники информации

Дж. Кемени, Дж. Снелл Конечные цепи Маркова, стр 93

@@ Строка 1: / Строка 1: @@
 {{Определение
-|definition=[[Марковская цепь|Марковская цепь]] называется '''регулярной''' (англ. ''regular Markov chain''), если она целиком состоит из одного [[Эргодическая марковская цепь | циклического класса]].
+|definition=[[Марковская цепь|Марковская цепь]] называется '''регулярной''' (англ. ''regular Markov chain''), если она целиком состоит из одного [[Эргодическая марковская цепь#Циклический класс | циклического класса]].
 }}
@@ Строка 19: / Строка 19: @@
 Применяя те же рассуждения для вектора <tex>-x</tex>, получим: <tex>-m_1 \leqslant -m_0 - \varepsilon (-m_0 + M_0)</tex>.
-Складывая эти два неравенства, получаем <tex>M_1 - m_1 \leqslant M_0 - m_0 - 2\varepsilon (M_0 - m_0) = (1 - 2\varepsilon )(M_0 - m_0)</tex>, ч.т.д.
+Складывая эти два неравенства, получаем <tex>M_1 - m_1 \leqslant M_0 - m_0 - 2\varepsilon (M_0 - m_0) = (1 - 2\varepsilon )(M_0 - m_0)</tex>.
 }}
@@ Строка 78: / Строка 78: @@
 </tex>
-Тогда <tex>\forall n \ \ P^n = P = A,\  \alpha = \{ 0.5, 0.5 \}</tex>
+Тогда <tex>\forall n \ \ P^n = P = A,\  \alpha = \{ 0.5, 0.5 \} ,\,</tex>
-То есть через достаточно большое количество ходов наша система будет ''равновероятно'' находится как в состоянии <tex>1</tex>, так и в состоянии <tex>2</tex>, независимо от начального распределения.
+то есть через достаточно большое количество ходов наша система будет ''равновероятно'' находится как в состоянии <tex>1</tex>, так и в состоянии <tex>2</tex>, независимо от начального распределения.
 Более интересный пример {{---}} если мы будем управлять переходом состояний с помощью нечестной монеты.
@@ Строка 94: / Строка 94: @@
 Тогда при возведении <tex>P</tex> в степень <tex>n</tex> элементы будут стремится к <tex>\dfrac{1}{2}</tex> с разных сторон.
-То есть вектор <tex>\alpha = \{ 0.5, 0.5 \}</tex>, т.е. от честности монеты ничего не зависит.
+То есть вектор <tex>\alpha = \{ 0.5, 0.5 \}</tex>, таким образом от честности монеты ничего не зависит.
 == См. также ==

Регулярная марковская цепь — различия между версиями

Текущая версия на 19:17, 4 сентября 2022

Содержание

Лемма

Эргодическая теорема для регулярных цепей

Следствия

Примеры

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты