Регулярная марковская цепь

Определение:

Марковская цепь называется регулярной (англ. regular Markov chain), если она целиком состоит из одного циклического класса.

Теорема:

Цепь регулярна тогда и только тогда, когда существует такое , что в матрице все элементы ненулевые, то есть из любого состояния можно перейти в любое за переходов.

Лемма

Лемма:

Пусть — матрица перехода регулярной цепи, — минимальный элемент этой матрицы. Пусть — произвольный -мерный вектор-столбец, имеющий максимальный элемент и минимальный . Пусть и — максимальный и минимальный элементы .
Тогда , и

Доказательство:

Пусть [math]x'[/math] — вектор, полученный из [math]x[/math] заменой всех элементов, кроме [math]m_0[/math] на [math]M_0[/math]. Тогда [math]x \leqslant x'[/math]. Каждый элемент [math]Px'[/math] имеет вид

, где [math]a[/math] — элемент [math]P[/math], который домножается на [math]m_0[/math], причем [math]a \geqslant \varepsilon[/math]. Поэтому наше выражение не превосходит . Отсюда и из неравенства [math]x \leqslant x'[/math] получается: .

Применяя те же рассуждения для вектора [math]-x[/math], получим: .

Складывая эти два неравенства, получаем .

Эргодическая теорема для регулярных цепей

Теорема:

Регулярная марковская цепь эргодична. Другими словами:

Пусть [math]P[/math] — регулярная переходная матрица. Тогда:
;

каждая строка А представляет собой один и тот же вероятностный вектор

Доказательство:

Рассмотрим вектор-столбец [math]e_j[/math], у которого [math]j[/math]-й элемент равен [math]1[/math], а все остальные равны [math]0[/math]. Пусть [math]M_n[/math] и [math]m_n[/math] — минимальный и максимальный элементы столбца [math]P^n e_j[/math]. Так как , то из леммы следует, что и и

. Пусть [math]d_n = M_n - m_n[/math], тогда

.

Значит [math]P^n e_j[/math] сходится к вектору, все элементы которого равны между собой. Пусть [math]a_j[/math] — их общее значение. Тогда . Заметим, что [math]P^n e_j[/math] — [math]j[/math]-тый столбец матрицы [math]P^n[/math]. Рассмотрим все [math]e_j[/math] для [math]j = 1, 2, \ldots[/math]. Тогда [math]P^n[/math] сходится к матрице [math]A[/math], у которой по строкам стоит один и тот же вектор .

Так как в каждой матрице сумма элементов в строке равна , то то же самое справедливо и для предельной матрицы . Теорема доказана.

Определение:

Матрица называется предельной матрицей (англ. limiting matrix), вектор — предельным распределением (англ. limiting distribution).

Следствия

Теорема:

Пусть — объекты из предыдущей теоремы.

Тогда справедливы факты:

для любого вероятностного вектора
[math]\alpha[/math] — единственный вектор, для которого [math]\alpha P = \alpha[/math]
[math]AP = PA = A[/math]

Доказательство:

Пусть [math]\xi[/math] — вектор-столбец, состоящий из единиц.

[math]\pi[/math] — вероятностный вектор, значит [math]\pi \xi = 1 [/math] ( сумма его элементов равна [math]1[/math] ), значит . Но — первый пункт доказан.
Пусть . Тогда . Второй пункт доказан.
. Третий пункт доказан.

Таким образом у регулярных цепей есть свойство: через достаточно большое количество ходов будет существовать постоянная вероятность нахождения цепи в состоянии [math]s_i[/math], и эта вероятность не зависит от начального распределения, а зависит только от матрицы [math]P[/math].

Примеры

Пример регулярной цепи (черным цветом обозначена вероятность, красным - выпавшая сторона монеты)

Самый очевидный и тривиальный пример регулярной цепи:

Пусть у нас есть два состояния — [math]1[/math] и [math]2[/math]. Каждый ход мы кидаем честную монету — если выпал [math]0[/math], то цепь остается в предыдущем состоянии, если [math]1[/math] — цепь меняет свое состояние.

Матрица переходов будет выглядеть так:

Тогда то есть через достаточно большое количество ходов наша система будет равновероятно находится как в состоянии [math]1[/math], так и в состоянии [math]2[/math], независимо от начального распределения.

Более интересный пример — если мы будем управлять переходом состояний с помощью нечестной монеты. Пусть [math]a[/math] — вероятность выпадения [math]0[/math] на монете.

Матрица переходов будет выглядеть так:

Тогда при возведении [math]P[/math] в степень [math]n[/math] элементы будут стремится к [math]\dfrac{1}{2}[/math] с разных сторон. То есть вектор [math]\alpha = \{ 0.5, 0.5 \}[/math], таким образом от честности монеты ничего не зависит.

См. также

Источники информации

Дж. Кемени, Дж. Снелл Конечные цепи Маркова, стр 93

Регулярная марковская цепь

Лемма

Эргодическая теорема для регулярных цепей

Следствия

Примеры

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты