Регулярная марковская цепь — различия между версиями

Версия 03:09, 14 января 2012

Содержание

1 Регулярная цепь Маркова
2 Лемма
3 Основная теорема регулярных цепей (Эргодическая теорема)
4 Следствия
5 Примеры
6 Литература

Регулярная цепь Маркова

Определение:

Марковская цепь называется регулярной (нормальной), если в матрице перехода P .

В регулярной Марковской цепи из любого состояния можно попасть в любое другое за некоторое число ходов.

Лемма

Лемма:

Пусть — матрица перехода регулярной цепи, — минимальный элемент этой матрицы. Пусть х — произвольный r-мерный вектор-столбец, имеющий максимальный элемент и минимальный . Пусть и - максимальный и минимальный элементы .
Тогда , и

Доказательство:

Пусть х' - вектор, полученный из х заменой всех элементов, кроме [math]m_0[/math] на [math]M_0[/math]. Тогда [math]x \leqslant x'[/math]. Каждый элемент [math]Px'[/math] имеет вид

, где а - элемент P, который домножается на [math]m_0[/math], причем [math]a \geqslant \varepsilon[/math]. Поэтому наше выражение не превосходит . Отсюда и из неравенства [math]x \leqslant x'[/math] получается: .

Применяя те же рассуждения для вектора -х, получим: .

Складывая эти два неравенства, получаем , ч.т.д.

Основная теорема регулярных цепей (Эргодическая теорема)

Теорема:

Регулярная марковская цепь эргодична. Другими словами:

Пусть Р - регулярная переходная матрица. Тогда:
;

каждая строка А представляет собой один и тот же вероятностный вектор

Доказательство:

Рассмотрим вектор-столбец [math]e_j[/math], у которого j-й элемент равен 1, а все остальные равны 0. Пусть [math]M_n[/math] и [math]m_n[/math] - минимальный и максимальный элементы столбца [math]P^n e_j[/math]. Так как , то из леммы следует, что и и

. Пусть [math]d_n = M_n - m_n[/math], тогда

.

Значит [math]P^n e_j[/math] сходится к вектору, все элементы которого равны между собой. Пусть [math]a_j[/math] - их общее значение. Тогда . Заметим, что [math]P^n e_j[/math] - j-тый столбец матрицы [math]P^n[/math]. Рассмотрим все [math]e_j[/math] для [math]j = 1, 2, \ldots[/math]. Тогда [math]P^n[/math] сходится к матрице А, у которой по строкам стоит один и тот же вектор .

Так как в каждой матрице сумма элементов в строке равна 1, то то же самое справедливо и для предельной матрицы А. Теорема доказана.

Определение:

Матрица А называется предельной матрицей, вектор - предельным распределением.

Следствия

Теорема:

Пусть - объекты из предыдущей теоремы.

Тогда справедливы факты:

для любого вероятностного вектора
[math]\alpha[/math] - единственный вектор, для которого [math]\alpha P = \alpha[/math]
[math]AP = PA = A[/math]

Доказательство:

Пусть [math]\xi[/math] - вектор-столбец, состоящий из единиц.

[math]\pi[/math] - вероятностный вектор, значит [math]\pi \xi = 1 [/math] ( сумма его элементов равна 1 ), значит . Но - первый пункт доказан.
Пусть . Тогда . Второй пункт доказан.
. Третий пункт доказан.

Таким образом у регулярных цепей есть свойство: через достаточно большое количество ходов будет существовать постоянная вероятность нахождения цепи в состоянии [math]s_i[/math], и эта вероятность не зависит от начального распределения, а зависит только от матрицы P.

Примеры

Пример регулярной цепи

Самый очевидный и тривиальный пример регулярной цепи:

Пусть у нас есть два состояния - "1" и "2". Каждый ход мы кидаем честную монету - если выпал "0", то цепь остается в предыдущем состоянии, если "1" - цепь меняет свое состояние.

Матрица переходов будет выглядеть так:

Тогда То есть через достаточно большое количество ходов наша система будет равновероятно находится как в состоянии "1", так и в состоянии "2", независимо от начального распределения.

Более интересный пример - если мы будем управлять переходом состояний с помощью нечестной монеты. Пусть а - вероятность выпадения "0" на монете.

Матрица переходов будет выглядеть так:

Тогда при возведении Р в степень n элементы будут стремится к [math]\frac{1}{2}[/math] с разных сторон. То есть вектор [math]\alpha = \{ 0.5, 0.5 \}[/math], т.е от честности монеты ничего не зависит.

Литература

Дж. Кемени, Дж. Снелл "Конечные цепи Маркова", стр 93

@@ Строка 62: / Строка 62: @@
 Таким образом у регулярных цепей есть свойство: через достаточно большое количество ходов будет существовать постоянная вероятность нахождения цепи в состоянии <tex>s_i</tex>, и эта вероятность не зависит от начального распределения, а зависит только от матрицы P.
-== Пример ==
+== Примеры ==
 [[File:Temp.gif|thumb|250px|Пример регулярной цепи]]
-Самый очевидный пример регулярной цепи - честная монета. Матрица переходов будет выглядеть так:
+Самый очевидный и тривиальный пример регулярной цепи:
+Пусть у нас есть два состояния - "1" и "2". Каждый ход мы кидаем честную монету - если выпал "0", то цепь остается в предыдущем состоянии, если "1" - цепь меняет свое состояние.
+Матрица переходов будет выглядеть так:
 <tex>
@@ Строка 74: / Строка 78: @@
 Тогда <tex>\forall n \ \ P^n = P = A,\  \alpha = \{ 0.5, 0.5 \}</tex>
-То есть через достаточно большое количество ходов наша система будет ''равновероятно'' находится как в состоянии "1", так и в состоянии "0", независимо от начального распределения.
+То есть через достаточно большое количество ходов наша система будет ''равновероятно'' находится как в состоянии "1", так и в состоянии "2", независимо от начального распределения.
+Более интересный пример - если мы будем управлять переходом состояний с помощью нечестной монеты.
+Пусть а - вероятность выпадения "0" на монете.
+Матрица переходов будет выглядеть так:
+<tex>
+P = \begin{bmatrix}
+a & 1 - a \\
+- a & a
+\end{bmatrix}
+</tex>
+Тогда при возведении Р в степень n элементы будут стремится к <tex>\frac{1}{2}</tex> с разных сторон.
+То есть вектор <tex>\alpha = \{ 0.5, 0.5 \}</tex>, т.е от честности монеты ничего не зависит.
 == Литература ==

Регулярная марковская цепь — различия между версиями

Версия 03:09, 14 января 2012

Содержание

Регулярная цепь Маркова

Лемма

Основная теорема регулярных цепей (Эргодическая теорема)

Следствия

Примеры

Литература

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты