Регулярная марковская цепь — различия между версиями
Yurik (обсуждение | вклад) |
Yurik (обсуждение | вклад) |
||
Строка 62: | Строка 62: | ||
Таким образом у регулярных цепей есть свойство: через достаточно большое количество ходов будет существовать постоянная вероятность нахождения цепи в состоянии <tex>s_i</tex>, и эта вероятность не зависит от начального распределения, а зависит только от матрицы P. | Таким образом у регулярных цепей есть свойство: через достаточно большое количество ходов будет существовать постоянная вероятность нахождения цепи в состоянии <tex>s_i</tex>, и эта вероятность не зависит от начального распределения, а зависит только от матрицы P. | ||
− | == | + | == Примеры == |
[[File:Temp.gif|thumb|250px|Пример регулярной цепи]] | [[File:Temp.gif|thumb|250px|Пример регулярной цепи]] | ||
− | Самый очевидный пример регулярной цепи - | + | Самый очевидный и тривиальный пример регулярной цепи: |
+ | |||
+ | Пусть у нас есть два состояния - "1" и "2". Каждый ход мы кидаем честную монету - если выпал "0", то цепь остается в предыдущем состоянии, если "1" - цепь меняет свое состояние. | ||
+ | |||
+ | Матрица переходов будет выглядеть так: | ||
<tex> | <tex> | ||
Строка 74: | Строка 78: | ||
Тогда <tex>\forall n \ \ P^n = P = A,\ \alpha = \{ 0.5, 0.5 \}</tex> | Тогда <tex>\forall n \ \ P^n = P = A,\ \alpha = \{ 0.5, 0.5 \}</tex> | ||
− | То есть через достаточно большое количество ходов наша система будет ''равновероятно'' находится как в состоянии "1", так и в состоянии " | + | То есть через достаточно большое количество ходов наша система будет ''равновероятно'' находится как в состоянии "1", так и в состоянии "2", независимо от начального распределения. |
+ | |||
+ | Более интересный пример - если мы будем управлять переходом состояний с помощью нечестной монеты. | ||
+ | Пусть а - вероятность выпадения "0" на монете. | ||
+ | |||
+ | Матрица переходов будет выглядеть так: | ||
+ | |||
+ | <tex> | ||
+ | P = \begin{bmatrix} | ||
+ | a & 1 - a \\ | ||
+ | 1 - a & a | ||
+ | \end{bmatrix} | ||
+ | </tex> | ||
+ | |||
+ | Тогда при возведении Р в степень n элементы будут стремится к <tex>\frac{1}{2}</tex> с разных сторон. | ||
+ | То есть вектор <tex>\alpha = \{ 0.5, 0.5 \}</tex>, т.е от честности монеты ничего не зависит. | ||
== Литература == | == Литература == |
Версия 03:09, 14 января 2012
Содержание
Регулярная цепь Маркова
Определение: |
Марковская цепь называется регулярной (нормальной), если в матрице перехода P . |
В регулярной Марковской цепи из любого состояния можно попасть в любое другое за некоторое число ходов.
Лемма
Лемма: |
Пусть — матрица перехода регулярной цепи, — минимальный элемент этой матрицы. Пусть х — произвольный r-мерный вектор-столбец, имеющий максимальный элемент и минимальный . Пусть и - максимальный и минимальный элементы . Тогда , и |
Доказательство: |
Пусть х' - вектор, полученный из х заменой всех элементов, кроме на . Тогда . Каждый элемент имеет вид, где а - элемент P, который домножается на , причем . Поэтому наше выражение не превосходит . Отсюда и из неравенства получается: . Применяя те же рассуждения для вектора -х, получим: Складывая эти два неравенства, получаем . , ч.т.д. |
Основная теорема регулярных цепей (Эргодическая теорема)
Теорема: |
Регулярная марковская цепь эргодична. Другими словами: Пусть Р - регулярная переходная матрица. Тогда: |
Доказательство: |
Рассмотрим вектор-столбец , у которого j-й элемент равен 1, а все остальные равны 0. Пусть и - минимальный и максимальный элементы столбца . Так как , то из леммы следует, что и и. Пусть , тогда . Значит Так как в каждой матрице сходится к вектору, все элементы которого равны между собой. Пусть - их общее значение. Тогда . Заметим, что - j-тый столбец матрицы . Рассмотрим все для . Тогда сходится к матрице А, у которой по строкам стоит один и тот же вектор . сумма элементов в строке равна 1, то то же самое справедливо и для предельной матрицы А. Теорема доказана. |
Определение: |
Матрица А называется предельной матрицей, вектор | - предельным распределением.
Следствия
Теорема: |
Пусть - объекты из предыдущей теоремы.
Тогда справедливы факты:
|
Доказательство: |
Пусть - вектор-столбец, состоящий из единиц.
|
Таким образом у регулярных цепей есть свойство: через достаточно большое количество ходов будет существовать постоянная вероятность нахождения цепи в состоянии
, и эта вероятность не зависит от начального распределения, а зависит только от матрицы P.Примеры
Самый очевидный и тривиальный пример регулярной цепи:
Пусть у нас есть два состояния - "1" и "2". Каждый ход мы кидаем честную монету - если выпал "0", то цепь остается в предыдущем состоянии, если "1" - цепь меняет свое состояние.
Матрица переходов будет выглядеть так:
Тогда
То есть через достаточно большое количество ходов наша система будет равновероятно находится как в состоянии "1", так и в состоянии "2", независимо от начального распределения.Более интересный пример - если мы будем управлять переходом состояний с помощью нечестной монеты. Пусть а - вероятность выпадения "0" на монете.
Матрица переходов будет выглядеть так:
Тогда при возведении Р в степень n элементы будут стремится к
с разных сторон. То есть вектор , т.е от честности монеты ничего не зависит.Литература
Дж. Кемени, Дж. Снелл "Конечные цепи Маркова", стр 93