Регулярная марковская цепь — различия между версиями
Yurik (обсуждение | вклад) (→Основная теорема регулярных цепей) |
Yurik (обсуждение | вклад) |
||
Строка 1: | Строка 1: | ||
== Регулярная цепь Маркова == | == Регулярная цепь Маркова == | ||
{{Определение | {{Определение | ||
− | |definition=Марковская цепь называется регулярной (нормальной), если в матрице перехода P <tex>\forall i,j \ \ p_{ij} \neq 0</tex>. | + | |definition=[[Марковская цепь|Марковская цепь]] называется регулярной (нормальной), если в матрице перехода P <tex>\forall i,j \ \ p_{ij} \neq 0</tex>. |
}} | }} | ||
Строка 24: | Строка 24: | ||
{{Теорема | {{Теорема | ||
− | |statement=Регулярная марковская цепь эргодична. Другими словами:<br> | + | |statement=Регулярная марковская цепь [[Эргодическая марковская цепь|эргодична]]. Другими словами:<br> |
Пусть Р - регулярная переходная матрица. Тогда:<br> | Пусть Р - регулярная переходная матрица. Тогда:<br> | ||
<tex>\exists A: \displaystyle \lim_{n \to \infty}P^n = A</tex>;<br> | <tex>\exists A: \displaystyle \lim_{n \to \infty}P^n = A</tex>;<br> | ||
каждая строка А представляет собой один и тот же вероятностный вектор <tex>\alpha = \{a_1, a_2, \ldots, a_r \}</tex> | каждая строка А представляет собой один и тот же вероятностный вектор <tex>\alpha = \{a_1, a_2, \ldots, a_r \}</tex> | ||
|proof= | |proof= | ||
− | Рассмотрим вектор-столбец <tex> | + | Рассмотрим вектор-столбец <tex>e_j</tex>, у которого j-й элемент равен 1, а все остальные равны 0. Пусть <tex>M_n</tex> и <tex>m_n</tex> - минимальный и максимальный элементы столбца <tex>P^n e_j</tex>. |
− | Так как <tex>P^n | + | Так как <tex>P^n e_j = P \cdot P^{n-1} e_j</tex>, то из леммы следует, что <tex>M_1 \geqslant M_2 \geqslant \ldots</tex> и <tex>m_1 \leqslant m_2 \leqslant \ldots</tex> и |
<tex>M_n - m_n \leqslant (1 - 2\varepsilon )(M_{n-1} - m_{n-1})</tex>. Пусть <tex>d_n = M_n - m_n</tex>, тогда | <tex>M_n - m_n \leqslant (1 - 2\varepsilon )(M_{n-1} - m_{n-1})</tex>. Пусть <tex>d_n = M_n - m_n</tex>, тогда | ||
Строка 36: | Строка 36: | ||
<tex>d_n \leqslant (1 - 2 \varepsilon )^n d_0 = (1 - 2 \varepsilon)^n \to 0</tex>. | <tex>d_n \leqslant (1 - 2 \varepsilon )^n d_0 = (1 - 2 \varepsilon)^n \to 0</tex>. | ||
− | Значит <tex>P^n | + | Значит <tex>P^n e_j</tex> сходится к вектору, все элементы которого равны между собой. Пусть <tex>a_j</tex> - их общее значение. Тогда <tex>0 \leqslant a_j \leqslant 1</tex>. Заметим, что <tex>P^n e_j</tex> - j-тый столбец матрицы <tex>P^n</tex>. Рассмотрим все <tex>e_j</tex> для <tex>j = 1, 2, \ldots</tex>. Тогда <tex>P^n</tex> сходится к матрице А, у которой по строкам стоит один и тот же вектор <tex>\alpha = \{a_1, a_2, \ldots, a_r \}</tex>. |
Так как в каждой матрице <tex>P^n</tex> сумма элементов в строке равна 1, то то же самое справедливо и для предельной матрицы А. Теорема доказана. | Так как в каждой матрице <tex>P^n</tex> сумма элементов в строке равна 1, то то же самое справедливо и для предельной матрицы А. Теорема доказана. | ||
}} | }} | ||
Строка 60: | Строка 60: | ||
}} | }} | ||
− | Таким образом у регулярных цепей есть свойство: через достаточно большое количество ходов будет существовать постоянная вероятность нахождения цепи в состоянии <tex>s_i</tex>, и эта вероятность не зависит от | + | Таким образом у регулярных цепей есть свойство: через достаточно большое количество ходов будет существовать постоянная вероятность нахождения цепи в состоянии <tex>s_i</tex>, и эта вероятность не зависит от начального распределения, а зависит только от матрицы P. |
+ | |||
+ | == Пример == | ||
+ | [[File:Temp.gif|thumb|250px|Пример регулярной цепи]] | ||
+ | Самый очевидный пример регулярной цепи - честная монета. Матрица переходов будет выглядеть так: | ||
+ | |||
+ | <tex> | ||
+ | P = \begin{bmatrix} | ||
+ | 0.5 & 0.5 \\ | ||
+ | 0.5 & 0.5 | ||
+ | \end{bmatrix} | ||
+ | </tex> | ||
+ | |||
+ | Тогда <tex>\forall n \ \ P^n = P = A,\ \alpha = \{ 0.5, 0.5 \}</tex> | ||
+ | То есть через достаточно большое количество ходов наша система будет ''равновероятно'' находится как в состоянии "1", так и в состоянии "0", независимо от начального распределения. | ||
== Литература == | == Литература == |
Версия 02:27, 14 января 2012
Содержание
Регулярная цепь Маркова
Определение: |
Марковская цепь называется регулярной (нормальной), если в матрице перехода P . |
В регулярной Марковской цепи из любого состояния можно попасть в любое другое за некоторое число ходов.
Лемма
Лемма: |
Пусть — матрица перехода регулярной цепи, — минимальный элемент этой матрицы. Пусть х — произвольный r-мерный вектор-столбец, имеющий максимальный элемент и минимальный . Пусть и - максимальный и минимальный элементы . Тогда , и |
Доказательство: |
Пусть х' - вектор, полученный из х заменой всех элементов, кроме на . Тогда . Каждый элемент имеет вид, где а - элемент P, который домножается на , причем . Поэтому наше выражение не превосходит . Отсюда и из неравенства получается: . Применяя те же рассуждения для вектора -х, получим: Складывая эти два неравенства, получаем . , ч.т.д. |
Основная теорема регулярных цепей (Эргодическая теорема)
Теорема: |
Регулярная марковская цепь эргодична. Другими словами: Пусть Р - регулярная переходная матрица. Тогда: |
Доказательство: |
Рассмотрим вектор-столбец , у которого j-й элемент равен 1, а все остальные равны 0. Пусть и - минимальный и максимальный элементы столбца . Так как , то из леммы следует, что и и. Пусть , тогда . Значит Так как в каждой матрице сходится к вектору, все элементы которого равны между собой. Пусть - их общее значение. Тогда . Заметим, что - j-тый столбец матрицы . Рассмотрим все для . Тогда сходится к матрице А, у которой по строкам стоит один и тот же вектор . сумма элементов в строке равна 1, то то же самое справедливо и для предельной матрицы А. Теорема доказана. |
Определение: |
Матрица А называется предельной матрицей, вектор | - предельным распределением.
Следствия
Теорема: |
Пусть - объекты из предыдущей теоремы.
Тогда справедливы факты:
|
Доказательство: |
Пусть - вектор-столбец, состоящий из единиц.
|
Таким образом у регулярных цепей есть свойство: через достаточно большое количество ходов будет существовать постоянная вероятность нахождения цепи в состоянии
, и эта вероятность не зависит от начального распределения, а зависит только от матрицы P.Пример
Самый очевидный пример регулярной цепи - честная монета. Матрица переходов будет выглядеть так:
Тогда
То есть через достаточно большое количество ходов наша система будет равновероятно находится как в состоянии "1", так и в состоянии "0", независимо от начального распределения.Литература
Дж. Кемени, Дж. Снелл "Конечные цепи Маркова", стр 93