Регулярная марковская цепь — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Основная теорема регулярных цепей (Эргодическая теорема))
Строка 10: Строка 10:
 
== Лемма ==
 
== Лемма ==
 
{{Лемма
 
{{Лемма
|statement=Пусть <tex>P_{[r\times r]}</tex> матрица перехода регулярной цепи, <tex>\varepsilon</tex> минимальный элемент этой матрицы. Пусть х произвольный r-мерный вектор-столбец, имеющий максимальный элемент <tex>M_0</tex> и минимальный <tex>m_0</tex>. Пусть <tex>M_1</tex> и <tex>m_1</tex> - максимальный и минимальный элементы <tex>Px</tex>. <br>
+
|statement=Пусть <tex>P_{[r\times r]}</tex> {{---}} матрица перехода регулярной цепи, <tex>\varepsilon</tex> {{---}} минимальный элемент этой матрицы. Пусть х {{---}} произвольный r-мерный вектор-столбец, имеющий максимальный элемент <tex>M_0</tex> и минимальный <tex>m_0</tex>. Пусть <tex>M_1</tex> и <tex>m_1</tex> {{---}} максимальный и минимальный элементы <tex>Px</tex>. <br>
 
Тогда <tex>M_1 \leqslant M_0</tex>, <tex>m_1 \geqslant m_0</tex> и <tex>M_1 - m_1 \leqslant (1 - 2\varepsilon)(M_0 - m_0)</tex>
 
Тогда <tex>M_1 \leqslant M_0</tex>, <tex>m_1 \geqslant m_0</tex> и <tex>M_1 - m_1 \leqslant (1 - 2\varepsilon)(M_0 - m_0)</tex>
 
|proof=
 
|proof=
Пусть х' - вектор, полученный из х заменой всех элементов, кроме <tex>m_0</tex> на <tex>M_0</tex>. Тогда <tex>x \leqslant x'</tex>. Каждый элемент <tex>Px'</tex> имеет вид
+
Пусть х' {{---}} вектор, полученный из х заменой всех элементов, кроме <tex>m_0</tex> на <tex>M_0</tex>. Тогда <tex>x \leqslant x'</tex>. Каждый элемент <tex>Px'</tex> имеет вид
  
<tex>am_0 + (1 - a)M_0 = M_0 - a(M_0 - m_0)</tex>, где а - элемент P, который домножается на <tex>m_0</tex>, причем <tex>a \geqslant \varepsilon</tex>. Поэтому наше выражение не превосходит <tex>M_0 - \varepsilon(M_0 - m_0)</tex>. Отсюда и из неравенства <tex>x \leqslant x'</tex> получается: <tex>M_1 \leqslant M_0 - \varepsilon (M_0 - m_0)</tex>.
+
<tex>am_0 + (1 - a)M_0 = M_0 - a(M_0 - m_0)</tex>, где а {{---}} элемент P, который домножается на <tex>m_0</tex>, причем <tex>a \geqslant \varepsilon</tex>. Поэтому наше выражение не превосходит <tex>M_0 - \varepsilon(M_0 - m_0)</tex>. Отсюда и из неравенства <tex>x \leqslant x'</tex> получается: <tex>M_1 \leqslant M_0 - \varepsilon (M_0 - m_0)</tex>.
  
 
Применяя те же рассуждения для вектора -х, получим: <tex>-m_1 \leqslant -m_0 - \varepsilon (-m_0 + M_0)</tex>.
 
Применяя те же рассуждения для вектора -х, получим: <tex>-m_1 \leqslant -m_0 - \varepsilon (-m_0 + M_0)</tex>.
Строка 26: Строка 26:
 
{{Теорема
 
{{Теорема
 
|statement=Регулярная марковская цепь [[Эргодическая марковская цепь|эргодична]]. Другими словами:<br>
 
|statement=Регулярная марковская цепь [[Эргодическая марковская цепь|эргодична]]. Другими словами:<br>
Пусть Р - регулярная переходная матрица. Тогда:<br>
+
Пусть Р {{---}} регулярная переходная матрица. Тогда:<br>
 
<tex>\exists A: \displaystyle \lim_{n \to \infty}P^n = A</tex>;<br>
 
<tex>\exists A: \displaystyle \lim_{n \to \infty}P^n = A</tex>;<br>
 
каждая строка А представляет собой один и тот же вероятностный вектор <tex>\alpha = \{a_1, a_2, \ldots, a_r \}</tex>
 
каждая строка А представляет собой один и тот же вероятностный вектор <tex>\alpha = \{a_1, a_2, \ldots, a_r \}</tex>
 
|proof=
 
|proof=
Рассмотрим вектор-столбец <tex>e_j</tex>, у которого j-й элемент равен 1, а все остальные равны 0. Пусть <tex>M_n</tex> и <tex>m_n</tex> - минимальный и максимальный элементы столбца <tex>P^n e_j</tex>.  
+
Рассмотрим вектор-столбец <tex>e_j</tex>, у которого j-й элемент равен 1, а все остальные равны 0. Пусть <tex>M_n</tex> и <tex>m_n</tex> {{---}} минимальный и максимальный элементы столбца <tex>P^n e_j</tex>.  
 
Так как <tex>P^n e_j = P \cdot P^{n-1} e_j</tex>, то из леммы следует, что <tex>M_1 \geqslant M_2 \geqslant \ldots</tex> и <tex>m_1 \leqslant m_2 \leqslant \ldots</tex> и  
 
Так как <tex>P^n e_j = P \cdot P^{n-1} e_j</tex>, то из леммы следует, что <tex>M_1 \geqslant M_2 \geqslant \ldots</tex> и <tex>m_1 \leqslant m_2 \leqslant \ldots</tex> и  
  
Строка 37: Строка 37:
 
<tex>d_n \leqslant (1 - 2 \varepsilon )^n d_0 = (1 - 2 \varepsilon)^n \to 0</tex>.
 
<tex>d_n \leqslant (1 - 2 \varepsilon )^n d_0 = (1 - 2 \varepsilon)^n \to 0</tex>.
  
Значит <tex>P^n e_j</tex> сходится к вектору, все элементы которого равны между собой. Пусть <tex>a_j</tex> - их общее значение. Тогда <tex>0 \leqslant a_j \leqslant 1</tex>. Заметим, что <tex>P^n e_j</tex> - j-тый столбец матрицы <tex>P^n</tex>. Рассмотрим все <tex>e_j</tex> для <tex>j = 1, 2, \ldots</tex>. Тогда <tex>P^n</tex> сходится к матрице А, у которой по строкам стоит один и тот же вектор <tex>\alpha = \{a_1, a_2, \ldots, a_r \}</tex>.
+
Значит <tex>P^n e_j</tex> сходится к вектору, все элементы которого равны между собой. Пусть <tex>a_j</tex> {{---}} их общее значение. Тогда <tex>0 \leqslant a_j \leqslant 1</tex>. Заметим, что <tex>P^n e_j</tex> {{---}} j-тый столбец матрицы <tex>P^n</tex>. Рассмотрим все <tex>e_j</tex> для <tex>j = 1, 2, \ldots</tex>. Тогда <tex>P^n</tex> сходится к матрице А, у которой по строкам стоит один и тот же вектор <tex>\alpha = \{a_1, a_2, \ldots, a_r \}</tex>.
 
Так как в каждой матрице <tex>P^n</tex> сумма элементов в строке равна 1, то то же самое справедливо и для предельной матрицы А. Теорема доказана.
 
Так как в каждой матрице <tex>P^n</tex> сумма элементов в строке равна 1, то то же самое справедливо и для предельной матрицы А. Теорема доказана.
 
}}
 
}}
  
 
{{Определение
 
{{Определение
|definition=Матрица А называется ''предельной матрицей'', вектор <tex>\alpha</tex> - ''предельным распределением''.
+
|definition=Матрица А называется ''предельной матрицей'', вектор <tex>\alpha</tex> {{---}} ''предельным распределением''.
 
}}
 
}}
  
Строка 48: Строка 48:
  
 
{{Теорема
 
{{Теорема
|statement=Пусть <tex>P, A, \alpha</tex> - объекты из предыдущей теоремы.
+
|statement=Пусть <tex>P, A, \alpha</tex> {{---}} объекты из предыдущей теоремы.
 
Тогда справедливы факты:<br>
 
Тогда справедливы факты:<br>
 
* для любого вероятностного вектора <tex>\pi \ \ \ \displaystyle \lim_{n \to \infty} \pi P^n = \alpha</tex>
 
* для любого вероятностного вектора <tex>\pi \ \ \ \displaystyle \lim_{n \to \infty} \pi P^n = \alpha</tex>
* <tex>\alpha</tex> - единственный вектор, для которого <tex>\alpha P = \alpha</tex>
+
* <tex>\alpha</tex> {{---}} единственный вектор, для которого <tex>\alpha P = \alpha</tex>
 
* <tex>AP = PA = A</tex>
 
* <tex>AP = PA = A</tex>
 
|proof=
 
|proof=
Пусть <tex>\xi</tex> - вектор-столбец, состоящий из единиц.
+
Пусть <tex>\xi</tex> {{---}} вектор-столбец, состоящий из единиц.
  
* <tex>\pi</tex> - вероятностный вектор, значит <tex>\pi \xi = 1 </tex> ( сумма его элементов равна 1 ), значит <tex>\pi A = \pi \xi \alpha = \alpha</tex>. Но <tex>\displaystyle \lim_{n \to \infty} \pi P^n = \pi A = \alpha</tex> - первый пункт доказан.
+
* <tex>\pi</tex> {{---}} вероятностный вектор, значит <tex>\pi \xi = 1 </tex> ( сумма его элементов равна 1 ), значит <tex>\pi A = \pi \xi \alpha = \alpha</tex>. Но <tex>\displaystyle \lim_{n \to \infty} \pi P^n = \pi A = \alpha</tex> {{---}} первый пункт доказан.
 
* Пусть <tex>\beta : \ \ \beta P = \beta</tex>. Тогда <tex>\forall n \ \beta P^n = \beta \Rightarrow \beta = \beta A = \alpha</tex>. Второй пункт доказан.
 
* Пусть <tex>\beta : \ \ \beta P = \beta</tex>. Тогда <tex>\forall n \ \beta P^n = \beta \Rightarrow \beta = \beta A = \alpha</tex>. Второй пункт доказан.
 
* <tex>\displaystyle \lim_{n \to \infty} P^n = A \Leftrightarrow P \cdot \lim_{n \to \infty} P^n = A \Leftrightarrow \lim_{n \to \infty} P^n  \cdot P = A</tex>. Третий пункт доказан.
 
* <tex>\displaystyle \lim_{n \to \infty} P^n = A \Leftrightarrow P \cdot \lim_{n \to \infty} P^n = A \Leftrightarrow \lim_{n \to \infty} P^n  \cdot P = A</tex>. Третий пункт доказан.
Строка 81: Строка 81:
 
То есть через достаточно большое количество ходов наша система будет ''равновероятно'' находится как в состоянии "1", так и в состоянии "2", независимо от начального распределения.
 
То есть через достаточно большое количество ходов наша система будет ''равновероятно'' находится как в состоянии "1", так и в состоянии "2", независимо от начального распределения.
  
Более интересный пример - если мы будем управлять переходом состояний с помощью нечестной монеты.  
+
Более интересный пример {{---}} если мы будем управлять переходом состояний с помощью нечестной монеты.  
 
Пусть а - вероятность выпадения "0" на монете.  
 
Пусть а - вероятность выпадения "0" на монете.  
  

Версия 04:27, 1 июня 2017

Определение:
Марковская цепь называется регулярной, если она целиком состоит из одного циклического класса.


Теорема:
Цепь регулярна тогда и только тогда, когда существует такое n, что в матрице Pn все элементы ненулевые, то есть из любого состояния можно перейти в любое за n переходов.

Лемма

Лемма:
Пусть P[r×r] — матрица перехода регулярной цепи, ε — минимальный элемент этой матрицы. Пусть х — произвольный r-мерный вектор-столбец, имеющий максимальный элемент M0 и минимальный m0. Пусть M1 и m1 — максимальный и минимальный элементы Px.
Тогда M1M0, m1m0 и M1m1(12ε)(M0m0)
Доказательство:

Пусть х' — вектор, полученный из х заменой всех элементов, кроме m0 на M0. Тогда xx. Каждый элемент Px имеет вид

am0+(1a)M0=M0a(M0m0), где а — элемент P, который домножается на m0, причем aε. Поэтому наше выражение не превосходит M0ε(M0m0). Отсюда и из неравенства xx получается: M1M0ε(M0m0).

Применяя те же рассуждения для вектора -х, получим: m1m0ε(m0+M0).

Складывая эти два неравенства, получаем M1m1M0m02ε(M0m0)=(12ε)(M0m0), ч.т.д.

Эргодическая теорема для регулярных цепей

Теорема:
Регулярная марковская цепь эргодична. Другими словами:

Пусть Р — регулярная переходная матрица. Тогда:
A:limnPn=A;

каждая строка А представляет собой один и тот же вероятностный вектор α={a1,a2,,ar}
Доказательство:

Рассмотрим вектор-столбец ej, у которого j-й элемент равен 1, а все остальные равны 0. Пусть Mn и mn — минимальный и максимальный элементы столбца Pnej. Так как Pnej=PPn1ej, то из леммы следует, что M1M2 и m1m2 и

Mnmn(12ε)(Mn1mn1). Пусть dn=Mnmn, тогда

dn(12ε)nd0=(12ε)n0.

Значит Pnej сходится к вектору, все элементы которого равны между собой. Пусть aj — их общее значение. Тогда 0aj1. Заметим, что Pnej — j-тый столбец матрицы Pn. Рассмотрим все ej для j=1,2,. Тогда Pn сходится к матрице А, у которой по строкам стоит один и тот же вектор α={a1,a2,,ar}.

Так как в каждой матрице Pn сумма элементов в строке равна 1, то то же самое справедливо и для предельной матрицы А. Теорема доказана.


Определение:
Матрица А называется предельной матрицей, вектор αпредельным распределением.


Следствия

Теорема:
Пусть P,A,α — объекты из предыдущей теоремы.

Тогда справедливы факты:

  • для любого вероятностного вектора π   limnπPn=α
  • α — единственный вектор, для которого αP=α
  • AP=PA=A
Доказательство:

Пусть ξ — вектор-столбец, состоящий из единиц.

  • π — вероятностный вектор, значит πξ=1 ( сумма его элементов равна 1 ), значит πA=πξα=α. Но limnπPn=πA=α — первый пункт доказан.
  • Пусть β:  βP=β. Тогда n βPn=ββ=βA=α. Второй пункт доказан.
  • limnPn=APlimnPn=AlimnPnP=A. Третий пункт доказан.

Таким образом у регулярных цепей есть свойство: через достаточно большое количество ходов будет существовать постоянная вероятность нахождения цепи в состоянии si, и эта вероятность не зависит от начального распределения, а зависит только от матрицы P.

Примеры

Пример регулярной цепи

Самый очевидный и тривиальный пример регулярной цепи:

Пусть у нас есть два состояния - "1" и "2". Каждый ход мы кидаем честную монету - если выпал "0", то цепь остается в предыдущем состоянии, если "1" - цепь меняет свое состояние.

Матрица переходов будет выглядеть так:

P=[0.50.50.50.5]

Тогда n  Pn=P=A, α={0.5,0.5} То есть через достаточно большое количество ходов наша система будет равновероятно находится как в состоянии "1", так и в состоянии "2", независимо от начального распределения.

Более интересный пример — если мы будем управлять переходом состояний с помощью нечестной монеты. Пусть а - вероятность выпадения "0" на монете.

Матрица переходов будет выглядеть так:

P=[a1a1aa]

Тогда при возведении Р в степень n элементы будут стремится к 12 с разных сторон. То есть вектор α={0.5,0.5}, т.е от честности монеты ничего не зависит.

Литература

Дж. Кемени, Дж. Снелл "Конечные цепи Маркова", стр 93