Регулярная марковская цепь — различия между версиями
м (rollbackEdits.php mass rollback) |
|||
(не показано 10 промежуточных версий 6 участников) | |||
Строка 1: | Строка 1: | ||
{{Определение | {{Определение | ||
− | |definition=[[Марковская цепь|Марковская цепь]] называется регулярной, если она целиком состоит из одного [[Эргодическая марковская цепь | циклического класса]]. | + | |definition=[[Марковская цепь|Марковская цепь]] называется '''регулярной''' (англ. ''regular Markov chain''), если она целиком состоит из одного [[Эргодическая марковская цепь#Циклический класс | циклического класса]]. |
}} | }} | ||
Строка 19: | Строка 19: | ||
Применяя те же рассуждения для вектора <tex>-x</tex>, получим: <tex>-m_1 \leqslant -m_0 - \varepsilon (-m_0 + M_0)</tex>. | Применяя те же рассуждения для вектора <tex>-x</tex>, получим: <tex>-m_1 \leqslant -m_0 - \varepsilon (-m_0 + M_0)</tex>. | ||
− | Складывая эти два неравенства, получаем <tex>M_1 - m_1 \leqslant M_0 - m_0 - 2\varepsilon (M_0 - m_0) = (1 - 2\varepsilon )(M_0 - m_0)</tex> | + | Складывая эти два неравенства, получаем <tex>M_1 - m_1 \leqslant M_0 - m_0 - 2\varepsilon (M_0 - m_0) = (1 - 2\varepsilon )(M_0 - m_0)</tex>. |
}} | }} | ||
Строка 42: | Строка 42: | ||
{{Определение | {{Определение | ||
− | |definition=Матрица <tex>A</tex> называется ''предельной матрицей'', вектор <tex>\alpha</tex> {{---}} ''предельным распределением''. | + | |definition=Матрица <tex>A</tex> называется '''предельной матрицей''' (англ. ''limiting matrix''), вектор <tex>\alpha</tex> {{---}} '''предельным распределением''' (англ. ''limiting distribution''). |
}} | }} | ||
Строка 64: | Строка 64: | ||
== Примеры == | == Примеры == | ||
− | [[File: | + | [[File:Пример регулярной цепи.jpg|thumb|270px|Пример регулярной цепи (черным цветом обозначена вероятность, красным - выпавшая сторона монеты)]] |
Самый очевидный и тривиальный пример регулярной цепи: | Самый очевидный и тривиальный пример регулярной цепи: | ||
Строка 78: | Строка 78: | ||
</tex> | </tex> | ||
− | Тогда <tex>\forall n \ \ P^n = P = A,\ \alpha = \{ 0.5, 0.5 \}</tex> | + | Тогда <tex>\forall n \ \ P^n = P = A,\ \alpha = \{ 0.5, 0.5 \} ,\,</tex> |
− | + | то есть через достаточно большое количество ходов наша система будет ''равновероятно'' находится как в состоянии <tex>1</tex>, так и в состоянии <tex>2</tex>, независимо от начального распределения. | |
Более интересный пример {{---}} если мы будем управлять переходом состояний с помощью нечестной монеты. | Более интересный пример {{---}} если мы будем управлять переходом состояний с помощью нечестной монеты. | ||
Строка 94: | Строка 94: | ||
Тогда при возведении <tex>P</tex> в степень <tex>n</tex> элементы будут стремится к <tex>\dfrac{1}{2}</tex> с разных сторон. | Тогда при возведении <tex>P</tex> в степень <tex>n</tex> элементы будут стремится к <tex>\dfrac{1}{2}</tex> с разных сторон. | ||
− | То есть вектор <tex>\alpha = \{ 0.5, 0.5 \}</tex>, | + | То есть вектор <tex>\alpha = \{ 0.5, 0.5 \}</tex>, таким образом от честности монеты ничего не зависит. |
== См. также == | == См. также == |
Текущая версия на 19:17, 4 сентября 2022
Определение: |
Марковская цепь называется регулярной (англ. regular Markov chain), если она целиком состоит из одного циклического класса. |
Теорема: |
Цепь регулярна тогда и только тогда, когда существует такое , что в матрице все элементы ненулевые, то есть из любого состояния можно перейти в любое за переходов. |
Содержание
Лемма
Лемма: |
Пусть — матрица перехода регулярной цепи, — минимальный элемент этой матрицы. Пусть — произвольный -мерный вектор-столбец, имеющий максимальный элемент и минимальный . Пусть и — максимальный и минимальный элементы . Тогда , и |
Доказательство: |
Пусть — вектор, полученный из заменой всех элементов, кроме на . Тогда . Каждый элемент имеет вид, где — элемент , который домножается на , причем . Поэтому наше выражение не превосходит . Отсюда и из неравенства получается: . Применяя те же рассуждения для вектора Складывая эти два неравенства, получаем , получим: . . |
Эргодическая теорема для регулярных цепей
Теорема: |
Регулярная марковская цепь эргодична. Другими словами: Пусть |
Доказательство: |
Рассмотрим вектор-столбец , у которого -й элемент равен , а все остальные равны . Пусть и — минимальный и максимальный элементы столбца . Так как , то из леммы следует, что и и. Пусть , тогда . Значит Так как в каждой матрице сходится к вектору, все элементы которого равны между собой. Пусть — их общее значение. Тогда . Заметим, что — -тый столбец матрицы . Рассмотрим все для . Тогда сходится к матрице , у которой по строкам стоит один и тот же вектор . сумма элементов в строке равна , то то же самое справедливо и для предельной матрицы . Теорема доказана. |
Определение: |
Матрица | называется предельной матрицей (англ. limiting matrix), вектор — предельным распределением (англ. limiting distribution).
Следствия
Теорема: |
Пусть — объекты из предыдущей теоремы.
Тогда справедливы факты:
|
Доказательство: |
Пусть — вектор-столбец, состоящий из единиц.
|
Таким образом у регулярных цепей есть свойство: через достаточно большое количество ходов будет существовать постоянная вероятность нахождения цепи в состоянии
, и эта вероятность не зависит от начального распределения, а зависит только от матрицы .Примеры
Самый очевидный и тривиальный пример регулярной цепи:
Пусть у нас есть два состояния —
и . Каждый ход мы кидаем честную монету — если выпал , то цепь остается в предыдущем состоянии, если — цепь меняет свое состояние.Матрица переходов будет выглядеть так:
Тогда
то есть через достаточно большое количество ходов наша система будет равновероятно находится как в состоянии , так и в состоянии , независимо от начального распределения.Более интересный пример — если мы будем управлять переходом состояний с помощью нечестной монеты. Пусть
— вероятность выпадения на монете.Матрица переходов будет выглядеть так:
Тогда при возведении
в степень элементы будут стремится к с разных сторон. То есть вектор , таким образом от честности монеты ничего не зависит.См. также
Источники информации
- Дж. Кемени, Дж. Снелл Конечные цепи Маркова, стр 93