Расчёт вероятности поглощения в состоянии — различия между версиями
(→Псевдокод) |
(→Псевдокод) |
||
Строка 9: | Строка 9: | ||
Матрица G определяется их суммированием по всем длинам пути из i в j: <tex>G = \sum\limits_{r = 1}^{\infty}{Q^{r-1} \cdot R} = (I + Q + Q^{2} + Q^{3} + ...) \cdot R = NR</tex>, т.к. <tex>(I + Q + Q^2 + ...) \cdot (I - Q) = I - Q + Q - Q^{2} + ... = I</tex>, а фундаментальная матрица марковской цепи <tex>N = (I - Q)^{-1}</tex> }} | Матрица G определяется их суммированием по всем длинам пути из i в j: <tex>G = \sum\limits_{r = 1}^{\infty}{Q^{r-1} \cdot R} = (I + Q + Q^{2} + Q^{3} + ...) \cdot R = NR</tex>, т.к. <tex>(I + Q + Q^2 + ...) \cdot (I - Q) = I - Q + Q - Q^{2} + ... = I</tex>, а фундаментальная матрица марковской цепи <tex>N = (I - Q)^{-1}</tex> }} | ||
=Псевдокод= | =Псевдокод= | ||
− | <tex>n</tex> - количество состояний Марковской цепи, <tex>m</tex> - количество переходов. Состояния пронумерованы от <tex>0</tex> до <tex>n - 1</tex>, переходы от <tex>0</tex> до <tex>m - 1</tex>. | + | Пусть <tex>n</tex> - количество состояний Марковской цепи, <tex>m</tex> - количество переходов. Состояния пронумерованы от <tex>0</tex> до <tex>n - 1</tex>, переходы от <tex>0</tex> до <tex>m - 1</tex>. Входные данные хранятся в массиве <tex>input</tex> где <tex>i</tex>-ая строка характеризует <tex>i</tex>-ый переход таким образом: <tex>input[i][2]</tex> - вероятность перехода из состояния <tex>input[i][0]</tex> в состояние <tex>input[i][1]</tex>. |
− | Создадим массив <tex>absorbing</tex> типа boolean, где <tex>i</tex>-ое true обозначает что <tex>i</tex>-ое состояние является поглощающим и наоборот. Обнаружим поглощающие состояния по такому признаку: если состояние поглощающее то с вероятностью 1 оно переходит само в себя. Также посчитаем количество поглощающих состояний <tex>abs | + | Создадим массив <tex>absorbing</tex> типа boolean, где <tex>i</tex>-ое true обозначает что <tex>i</tex>-ое состояние является поглощающим и наоборот. Обнаружим поглощающие состояния по такому признаку: если состояние поглощающее то с вероятностью 1 оно переходит само в себя. Также посчитаем количество поглощающих состояний <tex>abs</tex>. |
<code style = "display: inline-block;"> | <code style = "display: inline-block;"> | ||
− | + | '''for''' i=0 '''to''' n - 1 | |
− | if input[i][0] == input[i][1] and input[i][2] == 1 | + | '''if''' input[i][0] == input[i][1] '''and''' input[i][2] == 1 |
− | + | absorbing[input[i][0]] = true; | |
− | + | abs++; | |
</code> | </code> | ||
− | Найдем число несущественных состояний <tex>nonabs=n-abs | + | Найдем число несущественных состояний <tex>nonabs = n - abs</tex>. Теперь нужно заполнить матрицы <tex>Q</tex> (переходов между несущественными состояниями) и <tex>R</tex> (переходов из несущественных состояний в поглощающие). Для этого создадим сначала массив <tex>position</tex> где <tex>i</tex>-ый элемент указывает под каким номером будет находиться <tex>i</tex>-ое состояние среди существенных если оно существенное или несущественных в обратном случае, и заполним эти массивы. |
<code style = "display: inline-block;"> | <code style = "display: inline-block;"> | ||
− | + | count_q = 0; | |
− | + | count_r = 0; | |
− | + | '''for''' i = 0 '''to''' n - 1 | |
− | if abs[i] | + | '''if''' abs[i] |
− | + | position[i] = count_r; | |
− | + | count_r++; | |
− | else | + | '''else''' |
− | + | position[i] = count_q; | |
− | + | count_q++; | |
− | + | '''for''' i = 0 '''to''' m - 1 | |
if absorbing[input[i][1]] | if absorbing[input[i][1]] | ||
− | + | '''if''' absabsorbing[input[i][0]] | |
− | + | R[position[input[i][0]]][position[input[i][1]]] = input[i][2]; | |
− | else | + | '''else''' |
− | + | Q[position[input[i][0]]][position[input[i][1]]] = input[i][2]; | |
</code> | </code> | ||
Найдем Матрицу <tex>E = I - Q</tex> и создадим единичную матрицу <tex>N</tex>. | Найдем Матрицу <tex>E = I - Q</tex> и создадим единичную матрицу <tex>N</tex>. | ||
<code style = "display: inline-block;"> | <code style = "display: inline-block;"> | ||
− | + | '''for''' i = 0 '''to''' nonabs - 1 | |
− | N[i][i]=1; | + | N[i][i] = 1; |
− | E[i][i]=1; | + | E[i][i] = 1; |
− | for j=0 to nonabs | + | '''for''' j = 0 '''to''' nonabs - 1 |
− | + | E[i][j] -= Q[i][j]; | |
</code> | </code> | ||
Теперь приведем матрицу <tex>E</tex> к единичной методом Гаусса - Жордана, применяя те же преобразования к матрице <tex>N</tex>. | Теперь приведем матрицу <tex>E</tex> к единичной методом Гаусса - Жордана, применяя те же преобразования к матрице <tex>N</tex>. | ||
<code style = "display: inline-block;"> | <code style = "display: inline-block;"> | ||
− | + | '''for''' i = 0 '''to''' nonabs - 1 | |
− | + | '''if''' E[i][i] != 1 | |
− | + | mul = E[i][i]; | |
− | + | '''for''' j = 0 '''to''' nonabs - 1 | |
E[i][j] /= mul; | E[i][j] /= mul; | ||
N[i][j] /= mul; | N[i][j] /= mul; | ||
− | + | '''for''' row = 0 '''to''' nonabs - 1 | |
− | + | '''if''' i != row | |
− | + | mul = E[row][i]; | |
− | + | '''for''' j = 0 '''to''' nonabs - 1 | |
− | + | E[row][j] -= mul * E[i][j]; | |
− | + | N[row][j] -= mul * N[i][j]; | |
</code> | </code> | ||
− | В результате <tex>N=E^{-1}</tex> т.е. <tex>N</tex> - фундаментальная матрица Марковской цепи. Найдем матрицу <tex>G = N * R</tex>. | + | В результате <tex>N = E^{-1}</tex> т.е. <tex>N</tex> - фундаментальная матрица Марковской цепи. Найдем матрицу <tex>G = N * R</tex>. |
<code style = "display: inline-block;"> | <code style = "display: inline-block;"> | ||
− | + | '''for''' i = 0 '''to''' nonabs - 1 | |
− | + | '''for''' j = 0 '''to''' absorbing - 1 | |
− | + | G[i][j] = 0; | |
− | + | '''for''' k = 0 '''to''' nonabs - 1 | |
− | + | G[i][j] += N[i][k] * R[k][j]; | |
</code> | </code> | ||
− | Выведем ответ: | + | Выведем ответ: в <tex>i</tex>-ой строке вероятность поглощения в <tex>i</tex>-ом состоянии. Естественно для несущественного состояния это 0, в ином случае <tex>p=(($$\sum_{k=1}^n G[k][j]$$)+1)/n</tex> где <tex>j</tex> - номер соответствующий состоянию в <tex>G</tex>. Прибавлять 1 нужно т.к. вероятность поглотиться в <tex>i</tex>-ом поглощающем состоянии, оказавшись изначально в нем же равна 1. |
<code style = "display: inline-block;"> | <code style = "display: inline-block;"> | ||
− | + | '''for''' i = 0 '''to''' n - 1 | |
− | + | prob = 0; | |
− | + | '''if''' absorbing[i] | |
− | + | '''for''' j = 0 '''to''' nonabs - 1 | |
− | + | prob += G[j][position[i]]; | |
− | + | prob++; | |
− | + | prob /= n; | |
− | + | println(prob); | |
</code> | </code> | ||
Версия 19:14, 5 января 2013
Поглощающее(существенное) состояние цепи Маркова - состояние с вероятностью перехода в самого себя
. Составим матрицу G, элементы которой равны вероятности того, что, выйдя из i, попадём в поглощающее состояние j.Теорема: |
Доказательство: |
Пусть этот переход будет осуществлён за r шагов: i → Матрица G определяется их суммированием по всем длинам пути из i в j: → → ... → → j, где все являются несущественными. Тогда рассмотрим сумму , где Q - матрица переходов между несущественными состояниями, R - из несущественного в существенное. , т.к. , а фундаментальная матрица марковской цепи |
Псевдокод
Пусть
for i=0 to n - 1 if input[i][0] == input[i][1] and input[i][2] == 1 absorbing[input[i][0]] = true; abs++;
Найдем число несущественных состояний
count_q = 0; count_r = 0; for i = 0 to n - 1 if abs[i] position[i] = count_r; count_r++; else position[i] = count_q; count_q++; for i = 0 to m - 1 if absorbing[input[i][1]] if absabsorbing[input[i][0]] R[position[input[i][0]]][position[input[i][1]]] = input[i][2]; else Q[position[input[i][0]]][position[input[i][1]]] = input[i][2];
Найдем Матрицу
for i = 0 to nonabs - 1 N[i][i] = 1; E[i][i] = 1; for j = 0 to nonabs - 1 E[i][j] -= Q[i][j];
Теперь приведем матрицу
for i = 0 to nonabs - 1 if E[i][i] != 1 mul = E[i][i]; for j = 0 to nonabs - 1 E[i][j] /= mul; N[i][j] /= mul; for row = 0 to nonabs - 1 if i != row mul = E[row][i]; for j = 0 to nonabs - 1 E[row][j] -= mul * E[i][j]; N[row][j] -= mul * N[i][j];
В результате
for i = 0 to nonabs - 1 for j = 0 to absorbing - 1 G[i][j] = 0; for k = 0 to nonabs - 1 G[i][j] += N[i][k] * R[k][j];
Выведем ответ: в
for i = 0 to n - 1 prob = 0; if absorbing[i] for j = 0 to nonabs - 1 prob += G[j][position[i]]; prob++; prob /= n; println(prob);
Литература
- Википедия - Цепи Маркова
- Кемени Дж., Снелл Дж. "Конечные цепи Маркова".