Алгоритм "Вперед-Назад" — различия между версиями

Версия 07:06, 14 января 2013

Пусть дана скрытая Марковская модель , где [math]S = \{s_1, ..., s_n\}[/math] — состояния, — возможные события, — начальные вероятности, [math]A = \{a_{ij}\}[/math] — матрица переходов, а [math]B = \{b_{i\omega_k}\}[/math] — вероятность наблюдения события [math]\omega_k[/math] после перехода в состояние [math]s_i[/math].

За [math]T[/math] шагов в этой модели получилась последовательность наблюдений [math]O_{1,T} = {o_1, ..., o_T}[/math].

Алгоритм "вперед-назад" позволяет найти в скрытой Марковской модели вероятность попадания в состояние [math]s_i[/math] на [math]t[/math]-ом шаге при последовательности наблюдений [math]O[/math] и (скрытой) последовательности состояний [math]X[/math].

Вычисление

Пусть в момент [math]t[/math] мы оказались в состоянии [math]i[/math]: [math]X_t = i[/math]. Назовем [math]\alpha_{i}(t)[/math] вероятность того, что при этом во время переходов образовалась последовательность наблюдений [math]O_{1,t-1}[/math], а [math]\beta_{i}(t)[/math] — вероятность того, что после этого состояния мы будем наблюдать последовательность наблюдений [math]O_{t,T}[/math]:

Нам требуется найти . Поскольку будущее Марковской цепи не зависит от прошлого, мы можем утверждать, что вероятность того, что мы будем наблюдать события [math]O_{t,T}[/math] не зависит от того, что в прошлом мы наблюдали последовательность [math]O_{1,t-1}[/math], и, следовательно:

[math]=[/math]

Проход вперед

Заметим, что в [math]\{\alpha_s(1)\}[/math] нужно считать равной [math]\pi_s b_{so_1}[/math], как вероятность получить первое событие из начального распределения.

Для следующих [math]t[/math] можно вычислить [math]\alpha_s(t)[/math] рекуррентно:

Итак, вероятность попасть в состояние [math]s[/math] на [math]t[/math]-ом шаге, учитывая, что после перехода произойдет событие [math]o_t[/math] будет равна вероятности быть в состоянии [math]j[/math] на [math]t[/math]-ом шаге, умноженной на вероятность перейти из состояния [math]j[/math] в [math]s[/math], произведя событие [math]o_t[/math] для всех [math]j \in S[/math].

Проход назад

Аналогично, [math]\beta_s(T+1) = 1[/math], так как произвольная цепочка наблюдений будет произведена, какими бы ни были состояния.

Предыдущие [math]\beta_s(t)[/math] считаются рекуррентно:

Сглаживание вероятности

Итак, для произвольного состояния [math]s[/math] в произвольный шаг [math]t[/math] теперь известна вероятность того, что на пути к нему была произведена последовательность [math]O_{1,t}[/math] и вероятность того, что после него будет произведена последовательность [math]O_{t+1,T}[/math]. Чтобы найти вероятность того, что будет произведена цепочка событий, найти [math]P(O)[/math], нужно просуммировать произведение обеих вероятностей для всех состояний при произвольном шаге t: .

Теперь найдем вероятность того, что в момент [math]t[/math] цепь будет в состоянии [math]s[/math]:

[math]=[/math] [math]=[/math]

[math]=[/math]

Пример

Пусть ваша жизнь не удалась и вам пришлось работать охранником в холле офисного здания. Каждое утро вы наблюдали за тем, как один и тот же мужчина либо приносил, либо не приносил зонтик в зависимости от погоды. Увлекаясь статистикой, вы выяснили, что за день погода может поменяться с вероятностью 0.3; если на улице идет дождь, то мужчина приносит зонтик с вероятностью 0.9, а если солнечно — то с вероятностью 0.2 (пример справа).

Но вот вас переводят смотреть за камерами наблюдения: теперь вы не можете наблюдать за погодой, но каждый день видите того мужчину. За рабочую неделю вы заметили, что он не принес зонтик лишь в среду. С какой вероятностью во вторник шел дождь?

По вышесказанному, [math]\approx 0.820[/math].

Итак, с вероятностью [math]\approx 82\%[/math] во вторник шел дождь.

Псевдокод

   fwd = {}
   bkw = {}
   for s in S:
       fwd[s, 1] = emit_probability[s][observations[1]] * П[s]
       bkw[s, len(observations) - 1] = 1
   
   alpha(s, t):
       if (s, t) in fwd: return fwd[s, t]
       f = 0
       for j in S:
           f += alpha(j, t-1) * transition_probability[j][s]
       
       f *= emit_probability[s][observations[t]]
       fwd[s, t] = f
       return fwd[s, t]
  
   beta(s, t):
       if (s, t) in bkw: return bkw[s, t]
       b = 0
       for j in S:
           b += beta(j, t+1) * transition_probability[s][j] * emit_probability[j][O[t+1]]
       
       bkw[s, t] = b
       return bkw[s, t]
   
   forward_backward(s, t):
       chain_probability = 0
       for j in S:
           chain_probability = alpha(j, t)*beta(j, t)
       return (alpha(s, t)*beta(s, t)) / chain_probability

@@ Строка 33: / Строка 33: @@
 <tex>\beta_s(t) = P(O_{t, T} | X_t = s) = \\
-= \displaystyle\sum\limits_{j \in S} P(O_{t+1,T} | X_{t+1} = j) \cdot P(X_{t+1} = j | X_t = s) \cdot P(o_t | X_t = s) = \\
+= \displaystyle\sum\limits_{j \in S} P(O_{t+1,T} | X_{t+1} = j) \cdot P(X_{t+1} = j | X_t = s) \cdot P(o_{t+1} | X_t = s) = \\
-= \displaystyle\sum\limits_{j \in S} \beta_j(t+1) \cdot a_{sj} \cdot b_{jo_t}</tex>
+= \displaystyle\sum\limits_{j \in S} \beta_j(t+1) \cdot a_{sj} \cdot b_{jo_{t+1}}</tex>
 === Сглаживание вероятности  ===
@@ Строка 44: / Строка 44: @@
 <tex>=</tex> <tex dpi="160">\frac{\alpha_s(t)\cdot \beta_s(t)}{\sum_{i \in S}\alpha_s(t)\cdot \beta_s(t)}</tex>
+== Пример ==
+[[Файл:HMM-Forward-Backward-Example.png|right|Пример СММ]]
+Пусть ваша жизнь не удалась и вам пришлось работать охранником в холле офисного здания. Каждое утро вы наблюдали за тем, как один и тот же мужчина либо приносил, либо не приносил зонтик в зависимости от погоды. Увлекаясь статистикой, вы выяснили, что за день погода может поменяться с вероятностью 0.3; если на улице идет дождь, то мужчина приносит зонтик с вероятностью 0.9, а если солнечно {{---}} то с вероятностью 0.2 (пример справа).
+Но вот вас переводят смотреть за камерами наблюдения: теперь вы не можете наблюдать за погодой, но каждый день видите того мужчину. За рабочую неделю вы заметили, что он не принес зонтик лишь в среду. С какой вероятностью во вторник шел дождь?
+По вышесказанному, <tex>P(X_2 = Rain | \{umbrella, umbrella, no, umbrella, umbrella\}) =</tex> <tex dpi="160">\frac{\alpha_{Rain}(2)\cdot \beta_{Rain}(2)}{\sum_{i \in \{Rain, Sun\}}\alpha_{Rain}(2)\cdot \beta_{Rain}(2)}</tex> <tex>\approx 0.820</tex>.
+Итак, с вероятностью <tex>\approx 82\%</tex> во вторник шел дождь.
 == Псевдокод ==
@@ Строка 66: / Строка 76: @@
          b = 0
          for j in S:
-             b += beta(j, t+1) * transition_probability[s][j] * emit_probability[j][O[t]]
+             b += beta(j, t+1) * transition_probability[s][j] * emit_probability[j][O[t+1]]
          bkw[s, t] = b

Алгоритм "Вперед-Назад" — различия между версиями

Версия 07:06, 14 января 2013

Содержание

Вычисление

Проход вперед

Проход назад

Сглаживание вероятности

Пример

Псевдокод

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты