Участник:Mk17.ru — различия между версиями
(не показаны 44 промежуточные версии 9 участников) | |||
Строка 3: | Строка 3: | ||
{{Определение | {{Определение | ||
− | |definition = '''Случайное блуждание''' (англ. ''Random walk'') {{---}} математическая модель процесса случайных изменений — шагов в дискретные моменты времени | + | |definition = '''Случайное блуждание''' (англ. ''Random walk'') {{---}} математическая модель процесса случайных изменений — шагов в дискретные моменты времени, предполагается, что изменение на каждом шаге не зависит от предыдущих и от времени. В силу простоты анализа эта модель часто используется в разных сферах в математике, экономике, физике, но, как правило, такая модель является существенным упрощением реального процесса. |
}} | }} | ||
Строка 10: | Строка 10: | ||
Представим частицу, которая движется по целым точкам на прямой. Перемещение из одной точки | Представим частицу, которая движется по целым точкам на прямой. Перемещение из одной точки | ||
в другую происходит через равные промежутки времени. За один шаг частица из точки k с положительной вероятностью p перемещается в точку <tex>k + 1</tex> и с положительной вероятностью <tex>q = 1 − p</tex> | в другую происходит через равные промежутки времени. За один шаг частица из точки k с положительной вероятностью p перемещается в точку <tex>k + 1</tex> и с положительной вероятностью <tex>q = 1 − p</tex> | ||
− | перемещается в точку k − 1. | + | перемещается в точку <tex>k − 1</tex>. |
− | Физической системе соответствует цепь Маркова: | + | Физической системе соответствует [https://neerc.ifmo.ru/wiki/index.php?title=%D0%9C%D0%B0%D1%80%D0%BA%D0%BE%D0%B2%D1%81%D0%BA%D0%B0%D1%8F_%D1%86%D0%B5%D0%BF%D1%8C цепь Маркова]: |
*<tex>\xi_n = \xi_{n-1} + \eta_n = \xi_0 + S_n, \eta_n = \begin{cases} 1 &\text{с вероятностью p}\\-1 &\text{с вероятностью 1 - p} | *<tex>\xi_n = \xi_{n-1} + \eta_n = \xi_0 + S_n, \eta_n = \begin{cases} 1 &\text{с вероятностью p}\\-1 &\text{с вероятностью 1 - p} | ||
Строка 17: | Строка 17: | ||
Заметим, что вернуться в какую-либо точку можно только за четное число шагов. | Заметим, что вернуться в какую-либо точку можно только за четное число шагов. | ||
− | ==Вероятность смещения на d единиц вправо | + | ==Вероятность смещения на d единиц вправо (влево)== |
− | + | Будем считать, что <tex>P(\xi_0 = m) = 1</tex>. Это соответствует тому, что в начальный момент времени частица находилась в точке | |
− | <tex>x = m</tex> (здесь <tex>m</tex> — фиксированное число) и затем начала случайно блуждать в соответствии с описанными выше правилами. Пусть d — смещение частицы за n шагов. | + | <tex>x = m</tex> (здесь <tex>m</tex> — фиксированное число) и затем начала случайно блуждать в соответствии с описанными выше правилами. Пусть <tex>d</tex> — смещение частицы за <tex>n</tex> шагов. |
Найдём <tex>P(\xi_n = m + d)</tex> для каждого <tex>d ∈ Z</tex>. | Найдём <tex>P(\xi_n = m + d)</tex> для каждого <tex>d ∈ Z</tex>. | ||
− | |||
− | |||
− | |||
− | |||
− | + | Справедливо равенство: | |
− | + | *<tex>P(\xi_n = m + d) = P(\xi_n = m + d | \xi_0 = m)</tex>, если <tex>P(\xi_0 = m) = 1.</tex> | |
− | + | Представление через условную вероятность удобно, если нам необходимо явно указать, где находилась частица в начальный момент времени. | |
− | + | Наша физическая модель с математической точки зрения в точности отвечает | |
+ | схеме [https://neerc.ifmo.ru/wiki/index.php?title=%D0%A1%D1%85%D0%B5%D0%BC%D0%B0_%D0%91%D0%B5%D1%80%D0%BD%D1%83%D0%BB%D0%BB%D0%B8#:~:text=%D0%A1%D1%85%D0%B5%D0%BC%D0%BE%D0%B9%20%D0%91%D0%B5%D1%80%D0%BD%D1%83%D0%BB%D0%BB%D0%B8%20(%D0%B0%D0%BD%D0%B3%D0%BB.,%2C%20%D0%B0%20%D0%BD%D0%B5%D1%83%D0%B4%D0%B0%D1%87%D0%B0%20%E2%80%94%20%D1%81%20%D0%B2%D0%B5%D1%80%D0%BE%D1%8F%D1%82%D0%BD%D0%BE%D1%81%D1%82%D1%8C%D1%8E%20 независимых испытаний Бернулли] с двумя исходами —- движением вправо, который мы будем называть успехом, и движением вправо (неудачей). Пусть частица сделала <tex>n</tex> прыжков. Вероятность того, что среди | ||
+ | этих прыжков будет ровно <tex>k</tex> прыжков вправо (или, что то же самое, <tex>n−k</tex> прыжков | ||
+ | влево) задаётся формулой: | ||
− | + | *<tex>P = {C_{n}^k} p^k q^{n−k}, \quad k = 0, 1, . . . , n </tex> | |
− | + | Смещение частицы и число прыжков влево и вправо связаны уравнением | |
− | + | *<tex>d = 1 · k + (−1) · (n − k) = 2k − n \quad</tex> | |
− | + | откуда <tex>k = \frac{(n + d)}{2}</tex>. Понятно, что, поскольку частица сделала ровно <tex>n</tex> прыжков, | |
+ | число прыжков вправо должно быть целым числом в интервале <tex>[0, n]</tex>, другими словами, <tex>P(\xi_n = m + d) = 0,</tex> если <tex>k = \frac{(n + d)}{2}, k \notin \{0, 1, . . . , n\}</tex>. Если же указанное | ||
+ | ограничение выполнено, то в рамках нашей модели блужданий мы можем воспользоваться распределением Бернулли <tex>P = {C_{n}^k} p^k q^{n−k}</tex>: | ||
− | + | *<tex> P(\xi_n = m + d) = {C_{n}^k} p^k q^{n−k}, \quad k = \frac{(n + d)}{2} </tex>, при обязательном условии <tex>k ∈ {0, 1, . . . , n}.</tex> | |
− | |||
− | |||
− | |||
− | {{ | + | '''Замечания'''. |
− | + | ||
− | + | <tex>1)</tex> Ограничение <tex>0 \leq k \leq n </tex> по формуле <tex>d = 1 · k + (−1) · (n − k) = 2k − n</tex> влечёт <tex>|d| \leq n</tex>. Это можно понять и без расчётов: если <tex>|d| > n</tex>, то частица не успевает дойти из начальной в конечную точку за <tex>n</tex> шагов. | |
+ | |||
+ | <tex>2)</tex> При своём движении частица случайным образом выбирает одну из возможных траекторий. Для перехода из точки | ||
+ | <tex>m</tex> в точку <tex>m</tex> за <tex>n</tex> шагов возможными являются все те и только те траектории длины | ||
+ | <tex>n</tex>, в которых ровно <tex>k</tex> смещений вправо и <tex>n − k</tex> смещений влево, где <tex>k = \frac{(n + | ||
+ | d)}{2}</tex>. Равенство <tex>P = {C_{n}^k} p^k q^{n−k}</tex> при этом можно интерпретировать так: вероятность того, что частица пройдет по одной из | ||
+ | возможных траекторий, равна <tex>p^k q^{n−k}</tex>, и всего существуют <tex>{C_{n}^k}</tex> таких траекторий, таким | ||
+ | образом, | ||
+ | *<tex>P = p^k \cdot q^{n−k}+...+p^k \cdot q^{n−k}={C_{n}^k} p^k q^{n−k}.</tex> | ||
+ | |||
+ | == Случайные блуждания по прямой == | ||
+ | |||
+ | Представим частицу, которая движется по целым точкам на прямой. Перемещение из одной точки | ||
+ | в другую происходит через равные промежутки времени. За один шаг частица из точки k с положительной вероятностью p перемещается в точку <tex>k + 1</tex> и с положительной вероятностью <tex>q = 1 − p</tex> | ||
+ | перемещается в точку <tex>k − 1</tex>. | ||
+ | Физической системе соответствует [https://neerc.ifmo.ru/wiki/index.php?title=%D0%9C%D0%B0%D1%80%D0%BA%D0%BE%D0%B2%D1%81%D0%BA%D0%B0%D1%8F_%D1%86%D0%B5%D0%BF%D1%8C цепь Маркова]: | ||
+ | |||
+ | *<tex>\xi_n = \xi_{n-1} + \eta_n = \xi_0 + S_n, \eta_n = \begin{cases} 1 &\text{с вероятностью p}\\-1 &\text{с вероятностью 1 - p} | ||
+ | \end{cases}</tex> | ||
+ | Заметим, что вернуться в какую-либо точку можно только за четное число шагов. | ||
+ | |||
+ | == Задача о разорении игрока == | ||
+ | Пусть начальный капитал <tex>\xi_0</tex> первого | ||
+ | игрока составляет <tex>k</tex> рублей, а капитал второго игрока <tex> – (n − k)</tex> рублей. Первый игрок выигрывает | ||
+ | или проигрывает рубль с вероятностями <tex>p</tex> и <tex>q</tex> соответственно. Игра продолжается до тех пор, пока | ||
+ | капитал первого игрока не уменьшится до нуля, либо не возрастет до <tex>n</tex>. Поглощение точки в правом | ||
+ | конце отрезка <tex>[0, n]</tex> соответствует выигрышу первого игрока. | ||
+ | |||
+ | Рассмотрим конечную цепь Маркова: | ||
+ | |||
+ | <tex>\quad\xi_{t+1} = \xi_t + \eta_t,\quad P\{\eta_t = 1|\xi_t ≠ 0 ∨ \xi_t ≠ n\} = p,\quad P\{\eta_t = −1|\xi_t ≠ 0 ∨ \xi_t ≠ n\} = q</tex> и | ||
+ | |||
+ | <tex>\quad P\{\eta = 0|\xi_t = 0 ∨ \xi_t = n\} = 1. </tex> <tex>(2.1)</tex> | ||
+ | |||
+ | Вероятность выигрыша для первого игрока в момент времени <tex>t</tex> есть <tex>p_{kn}(t) = P\{\eta_t = n|\eta_0 = k\}</tex> | ||
+ | |||
+ | По формуле полной вероятности: | ||
+ | |||
+ | *<tex> \quad P\{\xi_{t+1} = n\} = P\{\xi_1 = k + 1|\xi_0 = k\}P\{\xi_{t+1} = n|\xi_{1} = k + 1\} | ||
+ | + P\{\xi_{1} = k − 1|\xi_0 = k\}P\{\xi_{t+1} = n|\xi_{1} = k - 1\} </tex> | ||
+ | |||
+ | или | ||
+ | |||
+ | *<tex> \quad p_{kn}(t + 1) = p \cdot p_{k+1,n}(t) + q \cdot p_{k−1,n}(t), \quad k = 1, 2, . . . , n − 1.</tex> | ||
+ | |||
+ | Теорему о предельных вероятностях применить не можем, но заметим, что: | ||
+ | |||
+ | <tex> \quad \quad \{\xi_1 = n\} ⊂ \{\xi_2 = n\} ⊂ · · · ⊂ \{\xi_t = n\} ⊂ . . . </tex> | ||
+ | |||
+ | Положим <tex>A =\cup_{t=1}^∞\{\xi_t = n\}</tex>. Тогда | ||
+ | |||
+ | <tex> \quad \quad p_{kn} = P(A) = \lim_{t\to\infty}P\{\xi_t = n|\xi_0 = k\} = \lim_{t\to\infty}p_{kn}(t).</tex> | ||
+ | |||
+ | Переходя к пределу в <tex>(2.1)</tex> при <tex>t → ∞</tex>, получим | ||
+ | |||
+ | <tex>\quad \quad p_{kn} = p \cdot p_{k+1,n} + q \cdot p_{k−1,n}</tex> | ||
+ | |||
+ | Так как <tex>p_{kn}</tex> вероятность выигрыша для первого игрока, то <tex>p_{0n} = 0, p_{nn} = 1</tex>. Рассматриваемая как функция от <tex>k</tex>, вероятность <tex>p_{kn}</tex> является решением уравнения в конечных разностях | ||
+ | |||
+ | *<tex> \quad \quad p \cdot f_{k+1} − f_{k} + q \cdot f_{k−1} = 0 </tex> <tex>(2.2)</tex> | ||
+ | |||
+ | удовлетворяющим граничным условиям <tex>f_0 = 0 \quad f_n = 1</tex>. Теория решения таких уравнений аналогична | ||
+ | теории линейных уравнений с постоянными коэффициентами. | ||
+ | |||
+ | Пусть сначала <tex>p ≠ q</tex>. Решение будем искать в виде <tex>f_k = \lambda^k</tex>, где <tex>\lambda</tex> является корнем характеристического уравнения <tex>p\lambda^2 − \lambda + q = 0</tex>. Корнями такого уравнения являются <tex>\lambda_1 = 1, \lambda_2 = \frac{q}{p}</tex>. | ||
+ | |||
+ | Значит, функции <tex>\lambda_1^k</tex> и <tex>\lambda_2^k</tex> удовлетворяют уравнению <tex>(2.2)</tex>. Линейная комбинация | ||
+ | *<tex>\quad f_k = C_1λ^k_1 + C_2λ^k_2</tex> | ||
− | + | при любых <tex>C_1</tex> и <tex>C_2</tex> также является решением. Подставляя граничные условия в <tex> f_k = C_1λ^k_1 + C_2λ^k_2</tex>, при <tex>k = 0</tex> и <tex>k = n</tex> получим | |
− | + | <tex>\quad C_1 + C_2 = 0, \quad C_1 + (\frac{q}{p})^nC_2 = 1.</tex> | |
− | + | Отсюда и из <tex>f_k = C_1λ^k_1 + C_2λ^k_2</tex> находим | |
− | |||
− | + | *<tex>\quad p_{kn} = \frac{(1 − q/p)^k}{(1 − (q/p)^n)}.</tex> | |
− | |||
− | |||
− | + | Вероятности выигрыша первым игроком <tex>p_{k0}</tex> тоже удовлетворяют уравнению <tex>(2.2)</tex>. Но граничными | |
− | + | условиями станут <tex>f_0 = 1, f_n = 0.</tex> Определяя из этих условий <tex>C_1</tex> и <tex>C_2</tex>, получим | |
− | |||
− | |||
− | |||
− | |||
− | + | <tex>\quad p_{k0} = \frac{((q/p)^k − (q/p)^n)}{(1 − (q/p)^n)}.</tex> | |
− | |||
− | |||
− | + | Так как <tex>p_{k0} + p_{kn} = 1</tex>, то с вероятностью <tex>1</tex> один из игроков выиграет. | |
− | {{ | ||
− | |||
− | |||
− | |||
− | + | Пусть теперь <tex>p = q = 0.5</tex>. В этом случае <tex>\lambda_1 = \lambda_2 = 1</tex> и решение уравнения <tex>(2.2)</tex> нужно искать в виде <tex>f_k = C_1 + kC_2 .</tex> | |
− | + | С помощью граничных условий находим | |
− | <tex | + | <tex>\quad p_{kn} = \frac{k}{n}, \quad p_{k0} = 1 − \frac{k}{n}.</tex> |
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | + | В схеме блуждания по целым точкам с поглощением только в нуле вероятность события | |
− | |||
− | <tex | + | <tex>\quad A_n = \{\exists t : \quad \xi_t = 0 </tex>, <tex>\quad \forall t: \quad \xi_t ∈ [0, n)\}</tex> равна |
− | + | <tex> \quad p_{k0} = \begin{cases} \frac{((q/p)^k − (q/p)^n)}{(1 − (q/p)^n)}, &\text{если p≠q}\\1 − k/n, &\text{если p=0.5} | |
+ | \end{cases}</tex> | ||
− | + | События <tex>A_n</tex> вложены последовательно друг в друга | |
+ | *<tex>\quad A_1 ⊂ A_2 ⊂ · · · ⊂ A_n ⊂ . . . ,</tex> | ||
− | + | поэтому вероятность поглощения в нуле равна | |
− | |||
− | == | + | *<tex>p_k = \lim_{n\to\infty}P(A) = \lim_{n\to\infty}p_{k0}=\begin{cases} (\frac{q}{p})^k, &\text{если q меньше p}\\1, &\text{если q≥p} |
− | + | \end{cases}</tex> | |
− | |||
== Источники информации == | == Источники информации == | ||
− | + | '''Все источники нужно сделать кликабельными''' | |
* [https://en.wikipedia.org/wiki/Random_walk "Википедия - Random_walk"] | * [https://en.wikipedia.org/wiki/Random_walk "Википедия - Random_walk"] | ||
* [https://www.youtube.com/watch?v=6wUD_gp5WeE "Лекция MIT Random Walks"] | * [https://www.youtube.com/watch?v=6wUD_gp5WeE "Лекция MIT Random Walks"] | ||
+ | * [http://math.csu.ru/new_files/students/lectures/teor_slych_proc/solovev_teor_slych_proc.pdf Конспект лекций по теории случайных процессов А.А. Соловьев] | ||
+ | * [https://cmp.phys.msu.ru/sites/default/files/02_RandomWalks.pdf Случайные блуждания по прямой] | ||
+ | *[https://ru.wikipedia.org/wiki/%D0%97%D0%B0%D0%B4%D0%B0%D1%87%D0%B0_%D0%BE_%D1%80%D0%B0%D0%B7%D0%BE%D1%80%D0%B5%D0%BD%D0%B8%D0%B8_%D0%B8%D0%B3%D1%80%D0%BE%D0%BA%D0%B0 "Задача о разорении игрока"] | ||
[[Категория:Дискретная математика и алгоритмы]] | [[Категория:Дискретная математика и алгоритмы]] | ||
− | [[Категория: Теория | + | [[Категория: Теория ]] |
Текущая версия на 16:19, 2 сентября 2020
Содержание
Определение
Определение: |
Случайное блуждание (англ. Random walk) — математическая модель процесса случайных изменений — шагов в дискретные моменты времени, предполагается, что изменение на каждом шаге не зависит от предыдущих и от времени. В силу простоты анализа эта модель часто используется в разных сферах в математике, экономике, физике, но, как правило, такая модель является существенным упрощением реального процесса. |
Случайные блуждания по прямой
Представим частицу, которая движется по целым точкам на прямой. Перемещение из одной точки в другую происходит через равные промежутки времени. За один шаг частица из точки k с положительной вероятностью p перемещается в точку цепь Маркова:
и с положительной вероятностью перемещается в точку . Физической системе соответствуетЗаметим, что вернуться в какую-либо точку можно только за четное число шагов.
Вероятность смещения на d единиц вправо (влево)
Будем считать, что
. Это соответствует тому, что в начальный момент времени частица находилась в точке (здесь — фиксированное число) и затем начала случайно блуждать в соответствии с описанными выше правилами. Пусть — смещение частицы за шагов. Найдём для каждого .Справедливо равенство:
- , если
Представление через условную вероятность удобно, если нам необходимо явно указать, где находилась частица в начальный момент времени.
Наша физическая модель с математической точки зрения в точности отвечает схеме независимых испытаний Бернулли с двумя исходами —- движением вправо, который мы будем называть успехом, и движением вправо (неудачей). Пусть частица сделала прыжков. Вероятность того, что среди этих прыжков будет ровно прыжков вправо (или, что то же самое, прыжков влево) задаётся формулой:
Смещение частицы и число прыжков влево и вправо связаны уравнением
откуда
. Понятно, что, поскольку частица сделала ровно прыжков, число прыжков вправо должно быть целым числом в интервале , другими словами, если . Если же указанное ограничение выполнено, то в рамках нашей модели блужданий мы можем воспользоваться распределением Бернулли :- , при обязательном условии
Замечания.
Ограничение по формуле влечёт . Это можно понять и без расчётов: если , то частица не успевает дойти из начальной в конечную точку за шагов.
При своём движении частица случайным образом выбирает одну из возможных траекторий. Для перехода из точки в точку за шагов возможными являются все те и только те траектории длины , в которых ровно смещений вправо и смещений влево, где . Равенство при этом можно интерпретировать так: вероятность того, что частица пройдет по одной из возможных траекторий, равна , и всего существуют таких траекторий, таким образом,
Случайные блуждания по прямой
Представим частицу, которая движется по целым точкам на прямой. Перемещение из одной точки в другую происходит через равные промежутки времени. За один шаг частица из точки k с положительной вероятностью p перемещается в точку цепь Маркова:
и с положительной вероятностью перемещается в точку . Физической системе соответствуетЗаметим, что вернуться в какую-либо точку можно только за четное число шагов.
Задача о разорении игрока
Пусть начальный капитал
первого игрока составляет рублей, а капитал второго игрока рублей. Первый игрок выигрывает или проигрывает рубль с вероятностями и соответственно. Игра продолжается до тех пор, пока капитал первого игрока не уменьшится до нуля, либо не возрастет до . Поглощение точки в правом конце отрезка соответствует выигрышу первого игрока.Рассмотрим конечную цепь Маркова:
и
Вероятность выигрыша для первого игрока в момент времени
естьПо формуле полной вероятности:
или
Теорему о предельных вероятностях применить не можем, но заметим, что:
Положим
. Тогда
Переходя к пределу в
при , получим
Так как
вероятность выигрыша для первого игрока, то . Рассматриваемая как функция от , вероятность является решением уравнения в конечных разностяхудовлетворяющим граничным условиям
. Теория решения таких уравнений аналогична теории линейных уравнений с постоянными коэффициентами.Пусть сначала
. Решение будем искать в виде , где является корнем характеристического уравнения . Корнями такого уравнения являются .Значит, функции
и удовлетворяют уравнению . Линейная комбинацияпри любых
и также является решением. Подставляя граничные условия в , при и получим
Отсюда и из
находимВероятности выигрыша первым игроком
тоже удовлетворяют уравнению . Но граничными условиями станут Определяя из этих условий и , получим
Так как
, то с вероятностью один из игроков выиграет.Пусть теперь
. В этом случае и решение уравнения нужно искать в видеС помощью граничных условий находим
В схеме блуждания по целым точкам с поглощением только в нуле вероятность события
, равна
События
вложены последовательно друг в другапоэтому вероятность поглощения в нуле равна
Источники информации
Все источники нужно сделать кликабельными