Симуляция одним распределением другого — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Симуляция распределений)
(Симуляция распределений)
Строка 8: Строка 8:
 
* Равномерное распределение
 
* Равномерное распределение
  
 +
<wikitex>
 
==Симуляция распределений==
 
==Симуляция распределений==
Рассмотрим следующий случай. Допустим, у нас есть честная монета. А нам надо получить распределения с вероятностями <tex>1/3</tex>. Проведем следующий эксперимент: подкинем монету дважды, и, если выпадет два раза орел, эксперимент не удался, повторим его.
+
Для того, чтобы создать необходимое распределение вероятностей, достаточно иметь последовательность независимых случайных величин типа "честной монеты".
Предположим, что у нас есть последовательность таких экспериментов. Вероятность успеха  <tex dpi = "140">p = \frac{3}{4}</tex>. Вероятность неудачи <tex dpi = "140">q = 1 - p = \frac{1}{4}</tex> Сколько экспериментов будет проведено до того, как будет достигнут успех? Пусть случайная величина <tex>X</tex> равна количеству экспериментов, необходимых для достижения успеха. Тогда <tex>X</tex> принимает значения <tex>\{1,2,...\}</tex> и для <tex> k \ge 1 </tex>
+
Например, для создания схемы с двумя исходами $A_1$ и $A_2$:
: <tex dpi = "140">{p}(X = k) = q^{k-1}p</tex>,
+
<center>$P(A_1)=\frac{3}{4}$ $,$  $P(A_2)=\frac{1}{4}$</center>
поскольку перед наступлением успешного эксперимента было проведено <tex> k - 1 </tex> неуспешных. Распределение вероятности, удовлетворяющее этому уравнению, называется геометрическим распределением.
+
можно из датчика случайных двоичных разрядов получить два двоичных разряда $\delta_1$ и $\delta_2$  и, например, при $\delta_1 = \delta_2 = 1$  выработать исход $A_2$, а в остальных случаях $A_1$.
Так как <tex> q < 1 </tex>, можно посчитать математическое ожидание геометрического распределения:
+
Аналогично для схемы с четырьмя исходами
: <tex dpi = "140">E(X) = \sum\limits_{k = 0}^{\infty}kq^{k-1}p = \frac{p}{q}\sum\limits_{k = 0}^{\infty}kq^{k} = \frac{p}{q} \frac{q}{(1 - q)^{2}} = \frac{1}{p} =\frac{1}{\frac{3}{4}} = \frac{4}{3}. </tex>
+
<center>$P(A_1)=\frac{3}{16}$ $,$ $P(A_2)=\frac{1}{16}$ $,$ $P(A_3)=\frac{8}{16}$ $,$ $P(A_4)=\frac{4}{16}$</center>
Дисперсия вычисляется аналогично:
+
можно получить четыре двоичных разряда $\delta_1$ $,$ $\delta_2$ $,$ $\delta_3$ $,$ $\delta_4$ и любым способом сопоставить трём из 16 возможных наборов исход $A_1$, одному $-$ $A_2$, восьми $-$ $A_3$, четырём $-$ $A_4$.
: <tex dpi = "140">D(X) = \frac{q}{p^{2}} = \frac{4}{9} </tex>
+
Если же вероятности исходов не кратны $2^{-k}$, можно применить два различных варианта действий.
Обобщим.
+
:#Можно приблизить вероятности двоичными дробями (с любой точностью), далее работать с полученными приближёнными значениями
Допустим, у нас есть распределение <tex>p</tex>. Нам нужно получить распределение <tex>q</tex>:
+
:#Пусть все вероятности $n_i$ $-$ дроби со знаменателем $r$. Найдём $k$, для которого $r < 2^k$. Предложим схему с $k$ двоичными разрядами, в которой $r$ наборов объявляются "неудачными" и требуют повторного эксперимента (пока не встретится удачный). Чем выше доля полезных исходов равная  $r2^{-k}$, тем схема будет эффективнее.
* Для начала, рассмотрим случай, когда все <tex>p_i = \frac{1}{k}</tex>, а в распределениии <tex>q </tex>  количество элементарных исходов равно <tex>2</tex>. Проводим эксперимент, если попадаем в область, пересекающуюся с <tex>q_1</tex> и <tex>q_2</tex>, то увеличиваем её и повторяем эксперимент. На рисунке ниже красным обозначенно распределение <tex>q</tex>. Вероятность того, что на этом шаге эксперимент не закончится {{---}} <tex>\frac{1}{k}</tex>. Математическое ожидание количества экспериментов {{---}} <tex> \frac{k}{k-1}, max(\frac{k}{k-1}) = 2 (</tex>при <tex>k = 2) </tex>
+
Количество случайных двоичных разрядов $\lambda$, которые необходимы для формирования случайного исхода, $-$  это случайная величина. Её математическое ожидание:
[[Файл:Sim pic1.JPG‎|400px]]
+
<center>$E\lambda = \frac{1}{2}\cdot1+\frac{1}{4}\cdot2+\frac{1}{8}\cdot3+\frac{1}{16}\cdot3+\frac{1}{16}\cdot4 = 1\frac{7}{8}$</center>
* Теперь рассмотрим случай, когда все элементарные исходы <tex>p_i</tex> по прежнему равновероятны <tex>(p_i = \frac{1}{k})</tex>, а количество элементарных исходов распределения <tex>q</tex> равно <tex>n (\sum\limits_{j=1}^{n}q_j = 1)</tex>. Повторим эксперимент <tex>t</tex> раз. <tex> k^t \ge 2n, t \ge \log\limits_{k}2n </tex>. Отрезок разбился на <tex> k^t </tex> отрезков. Стык будет не более, чем в половине отрезков. Математическое ожидание количества экспериментов <tex> \approx 2t </tex>
+
Можно сделать схему более экономной, используя свойство датчиков случайных чисел формировать не отдельные двоичные разряды, а целые наборы их, например в виде числа, равномерно распределённого в $[0, 1]$. Образуем по данному набору вероятностей $p_i$ накопленные суммы $s_i$: $s_0 = 0; s_i = s_{i-1} + p_i, i > 0$. Случайный исход будет вырабатываться так: по полученному из датчика случайному числу $\gamma$ определяется такой индекс $i$, для которого $s_{i-1} < \gamma \le s_i$. Найденное значение индекса $i$ и определяет исход $A_i$.
[[Файл:Sim pic2.JPG‎|400px]]
+
 
* <tex>p_i, \sum\limits_{i}p_i = 1, q_j, \sum\limits_{j}q_j = 1. </tex> Берем <tex> p_i </tex>, и пусть оно максимальной длины. Проводим <tex> t </tex> экспериментов. <tex>{p_i}^t < \frac{1}{2n}</tex>, все остальные еще меньше. Суммарная длина отрезков не больше <tex>\frac{1}{2}</tex>. Нужно <tex> t \ge \log\limits_{p}\frac{1}{2n} </tex>
+
Индекс $i$ можно определять непосредственно просмотром $s_i$ подряд. Если $k$ велико, можно применять специальные приёмы ускоренного поиска, например, деление множества индексов примерно пополам.
[[Файл:Sim pic3.JPG‎|400px]]
+
 
Вывод: из любого исходного распределения можно получить любое нужное нам распределение.
+
Самую эффективную схему предложил в 1977 г. А. Уолкер.
 +
</wikitex>
  
 
==См. также==  
 
==См. также==  

Версия 06:48, 18 декабря 2011

Распределение

Геометрическое распределение с p = 3/4

Распределение — одно из основных понятий теории вероятностей и математической статистике. Распределение вероятностей какой-либо случайной величины задается в простейшем случае указанием возможных значений этой величины и соответствующих им вероятностей, в более сложных — т. н. функцией распределения или плотностью вероятности.

Примеры распределений

  • Биномиальное распределение
  • Нормальное распределение
  • Равномерное распределение

<wikitex>

Симуляция распределений

Для того, чтобы создать необходимое распределение вероятностей, достаточно иметь последовательность независимых случайных величин типа "честной монеты". Например, для создания схемы с двумя исходами $A_1$ и $A_2$:

$P(A_1)=\frac{3}{4}$ $,$ $P(A_2)=\frac{1}{4}$

можно из датчика случайных двоичных разрядов получить два двоичных разряда $\delta_1$ и $\delta_2$ и, например, при $\delta_1 = \delta_2 = 1$ выработать исход $A_2$, а в остальных случаях $A_1$. Аналогично для схемы с четырьмя исходами

$P(A_1)=\frac{3}{16}$ $,$ $P(A_2)=\frac{1}{16}$ $,$ $P(A_3)=\frac{8}{16}$ $,$ $P(A_4)=\frac{4}{16}$

можно получить четыре двоичных разряда $\delta_1$ $,$ $\delta_2$ $,$ $\delta_3$ $,$ $\delta_4$ и любым способом сопоставить трём из 16 возможных наборов исход $A_1$, одному $-$ $A_2$, восьми $-$ $A_3$, четырём $-$ $A_4$. Если же вероятности исходов не кратны $2^{-k}$, можно применить два различных варианта действий.

  1. Можно приблизить вероятности двоичными дробями (с любой точностью), далее работать с полученными приближёнными значениями
  2. Пусть все вероятности $n_i$ $-$ дроби со знаменателем $r$. Найдём $k$, для которого $r < 2^k$. Предложим схему с $k$ двоичными разрядами, в которой $r$ наборов объявляются "неудачными" и требуют повторного эксперимента (пока не встретится удачный). Чем выше доля полезных исходов равная $r2^{-k}$, тем схема будет эффективнее.

Количество случайных двоичных разрядов $\lambda$, которые необходимы для формирования случайного исхода, $-$ это случайная величина. Её математическое ожидание:

$E\lambda = \frac{1}{2}\cdot1+\frac{1}{4}\cdot2+\frac{1}{8}\cdot3+\frac{1}{16}\cdot3+\frac{1}{16}\cdot4 = 1\frac{7}{8}$

Можно сделать схему более экономной, используя свойство датчиков случайных чисел формировать не отдельные двоичные разряды, а целые наборы их, например в виде числа, равномерно распределённого в $[0, 1]$. Образуем по данному набору вероятностей $p_i$ накопленные суммы $s_i$: $s_0 = 0; s_i = s_{i-1} + p_i, i > 0$. Случайный исход будет вырабатываться так: по полученному из датчика случайному числу $\gamma$ определяется такой индекс $i$, для которого $s_{i-1} < \gamma \le s_i$. Найденное значение индекса $i$ и определяет исход $A_i$.

Индекс $i$ можно определять непосредственно просмотром $s_i$ подряд. Если $k$ велико, можно применять специальные приёмы ускоренного поиска, например, деление множества индексов примерно пополам.

Самую эффективную схему предложил в 1977 г. А. Уолкер. </wikitex>

См. также

Литература