Методы генерации случайного сочетания — различия между версиями

Версия 20:48, 16 декабря 2014

Задача:

Необходимо сгенерировать случайное сочетание из элементов по с равномерным распределением вероятности, если есть в наличии функция для генерации случайного числа в заданном интервале.

Содержание

1 Наивное решение
- 1.1 Псевдокод
2 Решение за время [math]O(nk)[/math]
- 2.1 Псевдокод
- 2.2 Доказательство корректности алгоритма
3 Решение за время [math]O(n)[/math]
4 См. также
5 Источники информации

Наивное решение

Пусть [math]S[/math] — множество из [math]n[/math] элементов, тогда для генерации случайного сочетания сделаем следующее:

Шаг 1. Запишем в массив [math]C[/math] числа от [math]1[/math] до [math]k[/math],
Шаг 2. Выберем случайный номер сочетания [math]r[/math],
Шаг 3. Применим алгоритм получение следующего сочетания [math]r - 1[/math] раз к массиву [math]C[/math],
Шаг 4. В [math]C[/math] хранятся номера позиции из [math]S[/math] входящих в случайное сочетание, запишем в [math]C[/math] эти элементы.

Псевдокод

[math]\mathtt{arrayOfElements}[/math] — массив, в котором находятся все элементы множества [math]\mathtt{S}[/math].


 int[] randomCombination(int[] arrayOfElements, int n, int k):
   for i = 1 to k 
     C[i] = i
   r = random(1, n! / (k!(n - k)!))      //random(1, i) генерирует случайное целое число в интервале [1..i]
   for i = 1 to r - 1
     nextCombination(C, n, k)            //nextCombination(C, n, k) генерирует следующие сочетание
   for i = 1 to k
     C[i] = arrayOfElements[C[i]]
   return C

Сложность алгоритма — .

Решение за время [math]O(nk)[/math]

Пусть [math]S[/math] — множество из [math]n[/math] элементов, тогда для генерации случайного сочетания сделаем следующее:

Шаг 1. Выберем в множестве случайный элемент,
Шаг 2. Добавим его в сочетание,
Шаг 3. Удалим элемент из множества.

Эту процедуру необходимо повторить [math]k[/math] раз.

Псевдокод

[math]\mathtt{arrayOfElements}[/math] — массив, в котором находятся все элементы множества [math]\mathtt{S}[/math],
[math]\mathtt{exist}[/math] — такой массив, что если [math]\mathtt{exist[i] == 1}[/math], то [math]\mathtt{i}[/math] элемент присутствует в множестве [math]\mathtt{S}[/math],


int[] randomCombination(int[] arrayOfElements, int n, int k):
  for i = 1 to k 
    r = random(1, (n - i + 1))                
    cur = 0
    for j = 1 to n 
      if exist[j]
        cur = cur + 1
        if cur == r
          res[i] = arrayOfElements[j]
          exist[j] = false
  sort(res)
  return res

Доказательство корректности алгоритма

На первом шаге мы выбираем один элемент из [math]n[/math], на втором из [math]n - 1[/math] [math]\dots[/math] на [math]k[/math]-ом из [math]n - k + 1[/math]. Тогда общее число исходов получится . Это эквивалентно [math]{n! \over (n - k)!}[/math]. Однако заметим, что на этом шаге у нас получаются лишь размещения из [math]n[/math] по [math]k[/math]. Но все эти размещения можно сопоставить одному сочетанию, отсортировав их. И так как размещения равновероятны, и каждому сочетанию сопоставлено ровно [math]k![/math] размещений, то сочетания тоже генерируются равновероятно.

Решение за время [math]O(n)[/math]

Для более быстрого решения данной задачи воспользуемся следующим алгоритмом: пусть задан для определенности массив [math]a[/math] размера [math]n[/math], состоящий из [math]k[/math] единиц и [math]n - k[/math] нулей. Применим к нему алгоритм генерации случайной перестановки. Тогда все элементы [math]i[/math], для которых [math]a[i] = 1[/math], включим в сочетание.

Псевдокод

[math]\mathtt{arrayOfElements}[/math] — массив, в котором находятся все элементы множества [math]\mathtt{S}[/math],
[math]\mathtt{randomShuffle()}[/math] — функция генерации случайной перестановки.


 int[] randomCombination(int[] arrayOfElements, int n, int k):
   for i = 1 to n 
     if i <= k
       a[i] = 1
     else
       a[i] = 0
   randomShuffle(a)                        //randomShuffle() — функция генерации случайной перестановки
   for i = 1 to n
     if a[i] == 1
       ans.push(arrayOfElement[i])
   return ans

Доказательство корректности алгоритма

Заметим, что всего перестановок [math]n![/math], но так как наш массив состоит только из [math]0[/math] и [math]1[/math], то перестановка только [math]0[/math] или только [math]1[/math] ничего в нем не меняет. Заметим, что число перестановок нулей равно [math](n - k)![/math], единиц — [math]k![/math]. Следовательно, всего уникальных перестановок — [math]{n! \over k!(n - k)!}[/math]. Все они равновероятны, так как была сгенерирована случайная перестановка, а каждой уникальной перестановке сопоставлено ровно [math]k!(n - k)![/math] перестановок. Но [math]{n! \over k!(n - k)!}[/math] — число сочетаний из [math]n[/math] по [math]k[/math]. То есть каждому сочетанию сопоставляется одна уникальная перестановка. Следовательно, генерация сочетания происходит также равновероятно.

Оценка временной сложности

Алгоритм состоит из двух невложенных циклов по [math]n[/math] итераций каждый и функции генерации случайной перестановки [math]\mathrm{randomShuffle()}[/math], работающей за [math]O(n)[/math] по алгоритму Фишера—Йетcа. Следовательно, сложность и всего алгоритма [math]O(n)[/math]

См. также

Источники информации

Герасимов В. А. — Генерация случайных сочетаний. Генерация сочетания по его порядковому номеру

@@ Строка 6: / Строка 6: @@
 ==Наивное решение==
-Пусть <tex>S</tex>  —  массив из <tex>n</tex> элементов, тогда для генерации случайного сочетания сделаем следующее:
+Пусть <tex>S</tex>  —  множество из <tex>n</tex> элементов, тогда для генерации случайного сочетания сделаем следующее:
-* отсортируем <tex>S</tex>,
+* '''Шаг 1.''' Запишем в массив <tex>C</tex> числа от <tex>1</tex> до <tex>k</tex>,
-* запишем в массив <tex>C</tex> первые <tex>k</tex> элементов <tex>S</tex>,
+* '''Шаг 2.''' Выберем случайный номер сочетания <tex>r</tex>,
-* выберем случайные номер сочетания <tex>r</tex>,
+* '''Шаг 3.''' Применим алгоритм [[Получение следующего объекта|получение следующего сочетания]] <tex>r - 1</tex> раз к массиву <tex>C</tex>,
-* применим алгоритм генерации следующего сочетания <tex>r - 1</tex> раз к массиву <tex>C</tex>.
+* '''Шаг 4.''' В <tex>C</tex> хранятся номера позиции из <tex>S</tex> входящих в случайное сочетание, запишем в <tex>C</tex> эти элементы.
-<br/>
-*<tex>\mathrm{random(1..i)}</tex> генерирует случайное число в интервале <tex> [1;\; i] </tex> <br/>
 ===Псевдокод===
+*<tex>\mathtt{arrayOfElements}</tex> — массив, в котором находятся все элементы множества <tex>\mathtt{S}</tex>.
 <code>
-   '''int[]''' randomCombination('''int[]''' S, '''int''' n, '''int''' k)
+   '''int[]''' randomCombination('''int[]''' arrayOfElements, '''int''' n, '''int''' k):
-    sort(S);
      '''for''' i = 1 '''to''' k
-       C[i] = S[i]
+       C[i] = i
-     r = random(1, n! / (k!(n - k)!))
+     r = random(1, n! / (k!(n - k)!))     <font color=darkgreen> //random(1, i) генерирует случайное целое число в интервале [1..i]</font color=darkgreen>
      '''for''' i = 1 '''to''' r - 1
-       next_Combination(C, n, k)
+       nextCombination(C, n, k)           <font color=darkgreen> //nextCombination(C, n, k) генерирует следующие сочетание</font color=darkgreen>
-     '''return''' res
+    '''for''' i = 1 '''to''' k
+      C[i] = arrayOfElements[C[i]]
+     '''return''' C
 </code>
-==Решение за время <tex>O(n ^ 2)</tex>==
+Сложность алгоритма — <tex dpi="150">O({n! \over k!(n - k)!} \cdot n)</tex>.
+==Решение за время <tex>O(nk)</tex>==
 Пусть <tex>S</tex>  —  множество из <tex>n</tex> элементов, тогда для генерации случайного сочетания сделаем следующее:
-* выберем в множестве случайный элемент,
+* '''Шаг 1.''' Выберем в множестве случайный элемент,
-* добавим его в сочетание,
+* '''Шаг 2.''' Добавим его в сочетание,
-* удалим элемент из множества.
+* '''Шаг 3.''' Удалим элемент из множества.
 Эту процедуру необходимо повторить <tex>k</tex> раз.
 ===Псевдокод===
-  randomCombination(arrayOfElements, n, k)
+*<tex>\mathtt{arrayOfElements}</tex> — массив, в котором находятся все элементы множества <tex>\mathtt{S}</tex>,
+*<tex>\mathtt{exist}</tex> — такой массив, что если <tex>\mathtt{exist[i] == 1}</tex>, то <tex>\mathtt{i}</tex> элемент присутствует в множестве <tex>\mathtt{S}</tex>,
+<code>
+  '''int[]''' randomCombination('''int[]''' arrayOfElements, '''int''' n, '''int''' k):
     '''for''' i = 1 '''to''' k
-      r = rand(1..(n - i + 1))
+      r = random(1, (n - i + 1))
       cur = 0
       '''for''' j = 1 '''to''' n
         '''if''' exist[j]
-          cur++;
+          cur = cur + 1
           '''if''' cur == r
             res[i] = arrayOfElements[j]
@@ Строка 50: / Строка 51: @@
     sort(res)
     '''return''' res
+</code>
-Здесь <tex>exist</tex> — такой массив, что если <tex>exist[i] == 1</tex>, то <tex>i</tex> элемент присутствует в множестве <tex>S</tex>.
-Сложность алгоритма  —  <tex>O(n^2)</tex>
 ===Доказательство корректности алгоритма===
-На первом шаге мы выбираем один элемент из <tex>n</tex>, на втором из <tex>n - 1</tex>, ..., на <tex>k</tex>-ом из <tex>n - k + 1</tex>. Тогда общее число исходов получится <tex>n \cdot (n - 1) \cdot ... \cdot (n - k + 1)</tex>. Это эквивалентно <tex dpi="180">{n! \over (n - k)!}</tex>. Однако заметим, что на этом шаге у нас получаются лишь размещения из <tex>n</tex> по <tex>k</tex>. Но все эти размещения можно сопоставить одному сочетанию, отсортировав их. И так как размещения равновероятны, и каждому сочетанию сопоставлено ровно <tex>k!</tex> размещений, то сочетания тоже генерируются равновероятно.
+На первом шаге мы выбираем один элемент из <tex>n</tex>, на втором из <tex>n - 1</tex> <tex>\dots</tex>  на <tex>k</tex>-ом из <tex>n - k + 1</tex>. Тогда общее число исходов получится <tex>n \times (n - 1) \times \dots \times (n - k + 1)</tex>. Это эквивалентно <tex dpi="180">{n! \over (n - k)!}</tex>. Однако заметим, что на этом шаге у нас получаются лишь размещения из <tex>n</tex> по <tex>k</tex>. Но все эти размещения можно сопоставить одному сочетанию, отсортировав их. И так как размещения равновероятны, и каждому сочетанию сопоставлено ровно <tex>k!</tex> размещений, то сочетания тоже генерируются равновероятно.
 ==Решение за время <tex>O(n)</tex>==
 Для более быстрого решения данной задачи воспользуемся следующим алгоритмом: пусть задан для определенности массив <tex>a</tex> размера <tex>n</tex>, состоящий из <tex>k</tex> единиц и <tex>n - k</tex> нулей. Применим к нему [[Метод генерации случайной перестановки, алгоритм Фишера-Йетса|алгоритм генерации случайной перестановки]]. Тогда все элементы <tex>i</tex>, для которых <tex>a[i] = 1</tex>, включим в сочетание.
 ===Псевдокод===
+*<tex>\mathtt{arrayOfElements}</tex> — массив, в котором находятся все элементы множества <tex>\mathtt{S}</tex>,
+*<tex>\mathtt{randomShuffle()}</tex> — функция генерации случайной перестановки.
 <code>
-   randomCombination(arrayOfElements, n, k)
+   '''int[]''' randomCombination('''int[]''' arrayOfElements, '''int''' n, '''int''' k):
      '''for''' i = 1 '''to''' n
        '''if''' i <= k
@@ Строка 71: / Строка 69: @@
        '''else'''
          a[i] = 0
-     random_shuffle(a)
+     randomShuffle(a)                       <font color=darkgreen> //randomShuffle() — функция генерации случайной перестановки</font color=darkgreen>
      '''for''' i = 1 '''to''' n
        '''if''' a[i] == 1
@@ Строка 83: / Строка 81: @@
 ===Оценка временной сложности===
-Алгоритм состоит из 2 невложенных циклов по <tex>n</tex> итераций каждый и функции генерации случайной перестановки <tex>\mathrm{random_shuffle()}</tex>, работающей за <tex>O(n)</tex> по алгоритму [[Метод генерации случайной перестановки, алгоритм Фишера-Йетса|Фишера—Йетcа]]. Следовательно, сложность и всего алгоритма <tex>O(n)</tex>
+Алгоритм состоит из двух невложенных циклов по <tex>n</tex> итераций каждый и функции генерации случайной перестановки <tex>\mathrm{randomShuffle()}</tex>, работающей за <tex>O(n)</tex> по алгоритму [[Метод генерации случайной перестановки, алгоритм Фишера-Йетса|Фишера—Йетcа]]. Следовательно, сложность и всего алгоритма <tex>O(n)</tex>
 == См. также ==

Методы генерации случайного сочетания — различия между версиями

Версия 20:48, 16 декабря 2014

Содержание

Наивное решение

Псевдокод

Решение за время [math]O(nk)[/math]

Псевдокод

Доказательство корректности алгоритма

Решение за время [math]O(n)[/math]

Псевдокод

Доказательство корректности алгоритма

Оценка временной сложности

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты