Методы генерации случайного сочетания — различия между версиями
Loboda (обсуждение | вклад)  (→Псевдокод)  | 
				м (rollbackEdits.php mass rollback)  | 
				||
| (не показаны 92 промежуточные версии 6 участников) | |||
| Строка 1: | Строка 1: | ||
| − | + | {{Задача  | |
| − | Необходимо сгенерировать случайное сочетание из <tex> n </tex> элементов по <tex>k</tex> с равномерным распределением вероятности, если есть в наличии функция для генерации случайного числа в заданном интервале.    | + | |definition =    | 
| + | Необходимо сгенерировать случайное сочетание из <tex> n </tex> элементов по <tex> k </tex> с равномерным распределением вероятности, если есть в наличии функция для генерации случайного числа в заданном интервале.  | ||
| + | }}  | ||
| − | ==  | + | ==Наивное решение==  | 
| − | Пусть S   | + | Пусть <tex>S</tex>  —  множество из <tex>n</tex> элементов, тогда для генерации случайного сочетания сделаем следующее:  | 
| − | * Выберем   | + | * '''Шаг 1.''' Запишем в массив <tex>C</tex> числа от <tex>1</tex> до <tex>k</tex>,  | 
| − | *   | + | * '''Шаг 2.''' Выберем случайный номер сочетания <tex>r</tex>,  | 
| − | *   | + | * '''Шаг 3.''' Применим алгоритм [[Получение следующего объекта|получение следующего сочетания]] <tex>r - 1</tex> раз к массиву <tex>C</tex>,  | 
| + | * '''Шаг 4.''' В <tex>C</tex> хранятся номера позиции из <tex>S</tex> входящих в случайное сочетание, запишем в <tex>C</tex> эти элементы.  | ||
| + | ===Псевдокод===  | ||
| + | *<tex>\mathtt{arrayOfElements}</tex> — массив, в котором находятся все элементы множества <tex>\mathtt{S}</tex>.  | ||
| + | <code>  | ||
| + |   '''int[]''' randomCombination('''int[]''' arrayOfElements, '''int''' n, '''int''' k):  | ||
| + |     '''for''' i = 1 '''to''' k   | ||
| + |       C[i] = i  | ||
| + |     r = random(1, n! / (k!(n - k)!))     <font color=darkgreen> //random(1, i) генерирует случайное целое число в интервале [1..i]</font color=darkgreen>  | ||
| + |     '''for''' i = 1 '''to''' r - 1  | ||
| + |       nextCombination(C, n, k)           <font color=darkgreen> //nextCombination(C, n, k) генерирует следующие сочетание</font color=darkgreen>  | ||
| + |     '''for''' i = 1 '''to''' k  | ||
| + |       C[i] = arrayOfElements[C[i]]  | ||
| + |     '''return''' C  | ||
| + | </code>  | ||
| − | + | Сложность алгоритма — <tex dpi="150">O({n! \over k!(n - k)!} \cdot n)</tex>.  | |
| − | ==  | + | ==Решение за время <tex>O(nk)</tex>==  | 
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | + | Пусть <tex>S</tex>  —  множество из <tex>n</tex> элементов, тогда для генерации случайного сочетания сделаем следующее:  | |
| + | * '''Шаг 1.''' Выберем в множестве случайный элемент,  | ||
| + | * '''Шаг 2.''' Добавим его в сочетание,  | ||
| + | * '''Шаг 3.''' Удалим элемент из множества.  | ||
| − | + | Эту процедуру необходимо повторить <tex>k</tex> раз.  | |
| + | ===Псевдокод===  | ||
| + | *<tex>\mathtt{arrayOfElements}</tex> — массив, в котором находятся все элементы множества <tex>\mathtt{S}</tex>,  | ||
| + | *<tex>\mathtt{exist}</tex> — такой массив, что если <tex>\mathtt{exist[i] == 1}</tex>, то <tex>\mathtt{i}</tex> элемент присутствует в множестве <tex>\mathtt{S}</tex>,  | ||
| + | <code>  | ||
| + |  '''int[]''' randomCombination('''int[]''' arrayOfElements, '''int''' n, '''int''' k):  | ||
| + |    '''for''' i = 1 '''to''' k   | ||
| + |      r = random(1, (n - i + 1))                  | ||
| + |      cur = 0  | ||
| + |      '''for''' j = 1 '''to''' n   | ||
| + |        '''if''' exist[j]  | ||
| + |          cur = cur + 1  | ||
| + |          '''if''' cur == r  | ||
| + |            res[i] = arrayOfElements[j]  | ||
| + |            exist[j] = false  | ||
| + |    sort(res)  | ||
| + |    '''return''' res  | ||
| + | </code>  | ||
===Доказательство корректности алгоритма===  | ===Доказательство корректности алгоритма===  | ||
| − | На первом шаге мы выбираем один элемент из <tex>n</tex>, на втором из <tex>n - 1</tex>  | + | На первом шаге мы выбираем один элемент из <tex>n</tex>, на втором из <tex>n - 1</tex> <tex>\dots</tex>  на <tex>k</tex>-ом из <tex>n - k + 1</tex>. Тогда общее число исходов получится <tex>n \times (n - 1) \times \dots \times (n - k + 1)</tex>. Это эквивалентно <tex dpi="180">{n! \over (n - k)!}</tex>. Однако заметим, что на этом шаге у нас получаются лишь размещения из <tex>n</tex> по <tex>k</tex>. Но все эти размещения можно сопоставить одному сочетанию, отсортировав их. И так как размещения равновероятны, и каждому сочетанию сопоставлено ровно <tex>k!</tex> размещений, то сочетания тоже генерируются равновероятно.  | 
| − | ==Решение   | + | ==Решение за время <tex>O(n)</tex>==  | 
| − | |||
| − | |||
| + | Для более быстрого решения данной задачи воспользуемся следующим алгоритмом: пусть задан для определенности массив <tex>a</tex> размера <tex>n</tex>, состоящий из <tex>k</tex> единиц и <tex>n - k</tex> нулей. Применим к нему [[Метод генерации случайной перестановки, алгоритм Фишера-Йетса|алгоритм генерации случайной перестановки]]. Тогда все элементы <tex>i</tex>, для которых <tex>a[i] = 1</tex>, включим в сочетание.  | ||
===Псевдокод===  | ===Псевдокод===  | ||
| − | + | *<tex>\mathtt{arrayOfElements}</tex> — массив, в котором находятся все элементы множества <tex>\mathtt{S}</tex>,  | |
| + | *<tex>\mathtt{randomShuffle()}</tex> — функция генерации случайной перестановки.  | ||
<code>  | <code>  | ||
| − |    randomCombination(arrayOfElements, n, k)  | + |    '''int[]''' randomCombination('''int[]''' arrayOfElements, '''int''' n, '''int''' k):  | 
     '''for''' i = 1 '''to''' n    |      '''for''' i = 1 '''to''' n    | ||
       '''if''' i <= k  |        '''if''' i <= k  | ||
| − |          a[i] = 1  | + |          a[i] = 1  | 
       '''else'''  |        '''else'''  | ||
| − |          a[i] = 0  | + |          a[i] = 0  | 
| − | + |      randomShuffle(a)                       <font color=darkgreen> //randomShuffle() — функция генерации случайной перестановки</font color=darkgreen>  | |
     '''for''' i = 1 '''to''' n  |      '''for''' i = 1 '''to''' n  | ||
       '''if''' a[i] == 1  |        '''if''' a[i] == 1  | ||
| − |          ans.push(arrayOfElement[i])  | + |          ans.push(arrayOfElement[i])  | 
| − |      return ans  | + |      '''return''' ans  | 
</code>  | </code>  | ||
===Доказательство корректности алгоритма===  | ===Доказательство корректности алгоритма===  | ||
| − | Заметим, что всего перестановок <tex>n!</tex>, но так как наш массив состоит только из 0 и 1, то перестановка только 0 или только 1 ничего в нем не меняет. Заметим, что число перестановок нулей равно <tex>(n - k)!</tex>, единиц — <tex>k!</tex>. Следовательно всего уникальных перестановок — <tex dpi = "180">{n! \over k!(n - k)!}</tex>. Все они равновероятны, так как была сгенерирована случайная перестановка, а каждой уникальной перестановке сопоставлено ровно <tex>k!(n - k)!</tex> перестановок. Но <tex dpi="180">{n! \over k!(n - k)!}</tex> — число сочетаний из <tex>n</tex> по <tex>k</tex>. То есть каждому сочетанию сопоставляется одна уникальная перестановка. Следовательно, генерация сочетания происходит также равновероятно.  | + | Заметим, что всего перестановок <tex>n!</tex>, но так как наш массив состоит только из <tex>0</tex> и <tex>1</tex>, то перестановка только <tex>0</tex> или только <tex>1</tex> ничего в нем не меняет. Заметим, что число перестановок нулей равно <tex>(n - k)!</tex>, единиц — <tex>k!</tex>. Следовательно, всего уникальных перестановок — <tex dpi = "180">{n! \over k!(n - k)!}</tex>. Все они равновероятны, так как была сгенерирована случайная перестановка, а каждой уникальной перестановке сопоставлено ровно <tex>k!(n - k)!</tex> перестановок. Но <tex dpi="180">{n! \over k!(n - k)!}</tex> — число сочетаний из <tex>n</tex> по <tex>k</tex>. То есть каждому сочетанию сопоставляется одна уникальная перестановка. Следовательно, генерация сочетания происходит также равновероятно.  | 
===Оценка временной сложности===  | ===Оценка временной сложности===  | ||
| − | Алгоритм состоит из   | + | Алгоритм состоит из двух невложенных циклов по <tex>n</tex> итераций каждый и функции генерации случайной перестановки <tex>\mathrm{randomShuffle()}</tex>, работающей за <tex>O(n)</tex> по алгоритму [[Метод генерации случайной перестановки, алгоритм Фишера-Йетса|Фишера—Йетcа]]. Следовательно, сложность и всего алгоритма <tex>O(n)</tex>  | 
== См. также ==  | == См. также ==  | ||
| − | *[[  | + | *[[Получение номера по объекту|Получение номера по объекту]]  | 
| + | *[[Генерация комбинаторных объектов в лексикографическом порядке]]  | ||
| − | == Источники ==  | + | == Источники информации ==  | 
| − | *[http://www.rsdn.ru/article/alg/Combine.xml  | + | *[http://www.rsdn.ru/article/alg/Combine.xml Герасимов В. А. — Генерация случайных сочетаний. Генерация сочетания по его порядковому номеру]  | 
[[Категория: Дискретная математика и алгоритмы]]  | [[Категория: Дискретная математика и алгоритмы]]  | ||
[[Категория: Комбинаторика]]  | [[Категория: Комбинаторика]]  | ||
Текущая версия на 19:35, 4 сентября 2022
| Задача: | 
| Необходимо сгенерировать случайное сочетание из элементов по с равномерным распределением вероятности, если есть в наличии функция для генерации случайного числа в заданном интервале. | 
Наивное решение
Пусть — множество из элементов, тогда для генерации случайного сочетания сделаем следующее:
- Шаг 1. Запишем в массив числа от до ,
 - Шаг 2. Выберем случайный номер сочетания ,
 - Шаг 3. Применим алгоритм получение следующего сочетания раз к массиву ,
 - Шаг 4. В хранятся номера позиции из входящих в случайное сочетание, запишем в эти элементы.
 
Псевдокод
- — массив, в котором находятся все элементы множества .
 
 int[] randomCombination(int[] arrayOfElements, int n, int k):
   for i = 1 to k 
     C[i] = i
   r = random(1, n! / (k!(n - k)!))      //random(1, i) генерирует случайное целое число в интервале [1..i]
   for i = 1 to r - 1
     nextCombination(C, n, k)            //nextCombination(C, n, k) генерирует следующие сочетание
   for i = 1 to k
     C[i] = arrayOfElements[C[i]]
   return C
Сложность алгоритма — .
Решение за время
Пусть — множество из элементов, тогда для генерации случайного сочетания сделаем следующее:
- Шаг 1. Выберем в множестве случайный элемент,
 - Шаг 2. Добавим его в сочетание,
 - Шаг 3. Удалим элемент из множества.
 
Эту процедуру необходимо повторить раз.
Псевдокод
- — массив, в котором находятся все элементы множества ,
 - — такой массив, что если , то элемент присутствует в множестве ,
 
int[] randomCombination(int[] arrayOfElements, int n, int k):
  for i = 1 to k 
    r = random(1, (n - i + 1))                
    cur = 0
    for j = 1 to n 
      if exist[j]
        cur = cur + 1
        if cur == r
          res[i] = arrayOfElements[j]
          exist[j] = false
  sort(res)
  return res
Доказательство корректности алгоритма
На первом шаге мы выбираем один элемент из , на втором из на -ом из . Тогда общее число исходов получится . Это эквивалентно . Однако заметим, что на этом шаге у нас получаются лишь размещения из по . Но все эти размещения можно сопоставить одному сочетанию, отсортировав их. И так как размещения равновероятны, и каждому сочетанию сопоставлено ровно размещений, то сочетания тоже генерируются равновероятно.
Решение за время
Для более быстрого решения данной задачи воспользуемся следующим алгоритмом: пусть задан для определенности массив размера , состоящий из единиц и нулей. Применим к нему алгоритм генерации случайной перестановки. Тогда все элементы , для которых , включим в сочетание.
Псевдокод
- — массив, в котором находятся все элементы множества ,
 - — функция генерации случайной перестановки.
 
 int[] randomCombination(int[] arrayOfElements, int n, int k):
   for i = 1 to n 
     if i <= k
       a[i] = 1
     else
       a[i] = 0
   randomShuffle(a)                        //randomShuffle() — функция генерации случайной перестановки
   for i = 1 to n
     if a[i] == 1
       ans.push(arrayOfElement[i])
   return ans
Доказательство корректности алгоритма
Заметим, что всего перестановок , но так как наш массив состоит только из и , то перестановка только или только ничего в нем не меняет. Заметим, что число перестановок нулей равно , единиц — . Следовательно, всего уникальных перестановок — . Все они равновероятны, так как была сгенерирована случайная перестановка, а каждой уникальной перестановке сопоставлено ровно перестановок. Но — число сочетаний из по . То есть каждому сочетанию сопоставляется одна уникальная перестановка. Следовательно, генерация сочетания происходит также равновероятно.
Оценка временной сложности
Алгоритм состоит из двух невложенных циклов по итераций каждый и функции генерации случайной перестановки , работающей за по алгоритму Фишера—Йетcа. Следовательно, сложность и всего алгоритма