Методы генерации случайного сочетания — различия между версиями
(→Доказательство корректности алгоритма) |
м (rollbackEdits.php mass rollback) |
||
(не показано 13 промежуточных версий 3 участников) | |||
Строка 6: | Строка 6: | ||
==Наивное решение== | ==Наивное решение== | ||
− | Пусть <tex>S</tex> — | + | Пусть <tex>S</tex> — множество из <tex>n</tex> элементов, тогда для генерации случайного сочетания сделаем следующее: |
* '''Шаг 1.''' Запишем в массив <tex>C</tex> числа от <tex>1</tex> до <tex>k</tex>, | * '''Шаг 1.''' Запишем в массив <tex>C</tex> числа от <tex>1</tex> до <tex>k</tex>, | ||
* '''Шаг 2.''' Выберем случайный номер сочетания <tex>r</tex>, | * '''Шаг 2.''' Выберем случайный номер сочетания <tex>r</tex>, | ||
* '''Шаг 3.''' Применим алгоритм [[Получение следующего объекта|получение следующего сочетания]] <tex>r - 1</tex> раз к массиву <tex>C</tex>, | * '''Шаг 3.''' Применим алгоритм [[Получение следующего объекта|получение следующего сочетания]] <tex>r - 1</tex> раз к массиву <tex>C</tex>, | ||
* '''Шаг 4.''' В <tex>C</tex> хранятся номера позиции из <tex>S</tex> входящих в случайное сочетание, запишем в <tex>C</tex> эти элементы. | * '''Шаг 4.''' В <tex>C</tex> хранятся номера позиции из <tex>S</tex> входящих в случайное сочетание, запишем в <tex>C</tex> эти элементы. | ||
− | |||
===Псевдокод=== | ===Псевдокод=== | ||
− | + | *<tex>\mathtt{arrayOfElements}</tex> — массив, в котором находятся все элементы множества <tex>\mathtt{S}</tex>. | |
<code> | <code> | ||
− | '''int[]''' randomCombination('''int[]''' | + | '''int[]''' randomCombination('''int[]''' arrayOfElements, '''int''' n, '''int''' k): |
'''for''' i = 1 '''to''' k | '''for''' i = 1 '''to''' k | ||
C[i] = i | C[i] = i | ||
− | r = random(1, n! / (k!(n - k)!)) <font color=darkgreen> //random(1, i) генерирует случайное число в интервале [1 | + | r = random(1, n! / (k!(n - k)!)) <font color=darkgreen> //random(1, i) генерирует случайное целое число в интервале [1..i]</font color=darkgreen> |
'''for''' i = 1 '''to''' r - 1 | '''for''' i = 1 '''to''' r - 1 | ||
nextCombination(C, n, k) <font color=darkgreen> //nextCombination(C, n, k) генерирует следующие сочетание</font color=darkgreen> | nextCombination(C, n, k) <font color=darkgreen> //nextCombination(C, n, k) генерирует следующие сочетание</font color=darkgreen> | ||
'''for''' i = 1 '''to''' k | '''for''' i = 1 '''to''' k | ||
− | C[i] = | + | C[i] = arrayOfElements[C[i]] |
'''return''' C | '''return''' C | ||
</code> | </code> | ||
− | Сложность алгоритма — <tex dpi=" | + | Сложность алгоритма — <tex dpi="150">O({n! \over k!(n - k)!} \cdot n)</tex>. |
==Решение за время <tex>O(nk)</tex>== | ==Решение за время <tex>O(nk)</tex>== | ||
Строка 36: | Строка 35: | ||
Эту процедуру необходимо повторить <tex>k</tex> раз. | Эту процедуру необходимо повторить <tex>k</tex> раз. | ||
− | + | ===Псевдокод=== | |
− | |||
*<tex>\mathtt{arrayOfElements}</tex> — массив, в котором находятся все элементы множества <tex>\mathtt{S}</tex>, | *<tex>\mathtt{arrayOfElements}</tex> — массив, в котором находятся все элементы множества <tex>\mathtt{S}</tex>, | ||
*<tex>\mathtt{exist}</tex> — такой массив, что если <tex>\mathtt{exist[i] == 1}</tex>, то <tex>\mathtt{i}</tex> элемент присутствует в множестве <tex>\mathtt{S}</tex>, | *<tex>\mathtt{exist}</tex> — такой массив, что если <tex>\mathtt{exist[i] == 1}</tex>, то <tex>\mathtt{i}</tex> элемент присутствует в множестве <tex>\mathtt{S}</tex>, | ||
− | |||
− | |||
<code> | <code> | ||
'''int[]''' randomCombination('''int[]''' arrayOfElements, '''int''' n, '''int''' k): | '''int[]''' randomCombination('''int[]''' arrayOfElements, '''int''' n, '''int''' k): | ||
'''for''' i = 1 '''to''' k | '''for''' i = 1 '''to''' k | ||
− | r = random(1, (n - i + 1)) | + | r = random(1, (n - i + 1)) |
cur = 0 | cur = 0 | ||
'''for''' j = 1 '''to''' n | '''for''' j = 1 '''to''' n | ||
'''if''' exist[j] | '''if''' exist[j] | ||
− | cur = cur + 1 | + | cur = cur + 1 |
'''if''' cur == r | '''if''' cur == r | ||
res[i] = arrayOfElements[j] | res[i] = arrayOfElements[j] | ||
Строка 58: | Строка 54: | ||
===Доказательство корректности алгоритма=== | ===Доказательство корректности алгоритма=== | ||
− | На первом шаге мы выбираем один элемент из <tex>n</tex>, на втором из <tex>n - 1</tex> | + | На первом шаге мы выбираем один элемент из <tex>n</tex>, на втором из <tex>n - 1</tex> <tex>\dots</tex> на <tex>k</tex>-ом из <tex>n - k + 1</tex>. Тогда общее число исходов получится <tex>n \times (n - 1) \times \dots \times (n - k + 1)</tex>. Это эквивалентно <tex dpi="180">{n! \over (n - k)!}</tex>. Однако заметим, что на этом шаге у нас получаются лишь размещения из <tex>n</tex> по <tex>k</tex>. Но все эти размещения можно сопоставить одному сочетанию, отсортировав их. И так как размещения равновероятны, и каждому сочетанию сопоставлено ровно <tex>k!</tex> размещений, то сочетания тоже генерируются равновероятно. |
==Решение за время <tex>O(n)</tex>== | ==Решение за время <tex>O(n)</tex>== | ||
Для более быстрого решения данной задачи воспользуемся следующим алгоритмом: пусть задан для определенности массив <tex>a</tex> размера <tex>n</tex>, состоящий из <tex>k</tex> единиц и <tex>n - k</tex> нулей. Применим к нему [[Метод генерации случайной перестановки, алгоритм Фишера-Йетса|алгоритм генерации случайной перестановки]]. Тогда все элементы <tex>i</tex>, для которых <tex>a[i] = 1</tex>, включим в сочетание. | Для более быстрого решения данной задачи воспользуемся следующим алгоритмом: пусть задан для определенности массив <tex>a</tex> размера <tex>n</tex>, состоящий из <tex>k</tex> единиц и <tex>n - k</tex> нулей. Применим к нему [[Метод генерации случайной перестановки, алгоритм Фишера-Йетса|алгоритм генерации случайной перестановки]]. Тогда все элементы <tex>i</tex>, для которых <tex>a[i] = 1</tex>, включим в сочетание. | ||
− | + | ===Псевдокод=== | |
*<tex>\mathtt{arrayOfElements}</tex> — массив, в котором находятся все элементы множества <tex>\mathtt{S}</tex>, | *<tex>\mathtt{arrayOfElements}</tex> — массив, в котором находятся все элементы множества <tex>\mathtt{S}</tex>, | ||
*<tex>\mathtt{randomShuffle()}</tex> — функция генерации случайной перестановки. | *<tex>\mathtt{randomShuffle()}</tex> — функция генерации случайной перестановки. | ||
− | |||
− | |||
− | |||
<code> | <code> | ||
'''int[]''' randomCombination('''int[]''' arrayOfElements, '''int''' n, '''int''' k): | '''int[]''' randomCombination('''int[]''' arrayOfElements, '''int''' n, '''int''' k): | ||
Строка 88: | Строка 81: | ||
===Оценка временной сложности=== | ===Оценка временной сложности=== | ||
− | Алгоритм состоит из | + | Алгоритм состоит из двух невложенных циклов по <tex>n</tex> итераций каждый и функции генерации случайной перестановки <tex>\mathrm{randomShuffle()}</tex>, работающей за <tex>O(n)</tex> по алгоритму [[Метод генерации случайной перестановки, алгоритм Фишера-Йетса|Фишера—Йетcа]]. Следовательно, сложность и всего алгоритма <tex>O(n)</tex> |
== См. также == | == См. также == |
Текущая версия на 19:35, 4 сентября 2022
Задача: |
Необходимо сгенерировать случайное сочетание из | элементов по с равномерным распределением вероятности, если есть в наличии функция для генерации случайного числа в заданном интервале.
Содержание
Наивное решение
Пусть
— множество из элементов, тогда для генерации случайного сочетания сделаем следующее:- Шаг 1. Запишем в массив числа от до ,
- Шаг 2. Выберем случайный номер сочетания ,
- Шаг 3. Применим алгоритм получение следующего сочетания раз к массиву ,
- Шаг 4. В хранятся номера позиции из входящих в случайное сочетание, запишем в эти элементы.
Псевдокод
- — массив, в котором находятся все элементы множества .
int[] randomCombination(int[] arrayOfElements, int n, int k): for i = 1 to k C[i] = i r = random(1, n! / (k!(n - k)!)) //random(1, i) генерирует случайное целое число в интервале [1..i] for i = 1 to r - 1 nextCombination(C, n, k) //nextCombination(C, n, k) генерирует следующие сочетание for i = 1 to k C[i] = arrayOfElements[C[i]] return C
Сложность алгоритма —
.Решение за время
Пусть
— множество из элементов, тогда для генерации случайного сочетания сделаем следующее:- Шаг 1. Выберем в множестве случайный элемент,
- Шаг 2. Добавим его в сочетание,
- Шаг 3. Удалим элемент из множества.
Эту процедуру необходимо повторить
раз.Псевдокод
- — массив, в котором находятся все элементы множества ,
- — такой массив, что если , то элемент присутствует в множестве ,
int[] randomCombination(int[] arrayOfElements, int n, int k): for i = 1 to k r = random(1, (n - i + 1)) cur = 0 for j = 1 to n if exist[j] cur = cur + 1 if cur == r res[i] = arrayOfElements[j] exist[j] = false sort(res) return res
Доказательство корректности алгоритма
На первом шаге мы выбираем один элемент из
, на втором из на -ом из . Тогда общее число исходов получится . Это эквивалентно . Однако заметим, что на этом шаге у нас получаются лишь размещения из по . Но все эти размещения можно сопоставить одному сочетанию, отсортировав их. И так как размещения равновероятны, и каждому сочетанию сопоставлено ровно размещений, то сочетания тоже генерируются равновероятно.Решение за время
Для более быстрого решения данной задачи воспользуемся следующим алгоритмом: пусть задан для определенности массив алгоритм генерации случайной перестановки. Тогда все элементы , для которых , включим в сочетание.
размера , состоящий из единиц и нулей. Применим к немуПсевдокод
- — массив, в котором находятся все элементы множества ,
- — функция генерации случайной перестановки.
int[] randomCombination(int[] arrayOfElements, int n, int k): for i = 1 to n if i <= k a[i] = 1 else a[i] = 0 randomShuffle(a) //randomShuffle() — функция генерации случайной перестановки for i = 1 to n if a[i] == 1 ans.push(arrayOfElement[i]) return ans
Доказательство корректности алгоритма
Заметим, что всего перестановок
, но так как наш массив состоит только из и , то перестановка только или только ничего в нем не меняет. Заметим, что число перестановок нулей равно , единиц — . Следовательно, всего уникальных перестановок — . Все они равновероятны, так как была сгенерирована случайная перестановка, а каждой уникальной перестановке сопоставлено ровно перестановок. Но — число сочетаний из по . То есть каждому сочетанию сопоставляется одна уникальная перестановка. Следовательно, генерация сочетания происходит также равновероятно.Оценка временной сложности
Алгоритм состоит из двух невложенных циклов по Фишера—Йетcа. Следовательно, сложность и всего алгоритма
итераций каждый и функции генерации случайной перестановки , работающей за по алгоритму