Изменения

← Предыдущая правка

Мажорирующий элемент

13 439 байт добавлено, 19:05, 4 сентября 2022

м

rollbackEdits.php mass rollback

{{Задача|definition =~~= Формулировка задачи ==~~Требуется в массиве длиной <tex>N</tex> найти элемент, встречающийся более <tex>N/2</tex> раз. Гарантируется, что такой элемент существует.}}

~~Требуется в массиве длиной ''~~== Решение за O(N~~'' найти элемент, встречающийся более ''N/2'' раз.~~) ==

~~== Источники ==~~Алгоритм можно представить следующим образом: пусть на вечеринке собрались <tex>N</tex> людей, и каждому из них соответствует один элемент из массива. Когда встречаются двое с разными элементами, то они образуют пару и садятся. В конце концов останутся стоять только люди с одинаковыми элементами. Это и есть искомый элемент.

Будем идти по массиву и запоминать элемент, для которого еще не нашлось пары. При встрече такого же элемента увеличиваем счетчик "без пары", иначе — уменьшаем. Если все элементы уже имеют пару, то говорим, что у текущего элемента пары нет.

=== Псевдокод ===

'''function''' findMajorityElement(a: '''int[N]'''): '''int'''

count = 0 ''// количество людей, оставшихся стоять''

candidate = <tex>\varnothing</tex>

'''for''' i = 0 '''to''' N - 1

'''if''' count == 0 ''// никто не стоит''

candidate = a[i] ''// встанет текущий элемент''

count++ ''// увеличим количество стоящих''

'''else''' ''// кто-то стоит''

'''if''' a[i] == candidate ''// стоит такой же элемент''

count++ ''// увеличим количество стоящих''

'''else''' '' // стоит другой элемент => подобрали пару''

count-- ''// уменьшим количество стоящих''

'''return''' candidate

=== Доказательство ===

На <tex>i</tex>''-ом'' шаге выполняется следующий инвариант: если <tex>\mathtt{count} > 0</tex>, то <tex>\mathtt{candidate}</tex> — мажорирующий элемент на подмассиве <tex>a[0\ldots i]</tex>, либо мажорирующего элемента на данном подмассиве не существует; если <tex>\mathtt{count} = 0</tex>, то мажорирующего элемента на данном подмассиве не существует. Нам гарантируется существование мажорирующего элемента, значит на <tex>N</tex>''-ом'' шаге <tex>\mathtt{count} \ne 0</tex> и <tex>\mathtt{candidate}</tex> содержит мажорирующий элемент. Покажем, что данный инвариант всегда выполняется.

Пусть данный инвариант выполняется на <tex>k</tex>''-ом'' шаге. Тогда на <tex>(k+1)</tex>''-ом'' шаге возможны 3 варианта:

# <tex>\mathtt{count} = 0</tex>Очевидно, что на подмассиве <tex>a[0\ldots k]</tex> мажорирующего элемента не существует, так как все элементы разбились на пары. Тогда только <tex>a[k+1]</tex> может быть мажорирующим элементом.

# <tex>\mathtt{count} > 0</tex> и <tex>a[k+1] = \mathtt{candidate}</tex>Если на подмассиве <tex>a[0\ldots k]</tex> существует мажорирующий элемент, то он находится в <tex>\mathtt{candidate}</tex>. Тогда, в силу равенства <tex>a[k+1]</tex> и <tex>\mathtt{candidate}</tex>, если на подмассиве <tex>a[0\ldots k+1]</tex> существует мажорирующий элемент, то он тоже будет равен <tex>\mathtt{candidate}</tex>.

# <tex>\mathtt{count} > 0</tex> и <tex>a[k+1] \ne \mathtt{candidate}</tex>Если на подмассиве <tex>a[0\ldots k]</tex> существует мажорирующий элемент, то он находится в <tex>\mathtt{candidate}</tex>. Тогда, в силу неравенства <tex>a[k+1]</tex> и <tex>\mathtt{candidate}</tex>, образовалась новая пара. Если <tex>\mathtt{count}</tex> не станет равным нулю, то, опять же, мажорирующим элементом может быть только <tex>\mathtt{candidate}</tex>, так как для всех остальных мы нашли пару, а, значит, встречаются они не более <tex>N/2</tex> раз.

Всего происходит <tex>N</tex> итераций, каждая из которых обрабатывается за <tex>O(1)</tex>. Итоговая асимптотика <tex>O(N)</tex>.

== Обобщение на случай поиска элемента, встречающегося N/K раз ==

Будем пользоваться той же идеей, что и в предыдущем пункте. До этого мы сажали людей парами, а теперь будем сажать группами из <tex>K</tex> человек. В итоге, если искомые нами элементы есть, то они останутся стоять.

Будем идти по массиву и хранить элементы, которые еще не сели. При встрече элемента, который уже есть среди стоящих, увеличиваем счетчик данного элемента на <tex>1</tex>. В противном случае смотрим, можем ли мы посадить группу и, либо ее сажаем, либо добавляем текущий элемент к стоящим. В конце требуется сделать проверку, что оставшиеся стоять элементы встречаются <tex>N/K</tex> раз.

=== Псевдокод ===

'''function''' findMajorityElement(a: '''int[N]''', K: '''int'''): '''int[N]'''

''//candidates — словарь, где ключ — стоящий элемент,''

''//значение — количество таких стоящих элементов''

'''for''' i = 0 '''to''' N - 1

'''if''' candidates.containsKey(a[i]) ''// нашли стоящий элемент''

candidates[a[i]]++ ''// увеличим счетчик''

'''else'''

'''if''' candidates.size < K - 1 ''// полная группа не образована''

candidates[a[i]] = 1 ''// добавим элемент в группу''

'''else''' ''// образовалась полная группа''

'''for''' element '''in''' candidates ''// посадим группу''

candidates[element]--

'''if''' candidates[element] == 0 ''// если никто с таким элементом не стоит''

candidates.remove(element) ''// удалим этот элемент''

'''for''' candidate '''in''' candidates ''// обнулим счетчик''

candidates[candidate] = 0

'''for''' i = 0 '''to''' N - 1 ''// посчитаем, сколько раз встречаются элементы''

'''if''' candidates.containsKey(a[i])

candidates[a[i]]++

'''for''' candidate '''in''' candidates ''// проверим, встречается ли элемент N / K раз''

'''if''' candidates[candidate] > N / K

elements.add(candidate)

'''return''' elements

=== Доказательство ===

На <tex>i</tex>''-ом'' шаге поддерживается следующий инвариант: если на подмассиве <tex>a[0\ldots i]</tex> существуют элементы, которые встречаются больше, чем <tex>i / K</tex> раз, то все они содержатся в <tex>\mathtt{candidates}</tex> и размер <tex>\mathtt{candidates}</tex> не превышает <tex>K</tex>. Тогда на <tex>N</tex>''-ом'' шаге <tex>\mathtt{candidates}</tex> будет содержать все возможные элементы, встречающиеся более, чем <tex>N / K</tex> раз, остается только выполнить проверку. Покажем, что данный инвариант всегда выполняется:

Пусть данный инвариант выполняется на <tex>k</tex>''-ом'' шаге. Тогда на <tex>(k+1)</tex>''-ом'' шаге возможны <tex>3</tex> варианта:

#<tex>a[k + 1] \in \mathtt{candidates}</tex>Размер <tex>\mathtt{candidates}</tex> не увеличен, текущий элемент останется стоять. Инвариант выполняется.

#<tex>a[k + 1] \notin \mathtt{candidates}</tex> и <tex>|\mathtt{candidates}| < K - 1</tex>Размер <tex>\mathtt{candidates}</tex> останется меньше <tex>K</tex>, текущей элемент останется стоять. Инвариант выполняется.

#<tex>a[k + 1] \notin \mathtt{candidates}</tex> и <tex>|\mathtt{candidates}| = K - 1</tex>Размер <tex>\mathtt{candidates}</tex> на данном шаге может только уменьшиться. Сажаем группу. Если какой-то элемент был удален на текущем шаге, то, значит, он встречался не более, чем <tex>(k + 1) / K</tex> раз, т.к. мы могли успеть посадить максимум <tex>(k + 1) / K</tex> групп. Тогда удаление данного элемента из <tex>\mathtt{candidates}</tex> ни к чему плохому не приведет. Инвариант выполняется.

Рассмотрим среднее количество обращений к словарю за одну итерацию. На каждой итерации происходит не более <tex>1</tex> увеличения счетчика. Тогда, за все время, происходит не более <tex>N</tex> увеличений. Так как количество уменьшений счетчика не может превышать количество увеличений, то всего происходит не более <tex>2N</tex> обращений к словарю. Следовательно, сложность одной итерации составляет <tex>O(1)</tex>.

Получается, при реализации словаря на основе хэш-таблиц, каждая итерация в среднем выполняется за <tex>O(1)</tex>. Итоговая сложность <tex>O(N)</tex> с дополнительной памятью <tex>O(K)</tex>.

== Альтернативное решение ==

Выберем случайный элемент в массиве и проверим, встречается ли он больше, чем <tex>N / K</tex> раз. Будем делать так, пока не найдем подходящий элемент. Утверждается, что данный алгоритм в среднем работает за <tex>O(N \cdot K)</tex>

=== Псевдокод ===

'''function''' findMajorityElement(a: '''int[N]''', K: '''int'''): '''int'''

'''while''' ''true''

candidate = a[random(N)]

count = 0

'''for''' i = 0 '''to''' N - 1

'''if''' a[i] == candidate

count++

'''if''' count > N / K

'''return''' candidate

=== Доказательство ===

На каждом шаге мы берем случайный элемент. Проверка на мажорируемость выполняется за <tex>O(N)</tex>. Вероятность, что мы выбрали элемент "удачно" составляет <tex>1 / K</tex>. Тогда, в среднем, мы будем делать <tex>K</tex> проверок. Итоговая сложность <tex>O(N \cdot K)</tex>.

== Источники информации ==

* [http://habrahabr.ru/post/167177/ Habrahabr — Поиск часто встречающихся элементов в массиве]

* [http://algolist.ncstu.ru/olimp/poi_sol.php#a15 Algolist — Решение задачи 15]

[[Категория: Дискретная математика и алгоритмы]]

[[Категория: Амортизационный анализ]]

Maintenance script

1632

правки

Изменения

Мажорирующий элемент

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты