Поиск k-ой порядковой статистики за линейное время — различия между версиями
Niko (обсуждение | вклад) м |
Niko (обсуждение | вклад) м |
||
Строка 13: | Строка 13: | ||
Пусть <tex>T(n)</tex> - время работы алгоритма для <tex>n</tex> элементов, тогда оно не больше, чем сумма: | Пусть <tex>T(n)</tex> - время работы алгоритма для <tex>n</tex> элементов, тогда оно не больше, чем сумма: | ||
# времени работы на сортировку групп и разбиения по рассекающему элементу, то есть <tex>Cn</tex>; | # времени работы на сортировку групп и разбиения по рассекающему элементу, то есть <tex>Cn</tex>; | ||
− | # времени работы для поиска медианы медиан, то есть <tex>T(\frac{n}{5})</tex> | + | # времени работы для поиска медианы медиан, то есть <tex>T(\frac{n}{5})</tex>; |
# времени работы для поиска <tex>k</tex>-го элемента в одной из двух частей массива, то есть <tex>T(s)</tex>, где <tex>s</tex>- количество элементов в этой части. Но <tex>s</tex> не превосходит <tex>\frac{7n}{10}</tex>, так как чисел, меньших рассекающего элемента, не менее <tex>\frac{3n}{10}</tex> - это <tex>\frac{n}{10}</tex> медиан, меньших медианы медиан, плюс не менее <tex>\frac{2n}{10}</tex> элементов, меньших этих медиан. С другой стороны, чисел, больших рассекающего элемента, так же не менее <tex>\frac{3n}{10}</tex>, следовательно <tex> s \le \frac{7n}{10}</tex>, то есть в худшем случае <tex> s = \frac{7n}{10}</tex>. | # времени работы для поиска <tex>k</tex>-го элемента в одной из двух частей массива, то есть <tex>T(s)</tex>, где <tex>s</tex>- количество элементов в этой части. Но <tex>s</tex> не превосходит <tex>\frac{7n}{10}</tex>, так как чисел, меньших рассекающего элемента, не менее <tex>\frac{3n}{10}</tex> - это <tex>\frac{n}{10}</tex> медиан, меньших медианы медиан, плюс не менее <tex>\frac{2n}{10}</tex> элементов, меньших этих медиан. С другой стороны, чисел, больших рассекающего элемента, так же не менее <tex>\frac{3n}{10}</tex>, следовательно <tex> s \le \frac{7n}{10}</tex>, то есть в худшем случае <tex> s = \frac{7n}{10}</tex>. | ||
Версия 23:30, 7 июня 2011
Определение: |
-ой порядковой статистикой набора элементов линейно упорядоченного множества называется такой его элемент, который является -ым элементом набора в порядке сортировки |
Историческая справка
Алгоритм Блюма-Флойда-Пратта-Ривеста-Тарьяна (BFPRT-алгоритм) создан Мануэлем Блюмом(Manuel Blum), Робертом Флойдом(Robert Floyd), Воганом Рональдом Праттом(Vaughan Ronald Pratt), Роном Ривестом(Ron Rivest) и Рональдом Тарьяном(Robert Tarjan) в 1973 году.
Описание алгоритма
Разбиваем наш массив на группы по 5 элементов(на самом деле можно разбивать и на другое нечетное количество элементов, больших 5). Затем в каждой группе находим средний элемент(медиану), это можно сделать любой сортировкой. И запускаем рекурсивно этот алгоритм от медиан. Тем самым мы найдем средний элемент среди медиан, то есть медиану медиан. Эту медиану медиан выберем рассекающим элементом для поиска
-го элемента. Далее разбиваем массив на две части: слева от рассекающего элемента числа меньшие него, а справа - числа больше рассекающего элемента или равные ему. И рекурсивно запускаем наш алгоритм от той части массива, в которой будет лежать -й элемент.Анализ времени работы алгоритма
Пусть
- время работы алгоритма для элементов, тогда оно не больше, чем сумма:- времени работы на сортировку групп и разбиения по рассекающему элементу, то есть ;
- времени работы для поиска медианы медиан, то есть ;
- времени работы для поиска -го элемента в одной из двух частей массива, то есть , где - количество элементов в этой части. Но не превосходит , так как чисел, меньших рассекающего элемента, не менее - это медиан, меньших медианы медиан, плюс не менее элементов, меньших этих медиан. С другой стороны, чисел, больших рассекающего элемента, так же не менее , следовательно , то есть в худшем случае .
Тогда получаем, что
Покажем, что для всех
выполняется неравенство .Докажем по индукции:
- Очевидно, что для малых выполняется неравенство
- Тогда, по предположению индукции, и , тогда
Так как
, то время работы алгоритма