Поиск k-ой порядковой статистики за линейное время — различия между версиями
Niko (обсуждение | вклад) (→Анализ времени работы алгоритма) |
Niko (обсуждение | вклад) (→Анализ времени работы алгоритма) |
||
Строка 7: | Строка 7: | ||
== Анализ времени работы алгоритма == | == Анализ времени работы алгоритма == | ||
− | Пусть <tex>T(n)</tex> время работы алгоритма для <tex>n</tex> элементов, тогда она меньше, чем <tex>Cn</tex> - время работы, на сортировку групп, и разбиение по рассекающему элементу. Плюс время сумма время работы для поиска медианы медиан, то есть <tex>T(\frac{n}{5})</tex>. И кроме того время работы для поиска <tex>k</tex>-го элемента в одной из двух частей массива, то есть <tex>T(k)</tex>, где <tex>k</tex>, количество элементов в этой части, но <tex>k</tex> не превосходит <tex>\frac{7n}{10}</tex>, так как чисел меньше рассекающего элемента не менее <tex>\frac{3n}{10}</tex> - это <tex>\frac{n}{10}</tex> медиан меньшие медианы медиан плюс не менее <tex>\frac{2n}{10}</tex> элементов меньшие этих медиан, с другой стороны чисел больших рассекающего элемента так же менее <tex>\frac{3n}{10}</tex>, следовательно в худшем случае <tex> k = \frac{7n}{10}. Тогда получаем, что | + | Пусть <tex>T(n)</tex> время работы алгоритма для <tex>n</tex> элементов, тогда она меньше, чем <tex>Cn</tex> - время работы, на сортировку групп, и разбиение по рассекающему элементу. Плюс время сумма время работы для поиска медианы медиан, то есть <tex>T(\frac{n}{5})</tex>. И кроме того время работы для поиска <tex>k</tex>-го элемента в одной из двух частей массива, то есть <tex>T(k)</tex>, где <tex>k</tex>, количество элементов в этой части, но <tex>k</tex> не превосходит <tex>\frac{7n}{10}</tex>, так как чисел меньше рассекающего элемента не менее <tex>\frac{3n}{10}</tex> - это <tex>\frac{n}{10}</tex> медиан меньшие медианы медиан плюс не менее <tex>\frac{2n}{10}</tex> элементов меньшие этих медиан, с другой стороны чисел больших рассекающего элемента так же менее <tex>\frac{3n}{10}</tex>, следовательно в худшем случае <tex> k = \frac{7n}{10}</tex>. |
+ | |||
+ | Тогда получаем, что | ||
<tex>T(n) \le T(\frac{n}{5}) + T(\frac{7n}{10}) + Cn </tex> | <tex>T(n) \le T(\frac{n}{5}) + T(\frac{7n}{10}) + Cn </tex> | ||
− | + | ||
+ | Покажем, что для всех <tex> n </tex> выполняется неравенство <tex>T(n) \le 10Cn </tex>. | ||
+ | |||
Докажем по индукции | Докажем по индукции | ||
# Очевидно, что для малых <tex> n </tex> выполняется неравенство <tex>T(n) \le 10Cn </tex> | # Очевидно, что для малых <tex> n </tex> выполняется неравенство <tex>T(n) \le 10Cn </tex> | ||
# Тогда по предположению индукции <tex>T(\frac{n}{5}) \le 10C(\frac{n}{5}) = 2Cn</tex> и <tex> T(\frac{10n}{7}) \le 10C(\frac{7n}{10}) = 7Cn</tex>, тогда | # Тогда по предположению индукции <tex>T(\frac{n}{5}) \le 10C(\frac{n}{5}) = 2Cn</tex> и <tex> T(\frac{10n}{7}) \le 10C(\frac{7n}{10}) = 7Cn</tex>, тогда | ||
<tex>T(n) \le T(\frac{n}{5}) + T(\frac{7n}{10}) + Cn = 2Cn + 7Cn + Cn = 10Cn \Rightarrow T(n) \le 10Cn</tex> | <tex>T(n) \le T(\frac{n}{5}) + T(\frac{7n}{10}) + Cn = 2Cn + 7Cn + Cn = 10Cn \Rightarrow T(n) \le 10Cn</tex> |
Версия 21:36, 7 июня 2011
Историческая справка
Алгоритм Блюма-Флойда-Пратта-Ривеста-Тарьяна (BFPRT-алгоритм) создан Мануэлем Блюмом(Manuel Blum), Робертом Флойдом(Robert Floyd), Воганом Рональдом Праттом(Vaughan Ronald Pratt), Роном Ривестом(Ron Rivest) и Рональдом Тарьяном(Robert Tarjan) в 1973 году.
Описание алгоритма
Разбиваем наш массив на группы по 5 элементов(на самом деле можно разбивать и на другое нечетное количество элементов больших 5). Затем в каждой группе находим средний элемент(медиану), это можно сделать любой сортировкой. И запустить рекурсивно данный алгоритм от медиан. Тем самым мы найдем средний элемент среди медиан, то есть медиану медиан. Эту медиана медиан выберем рассекающим элементом для поиска
-го элемента. Далее простыми обменами получаем слева от рассекающего элемента числа меньшие него, а справа числа больше рассекающего элемента или равные ему. И запускаем нашу функцию от той части массива в котором будет лежать -й элемент.Анализ времени работы алгоритма
Пусть
время работы алгоритма для элементов, тогда она меньше, чем - время работы, на сортировку групп, и разбиение по рассекающему элементу. Плюс время сумма время работы для поиска медианы медиан, то есть . И кроме того время работы для поиска -го элемента в одной из двух частей массива, то есть , где , количество элементов в этой части, но не превосходит , так как чисел меньше рассекающего элемента не менее - это медиан меньшие медианы медиан плюс не менее элементов меньшие этих медиан, с другой стороны чисел больших рассекающего элемента так же менее , следовательно в худшем случае .Тогда получаем, что
Покажем, что для всех
выполняется неравенство .Докажем по индукции
- Очевидно, что для малых выполняется неравенство
- Тогда по предположению индукции и , тогда