Целочисленный двоичный поиск
Целочисленный двоичный поиск (бинарный поиск) (англ. binary search) — алгоритм поиска объекта по заданному признаку в множестве объектов, упорядоченных по тому же самому признаку, работающий за логарифмическое время.
Содержание
- 1 Формулировка задачи
- 2 Принцип работы
- 3 Правосторонний/левосторонний целочисленный двоичный поиск
- 4 Алгоритм двоичного поиска
- 5 Код
- 6 Несколько слов об эвристиках
- 7 Применение двоичного поиска на неотсортированных массивах
- 7.1 Применение поиска на циклически сдвинутом отсортированном массиве
- 7.2 Применение поиска на массиве, отсортированном по возрастанию, в конец которого приписан массив, отсортированный по убыванию
- 7.3 Применение поиска на двух отсортированных по возрастанию массивах, записанных один в конец другого
- 8 См. также
- 9 Источники информации
Формулировка задачи
Пусть нам дан упорядоченный массив, состоящий только из целочисленных элементов. Требуется найти позицию, на которой находится заданный элемент. Для этой задачи мы и можем использовать двоичный поиск.
Принцип работы
Двоичный поиск заключается в том, что на каждом шаге множество объектов делится на две части и в работе остаётся та часть множества, где находится искомый объект. Или же, в зависимости от постановки задачи, мы можем остановить процесс, когда мы получим первый или же последний индекс вхождения элемента. Последнее условие — это левосторонний/правосторонний двоичный поиск.
Правосторонний/левосторонний целочисленный двоичный поиск
Для простоты дальнейших определений будем считать, что
и что .
Определение: |
Правосторонний бинарный поиск (англ. rightside binary search) — бинарный поиск, с помощью которого мы ищем | , где — массив, а — искомый ключ
Определение: |
Левосторонний бинарный поиск (англ. leftside binary search) — бинарный поиск, с помощью которого мы ищем | , где — массив, а — искомый ключ
Использовав эти два вида двоичного поиска, мы можем найти отрезок позиций таких, что и
Например:
Задан отсортированный массив
.Правосторонний поиск двойки выдаст в результате
, в то время как левосторонний выдаст (нумерация с единицы).От сюда следует, что количество подряд идущих двоек равно длине отрезка
, то есть .Если искомого элемента в массиве нет, то правосторонний поиск выдаст минимальный элемент, больший искомого, а левосторонний наоборот, максимальный элемент, меньший искомого.
Алгоритм двоичного поиска
Идея поиска заключается в том, чтобы брать элемент посередине, между границами, и сравнивать его с искомым. Если искомое больше(в случае правостороннего — не меньше), чем элемент сравнения, то сужаем область поиска так, чтобы новая левая граница была равна индексу середины предыдущей области. В противном случае присваиваем это значение правой границе. Проделываем эту процедуру до тех пор, пока правая граница больше левой более чем на
. В случае правостороннего бинарного поиска ответом будет индекс , а в случае левостороннего — .Код
int binSearch(int[] a, int key) // l, r - левая и правая границы int l = 0 int r = len(a) + 1 while l < r - 1 // запускаем цикл m = (l + r) / 2 // m — середина области поиска if a[m] < key l = m else r = m // сужение границ return r
В случае правостороннего поиска изменится знак сравнения при сужении границ на .
Инвариант цикла: пусть левый индекс не больше искомого элемента, а правый — строго больше, тогда если
, то понятно, что — самое правое вхождение (так как следующее уже больше).Несколько слов об эвристиках
Эвристика с завершением поиска, при досрочном нахождении искомого элемента
Заметим, что если нам необходимо просто проверить наличие элемента в упорядоченном множестве, то можно использовать любой из правостороннего и левостороннего поиска. При этом будем на каждой итерации проверять "не попали ли мы в элемент, равный искомому", и в случае попадания заканчивать поиск.
Эвристика с запоминанием ответа на предыдущий запрос
Пусть дан отсортированный массив чисел, упорядоченных по неубыванию. Также пусть запросы приходят в таком порядке, что каждый следующий не меньше, чем предыдущий. Для ответа на запрос будем использовать левосторонний двоичный поиск. При этом после того как обработался первый запрос, запомним чему равно
, запишем его в переменную . Когда будем обрабатывать следующий запрос, то проинициализируем левую границу как . Заметим, что все элементы, которые лежат не правее , строго меньше текущего искомого элемента, так как они меньше предыдущего запроса, а значит и меньше текущего. Значит инвариант цикла выполнен.Применение двоичного поиска на неотсортированных массивах
Применение поиска на циклически сдвинутом отсортированном массиве
Пусть отсортированный по возрастанию массив
int l = 0 int r = n + 1 while l < r - 1 // Запускаем цикл... m = (l + r) / 2 // m — середина области поиска. if a[m] < a[n] // Сужение границ.. l = m else r = m int x = l // x — искомый индекс.
Затем воспользуемся двоичным поиском искомого элемента
if key > a[0] // Если key в левой части... l = 0 r = x + 1 if key < a[n] // Если key в правой части... l = x + 1 r = n + 1
Время выполнения данного алгоритма —
.Применение поиска на массиве, отсортированном по возрастанию, в конец которого приписан массив, отсортированный по убыванию
Найдем индекс последнего элемента массива, отсортированного по возрастанию, воспользовавшись двоичным поиском, условие в
int l = 0 int r = n + 1 while l < r - 1 // Запускаем цикл... m = (l + r) / 2 // m — середина области поиска. if a[m] > a[m - 1] // Сужение границ.. l = m else r = m int x = l // x — искомый индекс.
Затем запустим левосторонний двоичный поиск для каждого массива отдельно: для элементов
и для элементов . Для массива, отсортированного по убыванию используем двоичный поиск, измененнив условие в на .Время выполнения алгоритма —
.
Применение поиска на двух отсортированных по возрастанию массивах, записанных один в конец другого
Индекс последнего элемента левого массива найдем так же, как в предыдущей задаче. Затем запустим двоичный поиск для каждого массива отдельно: для
и для .Время выполнения алгоритма —
.См. также
Источники информации
- Д. Кнут - Искусство программирования (Том 3, 2-е издание)
- Википедия - двоичный поиск
- Интересная статья про типичные ошибки
- Бинарный поиск на algolist