Изменения

Перейти к: навигация, поиск

Интерполяционный поиск

3285 байт добавлено, 23:00, 15 июня 2014
Нет описания правки
== Алгоритм ==
[[Файл:Search.jpg|thumb|300px|Нахождение разделительного элемента]]Пусть <tex> a </tex> {{---}} отсортированный массив чисел из <tex> n </tex> чисел, <tex> x </tex> {{---}} значение, которое нужно найти. Сам алгоритм похож на Поиск происходит подобно [[Целочисленный двоичный поиск|двоичный поискдвоичному поиску]], однако есть существенное отличие: если но вместо деления области поиска на две примерно равные части, интерполирующий поиск производит оценку новой области поиска по расстоянию между ключом и текущим значением элемента. Если известно, что <tex> x </tex> лежит между <tex> a_l </tex> и <tex> a_r </tex>, то следующая проверка выполняется примерно на расстоянии <tex dpi = "170"> \frac{x - a_l}{a_r - a_l} \cdot</tex> <tex> (r - l) </tex> от <tex> l </tex>.
Формула для разделительного элемента <tex> m </tex> получается из следующего уравнения: <tex dpi ="170"> \frac{x - a_l}{m - l} =\frac{a_r - a_l}{r - l} </tex> {{---}}откуда следует, что <tex> m = Псевдокод ==l + </tex> <tex dpi ="170"> \frac{x - a_l}{a_r - a_l} \cdot</tex> <tex> (r - l) </tex>. На рисунке внизу показано, из каких соображений берется такая оценка. Интерполяционный поиск основывается на том, что наш массив представляет из себя что-то наподобии арифметической прогрессии.[[Файл:interpolation_search_from_gshark.png|500px|center|Размещение разделительного элемента]]
== Псевдокод ==<code> '''int interpolation_search''' interpolationSearch(double* a: '''int[]''', key : '''int n, double x''') {<font color=green> // a должен быть отсортирован </font> int l left = 0;<font color=green> // левая граница поиска (будем считать, что элементы массива нумеруются с нуля) </font> int r right = n a.length - 1; int m;<font color=green> // правая граница поиска </font>
'''while (''' a[lleft] <= x && x key '''and''' key <= a[rright]) { m mid = l left + (x key - a[lleft]) * (right - left) / (a[rright] - a[lleft]) * (r <font color=green> // индекс элемента, с которым будем проводить сравнение </font> '''if''' a[mid] < key left = mid + 1 '''else if''' a[mid] > key right = mid - l);1 '''else''' '''return''' mid
'''if (''' a[mleft] == x)key '''return m;''' left if (a[m] < x) l = m + 1; '''else r = m - 1; } if (''' a[lright] == x)key '''return l;''' right '''else''' '''return ''' -1; <font color=green>// not found }если такого элемента в массиве нет </font> </code>
== Время работы ==
Асимптотически интерполяционный поиск превосходит по своим характеристикам бинарный. Если ключи распределены случайным образом, то за один шаг алгоритм уменьшает количество проверяемых элементов с <tex> n </tex> до <tex> \sqrt n </tex><ref>[http://www.cs.technion.ac.il/~itai/publications/Algorithms/p550-perl.pdf Interpolation Search {{---}} A LogLogN Search]</ref>. То есть, после <tex>k</tex>-ого шага количество проверяемых элементов уменьшается до <tex dpi = 170>n^{\frac{1}{2^k}}</tex>. Значит, остаётся проверить только 2 элемента (и закончить на этом поиск), когда <tex dpi = 150>\frac{1}{2^k} = \log_{n}2 = \frac{1}{\log_{2}n} </tex>. Из этого вытекает, что количество шагов, а значит, и время работы составляет <tex>O(\log \log n)</tex>.
При "плохих" исходных данных (например, при экспоненциальном возрастании элементов) время работы может ухудшиться до <tex> O(n) </tex>.
Эксперименты показали, что интерполяционный поиск не настолько снижает количество выполняемых сравнений, чтобы компенсировать требуемое для дополнительных вычислений время (пока таблица не очень велика). Кроме того, типичные таблицы недостаточно случайны, да и разница между значениями <tex>\log \log n</tex> и <tex>\log n</tex> становится значительной только при очень больших <tex>n</tex>. На практике при поиске в больших файлах оказывается выгодным на ранних стадиях применять интерполяционный поиск, а затем, когда диапазон существенно уменьшится, переходить к двоичному. == Литература =Пример работы вместе с сравнением с бинарным поиском===Д[[Файл:ip_vs_bin_from_gshark.Эpng|700px|center|Сравнение бинарного и интерполирующего поисков]] ==Примечания==<references/> ==Источники информации==* Дональд Кнут {{---}} Искусство программирования. Том 3. Сортировка и поиск. / Knuth D.E. {{---}} The Art of Computer Programming. Vol. 3. КнутSorting and Searching.*[http: //en.wikipedia.org/wiki/Interpolation_search Wikipedia {{---}} Interpolation search]*[http://booksru.googlewikipedia.comorg/wiki/books?id=92rW-nktlbgC&pg=PA452&lpg=PA453&ots=jChsP2sutg&dq=%D0%BA%D0%BD%D1%83%D1%82+%D0%B898%D0%BD%D1%82%D0%B5%D1%80%D0%BF%D0%BE%D0%BB%D1D0%8FB8%D1%8680%D0D1%B883%D0D1%BE8E%D0D1%BD89%D0%BD%D1%8BB8%D0%B9+B9_%D0%BF%D0%BE%D0%B8%D1%81%D0%BA&hl=ru&ie=windowsВикипедия {{---1251&output=html Искусство программирования (том 3)] <br/>Wikipedia: [http://en.wikipedia.org/wiki/Interpolation_search Interpolation search}} Интерполирующий поиск]
[[Категория: Дискретная математика и алгоритмы]]
[[Категория: Алгоритмы поиска]]
69
правок

Навигация