Поиск в матрице — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Решение за O(n\cdot\log(m)))
Строка 9: Строка 9:
  
  
== Решение за O(n<tex>\cdot</tex>\log(m)) ==
+
== Решение за O(n<tex>\cdot</tex>log(m)) ==
 
Данный способ решения использует наивное решение за <math>n \cdot m</math>, улучшенное с помощью [[Целочисленный двоичный поиск|двоичного поиска]]. Для этого в каждой строке запускается двоичный поиск. Время работы — <tex>O(n \cdot \log(m))</tex>.
 
Данный способ решения использует наивное решение за <math>n \cdot m</math>, улучшенное с помощью [[Целочисленный двоичный поиск|двоичного поиска]]. Для этого в каждой строке запускается двоичный поиск. Время работы — <tex>O(n \cdot \log(m))</tex>.
  

Версия 23:31, 23 января 2016

Задача:
Задана отсортированная двумерная матрица (матрица, для которой выполнено следующее условие: [math] a[row][col] \le a[row + 1][col], a[row][col] \le a[row][col + 1] [/math] ), состоящая из [math]n[/math] строк и [math]m[/math] столбцов. Необходимо найти расположение указанного элемента в матрице или определить, что данный элемент в матрице отсутствует.


Пример отсортированной матрицы

Решение за O(n[math]\cdot[/math]m)

Для начала рассмотрим наивный алгоритм поиска элемента. В каждой строке исходной матрицы запускаем линейный поиск, если находим элемент, то возвращаем его координаты [math](row, col)[/math]. Время работы — [math]O(n \cdot m)[/math].


Решение за O(n[math]\cdot[/math]log(m))

Данный способ решения использует наивное решение за [math]n \cdot m[/math], улучшенное с помощью двоичного поиска. Для этого в каждой строке запускается двоичный поиск. Время работы — [math]O(n \cdot \log(m))[/math].

Замечание

Время работы может быть улучшено до [math]O(\min(n, m) \cdot \log(\max(n \cdot m))[/math]. Для этого необходимо модифицировать алгоритм так, чтобы в том случае, если столбцов больше чем строк, он бы запускал двоичный поиск по строкам, если строк больше — наоборот.

Существует еще один способ оптимизации. Рассмотрим случай, когда используется двоичный поиск по строке. Достаточно очевидно, что искомое число может находится только в тех строках, где первый элемент меньше искомого, а последний — больше. Перед началом поиска можно исключить 2 прямоугольных участка матрицы: первый состоит из строк, у которых последний элемент меньше искомого; второй состоит из строк, у которых первый элемент больше искомого. Используя двоичный поиск, можно найти границы этих участков за [math]O(\log(n))[/math] для столбцов и за [math]O(\log(m))[/math] строк.


Пример поиска числа 13 в матрице

Решение за O(n + m)

В данном решении мы начинаем поиск из правого верхнего угла и движемся к искомому элементу. Идея алгоритма в том, что если текущий элемент меньше необходимого, то мы сдвигаемся на одну строку вниз. Если он больше, то мы сдвигаемся на одну колонку влево.

Доказательство корректности

Докажем, что каждый ход в соседнюю ячейку отсекает только те столбцы или строки, которые точно не содержат искомый элемент. Назовем ход корректным, если он отсекает только те строки или колонки, в которых точно нет искомого элемента. Пусть первый ход (в правую верхнюю ячейку) корректный (он не отсек ни одной строки или столбца).

Пусть предыдущий ход был корректным. Докажем, что следующий ход, выполненный по правилам, будет корректным. Если текущий элемент меньше искомого, то очевидно, что все ячейки левее и выше меньше, чем искомый. Значит, их можно отсечь. Если текущий элемент больше искомого, то очевидно, что все ячейки правее и ниже больше, чем искомый. Значит, их тоже можно отсечь.

В определенный момент времени алгоритм либо найдет ячейку с искомым элементом (значит, элемент найден), либо в матрице не останется тех элементов, которые не были отсечены (значит, элемента в матрице нет).

Код

 int matrixFind(int[][] a, int target):
   if (target < a[0][0] OR target > a[N-1][N-1]) 
     return false
   row = 0
   col = N-1
   while (row <= N-1 AND col >= 0) 
     if (a[row][col] < target) 
       row++
     else if (a[row][col] > target)
       col--
     else
       return (row, col)
   return false


Оценка времени работы

Очевидно, что во время работы указатель сдвигается максимум на [math]n[/math] строк и [math]m[/math] столбцов. В этом случае время работы составляет [math]O(n + m)[/math].

См. также

Источники информации