Универсальное семейство хеш-функций — различия между версиями

Версия 00:17, 11 июня 2013

Содержание

1 Определение
2 Построение универсального множества хеш-функций
3 Попарная независимость
4 Построение попарно независимого множества хеш-функций
5 Источники

Определение

Качественная хеш-функция удовлетворяет (приближенно) условию простого равномерного хеширования: для каждого ключа, независимо от хеширования других ключей, равновероятно помещение его в любую из [math] m [/math] ячеек. Но это условие обычно невозможно проверить, так как распределение вероятностей, с которыми поступают входные данные, как правило, неизвестно. К тому же, вставляемые ключи могут и не быть независимыми. Если наш противник будет умышленно выбирать ключи для хеширования при помощи конкретной хеш-функции, то при некоторых реализациях хеш-таблиц может получиться так, что все ключи будут записаны в одну и ту же ячейку таблицы, что приведет к среднему времени выборки [math] \Theta(n) [/math]. Таким образом, любая фиксированная хеш-функция становится уязвимой. И единственный эффективный выход из данной ситуации — случайный выбор хеш-функции. Такой подход называется универсальным хешированием. Он гарантирует хорошую производительность в среднем, вне зависимости от данных, выбранных нашим противником.

Определение:

Пусть — конечное множество хеш-функций, которые отображают пространство ключей в диапазон . Такое множество называется универсальным, если для каждой пары ключей количество хеш-функций , для которых не превышает .

Иными словами, при случайном выборе хеш-функции из [math] H [/math] вероятность коллизии между различными ключами [math] k, l [/math] не превышает вероятности совпадения двух случайным образом выбранных хеш-значений из множества [math] \{0, 1, 2, .. , m - 1\} [/math], которая равна [math] \frac{1}{m} [/math].

Построение универсального множества хеш-функций

Теорема:

Множество хеш функций , где , , , — простое число, является универсальным.

Доказательство:

Рассмотрим [math]k,l\in Z_p:k\ne l[/math]. Пусть для данной хеш-функции [math]h_{a,b}[/math]

[math]r=(ak+b)\mod p[/math],

[math]s=(al+b)\mod p[/math].

[math]r\ne s[/math], так как [math]r-s\equiv a(k-l)\pmod p[/math], а [math]p[/math] — простое число, [math]a[/math] и [math](k-l)[/math] не равны нулю по модулю [math]p[/math]. Значит, произведение [math]r[/math] и [math]s[/math] также отлично от нуля по модулю [math]p[/math]. Таким, образом, коллизии "по модулю [math]p[/math]" отсутствуют. Более того, каждая из [math]p(p-1)[/math] возможных пар [math](a,b)[/math], приводят к различным парам [math](r,s):r\ne s[/math]. Чтобы доказать это, достаточно рассмотреть возможность однозначного определения [math]a[/math] и [math]b[/math] по заданным [math]r[/math] и [math]s[/math]:

.

Поскольку имеется только [math]p(p-1)[/math] возможных пар [math](r,s):r\ne s[/math], то имеется взаимнооднозначное соответствие между парами [math](a,b)[/math] и парами [math](r,s):r\ne s[/math]. Таким образом, для любых [math]k,l[/math] при равномерном случайном выборе пары [math](a,b)[/math] из [math]Z_p^*\times Z_p[/math], получаемая в результате пара [math](r,s)[/math] может быть с равной вероятностью любой из пар с отличающимися значениями по модулю [math]p[/math].

Отсюда следует, что вероятность того, что различные ключи [math]k,l[/math] приводят к коллизии, равна вероятности того, что [math]r\equiv s\pmod m[/math] при произвольном выборе отличающихся по модулю [math]p[/math] значений [math]r[/math] и [math]s[/math]. Для данного [math]r[/math] имеется [math]p-1[/math] возможное значение [math]s[/math]. При этом число значений [math]s:s\ne r[/math] и [math]s\equiv r\pmod p[/math], не превышает

.

Вероятность того, что [math]s[/math] приводит к коллизии с [math]r[/math] при приведении по модулю [math]m[/math], не превышает .

Значит, , что означает, что множество хеш-функций является универсальным.

Попарная независимость

Определение:

Пусть — универсальное семейство хеш-функций. Говорят что оно обладает свойством попарной независимости, если при фиксированных для каждой пары ключей количество хеш-функций , для которых и не превышает .

Построение попарно независимого множества хеш-функций

Теорема:

Семейство хеш функций, описанное выше, также является попарно независимым.

Доказательство:

Для функции [math]h_{a,b}[/math] получаем

[math]x \equiv (ak+b)[/math] [math]mod[/math] [math]p[/math] [math]mod[/math] [math]m[/math]

[math]y \equiv (al+b)[/math] [math]mod[/math] [math]p[/math] [math]mod[/math] [math]m[/math]

Выразим отсюда [math]a[/math] и [math]b[/math]. Вычтя из первого уравнения второе, получим:

[math]x - y = a(k - l)[/math] [math]mod[/math] [math]p[/math] [math]mod[/math] [math]m[/math]

Теперь сначала первое домножим на [math]l[/math], и второе на [math]k[/math]. Вычитаем:

[math]lx - ky = b(l - k)[/math] [math]mod[/math] [math]p[/math] [math]mod[/math] [math]m[/math]

Запишем иначе:

[math]x - y \equiv a(k - l)+im[/math] [math]\pmod p[/math]

[math]lx - ky \equiv b(l - k)+jm[/math] [math]\pmod p[/math],

где .

Стоит отметить, что эти равенства мы считаем выполненными, если при данных [math]a, b, x[/math] и [math]y[/math] и каких-либо [math]i[/math] и [math]j[/math] они будут верными (исходя из того как мы их получили).

[math]k \ne l[/math], [math]p[/math] — простое, тогда

[math]\pmod p[/math]

Теперь заметим, что [math]a[/math] принимает [math]p[/math] различных значений, а [math]i[/math] — значений. Понятно, что для заданных [math]x, y[/math] и [math]a[/math] с вероятностью лишь [math] \frac{1}{m} [/math] найдётся [math]i[/math], обращающий первое равенство в тождество; аналогично и со вторым равенством.

Остаётся подытожить наши выкладки.

[math]P( [x \equiv (ak+b)[/math] [math]mod[/math] [math]p[/math] [math]mod[/math] [math]m][/math] [math]\wedge[/math] [math][y \equiv (al+b)[/math] [math]mod[/math] [math]p[/math] [math]mod[/math] [math]m])[/math] [math]=[/math]

[math]=[/math] [math]\pmod p][/math] [math]\wedge[/math] [math]\pmod p])[/math] [math]=[/math]

[math]=[/math] [math]\pmod p)[/math] [math]\cdot[/math] [math]\pmod p)[/math] [math]=[/math]

[math]=[/math]

Переход к третьей строчке объясняется тем, что события, объединённые знаком , независимы.

Источники

Томас Х. Кормен, Чарльз И. Лейзерсон, Рональд Л. Ривест, Клиффорд Штайн Алгоритмы: построение и анализ — 2-е изд. — М.: «Вильямс», 2005. — с. 294. — ISBN 5-8459-0857-4

@@ Строка 63: / Строка 63: @@
 <tex>lx - ky = b(l - k)</tex> <tex>mod</tex> <tex>p</tex> <tex>mod</tex> <tex>m</tex>
-Теперь запишем это иначе:
+Запишем иначе:
 <tex>x - y \equiv a(k - l)+im</tex>  <tex>\pmod p</tex>
@@ Строка 71: / Строка 71: @@
 где <tex dpi = "135"> 0 \le i, j < \lfloor \frac{p}{m} \rfloor </tex>.
-Стоит отметить, что эти равенства мы считаем выполненными, если при данных <tex>a, b, x</tex> и <tex>y</tex> и '''каких-либо''' <tex>i</tex> и <tex>j</tex> они будут верными.
+Стоит отметить, что эти равенства мы считаем выполненными, если при данных <tex>a, b, x</tex> и <tex>y</tex> и '''каких-либо''' <tex>i</tex> и <tex>j</tex> они будут верными (исходя из того как мы их получили).
 <tex>k \ne l</tex>, <tex>p</tex> {{---}} простое, тогда
@@ Строка 79: / Строка 79: @@
 <tex>b \equiv (l - k)^{-1}(lx - ky - jm)</tex>   <tex>\pmod p</tex>
-Теперь заметим, что <tex>a</tex> принимает <tex>p</tex> различных значений, а <tex>i</tex> {{---}} <tex dpi = "130">\lfloor \frac{p}{m} \rfloor</tex> значений. Понятно, что для заданных <tex>x, y</tex> и <tex>a</tex> с вероятностью лишь  <tex dpi = "130"> \frac{1}{m} </tex>  найдётся <tex>i</tex>, обращающий равенство в тождество; аналогично и со вторым равенством.
+Теперь заметим, что <tex>a</tex> принимает <tex>p</tex> различных значений, а <tex>i</tex> {{---}} <tex dpi = "130">\lfloor \frac{p}{m} \rfloor</tex> значений. Понятно, что для заданных <tex>x, y</tex> и <tex>a</tex> с вероятностью лишь  <tex dpi = "130"> \frac{1}{m} </tex>  найдётся <tex>i</tex>, обращающий первое равенство в тождество; аналогично и со вторым равенством.
 Остаётся подытожить наши выкладки.
@@ Строка 87: / Строка 87: @@
 <tex>=</tex>
-<tex>P( [a \equiv (k - l)^{-1}(x - y - im)</tex>   <tex>\pmod p]</tex>  <tex>\wedge</tex>   <tex>[a \equiv (k - l)^{-1}(x - y - im)</tex>   <tex>\pmod p])</tex>
+<tex>P( [a \equiv (k - l)^{-1}(x - y - im)</tex>   <tex>\pmod p]</tex>  <tex>\wedge</tex>   <tex>[b \equiv (l - k)^{-1}(lx - ky - jm)</tex>   <tex>\pmod p])</tex>
 <tex>=</tex>
 <tex>=</tex>
-<tex>P( a \equiv (k - l)^{-1}(x - y - im)</tex>   <tex>\pmod p)</tex>  <tex>\cdot</tex>   <tex>P(a \equiv (k - l)^{-1}(x - y - im)</tex>   <tex>\pmod p)</tex>
+<tex>P( a \equiv (k - l)^{-1}(x - y - im)</tex>   <tex>\pmod p)</tex>  <tex>\cdot</tex>   <tex>P( b \equiv (l - k)^{-1}(lx - ky - jm)</tex>   <tex>\pmod p)</tex>
 <tex>=</tex>
 <tex>=</tex>
-<tex dpi = "130">\frac{1}{m} \cdot \frac{1}{m} = \frac{1}{m^2}</tex>
+<tex dpi = "130">(\frac{1}{m} + o(\frac{1}{m})) \cdot (\frac{1}{m} + o(\frac{1}{m})) = \frac{1}{m^2} + o(\frac{1}{m^2})</tex>
 Переход к третьей строчке объясняется тем, что события, объединённые знаком <tex>\wedge</tex>, независимы.

Универсальное семейство хеш-функций — различия между версиями

Версия 00:17, 11 июня 2013

Содержание

Определение

Построение универсального множества хеш-функций

Попарная независимость

Построение попарно независимого множества хеш-функций

Источники

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты