Изменения

Перейти к: навигация, поиск

Фильтр Блума

198 байт убрано, 14:40, 1 мая 2012
Минимизация вероятности ложноположительного срабатывания
== Минимизация вероятности ложноположительного срабатывания ==
Пусть размер битового массива <tex> m </tex>, и заданы <tex> k </tex> [[Хеширование|хеш-функций]], причем все [[Хеширование|хеш-функции]] являются [[Независимые случайные величины|независимыми случайными величинами]]. Тогда вероятность, что в <tex> j </tex>-ый бит не будет записана единица <tex> i </tex>-ой [[Хеширование|хеш-функцией]] при вставке очередного элемента, равна:
<tex dpi = "150">p(h_i(x) \neq j) = 1 - \frac {1}{m} </tex>
Так как для упрощения анализа мы предполагаем, что [[Хеширование|хеш-функции]] являются [[Независимые случайные величины|независимыми случайными величинами]], то вероятность, что <tex> j </tex>-ый бит останется нулевым после добавления очередного элемента, равна:
<tex dpi = "150">p(h_i(x) \neq j</tex> для <tex dpi = "150"> \forall i \in \big\{ 1 \dots k \big\}) = (1 - \frac {1}{m})^k </tex>
<tex dpi = "150">(1 - e^{-kn/m})^k</tex>
Для фиксированных <tex> m </tex> и <tex> n </tex>, оптимальное число [[Хеширование|хеш-функций]] <tex> k </tex>, минимизирующих вероятность ложноположительного срабатывания, равно:
<tex dpi = "150">k = \ln 2 \frac {m}{n} \approx 0.6931 \frac {m}{n}</tex>
403
правки

Навигация