Графы-экспандеры

Материал из Викиконспекты
Версия от 05:17, 9 января 2016; Kozichuk (обсуждение | вклад) (Источники информации)
Перейти к: навигация, поиск

Граф-экспандер (или расширяющийся граф, англ. expander graph) - в комбинаторике сильно разреженный граф, при этом связность определяется по вершинам, дугам или спектру.

Определение

Граф-экспандер — это конечный ненаправленный мультиграф, в котором любое подмножество вершин, не являясь «слишком большим», имеет «сильную» связность. Различные формализации этих понятий дают различные типы экспандеров: рёберный расширитель, вершинный расширитель, и спектральный расширитель.

Несвязный граф не является экспандером. Любой связный граф является экспандером, однако различные связные графы имеют различные параметры расширителя. Полный граф имеет лучшие параметры расширителя, но имеет наибольшую возможную степень. Неформально говоря, граф является хорошим экспандером, если он имеет низкую степень и высокий параметр расширителя.

Реберное расширение

Рёберное расширение (также изопериметрическое число или константа Чигера) [math]h(G)[/math] графа [math]G[/math] для [math]n[/math] вершин определяется как

[math]h(G) = \min\limits_{0 \lt |S|\leqslant \frac{n}{2}} \frac{|\partial_{\text{out}}(S)|}{|S|}[/math],

где минимум берётся по всем непустым множествам [math]S[/math] не более чем [math]n/2[/math] вершин и [math]\partial(S)[/math]граничные дуги множества [math]S[/math], то есть, множество дуг с единственной вершиной в [math]S[/math].

Вершинное расширение

Вершинное изопериметрическое число [math]h_{out}(G)[/math] (также вершинное раширение) графа [math]G[/math] определяется как

[math]h_{out}(G) = \min\limits_{0 \lt |S|\leqslant \frac{n}{2}} \frac{|\partial_{\text{out}}(S)|}{|S|}[/math],

где [math]\partial_{\text{out}}(S)[/math]внешняя граница [math]S[/math], то есть множество вершин из [math]V(G)\setminus S[/math], имеющих как минимум одного соседа в [math]S[/math]. В варианте этого определения (называемом уникальным соседним расширением) [math]\partial_{\text{out}}(S)[/math] заменяется на множество вершин из [math]V[/math] с точностью одним соседом из [math]S[/math].

Вершинное изопериметрическое число [math]h_{in}(G)[/math] графа [math]G[/math] определяется как

[math]h_{in}(G) = \min\limits_{0 \lt |S|\leqslant \frac{n}{2}} \frac{|\partial_{\text{in}}(S)|}{|S|}[/math],


где [math]\partial_{in}(S)[/math]внутренняя граница [math]S[/math], то есть множество вершин [math]S[/math], имеющих как минимум одного соседа в [math]V(G)\setminus S[/math].

Спектральное расширение

Если [math]G[/math] является d-регулярным, возможно определение в терминах линейной алгебры на основе собственных значений матрицы смежности [math]A = A(G)[/math] графа [math]G[/math], где [math]A_{ij}[/math] — число дуг между вершинами [math]i[/math] и [math]j[/math]. Поскольку [math]A[/math] является симметричной, согласно спектральной теореме, [math]A[/math] имеет [math]n[/math] действительных собственных значений [math]\lambda_1 \ge \lambda_2 \ge \cdots \ge \lambda_{n}[/math]. Известно, что эти значения лежат в промежутке [math][−d, d][/math]. Граф регулярен тогда и только тогда, когда вектор [math]u\in \mathbb {R} ^{n} с u_{i}=1[/math] для всех [math]i = 1, …, n[/math] является собственным вектором матрицы [math]A[/math], а его собственное число будет постоянной степенью графа. Таким образом, мы имеем [math]Au = du[/math], и [math]u[/math] — собственный вектор матрицы [math]A[/math] с собственными значениями [math]λ1 = d[/math], где [math]d[/math] — степень вершин графа [math]G[/math]. Спектральный зазор графа [math]G[/math] определяется как [math]d−λ2[/math] и является мерилом спектрального расширения графа [math]G[/math].

Известно, что [math]\lambda_n = −d[/math] тогда и только тогда, когда [math]G[/math] — двудольный. Во многих случаях, например в лемме о перемешивании, необходимо ограничить снизу не только зазор между [math]\lambda_1[/math] и [math]\lambda_2[/math], но и зазор между [math]\lambda_1[/math] и вторым максимальным по модулю собственным значением:

[math]\lambda=\max\{|\lambda_2|, |\lambda_{n}|\}[/math]

Поскольку это собственное значение соответствует некоторому собственному вектору, ортогональному [math]u[/math], его можно определить, используя отношение Рэлея: [math]\lambda=\max_{0\neq v\perp u} \frac{\|Av\|_2}{\|v\|_2},[/math] gde [math]\|v\|_2=\left(\sum_{i=1}^n v_i^2\right)^{1/2}[/math] — евклидова норма вектора [math]v\in \mathbb {R} ^{n}[/math].

Нормализованная версия этого определения также широко используется и более удобна для получения определённых результатов. В таком случае рассматривается матрица [math]{\tfrac {1}{d}}A[/math], являющаяся матрицей переходов графа G. Все её собственные значения лежат между [math]−1[/math] и [math]1[/math]. Если граф не регулярен, спектр графа может быть определён аналогичным образом, используя собственные значения матрицы Кирхгофа. Для направленного графа используются сингулярные значения матрицы сопряжения A, которые равны квадратным корням из собственных значений симметричной матрицы [math]A^TA[/math].

Конструирование

Существуют три основные стратегии создания семейств графов расширений[6]. Первая стратегия — алгебраическая и теоретико-групповая, вторая — аналитическая, использующая аддитивную комбинаторику, и третья — комбинаторная, использующая зигзаг-произведение и связанные комбинаторные произведения.

Маргулис-Габбер-Галил

Алгебраическое конструирование, основанное на графах Кэли, известно для различных вариантов экспандеров. Следующее конструирование принадлежит Маргулису и было проанализировано Габбером (Gabber) и Галилом (Galil). Для любого натурального [math]n[/math] строим граф, [math]G_{n}[/math] со множеством вершин [math]\mathbb Z _{n}\times \mathbb {Z} _{n}[/math], где [math]\mathbb {Z} _{n}=\mathbb Z /n \mathbb Z[/math] . Для любой вершины [math](x,y)\in \mathbb {Z} _{n}\times \mathbb {Z} _{n}[/math], её восемь соседей будут

[math](x \pm 2y,y), (x \pm (2y+1),y), (x,y \pm 2x), (x,y \pm (2x+1)).[/math]

Выполняется следующая теорема:

Теорема:
Для всех [math]n[/math] граф [math]Gn[/math] второе по величине собственное число [math]\lambda(G)\leq 5 \sqrt{2}[/math].

Граф Рамануджана

[math]d[/math]-регулярный граф называется графом Рамануджана, если его второе по модулю собственное число не превосходит [math]2{\sqrt {d-1}}[/math]. Любоцкий, Сарнак, Филлипс и Маргулис указали явную конструкцию графов Кэли, являющихся графами Рамануджана. Опишем эту конструкцию. Пусть [math]p[/math] и [math]q[/math] простые числа, [math]p = 1[/math] [math]mod[/math] [math]4[/math] и [math]q = 1[/math] [math]mod[/math] [math]4[/math]. В качестве группы [math]G[/math] возьмём [math]PGL(2, \mathbb Z/q{\mathbb Z})[/math], т.е. невырожденные матрицы 2 × 2 над полем вычетов по модулю [math]q[/math], профакторизованные по отношению пропорциональности (с обычной операцией матричного умножения). Далее мы зададим в этой группе симметричное множество [math]S[/math]. Выберем такое целое [math]i[/math], что [math]i^2 = −1[/math] [math]mod[/math] [math]q[/math]. Можно доказать, что тогда имеется ровно [math](p + 1)[/math] целочисленное решение уравнения

[math]a_0^2 + a_1^2 + a_3^2 = p[/math]

такое, что [math]a_0[/math] положительно и нечётно, а [math]a_1[/math], [math]a_2[/math], [math]a_3[/math] чётны. Каждой такой четвёрке сопоставим матрицу

[math]A = \begin{pmatrix} a_0 + ia_1 & a_2 + ia_3\\ -a_2 + ia_3 & a_0 - ia_1 \end{pmatrix}[/math]

Эти матрицы образуют множество S. Нетрудно понять, что граф Кэли [math](G, S)[/math] состоит из [math]\Theta(q^3)[/math] вершин, и степень каждой вершины равна [math](p + 1)[/math]. Свойства данного графа зависят от соотношения [math]p[/math] и [math]q[/math]. Рассмотрим случай, когда p является квадратичным вычетом по модулю [math]q[/math]. Тогда полученный граф Кэли состоит из двух связных компонент (поскольку все матрицы из [math]S[/math] лежат в подгруппе [math]G[/math] индекса два — подгруппе матриц, определитель которых является квадратичным вычетом). Обозначим [math]X^{p,q}[/math] связную компоненту полученного графа. Можно доказать, что у [math]X^{p,q}[/math] второе по абсолютной величине собственное число не превосходит [math]2{\sqrt{p}}[/math], т.е. мы получили граф Рамануджана.

Примеры применения экспандеров

Коды, исправляющие ошибки

С помощью расширяющего графа можно посторить линейный код, позволяющий исправлять ошибки в доле [math]\delta = 1/(2000d)[/math] битов. Чтобы задать линейный код с длиной кодового слова n, достаточно описать его проверочную матрицу [math]H[/math] [math]([/math]слово [math]x \in \{0, 1\}^n[/math] является кодовым словом если и только если [math]Hx^t = 0)[/math]. Другими словами, нужно задать систему линейных уравнений для переменных [math]x_1, . . . , x_n;[/math] решения этой системы и будут кодовыми словами.

Увеличение вероятности успеха в алгоритмах с датчиком случайных чисел

Определение:
Язык [math]L[/math] принадлежит сложностному классу [math]RP[/math], если существует полиномиальный алгоритм [math]A[/math] такой что

1. для [math]x \in L[/math] для всех [math]r \in \{0, 1\}^{poly(n)}[/math] [math]A(x, r) = 1[/math]

2. для [math]x \notin L[/math] не более чем для 1/2000 всех [math]r \in \{0, 1\}^{poly(n)}[/math] может выполняться [math]A(x, r) = 1[/math]


Покажем, что для любого [math]\epsilon \gt 0[/math] полиномиальный вероятностный алгоритм A можно модифицировать таким образом, чтобы вероятность ошибки уменьшилась до [math]\epsilon[/math], а число используемых случайных битов не изменится.

Пусть исходный алгоритм использует [math]k = k(n)[/math] случайных битов для вычислений на входах длины [math]n[/math]. Зафиксируем [math](2^k, 2^k, d)[/math] - экспандер [math]G[/math], где [math]d \gt 1/\epsilon[/math]. Новый алгоритм действует следующим образом: выбирается случайная вершина [math]v[/math] из левой доли графа (для этого требуется [math]k[/math] случайных битов); затем исходный алгоритм [math]A[/math] последовательно запускается на всех [math]d[/math] наборах случайных битов, соответствующих соседям вершины [math]v[/math]. Если все полученные ответы равны [math]1[/math], новый алгоритм также возвращает единицу; в противном случае возвращается ноль. Покажем, что у нового алгоритма вероятность ошибки не превосходит [math]1/d[/math]. В самом деле, обозначим [math]B = B(x)[/math] множество таких вершин [math]w[/math] из правой доли графа, которые соответствуют неверному ответу старого алгоритма на входе [math]x[/math]; аналогично, обозначим [math]S = S(x)[/math] множество таких вершин v из левой доли графа, которые для которых новый алгоритм даёт неверный ответ на входе [math]x[/math]. Очевидно, [math]S[/math] состоит из вершин, все соседи которых лежат в B. Предположим, что [math]S[/math] содержит не менее [math]n/(1000d)[/math] вершин. Выберем среди них ровно [math]n/(1000d)[/math] вершин и назовём это множество [math]S'[/math]. По свойству экспандера, имеем

[math]|\Gamma(S')| \geqslant \frac{7}{8}d\frac{n}{1000d}=7n/8000 \gt n/2000[/math]

Это противоречит тому, что все соседи [math]S'[/math] лежат в [math]B[/math]. В данном случае нам нужна явная в более сильном (чем в первом примере) смысле конструкция экспандера. Размер графа экспоненциално растёт с увеличенем [math]k[/math], и нам необходим алгоритм, который по заданному номеру вершины [math]v[/math] (из левой доли графа) за время [math]poly(k)[/math] находит список номеров всех соседей этой вершины (в правой доле графа).

Хранение множества со сверхбыстрым запросом элементов

Мы организуем хранение m-элементного множества [math]S \subset \{1, . . . , n\}[/math] в виде описания [math]X[/math], состоящего из [math]O(m log n)[/math] битов. При этом проверка принадлежности [math]a \in S[/math] будет производиться чрезвычайно быстро. А именно, мы построим такой вероятностный алгоритм, который по любому входу [math]a[/math] запрашивает из [math]X[/math] один бит; если этот бит оказывается равным единице, то алгоритм отвечает, что [math]a[/math] является элементом [math]S[/math]; в противном случае алгоритм говорит, что [math]a[/math] множеству не принадлежит. При этом для каждого [math]a \in \{1, . . . , n\}[/math] алгоритм ошибается с вероятностью не более [math]1/3[/math].

Чтобы построить нужное нам хранилище [math]X[/math], мы сначала зафиксируем некоторый экспандер, у которого левая доля [math]L[/math] состоит из [math]n[/math] вершин, правая [math]R[/math] из [math]k = O(m log n)[/math] вершин, степень всех вершин левой доли одинакова и равна некоторому [math]d[/math], и для каждого [math]A \subset L[/math] размера не более [math]2m[/math]

[math]|\Gamma(A)| \geqslant \frac{7}{8}d|A|[/math]

[math]X[/math] будет состоять в разметке вершин правой доли нулями и единицами. Эту разметку нужно выбрать таким образом, чтобы у каждой вершины из [math]S[/math] не менее [math]2/3[/math] соседей были помечены единицей, а у каждой вершины не из [math]S[/math] не менее [math]2/3[/math] соседей были помечены нулями.[math]X[/math] будет состоять в разметке вершин правой доли нулями и единицами. Эту разметку нужно выбрать таким образом, чтобы у каждой вершины из [math]S[/math] не менее [math]2/3[/math] соседей были помечены единицей, а у каждой вершины не из [math]S[/math] не менее [math]2/3[/math] соседей были помечены нулями.

Остаётся объяснить, как построить нужную нам разметку правой доли графа. Будем строить её последовательными приближениями. Сначала пометим всех соседей всех вершин из [math]S[/math] единицами, а все остальные вершины – нулями. На данной разметке наш алгоритм с вероятностью [math]1[/math] возвращает правильный ответ для всех [math]a \in S[/math]. Однако для [math]a[/math] не из [math]S[/math] проверочный алгоритм может работать неверно. Обозначим T множество всех таких вершин вне [math]S[/math], у которых более [math]d/3[/math] соседей помечены единицей. Поменяем разметку: пометим всех соседей [math]T[/math] нулём. Теперь разметка может стать плохой для части вершин из [math]S[/math]. Обозначим [math]S'[/math] множество всех таких вершин из [math]S[/math], у которых более [math]d/3[/math] соседей помечены нулями. Далее, поменяем разметку у всех соседей [math]S'[/math] на единицы. После этого может вновь возникнуть множество ‘неправильных’ вершин вне [math]S[/math], и т.д.

Чтобы доказать, что данный процесс в конце концов сойдётся, нужно показать, что на каждом шаге число ‘проблемных’ вершин уменьшается в константу раз. Поскольку все шаги аналогичны, достаточно разобрать самый первый: докажем, что [math]T[/math] в константу раз меньше, чем [math]S[/math]. Мы воспользуемся тем, что для [math]S \cup T[/math] выполнено свойство расширения:

[math](7/8)d(|S|+|T|) \leqslant |\Gamma(S \cup T)| \leqslant d|S| + (2/3)d|T|[/math]

Откуда получаем [math]|T| \leqslant 3/5|S|[/math].

Приложения и полезные свойства

Первоначально интерес к экспандерам возник с целью построения устойчивой сети (телефонов или компьютеров) — число дуг графов расширения с ограниченным значением регулярности растет линейно по отношению к числу вершин.

Экспандеры нашли широкое применение в теории вычислительных машин и систем, для построения алгоритмов, в корректирующих кодах, экстракторах, генераторах псевдослучайных чисел, сетях сортировки и компьютерных сетях. Они также используются для доказательства многих важных результатов в теории вычислительной сложности, таких как [math]SL=L[/math] и Теорема PCP. В криптографии экспандеры используются для создания хеш-функций.

Ниже приведены некоторые свойства экспандеров, считающиеся полезными во многих областях.

Лемма о перемешивании

Лемма о перемешивании утверждает, что для любых двух подмножеств вершин [math]S,T\subseteq V[/math] число рёбер между [math]S[/math] и [math]T[/math] примерно равно числу рёбер в случайном [math]d[/math]-регулярном графе. Приближение тем лучше, чем меньше [math]\lambda =\max\{|\lambda _{2}|[/math],[math]|\lambda _{n}|\}[/math]. В случайном [math]d[/math]-регулярном графе, также как и в случайном графе Эрдёша — Реньи с вероятностью [math]{\tfrac {d}{n}}[/math] выбора ребра, ожидается [math]{\tfrac {d}{n}}\cdot |S|\cdot |T|[/math] рёбер между [math]S[/math] и [math]T[/math].

Более формально, пусть [math]E(S, T)[/math] обозначает число рёбер между [math]S[/math] и [math]T[/math]. Если эти два множества пересекаются, дуги в пересечении считаются дважды, так что

[math]E(S,T)=2|E(G[S\cap T])|+E(S\setminus T,T)+E(S,T\setminus S)[/math]. Лемма о перемешивании утверждает, что

[math]\left|E(S,T)-{\frac {d\cdot |S|\cdot |T|}{n}}\right|\leq d\lambda {\sqrt {|S|\cdot |T|}}[/math], где [math]\lambda [/math] — абсолютное значение нормализованного второго по величине собственного значения.

Недавно Билу (Bilu) и Линайл (Linial) показали, что обратное тоже верно, то есть, при условии выполнения неравенства из леммы второе по величине собственное значение равно [math]O(d\lambda \cdot (1+\log(1/\lambda )))[/math].

Блуждания по экспандеру

Согласно границе Чернова, если выбирать много независимых случайных значений из интервала [math][−1, 1][/math], с большой степенью вероятности среднее выбранных значений будет близко к математическому ожиданию случайной переменной. Лемма о блуждании по экспандеру, согласно статьям Аджтари, Комлоша и Семереди и Гилмана, утверждает, что то же самое верно и для блужданий по экспандеру. Это полезно в теории дерандомизации, поскольку блуждание по экспандеру использует много меньше случайных бит, чем случайная независимая выборка.

Источники информации

  • Экспандер (теория графов)
  • [S. Hoory, N. Linial, A. Wigderson. Expander graphs and their applications. Bulletin of the AMS, vol. 43, Number 4, Oct. 2006, pp.439 561.]
  • [ H. Buhrman, P.B. Miltersen, J. Radhakrishnan, S. Venkatesh. Are Bitvectors optimal? SIAM J. Comput., 31(6):1723–1744, 2002.]