Случайные графы — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
м (Существование треугольников в случайном графе)
м (rollbackEdits.php mass rollback)
 
(не показано 7 промежуточных версий 4 участников)
Строка 1: Строка 1:
 
+
{{Определение
 +
|neat = 1
 +
|definition= '''Модель Эрдёша-Реньи''' (англ. ''Erdős–Rényi model'') {{---}} модель генерации случайных графов, в которой все графы с фиксированным набором вершин и фиксированным набором рёбер одинаково вероятны. Существует два тесно связанных варианта модели: ''биномиальная'' и ''равномерная''.
 +
}}
 
{{Определение  
 
{{Определение  
 
|neat = 1
 
|neat = 1
Строка 88: Строка 91:
 
{{Теорема  
 
{{Теорема  
 
|statement=<tex>p = \dfrac{c\ln n}{n}</tex>, тогда при <tex>c < 1</tex> граф а.п.н связен, при <tex>c > 1</tex> граф а.п.н не связен.
 
|statement=<tex>p = \dfrac{c\ln n}{n}</tex>, тогда при <tex>c < 1</tex> граф а.п.н связен, при <tex>c > 1</tex> граф а.п.н не связен.
 +
}}
 +
 +
== Распределение степеней вершин ==
 +
{{Определение
 +
|id=def_degree_dist
 +
|definition='''Распределение степеней вершин случайного графа''' - это функция <tex>P(x)</tex>, определённая на <tex>\mathbb{R}</tex> как <tex>P(\xi=x)</tex>, то есть выражающая вероятность того, что вершина <tex>\xi</tex> имеет степень <tex>x</tex>. Другими словами, распределение степеней <tex>P(k)</tex> графа определяется как доля узлов, имеющих степень <tex>k</tex>.
 +
}}
 +
{{Пример
 +
|id=example_1
 +
|example=Если есть в общей сложности <tex>n</tex> узлов в графе и из них <tex>n_k</tex> имеют степень <tex>k</tex>, то <tex>P(k) = \frac{n_k}{n}</tex>. Другими словами, <tex>P(k)</tex> равно вероятности того, что отдельно взятая вершина имеет степень <tex>k</tex>.
 +
}}
 +
 +
{{Утверждение
 +
|statement=Дан случайный граф <tex>G(n, p)</tex> в биноминальной модели. Тогда для него распределение степеней вершин
 +
<p>
 +
<tex>
 +
\begin{equation*}
 +
P(k) = {n-1 \choose k} p^k(1-p)^{n-1-k}
 +
\end{equation*}
 +
</tex>
 +
</p>
 +
|proof=Действительно, если вероятность появления ребра <tex>p</tex>, то вероятность появления ровно <tex>k</tex> рёбер у вершины равна <tex>p^k(1-p)^{n-1-k}</tex>([[схема Бернулли]]). Таких наборов рёбер у одной вершины всего <tex>{n-1 \choose k}</tex>, откуда получаем искомое распределение.
 +
}}
 +
 +
== Распределение максимальной степени вершин ==
 +
{{Определение
 +
|id=def_max_degree_dist
 +
|definition='''Распределение максимальной степени вершин случайного графа''' - это функция <tex>Q(x)</tex>, определённая на <tex>\mathbb{R}</tex> как <tex>P(\xi=x)</tex>, то есть выражающая вероятность того, что максимальная степень вершины <tex>\xi</tex> равна <tex>x</tex>.
 +
}}
 +
{{Утверждение
 +
|statement=<tex>Q(k) = P(k) \cdot (1 - \sum_{x=k+1}^{n} P(x))</tex>
 +
|proof=Будем выводить формулу для <tex>Q(k)</tex> через распределение степеней вершин <tex>P(k)</tex>.
 +
 +
Максимальная степень вершины равна <tex>k</tex> тогда и только тогда, когда не существует вершины степенью больше <tex>k</tex>. Таким образом, нужно посчитать вероятность события <tex>A: \exists v\in G: \; deg(v) = k \;\&\; !\exists v\in G: \; deg(v) > x</tex>.
 +
 +
<tex>P(\exists v: \; deg(v) = k) = P(k)</tex>
 +
 +
<tex>P(k)</tex> - вероятность того, что вершина имеет степень <tex>k</tex>. Тогда вероятность того, что имеет одну из степеней <tex>1...k</tex> - <tex>\sum_{x=1}^{k}P(x)</tex>. Нам нужно обратное событие, при наступлении которого вершина имеет степень больше <tex>k</tex>. Его вероятность равна <tex>1 - \sum_{x=1}^{k} P(x)</tex>.
 +
 +
<tex>P(!\exists v: \; deg(v) > k) = 1 - \sum_{x=1}^{k} P(x)</tex>
 +
 +
События независимы, поэтому получаем: <tex>Q(k) = P(k) \cdot (1 - \sum_{x=1}^{k} P(x))</tex>
 
}}
 
}}
  
Строка 116: Строка 161:
 
|statement=Пусть рассматривается свойство графа иметь диаметр два. Тогда <tex>p = \sqrt{2} \sqrt{\dfrac{\ln n}{n}}</tex> {{---}} пороговая функция.
 
|statement=Пусть рассматривается свойство графа иметь диаметр два. Тогда <tex>p = \sqrt{2} \sqrt{\dfrac{\ln n}{n}}</tex> {{---}} пороговая функция.
 
|proof=
 
|proof=
Назовем вершины <tex>u</tex> и <tex>v</tex> плохой парой, если кратчайшее расстояние между <tex>u</tex> и <tex>v</tex> меньше двух. <tex>B_{i, j}</tex> {{---}} индикаторная величина, равная <tex>1</tex>, если <tex>i</tex> и <tex>j</tex> являются плохой парой.
+
Назовем вершины <tex>u</tex> и <tex>v</tex> плохой парой, если кратчайшее расстояние между <tex>u</tex> и <tex>v</tex> больше двух. <tex>B_{i, j}</tex> {{---}} индикаторная величина, равная <tex>1</tex>, если <tex>i</tex> и <tex>j</tex> являются плохой парой.
 
<tex>N_z = \sum\limits_{i, j} B_{i,j}</tex>
 
<tex>N_z = \sum\limits_{i, j} B_{i,j}</tex>
 
<tex>P(B_{i, j}) = (1 - p)(1 - p^2)^{n - 2}</tex>
 
<tex>P(B_{i, j}) = (1 - p)(1 - p^2)^{n - 2}</tex>
Строка 153: Строка 198:
  
  
[[Категория: Дискретная математика и алгоритмы]]
+
[[Категория: Дискретная математика и алгоритмы]][[Категория: Теория графов]]

Текущая версия на 19:08, 4 сентября 2022

Определение:
Модель Эрдёша-Реньи (англ. Erdős–Rényi model) — модель генерации случайных графов, в которой все графы с фиксированным набором вершин и фиксированным набором рёбер одинаково вероятны. Существует два тесно связанных варианта модели: биномиальная и равномерная.


Определение:
Биномиальная модель случайного графа (англ. binomial random graph model) [math]G(n, p)[/math] — модель, в которой каждое ребро входит в случайный граф независимо от остальных ребер с вероятностью [math]p[/math]. [math]G(n, p) = (\Omega_n, F_n, P_{n, p})[/math] вероятностное пространство . [math]|\Omega_n| = 2^{C^2_n}[/math], [math]P_{n, p}(G) = p^m(1 - p)^{C^2_n - m}[/math], где [math]m[/math] — число ребер в графе.


Определение:
Равномерная модель случайного графа (англ. uniform random graph model) [math]G(n, m)[/math] — модель, в которой все графы с [math]m[/math] ребрами равновероятны. [math]G(n, m) = (\Omega_n, F_n, P_{n, m})[/math] — вероятностное пространство. [math]|\Omega_n| = m[/math], [math]P_{n, m}(G) = \dfrac{1}{C^m_n}[/math].


Определение:
Свойство [math]A[/math] асимптотически почти наверное истинно, если [math]\lim\limits_{n \rightarrow \infty} p(n) = 1[/math], где [math]p(n)[/math] — вероятность графа [math]G(n, p)[/math] обладать этим свойством.


Определение:
Свойство [math]A[/math] асимптотически почти наверное ложно, если [math]\lim\limits_{n \rightarrow \infty} p(n) = 0[/math], где [math]p(n)[/math] — вероятность графа [math]G(n, p)[/math] обладать этим свойством.


Существование треугольников в случайном графе

Теорема:
Если [math]p(n) = o(\dfrac{1}{n})[/math], то [math]G(n, p)[/math] асимптотически почти наверное (далее а.п.н) не содержит треугольников.
Доказательство:
[math]\triangleright[/math]

Пусть [math]T[/math] — число треугольников в графе, [math]T_{i,j,k}[/math] — индикаторная случайная величина, равная [math]1[/math], если вершины [math]i[/math], [math]j[/math] и [math]k[/math] образуют треугольник.

Воспользуемся неравенством Маркова:

[math]P(T \gt 0) = P(T \geqslant 1) \leqslant E[T] = \sum\limits_{i, j, k}T_{i, j, k}p^3 = C^3_np^3 \sim \dfrac{n^3p^3}{6} \rightarrow 0[/math], при [math]n \rightarrow \infty[/math].
[math]\triangleleft[/math]
Теорема:
Если [math]p(n) = \omega(\dfrac{1}{n})[/math], то [math]G(n, p)[/math] а.п.н содержит треугольник.
Доказательство:
[math]\triangleright[/math]

Пусть [math]T[/math] — число треугольников в графе, [math]T_{i,j,k}[/math] — индикаторная случайная величина, равная [math]1[/math], если вершины [math]i[/math], [math]j[/math] и [math]k[/math] образуют треугольник.

Воспользуемся неравенством Чебышева:

[math]P(T = 0) = P(T \leqslant 0) = P(E[T] - T \geqslant E[T]) \leqslant P(|E[T] - T| \geqslant E[T]) \leqslant \dfrac{D[T]}{(E[T])^2}[/math].

Найдем [math]E[T^2][/math]:


[math]E[T^2] = E[(\sum\limits_{i, j, k}T_{i, j, k})^2]= E[\sum\limits_{i, j, k}T_{i, j, k}^2] + E[\sum\limits_{i, j, k, a, b, c}T_{i, j, k}T_{a, b, c}] =[/math]

[math]= E[T] + (C^3_nC^3_{n - 3} + C^3_nC^2_{n - 3})p^6 + 3C^3_n(n - 3)p^5 \sim \dfrac{n^3p^3}{6} + (\dfrac{n^6}{36} + \dfrac{n^5}{4})p^6 + \dfrac{n^4}{2}p^5 \sim \dfrac{n^3p^3}{6} + \dfrac{n^6p^6}{36} + \dfrac{n^4p^5}{2} \sim \dfrac{n^3p^3}{6} + \dfrac{n^6p^6}{36}[/math]

[math]D[T] = E[T^2] - (E[T])^2 \sim \dfrac{n^3p^3}{6} + \dfrac{n^6p^6}{36} - \dfrac{n^6p^6}{36} = \dfrac{n^3p^3}{6}[/math]

[math]P(T = 0) \leqslant \dfrac{\dfrac{n^3p^3}{6}}{\dfrac{n^6p^6}{36}} = \dfrac{6}{p^3n^3} \rightarrow 0[/math], при [math]n \rightarrow \infty[/math]
[math]\triangleleft[/math]

Связность графа

Лемма:
Если [math]c \geqslant 3[/math], [math]n \geqslant 100[/math], [math]p = \dfrac{c\ln n}{n}[/math]. Тогда [math]P(G - связен) \rightarrow 1[/math].
Доказательство:
[math]\triangleright[/math]

Пусть [math]X[/math] — индикаторная величина, равная нулю, если [math]G[/math] связен, и [math]k[/math], если [math]G[/math] содержит [math]k[/math] компонент связности.

[math]X_i[/math] — число компонент связности размера [math]i[/math].

[math]X_{a_1,a_2, \dots , a_i} = 1[/math], если [math]a_1,a_2, \dots , a_i[/math] — компонента связности.

[math]X_i = \sum\limits_{a_1,a_2, \dots , a_i} X_{a_1,a_2, \dots , a_i}[/math]

[math]E[X_i] = \sum\limits_{a_1,a_2, \dots , a_i} E[X_{a_1,a_2, \dots , a_i}] = C_n^iEX_{1, 2, \dots, i} = C_n^i P(1, 2, \dots, i - комп.связности) \leqslant C_n^i (1 - p)^{i(n - i)}[/math].

[math]E[X] \sum\limits_{i = 1}^{n - 1} E[X_i] \leqslant \sum\limits_{i = 1}^{n - 1} C_n^i(1 - p)^{i(n - i)}[/math]

Последняя сумма симметрична (слагаемые при [math]i = k[/math] и [math]i = n - k[/math] равны), кроме того слагаемое при [math]i = 1[/math] — наибольшее (для доказательства достаточно рассмотреть отношения слагаемых при [math]i \leqslant \dfrac{n}{8}[/math] и [math]\dfrac{n}{8} \lt i \leqslant \dfrac{n}{2}[/math]).

Оценим сверху первое слагаемое [math]n(1 - p)^{n - 1}[/math]:

[math]n(1 - p)^{n - 1} \leqslant ne^{-p(n - 1)} \leqslant ne^{\frac{-3 (n - 1) \ln n}{n}}[/math]

[math]n \geqslant 100[/math], поэтому [math]\dfrac{n - 1}{n} \gt 0.9[/math].

[math]ne^{\frac{-3 (n - 1) \ln n}{n}} \lt e^{-2.7\ln n} = \dfrac{1}{n^{2.7}}[/math]

[math]\sum\limits_{i = 1}^{n - 1} C_n^i(1 - p)^{i(n - i)} \leqslant \sum\limits_{i = 1}^{n - 1}\dfrac{1}{n^{2.7}} \lt \dfrac{n}{n^{2.7}} \rightarrow 0[/math], при [math]n \rightarrow \infty[/math]
[math]\triangleleft[/math]
Лемма:
Если [math]c \geqslant 3[/math], [math]n \geqslant 100[/math], [math]p = \dfrac{c\ln n}{n}[/math]. Тогда [math]P(G - связен) \gt 1 - \dfrac{1}{n}[/math].
Теорема:
[math]p = \dfrac{c\ln n}{n}[/math], тогда при [math]c \lt 1[/math] граф а.п.н связен, при [math]c \gt 1[/math] граф а.п.н не связен.

Распределение степеней вершин

Определение:
Распределение степеней вершин случайного графа - это функция [math]P(x)[/math], определённая на [math]\mathbb{R}[/math] как [math]P(\xi=x)[/math], то есть выражающая вероятность того, что вершина [math]\xi[/math] имеет степень [math]x[/math]. Другими словами, распределение степеней [math]P(k)[/math] графа определяется как доля узлов, имеющих степень [math]k[/math].


Пример:
Если есть в общей сложности [math]n[/math] узлов в графе и из них [math]n_k[/math] имеют степень [math]k[/math], то [math]P(k) = \frac{n_k}{n}[/math]. Другими словами, [math]P(k)[/math] равно вероятности того, что отдельно взятая вершина имеет степень [math]k[/math].


Утверждение:
Дан случайный граф [math]G(n, p)[/math] в биноминальной модели. Тогда для него распределение степеней вершин

[math] \begin{equation*} P(k) = {n-1 \choose k} p^k(1-p)^{n-1-k} \end{equation*} [/math]

[math]\triangleright[/math]
Действительно, если вероятность появления ребра [math]p[/math], то вероятность появления ровно [math]k[/math] рёбер у вершины равна [math]p^k(1-p)^{n-1-k}[/math](схема Бернулли). Таких наборов рёбер у одной вершины всего [math]{n-1 \choose k}[/math], откуда получаем искомое распределение.
[math]\triangleleft[/math]

Распределение максимальной степени вершин

Определение:
Распределение максимальной степени вершин случайного графа - это функция [math]Q(x)[/math], определённая на [math]\mathbb{R}[/math] как [math]P(\xi=x)[/math], то есть выражающая вероятность того, что максимальная степень вершины [math]\xi[/math] равна [math]x[/math].
Утверждение:
[math]Q(k) = P(k) \cdot (1 - \sum_{x=k+1}^{n} P(x))[/math]
[math]\triangleright[/math]

Будем выводить формулу для [math]Q(k)[/math] через распределение степеней вершин [math]P(k)[/math].

Максимальная степень вершины равна [math]k[/math] тогда и только тогда, когда не существует вершины степенью больше [math]k[/math]. Таким образом, нужно посчитать вероятность события [math]A: \exists v\in G: \; deg(v) = k \;\&\; !\exists v\in G: \; deg(v) \gt x[/math].

[math]P(\exists v: \; deg(v) = k) = P(k)[/math]

[math]P(k)[/math] - вероятность того, что вершина имеет степень [math]k[/math]. Тогда вероятность того, что имеет одну из степеней [math]1...k[/math] - [math]\sum_{x=1}^{k}P(x)[/math]. Нам нужно обратное событие, при наступлении которого вершина имеет степень больше [math]k[/math]. Его вероятность равна [math]1 - \sum_{x=1}^{k} P(x)[/math].

[math]P(!\exists v: \; deg(v) \gt k) = 1 - \sum_{x=1}^{k} P(x)[/math]

События независимы, поэтому получаем: [math]Q(k) = P(k) \cdot (1 - \sum_{x=1}^{k} P(x))[/math]
[math]\triangleleft[/math]

Теоремы о связи вероятности и матожидания

Теорема:
Пусть [math]N_z[/math] — число объектов в графе [math]G(n, p)[/math]. [math]A = \{G | N_z(G) \gt 0 \}[/math] — свойство. Тогда, если [math]E[N_z] \rightarrow 0[/math], при [math]n \rightarrow \infty[/math], то [math]A[/math] а.п.н ложно.
Доказательство:
[math]\triangleright[/math]

Воспользуемся неравенством Маркова:

[math]P(N_z \gt 0) = P(N_z \geqslant 1) \leqslant E[N_z] \rightarrow 0[/math], при [math]n \rightarrow \infty[/math].
[math]\triangleleft[/math]
Теорема:
Пусть [math]N_z[/math] — число объектов в графе [math]G(n, p)[/math]. [math]A = \{G | N_z(G) \gt 0 \}[/math] — свойство. Тогда, если [math]E[N_z] \rightarrow \infty[/math], при [math]n \rightarrow \infty[/math], и [math]E[N_z^2] \leqslant (E[N_z])^2(1 + o(1))[/math] то [math]A[/math] а.п.н истинно.
Доказательство:
[math]\triangleright[/math]

Воспользуемся неравенством Чебышева:

[math]P(N_z = 0) = P(N_z \leqslant 0) = P(E[N_z] - N_z \geqslant E[N_z]) \leqslant P(|E[N_z] - N_z| \geqslant E[N_z]) \leqslant \dfrac{D[N_z]}{(E[N_z])^2} \rightarrow 0[/math], при [math]n \rightarrow \infty[/math].
[math]\triangleleft[/math]

Графы, имеющие диаметр два

Определение:
[math]A[/math] — некоторое свойство случайного графа. [math]p[/math] называется пороговой функцией (англ. threshold function), если граф [math]G(n, cp)[/math] при [math]c \lt 1[/math] а.п.н не имеет такого свойства, а при [math]c \gt 1[/math] а.п.н имеет.
Теорема:
Пусть рассматривается свойство графа иметь диаметр два. Тогда [math]p = \sqrt{2} \sqrt{\dfrac{\ln n}{n}}[/math] — пороговая функция.
Доказательство:
[math]\triangleright[/math]

Назовем вершины [math]u[/math] и [math]v[/math] плохой парой, если кратчайшее расстояние между [math]u[/math] и [math]v[/math] больше двух. [math]B_{i, j}[/math] — индикаторная величина, равная [math]1[/math], если [math]i[/math] и [math]j[/math] являются плохой парой. [math]N_z = \sum\limits_{i, j} B_{i,j}[/math] [math]P(B_{i, j}) = (1 - p)(1 - p^2)^{n - 2}[/math]

Сначала докажем, что при [math]c \gt sqrt{2}[/math], граф а.п.н не имеет диаметр, равный двум. Для этого оценим матожидание [math]N_z[/math]. [math]EN_z = C_n^2(1 - p)(1 - p^2)^{n - 2} \approx \dfrac{n^2}{2}(1 - c\sqrt{\dfrac{\ln n}{n}})(1 - \dfrac{c^2\ln n}{n})^{n - 2} \leqslant \dfrac{n^2}{2}e^{-c^2\ln n} = \dfrac{n^{2 - c^2}}{2}[/math]

При [math]c \gt \sqrt{2}[/math] последнее выражение стремится к [math]0[/math], по вышедоказанному граф а.п.н. не имеет диаметр, равный двум.

Рассмотрим [math]c \lt \sqrt{2}[/math]:

[math]EN_z^2 = E(\sum B_{i, j})^2 = E\sum B_{i,j}^2 + E\sum B_{i,j}B_{k,l} = EN_z + \sum EB_{i,j}B_{k,l}[/math]

Рассмотрим сумму [math]\sum EB_{i,j}B_{k,l}[/math]:

Если [math]i[/math], [math]j[/math], [math]k[/math] и [math]k[/math] различны, то [math]EB_{i,j}B_{k,l} \leqslant (1 - p^2)^{2(n - 4)} \leqslant n^{-2c^2}(1 + o(1))[/math].

[math]\sum EB_{i,j}B_{k,l} \leqslant n^{4 - 2c^2}(1 + o(1))[/math]

[math]EB_{i,j}B_{i,l} = (1 - p + p(1 - p)^2)^{n - 3} \approx (1 - 2p^2)^{n - 3} = (1 - 2c^2\dfrac{\ln n}{n})^{n - 3} \approx e^{-2c^2 \ln n} = n^{-2c^2}[/math]

[math]\sum EB_{i,j}B_{i,l} \leqslant n^{3 - 2c}[/math]

В итоге: [math]EN_z^2 \leqslant n^{2 - c^2} + n^{4 - 2c^2} + n^{3 - 2c^2}[/math]. Из этого следует, что [math]EN_z \leqslant (EN_z)^2(1 + o(1))[/math], а значит граф а.п.н имеет диаметр, равный двум при [math]c \gt \sqrt{2}[/math].
[math]\triangleleft[/math]

См. также

Источники информации