Теорема о гигантской компоненте. Поиск в ширину в случайном графе — различия между версиями

Версия 15:51, 26 мая 2020

Эта статья находится в разработке!

Содержание

1 Теорема о гигантской компоненте
- 1.1 Теорема о гигантской компоненте
2 Обход случайного графа
3 Вывод
4 См. также
5 Литература

Теорема о гигантской компоненте

Перед формулировкой основной теоремы данного раздела, дадим определение некоторых понятий, которые будут использованы в дальнейшем, а также приведем необходимые далее утверждения.

Определение:

Простейший ветвящийся процесс. Пусть — независимые пуассоновские величины^[1] с одним и тем же математическим ожиданием . Положим .

Представлять себе описанный только что процесс можно так. В начальный момент времени есть одна активная частица. Затем она Мб создает? делает [math]Z_1 \geq 0[/math] (может быть достигнуто, так как величина [math]Z_1[/math] равна нулю с положительной вероятностью) активных потомков и перестает быть активной. На следующем шаге все повторяется: какая-то частица (порядок роли не играет) порождает [math]Z_2[/math] новых частиц, а сама перестает быть активной. И так далее. Данный процесс может как завершиться (частицы перестанут быть активными), так и продолжаться бесконечно.
Говоря в терминах данного выше определения, [math]Y_i[/math] и [math]Z_i[/math] — количество активных и порожденных частиц в момент времени [math]t[/math], соответственно.

Теорема:

Пусть . Тогда с вероятностью 1 процесс вырождается, т.е. А почему < 0?.

Теорема:

Пусть . Пусть — единственное решение уравнения . Тогда процесс вырождается с вероятностью , т.е. .

Определение:

Ветвящийся процесс на случайном графе. Пусть — независимые пуассоновские величины с одним и тем же математическим ожиданием . Положим .

Пусть дан граф [math]G = (V,E)[/math]. Зафиксируем [math]v_1 \in V[/math]. Пометим ее как активную, а все остальные вершины — нейтральными. Выберем среди нейтральных вершин всех соседей вершины [math]v_1[/math]. После этого пометим вершину [math]v_1[/math] как неактивную , а смежных с ней — как активных, а все остальные вершины — нейтральными.

Снова зафиксируем какую-нибудь активную вершину [math]v_2[/math], и повторим процесс. Не меняем статус остальных уже активных вершин.

Продолжая этот ветвящийся процесс, мы в конце концов получим лишь неактивные (образующие компоненту, содержащую [math]v_1[/math]) и нейтральные вершины. Стоит добавить, что это похоже на бфс

Обозначим число активных вершин в момент времени [math]t[/math] через [math]Y_t[/math], число нейтральных вершин — через [math]N_t[/math], а число соседей вершины, которую собираемся пометить как неактивную, — через [math]Z_t[/math]. Тогда . Все введенные величины зависят от графа [math]G[/math] и от последовательности выбираемых вершин [math]v_1,\dotsc[/math].

Если [math]G[/math] посчитать случайным, то при любом выборе вершин [math]v_1,\dotsc[/math] получатся случайные величины [math]Y_t, N_t, Z_t[/math] на пространстве [math]G(n, p)[/math].

Теорема о гигантской компоненте

Теорема (о гигантской компоненте):

Рассмотрим модель . Пусть .

Если [math]c \lt 1[/math], то найдется такая константа [math]\beta = \beta(с)[/math], что а.п.н. Стоит сделать сноску или расшифровать хотя бы раз размер каждой связной компоненты случайного графа не превосходит [math]\beta \ln n[/math].

Если же , то найдется такая константа , получается, что бета и гамма - не константы, а функции от с? не очень понятно, что ты имеешь ввиду что а.п.н. в случайном графе есть ровно одна компонента размера . Размер остальных компонент не превосходит .

Доказательство:

Приведем здесь идеи^[2], изложенные А.М. Райгородским, основанные на доказательстве^[3] Р. Карпа. Данное доказательство не настолько строгое, как приведенное в ^[4], однако отличается лаконичностью и наглядностью.

Случай [math]c \lt 1[/math].

Положим [math]t_0=[\beta \ln n][/math], где [math]\beta = \beta(c)[/math] — константа, которую мы подберем позднее. Нам хочется доказать, что с большой вероятностью каждая из компонент случайного графа имеет размер [math]\le t_0[/math]. Но размер компоненты — это момент вырождения процесса [math]Y_t[/math] на случайном графе. Значит, интересующее нас утверждение можно записать в следующем виде:

Поскольку , Почему?достаточно найти такое [math]\beta[/math], при котором

Далее:

(с учетом асимптотики

Что такое Binom? почему примерно оно так преобразуется? (с учетом центральной предельной теоремы)
.

Сделай, чтобы знаменатель был не под знаком интеграла, а под всем интегралом

Поскольку [math]c \lt 1[/math], нижний предел интегрирования имеет порядок [math]\sqrt{t_0}[/math]. Таким образом, весь интеграл не превосходит величины [math]e^{−\delta t_0}[/math]. Выберем [math]\beta[/math] таким, чтобы [math]e^{−\delta t_0}[/math] оказалось меньше, чем , и в случае [math]c \lt 1[/math] теорема доказана. Прикольно было бы узнать порядок b

Случай [math]c \gt 1[/math].

В данном случае ветвящийся процесс на графе нужно «запускать» не один раз, а многократно. Только так удается доказать, что почти наверняка хотя бы в одном запуске возникнет гигантская компонента. Подробности можно найти в ^[4], мы же лишь поясним, откуда в текущей ситуации появляется константа [math]\gamma[/math] из формулировки предыдущей теоремы и почему она совпадает с одноименной константой из той же теоремы. Лучше сделать ссылку на прокрутку статьи вверх, но в целом можно забить. Вообще "предыдущая теорема" - не очень хорошая ссылка

Чтобы доказать, что есть гигантская компонента, необходимо, чтобы ветвящийся процесс на графе не вырождался даже при [math]t \thickapprox \gamma n[/math]. Иными словами, необходимо, чтобы:

Так как по условию [math]p = \dfrac{ c }{n}[/math], то при [math]t \thicksim \alpha n[/math] выполнено: Применим центральную предельную теорему к Интегрирование пойдет переформулируй от минус бесконечности до .

Если , то мы получим искомое стремление вероятности к нулю.

Если , то вероятность, напротив, будет стремиться к единице.

Таким образом, критическое значение , вплоть до которого есть именно стремление к нулю, — это решение уравнения или, что равносильно, . А это и есть уравнение из предыдущей теоремы, если заменить на .

Обход случайного графа

Приведем ряд утверждений, которые будут использованы а дальнейшем. Доказательство опустим ради лаконичности, их, а также более детальный рассказ можно найти здесь^[5].

Утверждение:

Пусть . Тогда вероятность , что ( — компонента связности, содержащая ): — константа.

Главная идея доказательства, которую мы будем использовать в дальнейшем — изменение алгоритма поиска в ширину таким образом, чтобы только что открытые вершины были выбраны из множества фиксированного размера. Такая модификация превращает поиск в ширину в ветвящийся процесс.

Теорема:

Пусть .

Найдутся такие [math]c_1, c_2[/math], что с [math]p \leq \frac{1}{n}[/math] .
Число вершин в компонентах размера [math]O(\ln n)[/math] а.п.н. [math]\leq cn, c \lt 1[/math]. Тогда с [math]p = 1 - o(1)[/math] существует компонента связности размера [math]\Omega (n)[/math].

Поиск в ширину

Рассмотрим граф [math]G(n, p)[/math]. Проанализируем его структуру по мере роста [math]p[/math]. При [math]p = 0[/math] граф состоит только из изолированных вершин. С ростом [math]p[/math] в нем появляются ребра, компоненты связности получающегося леса объединяются. При достижении граф а.п.н. является лесом. Когда [math]p = \frac{d}{n}[/math], появляются циклы. При [math]d \lt 1[/math] размер каждой из компонент связности нельзя пользоваться математическими символами как сокращениями в plain text, пиши равен[math]= \Omega(\log n)[/math]. Число компонент связности, содержащих только один цикл — константа, зависящая от [math]n[/math]. Таким образом, граф состоит из леса и компонент, содержащих единственный цикл без компонент размера [math]\Omega(\log n)[/math].
Когда [math]p = \frac{1}{n}[/math] начинает образовываться гигантская компонента. Этот процесс происходит в два этапа: при [math]p = \frac{1}{n}[/math] возникают компоненты из [math]n^{\frac{2}{3}}[/math] вершин, а.п.н. являющиеся деревьями. При [math]p = \frac{d}{n}, d \gt 1[/math], появляется гигантская компонента размером, пропорциональным количеству вершин во всем графе.
После превышения [math]p[/math] значения [math]\frac{d}{n}[/math], все неизолированные вершины оказываются в гигантской компоненте. При достижении [math]\frac{\ln n}{2n}[/math], в графе остаются только изолированные плюс гигантская компонента. Когда [math]p[/math] становится равной[math]\frac{\ln n}{n}[/math]граф становится связным. При [math]p = \frac{1}{2}[/math] верно: тут такое же замечание [math]\forall \varepsilon \gt 0[/math] в [math]G[/math] существует клика размером [math](2 - \varepsilon )\log n[/math].

Чтобы вычислить размер компоненты связности, пройдемся с помощью поиска в ширину по ней, стартуя из произвольной вершины и переходя к очередной неисследованной вершине, только если ребро между ними существует (данный факт необходимо установить независимо от других ребер, с вероятностью [math]p = \frac{d}{n}[/math]). Если ребро существует, пометим следующую вершину как "открытую". Алгоритм закончит свою работу (обойдет всю компоненту связности), когда множество неисследованных "открытых" вершин станет пустым.

Проблема поиска в ширину

Проблема поиска в ширину на случайном графе

На данном изображении представлены результаты работы поиска в ширину , начавшемся в вершине [math]1[/math] на двух графах: в первом у всех ребер [math]p = 1[/math], во втором же факт существования ребра определялся по ходу работы алгоритма — ребра, отмеченные пунктиром, не существуют. Возникающая проблема состоит в том, что, к примеру, Проблема возникает, очень странная синтаксическая конструкция когда алгоритм просто не доходит до каких-то ребер, не выясняя, существуют они или нет: находясь в вершине [math]2[/math], алгоритм не делал запрос о ребре [math](2, 3)[/math], так как у этому моменту вершина [math]3[/math] уже была исследована. Ребра, которые потенциально могли быть не изученными, помечены на рисунке точечным пунктиром.

Неоткрытые вершины

Будем считать шагом алгоритма поиска открытие новой вершины. После первых [math]i[/math] шагов алгоритма, любая из вершин, кроме стартовой, может быть неоткрытой с вероятностью [math]p = (1 - \frac{d}{n})^i[/math]. Пусть [math]z_i[/math] — число вершин, открытых за первые [math]i[/math] шагов алгоритма поиска. [math]z_i[/math] распределены как .
Унифицируй и пиши везде либо Binom, либо Binomial

== Ветвящийся процесс == Наверное, лучше придумать другой заголовок Пользуясь идеями, изложенными в доказательстве леммы, перейдем от модифицированного поиска в ширину к ветвящемуся процессу. Этот процесс используется для генерации случайных деревьев, возможно, бесконечного размера.
Рассмотрим натуральное случайное число [math]y[/math], обозначающее количество детей у очередной исследованной вершины. Каждый раз это значение выбирается случайно и независимо.
Процесс построения дерева заканчивается, образуя конечное дерево, когда у каждой вершины построены все ее "дети" Почему сначала не в кавычках, а потом в кавычках? Дай тогда формальное определение. Общая просьба к тексту, кстати, писать чуть более научно, использовать меньше вводных слов и предложений в 3 слова. Данный процесс может продолжаться бесконечно.
Пусть . Пусть [math]p′[/math] — вероятность того, что [math]size(cc(v)) = O(\log n)[/math] в модифицированном поиске в ширину. Пусть [math]q[/math] — вероятность окончания процесса. Тогда [math]q \geq p′[/math], поскольку поиск в ширину, заканчивающийся с [math] \le c_1\log n[/math] вершинами, приводит к окончанию построения дерева.
Пусть — вероятность, что [math]y[/math] производит [math]i[/math] детей. Тогда:
[math]\sum_{i = 0..s}p_i = 1[/math] и .
Глубина дерева [math]\geq[/math] количеству вершин. Пусть [math]a_i[/math] — вероятность того, что процесс закончится с деревом глубины [math]t[/math]. Имеем:

Вероятность исчезновения

Определение:

Вероятность исчезновения (extinction probability) — вероятность, того, что дерево ветвящегося процесса будет конечным (процесс завершится через конечное время).

Утверждение:

Пусть . Пусть — единственный корень на . Тогда для .

Теорема:

Рассмотрим дерево, сгенерированное ветвящимся процессом. Пусть — производящая функция числа детей каждой вершины. Тогда:

Если ожидаемое количество детей в каждой вершине [math]\le 1[/math], тогда вероятность исчезновения — 1, если вероятность появления ровно одного ребенка равна [math]1[/math].
Если ожидаемое количество детей в каждой вершине [math]\gt 1[/math], тогда вероятность исчезновения — единственное решение [math]f(x) = x[/math] на [math][0, 1)[/math].

В данной статье нами рассматривается простой случай ветвящегося процесса, в котором распределение количества потомков одинаково для каждой вершины.
Обозначим:

[math]q[/math] - вероятность исчезновения;
— количество детей у очередной исследованной вершины;
— вероятность, что [math]y[/math] производит [math]i[/math] детей.

Для того, чтобы вычислить вероятность исчезновения, воспользуемся производящей функцией:

где [math]p_i[/math] — вероятность того, что [math]y = i[/math]

Так как [math]q[/math] — вероятность конечности алгоритма, то, если у корневой вершины [math]i[/math] потомков, то построение каждого из поддеревьев должно завершиться, и это произойдет с вероятностью [math]q^i[/math]. Таким образом,

Таким образом, Либо убери вводное слово, либо придумай другое[math]q[/math] является корнем уравнения:

Рассмотрим решение данного уравнения на [math][0; 1][/math] [math]x = 1[/math] — всегда решение данного уравнения, так как .
В поисках другого, меньшего корня, рассмотрим , другими словами [math]m = E([/math]количество потомков вершины оформи по-другому, введи переменную, нельзя просто обернуть русский текст в тех[math])[/math] Кажется, что при [math]m \gt 1[/math] дерево будет расти вечно, так как каждая вершина в момент времени [math]j[/math] должна иметь потомков, однако при [math]p_0 \gt 0[/math] с положительной вероятность у корня может вообще не быть потомков. Вспоминая об исходном [math]G(n,\frac{d}{n})[/math]б ввиду того, что [math]d[/math] — ожидаемое количество потомков, [math]m[/math] играет роль [math]d[/math].

Решение уравнения f(x)=x

Далее, Ещё одно бессмысленное вводное слово, старайся не использовать их там, где не нужно пользуясь описанными выше утверждениями, можно доказать, что:

[math]m \lt 1[/math] [math]||[/math] [math]m = 1[/math] [math]\&[/math] [math]p_1 \lt 1[/math] — вероятность исчезновения [math] = 1[/math];
[math]m = 1[/math] [math]\&[/math] [math]p_1 = 1[/math] — вероятность исчезновения [math] = 0[/math];
[math]m \gt 1[/math] — вероятность исчезновения [math] \lt 1[/math], но, если [math]p_0 = 0[/math], процесс не завершится, так как у каждой вершины найдется по крайней мере один потомок;

Подробное описание доказательств данного факта, а также самих утверждений можно найти здесь^[5].

Вывод

Используя результаты, полученные в предыдущей части, сделаем вывод о вероятности окончания работы поиска в ширину на случайном графе [math]G(n, \frac{d}{n})[/math]. Рассчитав [math]p_0[/math] и [math]p_1[/math], можно сделать следующие выводы:

[math]d \lt 1[/math] [math]||[/math] [math]d = 1[/math] [math]\&[/math] [math]p_1 \lt 1[/math] — вероятность завершения[math] = 1[/math];
[math]d = 1[/math] [math]\&[/math] [math]p_1 = 1[/math] — вероятность завершения напиши словами и это и выше и ниже[math] = 0[/math];
[math]d \gt 1[/math] — вероятность исчезновения [math] \lt 1[/math], но, если [math]p_0 = 0[/math], процесс не завершится, так как у каждой вершины найдется по крайней мере один потомок;

См. также

Литература

↑ https://ru.wikipedia.org/wiki/Распределение_Пуассона
↑ Введение в математическое моделирование транспортных потоков: Учебное пособие/Издание 2-е, испр. и доп. А. В. Гасников и др. Под ред. А. В. Гасникова.— М.: МЦНМО, 2013 — C.330-339 — ISBN 978-5-4439-0040-7
↑ Karp R. The transitive closure of a random digraph//Random structures and algorithms. 1990. V. 1. P. 73–94.
↑ ^4,0 ^4,1 Алон Н., Спенсер Дж. Вероятностный метод. М.: Бином. Лаборатория знаний, 2007.
↑ ^5,0 ^5,1 Blum A. Random Graphs // CS 598 Topics in Algorithms (UIUC), 2015. URL: https://www.cs.cmu.edu/~avrim/598/chap4only.pdf

[1] ttps://ru.wikipedia.org/wiki/Распределение_Пуассона

[2] Введение в математическое моделирование транспортных потоков: Учебное пособие/Издание 2-е, испр. и доп. А. В. Гасников и др. Под ред. А. В. Гасникова.— М.: МЦНМО, 2013 — C.330-339 — ISBN 978-5-4439-0040-7

[3] Karp R. The transitive closure of a random digraph//Random structures and algorithms. 1990. V. 1. P. 73–94.

[trueproof-4] 4,0 ^4,1 Алон Н., Спенсер Дж. Вероятностный метод. М.: Бином. Лаборатория знаний, 2007.

[chap4-5] 5,0 ^5,1 Blum A. Random Graphs // CS 598 Topics in Algorithms (UIUC), 2015. URL: https://www.cs.cmu.edu/~avrim/598/chap4only.pdf

[1]

[2]

[3]

[4]

[5]

@@ Строка 7: / Строка 7: @@
 <tex>Y_0 = 1, Y_i = Y_{i - 1} + Z_i - 1</tex>.
 }}
-Представлять себе описанный только что процесс можно так. В начальный момент времени есть одна активная частица. Затем она делает <tex>Z_1 \geq 0</tex> (может быть достигнуто, так как величина <tex>Z_1</tex> равна нулю с положительной вероятностью) активных потомков и перестает быть активной. На следующем шаге все повторяется: какая-то частица (порядок роли не играет) порождает <tex>Z_2</tex> новых частиц, а сама перестает быть активной. И так далее. Данный процесс может как завершиться (частицы перестанут быть активными), так и продолжаться бесконечно.<br>
+Представлять себе описанный только что процесс можно так. В начальный момент времени есть одна активная частица. Затем она '''Мб создает?''' делает <tex>Z_1 \geq 0</tex> (может быть достигнуто, так как величина <tex>Z_1</tex> равна нулю с положительной вероятностью) активных потомков и перестает быть активной. На следующем шаге все повторяется: какая-то частица (порядок роли не играет) порождает <tex>Z_2</tex> новых частиц, а сама перестает быть активной. И так далее. Данный процесс может как завершиться (частицы перестанут быть активными), так и продолжаться бесконечно.<br>
 Говоря в терминах данного выше определения, <tex>Y_i</tex> и <tex>Z_i</tex> {{---}} количество активных и порожденных частиц в момент времени <tex>t</tex>, соответственно.
 {{Теорема
 |id = th1
-|statement=Пусть <tex>\lambda \leq 1</tex>. Тогда с вероятностью 1 процесс <tex>Y_t</tex> вырождается, т.е. <tex>P(\exists t: Y_t \leq 0) = 1</tex>.
+|statement=Пусть <tex>\lambda \leq 1</tex>. Тогда с вероятностью 1 процесс <tex>Y_t</tex> вырождается, т.е. '''А почему < 0?'''<tex>P(\exists t: Y_t \leq 0) = 1</tex>.
 }}
 {{Теорема
@@ Строка 25: / Строка 25: @@
 Снова зафиксируем какую-нибудь активную вершину <tex>v_2</tex>, и повторим процесс. Не меняем статус остальных уже активных вершин.
-Продолжая этот ветвящийся процесс, мы в конце концов получим лишь неактивные (образующие компоненту, содержащую <tex>v_1</tex>) и нейтральные вершины.
+Продолжая этот ветвящийся процесс, мы в конце концов получим лишь неактивные (образующие компоненту, содержащую <tex>v_1</tex>) и нейтральные вершины. '''Стоит добавить, что это похоже на бфс'''
 Обозначим число активных вершин в момент времени <tex>t</tex> через <tex>Y_t</tex>, число нейтральных вершин {{---}} через <tex>N_t</tex>, а число соседей вершины, которую собираемся пометить как неактивную, {{---}} через <tex>Z_t</tex>. Тогда <tex>Y_0 = 1,Y_t = Y_t−1 + Z_t − 1</tex>. Все введенные величины зависят от графа <tex>G</tex> и от последовательности выбираемых вершин <tex>v_1,\dotsc</tex>.
@@ Строка 36: / Строка 36: @@
 |about=о гигантской компоненте
 |statement=Рассмотрим модель <tex>G(n, p)</tex>. Пусть <tex>p = \dfrac{ c }{n}</tex>.
-Если <tex>c < 1</tex>, то найдется такая константа <tex>\beta = \beta(с)</tex>, что а.п.н. размер каждой  связной  компоненты  случайного  графа  не  превосходит <tex>\beta \ln n</tex>.
+Если <tex>c < 1</tex>, то найдется такая константа <tex>\beta = \beta(с)</tex>, что а.п.н. '''Стоит сделать сноску или расшифровать хотя бы раз''' размер каждой  связной  компоненты  случайного  графа  не  превосходит <tex>\beta \ln n</tex>.
-Если же <tex>c > 1</tex>, то найдется такая константа <tex>\gamma = \gamma(c)</tex>, что а.п.н.  в  случайном  графе  есть  ровно  одна  компонента  размера <tex>\geq\gamma n</tex>. Размер остальных компонент не  превосходит <tex>\beta \ln n</tex>.
+Если же <tex>c > 1</tex>, то найдется такая константа <tex>\gamma = \gamma(c)</tex>, '''получается, что бета и гамма - не константы, а функции от с? не очень понятно, что ты имеешь ввиду''' что а.п.н.  в  случайном  графе  есть  ровно  одна  компонента  размера <tex>\geq\gamma n</tex>. Размер остальных компонент не  превосходит <tex>\beta \ln n</tex>.
 |proof=
 Приведем здесь идеи<ref>Введение в математическое моделирование транспортных потоков: Учебное пособие/Издание 2-е, испр. и доп. А. В. Гасников и др. Под ред. А. В. Гасникова.{{---}} М.: МЦНМО, 2013 {{---}} C.330-339 {{---}} ISBN 978-5-4439-0040-7</ref>, изложенные А.М. Райгородским, основанные на доказательстве<ref>Karp R. The transitive closure of a random digraph//Random structures and algorithms. 1990. V. 1. P. 73–94.</ref> Р. Карпа. Данное доказательство не настолько строгое, как приведенное в <ref name="trueproof">Алон Н., Спенсер Дж. Вероятностный метод. М.: Бином. Лаборатория знаний, 2007.</ref>, однако
@@ Строка 48: / Строка 48: @@
 <tex>P_{n, p}(\exists v_1 : Y_{t_0} > 0) \rightarrow 0,  n \rightarrow \infty</tex>
+Поскольку <tex>P_{n, p}(\exists v_1 : Y_{t_0} > 0) \le nP_{n, p}(Y_{t_0} \ge 0)</tex>, '''Почему?'''достаточно найти такое <tex>\beta</tex>, при котором
-Поскольку <tex>P_{n, p}(\exists v_1 : Y_{t_0} > 0) \le nP_{n, p}(Y_{t_0} \ge 0)</tex>, достаточно найти такое <tex>\beta</tex>, при котором
 <tex>P_{n, p}(Y_{t_0} > 0) = o\left(\dfrac{1}{n}\right).</tex>
@@ Строка 57: / Строка 56: @@
 <tex>P_{n, p}(Y_{t_0} > 0) = P_{n, p}(\xi_{t_o} > t_0) \thickapprox P_{n, p}(Binom(n, 1 - (1 - p)^{t_0}) > t_0) \thickapprox</tex><br>
 (с учетом асимптотики <tex>1 - (1 - p)^{t_0} \thicksim pt_0) </tex><br>
-<tex>\thickapprox P_{n, p}(Binom(n, pt_0) > t_0) \thickapprox</tex><br>
+<tex>\thickapprox P_{n, p}(Binom(n, pt_0) > t_0) \thickapprox</tex><br> '''Что такое Binom? почему примерно оно так преобразуется?'''
 (с учетом центральной предельной теоремы) <br>
 <tex> \thickapprox \int\limits_{\frac{t_0 - npt_0}{\sqrt{npt_0(1 - pt_0)}}}^\infty \frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}dx</tex>.
+'''Сделай, чтобы знаменатель был не под знаком интеграла, а под всем интегралом'''
 Поскольку <tex>c < 1</tex>, нижний предел интегрирования имеет порядок <tex>\sqrt{t_0}</tex>. Таким образом, весь интеграл не превосходит величины
 <tex>e^{−\delta t_0}</tex>. Выберем <tex>\beta</tex> таким, чтобы <tex>e^{−\delta t_0}</tex> оказалось меньше, чем
-<tex>e^{-2 \ln n} = \dfrac{1}{n^2}</tex>, и в случае <tex>c < 1</tex> теорема доказана.<br>
+<tex>e^{-2 \ln n} = \dfrac{1}{n^2}</tex>, и в случае <tex>c < 1</tex> теорема доказана. '''Прикольно было бы узнать порядок b'''<br>
 <br>
@@ Строка 69: / Строка 70: @@
 В данном случае ветвящийся процесс на графе нужно «запускать» не один раз, а многократно. Только так удается доказать, что почти наверняка хотя
-бы в одном запуске возникнет гигантская компонента. Подробности можно найти в <ref name="trueproof" />, мы же лишь поясним, откуда в текущей ситуации появляется константа <tex>\gamma</tex> из формулировки предыдущей теоремы и почему она совпадает с одноименной константой из той же теоремы.
+бы в одном запуске возникнет гигантская компонента. Подробности можно найти в <ref name="trueproof" />, мы же лишь поясним, откуда в текущей ситуации появляется константа <tex>\gamma</tex> из формулировки предыдущей теоремы и почему она совпадает с одноименной константой из той же теоремы. '''Лучше сделать ссылку на прокрутку статьи вверх, но в целом можно забить. Вообще "предыдущая теорема" - не очень хорошая ссылка'''
 Чтобы доказать, что есть гигантская компонента, необходимо, чтобы ветвящийся процесс на графе не вырождался даже
@@ Строка 79: / Строка 80: @@
 Применим центральную предельную теорему к
 <tex>P_{n, p}(Y_{t_0} \le 0)\thickapprox P_{n, p}(Binom(n, 1 - e^{-c\alpha}) \le \alpha n).</tex>
-Интегрирование пойдет от минус бесконечности до
+Интегрирование пойдет '''переформулируй''' от минус бесконечности до
 <tex>\dfrac{\alpha n - n(1 - e^{-c\alpha})}{\sqrt{n(1 - e^{-c\alpha})e^{-c\alpha}}}</tex>.
@@ Строка 102: / Строка 103: @@
 === Поиск в ширину  ===
-Воспользуемся полученными знаниями. <br>
+<br>
-Рассмотрим граф <tex>G(n, p)</tex>. Проанализируем его структуру по мере роста <tex>p</tex>. При <tex>p = 0</tex>, граф состоит только из изолированных вершин. С ростом <tex>p</tex> в нем появляются ребра, [[Отношение связности, компоненты связности|компоненты связности]] получающегося леса объединяются. При достижении <tex>p = o\left(\frac{1}{n}\right)</tex> граф а.п.н. является лесом. Когда <tex>p = \frac{d}{n}</tex>, появляются циклы. При <tex>d < 1</tex>, размер каждой из компонент связности <tex>= \Omega(\log n)</tex>. Число компонент связности, содержащих только один цикл {{---}} константа, зависящая от <tex>n</tex>. Таким образом, граф состоит из леса и компонент, содержащих единственный цикл  без компонент размера <tex>\Omega(\log n)</tex>.<br>
+Рассмотрим граф <tex>G(n, p)</tex>. Проанализируем его структуру по мере роста <tex>p</tex>. При <tex>p = 0</tex> граф состоит только из изолированных вершин. С ростом <tex>p</tex> в нем появляются ребра, [[Отношение связности, компоненты связности|компоненты связности]] получающегося леса объединяются. При достижении <tex>p = o\left(\frac{1}{n}\right)</tex> граф а.п.н. является лесом. Когда <tex>p = \frac{d}{n}</tex>, появляются циклы. При <tex>d < 1</tex> размер каждой из компонент связности '''нельзя пользоваться математическими символами как сокращениями в plain text, пиши равен'''<tex>= \Omega(\log n)</tex>. Число компонент связности, содержащих только один цикл {{---}} константа, зависящая от <tex>n</tex>. Таким образом, граф состоит из леса и компонент, содержащих единственный цикл  без компонент размера <tex>\Omega(\log n)</tex>.<br>
 Когда <tex>p = \frac{1}{n}</tex> начинает образовываться гигантская компонента. Этот процесс происходит в два этапа: при <tex>p = \frac{1}{n}</tex> возникают компоненты из <tex>n^{\frac{2}{3}}</tex> вершин, а.п.н. являющиеся деревьями. При <tex>p = \frac{d}{n}, d > 1</tex>, появляется гигантская компонента размером, пропорциональным количеству вершин во всем графе.<br>
-После превышения <tex>p</tex> значения <tex>\frac{d}{n}</tex>, все неизолированные вершины оказываются в гигантской компоненте. При достижении <tex>\frac{\ln n}{2n}</tex>, в графе остаются только изолированные плюс гигантская компонента. Когда <tex>p</tex> становится равной<tex>\frac{\ln n}{n}</tex>граф становится связным. При <tex>p = \frac{1}{2}</tex> верно: <tex>\forall \varepsilon > 0</tex> в <tex>G</tex> существует клика размером <tex>(2 - \varepsilon )\log n</tex>.<br>
+После превышения <tex>p</tex> значения <tex>\frac{d}{n}</tex>, все неизолированные вершины оказываются в гигантской компоненте. При достижении <tex>\frac{\ln n}{2n}</tex>, в графе остаются только изолированные плюс гигантская компонента. Когда <tex>p</tex> становится равной<tex>\frac{\ln n}{n}</tex>граф становится связным. При <tex>p = \frac{1}{2}</tex> верно: '''тут такое же замечание''' <tex>\forall \varepsilon > 0</tex> в <tex>G</tex> существует клика размером <tex>(2 - \varepsilon )\log n</tex>.<br>
 <br>
 Чтобы вычислить размер компоненты связности, пройдемся с помощью [[Обход в ширину|поиска в ширину]] по ней, стартуя из произвольной вершины и переходя к очередной неисследованной вершине, только если ребро между ними существует (данный факт необходимо установить независимо от других ребер, с вероятностью <tex>p = \frac{d}{n}</tex>). Если ребро существует, пометим следующую вершину как "открытую". Алгоритм закончит свою работу (обойдет всю компоненту связности), когда множество неисследованных "открытых" вершин станет пустым.
@@ Строка 113: / Строка 114: @@
 [[Файл:Bfs_problem_on_random_graph.png|300px|thumb|center|Проблема поиска в ширину на случайном графе]]
 <br>
-На данном изображении представлены результаты работы поиска в ширину , начавшемся в вершине <tex>1</tex> на двух графах: в первом у всех ребер <tex>p = 1</tex>, во втором же факт существования ребра определялся по ходу работы алгоритма {{---}} ребра, отмеченные пунктиром, не существуют. Возникающая проблема состоит в том, что, к примеру, Проблема возникает, когда алгоритм просто не доходит до каких-то ребер, не выясняя, существуют они или нет: находясь в вершине <tex>2</tex>, алгоритм не делал запрос о ребре <tex>(2, 3)</tex>, так как у этому моменту вершина <tex>3</tex> уже была исследована. Ребра, которые потенциально могли быть не изученными, помечены на рисунке точечным пунктиром.
+На данном изображении представлены результаты работы поиска в ширину , начавшемся в вершине <tex>1</tex> на двух графах: в первом у всех ребер <tex>p = 1</tex>, во втором же факт существования ребра определялся по ходу работы алгоритма {{---}} ребра, отмеченные пунктиром, не существуют. Возникающая проблема состоит в том, что, к примеру, Проблема возникает,  '''очень странная синтаксическая конструкция''' когда алгоритм просто не доходит до каких-то ребер, не выясняя, существуют они или нет: находясь в вершине <tex>2</tex>, алгоритм не делал запрос о ребре <tex>(2, 3)</tex>, так как у этому моменту вершина <tex>3</tex> уже была исследована. Ребра, которые потенциально могли быть не изученными, помечены на рисунке точечным пунктиром.
 === Неоткрытые вершины ===
-Будем считать шагом алгоритма поиска открытие новой вершины. После первых <tex>i</tex> шагов алгоритма, любая из вершин, кроме стартовой, может быть неоткрытой с вероятностью <tex>p = (1 - \frac{d}{n})^i</tex>. Пусть <tex>z_i</tex> {{---}} число вершин, открытых за первые <tex>i</tex> шагов алгоритма поиска. <tex>z_i</tex> распределены как <tex>Binomial(n − 1,1 − (1 - \frac{d}{n})^i)</tex>.<br>
+Будем считать шагом алгоритма поиска открытие новой вершины. После первых <tex>i</tex> шагов алгоритма, любая из вершин, кроме стартовой, может быть неоткрытой с вероятностью <tex>p = (1 - \frac{d}{n})^i</tex>. Пусть <tex>z_i</tex> {{---}} число вершин, открытых за первые <tex>i</tex> шагов алгоритма поиска. <tex>z_i</tex> распределены как <tex>Binomial(n − 1,1 − (1 - \frac{d}{n})^i)</tex>.<br> '''Унифицируй и пиши везде либо Binom, либо Binomial'''
-== Ветвящийся процесс ==
+== Ветвящийся процесс =='''
-Пользуясь идеями, изложенными в доказательстве леммы, переходим от модифицированного поиска в ширину к ветвящемуся процессу. Этот процесс используется для генерации случайных деревьев, возможно, бесконечного размера.<br>
+Наверное, лучше придумать другой заголовок'''
+Пользуясь идеями, изложенными в доказательстве леммы, перейдем от модифицированного поиска в ширину к ветвящемуся процессу. Этот процесс используется для генерации случайных деревьев, возможно, бесконечного размера.<br>
 Рассмотрим натуральное случайное число <tex>y</tex>, обозначающее количество детей у очередной исследованной вершины. Каждый раз это значение выбирается случайно и независимо.<br>
-Процесс построения дерева заканчивается, образуя конечное дерево, когда у каждой вершины построены все ее "дети". Данный процесс может продолжаться бесконечно. <br>
+Процесс построения дерева заканчивается, образуя конечное дерево, когда у каждой вершины построены все ее "дети" '''Почему сначала не в кавычках, а потом в кавычках? Дай тогда формальное определение. Общая просьба к тексту, кстати, писать чуть более научно, использовать меньше вводных слов и предложений в 3 слова'''. Данный процесс может продолжаться бесконечно. <br>
 Пусть <tex>y \thicksim Binomial(s = n−c_1\log n, \frac{d}{n})</tex>. Пусть <tex>p′</tex> {{---}} вероятность того, что <tex>size(cc(v)) = O(\log n)</tex> в модифицированном поиске в ширину. Пусть <tex>q</tex> {{---}} вероятность окончания процесса. Тогда <tex>q \geq p′</tex>, поскольку поиск в ширину, заканчивающийся с <tex> \le c_1\log n</tex> вершинами, приводит к окончанию построения дерева.<br>
 Пусть <tex>p_i = \binom{s}{i}(\frac{d}{n})^i(1 − \frac{d}{n})^{s − i}</tex> {{---}} вероятность, что <tex>y</tex> производит <tex>i</tex> детей. Тогда:<br>
@@ Строка 130: / Строка 132: @@
 === Вероятность исчезновения ===
 {{Определение
-|definition='''Вероятность исчезновения''' (extinction probability) {{---}} вероятность, того, что дерево ветвящегося процесса будет конечным, то есть данный процесс завершится через конечное время.
+|definition='''Вероятность исчезновения''' (extinction probability) {{---}} вероятность, того, что дерево ветвящегося процесса будет конечным (процесс завершится через конечное время).
 }}
 {{Утверждение
@@ Строка 150: / Строка 152: @@
 <tex>f(x) = \sum_{i = 0..\infty}p_ix^i,</tex> где <tex>p_i</tex> {{---}} вероятность того, что <tex>y = i</tex><br>
 <br>
-Так как <tex>q</tex> {{---}} вероятность конечности алгоритма, то, если у корневой вершины <tex>i</tex> потомков, то построение каждого из поддеревьев должно завршиться, и это произойдет с вероятностью <tex>q^i</tex>. Таким образом:<br>
+Так как <tex>q</tex> {{---}} вероятность конечности алгоритма, то, если у корневой вершины <tex>i</tex> потомков, то построение каждого из поддеревьев должно завершиться, и это произойдет с вероятностью <tex>q^i</tex>. Таким образом, <br>
 <tex>q = \sum_{i = 0..\infty}p_iq^i</tex><br>
-Таким образом, <tex>q</tex> является корнем уравнения:<br>
+Таким образом, '''Либо убери вводное слово, либо придумай другое'''<tex>q</tex> является корнем уравнения:<br>
 <tex>x = \sum_{i = 0..\infty}p_ix^i \Leftrightarrow f(x) = x</tex><br>
 <br>
 Рассмотрим решение данного уравнения на <tex>[0; 1]</tex>
 <tex>x = 1</tex> {{---}} всегда решение данного уравнения, так как <tex>\sum_{i = 0..\infty}p_i1^i = \sum_{i = 0..\infty}p_i = 1 = x</tex>.<br>
-В поисках другого, меньшего корня, рассмотрим <tex>m = f'(1) = \sum_{i = 1..\infty}ip_i</tex>, другими словами <tex>m = E(</tex>количество потомков вершины<tex>)</tex>
+В поисках другого, меньшего корня, рассмотрим <tex>m = f'(1) = \sum_{i = 1..\infty}ip_i</tex>, другими словами <tex>m = E(</tex>количество потомков вершины '''оформи по-другому, введи переменную, нельзя просто обернуть русский текст в тех'''<tex>)</tex>
 Кажется, что при <tex>m > 1</tex> дерево будет расти вечно, так как каждая вершина в момент времени <tex>j</tex> должна иметь потомков, однако при <tex>p_0 > 0</tex> с положительной вероятность у корня может вообще не быть потомков. Вспоминая об исходном <tex>G(n,\frac{d}{n})</tex>б ввиду того, что <tex>d</tex> {{---}} ожидаемое количество потомков, <tex>m</tex> играет роль <tex>d</tex>.<br>
 [[Файл:Extinction_probability_equation_root_random_graph.png|thumb|300px|center|Решение уравнения f(x)=x]]
-Далее, пользуясь описанными выше утверждениями, можно доказать, что:<br>
+Далее, '''Ещё одно бессмысленное вводное слово, старайся не использовать их там, где не нужно''' пользуясь описанными выше утверждениями, можно доказать, что:<br>
 # <tex>m < 1</tex> <tex>||</tex> <tex>m = 1</tex> <tex>\&</tex> <tex>p_1 < 1</tex> {{---}} вероятность исчезновения <tex> = 1</tex>;<br>
 # <tex>m = 1</tex> <tex>\&</tex> <tex>p_1 = 1</tex> {{---}} вероятность исчезновения <tex> = 0</tex>;<br>
@@ Строка 169: / Строка 171: @@
 Используя результаты, полученные в предыдущей части, сделаем вывод о вероятности окончания работы поиска в ширину на случайном графе <tex>G(n, \frac{d}{n})</tex>. Рассчитав <tex>p_0</tex> и <tex>p_1</tex>, можно сделать следующие выводы:<br>
 # <tex>d < 1</tex> <tex>||</tex> <tex>d = 1</tex> <tex>\&</tex> <tex>p_1 < 1</tex> {{---}} вероятность завершения<tex> = 1</tex>;<br>
-# <tex>d = 1</tex> <tex>\&</tex> <tex>p_1 = 1</tex> {{---}} вероятность завершения<tex> = 0</tex>;<br>
+# <tex>d = 1</tex> <tex>\&</tex> <tex>p_1 = 1</tex> {{---}} вероятность завершения '''напиши словами и это и выше и ниже'''<tex> = 0</tex>;<br>
 # <tex>d > 1</tex> {{---}} вероятность исчезновения <tex> < 1</tex>, но, если <tex>p_0 = 0</tex>, процесс не завершится, так как у каждой вершины найдется по крайней мере один потомок;<br>

Теорема о гигантской компоненте. Поиск в ширину в случайном графе — различия между версиями

Версия 15:51, 26 мая 2020

Содержание

Теорема о гигантской компоненте

Теорема о гигантской компоненте

Обход случайного графа

Поиск в ширину

Проблема поиска в ширину

Неоткрытые вершины

Вероятность исчезновения

Вывод

См. также

Литература

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты