Параллельное программирование
Программирование параллельных и распределенных систем
6 семестр
Введение. Масштабируемость распределенных и параллельных систем, закон Амдала. Отличия распределенных систем от систем с разделяемой памятью
1-2 билеты. Логические часы Лампорта и векторные часы, их свойства
3-4 билеты. Часы с прямой зависимостью (и их свойства) и матричные часы
5-7 билеты. Взаимное исключение в распределенной системе. Централизованный, алгоритм Лампорта, алгоритм Рикарта и Агравалы
8-10 билеты. Взаимное исключение в распределенной системе. Алгоритм обедающих философов, на основе токена, на основе кворума (простое большинство, рушащиеся стены)
11-12 билеты. Согласованное глобальное состояние (согласованный срез). Алгоритм Чанди-Лампорта. Запоминание сообщений на стороне отправителя и получателя
13-14 билеты. Глобальные свойства. Стабильные и нестабильные предикаты. Слабый конъюнктивный предикат. Централизованный и распределенный алгоритмы
- Глобальные свойства системы
- Слабый конъюнктивный предикат (WCP)
- Централизованный алгоритм для WCP
- Распределенный алгоритм для WCP
15 билет. Диффундирующие вычисления. Останов. Алгоритм Дейкстры и Шолтена
TODO
Алгоритм Дейкстры и Шолтена в английской википедии[1].
16 билет. Локально-стабильные предикаты, согласованные интервалы, барьерная синхронизация (3 алгоритма). Применение для определения взаимной блокировки
TODO
- Локально стабильный предикат
- Согласованный интервал
- Барьерная синхронизация (3 алгоритма)
- Применение для определения дедлока.
Каждый процесс
поддерживает свою часть графа ожидания (ребра, которые из него исходят), а также флажок changed, который равен true, если его часть графа поменялась с последнего сообщения координатору. Координатор периодически опрашивает процессы, получая их графы. Процесс отвечает новым графом, если есть изменение, а иначе шлет notChanged. Координатор собирает весь граф ожидания. Если в нем есть цикл, он отправляет процессам запрос на изменение. Если все процессы в цикле ответили notChanged, дедлок найден.Рассмотрим два среза:
- когда взаимно блокирующие процессы прислали координатору свои графы;
- когда они прислали ему notChanged.
Эти срезы не обязательно согласованны, но они барьерно-синхронизированы (из-за сообщений координатору и обратно), а значит образуют согласованный интервал. Поэтому между ними есть согласованный срез
, а так как состояние процессов в цикле не менялось на всем интервале, и в первом срезе предикат выполнен, для он также выполнен.17-18 билеты. Упорядочивание сообщений. Определения, иерархия порядков. Алгоритм для FIFO. Алгоритм для причинно-согласованного порядка
TODO
Порядок сообщений:
- асинхронный (нет порядка)
- FIFO (сообщения доходят получателю в том порядке, в котором они были ему отправлены в смысле одного потока)
- причинно-следственный (если одно сообщение было отправлено раньше другого, то оно будет доставлено раньше другого (в системе целиком, а не в смысле одного потока, как в FIFO)
- синхронный (можно выстроить ребра передачи сообщений без пересечений)
Алгоритм FIFO основан на нумерации сообщений.
Псевдокод алгоритма для причинно-согласованного порядка. Вместе с сообщением отправляем матрицу M: M[i, j] — количество сообщений, отправленных процессом i процессу j.
var M:array[l..N, 1..N] of integer initially 0; To send a message to: M [i,j] := M[i,j] + 1; send M as part of the message; To receive a message with matrix W from Pj: enabled if W[j,i] = M [j,i] + 1 M := max(M, W)
19 билет. Упорядочивание сообщений. Определения, иерархия порядков. Алгоритм для синхронного порядка
Алгоритм для синхронного порядка основан на иерархии процессов. Упорядочим процессы по номеру, назовем сообщение большим, если номер отправителя больше номера получателя, и малым иначе. Процесс может быть в активном или пассивном состоянии. Изначально все активны. Процесс может отправить большое сообщение, только если он активен. После отправки он становится пассивным и не может ни отправлять, ни принимать сообщения, пока не получит от получателя ack.
Чтобы отправить сообщение большему процессу
, процесс сначала посылает служебное сообщение, запрос. В ответ отправляет разрешение; он может сделать это только в активном состоянии. Разрешив, он становится пассивным и остается в этом состоянии, пока не получает сообщение, которое разрешил.20-21 билеты. Общий порядок (total order). Алгоритмы Лампорта и Скина
TODO? (CHECK)
?? билет. Выбор лидера. Алгоритм Чанди-Робертса, и алгоритм Хирчберга-Синклера
Алгоритм Чанди-Робертса (Chang and Roberts) выбора лидера [2].
Пусть процессы находятся в кольце. Посылаем свой номер налево по кольцу. При получении номера справа посылаем налево максимум из своего номера и полученного справа. Если полученный справа номер является нашим номером, то заканчиваем работу.
Алгоритм Хирчберга-Синклера [3] [4].
22 билет. Иерархия ошибок в распределенных системах. Отказ узла в асинхронной системе - невозможность консенсуса (доказательство Фишера-Линча-Патерсона)
TODO
- Отказ одного или нескольких узлов (crash)
- Отказ одного или нескольких каналов (link failure)
- Ненадежная доставка сообщений (omission)
- Византийская ошибка (byzantine failure) (сломавшийся процесс может слать любой мусор)
Теорема FLP (Фишер-Линч-Патерсон):
Для асинхронной системы N потоков с хотя бы одним сбойным потоком нельзя построить решение задачи консенсуса.
Разрешением утверждения, которое постулируется в теореме выше, могут стать следующие изменения:
- Сделать сеть синхронной (ограничить время доставки сообщений)
- Сделать алгоритм недетерминированным (случайным)
- Ослабить требования при которых в алгоритме обязан быть прогресс (т.е. он обязан завершаться)
Инфо: http://bailonga.es/tpmtp/lecture09.pdf + презентация Р.Елизарова
23 билет. Консенсус в распределенных системах. Применение консенсуса: выбор лидера, terminating reliable broadcast
TODO
Результат FLP о невозможности консенсуса верен даже если, процессу разрешено делать операцию «атомарной передачи» сообщения сразу несколько процессам, ибо нет гарантии что все процессы обработают его. Если есть гарантия получения сообщения всеми процессами (или ни одним), то такая операция называется Terminating Reliable Broadcast (TRB). Имея TRB можно тривиально на его основе написать алгоритм консенсуса (процесс
рассылает всем свой бит, они соглашаются на этот бит, если получили сообщение, иначе на 0).Применение консенсуса:
1) Выбор лидера
- Каждый процесс предлагает себя. Консенсус определяет лидера для последующего распределенного алгоритма
2) Terminating Reliable Broadcast
- Надо прийти к консенсусу о том, надо ли обрабатывать полученное сообщение
- Таким образом, задача TRB эквивалентна задаче консенсуса
24 билет. Синхронные системы. Алгоритм для консенсуса в случае отказа заданного числа узлов
TODO
Пусть в системе имеется n узлов. Пусть из них максимум f не работают. Тогда можно решить задачу консенсуса:
- Каждый узел посылает каждому свое число;
- Процессы запоминают пришедшие числа;
- Новые для себя числа процессы рассылают дальше;
- Каждый процесс выбирает минимально известное ему число.
25 билет. Синхронные системы. Проблема византийских генералов. Алгоритм для N >= 4, f = 1. Объяснить идею обобщения для f > 1
Задача двух генералов — мысленный эксперимент, призванный проиллюстрировать проблему синхронизации состояния двух систем по ненадежному каналу связи. (Википедия)
Два процесса в случае ненадежного канала не могут достичь консенсуса.
Consider the last such message that was successfully delivered. If that last message had not been successfully delivered, then one general at least (presumably the receiver) would decide not to attack. From the viewpoint of the sender of that last message, however, the sequence of messages sent and delivered is exactly the same as it would have been, had that message been delivered.
Для недетерминнированного - аналогично. Посмотрим на "успешную" последовательность. И отменим успешность последнего сообщения. Для 1-ого все ок, для 2-ого все испортилось.
26 билет. Синхронные системы. Проблема византийских генералов. Невозможность решения при N = 3, f = 1
Задача византийских генералов — мысленный эксперимент, призванный проиллюстрировать проблему синхронизации состояния систем в случае, когда коммуникации считаются надёжными, а процессоры — нет. (Вики)
Проблема византийских генералов формулируется так: имеется n генералов из которых f являются предателями. Как прийти к консенсусу честным генералам?
Известно, что при n > 3f задача решаема, а иначе нет.
- Каждый рассылает каждому свое число;
- Каждый рассылает каждому собранные значения;
- В полученных векторах каждый проводит голосование.
Можно доказать, например, что при n = 3, f = 1 консенсус невозможен.
Данный вопрос достаточно хорошо описан в английской версии.
27 билет. Недетерминированные алгоритмы консенсуса. Алгоритм Бен-Ора.
28 билет. Paxos. Алгоритм, его свойства.
29 билет. Paxos. Общие принципы. Основные модификации.
30 билет. Транзакции в распределенных системах. 2 Phase Locking
31 билет. Транзакции в распределенных системах. 2 Phase Commit.
32 билет. СAP теорема (концепции, подходы, без доказательства)
33 билет. Gossip. СRDT и дельта-CRDT (концепции, примеры алгоритмов, см. работу с семинара)
CRDT (Conflict-Free Replicated Data Type) — объект, который можно реплицировать на много узлов и обновлять параллельно без координации между узлами. Репликация на основе состояния Получив обновление от клиента, реплика сперва обновляет локальное состояние, затем отправляет это состояние другой реплике. Та применяет функцию merge, чтобы объединить свое состояние с полученным и отправляет его еще одной реплике, и т. д..
Достаточные условия согласованности: 1. Множество возможных состояний образует полурешетку, т.е. частично упорядоченное множество с операцией наименьшей верхней грани, причем merge реализует эту операцию; 2. Обновления возрастают
Репликация на основе операций Реплика посылает не все состояние, а только обновление всем репликам. Согласованность можно гарантировать, если обновления коммутативны.