Примеры неразрешимых задач: проблема соответствий Поста — различия между версиями
Korolyov (обсуждение | вклад) м (→Источники информации: категории) |
м (rollbackEdits.php mass rollback) |
||
(не показано 25 промежуточных версий 4 участников) | |||
Строка 1: | Строка 1: | ||
'''Проблема соответствий Поста''' (англ. ''Post correspondence problem'') — один из основных примеров неразрешимой задачи, использующийся для доказательства неразрешимости многих других задач. | '''Проблема соответствий Поста''' (англ. ''Post correspondence problem'') — один из основных примеров неразрешимой задачи, использующийся для доказательства неразрешимости многих других задач. | ||
− | |||
− | |||
− | |||
{{Определение | {{Определение | ||
|definition= | |definition= | ||
− | Даны два конечных списка <tex>A = (a_1, \dots, a_n)</tex> и <tex>B = (b_1 ,\dots ,b_n)</tex>, где <tex>a_i \in \Sigma ^*</tex> и <tex>b_i \in \Sigma ^*</tex> для всех <tex>i</tex>. Вопрос существования непустой последовательности индексов <tex>(i_1 , \dots, i_k)</tex>, удовлетворяющей условию <tex>a_{i_1} \dots a_{i_k} = b_{i_1} \dots b_{i_k}</tex>, где <tex>1 \leqslant i_j \leqslant n</tex> для всех j, называется '''проблемой соответствий Поста (ПСП)'''. Такую последовательность индексов, в случае её существования, называют '''решением проблемы соответствий Поста'''. | + | Даны два конечных списка <tex>A = (a_1, \dots, a_n)</tex> и <tex>B = (b_1 ,\dots ,b_n)</tex>, где <tex>a_i \in \Sigma ^*</tex> и <tex>b_i \in \Sigma ^*</tex> для всех <tex>i</tex>. Вопрос существования непустой последовательности индексов <tex>(i_1 , \dots, i_k)</tex>, удовлетворяющей условию <tex>a_{i_1} \dots a_{i_k} = b_{i_1} \dots b_{i_k}</tex>, где <tex>1 \leqslant i_j \leqslant n</tex> для всех <tex>j</tex>, называется '''проблемой соответствий Поста (ПСП)'''. Такую последовательность индексов, в случае её существования, называют '''решением проблемы соответствий Поста'''. |
}} | }} | ||
− | { | + | == Примеры решений проблем соответствия Поста == |
− | | | + | |
− | + | === Пример 1 === | |
− | }} | + | {|class="wikitable" style="text-align: center" |
+ | |- | ||
+ | !Номер элемента | ||
+ | !<tex>1</tex> | ||
+ | !<tex>2</tex> | ||
+ | !<tex>3</tex> | ||
+ | |- | ||
+ | !<tex>A</tex> | ||
+ | |<tex>01</tex> | ||
+ | |<tex>1</tex> | ||
+ | |<tex>011</tex> | ||
+ | |- | ||
+ | !<tex>B</tex> | ||
+ | |<tex>101</tex> | ||
+ | |<tex>11</tex> | ||
+ | |<tex>01</tex> | ||
+ | |} | ||
+ | Решение этой проблемы соответствий Поста будет являться последовательность индексов <tex>(3, 1, 3, 2)</tex>. | ||
+ | Проверим это. | ||
+ | |||
+ | <tex>sA = 011, 01, 011, 1</tex> | ||
+ | |||
+ | <tex>sB = 01, 101, 01, 11</tex> | ||
+ | |||
+ | Получаем то, что строки <tex>sA</tex> и <tex>sB</tex> равны, а значит последовательность индексов <tex>(3, 1, 3, 2)</tex> является решением этой проблемы соотвествий Поста. | ||
+ | |||
+ | === Пример 2 === | ||
+ | Иногда возникает ситуация, когда решений конкретной проблемы соответствия Поста нет. | ||
+ | {|class="wikitable" style="text-align: center" | ||
+ | |- | ||
+ | !Номер элемента | ||
+ | !<tex>1</tex> | ||
+ | !<tex>2</tex> | ||
+ | !<tex>3</tex> | ||
+ | |- | ||
+ | !<tex>A</tex> | ||
+ | |<tex>01</tex> | ||
+ | |<tex>101</tex> | ||
+ | |<tex>011</tex> | ||
+ | |- | ||
+ | !<tex>B</tex> | ||
+ | |<tex>0</tex> | ||
+ | |<tex>10</tex> | ||
+ | |<tex>111</tex> | ||
+ | |} | ||
+ | |||
+ | Заметим, что если бы решение существовало оно должно было начинаться с индекса <tex>1</tex> или <tex>2</tex>. | ||
+ | Но тогда строки получаемые из <tex>A</tex> всегда будут строго больше по длине, чем строки полученные из <tex>B</tex>, так как <tex> \mathrm{length}(A[i]) \geqslant \mathrm{length}(B[i])</tex> для всех <tex>i</tex>. | ||
+ | |||
+ | Решения не существует. | ||
== Перечислимость языка ПСП == | == Перечислимость языка ПСП == | ||
Строка 20: | Строка 66: | ||
|proof= | |proof= | ||
Для списков <tex>A</tex> и <tex>B</tex> размера <tex>n</tex> из условия ПСП построим программу-полуразрешитель <tex>p</tex>, проверяющую все возможные решения: | Для списков <tex>A</tex> и <tex>B</tex> размера <tex>n</tex> из условия ПСП построим программу-полуразрешитель <tex>p</tex>, проверяющую все возможные решения: | ||
− | for <tex>m = 1 | + | '''for''' <tex>m = 1 \dots \infty</tex> |
− | + | '''foreach''' <tex>(i_1, i_2, \dots, i_m): 1 \leqslant i_j \leqslant n</tex> | |
− | if <tex>a_{i_1} \dots a_{i_m} = b_{i_1} \dots b_{i_m}</tex> | + | '''if''' <tex>a_{i_1} \dots a_{i_m} = b_{i_1} \dots b_{i_m}</tex> |
− | return true | + | '''return''' ''true'' |
+ | |||
Таким образом, язык пар последовательностей, для которых существует решение ПСП, полуразрешим, а значит, перечислим. | Таким образом, язык пар последовательностей, для которых существует решение ПСП, полуразрешим, а значит, перечислим. | ||
}} | }} | ||
− | + | == Неразрешимость языка ПСП == | |
− | == | + | {{Определение |
+ | |definition= | ||
+ | Проблема соответствий Поста, для которой фиксирован элемент последовательности индексов <tex>i_1 = 1</tex>, называется '''модифицированной проблемой соответствий Поста (МПСП)'''. | ||
+ | }} | ||
− | Докажем [[Разрешимые (рекурсивные) языки|неразрешимость]] языка ПСП следующим образом. Докажем, что универсальный язык [[M-сводимость|сводится]] к языку МПСП, который в свою очередь сводится к языку ПСП. | + | Докажем [[Разрешимые (рекурсивные) языки|неразрешимость]] языка ПСП следующим образом. Докажем, что универсальный язык [[M-сводимость|сводится]] к языку МПСП, который в свою очередь сводится к языку ПСП. При этом отметим, что для унарного алфавита ПСП разрешима. |
− | + | === Cведение МПСП к ПСП === | |
Пусть даны списки <tex>A</tex> и <tex>B</tex> из условия МПСП. Построим два новых списка <tex>C</tex> и <tex>D</tex> и рассмотрим ПСП для них. Для этого введем два новых символа, которые не используются в словах из цепочек <tex>A</tex> и <tex>B</tex>. Пусть для определенности это будут символы <tex>\#</tex> и <tex>\$</tex>. | Пусть даны списки <tex>A</tex> и <tex>B</tex> из условия МПСП. Построим два новых списка <tex>C</tex> и <tex>D</tex> и рассмотрим ПСП для них. Для этого введем два новых символа, которые не используются в словах из цепочек <tex>A</tex> и <tex>B</tex>. Пусть для определенности это будут символы <tex>\#</tex> и <tex>\$</tex>. | ||
Тогда сформируем два новых списка <tex>C, D</tex> по следующим правилам: | Тогда сформируем два новых списка <tex>C, D</tex> по следующим правилам: | ||
− | * | + | * для всех <tex>i = 1 \dots n</tex> возьмем <tex>c_i</tex> равное слову <tex>a_i</tex> с символом <tex>\#</tex> после каждого его символа. Например, для <tex>a_i = 10zx</tex> положим <tex>c_i = 1\#0\#z\#x\#</tex>, |
− | * | + | * для всех <tex>i = 1 \dots n</tex> возьмем <tex>d_i</tex> равное слову <tex>b_i</tex> с символом <tex>\#</tex> перед каждым его символом. Например, для <tex>b_i = 10zx</tex> положим <tex>d_i = \#1\#0\#z\#x</tex>, |
− | * <tex>c_0 = \#c_1</tex> | + | * <tex>c_0 = \#c_1</tex>, |
− | * <tex>d_0 = d_1</tex> | + | * <tex>d_0 = d_1</tex>, |
− | * <tex>c_{n+1} = \$</tex> | + | * <tex>c_{n+1} = \$</tex>, |
* <tex>d_{n+1} = \#\$</tex>. | * <tex>d_{n+1} = \#\$</tex>. | ||
Строка 74: | Строка 124: | ||
В любом существующем решении ПСП для списков <tex>C, D</tex> должны выполняться условия: | В любом существующем решении ПСП для списков <tex>C, D</tex> должны выполняться условия: | ||
− | * <tex>i_1 = 0</tex>, так как только в паре <tex>(c_1, d_1)</tex> первые символы совпадают | + | * <tex>i_1 = 0</tex>, так как только в паре <tex>(c_1, d_1)</tex> первые символы совпадают, |
* последний индекс равен <tex>n+1</tex>, так как только в паре <tex>(c_{n+1}, d_{n+1})</tex> строки заканчиваются одинаковыми символами. | * последний индекс равен <tex>n+1</tex>, так как только в паре <tex>(c_{n+1}, d_{n+1})</tex> строки заканчиваются одинаковыми символами. | ||
Строка 89: | Строка 139: | ||
<tex>a_1 a_{i_2} \dots a_{i_{f-1}} = b_1 b_{i_2} \dots b_{i_{f-1}}</tex>. | <tex>a_1 a_{i_2} \dots a_{i_{f-1}} = b_1 b_{i_2} \dots b_{i_{f-1}}</tex>. | ||
− | Итого, если <tex>(0, i_2, \dots, i_k, n+1)</tex> | + | Итого, если <tex>(0, i_2, \dots, i_k, n+1)</tex> — решение ПСП, то <tex>(1, i_2, \dots, i_k)</tex> — решение исходной МПСП. |
}} | }} | ||
− | + | === Сведение универсального языка к МПСП === | |
{{Определение | {{Определение | ||
|definition= | |definition= | ||
Строка 103: | Строка 153: | ||
<tex>\$ snap_1 \$ snap_2 \$ \dots \$ snap_n \$ snap_{n_{-1}} \$ snap_{n_{-2}} \$ \dots \$ \#_{yes} \$ \$</tex>, | <tex>\$ snap_1 \$ snap_2 \$ \dots \$ snap_n \$ snap_{n_{-1}} \$ snap_{n_{-2}} \$ \dots \$ \#_{yes} \$ \$</tex>, | ||
− | где <tex>snap_i</tex> — снимки последовательных состояний МТ от стартового до конечного, <tex>snap_{n_{-t}}</tex> — последний снимок с <tex>t</tex> удалёнными символами, а <tex>\$</tex> | + | где <tex>snap_i</tex> — снимки последовательных состояний МТ от стартового до конечного, <tex>snap_{n_{-t}}</tex> — последний снимок с <tex>t</tex> удалёнными символами, а <tex>\$</tex> — символ, не принадлежащий алфавиту ленты и алфавиту входных слов. Оговоримся, что отвергающего состояния <tex>no</tex> в автомате МТ не существует, а допуск происходит при попадании в состояние <tex>yes</tex>. |
Сформируем списки <tex>A</tex> и <tex>B</tex> по МТ <tex>M</tex> и входной строке <tex>w</tex>. Будем добавлять пары цепочек в эти списки по следующим правилам: | Сформируем списки <tex>A</tex> и <tex>B</tex> по МТ <tex>M</tex> и входной строке <tex>w</tex>. Будем добавлять пары цепочек в эти списки по следующим правилам: | ||
Строка 165: | Строка 215: | ||
|- | |- | ||
! Номер элемента | ! Номер элемента | ||
− | ! | + | ! <tex>A</tex> |
− | ! | + | ! <tex>B</tex> |
|- | |- | ||
|1 | |1 | ||
Строка 310: | Строка 360: | ||
Скомбинировав обе леммы, мы сведем универсальный язык к языку ПСП, а так как универсальный язык неразрешим, то и ПСП — неразрешима. | Скомбинировав обе леммы, мы сведем универсальный язык к языку ПСП, а так как универсальный язык неразрешим, то и ПСП — неразрешима. | ||
}} | }} | ||
+ | |||
+ | == См. также == | ||
+ | * [[Неразрешимость исчисления предикатов первого порядка]] | ||
+ | * [[Примеры неразрешимых задач: задача о выводе в полусистеме Туэ|Задача о выводе в полусистеме Туэ]] | ||
+ | * [[Примеры неразрешимых задач: задача о замощении|Задача о замощении]] | ||
+ | * [[Примеры неразрешимых задач: однозначность грамматики|Однозначность грамматики]] | ||
+ | * [[Неразрешимость задачи об эквивалентности КС-грамматик]] | ||
+ | * [[Неразрешимость проблемы существования решения диофантова уравнения в целых числах]] | ||
== Источники информации == | == Источники информации == | ||
* Хопкрофт Д., Мотвани Р., Ульман Д. Введение в теорию автоматов, языков и вычислений, 2-е изд. : Пер. с англ. — М.:Издательский дом «Вильямс», 2008. — С. 528. — ISBN 5-8459-1347-0 | * Хопкрофт Д., Мотвани Р., Ульман Д. Введение в теорию автоматов, языков и вычислений, 2-е изд. : Пер. с англ. — М.:Издательский дом «Вильямс», 2008. — С. 528. — ISBN 5-8459-1347-0 | ||
− | * [http://en.wikipedia.org/wiki/Post_correspondence_problem Post correspondence problem | + | * [http://en.wikipedia.org/wiki/Post_correspondence_problem Wikipedia — Post correspondence problem] |
[[Категория: Теория формальных языков]] | [[Категория: Теория формальных языков]] | ||
[[Категория: Теория вычислимости]] | [[Категория: Теория вычислимости]] | ||
[[Категория: Примеры неразрешимых задач]] | [[Категория: Примеры неразрешимых задач]] |
Текущая версия на 19:41, 4 сентября 2022
Проблема соответствий Поста (англ. Post correspondence problem) — один из основных примеров неразрешимой задачи, использующийся для доказательства неразрешимости многих других задач.
Определение: |
Даны два конечных списка | и , где и для всех . Вопрос существования непустой последовательности индексов , удовлетворяющей условию , где для всех , называется проблемой соответствий Поста (ПСП). Такую последовательность индексов, в случае её существования, называют решением проблемы соответствий Поста.
Содержание
Примеры решений проблем соответствия Поста
Пример 1
Номер элемента | |||
---|---|---|---|
Решение этой проблемы соответствий Поста будет являться последовательность индексов
. Проверим это.
Получаем то, что строки
и равны, а значит последовательность индексов является решением этой проблемы соотвествий Поста.Пример 2
Иногда возникает ситуация, когда решений конкретной проблемы соответствия Поста нет.
Номер элемента | |||
---|---|---|---|
Заметим, что если бы решение существовало оно должно было начинаться с индекса
или . Но тогда строки получаемые из всегда будут строго больше по длине, чем строки полученные из , так как для всех .Решения не существует.
Перечислимость языка ПСП
Теорема: |
Язык пар последовательностей, для которых существует решение ПСП, перечислим. |
Доказательство: |
Для списков и размера из условия ПСП построим программу-полуразрешитель , проверяющую все возможные решения:forТаким образом, язык пар последовательностей, для которых существует решение ПСП, полуразрешим, а значит, перечислим. foreach if return true |
Неразрешимость языка ПСП
Определение: |
Проблема соответствий Поста, для которой фиксирован элемент последовательности индексов | , называется модифицированной проблемой соответствий Поста (МПСП).
Докажем неразрешимость языка ПСП следующим образом. Докажем, что универсальный язык сводится к языку МПСП, который в свою очередь сводится к языку ПСП. При этом отметим, что для унарного алфавита ПСП разрешима.
Cведение МПСП к ПСП
Пусть даны списки
и из условия МПСП. Построим два новых списка и и рассмотрим ПСП для них. Для этого введем два новых символа, которые не используются в словах из цепочек и . Пусть для определенности это будут символы и .Тогда сформируем два новых списка
по следующим правилам:- для всех возьмем равное слову с символом после каждого его символа. Например, для положим ,
- для всех возьмем равное слову с символом перед каждым его символом. Например, для положим ,
- ,
- ,
- ,
- .
Лемма: |
МПСП для пары списков сводится к ПСП для пары списков . |
Доказательство: |
Из определения m-сведения следует, что мы должны доказать равносильность наличия решения для построенных экземпляров МПСП и ПСП.
Пусть набор индексов — решение МПСП из условия леммы. То есть , где, . Рассмотрев цепочки и c аналогичными индексами, заметим, что мы имеем почти равные цепочки с той лишь разницей, что первой не хватает символа в начале, а второй — в конце. Конкретно,. Изменив первый индекс с на , решим проблему с символом в начале. Добавив индекс к набору, решим проблему с символом в конце.. Итого, если — решение исходной МПСП, то — решение построенной по правилам выше ПСП.
В любом существующем решении ПСП для списков должны выполняться условия:
Пусть последовательность является решением ПСП. Иными словами,. Если — наименьший индекс, равный , то , — префиксы исходных конкатенаций до первого символа , следовательно, равны между собой. Последовательность — также решение ПСП, причём первый индекс равен и . Остальные индексы не превосходят , но и не равны , иначе в левой части равенства образуется подстрока из двух подряд, а в правой её не может быть. Учитывая эти ограничения, перепишем получившееся равенство:. Оставив из этих двух строк символы, стоящие на чётных позициях, и удалив с конца , получимИтого, если . — решение ПСП, то — решение исходной МПСП. |
Сведение универсального языка к МПСП
Определение: |
Назовём снимком состояния МТ строку вида , где — строка на ленте, за исключением бесконечных последовательностей пробелов слева и справа, — текущее состояние автомата МТ, головка расположена справа от . |
Построим списки
и таким образом, чтобы решение МПСП образовывало строку,
где
— снимки последовательных состояний МТ от стартового до конечного, — последний снимок с удалёнными символами, а — символ, не принадлежащий алфавиту ленты и алфавиту входных слов. Оговоримся, что отвергающего состояния в автомате МТ не существует, а допуск происходит при попадании в состояние .Сформируем списки
и по МТ и входной строке . Будем добавлять пары цепочек в эти списки по следующим правилам:- 1. , . По определению МПСП эта пара всегда будет первой в любом решении.
- 2. , для всех символов алфавита ленты.
- 3. , .
- 4. , для всех правил вида и для всех символов алфавита .
- 5. , для всех правил вида .
- 6. , для всех правил вида .
Заметим, что все элементы
и , кроме первых, имеют одинаковую длину. Значит, строка, составленная из элементов , всегда оказывается длиннее. Если представить процесс формирования решения МПСП как динамический, то строка из элементов вынуждена постоянно "догонять" первую. Более того, можно заметить, что вторая строка всегда будет отставать ровно на один снимок. Действительно, первая пара из списков и задает это отставание. Затем при помощи элементов из правил , и мы имитируем переход машины Тьюринга, добавляя во вторую строку то состояние и положение головки, которые были до перехода, а в первую строку - то состояние, положение головки и новый ленточный символ, которые стали после перехода. Нетрудно заметить, что тем самым строка составленная из элементов списка будет соответствовать строке из элементов списка , но с отставанием на один переход. Далее с помощью элементов из правил и мы допишем в обе строки одинаковые суффиксы текущего снимка, разделитель и префикс нового снимка до следующего перехода машины Тьюринга. Таким образом если первая строка равна,
то вторая будет равна
,
а через несколько шагов они изменятся на
и
,
соответственно.
Теперь стоит новая задача — получить равные строки, если состояние
достижимо. Для этого добавим в уже имеющиеся последовательности элементы по следующим правилам:- 7. , , для всех символов алфавита ленты.
- 8. , , для всех символов алфавита ленты.
- 9. , .
Если состояние
недостижимо, в первой строке никогда не будет символа , и ни одним из новых элементов воспользоваться не удастся. Значит, строки всегда будут иметь различную длину.Если же допускающее состояние встретится, то "съедая" по одному символу с помощью элементов правил
и и копируя все остальные с помощью элементов из правил и можно будет привести строки к виду
и
.
И наконец, с помощью элементов из правила
сравняем строки.Пример
Пусть автомат МТ состоит из двух состояний
и , алфавит ленты содержит символы и . Переходы автомата устроены следующим образом:;
;
из
переходов нет.Списки
и для строки будут сформированы следующим образом:Номер элемента | ||
---|---|---|
1 | ||
2 | ||
3 | ||
4 | ||
5 | ||
6 | ||
7 | ||
8 | ||
9 | ||
10 | ||
11 |
Решение МПСП будет иметь следующий вид:
Шаг | Индекс элемента | Первая строка | Вторая строка |
---|---|---|---|
1 | 1 | ||
2 | 5 | ||
3 | 3 | ||
4 | 4 | ||
5 | 3 | ||
6 | 6 | ||
7 | 4 | ||
8 | 8 | ||
9 | 3 | ||
10 | 4 | ||
11 | 10 | ||
12 | 4 | ||
13 | 11 |
Лемма: |
Универсальный язык сводится к МПСП. |
Доказательство: |
Из определения m-сведения следует, что мы должны доказать, что машина Тьюринга допускает тогда и только тогда, когда построенный экземпляр МПСП имеет решение.
Если допускается , то можно проимитировать работу со входом и, как показано в примере выше, получить равные строки из элементов списков и . То есть найти решение МПСП.Поскольку все решения МПСП должны начинаться с первой пары, то длина соответствующих строк будет различаться, и, как было сказано выше, если в первой строке никогда не будет символа , то "сравнять" строки по длине не удастся. Значит, если МПСП имеет решение, то символ рано или поздно появится. А значит и машина Тьюринга допустит . |
Теорема: |
ПСП не разрешима. |
Доказательство: |
Скомбинировав обе леммы, мы сведем универсальный язык к языку ПСП, а так как универсальный язык неразрешим, то и ПСП — неразрешима. |
См. также
- Неразрешимость исчисления предикатов первого порядка
- Задача о выводе в полусистеме Туэ
- Задача о замощении
- Однозначность грамматики
- Неразрешимость задачи об эквивалентности КС-грамматик
- Неразрешимость проблемы существования решения диофантова уравнения в целых числах
Источники информации
- Хопкрофт Д., Мотвани Р., Ульман Д. Введение в теорию автоматов, языков и вычислений, 2-е изд. : Пер. с англ. — М.:Издательский дом «Вильямс», 2008. — С. 528. — ISBN 5-8459-1347-0
- Wikipedia — Post correspondence problem