Колмогоровская сложность

Колмогоровскую сложность (Kolmogorov complexity) можно рассматривать как способ измерения количества информации в строке.

Но как понять, какое количество информации содержит в себе строка? Один из классических способов — это подсчет количества битов (число, пропорциональное длине строки). Рассмотрим следующий пример:

00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000

Понятно, что эту строку можно описать более компактно на естественном языке, "128 нулей", всего 9 символов.

Можем дать следующее определение. Количество информации, которое несет строка — это размер архива, полученного сжатием строки каким-то конкретным архиватором (например, LZW). Это более нетривиальная задача, но мы можем придумать строку, которая явно несет в себе мало информации, но которую архиватор тем не менее не сожмет.

Еще более сильное определение. Количество информации, которое несет строка — это размер архива, сжатого максимальным образом, самым лучшим архиватором. Но тогда встает вопрос, почему такой архиватор существует. На самом деле он есть, и в некотором смысле колмогоровская сложность строки — это размер наименьшей программы, которая печатает эту строку.

Содержание

1 Определения
- 1.1 Декомпрессор
- 1.2 Примеры
2 Свойства
- 2.1 Тривиальные свойства
- 2.2 Невычислимость
3 Применение
- 3.1 Альтернативное доказательство теоремы Гёделя о неполноте
- 3.2 Доказательство бесконечности простых чисел
4 Источники
5 Примечания

Определения

Декомпрессор

Определение:

Назовём декомпрессором алгоритм, восстанавливающий разжатый текст из сжатого.

Примечание: для простоты мы будем рассматривать бинарный алфавит, но все утверждения мы можем обобщить на строки произвольного алфавита.

Относительно каждого декомпрессора мы можем определить понятие сложности строки:

Определение:

Пусть , тогда назовем колмогоровской сложностью строки , размер минимальной строки , такой, что .
Если такого не существует, тогда .

Примеры

[math]D(x) = x[/math], тогда [math]K_D(x) = |x|[/math]
[math]D(x) = xx[/math], тогда

Определение:

Будем говорить, что декомпрессор лучше, чем декомпрессор , если .

Теорема:

Существует оптимальный декомпрессор , который лучше всех остальных.

Доказательство:

Пусть [math]p[/math] — некоторая строка, [math]|p| = n[/math]. Обозначим за [math]\hat{p}[/math] строку (мы удвоили каждый бит строки [math]p[/math] и добавили в конце [math]01[/math]).
Оптимальный декомпрессор будет работать следующим образом: , т.е. он интерпретирует [math]p[/math] как программу, а [math]x[/math] как входные данные и запускает [math]p[/math] на входе [math]x[/math]. Покажем, что такой декомпрессор будет лучше любого другого.
Пусть [math]D[/math] — другой декомпрессор. По определению [math]D[/math] — это алгоритм, значит есть программа, которая исполняет [math]D[/math].
[math]p[/math] — номер алгоритма [math]D,\ p = \#D[/math]. Тогда:
, т.к. [math]K_D(x)[/math] достигается на [math]D(y) = U(\hat{p}y) = x[/math], т.е. для этого [math]y[/math] есть строка [math]\hat{p}y[/math], которая даёт тот же самый результат и имеет длину не больше, чем на [math]2|p| + 2[/math].
Нетрудно заметить, что [math]2|p| + 2[/math] зависит только от [math]D[/math], но никак не зависит от [math]x[/math], т.е. является константой.

Следовательно, — оптимальный декомпрессор.

Определение:

Пусть — это оптимальный декомпрессор, тогда колмогоровская сложность .

Утверждение:

Очевидно, что если и — оптимальные декомпрессоры, то

Свойства

Тривиальные свойства

[math]KS(x) \leqslant |x| + c[/math]
Если [math]A[/math] — алгоритм, то
([math]A(x)[/math] запишем как пару — информация об алгоритме [math]A[/math] и информация о строке [math]x[/math], по предыдущему пункту нам нужно закодировать только сложность первого аргумента, что есть константа)
Принцип несжимаемости:
(Какой бы у нас ни был архиватор, он не может все строки фиксированной длины делать меньше. Строк длины меньшей, чем [math]n[/math] — [math](2^n-1)[/math], мы не сможем деархивировать)
[math]KS[/math] — невычислимая функция.

Докажем последнее свойство:

Невычислимость

Лемма:

Если — вычислимая функция, такая, что , тогда .

Доказательство:

Пусть , где [math]n \in N[/math], тогда [math]A(n)[/math] — вычислимая (т.к [math]f(x)[/math] — вычислима и ограничена), всюду определенная функция.

По свойству невозрастания при алгоритмических преобразованиях, .
Вспомним, что , следовательно .
Отсюда: , но ясно, что при больших это неравенство не выполняется. Противоречие.

Примечание: если функция [math]f(x)[/math] определена только на [math]M \subset \{0,1\}^*[/math], то лемма остается в силе с единственным отличием, что [math]x[/math] пробегает все значения из [math]M[/math] в порядке перечисления.

Утверждение (следствие из леммы):

невычислима.

Пусть вычислима. Возьмем вместо . Очевидно, что , но из принципа несжимаемости ясно, что неограничена. Противоречие. Следовательно, невычислима.

Применение

Альтернативное доказательство теоремы Гёделя о неполноте

Г. Хайтин^[1] заметил следующее:

Утверждение:

В данной фиксированной системе вывода существует недоказуемое утверждение вида

Выпишем множество пар [math]\{(x,n) |\ [/math] утверждение [math]KS(x) \geqslant n[/math] доказуемо [math]\}[/math]. Возможны два варианта:

Все [math]n \leqslant n_0[/math]. Это означает, что для всех строк будет доказуемо только [math]KS(x) \geqslant n_0[/math]. Но т.к. мы знаем, что [math]KS(x)[/math] неограничена, то существуют истинные, но недоказуемые утверждения.
В этом множестве встречаются сколь угодно большие [math]n[/math], т.е. есть бесконечная последовательность [math](x_i, n_i)[/math], в которой [math]n_{i+1} \gt n_i[/math]. Заметим, что эта последовательность задает график какой-то функции. А если график функции перечислим, то сама функция является вычислимой. Также заметим, что всегда выполняется условие [math]KS(x_i) \geqslant n_i[/math], т.е. эта вычислимая функция является нижней оценкой на [math]KS(x)[/math], а мы знаем, что такие функции обязаны быть ограниченными. Противоречие.

Заметим, что во всех множествах пар все [math]n[/math] ограничены какой-то константой, следовательно существует огромное число истинных, но недоказуемых утверждений вида [math]KS(x) \geqslant n[/math]

Доказательство бесконечности простых чисел

Утверждение:

Простых чисел бесконечно много.

Предположим, что простых чисел конечное число. Тогда любое число , где — это некоторая константа. Возьмём наибольшей колмогоровской сложности. Тогда , но также , т.к. . Но это неравенство не будет выполняться на достаточно больших , противоречие.

Источники

Примечания

↑ Грегори Джон Хайтин — аргентино-американский математик и информатик, внёс вклад в метаматематику, совместно с Андреем Колмогоровым считается основателем алгоритмической теории информации.

[chaitin-1] Грегори Джон Хайтин — аргентино-американский математик и информатик, внёс вклад в метаматематику, совместно с Андреем Колмогоровым считается основателем алгоритмической теории информации.

[1]

Колмогоровская сложность

Содержание

Определения

Декомпрессор

Примеры

Свойства

Тривиальные свойства

Невычислимость

Применение

Альтернативное доказательство теоремы Гёделя о неполноте

Доказательство бесконечности простых чисел

Источники

Примечания

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты