Теорема о рекурсии — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
м
м (rollbackEdits.php mass rollback)
 
(не показано 113 промежуточных версий 26 участников)
Строка 1: Строка 1:
Говоря неформально, теорема о рекурсии позволяет утверждать, что любая программа может использовать внутри себя свой исходный код (номер), который ей передали в качестве параметра.
+
==Теорема о рекурсии==
 +
 
 +
Рассмотрим произвольную вычислимую функцию от двух аргументов — <tex>V(x, y)</tex>. Теорема о рекурсии утверждает, что всегда можно найти эквивалентную ей <tex>p(y) = V(p, y)</tex>, которая будет использовать саму себя для вычисления значения. Сформулируем теорему более формально.
 
{{Теорема
 
{{Теорема
 
|id=th1
 
|id=th1
|about=О рекурсии
+
|author=Клини
|statement=Для <tex>\forall</tex> [[Вычислимые функции|вычислимой функции]] от двух аргументов <tex>V(x, y)</tex> <tex>\exists</tex> [[Вычислимые функции|вычислимая функция]] <tex>r(y) : r(y) = V(r, y).</tex>
+
|about=о рекурсии / ''Kleene's recursion theorem''
 +
|statement= Пусть <tex>V(n, x)</tex> {{---}} [[Вычислимые функции|вычислимая функция]]. Тогда найдётся такая вычислимая <tex>p</tex>, что <tex>\forall y:</tex> <tex>p(y) = V(p, y)</tex>.
 
|proof=
 
|proof=
Пусть <tex>V(x,y)</tex> - любая вычислимая функция. Напишем программу для r(y).
+
Приведем конструктивное доказательство теоремы.
  
<code><font size = "3em">
+
Введем новые обозначения для псевдокода. Внутри блока '''program''' располагаются функции, среди которых есть функция <tex>\mathrm{main}</tex>:
  r(y){
+
'''program int''' p('''int''' x):
      V(x,y);
+
  ...
 
   
 
   
      main() {
+
  '''int''' main():
          return V(getSrc(), y)
+
    ...
      }
 
 
    
 
    
      string getSrc() {
+
  ...
          string tmp = getOtherSrc();
+
Тогда вызов <tex>\mathrm{p(x)}</tex> — вызов функции <tex>\mathrm{main}</tex> от соответствующего аргумента.
          return (tmp + "string getOtherSrc() {" + "\n" + "return" + tmp + "\n" + "}";
+
 
      }
+
Все входные данные далее можно интерпретировать как строки, поэтому все типы аргументов и возвращаемых значений будут иметь тип '''string'''. Пусть есть вычислимая <tex>V(x,y)</tex>. Будем поэтапно строить функцию <tex>p(y)</tex>. <br> Предположим, что у нас в распоряжении есть функция <tex>\mathrm{getSrc()}</tex>, которая вернет код <tex>p(y)</tex>. Тогда саму <tex>p(y)</tex> можно переписать так:
    
+
'''program string''' p('''string''' y):
      string getOtherSrc() {
+
    '''string''' V('''string''' x, '''string''' y):
          return /* весь код до функции getOtherSrc() */
+
      ...
      }  
+
   }
+
    '''string''' main():
</font></code>
+
      '''return''' V(getSrc(), y)
 +
 +
    '''string''' getSrc():
 +
      ...
 +
Теперь нужно определить функцию <tex>\mathrm{getSrc()}</tex>. Предположим, что внутри <tex>p(y)</tex> мы можем определить функцию <tex>\mathrm{getOtherSrc()}</tex>, состоящую из одного оператора <tex>\mathrm{return}</tex>, которая вернет весь предшествующий ей код. Тогда <tex>p(y)</tex> перепишется так.
 +
 
 +
'''program string''' p('''string''' y):
 +
    '''string''' V('''string''' x, '''string''' y):
 +
      ...
 +
 +
    '''string''' main():
 +
      '''return''' V(getSrc(), y)
 +
 +
    '''string''' getSrc():
 +
      '''string''' src = getOtherSrc()
 +
      '''return''' ```$src                    <font color="green">// символ $ перед названием переменной используется для подстановки значения этой переменной в строку</font>
 +
                <nowiki>|</nowiki>string getOtherSrc():  <font color="green">// многострочные строки заключаются в ``` и используют <nowiki>|</nowiki> в качестве разделителя</font>
 +
                <nowiki>|</nowiki>    return $src```
 +
 +
    '''string''' getOtherSrc():
 +
    ...
 +
 
 +
Теперь <tex>\mathrm{getOtherSrc()}</tex> определяется очевидным образом, и мы получаем '''итоговую версию''' функции <tex>p(y)</tex>:
 +
<code>
 +
'''program string''' p('''string''' y):
 +
    '''string''' V('''string''' x, '''string''' y):
 +
      ...
 +
 +
    '''string''' main():
 +
      '''return''' V(getSrc(), y)
 +
 +
    '''string''' getSrc():
 +
      '''string''' src = getOtherSrc()
 +
      '''return''' ```$src
 +
                <nowiki>|</nowiki>string getOtherSrc():
 +
                <nowiki>|</nowiki>    return $src```
 +
 +
    '''string''' getOtherSrc():
 +
      '''return''' ```function  p(int y):     
 +
                <nowiki>|</nowiki>  int V(string x, int y):
 +
                <nowiki>|</nowiki>    ...
 +
                <nowiki>|</nowiki>
 +
                <nowiki>|</nowiki>  int main():
 +
                <nowiki>|</nowiki>    return V(getSrc(), y)
 +
                <nowiki>|</nowiki>
 +
                <nowiki>|</nowiki>  string getSrc():
 +
                <nowiki>|</nowiki>    string src = getOtherSrc()
 +
                <nowiki>|</nowiki>    return \```$src
 +
                <nowiki>|</nowiki>              <nowiki>|</nowiki>string getOtherSrc():
 +
                <nowiki>|</nowiki>              <nowiki>|</nowiki>  return \$src\```
 +
</code>
 +
}}
 +
 +
Иначе говоря, если рассмотреть <tex>V(x, y)</tex>, как программу, использующую <tex>x</tex> в качестве исходного кода и выполняющую действие над <tex>y</tex>, то теорема о рекурсии показывает, что мы можем написать эквивалентную ей программу <tex>p(y) = V(p, y)</tex>, которая будет использовать собственный исходный код.
 +
 
 +
Приведем так же альтернативную формулировку теоремы и альтернативное (неконструктивное) доказательство.
 +
 
 +
==Теорема о неподвижной точке==
 +
Введем на множестве натуральных чисел следующее отношение: <tex>x \equiv y \Leftrightarrow U_x = U_y</tex> и докажем вспомогательную лемму.
 +
{{Определение
 +
|definition = Функция <tex>g</tex> называется '''<tex>\equiv</tex> {{---}} продолжением (<tex>\equiv</tex> {{---}} continuation)''' функции <tex>f</tex>, если для всех таких <tex>x</tex>, что <tex>f(x)</tex> определено, <tex>g(x) \equiv f(x)</tex>.
 +
}}
 +
{{Лемма
 +
|statement= Для всякой вычислимой функции <tex>f</tex> существует вычислимая и всюду определенная функция <tex>g</tex>, являющаяся ее <tex>\equiv</tex> {{---}} продолжением.
 +
|proof= Рассмотрим вычислимую функцию от двух аргументов <tex> V(n, x) = U(f(n), x)</tex>. Так как <tex>V</tex> — вычислимая, то существует вычислимая и всюду определенная функция <tex>s(n)</tex> такая, что: <tex>V(n, x) = U(s(n), x)</tex>.
 +
 
 +
Покажем, что <tex>s(n)</tex> будет являться <tex>\equiv</tex> {{---}} продолжением функции <tex>f(n)</tex>. Если <tex>f(n)</tex> определено, то <tex>s(n)</tex> вернет другой номер той же вычислимой функции. Если же <tex>f(n)</tex> не определено, то <tex>s(n)</tex> вернет номер нигде не определенной функции.
 +
Таким образом, мы нашли <tex>\equiv</tex> {{---}} продолжение для произвольно взятой вычислимой функции <tex>f</tex>.
 +
}}
 +
{{Теорема
 +
|id=th2
 +
|author=Роджерс
 +
|about=о неподвижной точке / ''Rogers' fixed-point theorem''
 +
|statement= Пусть <tex>U</tex> {{---}} [[Диагональный_метод|универсальная функция]] для класса вычислимых функций одного аргумента, <tex>h</tex> {{---}} всюду определённая [[Вычислимые_функции|вычислимая функция]] одного аргумента. Тогда найдется такое <tex>n</tex>, что <tex>U_n=U_{h(n)}</tex>, то есть <tex>n</tex> и <tex>h(n)</tex> — номера одной функции.
 +
|proof=
 +
Будем доказывать теорему от противного: предположим, что существует всюду определенная вычислимая функция <tex>h</tex>, такая, что <tex>U_n \neq U_{h(n)}</tex> для любого <tex>n</tex>. В терминах введенного нами отношения, это значит, что <tex>h</tex> не имеет <tex>\equiv</tex> {{---}} неподвижных точек.
 +
 
 +
Рассмотрим некоторую вычислимую функцию, от которой никакая вычислимая функция не может отличаться всюду. Такой будет, например <tex>f(x) = U(x, x)</tex> (действительно, если предположить, что существует вычислимая функция <tex>g(n)</tex>, всюду отличная от <tex>f(n) = U(n, n)</tex>, то нарушается определение универсальной функции.)
 +
 
 +
Согласно доказанной нами лемме, существует вычислимая и всюду определенная функция <tex>g(x)</tex>, являющаяся <tex>\equiv</tex> {{---}} продолжением функции <tex>f(x)</tex>. Давайте зададим функцию <tex>t(x)</tex> следующим образом: <tex>t(x) = h(g(x))</tex>, где <tex>h(x)</tex> — искомая всюду определенная, вычислимая функция, не имеющая <tex>\equiv</tex> {{---}} неподвижных точек. Тогда <tex>t(x)</tex> всюду отличается от <tex>f(x)</tex> (в силу того, что <tex>h(x)</tex> не имеет неподвижных точек.) Получили противоречие, из чего следует, что такой функции <tex>h</tex> не существует.
 +
}}
 +
 
 +
 
 +
{{Утверждение
 +
|id=идентификатор (необязательно), пример: proposalF.
 +
|statement = <tex> \exists n : W_n = \{n\} </tex>, где <tex> W_n </tex> {{---}} множество слов, допускаемых программой с номером <tex> n </tex>.
 +
|proof=
 +
По [[Теорема о рекурсии | теореме о рекурсии]], программа может знать свой исходный код. Значит, в неё можно написать функцию <tex> \mathrm{getSrc()} </tex>, которая вернёт строку {{---}} исходный код программы.
 +
Напишем такую программу:
 +
 
 +
   <tex>p(q){:}</tex>
 +
    '''if''' <tex>p.\mathrm{getSrc()}</tex> == <tex>q.\mathrm{getSrc()}</tex>
 +
      '''return''' 1
 +
    '''else'''
 +
      '''while''' ''true''
 +
 
 +
Программа <tex> p </tex> знает свой код, что то же самое, что и знает свой номер. Как видно из её кода, она допускает только одно число {{---}} свой номер.
 +
}}
 +
 
 +
==Пример использования теоремы о рекурсии в доказательстве неразрешимости языка==
 +
Используя теорему о рекурсии, приведём простое доказательство неразрешимости языка <tex>L=\{p \mid p(\varepsilon)=\perp\}</tex>.
 +
{{Лемма
 +
|id=st2
 +
|statement= Язык <tex>L=\{p \mid p(\varepsilon)=\perp\}</tex> неразрешим.
 +
|proof=
 +
Предположим обратное. Тогда существует программа <tex>r</tex>, разрешающая <tex>L</tex>.
 +
Рассмотрим следующую программу:
 +
 
 +
   p(x):
 +
    '''if''' r(getSrc())
 +
      '''return''' 1
 +
    '''while''' ''true''
 +
 
 +
Пусть <tex>p(\varepsilon)=\perp</tex>. Тогда условие <tex>r(p)</tex> выполняется и <tex>p(\varepsilon)=1</tex>. Противоречие. Если <tex>p(\varepsilon) \ne \perp</tex>, то <tex>r(p)</tex> не выполняется и <tex>p(\varepsilon)=\perp</tex>. Противоречие.
 
}}
 
}}
'''Замечание:''' программа r(y) печатает свой текст. Она написана в соответствии со следующей неформальной инструкцией:
 
  
Напечатать два раза, второй раз в кавычках, такой текст: "Напечатать два раза, второй раз в кавычках, такой текст:"
+
==См. также==
 +
*[[Участник:Shersh/Теорема_о_рекурсии]]
 +
 
 +
==Источники информации==
 +
* [[wikipedia:Kleene's_recursion_theorem | Wikipedia {{---}} Kleene's recursion theorem]]
 +
* ''Верещагин Н. К., Шень А.'' '''Лекции по математической логике и теории алгоритмов. Часть 3. Вычислимые функции''' — М.: МЦНМО, 1999 - С. 176
 +
* ''Kleene, Stephen'' '''On notation for ordinal numbers''' - The Journal of Symbolic Logic, 1938 - С. 150-155
  
==Источники==
+
[[Категория: Теория формальных языков]]
Н. К. Верещагин,  А. Шень. Лекции по математической логике и теории алгоритмов. Часть 3. Вычислимые функции. -- М.: МЦНМО, 1999
+
[[Категория: Теория вычислимости]]
 +
[[Категория:Разрешимые и перечислимые языки]]

Текущая версия на 19:18, 4 сентября 2022

Теорема о рекурсии

Рассмотрим произвольную вычислимую функцию от двух аргументов — [math]V(x, y)[/math]. Теорема о рекурсии утверждает, что всегда можно найти эквивалентную ей [math]p(y) = V(p, y)[/math], которая будет использовать саму себя для вычисления значения. Сформулируем теорему более формально.

Теорема (Клини, о рекурсии / Kleene's recursion theorem):
Пусть [math]V(n, x)[/math]вычислимая функция. Тогда найдётся такая вычислимая [math]p[/math], что [math]\forall y:[/math] [math]p(y) = V(p, y)[/math].
Доказательство:
[math]\triangleright[/math]

Приведем конструктивное доказательство теоремы.

Введем новые обозначения для псевдокода. Внутри блока program располагаются функции, среди которых есть функция [math]\mathrm{main}[/math]:

program int p(int x):
  ...

  int main():
    ...
 
 ...

Тогда вызов [math]\mathrm{p(x)}[/math] — вызов функции [math]\mathrm{main}[/math] от соответствующего аргумента.

Все входные данные далее можно интерпретировать как строки, поэтому все типы аргументов и возвращаемых значений будут иметь тип string. Пусть есть вычислимая [math]V(x,y)[/math]. Будем поэтапно строить функцию [math]p(y)[/math].
Предположим, что у нас в распоряжении есть функция [math]\mathrm{getSrc()}[/math], которая вернет код [math]p(y)[/math]. Тогда саму [math]p(y)[/math] можно переписать так:

program string p(string y): 
   string V(string x, string y):
      ...

   string main():
      return V(getSrc(), y)

   string getSrc():
      ...

Теперь нужно определить функцию [math]\mathrm{getSrc()}[/math]. Предположим, что внутри [math]p(y)[/math] мы можем определить функцию [math]\mathrm{getOtherSrc()}[/math], состоящую из одного оператора [math]\mathrm{return}[/math], которая вернет весь предшествующий ей код. Тогда [math]p(y)[/math] перепишется так.

program string p(string y): 
   string V(string x, string y):
      ...

   string main():
      return V(getSrc(), y)

   string getSrc():
      string src = getOtherSrc()
      return ```$src                    // символ $ перед названием переменной используется для подстановки значения этой переменной в строку
               |string getOtherSrc():   // многострочные строки заключаются в ``` и используют | в качестве разделителя
               |    return $src```

   string getOtherSrc():
    ...

Теперь [math]\mathrm{getOtherSrc()}[/math] определяется очевидным образом, и мы получаем итоговую версию функции [math]p(y)[/math]:

program string p(string y): 
   string V(string x, string y):
      ...

   string main():
      return V(getSrc(), y)

   string getSrc():
      string src = getOtherSrc()
      return ```$src 
               |string getOtherSrc(): 
               |    return $src```

   string getOtherSrc():
      return ```function  p(int y):       
               |  int V(string x, int y):
               |    ...
               |
               |  int main():
               |    return V(getSrc(), y)
               |
               |  string getSrc():
               |    string src = getOtherSrc()
               |    return \```$src 
               |              |string getOtherSrc(): 
               |              |   return \$src\```
[math]\triangleleft[/math]

Иначе говоря, если рассмотреть [math]V(x, y)[/math], как программу, использующую [math]x[/math] в качестве исходного кода и выполняющую действие над [math]y[/math], то теорема о рекурсии показывает, что мы можем написать эквивалентную ей программу [math]p(y) = V(p, y)[/math], которая будет использовать собственный исходный код.

Приведем так же альтернативную формулировку теоремы и альтернативное (неконструктивное) доказательство.

Теорема о неподвижной точке

Введем на множестве натуральных чисел следующее отношение: [math]x \equiv y \Leftrightarrow U_x = U_y[/math] и докажем вспомогательную лемму.

Определение:
Функция [math]g[/math] называется [math]\equiv[/math] — продолжением ([math]\equiv[/math] — continuation) функции [math]f[/math], если для всех таких [math]x[/math], что [math]f(x)[/math] определено, [math]g(x) \equiv f(x)[/math].
Лемма:
Для всякой вычислимой функции [math]f[/math] существует вычислимая и всюду определенная функция [math]g[/math], являющаяся ее [math]\equiv[/math] — продолжением.
Доказательство:
[math]\triangleright[/math]

Рассмотрим вычислимую функцию от двух аргументов [math] V(n, x) = U(f(n), x)[/math]. Так как [math]V[/math] — вычислимая, то существует вычислимая и всюду определенная функция [math]s(n)[/math] такая, что: [math]V(n, x) = U(s(n), x)[/math].

Покажем, что [math]s(n)[/math] будет являться [math]\equiv[/math] — продолжением функции [math]f(n)[/math]. Если [math]f(n)[/math] определено, то [math]s(n)[/math] вернет другой номер той же вычислимой функции. Если же [math]f(n)[/math] не определено, то [math]s(n)[/math] вернет номер нигде не определенной функции.

Таким образом, мы нашли [math]\equiv[/math] — продолжение для произвольно взятой вычислимой функции [math]f[/math].
[math]\triangleleft[/math]
Теорема (Роджерс, о неподвижной точке / Rogers' fixed-point theorem):
Пусть [math]U[/math]универсальная функция для класса вычислимых функций одного аргумента, [math]h[/math] — всюду определённая вычислимая функция одного аргумента. Тогда найдется такое [math]n[/math], что [math]U_n=U_{h(n)}[/math], то есть [math]n[/math] и [math]h(n)[/math] — номера одной функции.
Доказательство:
[math]\triangleright[/math]

Будем доказывать теорему от противного: предположим, что существует всюду определенная вычислимая функция [math]h[/math], такая, что [math]U_n \neq U_{h(n)}[/math] для любого [math]n[/math]. В терминах введенного нами отношения, это значит, что [math]h[/math] не имеет [math]\equiv[/math] — неподвижных точек.

Рассмотрим некоторую вычислимую функцию, от которой никакая вычислимая функция не может отличаться всюду. Такой будет, например [math]f(x) = U(x, x)[/math] (действительно, если предположить, что существует вычислимая функция [math]g(n)[/math], всюду отличная от [math]f(n) = U(n, n)[/math], то нарушается определение универсальной функции.)

Согласно доказанной нами лемме, существует вычислимая и всюду определенная функция [math]g(x)[/math], являющаяся [math]\equiv[/math] — продолжением функции [math]f(x)[/math]. Давайте зададим функцию [math]t(x)[/math] следующим образом: [math]t(x) = h(g(x))[/math], где [math]h(x)[/math] — искомая всюду определенная, вычислимая функция, не имеющая [math]\equiv[/math] — неподвижных точек. Тогда [math]t(x)[/math] всюду отличается от [math]f(x)[/math] (в силу того, что [math]h(x)[/math] не имеет неподвижных точек.) Получили противоречие, из чего следует, что такой функции [math]h[/math] не существует.
[math]\triangleleft[/math]


Утверждение:
[math] \exists n : W_n = \{n\} [/math], где [math] W_n [/math] — множество слов, допускаемых программой с номером [math] n [/math].
[math]\triangleright[/math]

По теореме о рекурсии, программа может знать свой исходный код. Значит, в неё можно написать функцию [math] \mathrm{getSrc()} [/math], которая вернёт строку — исходный код программы. Напишем такую программу:

 [math]p(q){:}[/math]
   if [math]p.\mathrm{getSrc()}[/math] == [math]q.\mathrm{getSrc()}[/math]
     return 1
   else
     while true
Программа [math] p [/math] знает свой код, что то же самое, что и знает свой номер. Как видно из её кода, она допускает только одно число — свой номер.
[math]\triangleleft[/math]

Пример использования теоремы о рекурсии в доказательстве неразрешимости языка

Используя теорему о рекурсии, приведём простое доказательство неразрешимости языка [math]L=\{p \mid p(\varepsilon)=\perp\}[/math].

Лемма:
Язык [math]L=\{p \mid p(\varepsilon)=\perp\}[/math] неразрешим.
Доказательство:
[math]\triangleright[/math]

Предположим обратное. Тогда существует программа [math]r[/math], разрешающая [math]L[/math]. Рассмотрим следующую программу:

 p(x):
   if r(getSrc())
      return 1
   while true
Пусть [math]p(\varepsilon)=\perp[/math]. Тогда условие [math]r(p)[/math] выполняется и [math]p(\varepsilon)=1[/math]. Противоречие. Если [math]p(\varepsilon) \ne \perp[/math], то [math]r(p)[/math] не выполняется и [math]p(\varepsilon)=\perp[/math]. Противоречие.
[math]\triangleleft[/math]

См. также

Источники информации

  • Wikipedia — Kleene's recursion theorem
  • Верещагин Н. К., Шень А. Лекции по математической логике и теории алгоритмов. Часть 3. Вычислимые функции — М.: МЦНМО, 1999 - С. 176
  • Kleene, Stephen On notation for ordinal numbers - The Journal of Symbolic Logic, 1938 - С. 150-155