Лексикографический порядок

Материал из Викиконспекты
Версия от 07:24, 18 ноября 2011; 192.168.0.2 (обсуждение) (Сравнение слов)
Перейти к: навигация, поиск

Определение

Пусть дано линейно упорядоченное множество [math]~E=\{e_1\lt e_2\lt e_3\lt ...\lt e_k\}[/math] — алфавит. Словом назовем упорядоченное множество [math] ~S [/math] элементов алфавита [math] ~A [/math]. Тогда если на алфавите [math] A [/math] задан порядок, то порядок задан и на слове [math] ~S [/math]. Тогда говорят, что множество слов [math] ~A [/math] задано в лекcикографическом порядке, если для любого [math] i \in A [/math] и любого [math] j \in A [/math] таких, что [math] i \lt j [/math] выполнено, что слово [math] ~A_i [/math] меньше, чем слово [math] ~A_j [/math].

Рассмотрим сравнение объектов, состоящих из элементов, на которых задан порядок. Если нам даны два объекта [math] ~P [/math] и [math] ~Q [/math], то [math] ~P [/math] меньше, чем [math] ~Q [/math], если объект [math] ~P [/math] является префиксом [math] ~Q [/math], либо если первые [math] ~i [/math] элементов объектов совпадают, а [math] ~P_i \lt ~Q_i [/math].

Сравнение слов

Что же значит, что слово [math] ~A [/math] меньше слова [math] ~B [/math], и как вообще можно сравнивать слова?

Говорят, что слово [math] ~A [/math] меньше слова [math] ~B [/math], если:

1. Слово [math] ~A [/math] является префиксом слова [math] ~B [/math]

2. Ни одно из слов не является префиксом другого, но существует [math] i [/math] [math] \ge 0 [/math] такое, что для всех [math] j \lt i [/math] выполнено неравенство [math] A_j = B_j [/math], а [math] A_i \lt B_i [/math]. Элементы слова мы можем сравнивать, так как это элементы алфавита, а на алфавите задан строгий порядок.

Приведем псевдокод сравнения слов:

function isEqual(A, B : string)
   for i = 0 .. min(len(A), len(B)) - 1 //Длины равны, строки нумеруются с ноля
        if (A[i] < B[i])
            return <
        if (A[i] > B[i])
            return >
    //Одна из строк является префиксом другой
    if (len(A) < len(B))
        return <
    if (len(A) > len(B))
        return >
    return = //Длины строк и все символы равны

Примеры

  1. Последовательность чисел в любой системе счисления, записанных в фиксированной разрядной сетке (000, 001, 002, 003, 004, 005, …, 999).
  2. Порядок слов в словаре. Предполагается, что буквы можно сравнивать, сравнивая их номера в алфавите. Тогда лексикографический порядок — это, например, ААА, ААБ, ААВ, ААГ, …, ЯЯЯ.