Лексикографический порядок — различия между версиями
(→Сравнение слов) |
(→Сравнение слов) |
||
Строка 7: | Строка 7: | ||
Говорят, что слово <tex> ~A </tex> меньше слова <tex> ~B </tex>, если: | Говорят, что слово <tex> ~A </tex> меньше слова <tex> ~B </tex>, если: | ||
− | 1. | + | 1. Слово <tex> ~A </tex> является префиксом слова <tex> ~B </tex> |
− | 2. | + | 2. Ни одно из слов не является префиксом другого, но <tex>\exists i </tex> <tex> \ge 0 </tex> такое, что для всех <tex> j < i </tex> выполнено неравенство <tex> A_j = B_j </tex>, а <tex> A_i < B_i </tex>. Элементы слова мы можем сравнивать, так как это элементы алфавита, а на алфавите задан строгий порядок. |
Приведем псевдокод сравнения слов: | Приведем псевдокод сравнения слов: | ||
function isEqual(A, B : string) | function isEqual(A, B : string) | ||
− | + | for i = 0 .. min(len(A), len(B)) - 1 //Длины равны, строки нумеруются с ноля | |
− | |||
− | |||
− | |||
− | |||
if (A[i] < B[i]) | if (A[i] < B[i]) | ||
return < | return < | ||
if (A[i] > B[i]) | if (A[i] > B[i]) | ||
return > | return > | ||
− | // | + | //Одна из строк является префиксом другой |
− | return = | + | if (len(A) < len(B)) |
+ | return < | ||
+ | if (len(A) > len(B)) | ||
+ | return > | ||
+ | return = //Длины строк и все символы равны | ||
== Генерация слов в лексикографическом порядке == | == Генерация слов в лексикографическом порядке == |
Версия 03:04, 12 ноября 2011
Определение
Пусть дано линейно упорядоченное множество
— алфавит. Словом назовем упорядоченное множество элементов алфавита . Тогда если на алфавите задан порядок, то порядок задан и на слове . Тогда говорят, что множество слов задано в лекcикографическом порядке, если для таких, что выполнено, что слово меньше, чем слово .Сравнение слов
Что же значит, что слово
меньше слова , и как вообще можно сравнивать слова?Говорят, что слово
меньше слова , если:1. Слово
является префиксом слова2. Ни одно из слов не является префиксом другого, но
такое, что для всех выполнено неравенство , а . Элементы слова мы можем сравнивать, так как это элементы алфавита, а на алфавите задан строгий порядок.Приведем псевдокод сравнения слов:
function isEqual(A, B : string) for i = 0 .. min(len(A), len(B)) - 1 //Длины равны, строки нумеруются с ноля if (A[i] < B[i]) return < if (A[i] > B[i]) return > //Одна из строк является префиксом другой if (len(A) < len(B)) return < if (len(A) > len(B)) return > return = //Длины строк и все символы равны
Генерация слов в лексикографическом порядке
Попробуем сгенерировать все слова в лексикографическом порядке. Для этого воспользуемся рекурсией.
Параметром для рекурсии будет служить префикс, который мы уже записали. Тогда если наш префикс уже длины
(которую мы хотим получить), то запишем получившееся слово, и выйдем из рекурсии. Если длина меньше, то будем приписывать по символу, в порядке от меньшего к большему и снова запускать рекурсию от нового префикса.Почему это будет работать? Ну давайте проверим определение: мы генерируем слова одинаковой длины, потому проверим пункт 2.
Пусть мы сейчас имеем префикс длины
и все строки, начинающихся с префиксов меньших, чем наш уже выведены. Тогда согласно алгоритму мы будем приписывать меньшие символы, и достраивать при помощи рекурсии их до полных строк, то есть перебирать все строки с новым префиксом. А так как мы приписываем символы по увеличению, то все слова с меньшим префиксом мы заведомо переберем, следовательно слова будут в лексикографическом порядке.Приведем псевдокод генерации:
procedure generate(s : string) if (len(s) == L) write(s); exit; for i = 'a' .. 'z' generate(s + i)
Примеры
- Последовательность чисел в любой системе счисления, записанных в фиксированной разрядной сетке (000, 001, 002, 003, 004, 005, …, 999).
- Порядок слов в словаре. Предполагается, что буквы можно сравнивать, сравнивая их номера в алфавите. Тогда лексикографический порядок — это, например, ААА, ААБ, ААВ, ААГ, …, ЯЯЯ.