Основные определения, связанные со строками — различия между версиями
Megabyte (обсуждение | вклад) м (→Отношения между строками) |
|||
Строка 1: | Строка 1: | ||
− | == Базовые определения == | + | |
+ | ==Базовые определения== | ||
+ | |||
+ | {{Определение | ||
+ | |definition='''Символ''' (англ. ''Symbol'') {{---}} объект, имеющий собственное содержание и уникальную читаемую форму. | ||
+ | }} | ||
+ | |||
+ | {{Определение | ||
+ | |definition='''Алфавит''' (англ. ''Alphabet'') <tex>\Sigma</tex> {{---}} непустое множество символов. | ||
+ | }} | ||
+ | |||
+ | Примеры: | ||
+ | * <tex>\Sigma = \left\{0, 1\right\} </tex> {{---}} бинарный алфавит. | ||
+ | * <tex>\Sigma = \left\{\cdot, -\right\} </tex> {{---}} алфавит, лежащий в основе азбуки Морзе. | ||
+ | * <tex>\Sigma = \left\{a, b, c, d, ... , z\right\} </tex> {{---}} английский алфавит. | ||
+ | * <tex>\Sigma = \left\{0, 1, 2, ..., 9\right\} </tex> {{---}} алфавит цифр. | ||
+ | * Нотные знаки | ||
{{Определение | {{Определение | ||
− | |definition = | + | |definition='''Нейтральный элемент''' {{---}} пустая строка <tex>\varepsilon</tex>: <tex>\varepsilon \in \Sigma^{0}</tex>. Для любой строки <tex>\alpha \in \Sigma^k</tex> верно: <tex>\alpha\varepsilon=\varepsilon\alpha=\alpha</tex>. |
− | ''' | ||
}} | }} | ||
{{Определение | {{Определение | ||
− | |definition = | + | |definition='''Замыкание Клини''' (англ. ''Kleene closure'') {{---}} унарная операция над множеством строк либо символов. Замыкание Клини множества <tex>\Sigma</tex> есть <tex>\Sigma^* : \Sigma^* = \bigcup\limits_{n = 0}^\infty \Sigma^n</tex>. |
− | ''' | + | }} |
+ | |||
+ | Если <tex>\Sigma = \left\{0, 1\right\}</tex>, то <tex>\Sigma^* = \left\{\varepsilon, 0, 1, 00, 01, 10, 11, 000, 001, 010, 011, ... \right\} </tex>. | ||
+ | |||
+ | {{Определение | ||
+ | |definition='''Цепочка''' (англ. ''Chain'') {{---}} элемент конечной длины из <tex>\Sigma^*</tex>. | ||
}} | }} | ||
{{Определение | {{Определение | ||
− | |definition = | + | |definition='''Конкатенация''' (англ. ''Concatenation'') {{---}} бинарная, ассоциативная, некоммутативная операция, определённая на словах данного алфавита. Конкатецния строк <tex>\alpha \in \Sigma^k</tex> и <tex>\beta \in \Sigma^m</tex> является строка <tex>\alpha\beta \in \Sigma^{k + m}</tex>. |
− | ''' | ||
}} | }} | ||
{{Определение | {{Определение | ||
− | |definition = | + | |definition='''Моноид''' (англ. ''Monoid'') {{---}} множество, на котором задана бинарная ассоциативная операция, обычно именуемая умножением, и в котором существует нейтральный элемент. <tex>\Sigma^*</tex> с операцией конкатенации и нейтральным элементом <tex>\varepsilon</tex> образуют моноид |
− | ''' | ||
}} | }} | ||
− | <tex>\ | + | ==Отношения между строками== |
+ | |||
+ | {{Определение | ||
+ | |id=prefix | ||
+ | |definition='''Префикс''' (англ. ''Prefix'') строки <tex>\beta</tex> {{---}} строка <tex>\alpha</tex>: <tex>\beta = \alpha \gamma</tex>. | ||
+ | }} | ||
− | == | + | Пусть <tex>\beta = \underline{abr}acadabra</tex>, тогда <tex>\alpha = abr</tex> {{---}} префикс <tex>\beta</tex>. |
{{Определение | {{Определение | ||
− | |definition = | + | |id=suffix |
− | <tex>\ | + | |definition='''Суффикс''' (англ. ''Suffix'') строки <tex>\beta</tex> {{---}} строка <tex>\alpha</tex>: <tex>\beta = \gamma \alpha </tex>. |
}} | }} | ||
− | Пусть <tex>\beta = | + | Пусть <tex>\beta = abracada\underline{bra}</tex>, тогда <tex>\alpha = bra</tex> {{---}} суффикс <tex>\beta</tex>. |
− | |||
− | |||
{{Определение | {{Определение | ||
− | |||
− | |||
|id=border | |id=border | ||
+ | |definition='''Бордер''' (англ. ''Circumfix'') строки <tex>\beta</tex> {{---}} строка <tex>\alpha</tex>: <tex>\beta = \gamma \alpha = \alpha \eta</tex>. | ||
}} | }} | ||
− | Пусть <tex>\beta = \underline{abra}cad\underline{abra}</tex>, тогда <tex>\alpha = abra</tex> | + | Пусть <tex>\beta = \underline{abra}cad\underline{abra}</tex>, тогда <tex>\alpha = abra</tex> {{---}} бордер <tex\beta</tex>. |
{{Определение | {{Определение | ||
− | |definition = | + | |id=period |
− | + | |definition='''Период''' (англ. ''Period'') строки <tex>\alpha</tex> {{---}} число <tex>p</tex>: <tex>\forall i = 1 \ldots |\alpha| - p \alpha [i] = \alpha[i + p]</tex>. | |
− | |||
}} | }} | ||
− | + | Пусть <tex>\alpha = acaacaa</tex>, тогда <tex>p = 3</tex> {{---}} период строки <tex>\alpha = acaacaa</tex>. | |
{{Определение | {{Определение | ||
− | |definition = | + | |id=hardperiod |
− | Строка <tex>\alpha \neq \varepsilon</tex> | + | |definition=Строка <tex>\alpha \neq \varepsilon</tex> c периодом <tex>p \neq |\alpha|</tex>, называется '''сильнопериодической''', если <tex>|\alpha| \bmod p = 0</tex>. |
}} | }} | ||
− | Строка <tex>\alpha = acaacaaca</tex> является сильнопериодической | + | Строка <tex>\alpha = acaacaaca</tex> является сильнопериодической с периодом <tex>p = 3</tex>. |
{{Определение | {{Определение | ||
− | |definition = | + | |id=substring |
− | + | |definition='''Подстрока''' (англ. ''Substring'') {{---}} некоторая непустая связная часть строки. | |
}} | }} | ||
− | + | Пусть <tex>\beta = abr\underline{aca}dabra</tex>, тогда <tex>\alpha = aca</tex> {{---}} подстрока строки <tex>\beta</tex>. | |
{{Определение | {{Определение | ||
|definition = | |definition = | ||
Строка <tex>\alpha \le \beta</tex>, если: | Строка <tex>\alpha \le \beta</tex>, если: | ||
− | * <tex>\alpha</tex> префикс <tex>\beta</tex> | + | * <tex>\alpha</tex> {{---}} префикс <tex>\beta</tex> |
− | * <tex>\gamma</tex> общий префикс <tex>\alpha</tex> и <tex>\beta</tex> | + | * <tex>\gamma</tex> {{---}} общий префикс <tex>\alpha</tex> и <tex>\beta</tex>: <tex>\alpha = \gamma c \delta</tex>, <tex>\beta = \gamma d \xi</tex> и <tex>c \le d</tex> |
}} | }} | ||
Строка <tex>\alpha = aca \le \beta = acaaba</tex>, т.к. является префиксом <tex>\beta</tex>. | Строка <tex>\alpha = aca \le \beta = acaaba</tex>, т.к. является префиксом <tex>\beta</tex>. | ||
+ | Строка <tex>\alpha = acaa \le \beta = acab</tex>, т.к. <tex>a \le b</tex>. | ||
− | + | == Смотри также == | |
+ | [[Период и бордер, их связь]] | ||
+ | |||
+ | [[Слово Фибоначчи]] | ||
+ | |||
+ | [[Слово Туэ-Морса]] | ||
==Литература== | ==Литература== | ||
* Гасфилд Д. Строки, деревья и последовательности в алгоритмах: Информатика и вычислительная биология. — 2-е изд. | * Гасфилд Д. Строки, деревья и последовательности в алгоритмах: Информатика и вычислительная биология. — 2-е изд. | ||
+ | * Kelley, Dean (1995). Automata and Formal Languages: An Introduction. London: Prentice-Hall International. ISBN 0-13-497777-7. | ||
+ | * Gusfield, Dan (1999) [1997]. Algorithms on Strings, Trees and Sequences: Computer Science and Computational Biology. USA: Cambridge University Press. ISBN 0-521-58519-8. | ||
[[Категория:Алгоритмы и структуры данных]] | [[Категория:Алгоритмы и структуры данных]] | ||
[[Категория:Основные определения. Простые комбинаторные свойства слов]] | [[Категория:Основные определения. Простые комбинаторные свойства слов]] |
Версия 21:55, 9 июня 2014
Базовые определения
Определение: |
Символ (англ. Symbol) — объект, имеющий собственное содержание и уникальную читаемую форму. |
Определение: |
Алфавит (англ. Alphabet) | — непустое множество символов.
Примеры:
- — бинарный алфавит.
- — алфавит, лежащий в основе азбуки Морзе.
- — английский алфавит.
- — алфавит цифр.
- Нотные знаки
Определение: |
Нейтральный элемент — пустая строка | : . Для любой строки верно: .
Определение: |
Замыкание Клини (англ. Kleene closure) — унарная операция над множеством строк либо символов. Замыкание Клини множества | есть .
Если , то .
Определение: |
Цепочка (англ. Chain) — элемент конечной длины из | .
Определение: |
Конкатенация (англ. Concatenation) — бинарная, ассоциативная, некоммутативная операция, определённая на словах данного алфавита. Конкатецния строк | и является строка .
Определение: |
Моноид (англ. Monoid) — множество, на котором задана бинарная ассоциативная операция, обычно именуемая умножением, и в котором существует нейтральный элемент. | с операцией конкатенации и нейтральным элементом образуют моноид
Отношения между строками
Определение: |
Префикс (англ. Prefix) строки | — строка : .
Пусть , тогда — префикс .
Определение: |
Суффикс (англ. Suffix) строки | — строка : .
Пусть , тогда — суффикс .
Определение: |
Бордер (англ. Circumfix) строки | — строка : .
Пусть , тогда — бордер <tex\beta</tex>.
Определение: |
Период (англ. Period) строки | — число : .
Пусть , тогда — период строки .
Определение: |
Строка | c периодом , называется сильнопериодической, если .
Строка является сильнопериодической с периодом .
Определение: |
Подстрока (англ. Substring) — некоторая непустая связная часть строки. |
Пусть , тогда — подстрока строки .
Определение: |
Строка
| , если:
Строка , т.к. является префиксом .
Строка , т.к. .
Смотри также
Литература
- Гасфилд Д. Строки, деревья и последовательности в алгоритмах: Информатика и вычислительная биология. — 2-е изд.
- Kelley, Dean (1995). Automata and Formal Languages: An Introduction. London: Prentice-Hall International. ISBN 0-13-497777-7.
- Gusfield, Dan (1999) [1997]. Algorithms on Strings, Trees and Sequences: Computer Science and Computational Biology. USA: Cambridge University Press. ISBN 0-521-58519-8.