Основные определения, связанные со строками — различия между версиями
(→Отношения между строками) |
|||
Строка 3: | Строка 3: | ||
{{Определение | {{Определение | ||
− | |definition='''Символ''' (англ. '' | + | |definition='''Символ''' (англ. ''symbol'') {{---}} объект, имеющий собственное содержание и уникальную читаемую форму. |
}} | }} | ||
{{Определение | {{Определение | ||
− | |definition='''Алфавит''' (англ. '' | + | |definition='''Алфавит''' (англ. ''alphabet'') <tex>\Sigma</tex> {{---}} непустое множество символов. |
}} | }} | ||
Строка 13: | Строка 13: | ||
* <tex>\Sigma = \left\{0, 1\right\} </tex> {{---}} бинарный алфавит. | * <tex>\Sigma = \left\{0, 1\right\} </tex> {{---}} бинарный алфавит. | ||
* <tex>\Sigma = \left\{\cdot, -\right\} </tex> {{---}} алфавит, лежащий в основе азбуки Морзе. | * <tex>\Sigma = \left\{\cdot, -\right\} </tex> {{---}} алфавит, лежащий в основе азбуки Морзе. | ||
− | * <tex>\Sigma = \left\{a, b, c, d, | + | * <tex>\Sigma = \left\{a, b, c, d, \dots, z\right\} </tex> {{---}} английский алфавит. |
− | * <tex>\Sigma = \left\{0, 1, 2, | + | * <tex>\Sigma = \left\{0, 1, 2, \dots, 9\right\} </tex> {{---}} алфавит цифр. |
* Нотные знаки | * Нотные знаки | ||
{{Определение | {{Определение | ||
− | |definition='''Нейтральный элемент''' {{---}} пустая строка <tex>\varepsilon | + | |definition='''Нейтральный элемент''' {{---}} пустая строка <tex>\varepsilon : \varepsilon \in \Sigma^{0}</tex>. Для любой строки <tex>\alpha \in \Sigma^k</tex> верно <tex> : \alpha\varepsilon=\varepsilon\alpha=\alpha</tex>. |
}} | }} | ||
Строка 25: | Строка 25: | ||
}} | }} | ||
− | Если <tex>\Sigma = \left\{0, 1\right\}</tex>, то <tex>\Sigma^* = \left\{\varepsilon, 0, 1, 00, 01, 10, 11, 000, 001, 010, 011, | + | Если <tex>\Sigma = \left\{0, 1\right\}</tex>, то <tex>\Sigma^* = \left\{\varepsilon, 0, 1, 00, 01, 10, 11, 000, 001, 010, 011, \dots \right\} </tex>. |
{{Определение | {{Определение | ||
− | |definition='''Цепочка''' (англ. '' | + | |definition='''Цепочка''' (англ. ''chain'') {{---}} элемент конечной длины из <tex>\Sigma^*</tex>. |
}} | }} | ||
{{Определение | {{Определение | ||
− | |definition='''Конкатенация''' (англ. '' | + | |definition='''Конкатенация''' (англ. ''concatenation'') {{---}} бинарная, ассоциативная, некоммутативная операция, определённая на словах данного алфавита. Конкатецния строк <tex>\alpha \in \Sigma^k</tex> и <tex>\beta \in \Sigma^m</tex> является строка <tex>\alpha\beta \in \Sigma^{k + m}</tex>. |
}} | }} | ||
{{Определение | {{Определение | ||
− | |definition='''Моноид''' (англ. '' | + | |definition='''Моноид''' (англ. ''monoid'') {{---}} множество, на котором задана бинарная ассоциативная операция, обычно именуемая умножением, и в котором существует нейтральный элемент. <tex>\Sigma^*</tex> с операцией конкатенации и нейтральным элементом <tex>\varepsilon</tex> образуют моноид |
}} | }} | ||
Строка 43: | Строка 43: | ||
{{Определение | {{Определение | ||
|id=prefix | |id=prefix | ||
− | |definition='''Префикс''' (англ. ''prefix'') строки <tex>\beta</tex> {{---}} строка <tex>\alpha | + | |definition='''Префикс''' (англ. ''prefix'') строки <tex>\beta</tex> {{---}} строка <tex>\alpha : \beta = \alpha \gamma</tex>. |
}} | }} | ||
Строка 50: | Строка 50: | ||
{{Определение | {{Определение | ||
|id=suffix | |id=suffix | ||
− | |definition='''Суффикс''' (англ. ''suffix'') строки <tex>\beta</tex> {{---}} строка <tex>\alpha | + | |definition='''Суффикс''' (англ. ''suffix'') строки <tex>\beta</tex> {{---}} строка <tex>\alpha : \beta = \gamma \alpha </tex>. |
}} | }} | ||
Строка 57: | Строка 57: | ||
{{Определение | {{Определение | ||
|id=border | |id=border | ||
− | |definition='''Бордер''' (англ. ''circumfix'') строки <tex>\beta</tex> {{---}} строка <tex>\alpha | + | |definition='''Бордер''' (англ. ''circumfix'') строки <tex>\beta</tex> {{---}} строка <tex>\alpha : \beta = \gamma \alpha = \alpha \eta = \alpha \mu \alpha</tex>. |
}} | }} | ||
− | Пусть <tex>\beta = \underline{abra}cad\underline{abra}</tex>, тогда <tex>\alpha = abra</tex> {{---}} бордер <tex\beta</tex>. | + | Пусть <tex>\beta = \underline{abra}cad\underline{abra}</tex>, тогда <tex>\alpha = abra</tex> {{---}} бордер <tex>\beta</tex>. |
+ | |||
+ | {{Определение | ||
+ | |id=ind | ||
+ | |definition=<tex>\alpha[i]</tex> {{---}} обращение к символу под номером <tex>i</tex> строки <tex>\alpha</tex>. | ||
+ | }} | ||
{{Определение | {{Определение | ||
|id=period | |id=period | ||
− | |definition='''Период''' (англ. ''period'') строки <tex>\alpha</tex> {{---}} число <tex>p | + | |definition='''Период''' (англ. ''period'') строки <tex>\alpha</tex> {{---}} число <tex>p : \forall i = 1 \ldots |\alpha| - p, |
\alpha [i] = \alpha[i + p]</tex>. | \alpha [i] = \alpha[i + p]</tex>. | ||
}} | }} | ||
Строка 72: | Строка 77: | ||
{{Утверждение | {{Утверждение | ||
|statement=Пусть известна строка <tex>\tau</tex> {{---}} период <tex>\alpha</tex> и <tex>|\alpha|</tex>, тогда можно восстановить всю строку <tex>\alpha</tex>. | |statement=Пусть известна строка <tex>\tau</tex> {{---}} период <tex>\alpha</tex> и <tex>|\alpha|</tex>, тогда можно восстановить всю строку <tex>\alpha</tex>. | ||
− | |proof=Из определения периода строки следует, что <tex>\alpha[1 | + | |proof=Из определения периода строки следует, что <tex>\alpha[1 \dots |\tau|] = \alpha[|\tau| + 1 \dots 2 \cdot |\tau|] = \dots = \alpha[|\tau| \cdot (k - 1) + 1 \dots |\tau| \cdot k] </tex>, где <tex>k = </tex> <tex dpi="140">\lfloor\frac{|\alpha|}{|\tau|} \rfloor</tex>. |
+ | |||
+ | Таким образом <tex>\alpha = </tex><tex dpi="140">\sum \limits_{i=1}^{\lfloor\frac{|\alpha|}{|\tau|} \rfloor}</tex><tex> \tau + \tau[1 \dots |\alpha| \bmod |\tau|]</tex>. | ||
}} | }} | ||
Строка 85: | Строка 92: | ||
{{Определение | {{Определение | ||
|id=substring | |id=substring | ||
− | |definition='''Подстрока''' (англ. ''substring'') {{---}} некоторая непустая | + | |definition='''Подстрока''' (англ. ''substring'') {{---}} некоторая непустая подпоследовательность подряд идущих символов строки. |
}} | }} | ||
Строка 97: | Строка 104: | ||
''или'' | ''или'' | ||
− | 2. <tex> \mathcal {9} k\leqslant \min(|\alpha|, |\beta|) | + | 2. <tex> \mathcal {9} k : k \leqslant \min(|\alpha|, |\beta|) </tex> и <tex> \alpha[k] < \beta[k] </tex>, при этом <tex> \mathcal {8} j < k : \alpha_j = \beta_j </tex> |
}} | }} | ||
Версия 00:42, 10 июня 2014
Базовые определения
Определение: |
Символ (англ. symbol) — объект, имеющий собственное содержание и уникальную читаемую форму. |
Определение: |
Алфавит (англ. alphabet) | — непустое множество символов.
Примеры:
- — бинарный алфавит.
- — алфавит, лежащий в основе азбуки Морзе.
- — английский алфавит.
- — алфавит цифр.
- Нотные знаки
Определение: |
Нейтральный элемент — пустая строка | . Для любой строки верно .
Определение: |
Замыкание Клини (англ. Kleene closure) — унарная операция над множеством строк либо символов. Замыкание Клини множества | есть .
Если , то .
Определение: |
Цепочка (англ. chain) — элемент конечной длины из | .
Определение: |
Конкатенация (англ. concatenation) — бинарная, ассоциативная, некоммутативная операция, определённая на словах данного алфавита. Конкатецния строк | и является строка .
Определение: |
Моноид (англ. monoid) — множество, на котором задана бинарная ассоциативная операция, обычно именуемая умножением, и в котором существует нейтральный элемент. | с операцией конкатенации и нейтральным элементом образуют моноид
Отношения между строками
Определение: |
Префикс (англ. prefix) строки | — строка .
Пусть , тогда — префикс .
Определение: |
Суффикс (англ. suffix) строки | — строка .
Пусть , тогда — суффикс .
Определение: |
Бордер (англ. circumfix) строки | — строка .
Пусть , тогда — бордер .
Определение: |
— обращение к символу под номером строки . |
Определение: |
Период (англ. period) строки | — число .
Пусть , тогда — период строки .
Утверждение: |
Пусть известна строка — период и , тогда можно восстановить всю строку . |
Из определения периода строки следует, что Таким образом , где . . |
Определение: |
Строка | c периодом , называется сильнопериодической, если .
Строка является сильнопериодической с периодом .
Определение: |
Подстрока (англ. substring) — некоторая непустая подпоследовательность подряд идущих символов строки. |
Пусть , тогда — подстрока строки .
Определение: |
Строка 1. — префиксили 2. и , при этом | лексикографически меньше строки ( ), если
Строка , так как является префиксом .
Строка
, так как .Смотри также
Литература
- Гасфилд Д. Строки, деревья и последовательности в алгоритмах: Информатика и вычислительная биология. — 2-е изд.
- Kelley, Dean (1995). Automata and Formal Languages: An Introduction. London: Prentice-Hall International. ISBN 0-13-497777-7.
- Gusfield, Dan (1999) [1997]. Algorithms on Strings, Trees and Sequences: Computer Science and Computational Biology. USA: Cambridge University Press. ISBN 0-521-58519-8.