Саморасширяющийся массив — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Амортизационная стоимость каждой операции)
Строка 1: Строка 1:
Массив набор однотипных переменных, доступ к которым осуществляется по индексу. Саморасширяющийся массив может изменять свой размер в зависимости от количества элементов в нём.
+
{{Определение
 +
| definition =
 +
'''Массив''' {{---}} набор однотипных переменных, доступ к которым осуществляется по индексу. '''Саморасширяющийся массив''' может изменять свой размер в зависимости от количества элементов в нём.
 +
}}
  
 
== Операции ==
 
== Операции ==
 
Определим операции, которые мы будем применять к саморасширяющемуся массиву:<br>
 
Определим операции, которые мы будем применять к саморасширяющемуся массиву:<br>
 
=== get(i) ===
 
=== get(i) ===
:Возвращает значение i-ой ячейки массива. Время выполнения — <tex>O(1)</tex>.
+
:Возвращает значение <tex>i</tex>-ой ячейки массива. Время выполнения — <tex>O(1)</tex>.
 
=== set(i,x) ===
 
=== set(i,x) ===
:В i-ую ячейку массива записывается элемент x. Время выполнения — <tex>O(1)</tex>.
+
<tex>i</tex>-ую ячейку массива записывается элемент <tex>x</tex>. Время выполнения — <tex>O(1)</tex>.
 
=== add(x) ===
 
=== add(x) ===
:Добавление в массив элемента x. Время выполнения — <tex>O(1)</tex>; в худшем случае, при котором необходимо перенести все элементы из текущего массива в вдвое больший массив — <tex>O(n)</tex> (<tex>n</tex> — размер массива).
+
:Добавление в массив элемента <tex>x</tex>. Время выполнения — <tex>O(1)</tex>; в худшем случае, при котором необходимо перенести все элементы из текущего массива в вдвое больший массив — <tex>O(n)</tex> (<tex>n</tex> — размер массива).
 
=== del() ===
 
=== del() ===
 
:Удаляет последний элемент массива. В случае, если кол-во элементов в массиве в <tex>C</tex> раз меньше его длины, то происходит сжатие в <tex>B</tex> раз. (<tex>C,B</tex> — константы, зависящие от реализации). Время выполнения операции в худшем случае — <tex>O(n)</tex>.
 
:Удаляет последний элемент массива. В случае, если кол-во элементов в массиве в <tex>C</tex> раз меньше его длины, то происходит сжатие в <tex>B</tex> раз. (<tex>C,B</tex> — константы, зависящие от реализации). Время выполнения операции в худшем случае — <tex>O(n)</tex>.
Строка 16: Строка 19:
  
 
== Амортизационная стоимость каждой операции ==
 
== Амортизационная стоимость каждой операции ==
Пусть наш массив расширяется в 2 раза, и уменьшается в 2 раза, когда длина массива в 4 раза больше кол-ва элементов в массиве. В этом случае амортизационная стоимость каждой операции будет <tex>O(1)</tex>.
+
Пусть наш массив расширяется в <tex>2</tex> раза, и уменьшается в <tex>2</tex> раза, когда длина массива в <tex>4</tex> раза больше количества элементов в массиве. В этом случае амортизационная стоимость каждой операции будет <tex>O(1)</tex>.
 
=== Метод предоплаты ===
 
=== Метод предоплаты ===
 
==== Стоимость операции add(x) ====
 
==== Стоимость операции add(x) ====
 
[[Файл:Безымянный1.png|400px|thumb|right|Иллюстрация]]
 
[[Файл:Безымянный1.png|400px|thumb|right|Иллюстрация]]
Пусть у нас единицей стоимости операции является одна монетка. Тогда при каждой операции add(x), при которой нам не требуется копирование, мы будем использовать три монетки. Из них одна пойдёт на стоимость самой этой операции, а две будут в резерве (пусть, если мы добавили i-ый элемент, мы будем класть по одной монетке к элементам с номерами <tex>i</tex> и <tex>i-\frac{n}{2}</tex>). В итоге, к тому моменту, как массив будет заполнен, рядом с каждым элементом будет лежать по одной монетке, которую мы и можем использовать на его копирование в новый массив. Таким образом, амортизационная стоимость каждой операции add(x) <tex>3</tex>, и среднее время её работы <tex>O(1)</tex>.
+
Пусть у нас единицей стоимости операции является одна монетка. Тогда при каждой операции '''add(x)''', при которой нам не требуется копирование, мы будем использовать три монетки. Из них одна пойдёт на стоимость самой этой операции, а две будут в резерве (пусть, если мы добавили <tex>i</tex>-ый элемент, мы будем класть по одной монетке к элементам с номерами <tex>i</tex> и <tex>i-\frac{n}{2}</tex>). В итоге, к тому моменту, как массив будет заполнен, рядом с каждым элементом будет лежать по одной монетке, которую мы и можем использовать на его копирование в новый массив. Таким образом, амортизационная стоимость каждой операции '''add(x)''' {{---}} <tex>3</tex>, и среднее время её работы {{---}} <tex>O(1)</tex>.
 
==== Стоимость операции del() ====
 
==== Стоимость операции del() ====
 
При каждой операции будем использовать три монетки. Одну из них потратим на само удаление элемента, одну монету на элемент, стоящий на позиции <tex>i-\frac{n}{4}</tex>, и одну монетку на место удаленного элемента. Тогда даже в самом худшем случае (только что расширились, а потом <tex>\frac{n}{4}</tex> удалили) у нас будет хватать денег на копирование в новый массив.
 
При каждой операции будем использовать три монетки. Одну из них потратим на само удаление элемента, одну монету на элемент, стоящий на позиции <tex>i-\frac{n}{4}</tex>, и одну монетку на место удаленного элемента. Тогда даже в самом худшем случае (только что расширились, а потом <tex>\frac{n}{4}</tex> удалили) у нас будет хватать денег на копирование в новый массив.
 
=== Метод потенциалов ===
 
=== Метод потенциалов ===
 
За потенциал примем число:
 
За потенциал примем число:
<tex>\Phi(c, s) = \begin{cases}
+
<tex dpi=150>\Phi(c, s) = \begin{cases}
  2s-c, & \text{if } s\ge\frac{1}{2}c \\
+
  2s-c, & \text{if } s\geqslant\frac{1}{2}c \\
 
  \frac{1}{2}c-s, & \text{if } s<\frac{1}{2}c
 
  \frac{1}{2}c-s, & \text{if } s<\frac{1}{2}c
 
\end{cases}</tex>
 
\end{cases}</tex>
  
где <tex>c</tex> - размер массива, <tex>s</tex> - число элементов массива.
+
где <tex>c</tex> {{---}} размер массива, <tex>s</tex> {{---}} число элементов массива.
  
==== Стоимость операции add(x) ====
+
==== Стоимость операции '''add(x)''' ====
 +
 
 +
* <tex dpi=150>\frac{s}{c} = 1</tex>, массив расширяется: <tex dpi=150> a_i = t_i + \Phi(2c, s + 1) - \Phi(c, s) = (s + 1) + (2(s+1)-2c)-(2s-c) = 3 </tex>
 +
 
 +
* <tex dpi=150>1>\frac{s}{c}\geqslant\frac{1}{2}</tex>, массив не расширяется: <tex dpi=150>a_i=t_i+\Phi(c,s+1)-\Phi(c,s)=1+(2(s+1)-c)-(2s-c)=3</tex>
 +
 
 +
* <tex dpi=150>\frac{s}{c}<\frac{1}{2}, \frac{s+1}{c}\geqslant\frac{1}{2}</tex>, массив не расширяется:
 +
<tex dpi=150>a_i = t_i + \Phi(c, s+1)-\Phi(c, s)= 1 +(2(s+1)-c)-(\frac{1}{2}c - s)= 3+s-\frac{3}{2}c= 3 + \frac{s}{c}c-\frac{3}{2}c <3+\frac{3}{2}c-\frac{3}{2}c=3</tex>
  
* <tex dpi=150>\frac{s}{c} = 1</tex>, массив расширяется: <tex> a_i = t_i + \Phi(2c, s + 1) - \Phi(c, s) = (s + 1) + (2(s+1)-2c)-(2s-c) = 3 </tex>
+
* <tex dpi=150>\frac{s}{c}<\frac{1}{2}, \frac{s+1}{c}<\frac{1}{2}</tex>, массив не расширяется: <tex dpi=150>a_i = t_i + \Phi(c, s + 1) - \Phi(c, s) = 1 + (\frac{1}{2}c - (s + 1)) - (\frac{1}{2}c - s) = 0</tex>
* <tex dpi=150>1>\frac{s}{c}\ge\frac{1}{2}</tex>, массив не расширяется: <tex>a_i=t_i+\Phi(c,s+1)-\Phi(c,s)=1+(2(s+1)-c)-(2s-c)=3</tex>
 
* <tex dpi=150>\frac{s}{c}<\frac{1}{2}, \frac{s+1}{c}\ge\frac{1}{2}</tex>, массив не расширяется: <tex>a_i = t_i + \Phi(c, s+1)-\Phi(c, s)= 1 +(2(s+1)-c)-(\frac{1}{2}c - s)= 3+s-\frac{3}{2}c= 3 + \frac{s}{c}c-\frac{3}{2}c <3+\frac{3}{2}c-\frac{3}{2}c=3</tex>
 
* <tex dpi=150>\frac{s}{c}<\frac{1}{2}, \frac{s+1}{c}<\frac{1}{2}</tex>, массив не расширяется: <tex>a_i = t_i + \Phi(c, s + 1) - \Phi(c, s) = 1 + (\frac{1}{2}c - (s + 1)) - (\frac{1}{2}c - s) = 0</tex>
 
  
В итоге, средняя стоимость операции add(x) — <tex>3</tex>, а среднее время работы <tex>O(1)</tex>.
+
В итоге, средняя стоимость операции {{---}} <tex>3</tex>, а среднее время работы {{---}} <tex>O(1)</tex>.
  
 
==== Стоимость операции del() ====
 
==== Стоимость операции del() ====
  
* <tex dpi=150>\frac{s}{c}=\frac{1}{4}</tex>, массив сужается: <tex>a_i = t_i + \Phi(\frac{c}{2}, s - 1) - \Phi(c, s) = s + (\frac{1}{2}\cdot\frac{1}{2}c-(s-1)) - (\frac{1}{2}c-s) = 1-\frac{1}{4}c+s=1</tex>
+
* <tex dpi=150>\frac{s}{c}=\frac{1}{4}</tex>, массив сужается: <tex dpi=150>a_i = t_i + \Phi(\frac{c}{2}, s - 1) - \Phi(c, s) = s + (\frac{1}{2}\cdot\frac{1}{2}c-(s-1)) - (\frac{1}{2}c-s) = 1-\frac{1}{4}c+s=1</tex>
* <tex dpi=150>\frac{1}{4}<\frac{s}{c}<\frac{1}{2}</tex>, массив не сужается: <tex>a_i = t_i + \Phi(c, s - 1) - \Phi(c, s) = 1 + (\frac{1}{2}c-(s-1))-(\frac{1}{2}c-s)= 2</tex>
+
* <tex dpi=150>\frac{1}{4}<\frac{s}{c}<\frac{1}{2}</tex>, массив не сужается: <tex dpi=150>a_i = t_i + \Phi(c, s - 1) - \Phi(c, s) = 1 + (\frac{1}{2}c-(s-1))-(\frac{1}{2}c-s)= 2</tex>
* <tex dpi=150>\frac{s}{c}\ge\frac{1}{2}, \frac{s-1}{c}<\frac{1}{2}\Rightarrow s=\frac{1}{2}c</tex>, массив не сужается: <tex>a_i = t_i + \Phi(c, s - 1) - \Phi(c, s) =1 +(\frac{1}{2}c-(s-1))-(2s-c)=2+\frac{3}{2}c-3s = 2</tex>
+
* <tex dpi=150>\frac{s}{c}\geqslant\frac{1}{2}, \frac{s-1}{c}<\frac{1}{2}\Rightarrow s=\frac{1}{2}c</tex>, массив не сужается: <tex dpi=150>a_i = t_i + \Phi(c, s - 1) - \Phi(c, s) =1 +(\frac{1}{2}c-(s-1))-(2s-c)=2+\frac{3}{2}c-3s = 2</tex>
* <tex dpi=150>\frac{s}{c}>\frac{1}{2}</tex>, массив не сужается: <tex>a_i = t_i + \Phi(c, s - 1) - \Phi(c, s) = 1 + (2(s-1)-c)-(2s-c)=3</tex>
+
* <tex dpi=150>\frac{s}{c}>\frac{1}{2}</tex>, массив не сужается: <tex dpi=150>a_i = t_i + \Phi(c, s - 1) - \Phi(c, s) = 1 + (2(s-1)-c)-(2s-c)=3</tex>
  
 
Средняя стоимость операции — <tex>2</tex>, а среднее время работы — <tex>O(1)</tex>.
 
Средняя стоимость операции — <tex>2</tex>, а среднее время работы — <tex>O(1)</tex>.
 +
 +
==Саморасширяющиеся массивы в современных языках программирования==
 +
Саморасширяющиеся массивы широко применяются во многих языках программирования. Рассмотрим, как эта структура данных реализуется в С++ и Java.
 +
===С++ {{---}} vector===
 +
В С++ саморасширяющийся массив называется vector, он описан в STL(<vector>). Стратегия его расширения проста: при попытке записи в массив нового элемента в момент полного заполнения памяти происходит увеличение размера в <tex>2</tex> раза при компиляции GNU C++ и в <tex>1.5</tex> раза при компиляции Microsoft Visual C++. При удалении элементов уменьшения размера массива никогда не происходит.

Версия 20:34, 20 мая 2014

Определение:
Массив — набор однотипных переменных, доступ к которым осуществляется по индексу. Саморасширяющийся массив может изменять свой размер в зависимости от количества элементов в нём.


Операции

Определим операции, которые мы будем применять к саморасширяющемуся массиву:

get(i)

Возвращает значение [math]i[/math]-ой ячейки массива. Время выполнения — [math]O(1)[/math].

set(i,x)

В [math]i[/math]-ую ячейку массива записывается элемент [math]x[/math]. Время выполнения — [math]O(1)[/math].

add(x)

Добавление в массив элемента [math]x[/math]. Время выполнения — [math]O(1)[/math]; в худшем случае, при котором необходимо перенести все элементы из текущего массива в вдвое больший массив — [math]O(n)[/math] ([math]n[/math] — размер массива).

del()

Удаляет последний элемент массива. В случае, если кол-во элементов в массиве в [math]C[/math] раз меньше его длины, то происходит сжатие в [math]B[/math] раз. ([math]C,B[/math] — константы, зависящие от реализации). Время выполнения операции в худшем случае — [math]O(n)[/math].

size()

Возвращает количество элементов массива. Время выполнения — [math]O(1)[/math].

Амортизационная стоимость каждой операции

Пусть наш массив расширяется в [math]2[/math] раза, и уменьшается в [math]2[/math] раза, когда длина массива в [math]4[/math] раза больше количества элементов в массиве. В этом случае амортизационная стоимость каждой операции будет [math]O(1)[/math].

Метод предоплаты

Стоимость операции add(x)

Иллюстрация

Пусть у нас единицей стоимости операции является одна монетка. Тогда при каждой операции add(x), при которой нам не требуется копирование, мы будем использовать три монетки. Из них одна пойдёт на стоимость самой этой операции, а две будут в резерве (пусть, если мы добавили [math]i[/math]-ый элемент, мы будем класть по одной монетке к элементам с номерами [math]i[/math] и [math]i-\frac{n}{2}[/math]). В итоге, к тому моменту, как массив будет заполнен, рядом с каждым элементом будет лежать по одной монетке, которую мы и можем использовать на его копирование в новый массив. Таким образом, амортизационная стоимость каждой операции add(x)[math]3[/math], и среднее время её работы — [math]O(1)[/math].

Стоимость операции del()

При каждой операции будем использовать три монетки. Одну из них потратим на само удаление элемента, одну монету на элемент, стоящий на позиции [math]i-\frac{n}{4}[/math], и одну монетку на место удаленного элемента. Тогда даже в самом худшем случае (только что расширились, а потом [math]\frac{n}{4}[/math] удалили) у нас будет хватать денег на копирование в новый массив.

Метод потенциалов

За потенциал примем число: [math]\Phi(c, s) = \begin{cases} 2s-c, & \text{if } s\geqslant\frac{1}{2}c \\ \frac{1}{2}c-s, & \text{if } s\lt \frac{1}{2}c \end{cases}[/math]

где [math]c[/math] — размер массива, [math]s[/math] — число элементов массива.

Стоимость операции add(x)

  • [math]\frac{s}{c} = 1[/math], массив расширяется: [math] a_i = t_i + \Phi(2c, s + 1) - \Phi(c, s) = (s + 1) + (2(s+1)-2c)-(2s-c) = 3 [/math]
  • [math]1\gt \frac{s}{c}\geqslant\frac{1}{2}[/math], массив не расширяется: [math]a_i=t_i+\Phi(c,s+1)-\Phi(c,s)=1+(2(s+1)-c)-(2s-c)=3[/math]
  • [math]\frac{s}{c}\lt \frac{1}{2}, \frac{s+1}{c}\geqslant\frac{1}{2}[/math], массив не расширяется:

[math]a_i = t_i + \Phi(c, s+1)-\Phi(c, s)= 1 +(2(s+1)-c)-(\frac{1}{2}c - s)= 3+s-\frac{3}{2}c= 3 + \frac{s}{c}c-\frac{3}{2}c \lt 3+\frac{3}{2}c-\frac{3}{2}c=3[/math]

  • [math]\frac{s}{c}\lt \frac{1}{2}, \frac{s+1}{c}\lt \frac{1}{2}[/math], массив не расширяется: [math]a_i = t_i + \Phi(c, s + 1) - \Phi(c, s) = 1 + (\frac{1}{2}c - (s + 1)) - (\frac{1}{2}c - s) = 0[/math]

В итоге, средняя стоимость операции — [math]3[/math], а среднее время работы — [math]O(1)[/math].

Стоимость операции del()

  • [math]\frac{s}{c}=\frac{1}{4}[/math], массив сужается: [math]a_i = t_i + \Phi(\frac{c}{2}, s - 1) - \Phi(c, s) = s + (\frac{1}{2}\cdot\frac{1}{2}c-(s-1)) - (\frac{1}{2}c-s) = 1-\frac{1}{4}c+s=1[/math]
  • [math]\frac{1}{4}\lt \frac{s}{c}\lt \frac{1}{2}[/math], массив не сужается: [math]a_i = t_i + \Phi(c, s - 1) - \Phi(c, s) = 1 + (\frac{1}{2}c-(s-1))-(\frac{1}{2}c-s)= 2[/math]
  • [math]\frac{s}{c}\geqslant\frac{1}{2}, \frac{s-1}{c}\lt \frac{1}{2}\Rightarrow s=\frac{1}{2}c[/math], массив не сужается: [math]a_i = t_i + \Phi(c, s - 1) - \Phi(c, s) =1 +(\frac{1}{2}c-(s-1))-(2s-c)=2+\frac{3}{2}c-3s = 2[/math]
  • [math]\frac{s}{c}\gt \frac{1}{2}[/math], массив не сужается: [math]a_i = t_i + \Phi(c, s - 1) - \Phi(c, s) = 1 + (2(s-1)-c)-(2s-c)=3[/math]

Средняя стоимость операции — [math]2[/math], а среднее время работы — [math]O(1)[/math].

Саморасширяющиеся массивы в современных языках программирования

Саморасширяющиеся массивы широко применяются во многих языках программирования. Рассмотрим, как эта структура данных реализуется в С++ и Java.

С++ — vector

В С++ саморасширяющийся массив называется vector, он описан в STL(<vector>). Стратегия его расширения проста: при попытке записи в массив нового элемента в момент полного заполнения памяти происходит увеличение размера в [math]2[/math] раза при компиляции GNU C++ и в [math]1.5[/math] раза при компиляции Microsoft Visual C++. При удалении элементов уменьшения размера массива никогда не происходит.