Саморасширяющийся массив — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(С++ {{---}} vector)
Строка 60: Строка 60:
 
Саморасширяющиеся массивы широко применяются во многих языках программирования. Рассмотрим, как эта структура данных реализуется в С++ и Java.  
 
Саморасширяющиеся массивы широко применяются во многих языках программирования. Рассмотрим, как эта структура данных реализуется в С++ и Java.  
 
===С++ {{---}} vector===
 
===С++ {{---}} vector===
В С++ саморасширяющийся массив называется vector, он описан в STL(<vector>). Стратегия его расширения проста: при попытке записи в массив нового элемента в момент полного заполнения памяти происходит увеличение размера в <tex>2</tex> раза при компиляции GNU C++ и в <tex>1.5</tex> раза при компиляции Microsoft Visual C++. При удалении элементов уменьшения размера массива никогда не происходит.
+
В С++ саморасширяющийся массив называется vector, он описан в STL(<vector>). Стратегия его расширения проста: при попытке записи в массив нового элемента в момент полного заполнения памяти происходит увеличение размера в <tex>2</tex> раза при компиляции GNU C++ и в <tex>1.5</tex> раза при компиляции Microsoft Visual C++. При удалении элементов уменьшение размера массива никогда не происходит.

Версия 20:36, 20 мая 2014

Определение:
Массив — набор однотипных переменных, доступ к которым осуществляется по индексу. Саморасширяющийся массив может изменять свой размер в зависимости от количества элементов в нём.


Операции

Определим операции, которые мы будем применять к саморасширяющемуся массиву:

get(i)

Возвращает значение [math]i[/math]-ой ячейки массива. Время выполнения — [math]O(1)[/math].

set(i,x)

В [math]i[/math]-ую ячейку массива записывается элемент [math]x[/math]. Время выполнения — [math]O(1)[/math].

add(x)

Добавление в массив элемента [math]x[/math]. Время выполнения — [math]O(1)[/math]; в худшем случае, при котором необходимо перенести все элементы из текущего массива в вдвое больший массив — [math]O(n)[/math] ([math]n[/math] — размер массива).

del()

Удаляет последний элемент массива. В случае, если кол-во элементов в массиве в [math]C[/math] раз меньше его длины, то происходит сжатие в [math]B[/math] раз. ([math]C,B[/math] — константы, зависящие от реализации). Время выполнения операции в худшем случае — [math]O(n)[/math].

size()

Возвращает количество элементов массива. Время выполнения — [math]O(1)[/math].

Амортизационная стоимость каждой операции

Пусть наш массив расширяется в [math]2[/math] раза, и уменьшается в [math]2[/math] раза, когда длина массива в [math]4[/math] раза больше количества элементов в массиве. В этом случае амортизационная стоимость каждой операции будет [math]O(1)[/math].

Метод предоплаты

Стоимость операции add(x)

Иллюстрация

Пусть у нас единицей стоимости операции является одна монетка. Тогда при каждой операции add(x), при которой нам не требуется копирование, мы будем использовать три монетки. Из них одна пойдёт на стоимость самой этой операции, а две будут в резерве (пусть, если мы добавили [math]i[/math]-ый элемент, мы будем класть по одной монетке к элементам с номерами [math]i[/math] и [math]i-\frac{n}{2}[/math]). В итоге, к тому моменту, как массив будет заполнен, рядом с каждым элементом будет лежать по одной монетке, которую мы и можем использовать на его копирование в новый массив. Таким образом, амортизационная стоимость каждой операции add(x)[math]3[/math], и среднее время её работы — [math]O(1)[/math].

Стоимость операции del()

При каждой операции будем использовать три монетки. Одну из них потратим на само удаление элемента, одну монету на элемент, стоящий на позиции [math]i-\frac{n}{4}[/math], и одну монетку на место удаленного элемента. Тогда даже в самом худшем случае (только что расширились, а потом [math]\frac{n}{4}[/math] удалили) у нас будет хватать денег на копирование в новый массив.

Метод потенциалов

За потенциал примем число: [math]\Phi(c, s) = \begin{cases} 2s-c, & \text{if } s\geqslant\frac{1}{2}c \\ \frac{1}{2}c-s, & \text{if } s\lt \frac{1}{2}c \end{cases}[/math]

где [math]c[/math] — размер массива, [math]s[/math] — число элементов массива.

Стоимость операции add(x)

  • [math]\frac{s}{c} = 1[/math], массив расширяется: [math] a_i = t_i + \Phi(2c, s + 1) - \Phi(c, s) = (s + 1) + (2(s+1)-2c)-(2s-c) = 3 [/math]
  • [math]1\gt \frac{s}{c}\geqslant\frac{1}{2}[/math], массив не расширяется: [math]a_i=t_i+\Phi(c,s+1)-\Phi(c,s)=1+(2(s+1)-c)-(2s-c)=3[/math]
  • [math]\frac{s}{c}\lt \frac{1}{2}, \frac{s+1}{c}\geqslant\frac{1}{2}[/math], массив не расширяется:

[math]a_i = t_i + \Phi(c, s+1)-\Phi(c, s)= 1 +(2(s+1)-c)-(\frac{1}{2}c - s)= 3+s-\frac{3}{2}c= 3 + \frac{s}{c}c-\frac{3}{2}c \lt 3+\frac{3}{2}c-\frac{3}{2}c=3[/math]

  • [math]\frac{s}{c}\lt \frac{1}{2}, \frac{s+1}{c}\lt \frac{1}{2}[/math], массив не расширяется: [math]a_i = t_i + \Phi(c, s + 1) - \Phi(c, s) = 1 + (\frac{1}{2}c - (s + 1)) - (\frac{1}{2}c - s) = 0[/math]

В итоге, средняя стоимость операции — [math]3[/math], а среднее время работы — [math]O(1)[/math].

Стоимость операции del()

  • [math]\frac{s}{c}=\frac{1}{4}[/math], массив сужается: [math]a_i = t_i + \Phi(\frac{c}{2}, s - 1) - \Phi(c, s) = s + (\frac{1}{2}\cdot\frac{1}{2}c-(s-1)) - (\frac{1}{2}c-s) = 1-\frac{1}{4}c+s=1[/math]
  • [math]\frac{1}{4}\lt \frac{s}{c}\lt \frac{1}{2}[/math], массив не сужается: [math]a_i = t_i + \Phi(c, s - 1) - \Phi(c, s) = 1 + (\frac{1}{2}c-(s-1))-(\frac{1}{2}c-s)= 2[/math]
  • [math]\frac{s}{c}\geqslant\frac{1}{2}, \frac{s-1}{c}\lt \frac{1}{2}\Rightarrow s=\frac{1}{2}c[/math], массив не сужается: [math]a_i = t_i + \Phi(c, s - 1) - \Phi(c, s) =1 +(\frac{1}{2}c-(s-1))-(2s-c)=2+\frac{3}{2}c-3s = 2[/math]
  • [math]\frac{s}{c}\gt \frac{1}{2}[/math], массив не сужается: [math]a_i = t_i + \Phi(c, s - 1) - \Phi(c, s) = 1 + (2(s-1)-c)-(2s-c)=3[/math]

Средняя стоимость операции — [math]2[/math], а среднее время работы — [math]O(1)[/math].

Саморасширяющиеся массивы в современных языках программирования

Саморасширяющиеся массивы широко применяются во многих языках программирования. Рассмотрим, как эта структура данных реализуется в С++ и Java.

С++ — vector

В С++ саморасширяющийся массив называется vector, он описан в STL(<vector>). Стратегия его расширения проста: при попытке записи в массив нового элемента в момент полного заполнения памяти происходит увеличение размера в [math]2[/math] раза при компиляции GNU C++ и в [math]1.5[/math] раза при компиляции Microsoft Visual C++. При удалении элементов уменьшение размера массива никогда не происходит.