Изменения

Перейти к: навигация, поиск
м
rollbackEdits.php mass rollback
В задачах [[Задача_многокритериальной_оптимизации._Multiobjectivization|многокритериальной оптимизации]] встает проблема сравнения множеств решений. Данную проблему обычно решают введением функции, которая сопоставляет множеству решений вещественное значение. Такие функции называются индикаторами.
 
= Применение =
В работе <ref>[ftp://ife.ee.ethz.ch/pub/people/zitzler/ZK2004a.pdf Kunzli S., Zitzle E. — Indicator-Based Selection in Multiobjective Search]</ref> предлагают с помощью индикатора <tex>I</tex> ввести следующую функцию приспособленности:
<tex>F(x_1)= \sum \limits_{x_2 \in P \setminus \{ x_1 \}} -e^{-I(x_2,x_1)/k}</tex>, где <tex>P = \{x_i\}</tex> — популяция, <tex>k</tex> — некая константа, зависящая от текущей задачи. Данная функция приспособленности колличественно измеряет потери в качестве поколения при удалении особи.
 
Для пересчета значений функции приспособленности при удалении особи <tex>x^*</tex> из поколения достаточно выполнения следующего условия:
 
<tex>\forall x \in P \setminus \{x*\} :F(x) = F(x) + e^{-I(x^*,x)/k}</tex>
 
В работе <ref>[http://www.mpi-inf.mpg.de/~tfried/paper/2008PPSN_IBEA.pdf Brockhoff D., Friedrich T., Neumann F. — Analyzing Hypervolume Indicator Based Algorithms]</ref> детально рассматривается применение [[#definition2|индикатора гиперобъема]] в эволюционных алгоритмах.
 
= Основные определения =
Рассмотрим функции вида: <tex>f:[a,A] \rightarrow [b,B]</tex>, где <tex>f</tex> убывает и <tex>f(a)=B, f(A)=b</tex>.Множество всех таких функций обозначим через <tex>\mathbb{F}</tex> Введем несколько понятий:== Аппроксимация функции Гиперобъем ==
{{Определение
|id=definition1
|about=1
|definition=Множество Индикатор называется оптимальным по Парето(Pareto-compliant), если для любых двух множеств решений <tex>\mathrm{X=\{x_1,x_2, \ldots , x_n\}}A</tex> и <tex>B</tex> называется значение индикатора для <tex>\alphaA</tex>-аппроксимацией функции больше значения индикатора для <tex>f \in \mathbb{F}B</tex>тогда и только тогда, если:когда <tex>A</tex>\mathrm{\forall x \in [a,A[Задача_многокритериальной_оптимизации._Multiobjectivization#section=3|доминирует]] \exists x_i \in X : (x \leq \alpha x_i) \bigwedge (f(x) \leq \alpha f(x_i))}<tex>B</tex>.
}}
Множество всех множеств решений обозначим через <tex>\mathbb{X}</tex>
== Коэффициент аппроксимации ==Дадим определение индикатора гиперобъема<ref>[http://www.mpi-inf.mpg.de/~tfried/paper/2010GECCO_Hyp.pdf Friedrich T., Bringmann K. — The Maximum Hypervolume Set Yields Near-optimal Approximatio]</ref><tex>\left(HYP\right)</tex>.
{{Определение
|id=definition2
|about=2
|definition=Коэффициентом аппроксимации функции Пусть дано множество решений <tex>f\mathrm{X \subseteq \mathbb{R}^d}</tex> на . Пусть также множество всех решений усечено некоторой точкой <tex>X\mathrm{r = \left(r_1, r_2, \ldots, r_d \right)}</tex> называется . Тогда<tex>\mathrm{HYP\alpha left(f, X\right) = inf VOL\left( \bigcup\limits_{\alpha | left(x_1, x_2, \ldots, x_d \right) \in X} - \alphaleft[ r_1, x_1\right] \times \left[ r_2, x_2\right] \times \cdots \times \left[ r_d, x_d\right] \right)}</tex>, где через <tex>VOL(X)</tex>-аппроксимация обозначена мера множества <tex>f \}X</tex>[[Мера_Лебега_в_R%5En|по Лебегу]].
}}
{{Определение
|id=definition3
|about=3
|definition=Оптимальный коэффициент аппроксимации <tex>\alpha_{opt} = \sup \limits_{f \in \mathbb{F}} \inf \limits_{X \in \mathbb{X}} \alpha (f, X)</tex>.
}}
{{Теорема|statement=Например, пусть <tex>\alpha_mathrm{optr = \left(r_1\right)} </tex> и <tex>d= min 1</tex>, тогда <tex>HYP( X) = \prod \fraclimits_{Ax_i \in X}{(x_i-r_1)</tex>. Для задач двукритериальной оптимизацйии будем рассмотрим функции вида: <tex>f:[a}, A] \frac{rightarrow [b,B]</tex>, где <tex>f</tex> убывает и <tex>f(a)=B}{, f(A)=b})^{</tex>. Множество всех таких функций обозначим через <tex>\fracmathbb{1F}</tex>. Множество всех множеств решений обозначим через <tex>\mathbb{n}X}</tex>|id=theorem1|about=1|proof=.
{{Утверждение
|id=statement1
|about=1
|statement=Пусть <tex>f \alpha_in \mathbb{optF} , n \leq (in \fracmathbb{AN}</tex>, тогда существует, не обязательно единственное, множество решений <tex>X \in \mathbb{aX}</tex>, которое максимизирует значение <tex>HYP(X)^{</tex> на <tex>\frac{1}mathbb{n}X}</tex>.
|proof=
Рассмотрим <tex>\alpha = (\frac{A}{a})^{\frac{1}{n}}</tex>, тогда <tex>x_i=a \alpha^i(i=1 \ldots n)</tex>.
<tex>\{x_i\}</tex> - <tex>\alpha</tex>-аппроксимация, т.к. <tex>\forall x \in [x_i, x_{i+1}]: f(x) \leq \alpha f(x_i)</tex>.
Следовательно <tex>\alpha_{opt} \leq \alpha</tex>.
}}
{{Утверждение|id=statement2|about=2|statement=<tex>X=\alpha_{opt} x_1, x_2, \leq (\frac{B}{b})^{ldots,x_n\frac{1}{n}}</tex>|proof=Рассмотрим Пусть нижняя граница <tex>\alpha r= (\frac{B}{b}R_x, R_y)^{\frac{1}{n}}</tex> и . <tex>x_iHYP(X)=f^\sum\limits_{-i = 1}(B \alpha^{n} (x_i-x_{i-1})(i=1 \ldots n)</tex>.Тогда <tex>f(x_i) \geq B \alpha^{-i}</tex>.Следовательно <tex>\not \exists x: f(x_i)>f(xr)>B \alpha^{-1}</tex>.Т.о. <tex>\{x_i\}</tex> - <tex>\alpha</tex>-аппроксимация, т.к. где <tex>B \alpha^{-i} \leq f(x) \leq B \alpha^{-i+1}x_0 = R_x</tex>.}}
Получили Рассмотрим ряд множеств решений <tex>\alpha_{optX^i\} : \geq min ( lim\fraclimits_{A}{a}, i \rightarrow \frac{B}{binfty}(X^i)^{\frac{1}{n}}= X</tex>.
Пусть <tex>\forall i \in lim\limits_{0, 1, j \ldots, nrightarrow \infty} fHYP(xX^j)=B(B/b)\lim\limits_{i \rightarrow \infty} \sum\limits_{i = 1}^{-i/n}</tex> на интервале <tex>(a(A/a)x_i^j-x_{(i-1}^j)/n}, a(A/af(x_i^j) - r)^{i/n}]=</tex>.
Теперь <tex>f</tex> - это фронт Парето из <tex>n+1</tex> слоя. Предложим, множество решений <tex>= \sum\limits_{x_1,x_2, \ldots , x_n\i = 1}</tex> из <tex>^{n</tex> точек. По принципу Дирихле получается, что хотя бы на одном уровне нет ни одного решения. Это означает, что верхняя граница этого уровня аппроксимируется значением <tex>\min } ( \fracx_i-x_{Ai-1})(\lim\limits_{a}, i \rightarrow \frac{B}{binfty}f(x_i^j) - r)^{= \sum\fraclimits_{i = 1}^{n}(x_i-x_{i-1})(f(x_i) - r) = HYP(X)</tex>.
Получается, что <tex>HYP(X)</tex> — [[Wikipedia:Semi-continuity|полунепрерывна сверху]], следовательно, экстремум <tex>HYP</tex> достигается на компакте.
}}
= Аппроксимация функции и ее свойства ={{УтверждениеОпределение|id=statement3definition3
|about=3
|statementdefinition=Множество решений <tex>\forall n \geq \log (\min ( \fracmathrm{A}{a}, X=\frac{B}{b})) / \varepsilon </tex>, где <tex>\varepsilon \in (0x_1,1)</tex>x_2, выполняется:*<tex>\alpha_{opt} \geq 1 + \frac{\log (\min ( \frac{A}{a}ldots , x_n\frac{B}{b}))}{n}</tex>*называется <tex>\alpha_{opt} \leq 1 + (1+\varepsilon)\frac{\log (\min ( \frac{A}{a}, \frac{B}{b}))}{n}alpha</tex>|proof=Оба утверждения следуют из [[#theorem1|теоремы(1)]]. Для доказательства первого утверждения достаточно заметить, что -аппроксимацией функции <tex>\forall x f \in \mathbb{RF}: e^x\geq 1+x </tex>., еслиДля доказательства второго - <tex>\mathrm{\forall x \in [0a, A] \varepsilon]; \exists x_i \in X : e^(x \leq 1+\alpha x_i) \bigwedge (1+f(x) \leq \varepsilonalpha f(x_i))x }</tex>.
}}
 
'''Следствие:''' <tex>\alpha_{opt} = 1 + \Theta(1/n)</tex>.
 
== Индикатор Гиперобъема ==
 
Существует много различных индикаторов, с помощью которых численно оценивают качество решений. Но широко используется только один.
{{Определение
|id=definition4
|about=4
|definition=Индикатор называется эластичным по Парето(Pareto-compliant), если для любых двух множеств решения Коэффициентом аппроксимации функции <tex>Af</tex> и на <tex>BX</tex> значение индикатора для называется <tex>A</tex> больше значения для <tex>B</tex> тогда и только тогда\mathrm{\alpha (f, когда <tex>AX) = inf \{\alpha | X} - \alpha</tex> [[Задача_многокритериальной_оптимизации._Multiobjectivization#section=3|доминирует]] -аппроксимация <tex>Bf \}</tex>.
}}
Дадим определение индикатора гиперобъема<tex>\left(HYP\right)</tex>.
{{Определение
|id=definition5
|about=5
|definition=Пусть дано множество решения Оптимальный коэффициент аппроксимации <tex>\mathrmalpha_{X opt} = \sup \limits_{f \in \mathbb{RF}^d}</tex>. Пусть также множество всех решений усечено некоторой точкой <tex>\mathrm{r = inf \left(r_1, r_2, \ldots, r_d \right)}</tex>. Тогда:<tex>\mathrmlimits_{HYP\left(X\right)=VOLin \left( \bigcup\limits_mathbb{\left(x_1, x_2, \ldots, x_d \right) \in X}} \left[ r_1, x_1\right] \times \left[ r_2alpha (f, x_2\right] \times \cdots \times \left[ r_d, x_d\right] \right)}</tex>, где через <tex>VOL(X)</tex> обозначена мера множества <tex>X</tex> [[Мера_Лебега_в_R%5En|по Лебегу]].
}}
Пример:{{Теорема Пусть |statement=<tex>\mathrmalpha_{opt} = min ( \frac{A}{a}, \frac{B}{b})^{\frac{1}{n}}</tex>|id=theorem1|about=1|proof= {r {Утверждение|id=statement2|about= 2|statement=<tex>\leftalpha_{opt} \leq (r_1\rightfrac{A}{a})^{\frac{1}{n}}</tex> и |proof=Рассмотрим <tex>d\alpha =(\frac{A}{a})^{\frac{1}{n}}</tex>. Тогда , тогда <tex>HYPx_i=a \alpha^{i-1}(X) i= 1 \prod ldots n)</tex>.<tex>\limits_{x_i \}</tex> — <tex>\alpha</tex>-аппроксимация, т.к. <tex>\forall x \in X[x_i, x_{i+1} ]: f(x) \leq \alpha f(x_i-r_1)</tex>.Следовательно, <tex>\alpha_{opt} \leq \alpha</tex>.}}
{{Утверждение
|id=statement4statement3
|about=4
|statement=Пусть <tex>f \in \mathbbalpha_{Fopt}, n \in leq (\mathbbfrac{NB}</tex>.Тогда существует, не обязательно единственное, множество решений <tex>X \in \mathbb{Xb}</tex>, которое максимизирует значение <tex>HYP(X)</tex> на <tex>^{\mathbbfrac{X1}{n}}</tex>
|proof=
Рассмотрим <tex>\alpha = (\frac{B}{b})^{\frac{1}{n}}</tex> и <tex>x_i=f^{-1}(B \alpha^{-i}) \; (i=1 \ldots n)</tex>.
Тогда <tex>f(x_i) \geq B \alpha^{-i}</tex>.
Следовательно, <tex>\not \exists \; x: f(x_i)>f(x)>B \alpha^{-1}</tex>.
Таким образом, <tex>\{x_i\}</tex> — <tex>\alpha</tex>-аппроксимация, так как <tex>B \alpha^{-i} \leq f(x) \leq B \alpha^{-i+1}</tex>.
}}
Получили <tex>X=\alpha_{x_1, x_2, opt} \ldots,x_ngeq min ( \frac{A}</tex> <tex>HYP(X)=\sum\limits_{i = 1a}^, \frac{nB} (x_i-x_{i-1b})(f(x_i) - r)</tex> Рассмотрим ряд множеств решений <tex>^{\frac{X^i\1}: \lim\limits_{i \rightarrow \inftyn}} (X^i) = X</tex>.
Пусть <tex>\limforall i \in \limits_{j 0, 1, \rightarrow ldots, n\infty} HYP\; f(X^jx) = \lim\limits_B(B/b)^{-i \rightarrow \infty/n} \sum\limits_</tex> на интервале <tex>(a(A/a)^{(i = -1}^{)/n} , a(x_iA/a)^j-x_{i-1/n}^j)(f(x_i^j) - r) =]</tex>.
Теперь <tex>f</tex> — это фронт Парето из <tex>n+1</tex> слоя. Предложим, множество решений <tex>= \sum{x_1,x_2, \limits_ldots , x_n\}</tex> из <tex>n</tex> точек. По принципу Дирихле получается, что хотя бы на одном уровне нет ни одного решения. Это означает, что верхняя граница этого уровня аппроксимируется значением <tex>\min ( \frac{i = 1A}^{na} (x_i-x_, \frac{i-1B})(\lim\limits_{i \rightarrow \inftyb} f(x_i)^j) - r) = {\sum\limits_frac{i = 1}^{n} (x_i-x_{i-1})(f(x_i) - r) = HYP(X)</tex>.
Получается, что <tex>HYP(X)</tex> - верхняя полунепрерывная, следовательно экстремум <tex>HYP</tex> достигается на компакте.
}}
 
{{Определение
|id=definition6
|about=6
|definition=Пусть <tex>f \in \mathbb{F}, n \geq 3</tex> и <tex>X = \{x_1, \ldots, x_n\} \in \mathbb{X}</tex>. Наименьшим вкладом этого множества называется:
<tex>MinCon(X)= \min \limits_{2 \leq i \leq n-1} (x_i-x_{i-1})(f(x_i)- f(x_{i-1}))</tex>
}}
{{Утверждение
|id=statement5statement4
|about=5
|statement=Пусть <tex>f \in forall n \geq \log (\min ( \mathbbfrac{A}{Fa}, n \geq 3frac{B}{b})) / \varepsilon </tex> и , где <tex>X = \{x_1, varepsilon \ldotsin (0, x_n1)</tex> выполняется:*<tex>\alpha_{opt} \in geq 1 + \frac{\log (\min ( \frac{A}{a}, \mathbbfrac{B}{b}))}{Xn}</tex>. Тогда:*<tex>MinCon\alpha_{opt} \leq 1 + (X1+\varepsilon) \leq \frac{\log (x_n-x_1)\min (f(x_1)-f(x_n\frac{A}{a}, \frac{B}{b}))}{(n-2)^2}</tex>
|proof=
Пусть <tex>a_i=x_i-x_{i-1}</tex> <tex>\forall i \in [2,n]</tex> и <tex>b_i=f(x_i)-f(x_{i-1})</tex> <tex>\forall i \in [1,n-1]</tex>.Подставив в Оба утверждения следуют из [[#definition6theorem1|определениетеоремы(61)]], получим:.
Для доказательства первого утверждения достаточно заметить, что <tex>MinCon(X)= \min \limits_{2 \leq i \leq n-1} a_i b_i \Leftrightarrow a_i \geq MinCon(X) / b_i \forall i x \in [2, n-1]</tex> <tex>\sum \limits_mathbb{i=2R}: e^{n-1} MinCon(X) / b_i x\leq \sum \limits_{i=2}^{n-1} a_i \leq \sum \limits_{i=2}^{n} a_i = \sum \limits_{i=2}^{n}x_i - \sum \limits_{i=1}^{n-geq 1}x_i=x_n-x_1 </tex> Тогда <tex>MinCon(X) \leq \frac{x_n-x_1}{\sum \limits_{i=2}^{n-1}1/b_i}+x </tex>. Cреднее гармоническое меньше среднего арифметическогоВторое утверждение следует из того, тогда:что <tex>MinCon(X) \leq forall x \frac{x_n-x_1}{in [0, \sum \limits_{i=2}varepsilon]: e^{n-1}1/b_i} x \leq \frac{1+(x_n-x_1)\sum \limits_{i=2}^{n-1}b_i}{(n-2)^2} +\leq \frac{(x_n-x_1varepsilon)(f(x_1)-f(x_n))}{(n-2)^2}x </tex>.
}}
{{Теорема
|statement=Пусть <tex>f \in \mathbb{F}, n > 4</tex> и <tex>X = \{ x_1, \ldots, x_n \} \in \mathbb{X}</tex>. Тогда:
<tex>\alpha = 1 + \frac{\sqrt{A/a} + \sqrt{B/b}}{n-4}</tex>
|proof=
Допустим, что существует <tex>x</tex>, который не аппроксимируется <tex>\alpha = 1 + \frac{\sqrt{A/a} + \sqrt{B/b}}{n-4}</tex>.
Пусть <tex>x_i < x < x_i+1</tex>, тогда <tex>x > \alpha x_i, f(x) > \alpha f(x_{i+1})</tex>.
Известно, что '''Следствие:''' <tex>MinCon(X) \geq (x-x_i)(f(x)-f(x_alpha_{iopt} = 1 +\Theta(1})/n)</tex>. = Заключение =
После подстановки получим:<tex>MinCon(X) > (\alpha - 1)^2 x_i f(x_{i+1})</tex> (1)В данной статье было введено понятие [[#definition1|индикатора]] и его применимости. Также мы рассмотрели понятие [[#definition3|аппроксимации функции]] и доказали ее основные свойства.
Применив В статье [[#statement5|утверждение(5)Связь между максимизацией гиперобъема и аппроксимацией Парето-фронта]]представлено докательство того, получим: что для <tex>\forall i \in [3, n-1]</tex> <tex>MinCon(X) \leq (x_i-x_1)(f(x_1)точек оптимальный коэффициент апроксимации для данного Парето-f(x_i))/фронта (i-2)^2 \leq x_iB/(i-2)^2</tex> (2) <tex>\forall i \in [1, n-3]</tex> <tex>MinCon(X) \leq (x_n-x_{i+1})(f(x_{i+1})-f(x_n))/(n-i-2)^2 \leq A f(x_{i+1})/(n-i-2)^2</tex> (3) Таким образом <tex>(\alpha - 1)^2 x_i f(x__{i+1OPT}) < \min \{\frac{x_iB}{(i-2)^2} ,\frac{A f(x_{i+1})}{(n-i-2)^2}\} \Leftrightarrow</tex> <tex>\alpha < 1 + \min \{\frac{\sqrt{x_iB}}{i-2} ,\frac{\sqrt{A f(x_{i+1})}}{n-i-2}\}</tex>. Т.к. <tex>\frac{\sqrt{x_iB}}{i-2}</tex> монотонно убывает, а <tex>\frac{\sqrt{A f(x_{i+1})}}{n-i-2}\}</tex> монотонно возрастаети верхняя граница коэффициента аппроксимации для множества, то максимальное максимизирующего значение <tex>\min \{\frac{\sqrt{x_iB}}{i-2} ,\frac{\sqrt{A f(x_{i+1})}}{n-i-2}\}</tex> достигается при равенстве обоих членов:индикатора гиперобъема <tex>\frac{\sqrt{x_iB}}{i-2} = \frac{\sqrt{A f(x_{i+1})}}{n-i-2}\} \Leftrightarrow i = 2 + \frac{(n-4)\sqrt{B/b}}{\sqrt{A/a} + \sqrt{B/b}}</tex> Получим верхнюю оценку для <tex>\alpha</tex>: <tex>\alpha < 1 + \frac{\sqrt{A/a} + \sqrt{B/b}}_{n-4HYP}</tex>. Вышесказанное верно для <tex>3 \leq i \leq n-3</tex>. Для <tex>i = 1, 2</tex> из (1) одинаковы и (3) получим: равны <texmath>\alpha < 1 + \frac{\sqrt{A/a}}{n-i-2} \leq 1 + \frac{\sqrt{A/a}}{n-4}</tex> что невозможно по условию теоремы. Для <tex>i = n-2, n-2</tex> из (1) и Theta (2) получим: <tex>\alpha < 1 + \frac{ \sqrt{B/b} } {i-2} \leq 1 + \frac {\sqrt {B/b} } {n-4}) </texmathчто тоже невозможно по условию теоремы}}
== Источники ==# [http://rain.ifmo.ru/~tsarev/teaching/ea-2012/lectures/4/2010GECCO_Hyp.pdf Friedrich T., Bringmann K. - The Maximum Hypervolume Set Yields Near-optimal Approximation]# [http://rain.ifmo.ru/~tsarev/teaching/ea-2012/lectures/3/multiobjectivization.pdf Corne D., Knowles J., Watson R. - Reducing Local Optima in Single-Objective Problems by Multi-objectivization]# [http://www.mpi-inf.mpg.de/~tfried/paper/2009GECCO.pdf Friedrich T., Horoba C., Neumann F. - Multiplicative Approximations and the Hypervolume Indicator]# [ftp://ife.ee.ethz.ch/pub/people/zitzler<references/ZK2004a.pdf Kunzli S., Zitzle E. - Indicator-Based Selection in Multiobjective Search]>
1632
правки

Навигация