Эволюционные алгоритмы многокритериальной оптимизации, основанные на индикаторах. Гиперобъем — различия между версиями
Fkorotkov (обсуждение | вклад) |
Fkorotkov (обсуждение | вклад) |
||
Строка 7: | Строка 7: | ||
Введем несколько понятий: | Введем несколько понятий: | ||
{{Определение | {{Определение | ||
+ | |id=definition1 | ||
+ | |about=1 | ||
|definition=Множество решений <tex>\mathrm{X=(x_1,x_2, \ldots , x_n)}</tex> называется <tex>\alpha</tex>-аппроксимацией функции <tex>f \in \mathbb{F}</tex>, если: | |definition=Множество решений <tex>\mathrm{X=(x_1,x_2, \ldots , x_n)}</tex> называется <tex>\alpha</tex>-аппроксимацией функции <tex>f \in \mathbb{F}</tex>, если: | ||
<tex>\mathrm{\forall x \in [a,A] \exists x_i \in X : (x \leq \alpha x_i) \bigwedge (f(x) \leq \alpha f(x_i))}</tex> | <tex>\mathrm{\forall x \in [a,A] \exists x_i \in X : (x \leq \alpha x_i) \bigwedge (f(x) \leq \alpha f(x_i))}</tex> | ||
Строка 13: | Строка 15: | ||
{{Определение | {{Определение | ||
+ | |id=definition2 | ||
+ | |about=2 | ||
|definition=Коэффицентом аппроксимации функции <tex>f</tex> на <tex>X</tex> равен: | |definition=Коэффицентом аппроксимации функции <tex>f</tex> на <tex>X</tex> равен: | ||
<tex>\mathrm{\alpha (f, X) = inf \{\alpha | X} - \alpha</tex> аппроксимация <tex>f \}</tex> | <tex>\mathrm{\alpha (f, X) = inf \{\alpha | X} - \alpha</tex> аппроксимация <tex>f \}</tex> | ||
Строка 18: | Строка 22: | ||
{{Определение | {{Определение | ||
+ | |id=definition3 | ||
+ | |about=3 | ||
|definition=Оптимальный коэффицент аппроксимации <tex>\alpha_{opt} = \sup \limits_{f \in \mathbb{F}} \inf \limits_{x \in \mathbb{X}} \alpha (f, X)</tex> | |definition=Оптимальный коэффицент аппроксимации <tex>\alpha_{opt} = \sup \limits_{f \in \mathbb{F}} \inf \limits_{x \in \mathbb{X}} \alpha (f, X)</tex> | ||
}} | }} | ||
Строка 57: | Строка 63: | ||
{{Утверждение | {{Утверждение | ||
+ | |id=statement3 | ||
+ | |about=3 | ||
|statement= | |statement= | ||
<tex>\forall n \geq \log (\min ( \frac{A}{a}, \frac{B}{b})) / \varepsilon </tex>, где <tex>\varepsilon \in (0,1)</tex>, выполняется: | <tex>\forall n \geq \log (\min ( \frac{A}{a}, \frac{B}{b})) / \varepsilon </tex>, где <tex>\varepsilon \in (0,1)</tex>, выполняется: | ||
Строка 73: | Строка 81: | ||
Существует много различных индикаторов, с помощью которых численно оценивают качество решений. Но широко используется только один. | Существует много различных индикаторов, с помощью которых численно оценивают качество решений. Но широко используется только один. | ||
{{Определение | {{Определение | ||
− | |definition=Индикатор называется эластичным по Парето(Pareto-compliant), если для любых двух множеств решения <tex>A</tex> и <tex>B</tex> значение индикатора для <tex>A</tex> больше значения для <tex>B</tex> тогда и только тогда, когда <tex>A</tex> доминирует <tex>B</tex>. | + | |id=definition4 |
+ | |about=4 | ||
+ | |definition=Индикатор называется эластичным по Парето(Pareto-compliant), если для любых двух множеств решения <tex>A</tex> и <tex>B</tex> значение индикатора для <tex>A</tex> больше значения для <tex>B</tex> тогда и только тогда, когда <tex>A</tex> [[Задача_многокритериальной_оптимизации._Multiobjectivization#section=3|доминирует]] <tex>B</tex>. | ||
}} | }} | ||
Дадим определение индикатора гиперобъема<tex>\left(HYP\right)</tex>. | Дадим определение индикатора гиперобъема<tex>\left(HYP\right)</tex>. | ||
{{Определение | {{Определение | ||
+ | |id=definition5 | ||
+ | |about=5 | ||
|definition=Пусть дано множество решения <tex>\mathrm{X \in \mathbb{R}^d}</tex>. Пусть также множество всех решений усечено некоторой точкой <tex>\mathrm{r = \left(r_1, r_2, \ldots, r_d \right)}</tex>. Тогда: | |definition=Пусть дано множество решения <tex>\mathrm{X \in \mathbb{R}^d}</tex>. Пусть также множество всех решений усечено некоторой точкой <tex>\mathrm{r = \left(r_1, r_2, \ldots, r_d \right)}</tex>. Тогда: | ||
<tex>\mathrm{HYP\left(X\right)=VOL\left( \bigcup\limits_{\left(x_1, x_2, \ldots, x_d \right) \in X} \left[ r_1, x_1\right] \times \left[ r_2, x_2\right] \times \cdots \times \left[ r_d, x_d\right] \right)}</tex>, где через <tex>VOL(X)</tex> обозначена мера множества <tex>X</tex> [[Мера_Лебега_в_R%5En|по Лебегу]]. | <tex>\mathrm{HYP\left(X\right)=VOL\left( \bigcup\limits_{\left(x_1, x_2, \ldots, x_d \right) \in X} \left[ r_1, x_1\right] \times \left[ r_2, x_2\right] \times \cdots \times \left[ r_d, x_d\right] \right)}</tex>, где через <tex>VOL(X)</tex> обозначена мера множества <tex>X</tex> [[Мера_Лебега_в_R%5En|по Лебегу]]. | ||
Строка 86: | Строка 98: | ||
{{Утверждение | {{Утверждение | ||
+ | |id=statement4 | ||
+ | |about=4 | ||
|statement=Пусть <tex>f \in \mathbb{F}, n \in \mathbb{N}</tex>. | |statement=Пусть <tex>f \in \mathbb{F}, n \in \mathbb{N}</tex>. | ||
Тогда существует, не обязятельно единственное, множество решения <tex>X \in \mathbb{X}</tex>, которое максимизирует значение <tex>HYP(X)</tex> на <tex>\mathbb{X}</tex> | Тогда существует, не обязятельно единственное, множество решения <tex>X \in \mathbb{X}</tex>, которое максимизирует значение <tex>HYP(X)</tex> на <tex>\mathbb{X}</tex> | ||
Строка 96: | Строка 110: | ||
</tex> | </tex> | ||
Получается, что <tex>HYP(X)</tex> - верхняя полунепрерывная, следовательно экстремум <tex>HYP</tex> достикается на компакте. | Получается, что <tex>HYP(X)</tex> - верхняя полунепрерывная, следовательно экстремум <tex>HYP</tex> достикается на компакте. | ||
+ | }} | ||
+ | |||
+ | {{Определение | ||
+ | |id=definition6 | ||
+ | |about=6 | ||
+ | |definition=Пусть <tex>f \in \mathbb{F}, n \geq 3</tex> и <tex>X = (x_1, \ldots, x_n) \in \mathbb{X}</tex>. Наименьшим вкладом этого множества называтеся: | ||
+ | <tex>MinCon(X)= \min \limits_{2 \leq i \leq n-1} (x_i-x_{i-1})(f(x_i)- f(x_{i-1}))</tex>. | ||
+ | }} | ||
+ | |||
+ | {{Утверждение | ||
+ | |id=statement5 | ||
+ | |about=5 | ||
+ | |statement=Пусть <tex>f \in \mathbb{F}, n \geq 3</tex> и <tex>X = (x_1, \ldots, x_n) \in \mathbb{X}</tex>. Тогда: | ||
+ | <tex>MinCon(X) \leq \frac{(x_n-x_1)(f(x_1)-f(x_n))}{(n-2)^2}</tex> | ||
+ | |proof= | ||
+ | Пусть <tex>a_i=x_i-x_{i-1}</tex> <tex>\forall i \in [2,n]</tex> и <tex>b_i=f(x_i)-f(x_{i-1})</tex> <tex>\forall i \in [1,n-1]</tex>. | ||
+ | Подставив в [[#definition6|определние(6)]], получим: | ||
+ | <tex>MinCon(X)= \min \limits_{2 \leq i \leq n-1} a_i b_i \Leftrightarrow a_i \geq MinCon(X) / b_i \forall i \in [2, n-1]</tex> | ||
+ | <tex>\sum \limits_{i=2}^{n-1} MinCon(X) / b_i \leq \sum \limits_{i=2}^{n-1} a_i \leq \sum \limits_{i=2}^{n} a_i = \sum \limits_{i=2}^{n}x_i - \sum \limits_{i=1}^{n-1}x_i=x_n-x_1 </tex> | ||
+ | |||
+ | Тогда <tex>MinCon(X) \leq \frac{x_n-x_1}{\sum \limits_{i=2}^{n-1}1/b_i}</tex> | ||
+ | |||
+ | Cреднее гармоническое меньше среднего арифметического, тогда: | ||
+ | <tex>MinCon(X) \leq \frac{x_n-x_1}{\sum \limits_{i=2}^{n-1}1/b_i} \leq \frac{(x_n-x_1)\sum \limits_{i=2}^{n-1}b_i}{(n-2)^2} \leq \frac{(x_n-x_1)(f(x_1)-f(x_n))}{(n-2)^2}</tex> | ||
+ | }} | ||
+ | |||
+ | {{Теорема | ||
+ | |statement=Пусть <tex>f \in \mathbb{F}, n > 4</tex> и <tex>X = (x_1, \ldots, x_n) \in \mathbb{X}</tex>. Тогда: | ||
+ | <tex>\alpha = 1 + \frac{\sqrt{A/a} + \sqrt{B/b}}{n-4}</tex> | ||
+ | |proof= | ||
+ | Допустим, что существует <tex>x</tex>, который не аппроксимируется <tex>\alpha = 1 + \frac{\sqrt{A/a} + \sqrt{B/b}}{n-4}</tex>. | ||
+ | Пусть <tex>x_i < x < x_i+1</tex>, тогда <tex>x > \alpha x_i, f(x) > \alpha f(x_{i+1})</tex>. | ||
+ | |||
+ | Известно, что <tex>MinCon(X) \geq (x-x_i)(f(x)-f(x_{i+1}))</tex> | ||
+ | |||
+ | После подстановки, получим: | ||
+ | <tex>MinCon(X) > (\alpha - 1)^2 x_i f(x_{i+1})</tex> (1). | ||
+ | |||
+ | Применив [[#statement5|утверждение(5)]], получим: | ||
+ | |||
+ | <tex>\forall i \in [3, n-1]</tex> <tex>MinCon(X) \leq (x_i-x_1)(f(x_1)-f(x_i))/(i-2)^2 \leq x_iB/(i-2)^2</tex> (2) | ||
+ | |||
+ | <tex>\forall i \in [1, n-3]</tex> <tex>MinCon(X) \leq (x_n-x_{i+1})(f(x_{i+1})-f(x_n))/(n-i-2)^2 \leq A f(x_{i+1})/(n-i-2)^2</tex> (3) | ||
+ | |||
+ | Таким образом <tex>(\alpha - 1)^2 x_i f(x_{i+1}) < \min \{\frac{x_iB}{(i-2)^2} ,\frac{A f(x_{i+1})}{(n-i-2)^2}\} \Leftrightarrow</tex> <tex>\alpha < 1 + \min \{\frac{\sqrt{x_iB}}{i-2} ,\frac{\sqrt{A f(x_{i+1})}}{n-i-2}\}</tex>. | ||
+ | |||
+ | Т.к. <tex>\frac{\sqrt{x_iB}}{i-2}</tex> монотонно убывает, а <tex>\frac{\sqrt{A f(x_{i+1})}}{n-i-2}\}</tex> монотонно возрастает, то максимальное значение <tex>\min \{\frac{\sqrt{x_iB}}{i-2} ,\frac{\sqrt{A f(x_{i+1})}}{n-i-2}\}</tex> достигается при равестве обоих членов: | ||
+ | |||
+ | <tex>\frac{\sqrt{x_iB}}{i-2} = \frac{\sqrt{A f(x_{i+1})}}{n-i-2}\} \Leftrightarrow i = 2 + \frac{(n-4)\sqrt{B/b}}{\sqrt{A/a} + \sqrt{B/b}}</tex> | ||
+ | |||
+ | Получим верхнюю оценку для <tex>\alpha</tex>: <tex>\alpha < 1 + \frac{\sqrt{A/a} + \sqrt{B/b}}{n-4}</tex>. | ||
+ | |||
+ | Выше сказанное верно для <tex>3 \leq i \leq n-3</tex>. | ||
+ | |||
+ | Для <tex>i = 1, 2</tex> из (1) и (3) получим: | ||
+ | |||
+ | <tex>\alpha < 1 + \frac{\sqrt{A/a}}{n-i-2} \leq 1 + \frac{\sqrt{A/a}}{n-4}</tex> | ||
+ | |||
+ | что невозможно по условию теоремы. | ||
+ | |||
+ | Для <tex>i = n-2, n-2</tex> из (1) и (2) получим: | ||
+ | |||
+ | <tex>\alpha < 1 + \frac{ \sqrt{B/b} } {i-2} \leq 1 + \frac {\sqrt {B/b} } {n-4}</tex> | ||
+ | |||
+ | что тоже невозможно по условию теоремы. | ||
+ | |||
}} | }} | ||
Версия 10:24, 19 июня 2012
Рассмотрим функции вида: , где убывает и .
Множество всех таких функций обозначим через
Введем несколько понятий:
Определение: |
Множество решений | называется -аппроксимацией функции , если:
Множество всех множеств решений обозначим через
Определение: |
Коэффицентом аппроксимации функции | на равен: аппроксимация
Определение: |
Оптимальный коэффицент аппроксимации |
Теорема (1): | ||||||||||
Доказательство: | ||||||||||
Получили .Пусть Теперь на интервале . - это фронт Парето из слоя. Предложим множество решений из точек. По принципу Дирихде получается, что хотя бы на одном уровне нету ни одного решения. Это означает, что нижняя граница этого уровня апроксимируется значением . | ||||||||||
Утверждение (3): |
Оба утверждения следуют из теоремы(1). Для доказательства первого утверждения, достаточно заметить, что Для доказательства второго - . |
Следствие:
Существует много различных индикаторов, с помощью которых численно оценивают качество решений. Но широко используется только один.
Определение: |
Индикатор называется эластичным по Парето(Pareto-compliant), если для любых двух множеств решения доминирует . | и значение индикатора для больше значения для тогда и только тогда, когда
Дадим определение индикатора гиперобъема .
Определение: |
Пусть дано множество решения по Лебегу. | . Пусть также множество всех решений усечено некоторой точкой . Тогда: , где через обозначена мера множества
Пример:
Пустьи . Тогда .
Утверждение (4): |
Пусть .
Тогда существует, не обязятельно единственное, множество решения , которое максимизирует значение на |
Получается, что Рассмотрим ряд множест решений - верхняя полунепрерывная, следовательно экстремум достикается на компакте. |
Определение: |
Пусть | и . Наименьшим вкладом этого множества называтеся: .
Утверждение (5): |
Пусть и . Тогда:
|
Пусть определние(6), получим: и . Подставив вТогда Cреднее гармоническое меньше среднего арифметического, тогда: |
Теорема: |
Пусть и . Тогда:
|
Доказательство: |
Допустим, что существует , который не аппроксимируется . Пусть , тогда .Известно, что После подстановки, получим: (1).Применив утверждение(5), получим: (2) (3) Таким образом .Т.к. монотонно убывает, а монотонно возрастает, то максимальное значение достигается при равестве обоих членов:
Получим верхнюю оценку для : .Выше сказанное верно для .Для из (1) и (3) получим:
что невозможно по условию теоремы. Для из (1) и (2) получим:что тоже невозможно по условию теоремы. |
Источники
- Friedrich T., Bringmann K. - The Maximum Hypervolume Set Yields Near-optimal Approximation
- Corne D., Knowles J., Watson R. - Reducing Local Optima in Single-Objective Problems by Multi-objectivization
- Friedrich T., Horoba C., Neumann F. - Multiplicative Approximations and the Hypervolume Indicator
- Kunzli S., Zitzle E. - Indicator-Based Selection in Multiobjective Search