Эволюционные алгоритмы многокритериальной оптимизации, основанные на индикаторах. Гиперобъем — различия между версиями
Fkorotkov (обсуждение | вклад) |
Fkorotkov (обсуждение | вклад) м (typos) |
||
Строка 17: | Строка 17: | ||
|id=definition2 | |id=definition2 | ||
|about=2 | |about=2 | ||
− | |definition= | + | |definition=Коэффициентом аппроксимации функции <tex>f</tex> на <tex>X</tex> равен: |
<tex>\mathrm{\alpha (f, X) = inf \{\alpha | X} - \alpha</tex> аппроксимация <tex>f \}</tex> | <tex>\mathrm{\alpha (f, X) = inf \{\alpha | X} - \alpha</tex> аппроксимация <tex>f \}</tex> | ||
}} | }} | ||
Строка 24: | Строка 24: | ||
|id=definition3 | |id=definition3 | ||
|about=3 | |about=3 | ||
− | |definition=Оптимальный | + | |definition=Оптимальный коэффициент аппроксимации <tex>\alpha_{opt} = \sup \limits_{f \in \mathbb{F}} \inf \limits_{x \in \mathbb{X}} \alpha (f, X)</tex> |
}} | }} | ||
Строка 58: | Строка 58: | ||
Пусть <tex>\forall i \in \{0, 1, \ldots, n\} f(x)=B(B/b)^{-i/n}</tex> на интервале <tex>(a(A/a)^{(i-1)/n}, a(A/a)^{i/n}]</tex>. | Пусть <tex>\forall i \in \{0, 1, \ldots, n\} f(x)=B(B/b)^{-i/n}</tex> на интервале <tex>(a(A/a)^{(i-1)/n}, a(A/a)^{i/n}]</tex>. | ||
− | Теперь <tex>f</tex> - это фронт Парето из <tex>n+1</tex> слоя. Предложим множество решений <tex>(x_1,x_2, \ldots , x_n)</tex> из <tex>n</tex> точек. По принципу | + | Теперь <tex>f</tex> - это фронт Парето из <tex>n+1</tex> слоя. Предложим множество решений <tex>(x_1,x_2, \ldots , x_n)</tex> из <tex>n</tex> точек. По принципу Дирихле получается, что хотя бы на одном уровне нету ни одного решения. Это означает, что нижняя граница этого уровня аппроксимируется значением <tex>\min ( \frac{A}{a}, \frac{B}{b})^{\frac{1}{n}}</tex>. |
}} | }} | ||
Строка 101: | Строка 101: | ||
|about=4 | |about=4 | ||
|statement=Пусть <tex>f \in \mathbb{F}, n \in \mathbb{N}</tex>. | |statement=Пусть <tex>f \in \mathbb{F}, n \in \mathbb{N}</tex>. | ||
− | Тогда существует, не | + | Тогда существует, не обязательно единственное, множество решения <tex>X \in \mathbb{X}</tex>, которое максимизирует значение <tex>HYP(X)</tex> на <tex>\mathbb{X}</tex> |
|proof= | |proof= | ||
<tex>X=(x_1, x_2, \ldots,x_n)</tex> | <tex>X=(x_1, x_2, \ldots,x_n)</tex> | ||
<tex>HYP(X)=\sum\limits_{i = 1}^{n} (x_i-x_{i-1})(f(x_i) - r)</tex> | <tex>HYP(X)=\sum\limits_{i = 1}^{n} (x_i-x_{i-1})(f(x_i) - r)</tex> | ||
− | Рассмотрим ряд | + | Рассмотрим ряд множеств решений <tex>\{X^i\}: \lim\limits_{i \rightarrow \infty} (X^i) = X</tex> |
<tex> | <tex> | ||
\lim\limits_{j \rightarrow \infty} HYP(X^j) = \lim\limits_{i \rightarrow \infty} \sum\limits_{i = 1}^{n} (x_i^j-x_{i-1}^j)(f(x_i^j) - r) = \sum\limits_{i = 1}^{n} (x_i-x_{i-1})(\lim\limits_{i \rightarrow \infty} f(x_i^j) - r) = \sum\limits_{i = 1}^{n} (x_i-x_{i-1})(f(x_i) - r) = HYP(X) | \lim\limits_{j \rightarrow \infty} HYP(X^j) = \lim\limits_{i \rightarrow \infty} \sum\limits_{i = 1}^{n} (x_i^j-x_{i-1}^j)(f(x_i^j) - r) = \sum\limits_{i = 1}^{n} (x_i-x_{i-1})(\lim\limits_{i \rightarrow \infty} f(x_i^j) - r) = \sum\limits_{i = 1}^{n} (x_i-x_{i-1})(f(x_i) - r) = HYP(X) | ||
</tex> | </tex> | ||
− | Получается, что <tex>HYP(X)</tex> - верхняя полунепрерывная, следовательно экстремум <tex>HYP</tex> | + | Получается, что <tex>HYP(X)</tex> - верхняя полунепрерывная, следовательно экстремум <tex>HYP</tex> достигается на компакте. |
}} | }} | ||
Строка 115: | Строка 115: | ||
|id=definition6 | |id=definition6 | ||
|about=6 | |about=6 | ||
− | |definition=Пусть <tex>f \in \mathbb{F}, n \geq 3</tex> и <tex>X = (x_1, \ldots, x_n) \in \mathbb{X}</tex>. Наименьшим вкладом этого множества | + | |definition=Пусть <tex>f \in \mathbb{F}, n \geq 3</tex> и <tex>X = (x_1, \ldots, x_n) \in \mathbb{X}</tex>. Наименьшим вкладом этого множества называется: |
<tex>MinCon(X)= \min \limits_{2 \leq i \leq n-1} (x_i-x_{i-1})(f(x_i)- f(x_{i-1}))</tex>. | <tex>MinCon(X)= \min \limits_{2 \leq i \leq n-1} (x_i-x_{i-1})(f(x_i)- f(x_{i-1}))</tex>. | ||
}} | }} | ||
Строка 126: | Строка 126: | ||
|proof= | |proof= | ||
Пусть <tex>a_i=x_i-x_{i-1}</tex> <tex>\forall i \in [2,n]</tex> и <tex>b_i=f(x_i)-f(x_{i-1})</tex> <tex>\forall i \in [1,n-1]</tex>. | Пусть <tex>a_i=x_i-x_{i-1}</tex> <tex>\forall i \in [2,n]</tex> и <tex>b_i=f(x_i)-f(x_{i-1})</tex> <tex>\forall i \in [1,n-1]</tex>. | ||
− | Подставив в [[#definition6| | + | Подставив в [[#definition6|определение(6)]], получим: |
<tex>MinCon(X)= \min \limits_{2 \leq i \leq n-1} a_i b_i \Leftrightarrow a_i \geq MinCon(X) / b_i \forall i \in [2, n-1]</tex> | <tex>MinCon(X)= \min \limits_{2 \leq i \leq n-1} a_i b_i \Leftrightarrow a_i \geq MinCon(X) / b_i \forall i \in [2, n-1]</tex> | ||
<tex>\sum \limits_{i=2}^{n-1} MinCon(X) / b_i \leq \sum \limits_{i=2}^{n-1} a_i \leq \sum \limits_{i=2}^{n} a_i = \sum \limits_{i=2}^{n}x_i - \sum \limits_{i=1}^{n-1}x_i=x_n-x_1 </tex> | <tex>\sum \limits_{i=2}^{n-1} MinCon(X) / b_i \leq \sum \limits_{i=2}^{n-1} a_i \leq \sum \limits_{i=2}^{n} a_i = \sum \limits_{i=2}^{n}x_i - \sum \limits_{i=1}^{n-1}x_i=x_n-x_1 </tex> | ||
Строка 156: | Строка 156: | ||
Таким образом <tex>(\alpha - 1)^2 x_i f(x_{i+1}) < \min \{\frac{x_iB}{(i-2)^2} ,\frac{A f(x_{i+1})}{(n-i-2)^2}\} \Leftrightarrow</tex> <tex>\alpha < 1 + \min \{\frac{\sqrt{x_iB}}{i-2} ,\frac{\sqrt{A f(x_{i+1})}}{n-i-2}\}</tex>. | Таким образом <tex>(\alpha - 1)^2 x_i f(x_{i+1}) < \min \{\frac{x_iB}{(i-2)^2} ,\frac{A f(x_{i+1})}{(n-i-2)^2}\} \Leftrightarrow</tex> <tex>\alpha < 1 + \min \{\frac{\sqrt{x_iB}}{i-2} ,\frac{\sqrt{A f(x_{i+1})}}{n-i-2}\}</tex>. | ||
− | Т.к. <tex>\frac{\sqrt{x_iB}}{i-2}</tex> монотонно убывает, а <tex>\frac{\sqrt{A f(x_{i+1})}}{n-i-2}\}</tex> монотонно возрастает, то максимальное значение <tex>\min \{\frac{\sqrt{x_iB}}{i-2} ,\frac{\sqrt{A f(x_{i+1})}}{n-i-2}\}</tex> достигается при | + | Т.к. <tex>\frac{\sqrt{x_iB}}{i-2}</tex> монотонно убывает, а <tex>\frac{\sqrt{A f(x_{i+1})}}{n-i-2}\}</tex> монотонно возрастает, то максимальное значение <tex>\min \{\frac{\sqrt{x_iB}}{i-2} ,\frac{\sqrt{A f(x_{i+1})}}{n-i-2}\}</tex> достигается при равенстве обоих членов: |
<tex>\frac{\sqrt{x_iB}}{i-2} = \frac{\sqrt{A f(x_{i+1})}}{n-i-2}\} \Leftrightarrow i = 2 + \frac{(n-4)\sqrt{B/b}}{\sqrt{A/a} + \sqrt{B/b}}</tex> | <tex>\frac{\sqrt{x_iB}}{i-2} = \frac{\sqrt{A f(x_{i+1})}}{n-i-2}\} \Leftrightarrow i = 2 + \frac{(n-4)\sqrt{B/b}}{\sqrt{A/a} + \sqrt{B/b}}</tex> |
Версия 10:33, 19 июня 2012
Рассмотрим функции вида: , где убывает и .
Множество всех таких функций обозначим через
Введем несколько понятий:
Определение: |
Множество решений | называется -аппроксимацией функции , если:
Множество всех множеств решений обозначим через
Определение: |
Коэффициентом аппроксимации функции | на равен: аппроксимация
Определение: |
Оптимальный коэффициент аппроксимации |
Теорема (1): | ||||||||||
Доказательство: | ||||||||||
Получили .Пусть Теперь на интервале . - это фронт Парето из слоя. Предложим множество решений из точек. По принципу Дирихле получается, что хотя бы на одном уровне нету ни одного решения. Это означает, что нижняя граница этого уровня аппроксимируется значением . | ||||||||||
Утверждение (3): |
Оба утверждения следуют из теоремы(1). Для доказательства первого утверждения, достаточно заметить, что Для доказательства второго - . |
Следствие:
Существует много различных индикаторов, с помощью которых численно оценивают качество решений. Но широко используется только один.
Определение: |
Индикатор называется эластичным по Парето(Pareto-compliant), если для любых двух множеств решения доминирует . | и значение индикатора для больше значения для тогда и только тогда, когда
Дадим определение индикатора гиперобъема .
Определение: |
Пусть дано множество решения по Лебегу. | . Пусть также множество всех решений усечено некоторой точкой . Тогда: , где через обозначена мера множества
Пример:
Пустьи . Тогда .
Утверждение (4): |
Пусть .
Тогда существует, не обязательно единственное, множество решения , которое максимизирует значение на |
Получается, что Рассмотрим ряд множеств решений - верхняя полунепрерывная, следовательно экстремум достигается на компакте. |
Определение: |
Пусть | и . Наименьшим вкладом этого множества называется: .
Утверждение (5): |
Пусть и . Тогда:
|
Пусть определение(6), получим: и . Подставив вТогда Cреднее гармоническое меньше среднего арифметического, тогда: |
Теорема: |
Пусть и . Тогда:
|
Доказательство: |
Допустим, что существует , который не аппроксимируется . Пусть , тогда .Известно, что После подстановки, получим: (1).Применив утверждение(5), получим: (2) (3) Таким образом .Т.к. монотонно убывает, а монотонно возрастает, то максимальное значение достигается при равенстве обоих членов:
Получим верхнюю оценку для : .Выше сказанное верно для .Для из (1) и (3) получим:
что невозможно по условию теоремы. Для из (1) и (2) получим:что тоже невозможно по условию теоремы. |
Источники
- Friedrich T., Bringmann K. - The Maximum Hypervolume Set Yields Near-optimal Approximation
- Corne D., Knowles J., Watson R. - Reducing Local Optima in Single-Objective Problems by Multi-objectivization
- Friedrich T., Horoba C., Neumann F. - Multiplicative Approximations and the Hypervolume Indicator
- Kunzli S., Zitzle E. - Indicator-Based Selection in Multiobjective Search