Аффинное пространство — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
м
м (Обоснование)
Строка 184: Строка 184:
 
{{Лемма
 
{{Лемма
 
|id=pOnPlane
 
|id=pOnPlane
 +
|about=(1)
 
|statement=Точка <tex>p</tex> лежит на плоскости <tex>g</tex> тогда и только тогда, когда определитель матрицы <tex>A</tex> равен <tex>0</tex>.
 
|statement=Точка <tex>p</tex> лежит на плоскости <tex>g</tex> тогда и только тогда, когда определитель матрицы <tex>A</tex> равен <tex>0</tex>.
 
|proof=
 
|proof=
Строка 212: Строка 213:
  
 
Итак, поворот классифицирует точки не лежащие на плоскости и разбивает их на два выпуклых множества
 
Итак, поворот классифицирует точки не лежащие на плоскости и разбивает их на два выпуклых множества
 +
 
==Уравнение гиперплоскости, полупространства==
 
==Уравнение гиперплоскости, полупространства==

Версия 23:49, 11 декабря 2016

Введение

Мотивация

Рассмотрим векторное пространство [math]\mathbb{R}^3[/math], построим в нём плоскости [math]P_1=\{z=0\}[/math] и [math]P_2=\{z=1\}[/math]. Плоскость [math]P_1[/math] является векторным подпространством исходного векторного пространства, а плоскость [math]P_2[/math] не является. Это довольно странно, так как с точки зрения геометрии ни одна из плоскостей ничем не лучше другой, плоскость [math]P_2[/math] интуитивно выражается той же линейной структурой, что и [math]P_1[/math].

В векторном пространстве недостаток плоскости [math]P_2[/math] состоит в том, что у неё нет выделенного начала, а [math]P_1[/math] повезло пройти через точку [math](0; 0; 0)[/math]. То, что проходящие через начало координат прямые и плоскости чем-то особенны, довольно неудобно. Аффинные пространства исправляют это досадное недоразумение.

Неформальное описание

Аффинное пространство можно воспринимать как векторное пространство, в котором потеряли начальную точку.

Представим, что Алиса знает настоящую начальную точку, а Боб думает, что начальная точка это [math]p[/math]. Есть какие-то два вектора [math]a[/math] и [math]b[/math], и Алиса с Бобом их складывают. Алиса, опираяющаяся на настоящую начальную точку, получит [math]a + b[/math], а Боб, откладывая те же вектора от точки [math]p[/math], получит [math]p + (a - p) + (b - p)[/math], понятно, что результаты будут разные.

Точно так же они могут вычислять линейные комбинации этих векторов, и, как правило, получать разные результаты. Однако, если сумма коэффициентов линейной комбинации будет равна [math]1[/math], то результаты будут получаться одинаковые. Алиса будет получать получать [math]\lambda a + (1 - \lambda) b[/math], и Боб будет точно так же получать [math]p + \lambda(a - p) + (1 - \lambda)(b - p) = \lambda a + (1 - \lambda) b[/math].

На самом деле, точки, получаемые таким образом, будут лежать на прямой, проходящей через точки [math]a[/math] и [math]b[/math].

У Боба с Алисой есть знание об "аффинной структуре" пространства, то есть значения аффинных комбинаций, определённых как линейные комбинации в которых сумма коэффициентов равна [math]1[/math]. Пространство с аффинной структурой и есть аффинное пространство.

Векторные пространства и определители

Вспомним несколько фактов из линейной алгебры.

Определение:
Набор векторов [math]\{\vec{e}_i\}_{i=1}^n[/math] называется линейно независимым (ЛНЗ), если его линейная комбинация [math]\sum_{i=1}^n \alpha_i \vec{e}_i[/math] равна нулю только в том случае, если она тривиальная, то есть [math]\forall i : \alpha_i = 0[/math].
Определение:
Векторное пространство называется [math]d[/math]-мерным, если в нём существует набор из [math]d[/math] линейно независимых векторов, и не существует набора из [math]d + 1[/math] линейно независимого вектора.

Единственность разложения в базис

Утверждение:
В [math]d[/math]-мерном пространстве любой вектор [math]\vec{A}[/math] единственным образом раскладывается в базисе из [math]d[/math] линейно независимых векторов [math]\{\vec{e}_i\}_{i=1}^d[/math] как [math]\sum_{i=1}^d\alpha_i\vec{e}_i[/math].
[math]\triangleright[/math]

Если мы добавим в базис вектор [math]\vec{A}[/math], то он обязательно станет линейно зависимым, и, значит, найдутся такие [math]\beta[/math] и [math]\{\alpha_i\}[/math], что

[math]\displaystyle \beta \vec{A} + \sum_{i=1}^d\alpha_i\vec{e}_i=0 \implies \vec{A} = \sum\limits_{i=1}^d-\frac{\alpha_i}{\beta}\vec{e}_i[/math],

и, значит, разложение существует.

Теперь пусть есть два разложения [math]\sum_{i=1}^d\alpha_i\vec{e}_i=\vec{A}[/math] и [math]\sum_{i=1}^d\beta_i\vec{e}_i=\vec{A}[/math]. Тогда

[math]\displaystyle \vec{A} - \vec{A} = \vec{0} = \sum_{i=1}^d(\alpha_i - \beta_i)\vec{e}_i[/math],

однако такое может быть только в том случае, если линейная комбинация тривиальная, то есть

[math]\alpha_i - \beta_i = 0 \implies \alpha_i = \beta_i \implies[/math]   разложение единственно.
[math]\triangleleft[/math]

Матрица перехода

Мы можем переходить из одного базиса в другой. Пусть у нас есть базисы [math]\{\vec{e}_i\}_{i=1}^d[/math] и [math]\{\vec{f}_i\}_{i=1}^d[/math].

[math]\displaystyle \vec{A} = \sum_{i=1}^d\alpha_i\vec{e}_i = \sum_{i=1}^d\beta_i\vec{f}_i \ \land\ \vec{e}_i = \sum_{j=1}^d c_{ij}\vec{f}_j[/math]

[math]\displaystyle \vec{A} = \sum_{i=1}^d\alpha_i\vec{e}_i = \sum_{i=1}^d \alpha_i \sum_{j=1}^d c_{ij} \vec{f}_j = \sum_{j=1}^d \vec{f}_j \sum_{i=1}^d \alpha_i c_{ij}[/math]

[math]\displaystyle \beta_j = \sum_{i=1}^d\alpha_i c_{ij} \implies \begin{pmatrix} \beta_1 \\ \beta_2 \\ \vdots \\ \beta_d \end{pmatrix} = \begin{pmatrix} c_{11} & c_{21} & \cdots & c_{d1} \\ c_{12} & c_{22} & \cdots & c_{d2} \\ \vdots & \vdots & \ddots & \vdots \\ c_{1d} & c_{2d} & \cdots & c_{dd} \end{pmatrix} \cdot \begin{pmatrix} \alpha_1 \\ \alpha_2 \\ \vdots \\ \alpha_d \end{pmatrix} [/math]

Аффинные пространства

Определение:
Аффинное пространство – это либо вырожденное пустое множество, либо кортеж [math]\langle A, V, (+)\rangle[/math], состоящий из непустого множества точек [math]A[/math], векторного пространства [math]V[/math] и действия [math](+) : A \times V \rightarrow A[/math], удовлетворяющего следующим свойствам:
  1. [math]\forall a \in A : a + 0 = a[/math];
  2. [math]\forall v, w \in V, a \in A : (a + v) + w = a + (v + w)[/math];
  3. Для всех [math]a[/math] из [math]A[/math] отображение [math](a+)[/math] биективно.

Из этих свойств также следует, что для всех [math]v[/math] из [math]V[/math] [math](+v)[/math] тоже биективно.

Последнее свойство позволяет определить вычитание двух элементов из [math]A[/math]. Пусть [math]a, b \in A[/math], тогда [math]b - a[/math], или [math]\overrightarrow{ab}[/math], это такой вектор из [math]V[/math], что [math]a + (b - a) = b[/math]. Таким образом определённое вычитание обладает следующими свойствами:

  1. [math]\forall a \in A, v \in V \ \exists ! b \in A : (b - a) = v[/math];
  2. [math]\forall a, b, c \in A : (b - a) + (c - b) = (c - a)[/math].

Далее для удобства будем пользоваться вторым вариантом записи.

Определение:
Размерность аффинного пространства [math]\langle A, V, (+)\rangle[/math] равна размерности [math]V[/math].

Аффинные комбинации

В векторном пространстве мы часто пользовались линейными комбинациями. Давайте введём похожее определение для аффинного пространства. Пусть у нас есть множество точек [math]\{a_i\}_{i=1}^n[/math] из [math]A[/math] и такое множество скаляров [math]\{\lambda_i\}_{i=1}^n[/math], что [math]\sum_{i=1}^n \lambda_i = 1[/math]. Теперь давайте перебирать точки начала отсчёта [math]x \in A[/math], и считать суммы [math]x + \sum_{i=1}^n \lambda_i \cdot \overrightarrow{xa_i}[/math]. Несложно показать, что

[math]\displaystyle \forall x, y \in A : x + \sum_{i=1}^n \lambda_i \cdot \overrightarrow{xa_i} = y + \sum_{i=1}^n \lambda_i \cdot \overrightarrow{ya_i}[/math].

То есть, какую бы точку мы не взяли за начало отсчёта, результат мы будем получать один и тот же.

Определение:
Для любого набора точек [math]\{a_i\}_{i=1}^n[/math] из [math]A[/math] и такого набора скаляров [math]\{\lambda_i\}_{i=1}^n[/math], что [math]\sum_{i=1}^n \lambda_i = 1[/math], точка

[math]\displaystyle p = x + \sum_{i=1}^n \lambda_i \cdot \overrightarrow{xa_i}[/math],

не зависящая от выбора [math]x \in A[/math], называется аффинной комбинацией (а также барицентрической комбинацией, или барицентром) точек [math]\{a_i\}_{i=1}^n[/math] с весами [math]\{\lambda_i\}_{i=1}^n[/math], и обозначается как

[math]\displaystyle p = \sum_{i=1}^n \lambda_i a_i[/math].

Аффинные подпространства

С помощью этого определения довольно естественно ввести следующее определение аффинного подпространства.

Определение:
Если [math]\langle A, V, (+)\rangle[/math] – это аффинное пространство, то [math]B \subset A[/math] является аффинным подпространством пространства [math]\langle A, V, (+)\rangle[/math], если любая аффинная комбинация любого множества точек из [math]B[/math] принадлежит [math]B[/math].

Например, [math]\{z=1\}[/math] будет аффинным подпространством аффинного пространства над [math]\mathbb{R}^3[/math], и прямая [math]ax+by=c[/math] будет аффинным подпространством аффинного пространства над [math]\mathbb{R}^2[/math].

Следующая лемма проводит связь между аффинными подпространствами и векторными подпространствами.

Лемма:
Пусть [math]\langle A, V, (+)\rangle[/math] – это аффинное пространство.
  1. Непустое [math]B \subset A[/math] является аффинным подпространством тогда и только тогда, когда для любой точки [math]a \in B[/math] множество [math]W_a = \{\overrightarrow{ab} : b \in B\}[/math] является подпространством [math]V[/math]. Как следствие, [math]B=\{a + w : w \in W_a \}[/math]. Более того, [math]W = \{\overrightarrow{ab} : a, b \in B\}[/math] является подпространством [math]V[/math], и для любой точки [math]a \in B[/math] справедливо [math]W_a = W[/math].
  2. Для любого [math]W[/math], являющегося подпространством [math]V[/math], множество [math]\{a + v : v \in W\}[/math] является аффинным подпространством для любого [math]a \in A[/math].

Аффинная независимость

Аналогично с линейной независимостью в векторных пространствах можно ввести аффинную независимость.

Лемма:
Пусть [math]\langle A, V, (+)\rangle[/math] – это аффинное пространство. Пусть [math]\{a_i\}_{i \in I}[/math] – множество точек из [math]A[/math]. Если для какого-то [math]i \in I[/math] множество векторов [math]\{\overrightarrow{a_i a_j}\}_{j \in I \setminus \{i\}}[/math] линейно независимо, то для любого [math]i \in I[/math] множество [math]\{\overrightarrow{a_i a_j}\}_{j \in I \setminus \{i\}}[/math] будет линейно независимо.

Эта лемма даёт возможность говорить о независимости множества точек без выделения одной из них.

Определение:
Пусть [math]\langle A, V, (+)\rangle[/math] – это аффинное пространство. Множество точек [math]\{a_i\}_{i \in I}[/math] аффинно независимо, если для какого-то [math]i \in I[/math] множество [math]\{\overrightarrow{a_i a_j}\}_{j \in I \setminus \{i\}}[/math] линейно независимо.


Вычисление поворота

Матрица поворота

У нас есть гиперплоскость [math]g[/math] и точки задающие её. В [math]d[/math] мерном пространстве у нас будет [math]d[/math] линейно независимых (ЛНЗ) точек [math]a_1, a_2, \dots, a_d[/math]. Линейную независимость точек воспринимаем творчески.

Определение:
Будем называть набор из [math]d[/math] точек линейно независимым, если мы можем выбрать одну из них, провести вектора от нее до всех остальных и получить [math]d-1[/math] ЛНЗ вектор.


Возьмем в нашем пространстве еще одну выделенную точку [math]p[/math]. Получившийся набор [math]a_1, a_2, \dots, a_d, p[/math] тоже будет ЛНЗ.

Пусть у нас есть какая-то выделенная зарание система координат [math]C[/math]. Эта система приходит обычно вместе с какой-то задачей, и обычно она декартова. И у нас тоже будет сейчас декартова.

Мы знаем, что можно составить матрицу перехода, если умеем выразить координаты векторов в исходной базовой системе координат [math]C[/math]. А в нашем случае мы это сделать, конечно, можем: поскольку вектор существует между любыми парами точек, просто сопредставим нашим точкам вектора, соединяющие начало координат [math]O[/math] и очередную точку. Значит, если нам известны координаты точек, то нам известны координаты векторов в ситеме [math]C[/math]. Запишем матрицу перехода и немножко преобразуем её:

Пример для [math]\mathbb{R}^3[/math]

[math]A = \begin{pmatrix} \overrightarrow{Oa_1} - \overrightarrow{Op} \\ \overrightarrow{Oa_2} - \overrightarrow{Op} \\ \vdots \\ \overrightarrow{Oa_d} - \overrightarrow{Op} \end{pmatrix}^ \mathrm{T} = \begin{pmatrix} a_1 - p \\ a_2 - p\\ \vdots \\ a_d - p \end{pmatrix}^ \mathrm{T} = (-1)^{d+1}\begin{pmatrix} a_1 & 1 \\ a_2 & 1\\ \vdots & \vdots \\ a_d & 1 \\ p & 1 \end{pmatrix}^ \mathrm{T}[/math]

В дальнейшем нас будут интересовать детерминант этой матрицы и его знак:

[math]\det(A) = \begin{vmatrix} a_1 & 1 \\ a_2 & 1\\ \vdots & \vdots \\ a_d & 1 \\ p & 1 \end{vmatrix}[/math]

Обоснование

Лемма ((1)):
Точка [math]p[/math] лежит на плоскости [math]g[/math] тогда и только тогда, когда определитель матрицы [math]A[/math] равен [math]0[/math].
Доказательство:
[math]\triangleright[/math]
Плоскость [math]g[/math] определяется замыканием набора [math]a_1, a_2, \dots, a_d[/math] ЛНЗ точек, значит, если [math]p[/math] принадлежит множеству, то [math]p[/math] является линейной комбинацией этих точек. В этом случае мы с помощью преобразований можем получить нулевую стррочку в матрице [math]A[/math], значит, ее определитель будет ноль.
[math]\triangleleft[/math]

Разобъем все точки пространства (кроме тех, что лежат на плоскости) на два множества в зависимости от того, какой знак для них будет иметь детерминант [math]A[/math]. Покажем, что наша классификация осмысленна.

Лемма:
Получившиеся множества будут выпуклыми.
Доказательство:
[math]\triangleright[/math]

По определению выпуклого множества. Возьмем две любые точки [math]p_1[/math] и [math]p_2[/math], лежащие в одной области. По аксиоматике существует вектор [math]\overrightarrow{p_1p_2}[/math] и по определению можно сделать линейную комбинацию. Значит можем получить любую точку между [math]p_1[/math] и [math]p_2[/math], лежащую с ними на одной прямой, отложив от [math]p_1[/math] вектор [math]\alpha \overrightarrow{p_1p_2}[/math], где [math]\alpha \in [0..1][/math]. Если подставить это в определитель, то получим

[math]\begin{vmatrix} a_1 & 1 \\ a_2 & 1\\ \dots \\ a_d & 1 \\ p_1 + \alpha\overrightarrow{p_1p_2} & 1 \end{vmatrix} = \begin{vmatrix} a_1 & 1 \\ a_2 & 1\\ \dots \\ a_d & 1 \\ \alpha p_2 + (1 - \alpha)p_1 & 1 \end{vmatrix} = \alpha \begin{vmatrix} a_1 & 1 \\ a_2 & 1\\ \dots \\ a_d & 1 \\ p_2 & 1 \end{vmatrix} + (1 - \alpha) \begin{vmatrix} a_1 & 1 \\ a_2 & 1\\ \dots \\ a_d & 1 \\ p_1 & 1 \end{vmatrix} [/math]

Матрицы одинакового знака, и стоящие перед ними коэффициенты положительны. Значит, у нашей точки будет тот же знак определителя, что и у [math]p_1[/math] и [math]p_2[/math].
[math]\triangleleft[/math]

Хорошая лемма, пользоваться мы ей, конечно, не будем.

Проблема в том, что нужно показать, что любая непрерывная кривая не может пройти из точки одного множества в точку другого множества не пересекая плоскость. Но для этого нам необходимо понятие непрерывности, а непрерывность связана с топологией. А у нас есть только афинное пространство, но нет топологии.

Можно было бы воспользоваться аналогом леммы Жордана о том, что любая замкнутая кривая без самопересечений делит пространство на две области, но у нас нет области, потому что понятие области связано с топологией.

В афинном пространстве можно вполне естественно ввести евклидовскую метрику: ввести скалярное произведение, а затем показать, что корень из скалярного произведения задает метрику. Тогда эта метрика будет индуцировать топологию открытыми шарами, а значит, можно будет воспользоваться аналогом теоремы Жордана.

Эта история о том, что даже когда мы притворяемся, что у нас нет метрики, мы неявно испоользуем топологию, индуцированную этой метрикой. Но, метрика, не единственна, и топология не единственна. Иногда нам достаточно топологии, которая даже может быть не индуцирована метрикой, или которая вообще не метризуема, но эта топология будет давать свойство непрерывности. Но тогда для нашей топогогии нужно будет доеказывать вышеупомянутый факт (про непрерывность кривой).

Итак, поворот классифицирует точки не лежащие на плоскости и разбивает их на два выпуклых множества

Уравнение гиперплоскости, полупространства