Изменения

Перейти к: навигация, поиск

Ядро

2461 байт добавлено, 02:38, 22 марта 2020
Нет описания правки
[[File:kernel3_2.png|600px|thumb|right|Пример использования ядерного трюка]]'''Ядерный трюк'''Ядро(Kernelанг. ''kernel function'') метод в машинном обучении, позволяющий перевести элементы для случая линейной неразделимости в новое линейно разделимое пространство пространство. Такое пространство называют '''спрямляющим'' - функция x->\fi(x)'. Поскольку для любой непротиворечивой выборки соответствующее пространство большей размерности существует, которая позволяет совершить преобразование признаков и получить линейно разделимое пространствоглавной проблемой становится его найти.
== Определение ==
Функция $K(x,x′x'):X×X->\rightarrow \mathbb{R }$ называется '''ядром''', если она может быть представлена в виде $K(x,x')=<\filangle \varphi(x),\fivarphi(x')>_H для какой либо функции \firangle_H$ при некотором отображении $\varphi(x):X\rightarrow H$,где H {{->H--}} пространство со скалярным произведением.
Поскольку для задачи линейного разделения объектов не требуется их признаковое описание, а достаточно скаляров, то можно заменить скалярное произведение $\langle x,x'\rangle$ на ядро $K(x,x')$ Более того, можно вообще не строить спрямляющее пространствоHв явномвиде, и вместо подбора отображения $\varphi$ заниматься непосредственно подбором ядра.
 
Можно пойти ещё дальше, и вовсе отказаться от признаковых описаний объек-тов. Во многих практических задачах объекты изначально задаются информациейоб их попарном взаимоотношении, например, отношении сходства. Если эта инфор-мация допускает представление в виде двуместной функции $K(x,x')$, удовлетворяю-щей аксиомам скалярного произведения, то задача может решаться методом [[Метод опорных векторов (SVM) | SVM ]].
== Теорема Мерсера ==
Функция K(x,y) является ядром тогда и только тогда, когда:
Она симметрична: $K(x,y)=K(y,x)$
Она неотрицательно определена, то есть для любой конечной выборки матрица $\forall g: X \rightarrow \mathbb{R}, \int_X \int_X K=(K(x_ix,x_jx')g(x)^l_{i,j=1} неотрицательно определена g(x')dxdx' \geqslant 0$
== Конструктивные способы построения ядер ==
1.Произвольное скалярное произведениеKпроизведение $ K(x,x') =<\langle x,x'>\rangle $ является ядром.
2. КонстантаKКонстанта $K(x,x') = 1 $ является ядром.
3. Произведение ядер <tex>$K(x,x') =K_1(x,x')K_2(x,x')<tex>$является ядром.
4. Для любой функции <tex>$\psi :X->\rightarrow R<tex> $ произведение <tex>K(x,x′) =\psi(x)\psi(x′)</tex>{{---}} ядро.
5. Линейная комбинация ядер с неотрицательными коэффициентамиKкоэффициентами K(x,x′) ==\alpha_1K_1(x,x') +\alpha_2K_2(x,x')является ядром.
6. Композиция произвольной функции $\fivarphi:X->\rightarrow X $ и произвольного ядраK0является ядром: $K(x,x') =K_0(\fivarphi(x),\fivarphi(x'))$.
7. Еслиs:X×X→R $X×X\rightarrow R$ произвольная симметричная интегрируемая функция, тоKто $K(x,x′) =∫Xs\int Xs(x,z)s(x′x',z)$dzявляется ядром.//TODO
8. Функция вида K(x,x') = k(x−x)является ядром тогда и только тогда, когдаФурье-образ F[k](\omega) = (2\Pi)n_2∫Xe−i〈\owmega,x〉k(x)dx неотрицателен.
9. Предел локально-равномерно сходящейся последовательности ядер {{---}} ядро.
10. Композиция произвольного ядраK0и произвольной функции ''f'':R->\rightarrow R, представимой в виде сходящегося степенного ряда с неотрицательными коэффици-ентамиKкоэффициентами $K(x,x') =f(K_0(x,x'))$, является ядром. В частности, функцииfфункции $f(z) =e^z $ и f(z) =1/{1−z} от ядра являются ядрами.
== Некоторые часто используемые функции ==
0.Линейное $K(x, x')=<\langle x, x'>\rangle$
1.Полиномиальное ядро $K(x, x') = (<\langle x, x'> \rangle + R)^d$
2.Гаусово ядро RBF K(x, x') = exp(-\gamma ||x - x'||^2)
 
 
 
== Источники информации ==
 
#[http://www.machinelearning.ru/wiki/images/6/6d/Voron-ML-1.pdf Ядра и спрямляющие пространства p.73-75 — К. В. Воронцов Математические методы обучения по прецедентам]
 
[[Категория: Машинное обучение]]
20
правок

Навигация