Изменения

Мета-обучение

124 байта добавлено, 00:45, 6 апреля 2019

Нет описания правки

$\text{SGD}(\mathcal{L}_{\tau_i}, \theta, k)$ выполняет стохастический градиентный спуск на $k$ шагов на лоссе $\mathcal{L}_{\tau_i}$, начиная с параметра $\theta$ и возвращает конечный вектор параметров. Градиент reptile определяется как $(\theta - W)/\alpha$, где $\alpha$ {{---}} размер шага, используемый функцией $SGD$.

<font color=green>// ~~Algorithm~~ Алгоритм REPTILE~~, batched version~~</font>

Initialize $\theta$

'''for''' $iteration = 1, 2,...$ '''do'''

{| class="wikitable"

|+ ~~Meta~~мета-~~feature~~признак

|-

! '''~~Name~~Название''' !! '''~~Formula~~Формула''' !! '''~~Rationale~~Объяснение''' !! '''~~Variants~~Варианты'''

|-

| colspan="4" align="center" | '''simple'''

| Nr outliers || $o$ || Data noisiness <ref>Peter J. Rousseeuw and Mia Hubert. Robust statistics for outlier detection. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 2011.</ref> || $o/n$

|-

| colspan="4" align="center" | '''~~statistical~~статистические'''

|-

| Skewness || $\frac{E(X-\mu_{X})^{3}}{\sigma_{X}^{3}}$ || Feature normality || min,max,$\mu$,$\sigma$,$q_{1},q_{3}$

| Class probability || $P(\texttt{C})$ || Class distribution || min,max,$\mu$,$\sigma$

|-

| colspan="4" align="center" | '''~~informational~~информационно-~~theoretic~~теоретические'''

|-

| Class entropy || $H(\texttt{C})$ || Class imbalance ||

| Noise-signal ratio || $\frac{\overline{H(X)}-\overline{MI(C,X)}}{\overline{MI(C,X)}}$ || Noisiness of data ||

|-

| colspan="4" align="center" | '''~~complexity~~сложностные'''

|-

| Fisher's discrimin. || $\frac{(\mu_{c1}-\mu_{c2})^{2}}{\sigma_{c1}^{2}-\sigma_{c2}^{2}}$ || Separability classes $c_{1},c_{2}$ ||

| Data consistency || || Data quality <ref>C K{\"o}pf and I Iglezakis. Combination of task description strategies and case base properties for meta-learning, 2002.</ref> ||

|-

| colspan="4" align="center" | '''~~model-based~~основанные на модели'''

|-

| Nr nodes, leaves || <tex>|\eta|,|\psi|</tex> || Concept complexity <ref>Y Peng, P Flach, C Soares, and P Brazdil. Improved dataset characterisation for meta-learning, 2002.</ref> || Tree depth

| colspan="4" align="center" | '''landmarks'''

|-

| Landmarker(1NN) || $P(\theta_{1NN},t_{j})$ || Data sparsity <ref>Bernhard Pfahringer, Hilan Bensusan, and Christophe G. Giraud-Carrier. Meta-learning by landmarking various learning algorithms.In \emph{17th International Conference on Machine Learning (ICML)}, pages 743 -- 750, 2000.</ref> || ~~See \citet{Pfahringer:2000p553}~~

|-

| Landmarker(Tree) || $P(\theta_{Tree},t_{j})$ || Data separability || Stump,RandomTree

| Landmarker(Lin) || $P(\theta_{Lin},t_{j})$ || Linear separability || Lin.Disciminant

|-

| Landmarker(NB) || $P(\theta_{NB},t_{j})$ || Feature independence || ~~See~~ <ref>Daren Ler, Irena Koprinska, and Sanjay Chawla. Utilizing regression-based landmarkers within a meta-learning framework for algorithm selection. \emph{Technical Report 569. University of Sydney}, pages 44--51, 2005.</ref>

|-

| Relative LM || $P_{a,j} - P_{b,j}$ || Probing performance <ref>J F{\"u}rnkranz and J Petrak. An evaluation of landmarking variants. \emph{ECML/PKDD 2001 Workshop on Integrating Aspects of Data Mining, Decision Support and Meta-Learning}, pages 57--68, 2001.</ref> ||

|}

Непрерывные ~~фичи~~ признаки $X$ и таргет $Y$ имеют медиану $\mu_{X}$, стандартное отклонение $\sigma_{X}$ и дисперсию $\sigma^{2}_{X}$. Категориальные ~~фичи~~ признаки $\texttt{X}$ и класс $\texttt{C}$ имеют категориальные значения $\pi_{i}$, условные вероятности $\pi_{i|j}$, совместные вероятности $\pi_{i,j}$, предельные вероятности $\pi_{i+}=\sum_{j}\pi_{ij}$, и энтропию $H(\texttt{X})=-\sum_{i}\pi_{i+}log_{2}(\pi_{i+})$.

Многие мета-~~фичи~~ признаки вычисляются по одиночным ~~фичам~~ признакам или их комбинации ~~фичей~~, и должны быть агрегированы через min,max,$\mu$,$\sigma$,~~quartiles~~ квартили или ~~гистограммами~~гистограммы.

Во время вычисления похожести задач важно нормализовать все мета-признаки, использовать отбор признаков <ref>L Todorovski and S Dzeroski. Experiments in meta-level learning with ILP. Lecture Notes in Computer Science, 1704:98–106, 1999.</ref> или использовать уменьшение размерности (PCA, например).

Tsebrovskiy

16

правок

Изменения

Мета-обучение

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты