Изменения

Обучение в реальном времени

Нет изменений в размере, 22:30, 20 апреля 2020

→‎Градиентный спуск в реальном времени (Online Gradient Descent)

<tex> C(w) \stackrel{\triangle}{=} E_z Q(z,w) \stackrel{\triangle}{=} \int Q(z, w)\,\mathrm{d}P(z)\ </tex>

Каждая итерация этого алгоритма состоит из извлечения события <tex>z_t</tex> из распределения <tex>\mathrm{d}P(z)</tex> и применения следующей формулы обновления, где <tex>\gamma_t</tex> - либо ~~положительные числа~~положительное число, либо ~~определенные положительные матрицы~~определенная положительная матрица:

<tex> w_{t+1} = w_t - \gamma_t H(z_t, w_t) \ </tex>

Mettus.katerina

34

правки

Изменения

Обучение в реальном времени

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты