Изменения

Генерация объектов

Нет изменений в размере, 15:05, 11 января 2021

→‎Музыка и звуки

Аудио является еще одним возможным приложением для GAN, однако используется гораздо реже. Примером может являться архитектура [https://arxiv.org/abs/1802.04208 WaveGan], которая без меток учится воспроизводить понятные слова при обучении на наборе речевых данных с небольшим словарным запасом, а также может синтезировать звук из других областей, таких как барабаны, вокализации птиц и фортепиано.

На сегодняшний день, многие модели для генерации музыки используют [[Долгая краткосрочная память | долгую краткосрочную память (LSTM)]]. Например, еще в 2002 году при помощи LSTM-сети построили модель, генерирующую не только мелодию, но и аккомпанемент к ней в формате выбора аккорда из зафиксированного перечня, и, отчасти, впервые добились благозвучного результата.

В Google сейчас активно используется модель [https://en.wikipedia.org/wiki/WaveNet WaveNet], которая основана на [[~~CNN |~~ Сверточные нейронные сети| CNN]]. WaveNet способна генерировать речь, похожую на голос любого человека, и другие звуки, включая музыку (например, композиции на пианино) <ref>[https://habr.com/ru/company/Voximplant/blog/309648/ Google WaveNet]</ref>.

<!---

Анонимный участник

188.170.82.183

Изменения

Генерация объектов

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты