Изменения

Генерация объектов

1461 байт добавлено, 15:04, 11 января 2021

→‎Музыка и звуки

==== Музыка и звуки ====

Аудио является еще одним возможным приложением для GAN, однако используется гораздо реже. Примером может являться архитектура [https://arxiv.org/abs/1802.04208 WaveGan], которая без меток учится воспроизводить понятные слова при обучении на наборе речевых данных с небольшим словарным запасом, а также может синтезировать звук из других областей, таких как барабаны, вокализации птиц и фортепиано. На сегодняшний день, многие модели для генерации музыки используют [[Долгая краткосрочная память | долгую краткосрочную память (LSTM]]. Например, еще в 2002 году при помощи LSTM-сети построили модель, генерирующую не только мелодию, но и аккомпанемент к ней в формате выбора аккорда из зафиксированного перечня, и, отчасти, впервые добились благозвучного результата. В Google сейчас активно используется модель [https://en.wikipedia.org/wiki/WaveNet WaveNet] , которая основана на [[CNN | Сверточные нейронные сети]]. WaveNet способна генерировать речь, похожую на голос любого человека, и другие звуки, включая музыку (например, композиции на пианино) <ref>[https://habr.com/ru/company/Voximplant/blog/309648/ Google WaveNet]</ref>.

<!---

Анонимный участник

188.170.82.183

Изменения

Генерация объектов

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты