Изменения

Перейти к: навигация, поиск

Генерация объектов

1461 байт добавлено, 15:04, 11 января 2021
Музыка и звуки
==== Музыка и звуки ====
Аудио является еще одним возможным приложением для GAN, однако используется гораздо реже. Примером может являться архитектура [https://arxiv.org/abs/1802.04208 WaveGan], которая без меток учится воспроизводить понятные слова при обучении на наборе речевых данных с небольшим словарным запасом, а также может синтезировать звук из других областей, таких как барабаны, вокализации птиц и фортепиано. На сегодняшний день, многие модели для генерации музыки используют [[Долгая краткосрочная память | долгую краткосрочную память (LSTM]]. Например, еще в 2002 году при помощи LSTM-сети построили модель, генерирующую не только мелодию, но и аккомпанемент к ней в формате выбора аккорда из зафиксированного перечня, и, отчасти, впервые добились благозвучного результата.  В Google сейчас активно используется модель [https://en.wikipedia.org/wiki/WaveNet WaveNet] , которая основана на [[CNN | Сверточные нейронные сети]]. WaveNet способна генерировать речь, похожую на голос любого человека, и другие звуки, включая музыку (например, композиции на пианино) <ref>[https://habr.com/ru/company/Voximplant/blog/309648/ Google WaveNet]</ref>.
<!---
Анонимный участник

Навигация