Нейросети для создания звуков работают на основе методов машинного обучения. 5 Они обучаются на больших объёмах различных звуков, благодаря чему способны распознавать закономерности, различать разные звуковые элементы (например, вокал и инструменты) и принимать разумные решения в отношении шумоподавления, улучшения выравнивания и других аудиоулучшений. 5
Например, нейросеть Stable Audio от Stability AI генерирует музыку и звуки по текстовой подсказке заданной пользователем длины. 1 Для этого текстовые подсказки интегрируются с помощью текстового энкодера CLAP, который обучен на датасете с аудиофайлами и текстовыми метаданными. 1
Также существует нейросеть NSynth Super, которая создаёт новые звуки. 2 Она анализирует акустические свойства уже существующих тембров, берёт параметры отдельных инструментов (мелодику, интенсивность, длительность) и на их основе синтезирует совершенно новое звучание. 2