Nova rede neural Stable Audio gera música com base na descrição do texto

Miscelânea / by admin / September 14, 2023

click fraud protection

Dos criadores do Stable Diffusion.

Stability AI, conhecida principalmente por redes neurais para geração de imagens (Difusão Estável, Doodle Estável e não só), lançado nova rede neural Stable Audio. Como o nome sugere, gera clipes de áudio.

Captura de tela: Lifehacker

Tudo funciona da mesma maneira que geradores de imagens baseados em descrições de texto. O usuário especifica palavras-chave (por exemplo, "hip-hop lo-fi melódico, melódico, 85 BPM" ou “death metal com riffs de guitarra poderosos e bateria rápida”), a duração desejada e aguarda o resultado.

Usamos como base o mesmo modelo do Stable Diffusion, mas o treinamos em composições musicais em vez de imagens. No total, ela recebeu cerca de 800 mil faixas do site de música AudioSparx - ou cerca de 19.500 horas de sons diferentes.

Os criadores observam que a principal característica do Stable Audio é a capacidade de gerar composições de uma determinada duração. Anteriormente, as redes neurais só funcionavam com duração fixa: se fossem treinadas em clipes de áudio de 30 segundos, só poderiam gerar composições de 30 segundos. Para conseguir ajustar a duração de uma faixa, os desenvolvedores tiveram que alterar o modelo e adicionar metadados para o início e o fim da composição.

instagram viewer

O Áudio Estável é oferecido em três modelos. A versão gratuita permite gerar no máximo 20 músicas com duração de até 45 segundos por mês. Há também uma assinatura Profissional que permite criar até 500 faixas com até 90 segundos de duração por US$ 12 por mês (≈1.200 rublos) e a opção Enterprise para empresas com a capacidade de selecionar o volume de geração e o preço individualmente OK. Você não pode usar a música gerada para fins comerciais sem uma assinatura paga.

Tal como acontece com outras redes neurais semelhantes, o Stable Audio é mais voltado para criadores de conteúdo do que para músicos profissionais. Essas ferramentas são adequadas para criar rapidamente música de fundo para podcasts e vídeos quando você não tem tempo ou orçamento para colaborar com um compositor. Ele também pode substituir sons padrão se você quiser risadas únicas ou ruídos de multidão.

Você pode experimentar o Stable Audio no site oficial. Você precisará se registrar ou fazer login com uma conta do Google. No início, podem ocorrer interrupções no acesso devido à grande carga do servidor.

Áudio estável →

Mais novas redes neurais🦾✨

O assistente virtual AIDA da Sber diagnosticará pacientes em clínicas de Moscou
Novo app Artisse gera fotos bacanas com o rosto do usuário
Stability AI introduziu o chatbot Stable Chat - um análogo gratuito do ChatGPT