Como usar a rede neural Kandinsky
Miscelânea / / September 08, 2023
Um serviço russo que ajuda você a criar e editar imagens rapidamente.
O que é Kandinsky
Kandinsky é a rede neural de Sber para geração de imagens. É capaz de criar imagens a partir de consultas de texto, além de apresentar variações de imagens prontas e combinar estilos de diferentes molduras.
O sistema identifica solicitações em diferentes idiomas, inclusive funcionando de forma confiável em russo. A versão mais recente do serviço no momento é o Kandinsky 2.2. A rede neural leva em consideração parâmetros adicionais ao gerar o resultado, incluindo plano de fundo e estilo.
O que a rede neural Kandinsky 2.2 pode fazer
Como mencionado acima, Kandinsky pode não apenas fornecer imagens sob demanda, mas também criar imagens misturando diferentes conceitos ou estilos. A rede neural Sber oferece suporte a vários modos de operação. No padrão ele gera o resultado por introduzido mensagem de texto. Ao combinar frames, analisa os dois e compõe um novo a partir deles.
Você também pode “alimentar” uma pintura ou fotografia acabada no sistema adicionando as características necessárias. Neste caso, Kandinsky criará uma nova imagem, dado o exemplo visual e o prompt ao mesmo tempo.
Além disso, o serviço suporta o modo outpainting, ou desenho de acabamento. Esta função permite complementar a moldura acabada com novos detalhes que não existiam antes. Outro modo de operação é a transferência de estilo. Com sua ajuda, você pode usar alguns detalhes da imagem original na imagem gerada.
Como usar Kandinsky 2.2
A rede neural está disponível através de diversos serviços em diferentes formatos. Então, Kandinsky pode ser testado no site Cérebro de Fusão. Lá você pode gerar imagens usando comandos de texto, bem como utilizar a ferramenta de acabamento.
Também disponível no Telegram bot oficial Kandinsky. Com sua ajuda, você pode criar imagens a partir de texto, misturar duas imagens diferentes, transferir estilos e criar variações de molduras acabadas.
Além disso, em Site ruDALL-E Existe um formulário para criação de imagens com configurações básicas. A rede neural Kandinsky também está integrada ao assistente de voz “Fogo de artifício» de Sber. Aqui você precisa executar a habilidade “Turn on Artist” para gerar imagens. Além disso, o serviço pode ser utilizado via bot "VKontakte" e assim por diante website oficial "Sbera".
O bot do Telegram só precisa especificar o modo de operação com o botão correspondente e, em seguida, inserir o texto da solicitação ou fazer upload das imagens necessárias. O serviço é gratuito e fornece resultados com bastante rapidez. Falhas e erros ocorrem raramente - com um número muito grande de comandos simultâneos dos usuários.
A ferramenta de edição e expansão de frames em Kandinsky está disponível apenas no site Cérebro de Fusão. Além disso, há uma ampla área com imagem para trabalho, campo de texto para pronto e um menu suspenso com dezenas de estilos. Na lista você pode escolher um dos exemplos populares - do cyberpunk aos desenhos animados soviéticos.
O estilo não precisa ser marcado nas configurações, pode ser especificado na solicitação de texto. Você pode até escrever uma opção que ainda não esteja na lista básica. Neste caso, você deve deixar a opção “Sem estilo” no menu.
Para fotos, você pode escolher uma das proporções e resoluções disponíveis. A rede neural produz frames com dimensões de 1.152 × 768 pixels, 1.024 × 1.024 pixels, 680 × 1.024 pixels e vice-versa, 576 × 1.024 pixels e vice-versa.
O acabamento permite formar imagens a partir de pequenas ideias. Basta selecionar parte do quadro finalizado e uma área vazia e, em seguida, inserir um comando de texto que Kandinsky determinará exatamente como expandir o quadro especificado, adicionando detalhes ou continuações a ele objetos.
Ao trabalhar em projetos gráficos, você pode gerar novas ideias rapidamente usando redes neurais "Sbera". Para fazer isso, a ferramenta Eraser, ou Erase, no Fusion Brain é útil. Basta apagar parte da moldura finalizada e depois adicionar novos elementos ao espaço livre conforme descrição do texto. Neste caso, será possível manter a imagem no mesmo estilo ou combinar diferentes conceitos.
Ao transferir um estilo de uma moldura existente para uma nova, Kandinsky permite usar as poses de pessoas de uma fotografia ou pintura, bem como os contornos gerais da imagem original. Por exemplo, num retrato será possível substituir uma pessoa por outra, mantendo a composição geral e o fundo. Este algoritmo funciona através de um bot em Telegrama.
Ao misturar duas imagens, o sistema não preserva a construção ou disposição dos objetos. A fusão ocorre de forma aleatória, o que às vezes leva a resultados inesperados e novas ideias.
Quais são as desvantagens do Kandinsky 2.2
Kandinsky 2.2 faz um trabalho muito melhor na geração de quadros realistas do que as versões anteriores. Os resultados são semelhantes a um serviço popular Meio da jornada, mas ainda são inferiores em nível de detalhe.
Para obter bons resultados, você precisa experimentar os parâmetros e as descrições das consultas. De vez em quando Kandinsky produz imagens com erros. Por exemplo, o sistema exibe objetos arquitetônicos familiares a muitos de uma forma estranha. Mas isso geralmente acontece se você introduzir peças industriais muito longas com um grande número de pequenos detalhes.
Teste outras redes neurais🖼️🤖💬
- Como usar a rede neural DALL-E 2 que gera imagens
- 6 redes neurais para criação de logotipos
- 7 ferramentas baseadas em redes neurais para melhorar a qualidade do vídeo
- 6 serviços baseados em redes neurais para melhorar a qualidade do som
- Como usar YandexGPT - uma rede neural que gera textos em russo