10 promoções do Stable Diffusion que ajudarão você a criar imagens originais
Miscelânea / / October 15, 2023
Eles economizarão seu tempo e o ajudarão a descobrir novas ideias.
Como escrever consultas para difusão estável
Ao trabalhar com a rede neural de difusão estável e outros sistemas semelhantes, os resultados mais bem-sucedidos podem ser obtidos se você criar instruções detalhadas. Veja como fazer isso direito.
Inclua todos os detalhes importantes
Primeiramente é preciso definir o objetivo do pedido e o resultado aproximado, em que estilo deve ser apresentado e o que não pode ser retratado na imagem.
A peça correta deve conter o assunto ou objeto que queremos ver na imagem. Você precisa especificar o que o assunto faz, sua localização e quaisquer palavras-chave adicionais. Um pedido complexo também pode incluir uma descrição detalhada do tipo de imagem: desenho, fotografia realista, paisagem. Muitas vezes esta propriedade pode ser ativada nas configurações do serviço.
Quanto mais próximo do início da solicitação estiver, mais poder ele terá na geração da imagem. Para cada elemento, você pode especificar a importância ou “peso” manualmente. Geralmente é escrito após dois pontos sem espaço, por exemplo: peso: 1,5, peso: 0,4.
Em consultas detalhadas, vale a pena usar palavras adicionais que ajudarão a rede neural a selecionar a opção mais bem-sucedida. Descreva todas as características que você possa imaginar para uma tarefa específica.
Você pode encontrar as palavras-chave certas experimentando por conta própria ou usando um designer de produto. No segundo caso, você pode levar imediatamente em consideração a maioria dos parâmetros disponíveis e modificadores do resultado final.
Registre elementos e características desnecessárias
Um prompt negativo também pode ajudar ao redigir uma solicitação. Esta é uma lista de todas as propriedades que não deveriam estar na imagem. Muitas vezes indica pontos que dependem do contexto.
Pode ser necessário excluir partes deformadas do corpo, uma segunda pessoa no quadro, desfoque, má qualidade e outras coisas semelhantes. O prompt negativo o ajudará a coletar quadros com menos artefatos. Mas você não precisa fazer listas enormes de palavras negativas – palavras-chave básicas são suficientes.
Leve em consideração os principais parâmetros nas configurações da solicitação
As configurações da rede neural sempre contêm vários parâmetros importantes: etapas de geração, semente, resolução, amostrador.
- Passos - indica o número de etapas que a rede neural executará ao gerar a imagem. Quanto mais houver, maior será a qualidade do resultado.
- Semente - este é o ponto de referência com base no qual o sistema gera uma imagem. Inicialmente, é especificado um parâmetro “aleatório” entre bilhões de opções. Isso ajuda a obter resultados diferentes para a mesma consulta. Se você usar um valor específico, ao alterar a dica, o conteúdo da imagem permanecerá aproximadamente o mesmo.
- Amostrador - significa processos que influenciam o resultado final. Para fotos simples, 5 a 10 etapas são suficientes, enquanto para outras você precisará de 60 a 90.
- Resolução é o tamanho da imagem. O modelo Stable Diffusion XL gera no máximo 2.048 x 2.048 pixels.
Para um iniciante, é melhor começar com um construtor de prompt. A opção mais popular com um grande número de configurações é Promptomania. É adequado para várias redes neurais, incluindo uma seção para Difusão Estável.
Quais comandos podem ser úteis?
No momento, o modelo de rede neural mais recente é Stable Diffusion XL (SDXL). Ele fornece imagens de alta qualidade e possui melhorias significativas em relação às versões anteriores. As opções que funcionam em SDXL podem ser diferentes dos modelos anteriores.
Para testar solicitações neste caso, utilizamos o serviço online DreamStudio baseado em Difusão Estável XL 1.0. A seguir, veremos exemplos de prompts para gerar imagens em vários estilos e formas.
1. Para imagens fotorrealistas
1 / 0
2 / 0
Stable Diffusion XL pode gerar imagens em uma ampla variedade de estilos. Um dos mais importantes é o fotorrealismo. É improvável que você consiga um resultado perfeito na primeira vez, mas depois de uma série de tentativas você poderá gerar imagens impressionantes.
Exemplos de possíveis solicitações:
- Caneta metálica azul fabricada pela Parker, caneta-tinteiro, refletiva, posicionada sobre a mesa de trabalho. A caneta fica em cima do caderno de papel com capa preta e dourada. Imagem ensolarada e brilhante. Enorme espaço de cópia na parte superior da imagem, espaço negativo, hd, 8k, fundo desfocado e sonhador, lindas fotos.
- Jovem com vestido fabuloso, fotorrealismo, cabelo escuro, centralizado na moldura, rosto simétrico, 50 mm lente, câmera de frente, fundo escuro, luz natural, montanhas fora de foco ao fundo, ultra-detalhes, 16K.
Detalhes negativos adequados para consultas: (deformado, distorcido, desfigurado: 1,3), mal desenhado, fora de quadro, marca d'água, assinatura, corte, baixo contraste, subexposto, superexposto, arte ruim, iniciante, amador.
2. Para imagens animadas
1 / 0
2 / 0
3 / 0
A rede neural permite criar imagens animadas de qualquer complexidade, mas para obter um bom resultado você terá que mexer na montagem da consulta.
Solicitações de exemplo:
- Homem com capacete espacial preto, casaco longo escuro, retrato corporal, luz vermelha no peito, desfile de moda botas conceituais, foco nítido, lenço preto, ventoso, altamente detalhado, olhos vermelhos, pintura digital, arte de ilustração.
- Gato de botas sentado em um restaurante comendo macarrão com queijo assistindo a apresentação de um cantor, motor irreal, iluminação interna aconchegante, estação de arte, detalhada, pintura digital, cinematográfica, arte ilustrativa.
- Uma ilustração de um grande dragão cuspindo fogo, pequenas pessoas ao seu redor orando. Sopro ardente intenso e poderoso, volumétrico. Enfatize seu olhar penetrante, dentes afiados e postura poderosa. Artstation, detalhada, pintura digital, cinematográfica.
Detalhes negativos para solicitações: (deformado, distorcido, desfigurado: 1.3), mal desenhado, anatomia ruim, anatomia errada, membro extra, membro faltante, membros flutuantes, (mãos e dedos mutantes: 1,4), membros desconectados, mutação, mutante, feio, nojento, embaçado, amputação, pés mal desenhados, rosto mal desenhado, fora de moldura, membros extras, desfigurado, deformado, corpo fora da moldura, anatomia ruim, marca d'água, assinatura, corte, baixo contraste, subexposto, superexposto, arte ruim, iniciante, amador.
3. Para paisagens artísticas
1 / 0
2 / 0
3 / 0
4 / 0
A Difusão Estável gera excelentes paisagens, por exemplo, uma floresta de outono sob os raios do sol poente, fantástica fechaduras, praias ou cidades futuristas.
Solicitações de exemplo:
- Grande floresta com folhas amarelas, verdes e vermelhas ao pôr do sol, uma pequena cidade com uma igreja e uma torre de rádio ao fundo, fantasia, tela profissional, cores triádicas, cores profundas, iluminação volumétrica, sombreamento com bordas escuras, ricamente detalhado, fundo fosco, estilo renderização de octanagem.
- O ambiente em um mundo de fantasia de Tolkien, grande castelo gótico, ultradetalhado, diurno, arte conceitual de filme, épico, pintura fosca, névoa, luz volumétrica, 16k, estação de arte.
- Pintura de uma praia rochosa com grandes ondas batendo e um trovão ao fundo com uma mansão no morro, pintura a óleo extremamente detalhada, luz volumétrica, 16k, artstation.
- Highrise futurista, luz de flash, composição épica, cinematográfico, ilustração de paisagem, pintura detalhada, pós-processamento de 8k, motor irreal, estação de arte.
Detalhes negativos para consultas: (deformado, distorcido, desfigurado: 1,3), mal desenhado, anatomia ruim, anatomia errada, membro extra, membro faltante, flutuante membros, (mãos e dedos mutantes: 1.4), membros desconectados, mutação, mutante, feio, nojento, embaçado, amputação, pessoas, humano, assinatura, marca d'água, sinal.
4. Para retratos
1 / 0
2 / 0
3 / 0
Stable Diffusion XL faz um bom trabalho na geração de retratos, mas o super-realismo ainda é difícil de alcançar. Mas a rede neural é útil para testar opções de filmagens reais ou, por exemplo, histórias em quadrinhos.
Solicitações de exemplo:
- Uma jovem mulher, fitas verdes no cabelo, sentada do lado de fora do café em Paris, olhos verdes, usando um vestido estiloso, luz lateral, fotorrealista
- Cavalheiro de terno preto, ultra-realista, foto cinematográfica, da mais alta qualidade, (rosto e olhos detalhados: 1.1), curto cabelo, dentro de uma mansão antiga, dispersão subterrânea, (pele detalhada: 1.1), pele brilhante, foto profissional, volumétrica iluminação
- Mulher elegante, fotografia de rua, longos cabelos loiros, capturando seu reflexo em uma porta de vidro de livraria, enquadramento da parte superior do corpo, em uma rua parisiense, iluminação neon, filmado de um ângulo baixo, (efeito bokeh: 1,2), ultra realista
Detalhes negativos para consultas: (deformado, distorcido, desfigurado: 1.3), mal desenhado, anatomia ruim, anatomia errada, membro extra, membro faltante, membros flutuantes, (mutado mãos e dedos: 1.4), membros desconectados, mutação, mutante, feio, nojento, embaçado, amputação, pés mal desenhados, rosto mal desenhado, fora de enquadramento, membros extras, desfigurado, deformado, corpo fora do enquadramento, anatomia ruim, marca d'água, assinatura, cortado, baixo contraste, subexposto, superexposto, arte ruim, iniciante, amador, distorcido face.
5. Para gerar personagens
1 / 0
2 / 0
3 / 0
Com Stable Diffusion XL você pode criar fotos lindas e engraçadas de famosos personagens. Você pode combinar vários estilos diferentes ao mesmo tempo.
Solicitações de exemplo:
- Uma tomada cinematográfica de um Batman, filmada com câmera Red V‑Raptor 8K, 50 mm, f/1.4, diretor de cinema David Fincher, claro-escuro, corpo inteiro, traje cyberpunk futurista, realismo mágico.
- Imagem detalhada em 8k de One-Punch Man sentado em um trono de metal em meio à arquitetura japonesa à noite. Ilustração, realista, anime, iluminação volumétrica.
- Uma foto do Vault Boy de Fallout como um gladiador em uma grande arena de luta, neblina, ilustração.
Detalhes negativos para consultas: (deformado, distorcido, desfigurado: 1,3), mal desenhado, anatomia ruim, anatomia errada, membro extra, membro faltante, flutuante membros, (mãos e dedos mutantes: 1.4), membros desconectados, mutação, mutante, feio, nojento, embaçado, amputação, pessoas, humano, assinatura, marca d'água, sinal.
6. Para criar objetos arquitetônicos
1 / 0
2 / 0
3 / 0
SDXL é útil para designers. Por exemplo, pode ser usado para criar imagens conceituais de edifícios em qualquer estilo. A rede neural muitas vezes comete erros nas linhas e formas de objetos complexos, você terá que repetir o processo de geração até obter um resultado bem-sucedido.
Solicitações de exemplo:
- Plano de projeto arquitetônico de uma pousada filmado de fora, grandes janelas de aço com vista para a cidade, teto alto, alta qualidade, 8k, ultra realismo, fotografia de alta resolução
- Foto externa de uma vila em Mykonos, com vista para o mar, clima nas cores branco e azul, iluminação volumétrica, alta qualidade, 8k, ultra realismo, fotografia de alta resolução
- Casa rústica de estilo espanhol, em pedra, com decoração branca e azul. iluminação volumétrica, alta qualidade, 8k, ultra realismo, fotografia de alta resolução
Detalhes negativos para consultas: (deformado, distorcido, desfigurado: 1,3), mal desenhado, anatomia ruim, anatomia errada, membro extra, membro faltante, flutuante membros, (mãos e dedos mutantes: 1.4), membros desconectados, mutação, mutante, feio, nojento, embaçado, amputação, pessoas, humano, assinatura, marca d'água, sinal.
7. Para design de interiores
1 / 0
2 / 0
3 / 0
A rede neural também é adequada para preparar o design de interiores de instalações. Use SDXL se quiser encontrar opções incomuns para o design de sua casa ou apartamentos.
Solicitações de exemplo:
- Uma sala de estar futurista com teto reflexivo, janelas altas de metal (decoração futurista: 1.2), paisagem urbana futura à noite ao longe, alta qualidade, 8k, ultra realismo
- Cozinha no estilo Sou Fujimoto, vista panorâmica de uma cidade vibrante nas janelas, arquitetura de interiores, renderizada em octanagem, fotorrealista, altamente detalhada
- Projeto de design de interiores com estilo orgânico moderno, sala com sofá, carpete, mesa de revistas, lustre e poltrona, cores neutras, ambiente claro, realista, renderizador V‑Ray, altamente detalhado
Detalhes negativos para solicitações: (deformado, distorcido: 1,3), mal desenhado, nojento, borrado, pessoas, humano, assinatura, marca d'água, sinal.
8. Para criar imagens de roupas
1 / 0
2 / 0
3 / 0
SDXL oferece boas filmagens com roupas, mas você terá que experimentar consultas e repetir o processo várias vezes para obter fotos bem-sucedidas.
Solicitações de exemplo:
- Roupas techwear e look fashion, pés a cabeça, proporção áurea, futurista, altamente detalhado, Errolson Hugh, Yohji Yamamoto, Nike ACG, hiper maximalista.
- Vestido de alta costura e look fashion, pés a cabeça, proporção áurea, altamente detalhado, cores pastéis, Miu Miu, Prada, luxo, alta qualidade, 8k, ultra realismo.
Detalhes negativos para consultas: (deformado, distorcido, desfigurado: 1,3), anatomia ruim, anatomia errada, extra membro, membro perdido, membros flutuantes, (mãos e dedos mutantes: 1,4), membros desconectados, mutantes, embaçados.
9. Para criar logotipos
A rede neural também será útil durante a formação da identidade da organização. Com SDXL você pode testar diferentes ideias de logotipo em qualquer estilo. Esteja preparado para ajustes constantes nas solicitações.
Solicitações de exemplo:
- Um logotipo minimalista com um OVNI retrofuturista. O logotipo mostra OVNIs voando sobre arranha-céus e luzes brilhantes da cidade. A paleta de cores é uma mistura de cores escuras e intensas, incluindo tons de preto e vermelho. Ilustração, arte vetorial, design de logotipo.
- Logotipo para empresa de tecnologia, branco e azul, uma gaivota voando, simétrica, ilustração, arte vetorial, design de logotipo.
Dados negativos para solicitações: (deformado, distorcido, desfigurado: 1,3), mal desenhado, nojento, embaçado, pessoas, humano, assinatura, marca d’água.
10. Para ilusões de ótica
A Difusão Estável permite gerar ilusões de ótica - imagens baseadas em referências ou imagens com palavras “costuradas” nelas. Eles são criados usando o plugin de rede neural ControlNet. Permite obter fotos baseadas em outras imagens, preservando elementos das molduras originais.
A rede neural cria uma imagem a pedido do usuário e leva em consideração a referência proposta. Por exemplo, a paisagem é combinada com a forma estrelas ou a grama forma uma palavra que fica visível ao se afastar da imagem.
Para usar o Stable Diffusion com o plugin ContolNet, você precisará de um computador potente. Como alternativa, você pode usar serviços online com os mesmos recursos. Você pode ler mais sobre as ferramentas disponíveis e como trabalhar com elas em artigo Hacker de vida.
Aprendendo a trabalhar com IA📝🤖💬
- Como usar o ChatGPT no Telegram e obter respostas rápidas para qualquer dúvida sem navegador
- 3 serviços baseados em redes neurais que ajudarão a criar ilusões de ótica
- 10 melhores redes neurais para desenho online
- 7 ferramentas baseadas em redes neurais para melhorar a qualidade do vídeo
- 15 solicitações do ChatGPT que podem ser úteis para você