Como usar a rede neural DALL-E 2
Miscelânea / / July 26, 2023
Entendemos quais são os prós e contras do sistema e o que indicar nas solicitações.
O que é DALL-E
DALL‑E é uma rede neural da OpenAI que gera imagens com base em consultas de texto e também pode criar variações de imagem com base em exemplos sugeridos pelo usuário.
A ferramenta é projetada com base no modelo GPT-3, que também foi treinado para criar graficamente pessoas, animais e um grande número de outros objetos. Além disso, o serviço é capaz de combinar conceitos não relacionados para formar novas ideias.
A primeira versão do DALL‑E foi lançada em 2021 e, um ano depois, os desenvolvedores introduziram uma versão aprimorada do DALL‑E 2, que suporta maior qualidade de imagem e opções avançadas para converter imagens prontas fotos.
O sistema define consultas em centenas de idiomas, incluindo russo. Mas o idioma principal para comandos eficazes é o inglês. Primeiro, a rede neural reconhece o texto digitado pelo usuário e gera um esboço simples a partir dele, depois o converte na versão final de uma pequena resolução e depois o amplia, adicionando detalhes.
O que a rede neural DALL-E 2 pode fazer
Como mencionado acima, o modelo da OpenAI pode não apenas gerar imagens sob demanda, mas também criar projetos misturando diferentes conceitos. A rede neural conecta dois quadros e forma outro a partir deles.
Usando a função Outpainting, você pode desenhar fundo Imagens. É interessante complementar pinturas ou fotografias acabadas, desenvolvendo novas histórias sobre elas. Também é possível alterar a composição, editar as sombras e a textura da imagem, adicionar e remover objetos no quadro.
Um dos recursos do DALL‑E 2 é trabalhar com arquivos baixados. Usando uma interface minimalista amigável, é fácil adicionar elementos às fotos, gerar paisagens fantásticas ou aumentar o detalhe das fotos.
Quais são as desvantagens do DALL-E 2
No momento, o DALL‑E 2 não é um instrumento perfeito. Para obter bons resultados, você precisa experimentar, tentar diferentes consultas e ajustar os parâmetros. A rede neural produz periodicamente quadros engraçados ou até assustadores com objetos distorcidos e arranjo incorreto de elementos.
O sistema é especialmente equivocado se você der muito tempo solicitações de e dando muitos detalhes específicos. Ele não define muito bem os termos profissionais e também fica confuso ao usar negações ou exclusões em vez de indicações diretas do que deveria estar no quadro.
Como usar DALL-E 2
Você pode começar a usar o sistema no site da OpenAI em seção DALL E 2pressionando o botão Try DALL‑E 2. Se você ainda não possui uma conta no site, pode obtê-la por meio de seu endereço de e-mail ou de perfis existentes do Google ou da Microsoft.
Se estiver tentando se conectar da Rússia, você precisará de uma VPN e um número virtual para criar uma conta. Você pode ler mais sobre como criar uma conta no site da OpenAI em material sobre ChatGPT.
Uma vez logado, você deve ter 35 créditos gratuitos de geração de imagens por um mês. A cada mês seguinte, são dadas 15 tentativas. Você pode reabastecer o saldo em sua conta pessoal usando o botão Comprar créditos. Você terá que pagar um mínimo de $ 15 por 115 solicitações. Infelizmente, os usuários da Rússia não podem reabastecer o saldo diretamente agora.
Existem várias opções para resolver o problema: peça a um amigo com acesso adequado ao sistema de pagamento para pagar a conta ou forneça uma conta por um tempo, encontre e compre um perfil OpenAI pronto por meio de plataformas de negociação online ou use outros serviços em Base DALL-E.
A alternativa mais conveniente Gerador de imagens da Microsoft. Esta ferramenta é executada em algoritmos DALL‑E 2 e fornece quase os mesmos resultados gratuitamente. Mas não tem modo. edição de imagem, completando o quadro e outros recursos úteis. O analógico pode ser usado apenas para gerar imagens, e depois corrigir o resultado com outros programas. Você precisará de uma conta da Microsoft e uma VPN para usá-lo.
É melhor fazer uma solicitação de geração no site DALL-E 2 e no Gerador de imagens em inglês, mas em russo o sistema também produz bons resultados. O botão Surpreenda-me, localizado próximo à linha de entrada, emitirá automaticamente uma solicitação incomum para testar a rede neural.
Para obter um resultado de qualidade, use consultas que descrevam claramente o quadro desejado, mas sem detalhes desnecessários. Digite o tipo de imagem na linha de entrada. Pode ser um retrato, uma aquarela, um desenho a lápis e coisas do gênero.
Especifique também a opção de iluminação no quadro e no estilo. Por exemplo, uma exibição realista, como em uma história em quadrinhos, ou um estilo específico de um artista famoso. É desejável complementar isso com um nível aproximado de brilho.
No final da linha, você pode adicionar o contexto do que está acontecendo. Por exemplo, que o quadro contém não apenas o rover lunar, mas também o momento em que ele se move contra o fundo da Terra. Ou um palco onde lebres de pelúcia lutam contra alienígenas.
A solicitação não precisa incluir todos os itens, o resultado ainda pode ser interessante, mas a taxa de sucesso será visivelmente menor. Ajude a construir uma equipe de sucesso ferramentas especializadas, como Promptomania.
Leia também🖼️🤖💬
- Como usar o ChatGPT no Telegram e obter respostas rapidamente para qualquer dúvida sem um navegador
- Mais de 100 serviços baseados em redes neurais para uma variedade de tarefas
- 7 ferramentas de rede neural para melhorar a qualidade do vídeo
- 6 serviços baseados em redes neurais para melhorar a qualidade do som
- 10 plugins úteis para ChatGPT