Midjourney v5 será lançado esta semana, veja algumas imagens da versão alpha

  • O fundador da Midjourney, David Holz, anuncia que a v5 será lançada esta semana.
  • Antes disso, haverá uma sessão de avaliação final: todos os clientes pagantes podem participar (veja abaixo).
  • A Midjourney escolheu o Google Cloud como parceiro para treinar e executar seus próprios modelos de IA. Para treinamento,
  • Midjourney está usando TPUs v4 do Google com JAX da Deepmind, com inferência em execução em “grandes clusters de GPU”.

Midjourney oferece o melhor compromisso entre acessibilidade e resultados de qualquer gerador de imagens do mercado. A próxima versão 5 está pronta para levar a IA generativa um passo adiante. As primeiras imagens alfa são muito promissoras.

O salto de Midjourney v3 para v4 foi enorme em termos de qualidade: a imagem AI gerou imagens mais atraentes e detalhadas que correspondiam melhor aos prompts de entrada. Midjourney está testando o algoritmo mais recente, v5, que será lançado em breve.

O desenvolvimento da v5 ainda está em andamento: Midjourney está coletando feedback humano avaliando imagens geradas pela v5. As imagens que circulam atualmente na Internet são o resultado desse processo.

Como os resultados desse feedback influenciam no desenvolvimento do modelo, a Midjourney diz que essas imagens não são representativas da versão v5 a ser lançada. As classificações e a qualidade dos dados resultantes são “muito sérias” para a versão final, diz o fundador da Midjourney, David Holz.

A Midjourney já contava com um processo de feedback para a v4, que a startup diz ter melhorado ainda mais a qualidade da versão final da v4.

Um Desenvolvedor Midjourney compara v5 ao “Navio de Teseu” : todos os componentes foram substituídos em algum momento, mas nenhum foi desenvolvido do zero, disse ele.

Midjourney v5 poderia ser mais detalhado e realista – e lidar melhor com as mãos

As imagens de teste v5 mostram um maior nível de detalhe e precisão, especialmente em imagens fotorrealistas. De acordo com o Midjourney, as imagens geradas pela v5 geralmente oferecem uma resolução padrão mais alta (1024 x 1024) e podem exibir uma variedade maior de estilos. As primeiras imagens fotorrealistas mostram um maior nível de detalhe.

Um grande problema com Midjourney e ferramentas semelhantes é a representação precisa de mãos e dedos. Geralmente há muitos ou poucos dedos na mão, que também são estranhamente dobrados ou torcidos. Isso é tão comum que Os críticos de arte da IA ​​fizeram de uma mão aleijada o símbolo de sua dissidência. Como são as mãos em Midjourney v5?

No material de visualização, os defeitos nas mãos e nos pés não são totalmente removidos. Em algumas fotos, você ainda pode ver as extremidades mutantes características. Mas parece haver um progresso significativo e, possivelmente, a v5 final estará livre de bugs.

Os clientes pagantes do Midjourney podem junte-se à festa de classificação aqui e veja mais imagens v5 . Poderia ir rápido até o lançamento alfa: o tempo entre a festa de classificação v4 e o lançamento alfa era de cerca de duas semanas.

O fundador da Midjourney, Holz, acredita há muito tempo na IA generativa . Ele acha que um dia mundos de jogo inteiros serão gerados por sistemas muito melhorados do tipo Midjourney.