O custo de treinamento para Stable Diffusion foi de apenas $ 600.000 e isso é um bom sinal para o progresso da IA

Stable Diffusion é uma poderosa IA de imagem de código aberto que compete com o DALL-E 2 da OpenAI. O treinamento de IA provavelmente foi bastante barato em comparação.

Quem tiver interesse pode baixe o modelo da imagem de código aberto AI Stable Diffusion gratuitamente no Github e execute-o localmente em uma placa de vídeo compatível. Isso deve ser razoavelmente poderoso (pelo menos 5,1 GB de VRAM), mas você não precisa de um computador de última geração.

Além da versão gratuita local, o A equipe Stable Diffusion também oferece acesso via interface web . Por cerca de 12, você obtém aproximadamente 1.000 prompts de imagem.

Uma diferença importante além do preço: a versão local roda sem restrições, enquanto a versão web bloqueia prompts que possam gerar imagens sexuais ou violentas, por exemplo. DALL-E 2 e meio da jornada também tem essa restrição.

Difusão estável: treinamento de IA por relativamente pouco dinheiro

O treinamento da IA ​​de imagem foi relativamente barato, revela Emad Mostaque no Twitter. O matemático e cientista da computação fundou a Stability AI, a startup que é a força motriz por trás da Stable Diffusion.

De acordo com Mostaque, a equipe Stable Diffusion usou um cluster de nuvem com 256 GPUs Nvidia A100 para treinamento. Isso exigiu cerca de 150.000 horas, o que Mostaque diz equivaler a um preço de mercado de cerca de 600.000.

Para DALL-E 2, Mostaque assume um custo computacional de aproximadamente um milhão de horas A100 . Os custos de treinamento da IA ​​de imagem da OpenAI provavelmente serão muito maiores do que os da Stable Diffusion. No entanto, o DALL-E 2 atualmente oferece melhor desempenho, em parte devido à sua arquitetura, que requer mais dados de treinamento.

O treinamento de IA para modelos grandes é acessível

A explicação de Mostaque é interessante em dois aspectos: primeiro, ele menciona custos concretos de treinamento. Para outros grandes modelos AI como DALL-E 2 ou GPT-3, há apenas especulação, às vezes na casa dos milhões , mas sem fatos. Graças à Stable Diffusion, agora existe um ponto de referência concreto.

Por outro lado, os custos de treinamento de $ 600.000 estão dentro de uma faixa financeira que muitas empresas podem pagar.

Isso, por sua vez, é uma indicação de que uma posição dominante de empresas como a OpenAI no campo de grandes modelos de IA não precisa surgir, pelo menos por causa de custos de treinamento inacessíveis para outros. Os verdadeiros geradores de custo provavelmente serão o pessoal de pesquisa e desenvolvimento e a coleta e manutenção de dados.