Stable Diffusion 3 Medium é a IA geradora de imagens mais avançada da Stability

Saúde e Bem-estar

Stability AI lançou o modelo aberto Stable Diffusion 3 Medium para gerar imagens realistas e com performance otimizada em computadores pessoais

13 jun
2024
– 01h27

(atualizado às 01h36)

A Stability AI anunciou o Stable Diffusion 3 Medium, a primeira versão aberta da nova geração do modelo de IA para gerar imagens. De acordo com a empresa, é o “modelo aberto de texto para imagem mais avançado até o momento”, com dois bilhões de parâmetros.



Foto: Divulgação/Stability AI / Canaltech

Os maiores destaques estão no realismo e na habilidade com tipografia. As primeiras imagens reveladas pelo SD3 Medium chamam a atenção pela quantidade de detalhes nos quais a IA normalmente tem dificuldade de acertar, como rostos e mãos, além de proporcionar resultados de alta qualidade. 

A arquitetura do Diffusion Transformer permite criar imagens com textos sem erros de digitação ou problemas na formatação das letras, enquanto o modelo é capaz de compreender prompts cada vez mais complexos para ajudar na personalização do resultado.




Alguns exemplos de imagens geradas com o Stable Diffusion 3 Medium (Imagem: Divulgação/Stability AI)

Alguns exemplos de imagens geradas com o Stable Diffusion 3 Medium (Imagem: Divulgação/Stability AI)

Foto: Canaltech

Performance otimizada

O modelo de dois bilhões de parâmetros é otimizado para garantir eficiência em computadores pessoais e GPUs de nível empresarial — o Stable Diffusion 3 tem modelos que podem chegar a oito bilhões de parâmetros, por exemplo, então a Stability AI pretende usar o tamanho da versão média como um padrão para conversão de texto para imagem. 

A empresa informa que o consumo de VRAM foi reduzido, o que melhora a performance da ferramenta em placas de vídeo mais limitadas. Além disso, a desenvolvedora contou com a colaboração de NVIDIA e AMD para otimizar o Stable Diffusion 3 em diferentes dispositivos, como as placas de vídeo da série RTX e APUs da AMD.

Já disponível

A Stability AI anunciou a família de modelos do Stable Diffusion 3 em fevereiro deste ano, mas ainda não era possível testá-la em diferentes ferramentas. O SD3 Medium está disponível para uso via API da Stability Platform ou pelos serviços pagos Stable Assistant e Stable Artisan.

A empresa também é responsável por outros modelos de IA generativa, como é o caso do Stable Audio, capaz de criar músicas com até três minutos de duração a partir de prompts de texto.

Trending no Canaltech: