Seguindo o modelo de linguagem grande “Q”, o Amazon Titan traz recursos de IA multimodal para a plataforma da AWS.

Amazon Web Services. Imagem: Shutterstock
A Amazon anunciou hoje o lançamento de um novo gerador de imagens como parte do Amazon Titan, o nome do conjunto completo de modelos de fundação multimodais (FMs) agora disponível através da Amazon Web Services.
“O modelo Amazon Titan é uma mistura de 25 anos de inovações de inteligência artificial (IA) e aprendizado de máquina (ML) da Amazon”, escreveu Antje Bartha, educadora de IA e aprendizado de máquina, em uma postagem oficial no blog da Amazon. "A AWS pré-treina esses modelos em grandes conjuntos de dados, tornando-os modelos poderosos e de uso geral, projetados para oferecer suporte a uma variedade de casos de uso e, ao mesmo tempo, apoiar o uso responsável da IA. "
O gerador de imagens do Amazon Titan permite que os criadores de conteúdo gerem imagens realistas e de alta qualidade usando prompts simples em inglês ou até mesmo outras imagens como referências. Isso é especialmente útil em áreas de negócios como publicidade, comércio eletrônico e mídia. Parece funcionar bem contra os recursos de IA generativa da rival Adobe, que podem ser mais granulares, mas menos intuitivos.
O driver de IA da Amazon é a personalização. As empresas agora podem ajustar esses modelos usando dados proprietários para produzir imagens que se alinham com sua identidade de marca ou preferências de estilo específicas, disse a empresa.
Além desses novos modelos, a Amazon também anunciou seu próprio modelo de linguagem grande (LLM), chamado “Q”, que é treinado em conversas com clientes em toda a sua linha de dispositivos inteligentes Alexa. Em um comunicado aos meios de comunicação, a Amazon disse: “O Amazon Q fornece aos funcionários informações e recomendações imediatas e relevantes para simplificar tarefas, acelerar a tomada de decisões e a resolução de problemas e ajudar a estimular a criatividade e a inovação no trabalho”. "
O “Q” da Amazon não tem nada a ver com o conceito de “Q*” ou “Q-learning” que surgiu em rumores recentes de desenvolvimento de IA na OpenAI.
A segurança é uma das principais preocupações no campo da inteligência artificial, e a Amazon está ciente disso. A equipe da AWS implementou recursos robustos de segurança de IA semelhantes aos implementados pela Adobe para mitigar os riscos associados ao conteúdo gerado por IA. Isso inclui treinamento prévio sobre conjuntos de dados mais seguros e marcas d’água invisíveis em imagens geradas por IA para combater a desinformação. O suporte da Amazon ao SDXL demonstra ainda mais sua abordagem abrangente à tecnologia de IA e oferece aos clientes mais flexibilidade quando o Titan não atende às necessidades dos clientes.
A Amazon revelou recentemente modelos avançados de IA, tornando-se um candidato formidável em comparação com outros grandes players da indústria de tecnologia que também estão adotando a IA, que juntos produzem uma intensidade que lembra a corrida do ouro do século 21.
Testes do mundo real mostraram que o gerador de imagens Amazon Titan se destaca por seu realismo, superando o SDXL nessa área. Este novo modelo oferece uma infinidade de recursos sob uma interface muito semelhante à obtenção de difusão estável com o A1111, mas oferece uma sólida combinação de controle e versatilidade, o que é particularmente atraente para aplicações de negócios sérias.
Por exemplo, o Amazon Titan Image Generator pode produzir imagens em destaque com base em necessidades comerciais específicas, fornecendo mais controle do que os modelos da Adobe, que tendem a ser excessivamente simplistas ou até mesmo caricatos.

Gerador de imagens Titan AI da Amazon. Fonte: Decrypt