Novas instâncias Amazon EC2 G6e com GPUs Nvidia L40S e instâncias G6 alimentadas por GPUs L4 também estão em andamento, anunciou a AWS. As GPUs L4 são reduzidas em relação à Hopper H100, mas oferecem muito mais eficiência energética. Essas novas instâncias são destinadas a startups, empresas e pesquisadores que desejam fazer experiências com IA.
A Nvidia também compartilhou planos de integrar seu microsserviço NeMo Retriever ao AWS para ajudar os usuários no desenvolvimento de ferramentas de IA generativas, como chatbots. O NeMo Retriever é um microsserviço de IA generativa que permite que as empresas conectem LLMs personalizados a dados corporativos, para que a empresa possa gerar respostas de IA adequadas com base em seus próprios dados.
“A IA generativa está transformando as cargas de trabalho em nuvem e colocando a computação acelerada na base da geração de conteúdo diversificado”, disse Jensen Huang, fundador e CEO da Nvidia, em um comunicado. “Impulsionadas por uma missão comum de fornecer IA geradora econômica e de última geração a todos os clientes, a Nvidia e a AWS estão colaborando em toda a pilha de computação, abrangendo infraestrutura de IA, bibliotecas de aceleração, modelos de base e serviços de IA geradora.”