A Blackwell também tem um novo mecanismo de transformação para detectar automaticamente quais camadas do modelo podem lidar com qual precisão, variando de FP4 a FP64. Quanto maior a precisão, maior o tempo de processamento e maior o consumo de energia. Esse novo mecanismo transformador muda automaticamente para uma precisão menor ou maior conforme a necessidade. As gerações anteriores exigiam a programação do processador para alternar a precisão matemática.
“Nossa grande inovação aqui é que o usuário não precisa programar isso manualmente. O senhor pode deixar que o sistema cuide disso para você”, disse Charlie Boyle, vice-presidente de sistemas DGX da Nvidia. “E ele faz isso com segurança, o que significa que armazena os pesos com maior precisão do que o necessário para manter a precisão e em áreas em que o senhor não precisa desse nível de precisão para obter a mesma quantidade de precisão.”
A interconexão de alta velocidade, NVLink, é tão importante quanto a própria tecnologia de GPU. Esta é a quinta geração do NVLink, projetada para oferecer escalonamento eficiente para uma mistura de trilhões de parâmetros de modelos diferentes, disse Buck. Isso permite que a Blackwell ofereça rendimento e desempenho 18 vezes mais rápidos em interconexões de vários nós.
Além das novas GPUs, a Nvidia está anunciando sua próxima geração de InfiniBand, o Quantum-X800 QDR, uma infraestrutura dedicada à IA com conjuntos de recursos avançados cruciais para nuvens de IA generativas multilocatário e grandes empresas.
O X800 inclui o switch Nvidia Quantum Q3400 e a Nvidia ConnectXR-8 SuperNIC, que juntos atingem uma taxa de transferência de 800 Gb/s de ponta a ponta. Isso representa cinco vezes a capacidade de largura de banda e um aumento de nove vezes para 14,4Tflops de computação em rede em comparação com a geração anterior.
Os produtos Blackwell estão planejados para serem lançados ainda este ano, enquanto o Quantum-X800 e o Spectrum-X800 estarão disponíveis no próximo ano. A GTC acontece esta semana em San Jose, Califórnia.