As instâncias são alimentadas por oito GPUs Nvidia H100, a mais nova GPU da Nvidia que começou a ser comercializada no início deste mês, bem como por processadores Xeon Scalable de 4ª geração da Intel, 2 TB de memória host e 3,6 TB de largura de banda bisseccional entre as oito GPUs por meio das interconexões NVSwitch e NVLink 4.0 da Nvidia.
No total, o Google afirma que essas máquinas podem fornecer até 26 exaFlops de potência. Esse é o desempenho cumulativo de todo o supercomputador, não de cada instância individual. Ainda assim, isso supera o antigo recorde de supercomputador mais rápido, Fronteira, que foi pouco mais de um exaFlop.
De acordo com o Google, o A3 é a primeira implementação em nível de produção de sua interface de dados GPU-para-GPU, que o Google chama de unidade de processamento de infraestrutura (IPU). Ela permite o compartilhamento de dados a 200 Gbps diretamente entre as GPUs, sem a necessidade de passar pela CPU. O resultado é um aumento de dez vezes na largura de banda de rede disponível para máquinas virtuais A3 em comparação com as VMs A2 da geração anterior.