A NVIDIA Enterprise anuncia sua primeira CPU de data center, um processador baseado em ARM que oferecerá 10 vezes mais desempenho do que os servidores atuais mais rápidos nas mais complexas cargas de trabalho de IA e computação de alta performance.
Resultado de mais de 10 mil anos de trabalho de engenharia, a CPU NVIDIA Grace foi projetada para atender aos requisitos de computação para as aplicações mais avançadas do mundo – incluindo processamento de linguagem natural, sistemas de recomendação e supercomputação de IA – que analisam enormes conjuntos de dados que requerem tanto desempenho computacional ultra-rápido quanto memória maciça. Combina núcleos de CPU ARM com eficiência energética com um inovador subsistema de memória de baixa potência para oferecer alto desempenho com grande eficiência.
“A IA e a ciência de dados de ponta desafiam os limites da arquitetura de computadores atual, processando volumes inimagináveis de dados. Usando o IP de ARM licenciado, a NVIDIA projetou a Grace como uma CPU especificamente para IA e HPC em escala gigante. Juntamente com a GPU e a DPU, a Grace nos dá a terceira tecnologia fundamental para computação, e a capacidade de reestruturar o data center para avançar a IA. Agora a NVIDIA é uma empresa com três chips”, afirma Jensen Huang, fundador e CEO da NVIDIA.
Grace é um processador altamente especializado
Grace é um processador altamente especializado que direciona cargas de trabalho, como o treinamento de modelos de NLP de última geração que têm mais de 1 trilhão de parâmetros. Quando vem juntamente com as GPUs NVIDIA, um sistema baseado em Grace oferecerá Desempenho 10 vezes mais rápido do que os sistemas de última geração baseados em NVIDIA DGX™ executados em CPUs x86.
“A nova CPU Grace vai revolucionar a acessibilidade da Inteligência Artificial no mundo inteiro, incluindo regiões como a América Latina”, comenta Marcio Aguiar, diretor da NVIDIA Enterprise para América Latina. “Os brasileiros têm um grande potencial para concepção e desenvolvimento de inovações com IA.”
Embora espera-se que a grande maioria dos data centers seja atendida por CPUs existentes, Grace, nomeada para Grace Mimr, a pioneira em programação de computadores dos EUA, atenderá a um segmento de nicho de computação.
O Swiss National Supercomputing Centre (CSCS) e o Los Alamos National Laboratory do Departamento de Energia dos EUA são os primeiros a anunciar planos para a construção de supercomputadores com tecnologia da Grace em apoio aos esforços nacionais de pesquisa científica.
A NVIDIA está lançando Grace porque o volume de dados e o tamanho dos modelos de IA estão crescendo exponencialmente. Os maiores modelos de IA atuais incluem bilhões de parâmetros e estão dobrando a cada dois meses e meio. O treinamento deles exige uma nova CPU que possa ser bem conectada a uma GPU para eliminar os gargalos do sistema.
A NVIDIA criou a Grace aproveitando a incrível flexibilidade da arquitetura de data center da ARM. “Ao lançar uma nova CPU de nível de servidor, a NVIDIA cumpre o objetivo da diversidade tecnológica nas comunidades de IA e HPC, em que é fundamental ter opções para oferecer a inovação necessária para resolver os problemas mais urgentes do mundo. Considerada a arquitetura de processadores mais licenciada do mundo, a ARM promove a inovação de um jeito novo todos os dias. O lançamento da CPU de data center Grace da NVIDIA mostra claramente como o modelo de licenciamento aberto da ARM permite uma invenção importante, que apoiará ainda mais o incrível trabalho de pesquisadores e cientistas de IA em todos os lugares”, declara Simon Segars, CEO da ARM.
Primeiros a adotarem Grace ultrapassam os limites da ciência e da IA
A CSCS e o Los Alamos National Laboratory planejam colocar on-line, em 2023, os supercomputadores da Grace, construídos pela Hewlett Packard Enterprise.
“A nova CPU Grace da NVIDIA nos permite convergir tecnologias de IA e supercomputação clássica para resolver alguns dos problemas mais difíceis da ciência computacional”, explica o diretor do CSCS, Thomas Schulthess. “Estamos entusiasmados em disponibilizar a nova CPU da NVIDIA para nossos usuários na Suíça e em todo o mundo, para o processamento e a análise de conjuntos de dados científicos maciços e complexos.”
“Com um equilíbrio inovador entre largura de banda e capacidade de memória, este sistema de próxima geração moldará a estratégia de computação da nossa instituição”, conta Thom Mason, diretor do Los Alamos National Laboratory. “Graças à nova CPU Grace da NVIDIA, seremos capazes de fornecer pesquisa científica avançada usando simulações 3D de alta fidelidade e análises com conjuntos de dados que são maiores do que anteriormente possíveis.”
Oferecendo desempenho revolucionário
Por trás do desempenho da Grace está a tecnologia de interconexão NVIDIA NVLink® de quarta geração, que fornece uma conexão recorde de 900 GB/s entre as GPUs Grace e NVIDIA para permitir uma largura de banda agregada 30x maior em comparação com os melhores servidores atuais.
Grace também usará um inovador subsistema de memória LPDDR5x que oferecerá o dobro da largura de banda e uma eficiência energética 10 vezes melhor em comparação com a memória DDR4. Além disso, a nova arquitetura oferece coerência unificada de cache com um único espaço de endereço da memória que combina o sistema e a HBM da GPU para simplificar a capacidade de programação.
Grace será compatível com o kit de desenvolvimento de software NVIDIA HPC e toda a série de bibliotecas CUDA® e CUDA-X™, que aceleram mais de 2.000 aplicações de GPU, acelerando as descobertas para cientistas e pesquisadores que trabalham nos desafios mais importantes do mundo.
A disponibilidade é esperada para o início de 2023.