Google Cloud e NVIDIA anuncia infraestrutura para a criação de modelos massivos de GenIA

O Google Cloud e a NVIDIA anunciam uma nova infraestrutura e software de IA para os clientes criarem e implantarem modelos massivos para IA generativa e acelerarem cargas de trabalho de ciência de dados.

Em um bate-papo no Google Cloud Next, o CEO do Google Cloud, Thomas Kurian, e o fundador e CEO da NVIDIA, Jensen Huang, discutiram como a parceria está trazendo serviços de machine learning de ponta a ponta para os maiores clientes de IA do mundo, inclusive facilitando a execução e implementação de Supercomputadores de IA com ofertas do Google Cloud baseadas em soluções da NVIDIA. As novas integrações de hardware e software utilizam as mesmas tecnologias NVIDIA empregadas nos últimos dois anos pelo Google DeepMind e pelas equipes de pesquisa do Google.

“Essa otimização facilitará a execução das cargas de trabalho e a implementação cada vez mais eficiente da IA generativa para os clientes. Essa parceria reforça nosso compromisso em contribuir cada vez mais para o avanço de novas tecnologias”, ressalta Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.

Integrações

A estrutura do Google para a construção de grandes modelos de linguagem (LLMs), PaxML, agora está otimizada para computação acelerada NVIDIA. Originalmente desenvolvido para abranger várias fatias do acelerador Google TPU, o PaxML agora permite que os desenvolvedores usem GPUs NVIDIA H100 e A100 Tensor Core para experimentação e escalabilidade avançadas e totalmente configuráveis.

Um contêiner PaxML otimizado para GPU já está disponível no catálogo de software NVIDIA NGC. Além disso, o PaxML é executado em JAX, que foi otimizado para GPUs que utilizam o compilador OpenXLA.
O Google DeepMind e outros pesquisadores do Google estão entre os primeiros a usar PaxML com GPUs NVIDIA para pesquisas exploratórias.

O contêiner otimizado para PaxML da NVIDIA estará disponível imediatamente no registro de contêiner NVIDIA NGC para pesquisadores, startups e empresas em todo o mundo que estão construindo a próxima geração de aplicações baseadas em IA.

Além disso, as empresas anunciaram a integração do serverless Spark do Google com GPUs NVIDIA por meio do serviço Google’s Dataproc. Isso ajudará os cientistas de dados a acelerarem as cargas de trabalho do Apache Spark para preparar dados para o desenvolvimento de IA.

 

Tags

Compartilhe

Anatel remarca leilão de 700 MHz para segunda-feira, dia 4 de maio
Anatel confirma abertura das propostas do 700 MHz para dia 4
Anatel confirma abertura das propostas do 700 MHz para dia 4
Setor de data centers pede velocidade e previsibilidade no Brasil
Setor de data centers pede velocidade e previsibilidade no Brasil
IA exige redes ópticas mais escaláveis e resilientes, diz Nokia
IA exige redes ópticas mais escaláveis e resilientes, diz Nokia
Ciena vê interconexão óptica como peça-chave para data centers de IA
Ciena vê interconexão óptica como peça-chave para data centers de IA
Data center leva IA soberana para serviço público do Caribe
Data center leva IA soberana para serviço público do Caribe
Fair share e Inteligência Artificial têm movimentações no Congresso
Fair share e Inteligência Artificial têm movimentações no Congresso
Associações pedem para Justiça barrar medidas sobre Fundação Atlântico na recuperação da Oi
Associações pedem para Justiça barrar medidas sobre Fundação Atlântico na recuperação da Oi
Para nova presidente da Algar, crescimento passa por transformação e reaproximação com o consumidor
Para nova presidente da Algar, crescimento passa por transformação e reaproximação com o consumidor
Instituto Claro completa 25 anos de atuação em educação e cidadania
Instituto Claro completa 25 anos de atuação em educação e cidadania