Google Cloud e NVIDIA anuncia infraestrutura para a criação de modelos massivos de GenIA

Manchetes

Anatel remarca leilão de 700 MHz para segunda-feira, dia 4 de maio

Anatel confirma abertura das propostas do 700 MHz para dia 4

Setor de data centers pede velocidade e previsibilidade no Brasil

IA exige redes ópticas mais escaláveis e resilientes, diz Nokia

Ciena vê interconexão óptica como peça-chave para data centers de IA

Data center leva IA soberana para serviço público do Caribe

Fair share e Inteligência Artificial têm movimentações no Congresso

Associações pedem para Justiça barrar medidas sobre Fundação Atlântico na recuperação da Oi

Para nova presidente da Algar, crescimento passa por transformação e reaproximação com o consumidor

Instituto Claro completa 25 anos de atuação em educação e cidadania

Sem Categoria

Google Cloud e NVIDIA anuncia infraestrutura para a criação de modelos massivos de GenIA

agosto 30, 2023

O Google Cloud e a NVIDIA anunciam uma nova infraestrutura e software de IA para os clientes criarem e implantarem modelos massivos para IA generativa e acelerarem cargas de trabalho de ciência de dados.

Em um bate-papo no Google Cloud Next, o CEO do Google Cloud, Thomas Kurian, e o fundador e CEO da NVIDIA, Jensen Huang, discutiram como a parceria está trazendo serviços de machine learning de ponta a ponta para os maiores clientes de IA do mundo, inclusive facilitando a execução e implementação de Supercomputadores de IA com ofertas do Google Cloud baseadas em soluções da NVIDIA. As novas integrações de hardware e software utilizam as mesmas tecnologias NVIDIA empregadas nos últimos dois anos pelo Google DeepMind e pelas equipes de pesquisa do Google.

“Essa otimização facilitará a execução das cargas de trabalho e a implementação cada vez mais eficiente da IA generativa para os clientes. Essa parceria reforça nosso compromisso em contribuir cada vez mais para o avanço de novas tecnologias”, ressalta Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.

Integrações

A estrutura do Google para a construção de grandes modelos de linguagem (LLMs), PaxML, agora está otimizada para computação acelerada NVIDIA. Originalmente desenvolvido para abranger várias fatias do acelerador Google TPU, o PaxML agora permite que os desenvolvedores usem GPUs NVIDIA H100 e A100 Tensor Core para experimentação e escalabilidade avançadas e totalmente configuráveis.

Um contêiner PaxML otimizado para GPU já está disponível no catálogo de software NVIDIA NGC. Além disso, o PaxML é executado em JAX, que foi otimizado para GPUs que utilizam o compilador OpenXLA.
O Google DeepMind e outros pesquisadores do Google estão entre os primeiros a usar PaxML com GPUs NVIDIA para pesquisas exploratórias.

O contêiner otimizado para PaxML da NVIDIA estará disponível imediatamente no registro de contêiner NVIDIA NGC para pesquisadores, startups e empresas em todo o mundo que estão construindo a próxima geração de aplicações baseadas em IA.

Além disso, as empresas anunciaram a integração do serverless Spark do Google com GPUs NVIDIA por meio do serviço Google’s Dataproc. Isso ajudará os cientistas de dados a acelerarem as cargas de trabalho do Apache Spark para preparar dados para o desenvolvimento de IA.