O governo brasileiro quer desenvolver um grande modelo de linguagem (LLM, na sigla original em inglês) próprio e em português para uso em sistemas de inteligência artificial (IA). A informação foi confirmada em uma entrevista ao site Mobile Time do secretário de Ciência e Tecnologia para a Transformação Digital do Ministério da Ciência, Tecnologia e Inovação (MCTI), Henrique Miguel.
A criação de um LLM nacional ainda está na fase de planejamento, com o MCTI em articulação com outros governos e empresas privadas para encontrar uma rota possível para tirar o projeto do papel.
De acordo com Miguel, o projeto faz parte do Plano Brasileiro de Inteligência Artificial (PBIA) e envolve também a aquisição de um supercomputador para fazer boa parte dessas operações e investimentos para a construção de data centers. Outro ponto importante para o avanço do debate é o projeto de lei que regulamenta a IA no Brasil. Ele foi aprovado no Senado no fim de 2024, mas ainda pode ser bastante alterado até a sanção presidencial.
Como será o LLM 100% nacional
Segundo os planos do governo, o LLM deve “incorporar as principais bases de dados públicas“, que ainda precisam ser devidamente articuladas, e ter o português como idioma nativo, passo considerado importante para ser mais próximo inclusive dos parâmetros da cultura nacional. O Serviço Federal de Processamento de Dados (Serpro), que desenvolve soluções tecnológicas para o Estado, também já confirmou em paralelo o desejo de elaborar uma base de dados a partir de informações do governo para alimentar o LLM.
Além disso, a questão de direitos autorais e o uso de materiais sem autorização é outra preocupação do MCTI. Enquanto empresas como Meta são acusadas de baixar materiais piratas para alimentar IAs e ainda não sofrer punições por isso, um governo agir desse modo poderia gerar consequências piores.
“O treinamento também deve ser feito preservando essas bases de dados. Por isso que, se você usar um LLM de fora, uma nuvem de fora, você não tem garantia e certeza de onde esses essas informações e esses dados vão parar e qual será a utilidade e a finalidade deles”, diz o secretário.
O secretário reforçou ainda que o projeto será inspirado no DeepSeek, a plataforma chinesa de IA que tem mudado a visão do mercado global. O LLM e chatbot servirão como base no sentido de funcionar a partir de uma estrutura menos robusta de GPUs para treinamento, alimentação e funcionamento dos sistemas, sem comprometer o desempenho.
- Leia também: Câmara dos Deputados aprova lei que criminaliza divulgação de imagens estilo “deepnudes”
Quer saber mais sobre o DeepSeek e por que ele tem sido tão importante para o setor? Confira o especial de curiosidades sobre o tema preparado pelo TecMundo!