Nvidia lança Nemotron 3 Ultra nos EUA, modelo aberto visa reduzir custos de agentes de tarefas longas_Boletins

Nvidia lança Nemotron 3 Ultra nos EUA, modelo aberto visa reduzir custos de agentes de tarefas longas

2026-06-02 09:16

Favoritos

De acordo com pt.wedoany.com-Em 1º de junho, o CEO da Nvidia, Jensen Huang, apresentou o novo modelo de IA Nemotron 3 Ultra durante um evento relacionado à COMPUTEX 2026 em Taipei, Taiwan. O modelo é voltado para fluxos de trabalho de agentes empresariais, abrangendo cenários como código, pesquisa, automação de processos empresariais e execução de tarefas de longa duração.

Com o lançamento do Nemotron 3 Ultra, o papel da Nvidia continua a se expandir de fornecedor de chips de IA para uma combinação de "plataforma de computação + modelo + ferramentas de desenvolvimento". Informações públicas mostram que o Nemotron 3 Ultra é um modelo de especialistas mistos com 550 bilhões de parâmetros, projetado para agentes de tarefas longas, capaz de alcançar maior velocidade de inferência em tarefas complexas de agentes e reduzir custos operacionais. Para clientes empresariais, a pressão de custo das aplicações de agentes não vem apenas de perguntas e respostas únicas, mas de chamadas contínuas a ferramentas, leitura de dados empresariais, execução de planos de várias etapas, verificação repetida de resultados e raciocínio de contexto longo. Se o modelo não conseguir manter estabilidade e eficiência em tarefas longas, as empresas terão dificuldade em levar os agentes de pilotos internos para sistemas de produção. Ao enfatizar velocidade de inferência, custo e capacidade de tarefas longas no Nemotron 3 Ultra, a Nvidia está, na verdade, respondendo às novas demandas da IA empresarial, que passa de "ser capaz de gerar conteúdo" para "ser capaz de executar processos".

Este modelo faz parte da família de modelos abertos Nemotron 3. A Nvidia já lançou modelos de diferentes escalas, como Nano, Super e Ultra, voltados respectivamente para implantação leve, inferência de alto rendimento e tarefas complexas de agentes.

Do ponto de vista da trajetória técnica, o Nemotron 3 Ultra dá continuidade à estratégia combinada da Nvidia em torno de modelos abertos, NVIDIA NIM, NeMo, CUDA-X e ecossistema de software empresarial. Ao implantar agentes, as empresas geralmente precisam que o modelo possua múltiplas capacidades, como raciocínio, geração de código, chamada de ferramentas, planejamento de processos, verificação de resultados e controle de segurança, além de se adaptar a nuvens privadas, data centers locais, softwares empresariais e sistemas de permissão corporativos. A vantagem da Nvidia não está apenas no modelo em si, mas também no fato de que suas GPUs, serviços de inferência, bibliotecas de software e ecossistema de desenvolvedores podem formar um caminho de entrega unificado. Se o Nemotron 3 Ultra puder ser integrado à infraestrutura de IA existente, ajudará as empresas a incorporar aplicações de agentes em processos como segurança cibernética, tomada de decisão operacional, colaboração em P&D, atendimento ao cliente, automação de TI e análise de dados, reduzindo os custos de engenharia de adaptação separada a diferentes modelos e diferentes estruturas de inferência.

Este lançamento também está alinhado com a expansão da Nvidia em AI PC, IA física e agentes empresariais. Na mesma ocasião, Jensen Huang também apresentou novos avanços em chips para PC, kits de ferramentas para agentes e modelos relacionados a robôs, mostrando que a Nvidia está estendendo as capacidades de IA dos data centers para terminais pessoais, desktops empresariais, robôs e direção autônoma, entre outros cenários mais amplos. O Nemotron 3 Ultra assume a função de complementar as capacidades no nível de agentes empresariais e modelos abertos, formando, juntamente com chips de hardware, plataformas de inferência e ferramentas de desenvolvimento, a infraestrutura da Nvidia para a próxima fase de aplicações de IA. As variáveis subsequentes concentram-se no grau de abertura do modelo, no custo real de inferência, na estabilidade em tarefas longas, na velocidade de integração com software empresarial e na disposição dos desenvolvedores em construir aplicações de agentes especializadas em torno da família Nemotron.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com

EUA

Informação e Comunicação Engenharia de inteligência artificial

Este boletim é uma compilação e reprodução de informações de parceiros estratégicos e da internet global, destinado apenas para troca de informações entre leitores. Em caso de infração ou outros problemas, por favor, informe-nos imediatamente, e este site fará as devidas modificações ou exclusões. A reprodução deste artigo é estritamente proibida sem autorização formal. E-mail: news@wedoany.com