De acordo com pt.wedoany.com-Em 1º de junho, a Aible, empresa americana de inteligência artificial agêntica empresarial, anunciou que sua solução empresarial para agentes de IA controlados e de longa duração, AibleClaw, foi integrada ao NVIDIA Cloud Functions (NVCF), trazendo o modelo econômico de GPU sem servidor para cargas de trabalho empresariais de IA executadas em horários programados. A Aible afirma que essa integração estende a vantagem de até 200x no custo total de propriedade (TCO) de IA generativa ponta a ponta, demonstrada em seus benchmarks anteriores, para tarefas agênticas empresariais de longa duração.
O AibleClaw visa agora os agentes de longa duração que as empresas estão acelerando na implantação, ou seja, cargas de trabalho de IA que precisam executar tarefas contínua ou periodicamente em segundo plano. Em comparação com perguntas e respostas únicas ou inferências de curta duração, essas tarefas geralmente apresentam características de pico e vale mais pronunciadas, como analisar agendas de reuniões em horários programados, gerar briefings de trabalho, escanear dados de negócios, processar leads de operações de clientes, rastrear mudanças na cadeia de suprimentos ou realizar verificações de conformidade. A Aible chama essas tarefas de "Claws", cuja operação pode durar vários minutos, com um tempo de acionamento relativamente controlável e menor sensibilidade à latência de inicialização a frio em comparação com aplicações interativas em tempo real, tornando-as mais adequadas para agendamento sob demanda, inferência elástica e otimização de custos via NVCF. Ao combinar o AibleClaw com o NVCF, as empresas não precisam manter clusters de GPU sempre ativos para todas as tarefas de agentes de longa duração, podendo executar tarefas programadas em períodos de menor demanda por GPU ou com recursos mais adequados, aumentando assim a utilização da capacidade computacional e reduzindo os custos ociosos em implantações privadas de IA.
Esta solução é construída sobre o conjunto de software NVIDIA DSX OS. O NVCF, como uma camada de API unificada, pode ser usado para executar e escalar cargas de trabalho como inferência, ajuste fino, processamento em lote e simulação em clusters Kubernetes, suportando escalonamento automático, isolamento multi-inquilino e maior utilização de GPU. Para a Aible, o valor do NVCF concentra-se na camada de orquestração de execução de agentes de IA empresariais: as empresas podem conectar servidores privados, servidores de borda, supercomputadores de mesa, principais plataformas de nuvem e recursos de parceiros de nuvem da NVIDIA ao mesmo sistema de agendamento, priorizando a execução local quando as condições forem adequadas e distribuindo tarefas para outros locais ou recursos de datacenter compartilhados quando necessário.
O AibleClaw também combina o runtime NVIDIA OpenShell e o blueprint NemoClaw para suportar agentes de longa duração controlados. A empresa já havia lançado anteriormente o AibleClaw with NVIDIA Nemotron 3 Super, voltado para agentes empresariais controlados de longa duração, e o AibleClaw with NVIDIA Nemotron 3 Nano Omni, para inferência multimodal na borda. Esta integração com o NVCF expande o foco do AibleClaw da capacidade do modelo para a estrutura de custos de IA empresarial, implantação privada e métodos de alocação de recursos. Para empresas que já integraram agentes de IA em seus processos de negócios, as variáveis que realmente impactam a implantação em escala não se limitam à qualidade das respostas do modelo, mas também incluem a utilização de recursos de GPU, flutuações nos custos de tokens, requisitos de residência de dados, capacidade de auditoria e custos previsíveis de tarefas de longa duração.
A Aible enfatiza que sua plataforma pode operar em ambientes como nuvens principais, servidores privados, parceiros de nuvem da NVIDIA, supercomputadores de mesa e servidores de borda, suportando a execução privada de cargas de trabalho de IA generativa e agêntica nos próprios servidores das empresas. Isso significa que as empresas podem integrar gradualmente agentes de IA em torno de sua infraestrutura de TI existente, sem precisar construir grandes datacenters centralizados de uma só vez. À medida que as empresas passam de demonstrações de IA para implantações de nível de produção, o modelo de custo dos agentes de longa duração está se tornando um fator importante na seleção de infraestrutura. A integração do AibleClaw com o NVCF também reflete que a competição empresarial de IA está evoluindo de "ser capaz de construir agentes" para "ser capaz de operar agentes de longa duração de forma econômica, governável e auditável".
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









