De acordo com pt.wedoany.com-Em 25 de junho, a Sail Research, empresa americana de infraestrutura de agentes de IA, anunciou a conclusão de rodadas de financiamento Semente e Série A, arrecadando um total de US$ 80 milhões, com uma avaliação de US$ 450 milhões. A rodada Série A foi liderada pela Kleiner Perkins, dos EUA, e a rodada Semente foi liderada pela Sequoia Capital, dos EUA. Os recursos serão usados para construir infraestrutura de inferência de alta eficiência voltada para agentes de IA de ciclo longo.
A Sail Research tem como alvo o problema de custo na operação em larga escala de agentes de IA. Aplicativos de IA de chat comuns são geralmente projetados para uma única pergunta e resposta ou sessões curtas, enquanto agentes de IA de ciclo longo precisam operar continuamente por horas ou até dias, executando tarefas como análise de código, pesquisa empresarial, triagem de candidatos, processamento de documentos e planejamento de tarefas complexas. Quanto maior a duração da tarefa, maior o número de chamadas de modelo, consumo de contexto e uso de tokens, tornando o custo de inferência um gargalo para a implantação de agentes pelas empresas.
Esta empresa não tenta reconstruir um único modelo, mas sim a infraestrutura subjacente de inferência e ambiente sandbox da qual os agentes dependem para operar. A infraestrutura fornecida pela Sail Research inclui uma pilha de inferência reconstruída para throughput e eficiência, e um ambiente sandbox Sailboxes que pode operar continuamente por horas ou dias. O primeiro é usado para reduzir o custo por token em tarefas longas, enquanto o segundo permite que os agentes trabalhem continuamente em um ambiente com estado, cobrando com base no tempo real de trabalho, reduzindo os custos de inatividade em tarefas de ciclo longo.
O grupo de investidores desta rodada de financiamento está focado em infraestrutura de IA e sistemas de software. Além da Kleiner Perkins e Sequoia Capital, dos EUA, também participaram a Redpoint Ventures, Theory Ventures, Vine Ventures, CRV, A* e Abstract Ventures, todas dos EUA. Os investidores-anjo incluem o presidente da Alphabet, John Hennessy, o CEO da Intel, Lip-Bu Tan, e o cientista-chefe da Together AI, Tri Dao, entre outros.
A equipe fundadora da Sail Research tem experiência em hardware e sistemas em larga escala. O cofundador e CEO, Neil Movva, trabalhou anteriormente na NVIDIA, Apple e Together AI, dos EUA, em áreas relacionadas a desempenho de GPU, infraestrutura e sistemas de IA; o cofundador e CTO, Samir Menon, também participou da construção de sistemas em larga escala na Apple. Essa formação determina que a empresa se concentre mais na utilização de poder computacional, throughput de inferência, escalonamento de carga de trabalho e otimização de custos em nível de sistema, em vez de apenas empacotar produtos de agentes de IA na camada de aplicação.
Agentes de IA de ciclo longo impõem requisitos diferentes à infraestrutura. Quando um usuário humano espera por uma resposta, ele se preocupa mais com a baixa latência; quando um agente executa tarefas continuamente, ele precisa de throughput estável, contexto escalável, capacidade de chamada concorrente e custo controlável. O diagnóstico da Sail Research é que a infraestrutura de inferência existente é projetada principalmente para interações curtas, não sendo adequada para que agentes consumam grandes quantidades de tokens continuamente e mantenham operação prolongada. Portanto, é necessário redesenhar o sistema subjacente em torno da forma como os agentes trabalham.
A empresa afirma que sua infraestrutura de inferência melhora a eficiência do uso de GPU ao personalizar mecanismos de inferência de código aberto, distribuir cargas de trabalho entre fornecedores e utilizar recursos computacionais subutilizados, alcançando uma redução de custo por token de até 10 vezes em algumas avaliações. Sua API é compatível com o fluxo de trabalho existente da OpenAI e suporta modelos de código aberto como DeepSeek, Gemma, GLM, Kimi, Nemotron, facilitando a integração por empresas sem grandes modificações na arquitetura do aplicativo.
A Sail Research já atende alguns clientes de fluxo de trabalho de IA, incluindo a empresa de dados da web Parallel Web Systems, a plataforma de revisão de código Detail.dev e a Jack and Jill. Para esses clientes, o agente não se limita a responder perguntas, mas precisa ler continuamente páginas da web, analisar bases de código, gerar relatórios ou processar fluxos complexos. Uma vez que tais cenários entram em produção, o custo de inferência, a estabilidade operacional e a capacidade de recuperação de tarefas afetam diretamente a viabilidade comercial.
Com a conclusão do financiamento de US$ 80 milhões, a Sail Research entrará em uma fase inicial de expansão no setor de infraestrutura de agentes de IA. À medida que as empresas passam de testar chatbots para implantar agentes de IA que podem trabalhar continuamente, a plataforma de inferência subjacente, o ambiente sandbox, o escalonamento de tarefas e o controle de custos se tornarão novos focos de concorrência. Resta saber se a Sail Research conseguirá transformar sua vantagem de custo em crescimento estável de clientes e se a infraestrutura para agentes de ciclo longo se tornará uma camada fundamental independente na implementação de aplicações de IA.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









