De acordo com pt.wedoany.com-O Google DeepMind lançou oficialmente a API de Interações (Interactions API), impulsionando a transição do Gemini de chamada de modelo para execução de agente. Esta API pode processar simultaneamente chamadas de modelo Gemini e execução de agentes em um único endpoint unificado (Unified Endpoint). Os desenvolvedores precisam apenas passar o ID do modelo para tarefas de inferência e o ID do agente para tarefas autônomas.
Anteriormente, após o desenvolvedor enviar um prompt (Prompt), a API apenas chamava o modelo e retornava a resposta. A principal mudança com a API de Interações é que o papel da API se expandiu de simples chamada de modelo para gerenciamento de execução de tarefas de agente, suportando funções como execução de agente, gerenciamento de estado de tarefas, conexão de ferramentas e processamento em segundo plano em um único fluxo.

O recurso de Agente Gerenciado (Managed Agent) ajuda os desenvolvedores a criar um sandbox Linux remoto (Sandbox) com uma única chamada de API. O agente Gemini pode raciocinar, executar código, navegar na web e gerenciar arquivos dentro deste sandbox.

O VentureBeat considera que a API de Interações é uma interface unificada, projetada para que o modelo de linguagem grande (LLM) não seja mais apenas um gerador de texto, mas se aproxime de um sistema operacional remoto. Isso significa que o modelo está evoluindo de uma ferramenta que apenas gera respostas para um sistema capaz de chamar vários modelos, realizar chamadas repetidas, usar ferramentas e até executar código de backend.
Em termos de custos, a API de Interações armazena registros de conversas e conteúdos de tarefas nos servidores do Google, eliminando a necessidade de os desenvolvedores reenviarem o mesmo contexto longo a cada vez. Em serviços de agente que utilizam frequentemente documentos em grande escala ou registros de conversas longos, essa medida pode reduzir os custos de token e a latência de resposta. Os registros de tarefas de clientes da versão gratuita são retidos por um dia, enquanto os usuários pagos podem mantê-los por 55 dias. O TechCrunch aponta que isso é benéfico para manter o estado da API e reduzir preços, mas empresas que lidam com dados sensíveis precisam considerar simultaneamente questões de governança e residência de dados.
Ali Chebik, gerente de produto do grupo Google DeepMind, enfatizou no site oficial que a API de Interações foi desenvolvida com base no feedback dos desenvolvedores e que essa direção não mudará após o lançamento oficial.









