GitHub lança agente interno de análise de IA, Qubot, com suporte a consultas em linguagem natural
2026-06-21 10:12
Favoritos

De acordo com pt.wedoany.com-O GitHub lançou o agente interno de análise de Inteligência Artificial Qubot, que permite que os funcionários consultem qualquer modelo de dados no data warehouse usando linguagem natural e obtenham respostas em segundos.

Grandes organizações de dados e análise frequentemente enfrentam dificuldades em fornecer acesso self-service a dados e insights. O GitHub possui dezenas de equipes de produto internamente, e fornecer suporte analítico dedicado a cada uma delas é um desafio; por isso, muitas equipes precisam resolver problemas de análise de dados por conta própria. Embora exista uma grande quantidade de dados de telemetria de produto valiosos disponíveis para tomada de decisões, determinar o modelo de dados, a granularidade, os filtros, escrever consultas e validar os resultados sempre foi uma tarefa difícil sem o suporte de um analista de dados.

O Qubot, como um agente de análise interno baseado no GitHub Copilot, permite que qualquer Hubber (ou seja, funcionário do GitHub) faça perguntas em linguagem natural, como "Qual grupo de usuários tem a maior taxa de retenção neste recurso?" ou "Qual produto contribuiu mais para a melhoria deste indicador na semana passada?". Esta ferramenta não substitui ferramentas de relatórios ou dashboards, mas é adequada para perguntas exploratórias, com custo de manutenção zero, ajudando as equipes a se familiarizarem rapidamente com conjuntos de dados desconhecidos.

A arquitetura do Qubot consiste em três componentes principais: interface do usuário, camada de contexto e mecanismo de consulta.

Diagrama ilustrando a arquitetura do agente de análise Qubot. Contexto e entrada do usuário vão para o Qubot, que consulta o Trino e o Kusto para obter respostas.

A interface do usuário pode ser acessada via Slack, VS Code e Copilot CLI. A interface do Slack não requer configuração; quando alguém faz uma pergunta no canal do Slack do Qubot, o sistema gera uma instância do Qubot, e a resposta é exibida diretamente no Slack, permitindo que os usuários compartilhem os resultados e refinem as perguntas iterativamente. Os resultados também são armazenados como relatórios Markdown em pull requests. O Qubot pode ser usado como um plugin instalado no VS Code e no Copilot CLI.

A camada de contexto é construída de forma federada, com conhecimento adaptado ao tipo de dado. Para dados de eventos brutos (camada bronze), possui contexto de telemetria contribuído pelas equipes de produto; para dados de fatos e dimensões conformados (camada prata), possui exemplos de consultas e guias de uso mantidos pelas equipes de dados e análise; para dados da camada ouro, curados para casos de uso de negócios específicos, possui regras de negócio e definições de indicadores. O pipeline ETL enriquece a camada de contexto com sinais adicionais e metadados derivados, e é carregado em tempo de execução através do servidor MCP do GitHub.

O agente de contexto simplifica a contribuição federada de contexto. As equipes podem contribuir com contexto usando modelos padronizados ou repositórios de referência, e o agente ingere, organiza e normaliza as informações em um formato estruturado. Cada alteração na camada de contexto ou na configuração do agente é medida antes da publicação por meio de uma estrutura de avaliação, que inclui casos de teste cuidadosamente elaborados, orquestração de execução automática e componentes de agregação estatística, usados para medir a precisão das respostas, a latência e capturar problemas de regressão.

O mecanismo de consulta se conecta ao Kusto e ao Trino através do servidor MCP. O Kusto é rápido, adequado para consultas exploratórias em dados de eventos recentes; o Trino lida com joins complexos e análises históricas mais aprofundadas. O Qubot usa o Kusto por padrão e alterna automaticamente para o Trino quando necessário.

O Qubot já é amplamente utilizado no GitHub, com centenas de usuários executando milhares de consultas. O número de perguntas nos canais de dados e análise diminuiu significativamente, e os funcionários podem explorar dados de forma mais autônoma. A camada de contexto tornou-se a chave para aprimorar a capacidade de raciocínio do Copilot; um contexto bem estruturado não só torna o Qubot mais preciso, mas também acelera em três vezes a velocidade de retorno de respostas corretas.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com