Microsoft identifica sete novos modos de falha em sistemas de IA agêntica
2026-06-06 11:15
Favoritos

De acordo com pt.wedoany.com-A Microsoft identificou sete novos modos de falha em sistemas de IA agêntica, com base na sua "Taxonomia de Modos de Falha em Sistemas de IA Agêntica" (Taxonomy of Failure Modes in Agentic AI Systems), publicada no ano passado.

Princípio de funcionamento da IA agêntica

Quatro razões principais levam a mais falhas na IA agêntica: a aceleração da adoção mainstream da tecnologia, o ecossistema do Protocolo de Contexto de Modelo (Model Context Protocol, MCP) cada vez mais maduro, o surgimento de agentes de uso de computador (computer-use agents) e o acúmulo de evidências empíricas à medida que os pesquisadores obtêm mais descobertas práticas.

Os sete novos modos de falha identificados incluem: Comprometimento da Cadeia de Suprimentos Agêntica (Agentic Supply Chain Compromise), onde o comportamento do agente pode ser influenciado por linguagem natural em vez de código malicioso; Sequestro de Objetivo (Goal Hijacking), onde instruções adversárias parecem alinhadas com tarefas legítimas, redirecionando secretamente o objetivo final do agente; Escalonamento de Confiança entre Agentes (Inter-Agent Trust Escalation), onde um agente comprometido alega identidade falsa ou exagera permissões ao orquestrador (orchestrator); Ataque Visual ao Agente de Uso de Computador (Computer Use Agent (CUA) Visual Attack), onde agentes que operam por interface gráfica podem ser manipulados por conteúdo contendo instruções adversárias; Contaminação do Contexto de Sessão (Session Context Contamination), onde um adversário introduz dados que desviam o raciocínio do agente em etapas subsequentes, sem acionar controles de segurança em nenhuma etapa individual; Abuso de MCP/Plugins (MCP / Plugin Abuse), uma atualização da cobertura de comprometimento de funções relacionadas a MCP e protocolos de plugins na classificação original, especialmente as superfícies de ataque específicas desses protocolos; Vazamento de Capacidades/Arquitetura (Capability / Architecture Disclosure), onde o agente revela detalhes internos de implementação, como nomes e padrões de ferramentas, estrutura de prompts do sistema, interface de memória ou lógica de acionamento de consentimento/humano no circuito.

A Microsoft recomenda que as equipes de segurança utilizem esses modos de falha para orientar o planejamento, façam um inventário da cadeia de suprimentos, gerem uma Lista de Materiais de Software (SBOM) para cada agente implantado, verifiquem criptograficamente a identidade do agente (em vez da localização) por meio de credenciais comprováveis emitidas no momento da concessão, adicionem os sete novos modos de falha à matriz de cobertura da equipe vermelha (red team) e auditem a experiência do usuário com humano no circuito como um controle de segurança.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com