De acordo com pt.wedoany.com-A Anthropic implementou um filtro anti-destilação oculto no modelo Claude Fable 5, que altera secretamente os resultados quando os usuários tentam destilar o modelo, em vez de recusar diretamente. Em 11 de junho de 2026, o site de tecnologia The Verge revelou esse mecanismo, gerando forte reação na comunidade de IA. A Anthropic posteriormente pediu desculpas e prometeu tornar essa restrição tão transparente quanto outras medidas de proteção no futuro.
A destilação é uma técnica comum em pesquisa, que utiliza a saída de modelos grandes para treinar modelos mais compactos. A Anthropic proíbe a destilação em seus termos de uso, mas o Fable 5 trata tentativas de destilação de forma diferente de outras áreas sensíveis. Para solicitações relacionadas a ataques cibernéticos, biologia ou química, o modelo muda explicitamente para o Claude Opus 4.8 e notifica o usuário; já para comportamentos de destilação, ele modifica silenciosamente os prompts por meio de um mecanismo complexo, gerando saídas intencionalmente degradadas, sem qualquer aviso ou mensagem de erro. A existência desse filtro está registrada no cartão do sistema do modelo, mas o mecanismo não era amplamente conhecido.
A comunidade reagiu intensamente. Segundo o Gizmodo, pesquisadores de IA afirmaram nunca ter visto tanta indignação entre colegas. Um usuário do Reddit resumiu o sentimento geral, dizendo que para conteúdo sensível pode-se recusar ou retornar códigos de erro, mas "pegar o dinheiro das pessoas e envenenar seus códigos" é inaceitável.
A Anthropic respondeu rapidamente. Em uma declaração, a empresa reconheceu ter "feito um compromisso errado" e pediu desculpas por não ter "encontrado o equilíbrio correto". Atualmente, solicitações identificadas como tentativas de destilação serão redirecionadas para o Claude Opus 4.8, de forma consistente com outras áreas sensíveis, e o usuário será notificado a cada vez.

Este incidente expõe a profunda contradição da Anthropic entre a abertura dos modelos e a proteção de vantagens técnicas. O Fable 5 já é uma versão restrita do Mythos, que não foi lançado publicamente por ser considerado perigoso demais. A empresa deseja proteger seus ativos técnicos da destilação, uma demanda comercialmente razoável, mas a decisão de implementá-la silenciosamente, em vez de declarar publicamente a restrição, corroeu a confiança externa em uma empresa que tem como principal diferencial a transparência e a segurança responsável. A Anthropic ajustou rapidamente o rumo, mas resta saber se esse incidente mudará de forma duradoura a forma como a empresa registra suas medidas de proteção.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









