De acordo com pt.wedoany.com-A Fundação LF AI & Data, sob a Linux Foundation, estabeleceu um grupo de trabalho focado no desenvolvimento da especificação DocLang, visando fornecer um padrão interoperável de processamento de documentos para fluxos de trabalho de IA e agentes.

O grupo de trabalho, fundado pelos membros principais IBM, Nvidia e Red Hat, tem a missão de criar um formato de documento aberto, universal e nativo de IA, destinado a melhorar a forma como as empresas preparam, trocam e gerenciam dados de documentos para sistemas de IA. Os contribuidores ABBYY e Human Signal também participarão do seu desenvolvimento.
De acordo com o anúncio, as empresas atualmente operam com uma variedade de formatos de documentos fragmentados, incluindo PDF, JPEG e outros tipos de arquivo construídos principalmente para leitura humana, e não para interpretação por IA. À medida que as organizações dependem cada vez mais de IA generativa e sistemas de agentes, essa desconexão pode introduzir complexidade, aumentar custos e reduzir a confiabilidade ao extrair significado de documentos de negócios.
Mark Collier, diretor executivo da LF AI & Data, afirmou que o objetivo do grupo de trabalho da especificação DocLang é desenvolver um padrão neutro em relação a fornecedores e interoperável, ajudando as organizações a preparar dados de documentos para IA de forma mais confiável, transparente e em grande escala. Um documento informativo divulgado pelo grupo de trabalho afirma que o PDF foi criado para impressão, o DOCX para editores, e o DocLang para a próxima era — um padrão de documento legível por máquina que os modelos podem realmente confiar. O DocLang define um formato estruturado e legível por máquina para qualquer tipo de documento, assim como o JSON é para dados e o HTML é para a web; qualquer ferramenta pode implementá-lo e qualquer pipeline pode utilizá-lo.
O analista de tecnologia independente Carmi Levy afirmou que os padrões de documentos existentes permitiram que partes interessadas globais colaborassem com confiança por décadas, mas, à medida que a IA redefine as regras de como o trabalho é feito, esses padrões precisam urgentemente de atualização. Ele acredita que o DocLang representa a maior e mais antiga esperança de alcançar uma linha de base fundamental nos padrões de documentos, com potencial para tornar os fluxos de trabalho mais inteligentes, eficientes e de menor risco do que atualmente. A adoção de uma abordagem de código aberto e neutra em relação a fornecedores garante que os interesses coletivos tenham prioridade sobre as necessidades de fornecedores específicos, e os primeiros trabalhos de padronização em torno de redes, documentos, páginas web e nuvem impulsionaram o cenário digital livre que define a vida moderna.
Jason Andersen, analista principal da Moor Insights & Strategy, acredita que, quando padrões como o DocLang são aplicados à ingestão de conteúdo, os usuários podem enviar documentos para um agente, que executa uma habilidade para pré-processar o documento no formato padrão DocLang, economizando tokens. Ele imagina que esses padrões precisam preservar a capacidade humana de fazer o que deseja e usar com proficiência sem precisar saber codificação. Após o pré-processamento anexar metadados ou código ao documento, a governança pode ser mais fácil de alcançar, desde que seja mantida adequadamente, mas isso ainda não está refletido na especificação, e ele incentiva a equipe a considerar esse aspecto.
Yaz Palanichamy, analista sênior de pesquisa do Info-Tech Research Group, afirmou que o conceito de documentos nativos de IA, do ponto de vista da produtividade do usuário, ajuda as organizações a preparar dados de documentos para sistemas incorporados de IA. No entanto, ele enfatizou que os controles de conformidade organizacional e o modelo geral de governança são absolutamente necessários, e é preciso entender se a prontidão tecnológica da empresa permite padronizar as práticas internas de gerenciamento de documentos. Sem um estudo de viabilidade interno ou preparação prévia, a gestão de mudanças não pode ser executada adequadamente, o que pode impedir a organização de amadurecer ou expandir ainda mais a capacidade de processamento de documentos incorporados com IA. Do ponto de vista da governança, ainda é necessário revisar adequadamente várias medidas de controle organizacional para garantir que este novo padrão e kit de ferramentas de colaboração sejam expandidos de forma responsável e segura.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









