Mistral AI, da França, lança modelo OCR 4, focado na estruturação de documentos empresariais
2026-06-25 10:16
Favoritos

De acordo com pt.wedoany.com-A empresa francesa de inteligência artificial Mistral AI lançou na terça-feira seu modelo de reconhecimento óptico de caracteres de quarta geração, o OCR 4. A capacidade central do modelo não se limita à extração de texto, mas também retorna uma representação estruturada do documento, incluindo caixas delimitadoras, classificação de tipos de blocos e pontuações de confiança por palavra. O produto é direcionado ao mercado de implantação empresarial auto-hospedada em setores regulamentados, que não podem enviar documentos confidenciais para provedores de serviços em nuvem sob jurisdição dos EUA.

Arte vetorial Nuneybits de um documento branco centralizado em OCR laranja g 389a1d54-734c-4957-a8fa-848d9b6e9794

O OCR 4 suporta 170 idiomas de 10 famílias linguísticas e pode processar formatos PDF, DOC, PPT e OpenDocument. A Mistral afirma que as gerações anteriores convertiam principalmente páginas em texto e tabelas limpos, enquanto o OCR 4 retorna diretamente a representação estruturada do documento. O modelo já está disponível através da API Mistral, Document AI no Mistral Studio, Amazon SageMaker e Microsoft Foundry, com suporte para Snowflake Parse Document previsto para breve. O preço é a partir de US$ 4 por 1.000 páginas, com desconto para API em lote de US$ 2 por 1.000 páginas.

O núcleo de engenharia do OCR 4 é a saída de uma representação hierárquica do documento, em vez de um fluxo de texto plano. Cada bloco de texto vem acompanhado de posicionamento de caixa delimitadora, classificação de tipo (como título, tabela, fórmula, assinatura) e pontuações de confiança em nível de página e palavra. A Mistral afirma que as caixas delimitadoras são o recurso mais solicitado pelos clientes, pois permitem que sistemas downstream rastreiem informações extraídas para locais específicos da página. A classificação de blocos permite que parágrafos de título sejam usados para segmentação hierárquica em pesquisa semântica, blocos de tabela sejam roteados para pipelines de dados estruturados e blocos de assinatura possam acionar fluxos de trabalho de edição em sistemas de conformidade. As pontuações de confiança permitem que as organizações encaminhem programaticamente áreas de baixa confiança para revisão humana, enquanto aprovam automaticamente extrações de alta confiança.

Em avaliações independentes, a Mistral relatou que uma avaliação humana de mais de 600 documentos reais em mais de 12 idiomas, realizada por anotadores independentes, mostrou que o OCR 4 alcançou uma taxa média de vitória de 72% em comparação direta com os principais concorrentes. O modelo obteve 85,20 pontos no OlmOCRBench e 93,07 pontos no OmniDocBench. No entanto, a Mistral também auditou e divulgou proativamente artefatos nas pontuações, incluindo erros em anotações de referência, problemas de correspondência de símbolos LaTeX e suposições de ordem de leitura de colunas, considerando a pontuação total apenas como direcional, não definitiva. Vale notar que, no ranking público do OlmOCRBench, o OCR 4 atualmente ocupa o terceiro lugar, atrás de alguns modelos de pesos abertos, como o Chandra OCR 2. O PaddleOCR-VL-1.6 afirma ter uma pontuação geral de 96,33 no OmniDocBench.

O feedback inicial de empresas forneceu dados concretos. Aidan Donohue, engenheiro de IA da empresa de IA financeira Rogo, afirmou que, em um conjunto de dados de perguntas e respostas financeiras com muitos gráficos, o OCR 4, em comparação com analisadores de documentos de agentes líderes, "atingiu precisão equivalente com uma redução de custo de cerca de 8 vezes e uma redução de latência de cerca de 17 vezes". Já Ivan Mihailov, engenheiro de IA da empresa de gestão de propriedade intelectual Anaqua, disse que a "velocidade por página do OCR 4 é cerca de 4 vezes maior que a dos fornecedores existentes".

O contexto geopolítico deste lançamento é a desativação, em 12 de junho, dos modelos mais recentes Fable 5 e Mythos 5 da Anthropic devido a controles de exportação dos EUA, causando interrupções no serviço para clientes empresariais nos setores financeiro, de saúde e de infraestrutura crítica. Este evento validou os avisos do CEO da Mistral, Arthur Mensch, sobre os riscos da dependência europeia de empresas de IA americanas. Mensch afirmou que as empresas americanas "detêm o controle sobre seus modelos" e enfatizou recentemente que "a Europa está atrasada na construção de infraestrutura, então estamos investindo para reduzir essa lacuna". O modo de implantação auto-hospedada em contêiner único do OCR 4 garante que os documentos não precisem sair da infraestrutura do cliente, operando inteiramente sob jurisdição da UE.

Um dia antes do lançamento da Mistral, a Baidu apresentou um modelo de 3 bilhões de parâmetros chamado Unlimited-OCR, com pesos abertos gratuitos sob licença MIT. O modelo usa uma técnica chamada Atenção de Janela Deslizante de Referência (R-SWA), capaz de analisar PDFs inteiros e digitalizações de várias páginas em uma única passagem direta, sem necessidade de divisão ou concatenação. Analistas veem esses dois lançamentos como uma divergência de modelos no campo da IA documental em junho de 2026: análise de longo alcance auto-hospedada com pesos abertos versus extração estruturada hospedada comercializada. Para equipes de pesquisa com uma única GPU, o Unlimited-OCR pode ser mais adequado, enquanto o OCR 4 é voltado para acordos de nível de serviço, acordos de processamento de dados e auditorias de conformidade envolvidos nos processos de aquisição de TI empresarial.

Do ponto de vista industrial, o OCR 4 é o ponto de entrada da Mistral no orçamento de IA empresarial. O modelo suporta diretamente o Search Toolkit da Mistral, uma estrutura de busca componível de código aberto. Arquitetonicamente, o OCR 4 atua como a camada de extração para pipelines de Geração Aumentada por Recuperação e busca empresarial. A Bloomberg noticiou recentemente que a Mistral está em negociações iniciais para levantar cerca de 3 bilhões de euros com uma avaliação de aproximadamente 20 bilhões de euros. A empresa tem como meta uma receita de 1 bilhão de euros em 2026. O CEO da Mistral também rebateu recentemente o apelo do Papa para que a IA seja "desarmada", argumentando que a Europa não pode ficar para trás em relação aos gigantes de tecnologia dos EUA e precisa ter suas próprias capacidades de IA.

comparação-de-desempenho-de-modelo-ocr

comparação-de-modelos-mistral-ocr-4

Mistral-OCR-4-multilíngue

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com