Teste real de modelos multimodais nacionais: Step3.7Flash lidera em velocidade e custo_Boletins_Wedoany.com

Início Notícias Detalhes

Teste real de modelos multimodais nacionais: Step3.7Flash lidera em velocidade e custo

2026-07-02 14:26

Favoritos

De acordo com pt.wedoany.com-No contexto em que os modelos multimodais estão passando de demonstrações para implantação em produção, os modelos Step 3.7 Flash, Qwen3.6-flash e MiniMax M3 foram testados em cenários de desenvolvimento e negócios. Uma avaliação comparativa focada em duas tarefas — reconhecimento de fluxogramas e extração de dados de recibos — mostrou que os três modelos apresentam qualidade estável na compreensão visual e na saída estruturada, mas diferem em velocidade de resposta e consumo de tokens.

A avaliação, centrada nas três dimensões de qualidade, velocidade e custo, selecionou dois tipos de cenários industriais: primeiro, a reconstrução da lógica de negócios a partir de fluxogramas de sistema durante o desenvolvimento de agentes; segundo, a extração estruturada de informações de faturas por meio de chamadas de API em sistemas de negócios. Os testes indicaram que nenhum dos três modelos cometeu erros graves de reconhecimento nas duas tarefas, com saídas de alta usabilidade.

No cenário de compreensão de fluxogramas, o modelo precisava extrair com precisão 10 etapas da lógica de negócios de um fluxograma de autenticação de login de um miniaplicativo WeChat. O Step 3.7 Flash identificou corretamente todas as 10 etapas, com cada etapa correspondendo perfeitamente ao fluxograma original. O MiniMax M3 também gerou 10 etapas, com a lógica correta. O Qwen3.6-flash, por sua vez, combinou as etapas 3 e 4, gerando 9 etapas, mas a lógica geral estava correta. Com qualidade de saída equivalente, o Step 3.7 Flash apresentou a velocidade de resposta mais rápida e o menor consumo de tokens.

Em outro teste voltado para sistemas de negócios, o modelo precisava extrair campos-chave de uma fatura eletrônica e gerar uma saída em uma estrutura JSON predefinida. Os três modelos conseguiram identificar e estruturar com precisão as informações necessárias. O Step 3.7 Flash concluiu a tarefa em 5,6 segundos, consumindo 1409 tokens; o MiniMax M3 levou 6,1 segundos, consumindo 2216 tokens; e o Qwen3.6-flash levou 7,38 segundos, consumindo 2008 tokens. O custo de extração estruturada por fatura foi inferior a 1 centavo.

Considerando ambos os testes, a estabilidade de qualidade dos três modelos na compreensão visual e na saída estruturada atende aos requisitos iniciais de produção, sem erros de extração. Para cenários de agentes ou APIs de negócios com chamadas frequentes, a latência de resposta e o consumo de tokens tornam-se indicadores-chave de diferenciação. Nesta comparação, o Step 3.7 Flash, mantendo a mesma qualidade de saída, oferece velocidade de resposta mais rápida e custo mais baixo, sendo mais adequado para testes prioritários em ambientes de produção.

Informação e Comunicação Engenharia de processamento inteligente de dados Engenharia de inteligência artificial

Anterior：Acelerador Rubin Ultra da NVIDIA em 2027 abandona design de 4 dies

Próximo：Deichmann Espanha e TW Logistics inauguram primeira fase de 10.000 m² do centro logístico

Solicitar Cotação

Cabo Óptico GYTA do tipo Não Auto-Suportado para Aéreo e Dutos

TONGDING INTERCONNECTION INFORMATION CO., LTD.

Solicitar Cotação

Solução de Manutenção Inteligente

Chengdu Yunda Technology Co., Ltd.

Solicitar Cotação

Perfil de gabinete T

Xinli Tongchuang Electronic Equipment Co., Ltd.

Solicitar Cotação

Condução Autônoma FAO

UniTTEC Co., Ltd.

Solicitar Cotação

Subarranjo Tx de Antena de Matriz Faseada em Banda Ka

COXSAT TECHNOLOGY CO., LTD.

Solicitar Cotação

Série DYJWGB-50 Dispositivo Terminal Remoto (RTU) com GPRS

Ningbo Donghai Group Co., Ltd.

Solicitar Cotação

Robô Inteligente para Troca de Cabos em Mineração

Solicitar Cotação

Solução de Instrumentação de Segurança SIS

Beijing Consen Automation Technology Co., Ltd.

Solicitar Cotação

Software do Sistema de Verificação / Calibração de Pressão ACal

Beijing ConST Instruments Technology Inc.

Solicitar Cotação

Comutador industrial PRS-7961B

CYG SUNRI CO.,LTD.

Solicitar Cotação

Sistema de Monitoramento Inteligente de Correias Transportadoras

LUO YANG WIRE ROPE INSPECTION TECHNOLOGY CO., LTD.

Solicitar Cotação

Fibra Óptica Monomodo G.652B

SHENZHEN SDG INFORMATION CO., LTD.

Recomendações

HD Hyundai Electric da Coreia do Sul recebe pedido de equipamentos para data center no valor de 1,12 trilhão de won

Patmos, dos EUA, planeja investir US$ 107 milhões para converter armazém em data center em Independence

Grupo Membrane Índia e Kurita Water Industries formam joint venture para atender indústria de semicondutores

Os 250 tipos de robôs da FANUC no Japão suportam todos a IA Física

Receita anual da divisão de IA da Microsoft nos EUA ultrapassa US$ 37 bilhões, com crescimento de 123%

Vertiv na Malásia inaugura primeira base de fabricação no Sudeste Asiático para atender à demanda de IA

Schneider Electric e Foxconn unem forças para impulsionar infraestrutura de data centers de IA

Saltroad, do Reino Unido, recebe financiamento de £1,5 milhões e adquire plataforma de IA Ogma

Helix lança plano de aquisição com apoio da KKR e Nvidia para acelerar construção de data centers

Silk Way West Airlines do Azerbaijão assina acordo digital com a CargoAi

Boletins Mais Recentes

Spie batignolles ganha contrato de 132 milhões de euros para cais no porto de Dunquerque, França

Congresso Mundial de Túneis de 2026 realizado em Montreal, Canadá

Empresa chinesa de robôs humanoides Zhiyuan Robot estabelece nova empresa de equipamentos inteligentes com capital de 4,5 milhões de yuans

VINCI Building ganha contrato de £55 milhões para edifício de escritórios em Liverpool

Porto de Caofeidian, em Tangshan, China, alcança atracação regular de navios de 400.000 toneladas com carga total

Plano técnico do projeto de demonstração de geração de energia a carvão a 650°C da China Huaneng aprovado em avaliação

Iniciada investigação geotécnica para o projeto da Vila Desportiva de Cumbria, no Reino Unido

251 apartamentos na Zona Verde de Manchester e 50 residências em Levenshulme prestes a serem aprovados

Richborough, do Reino Unido, obtém licença de planeamento para 200 habitações em Clitheroe

Alibaba China integra linha de produtos Agent e lança produto de IA para produtividade empresarial