De acordo com pt.wedoany.com-A Unisound (云知声) lançou, em 8 de junho de 2026, seu novo modelo de linguagem geral de grande escala, o U2. Posicionado como um modelo nativo de agente, voltado para indivíduos, desenvolvedores e organizações, sua proposta técnica é de alta densidade de inteligência e alto valor de token, sem acumular parâmetros ou comprimento de saída de forma cega.
Diferente dos modelos de linguagem geral tradicionais, que tendem a ser mais voltados para perguntas e respostas únicas, o U2 enfatiza a execução contínua de tarefas do mundo real. Em cenários como trabalho de escritório complexo, engenharia de software, pesquisa aprofundada e colaboração com múltiplas ferramentas, o U2 pode decompor e avançar autonomamente fluxos de trabalho com mais de 100 etapas, conectando compreensão de demanda, planejamento de tarefas, interação com o ambiente, uso de ferramentas, correção de processo e verificação de resultados em um ciclo de execução fechado, passando de fornecer respostas para concluir tarefas.

Em termos de avaliação, o U2 obteve 87,9 pontos no GPQA Diamond, que mede conhecimento e capacidade de raciocínio complexo, superando o GLM-5.1, Hy3 preview, DeepSeek-V4-Flash (High) e MiniMax M2.7. No SWE-Bench Verified, que avalia a capacidade de engenharia de software, obteve 75 pontos, figurando entre os principais modelos. Na avaliação de agente autônomo de ponta a ponta, o Claw-Eval (pass@3), obteve 76,9 pontos, também superando o Hy3 preview, DeepSeek-V4-Flash (High) e MiniMax M2.7. No GDPval, que avalia a capacidade de entrega em escritório e trabalho de conhecimento, obteve 72,9 pontos; esse benchmark foca na conclusão de tarefas típicas de escritório, como análise de documentos, redação de relatórios, processamento de planilhas, geração de gráficos e criação de slides.
A Unisound afirma que o design do U2 não depende de uma única capacidade isolada para se destacar, mas oferece desempenho sistêmico em raciocínio, programação, execução de agente e entrega em escritório. Para atingir os objetivos de execução de tarefas, o U2 introduziu um mecanismo de pensamento híbrido, alternando dinamicamente entre cadeia de pensamento explícita e raciocínio em espaço latente dentro do mesmo processo de raciocínio, com base no estágio da tarefa, complexidade e incerteza. No início da tarefa, o modelo realiza busca de caminhos, decomposição de tarefas e geração de soluções candidatas no espaço latente; em estágios de julgamento crítico ou tratamento de restrições, alterna para raciocínio explícito para calibração lógica e convergência de resultados. Através de dedução latente limitada e alternância com percepção de entropia, o modelo pode ajustar dinamicamente o padrão de pensamento com base na incerteza durante o raciocínio.
Na base de conhecimento, o U2 aplica técnicas de filtragem e purificação de dados de alta densidade de conhecimento, filtrando dados repetidos e de baixa qualidade, e combina codificação de conhecimento esparsa e arquitetura de destilação de conhecimento para comprimir parâmetros redundantes do modelo. Na camada de execução de tarefas, introduz o paradigma de treinamento colaborativo Agent-Harness, incorporando a melhoria da capacidade do modelo e a otimização da cadeia de ferramentas no mesmo ciclo de treinamento, permitindo que trajetórias de execução de alta qualidade geradas em tarefas reais sejam realimentadas para o modelo, aprimorando suas capacidades de planejamento, uso de ferramentas, correção de processo e aceitação de resultados.
O U2 foca em três capacidades principais: raciocínio, programação e agente. No raciocínio, enfatiza execução de baixo desvio e estabilidade lógica de longo prazo; na programação, visa a entrega de engenharia de ponta a ponta, capaz de gerar código a partir de requisitos em linguagem natural e entender estruturas de projetos com múltiplos arquivos; na capacidade de agente, dedica-se a melhorar a colaboração com múltiplas ferramentas, orquestração de fluxos longos e interação com o ambiente. Essas capacidades formam um ciclo fechado de entrega de tarefas, desde a compreensão de requisitos, planejamento e execução até a verificação e colaboração.
Em termos de cenários de aplicação, o U2 pode cobrir design de interface de espectro completo, incluindo desenvolvimento de sites responsivos, construção de aplicativos web móveis e implementação de sistemas de design; pesquisa e análise aprofundadas, incluindo pesquisa setorial e de políticas, análise de visualização de dados e entrega de documentos em múltiplos formatos; desenvolvimento de jogos interativos imersivos, como jogos casuais clássicos e simuladores físicos; e automação de escritório eficiente, incluindo análise de relatórios de negócios, análise de cenário setorial e revisão periódica de negócios. O U2 já está disponível no Token Hub da Unisound, aberto para indivíduos, desenvolvedores e organizações.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









