A chinesa SenseTime lançará modelo de geração de imagens U1 Pro para competir com GPT-Image 2
2026-06-26 15:05
Favoritos

De acordo com pt.wedoany.com-A SenseTime está desenvolvendo secretamente um modelo multimodal de grande escala chamado "U1 Pro", liderado pelo cofundador e cientista-chefe Lin Dahua, voltado principalmente para cenários de "design", com o objetivo de criar um modelo de geração de imagens com capacidade de raciocínio que rivalize com o GPT-Image 2 da OpenAI.

O modelo está sendo desenvolvido pelo Instituto de Pesquisa da SenseTime, faz parte da família de modelos SenseNova, e está previsto para iniciar testes internos por convite e fornecer serviços aos clientes em julho deste ano. Segundo fontes próximas, o "U1 Pro" pode, ao enfrentar demandas complexas de design, agir como um "designer que pensa", realizando um ciclo longo de design, geração e avaliação, além de suportar saída em resolução 8K. Em inúmeros testes internos, com as mesmas instruções, as imagens geradas pelo "U1 Pro" são altamente semelhantes às do GPT-Image 2, e até apresentam vantagens.

Na avaliação de texto para imagem do LMSYS Chatbot Arena, o GPT-Image 2 superou amplamente o Nano Banana 2 do Google em qualidade de geração de imagem, renderização de texto e adesão a instruções, gerando grande entusiasmo na indústria de design. O setor geralmente prevê que a OpenAI também lançará em breve um novo modelo de geração de imagens por IA, com foco no "design" como direção principal.

O vazamento do novo modelo "U1" da SenseTime envia um sinal ao mundo exterior: além da programação, liderada por empresas de IA de ponta como Anthropic e Zhipu, o "design" está se tornando o próximo grande campo de batalha para modelos multimodais.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com