A HiDream.ai da China concluiu uma nova rodada de financiamento de centenas de milhões e lançou o modelo de imagem multimodal nativo de grande escala HiDream-O1-Image-Pro com mais de 200 bilhões de parâmetros
2026-05-20 17:46
Favoritos

De acordo com pt.wedoany.com-A HiDream.ai realizou o seu primeiro Open Day a 19 de maio, lançando oficialmente o modelo de imagem de grande escala HiDream-O1-Image-Pro, construído com base na nova arquitetura de modelo multimodal nativo Unified Transformer (UiT), com uma escala de parâmetros superior a 200 mil milhões. A empresa anunciou simultaneamente a conclusão de uma nova ronda de financiamento de centenas de milhões de yuans, com a participação de várias instituições, incluindo Shenzhen Capital Group, Jinpu Investment, Caixin Capital e Fuju Capital. Esta é a segunda vez que a HiDream.ai conclui uma ronda de financiamento no espaço de meio mês, após ter concluído uma ronda de financiamento superior a 500 milhões de yuans em meados de abril.

O HiDream-O1-Image-Pro é o principal produto de código fechado da HiDream.ai na via da arquitetura multimodal nativa. Distinguindo-se do paradigma tradicional de codificação fragmentada com múltiplos módulos, este modelo integra pixels de imagem brutos, tokens de texto discretos e condições de tarefa num espaço de tokens contínuo e partilhado, alcançando uma fusão profunda de imagem, texto e condições multitarefa ao nível da representação subjacente. Este design de arquitetura permite-lhe atingir o estado da arte (SOTA) em tarefas-chave como geração genérica de texto-para-imagem, renderização de texto de alta fidelidade, geração de cenas diversificadas e edição de imagem. Anteriormente, a versão de código aberto HiDream-O1-Image, com 8 mil milhões de parâmetros e utilizando a mesma arquitetura, alcançou o primeiro lugar global entre modelos de código aberto na tabela de classificação de texto-para-imagem da plataforma de avaliação independente global Artificial Analysis, superando modelos de código aberto convencionais como Z-Image Turbo, Qwen-Image e FLUX.2 dev, e tornando-se a versão de modelo com o menor número de parâmetros públicos entre os 20 primeiros classificados dessa tabela.

Mei Tao, Fundador e CEO da HiDream.ai, afirmou durante o Open Day que a escolha da empresa pelo caminho multimodal nativo decorre de uma visão de longo prazo sobre a combinação da geração visual com o mundo físico: "Atualmente, muitos 'grandes modelos multimodais' são, na sua essência, 'justaposições unimodais'. O multimodal nativo, pelo contrário, grava as 'regras do mundo' no modelo desde o início – ele conhece as leis da física, as relações espaciais, a lógica causal, por isso pode verdadeiramente compreender o mundo, raciocinar sobre o mundo e reconstruir o mundo, em vez de apenas 'gerar conteúdo'." Mei Tao acredita que o multimodal nativo é o caminho necessário para alcançar a AGI.

A HiDream.ai foi fundada em março de 2023 pelo Dr. Mei Tao, Académico Estrangeiro da Academia Canadiana de Engenharia e antigo Vice-Presidente do Grupo JD.com. Mais de 90% dos membros da sua equipa de tecnologias-chave possuem doutoramento ou mestrado. A empresa construiu uma arquitetura de negócio "1+1+3": o modelo fundacional da série HiDream, a plataforma de serviços empresariais HiHarness, e três aplicações de agentes inteligentes que cobrem marketing comercial (HiBurst, Fornecedor Oficial Top 5 do TikTok), criação cinematográfica e televisiva ("Frame Praise", com mais de 5000 minutos de curtas-metragens e banda desenhada produzidos) e criação para redes sociais (vivago, com uma base de utilizadores superior a 40 milhões).

No evento do Open Day, a HiDream.ai assinou acordos de cooperação estratégica com o Fundo Shanghai Film New Vision, BlueFocus, Jetsen Century e Beier Health, promovendo a implementação do grande modelo multimodal nativo em áreas como cinema e televisão, marketing e saúde. O HiDream-O1-Image-Pro lançado é uma versão de código fechado, e a sua escala de mais de 200 mil milhões de parâmetros valida plenamente a enorme escalabilidade do paradigma da arquitetura multimodal nativa. A empresa está a acelerar o seu avanço em direção à modelação unificada de múltiplas modalidades, incluindo imagem, vídeo, texto e áudio.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com
Recomendações
Google dos EUA e Samsung da Coreia do Sul unem-se à Warby Parker e Gentle Monster para lançar óculos de áudio com IA, com estreia global no outono
2026-05-20
A SMIC, Hua Hong Group e outras empresas chinesas unem-se para estabelecer o Centro Internacional da Cadeia de Abastecimento de Materiais Eletrónicos de Xangai, com um capital registado de 200 milhões de yuans
2026-05-20
Espera-se que a capacidade de computação para inferência de IA dos cinco maiores provedores de serviços de nuvem da América do Norte cresça 122% ao ano, com aceleração da implantação de racks completos NVIDIA GB e Vera Rubin nos EUA
2026-05-20
TSMC da China anuncia que a taxa de rendimento da embalagem avançada CoWoS ultrapassa 98%, e produtos com tamanho de retículo de 5,5x já estão em produção em massa
2026-05-20
Meitu, da China, lidera rodada anjo de milhões de dólares na Chance AI, apostando no segmento de agentes inteligentes de visão nativos de câmera
2026-05-20
A HiDream.ai da China concluiu uma nova rodada de financiamento de centenas de milhões e lançou o modelo de imagem multimodal nativo de grande escala HiDream-O1-Image-Pro com mais de 200 bilhões de parâmetros
2026-05-20
Zhou Jian, fundador da UBTECH da China, anuncia a marca de robôs humanoides de consumo "UWORLD"
2026-05-20
A Qianxun Intelligent da China e a Dgua Robot estabelecem uma parceria estratégica, e o modelo de código aberto Spirit v1.5 conclui a adaptação profunda com o chip Sunrise S600
2026-05-20
Alibaba Pingtouge, da China, lança chip de IA Zhenwu M890 com desempenho até 3 vezes superior ao da geração anterior
2026-05-20
Alibaba da China lança o modelo carro-chefe Qwen Qwen3.7-Max
2026-05-20