NVIDIA e BAAI impulsionam modelos mundiais, competição por bases de dados se intensifica
2026-07-04 14:53
Favoritos

De acordo com pt.wedoany.com-A NVIDIA e o Instituto de Pesquisa de Inteligência Artificial de Pequim (BAAI) sinalizaram recentemente, de forma sincronizada: a IA está passando do mundo digital para o mundo físico, com dados, modelos mundiais e simulação se tornando os elementos centrais que impulsionam esse processo. O CEO da NVIDIA, Jensen Huang, na assembleia geral anual de acionistas em 25 de junho de 2026, destacou que os data centers de IA são fábricas que "produzem tokens", onde cada token pode ser convertido em código, respostas, designs, ações e serviços. Os clientes não compram apenas servidores, mas fábricas de IA capazes de gerar receita. Ele enfatizou que a IA física é a próxima onda de crescimento, e robôs, carros e fábricas se tornarão agentes inteligentes no mundo real. A NVIDIA treinará modelos por meio de fábricas de IA, simulará com o Omniverse e, em seguida, implantará em dispositivos físicos por meio de plataformas como o Jetson. Quase simultaneamente, o BAAI listou os modelos mundiais como uma direção consensual importante para alcançar a Inteligência Artificial Geral (AGI), propondo uma mudança de "prever a próxima palavra" para "prever o próximo estado do mundo".

O núcleo dos modelos mundiais é permitir que a IA perceba, compreenda e raciocine sobre o tempo, o espaço e as leis físicas do mundo real, abrangendo dados multimodais completos e possuindo capacidade de interação ativa. A professora de Stanford, Fei-Fei Li, aponta que a inteligência espacial é a capacidade das máquinas de perceber, raciocinar e agir em espaços 3D e no tempo. Sua empresa, World Labs, concluiu recentemente uma rodada de financiamento de US$ 1 bilhão, com uma avaliação de US$ 5 bilhões. Fei-Fei Li avalia: grandes modelos ensinam as máquinas a ler e escrever, enquanto a inteligência espacial as ensina a observar e construir.

O cenário global de modelos mundiais está se tornando rapidamente concorrido, abrangendo desde direção autônoma ao ar livre, espaços urbanos externos até cenários internos. No campo da direção autônoma, a Momenta lançou o modelo mundial R7 em produção em massa em abril de 2026, apoiando-se em mais de 12 bilhões de quilômetros de dados reais de direção para permitir que o sistema antecipe o mundo; a Li Auto lançou o MindVLA-o1, definindo a direção autônoma como o ponto de partida da IA física. Em cenários internos e domésticos, a Ezviz lançou seu próprio "Modelo Mundial Ezviz Xingchen", onde seu aspirador robô com IA constrói mapas semânticos 3D da casa, antecipando os movimentos de animais de estimação e pedestres; a Daxiao Robotics, em colaboração com a Universidade Chinesa de Hong Kong (CUHK), lançou o Kairos-HomeWorld, o primeiro modelo mundial do mundo capaz de gerar casas inteiras e interagir com todos os objetos, disponibilizando simultaneamente um conjunto de dados de código aberto com 300.000 plantas baixas reais de residências chinesas e 5.000 cenários simulados. No campo da construção e BIM, a gigante global de software de design Autodesk fez um investimento estratégico na World Labs, impulsionando a IA física de "entender dados" para "entender edifícios"; a equipe de Fei-Fei Li lançou a tecnologia World Tracing em junho de 2026, capaz de recuperar a geometria 3D completa a partir de uma única foto de um edifício. No campo externo e de espaços urbanos, a Amap lançou em junho de 2026 o primeiro modelo mundial urbano 3D nativo do mundo, ABot-Earth0.5, cobrindo mais de 190 países e regiões. Com uma imagem de satélite de entrada, leva apenas 10 minutos para gerar uma cena urbana 3D em escala quilométrica em uma GPU de consumo, a um custo de apenas um centésimo dos métodos tradicionais; a Baidu integrou capacidades de modelo mundial em seu modelo de linguagem grande ERNIE 5.0 e no sistema de direção autônoma Apollo; o Google DeepMind conectou 280 bilhões de imagens de street view cobrindo 110 países ao modelo mundial Genie, permitindo que os usuários gerem ambientes interativos baseados em locais reais. No campo da inteligência espacial interna, internacionalmente temos a Mappedin, a maior plataforma global de mapas internos, que usa IA e tecnologia LiDAR para converter plantas baixas de edifícios em mapas digitais 3D dinâmicos, já cobrindo mais de 10 bilhões de pés quadrados de espaço interno em 86 países; a NavVis, fornecedora alemã de soluções de inteligência espacial interna fundada em 2013, que atende empresas como Daimler e Huawei por meio de sistemas de varredura móvel e plataformas de gêmeos digitais; a VergeSense, que lançou o Large Spatial Model (LSM), baseado em dados comportamentais de escritórios coletados por oito anos em mais de 200 milhões de pés quadrados, para prever padrões de comportamento humano; e a Vestella Labs, uma empresa de inteligência espacial focada em IA física, cuja tecnologia central converte automaticamente informações espaciais não estruturadas (como imagens, PDFs, plantas CAD) em dados espaciais compreensíveis por IA. Domesticamente, temos a Shuwei Tech, que, por meio de crowdsourcing para coleta em campo e anotação técnica automatizada, estabeleceu um banco de dados de informações espaciais internas da China após uma década de atualizações contínuas, realizando anotações multimodais contínuas e ponto a ponto (visuais, textuais, impressões digitais sem fio, etc.) em espaços urbanos acessíveis a pedestres, como espaços internos complexos, gerando, em última análise, conjuntos de dados multimodais em larga escala.

Dados do setor mostram que o mercado chinês de IA incorporada foi de aproximadamente RMB 915 bilhões em 2025, com previsão de ultrapassar RMB 1.090,4 trilhões em 2026; o mercado global de navegação e posicionamento interno foi de US$ 16,9 bilhões em 2025, devendo atingir US$ 72,46 bilhões em 2032, com uma taxa de crescimento anual composta de 23,11%; o mercado global de BIM foi de aproximadamente US$ 9,5 bilhões em 2025, com previsão de atingir US$ 32,5 bilhões em 2036. Os principais players do setor já perceberam que a barreira final dos modelos mundiais está nos dados, não nos algoritmos. Noventa por cento da vida, trabalho e consumo humanos ocorrem em ambientes internos. Seja um robô incorporado entrando em uma casa, um eletrodoméstico inteligente entendendo o layout da residência ou uma empresa tomando decisões comerciais offline, a inteligência espacial interna é uma capacidade central inevitável. Esta é a parte mais valiosa e difícil de obter na base de dados dos modelos mundiais.

A competição por modelos mundiais é, essencialmente, uma competição por bases de dados, e o núcleo dessas bases são dados de espaços internos reais, de granulação fina e comercializáveis. Quando Jensen Huang anuncia que a IA física é a próxima onda de crescimento, quando a Amap reconstrói cidades 3D, a Momenta antecipa as condições do trânsito e a Ezviz permite que robôs "entendam" o lar, cada direção clama por dados espaciais reais, precisos e escaláveis. A IA está aprendendo a "imaginar" o mundo físico, e o que impede essa imaginação de se desviar da realidade, tornando os modelos mundiais verdadeiramente úteis, são os tijolos e argamassas, as pessoas e os lugares, as entradas e saídas do mundo real.

Este boletim é uma compilação e reprodução de informações de parceiros estratégicos e da internet global, destinado apenas para troca de informações entre leitores. Em caso de infração ou outros problemas, por favor, informe-nos imediatamente, e este site fará as devidas modificações ou exclusões. A reprodução deste artigo é estritamente proibida sem autorização formal. E-mail: news@wedoany.com
Produtos Relacionados