De acordo com pt.wedoany.com-O governo sul-coreano anunciou recentemente que construirá um Banco de Dados Nacional de Manufatura (National Manufacturing Data Library) e digitalizará o conhecimento tácito de trabalhadores qualificados. No entanto, empresas de IA Física (Physical AI) apontam que é necessário considerar simultaneamente questões-chave como o método de coleta de dados brutos no chão de fábrica, os padrões de organização e os direitos de uso.

O sucesso ou fracasso da política de IA para manufatura depende, em última análise, da capacidade de estabelecer uma "estrutura de ciclo de dados". Se os dados de IA Física forem simplesmente armazenados em um repositório, será difícil aplicá-los no chão de fábrica. É necessário construir um sistema: coletar dados de movimentos dos trabalhadores e processos de fabricação, após limpeza e validação, utilizá-los para simulação e treinamento de modelos, e então realimentar os resultados empíricos dos robôs como dados. Portanto, a chave no futuro é como conectar o banco de dados de Manufatura AX (Manufacturing AX) liderado pelo governo com o sistema de utilização de dados necessário para a indústria de IA Física. Somente criando um ecossistema que vá desde a coleta de dados até o desenvolvimento de modelos, a aplicação de robôs no campo e o feedback empírico, o banco de dados de manufatura poderá se tornar uma infraestrutura pública para a indústria de IA Física, e não um mero repositório.
Na "Reunião Nacional de Relato dos Três Grandes Superprojetos para o Grande Salto da Coreia", realizada em 29 de junho no Salão de Recepções da Casa Azul (Cheong Wa Dae), o governo afirmou que promoverá a IA para manufatura e a IA Física como indústrias estratégicas nacionais. As medidas centrais incluem a construção do banco de dados nacional de manufatura, a digitalização do conhecimento tácito de trabalhadores qualificados e o desenvolvimento de um Modelo Fundacional de IA Física (Physical AI Foundation Model). Entre elas, o projeto de conversão do conhecimento tácito de trabalhadores qualificados em dados já recebeu uma alocação antecipada de 48 bilhões de won no orçamento suplementar de 2026.
Empresas de IA Física geralmente consideram que os dados são o principal gargalo atualmente. Embora as Unidades de Processamento Gráfico (GPU) e a infraestrutura de computação sejam importantes, para que os robôs operem efetivamente no chão de fábrica, é necessário primeiro obter dados brutos de alta qualidade que incluam movimentos dos trabalhadores e condições de processo. Diferentemente dos Grandes Modelos de Linguagem (LLM), a IA Física precisa lidar com questões do mundo real, como força, atrito, contato, falhas e segurança. Para que um robô pegue peças, aperte parafusos e transporte itens em uma fábrica, são necessários dados de movimento específicos para diferentes locais e setores.
Yeom Woon-seol, CEO da AIRobot, afirmou: "Para startups, as GPUs são importantes, mas o maior gargalo são os dados. Sem dados, não é possível criar modelos de movimento para robôs; sem modelos de movimento, os robôs não podem agir conforme as exigências do cliente." Ele acrescentou que isso, em última análise, dificulta a venda dos robôs.
O problema é que o trabalho no chão de fábrica varia conforme o setor. Os movimentos necessários em indústrias como siderurgia, autopeças, alimentos, logística e montagem podem parecer semelhantes, mas são diferentes. Por exemplo, apenas o processo de fabricação de pão inclui ações distintas como dividir a massa, moldá-la em papel manteiga e operar máquinas. É difícil para uma única empresa de robótica ou de dados de IA obter diretamente dados de movimento de todos os setores. Os métodos de coleta de dados também variam; alguns são baseados em visão, outros em estruturas mestre-escravo ou operação remota, o que pode facilmente gerar dados otimizados para uma mão robótica ou plataforma específica.
O CEO Yeom Woon-seol explicou: "Os dados obtidos com uma mão robótica específica são otimizados para ela; para que outra empresa os utilize, é necessário reanotá-los e reprocessá-los, o que equivale a fazer o trabalho duas vezes." Ele acredita que instalar câmeras nos trabalhadores para filmar os movimentos das mãos humanas em perspectiva de primeira pessoa (Egocêntrica) pode ser uma alternativa. Se vídeos dos movimentos das mãos de sapateiros, chefs e trabalhadores qualificados forem obtidos, várias empresas de robótica poderão reprocessá-los e utilizá-los de acordo com seus próprios robôs.
Jang Jun-hyun, vice-CEO da Tomorrow Robotics, enfatizou a importância dos padrões de dados. "Embora existam vários padrões de dados, eles ainda não foram unificados. Se empresas e instituições criarem dados em formatos diferentes, a compatibilidade mútua será difícil; portanto, são necessários padrões de dados que possam ser usados em comum." Ele explicou que dados em primeira pessoa às vezes são eficazes, mas podem ter custos elevados, enquanto para algumas tarefas, dados em terceira pessoa são suficientes. O ponto crucial é determinar em que unidade e formato combinar ângulo, comprimento, informações de juntas, informações de força, informações de vídeo e contexto de trabalho.
A Wirobotics acredita que o cerne está na qualidade e no design dos dados, não na quantidade. Um representante afirmou: "Os dados do chão de fábrica são muito úteis e indispensáveis para o desenvolvimento da IA Física. Mas o importante não é simplesmente coletar uma grande quantidade de dados, sim projetar cuidadosamente, desde o início, o tipo de dados a serem coletados, os padrões de coleta e o formato dos dados, com base no conteúdo do trabalho, padronizando-os em dados de alta qualidade e significativos."
A acessibilidade também é um problema. Se os dados estiverem concentrados em chãos de fábrica de grandes empresas ou em fábricas de dados, podem surgir problemas de segurança e propriedade intelectual, dificultando o acesso por startups e empresas especializadas em robótica. Um representante da Wirobotics destacou: "Os dados em instalações de manufatura de grandes empresas ou nas fábricas de dados que elas constroem podem ser de difícil acesso para startups ou empresas de robótica devido a questões de segurança e PI. O banco de dados nacional de manufatura deve ser substancialmente aberto às empresas especializadas em robótica." A Tomorrow Robotics também enfatizou a importância de uma estrutura de compartilhamento de dados. O vice-CEO Jang Jun-hyun disse: "Embora seja importante criar espaços ou instituições capazes de produzir grandes volumes de dados para gerar dados de alta qualidade, é ainda mais importante que esses dados possam ser usados em conjunto."
As lições de projetos anteriores de construção de dados para aprendizado de IA também são dignas de nota. O governo construiu dados de aprendizado em larga escala através do AI Hub, etc., mas a indústria sempre apontou que "mesmo com dados, é difícil para as empresas reais usá-los diretamente". Os dados de IA Física são mais complexos do que simples imagens ou textos, pois devem conter simultaneamente movimentos dos trabalhadores, valores de juntas dos robôs, informações de força/contato, ambiente de trabalho e casos de falha.
A indústria é geralmente positiva em relação ao objetivo do governo de "desenvolver um modelo fundacional de IA Física autônomo em 3 anos". Um representante da Wirobotics afirmou: "Acredito que seja possível desenvolver, em 3 anos, um modelo de IA Física de primeira geração com desempenho significativo em áreas específicas." Um representante da MindAI também disse: "Desenvolver um modelo fundacional de IA Física autônomo em 3 anos é totalmente possível; veremos resultados a partir deste ano." O vice-CEO Jang Jun-hyun, sob a perspectiva da IA Soberana (Sovereign AI), destacou: "O modelo fundacional de robôs equivale ao cérebro de um robô humanoide. O cérebro de robôs humanoides que trabalham em fábricas na Coreia não pode usar apenas modelos chineses ou americanos. Se usarmos 'cérebros' estrangeiros, os dados atuais do processo podem vazar."
A recente controvérsia sobre as restrições de acesso ao Mythos5 e Fable5 da Anthropic intensificou essa conscientização. O governo dos EUA restringiu o acesso a modelos avançados de IA com base em segurança nacional e controle de exportações, embora tenha havido uma flexibilização posterior, isso ainda demonstra o risco de dependência de modelos de ponta estrangeiros. Em áreas onde fluem dados centrais, como manufatura, defesa, segurança e setor público, a soberania dos modelos de IA deixou de ser apenas um slogan para a autossuficiência tecnológica. O CEO da AIRobot, Yeom Woon-seol, também concordou com a necessidade de um modelo fundacional autônomo, afirmando: "Mesmo para quebrar a posição de ecossistema monopolista, é absolutamente necessário ter um modelo fundacional autônomo."









