De acordo com pt.wedoany.com-Com o foco do mercado de infraestrutura de IA migrando do treinamento em larga escala para o setor de inferência, as empresas coreanas de semicondutores de IA estão acelerando sua expansão com arquiteturas exclusivas e casos práticos, buscando encontrar pontos fracos da NVIDIA no mercado global de infraestrutura de próxima geração.
As principais empresas que lideram o segmento de semicondutores de IA na Coreia incluem Rebellions, Mobilint e HyperAccel, cada uma competindo com base em diferentes mercados-alvo e abordagens tecnológicas. A Rebellions estabeleceu uma posição independente por meio da produção em massa de chips de alto desempenho e comercialização em larga escala. Seu principal produto de próxima geração, 'REBEL100', utiliza uma arquitetura avançada de Chiplet que conecta quatro chips e é equipado com memória HBM3E de quinta geração, alcançando desempenho computacional de alto nível comparável às GPUs emblemáticas atuais, garantindo excelente eficiência energética. A Rebellions já aplicou sua NPU no serviço de resumo de chamadas 'A.' da SK Telecom, que gera até 50 milhões de chamadas de API por dia. Atualmente, com uma média mensal de 20 milhões e diária de 700 mil chamadas de inferência, a NPU da Rebellions substituiu as GPUs existentes e opera de forma estável. Além disso, seu produto é utilizado no serviço de diagnóstico auxiliar de IA para animais de estimação 'Excalibur', usado em mais de 1.000 hospitais veterinários em todo o país.

A Mobilint tem como alvo o mercado de inferência, desde data centers até dispositivos finais, projetando NPUs de alto desempenho e baixo consumo. Seu produto representativo, 'ARIES', oferece desempenho computacional de até 80 TOPS com consumo de apenas cerca de 25W. A Mobilint opera uma plataforma de consultoria de IA baseada em NPU em parceria com a empresa de contact centers de IA MetaM, colabora com empresas de IA industrial como a POSCO DX na construção e validação técnica de infraestrutura de IA personalizada para ambientes de manufatura, e já forneceu a IA independente 'MLX-A1' para a Universidade Yonsei. Recentemente, a Mobilint concluiu com sucesso o 'Projeto de Demonstração e Difusão de Serviços de IA em Dispositivos de Borda' apoiado pelo Ministério da Ciência e TIC da Coreia (MSIT), instalando suas NPUs 'ARIES' e 'REGULUS' em câmeras de prevenção de incêndios florestais e drones, construindo uma infraestrutura de controle de desastres capaz de detectar incêndios em tempo real e prever rotas de propagação por meio de mapas 3D. A Mobilint planeja lançar no segundo semestre deste ano o primeiro SoC de IA independente entre as empresas coreanas de NPU, o 'REGULUS'.
A HyperAccel, desde sua criação, projetou a 'LPU (Unidade de Processamento LLM)' especificamente para cargas de trabalho de inferência de IA generativa e LLM, utilizando memória LPDDR5x relativamente barata e de baixo consumo, maximizando a utilização da largura de banda e obtendo economia em latência, eficiência energética e TCO. A HyperAccel, começando com o servidor 'Orion', avança em um roteiro de produtos voltado para data centers e computação de borda, colaborando com a Naver Cloud para construir infraestrutura de inferência de IA otimizada para ambientes de data center e com a LG Electronics para aplicar tecnologia de inferência em diversos ambientes de dispositivos. Por meio de parcerias com gigantes globais como Samsung Electronics, SemiFive, Advantech, INVENTEC e HPE, a empresa está simultaneamente comprovando sua competitividade técnica e escalabilidade comercial.

As três empresas aproveitaram a mudança de foco da infraestrutura do treinamento para a inferência e os agentes de IA, projetando arquiteturas eficientes para cargas de trabalho de inferência, maximizando o valor do TCO. Para quebrar as barreiras de bloqueio de hardware e software centradas na NVIDIA, todas adotaram totalmente ecossistemas de código aberto, apoiando ativamente pilhas de software proprietárias ou SDKs, permitindo que desenvolvedores usem diretamente frameworks como PyTorch, Hugging Face, vLLM e Triton, sem necessidade de portabilidade complexa ou modificações de código. As três empresas estão focadas em acumular casos de referência práticos e estabelecer alianças globais, começando a expansão global com base em casos acumulados no mercado interno, como serviços de resumo de chamadas em larga escala, consultoria de IA e desenvolvimento conjunto com a Naver Cloud.
Com o foco do mercado de infraestrutura de IA migrando para o setor de inferência, os serviços de NPU em nuvem (NPUaaS) nacionais, que combinam custo-benefício e soberania tecnológica, estão ganhando atenção. Mais de 55% dos gastos globais com infraestrutura de IA estão concentrados em inferência, e 80% a 90% dos custos do ciclo de vida total vêm de custos de inferência, aumentando a demanda por alternativas às GPUs de alto custo. A Gabia lançou oficialmente em abril deste ano o NPUaaS equipado com o 'ATOM-Max' da Rebellions, que, na competição global de avaliação de desempenho de IA 'MLPerf', alcançou velocidade de processamento 1,5 a 3 vezes maior que GPUs equivalentes e eficiência energética 3 a 4,5 vezes maior. A KT Cloud lançou oficialmente o produto 'Servidor NPU' em conformidade com regulamentações de segurança para instituições públicas e provedores de soluções de agentes de IA públicos, já garantindo cerca de 300 aceleradores NPU em operação, e planeja adicionar mais após a produção em massa do chip de próxima geração da Rebellions, 'REBEL100', no terceiro trimestre deste ano. A Samsung SDS planeja lançar o NPUaaS baseado na NPU de segunda geração 'RNGD' da FuriosaAI, integrando diretamente o servidor RNGD à camada de virtualização da plataforma de nuvem Samsung (SCP) por meio de tecnologia de virtualização de hardware.
Os CSPs concordam que a infraestrutura de IA do futuro entrará em um ambiente de computação heterogênea com uma mistura de GPUs, NPUs e TPUs, e a 'nuvem soberana', que visa manter a soberania dos dados, também representa um sinal positivo para as NPUs nacionais. Para que as NPUs garantam uma experiência de desenvolvedor equivalente ao 'CUDA' da NVIDIA, o atual projeto K-Cloud do governo apoia a cooperação entre investimentos em software de fabricantes de semicondutores. Especialistas do setor enfatizam que o papel dos CSPs, como transmissores finais que concretizam o valor tecnológico dos semicondutores nacionais de IA no campo, está mudando para integrar design de serviços, consultoria de otimização de inferência, automação de plataforma e monitoramento de segurança.









