A Kingsoft Cloud da China planeja acelerar a construção de clusters de poder computacional GPU no segundo semestre para atender à demanda de modelos de grande escala da Xiaomi e Alibaba_Boletins

A Kingsoft Cloud da China planeja acelerar a construção de clusters de poder computacional GPU no segundo semestre para atender à demanda de modelos de grande escala da Xiaomi e Alibaba

2026-07-02 18:01

Favoritos

De acordo com pt.wedoany.com-Em 2 de julho, a Kingsoft Cloud da China acelerará a construção de clusters de poder computacional GPU no segundo semestre para atender à crescente demanda de poder computacional de IA de seus principais clientes. A demanda vem principalmente das equipes de modelos de grande escala da Xiaomi Group e da Alibaba, na China. A demanda de poder computacional GPU da Xiaomi para a Kingsoft Cloud já foi atualizada de um cluster de dez mil placas para um cluster de poder computacional de escala ultra-grande, com o orçamento de investimento relacionado aumentando de quase 4 bilhões de yuans iniciais para mais de 10 bilhões de yuans.

O núcleo desta expansão é a capacidade de entrega de clusters GPU em grande escala. O treinamento e a inferência de modelos de IA de grande escala exigem altos padrões em número de servidores, interconexão GPU, throughput de armazenamento, largura de banda de rede, fornecimento de energia, dissipação de calor e agendamento de clusters. A simples compra de servidores GPU não forma diretamente poder computacional utilizável. Os provedores de nuvem precisam concluir a implantação geral de recursos de sala de servidores, servidores de oito placas, rede de comutação, armazenamento distribuído, agendamento de contêineres, plataforma de treinamento, monitoramento de falhas e sistema de operação e manutenção para transformar recursos de hardware em serviços de poder computacional de IA que os clientes possam invocar continuamente.

A equipe de modelos de grande escala da Alibaba já assinou um contrato de locação de poder computacional de 5 anos com a Kingsoft Cloud, envolvendo mais de 3.000 servidores GPU de oito placas. Com base no preço de aluguel mensal no momento da assinatura, o fluxo mensal após a entrega total é de cerca de 300 milhões de yuans, com uma receita anualizada superior a 4 bilhões de yuans. Para os provedores de nuvem, contratos de locação de longo prazo como este não apenas aumentam os pedidos de receita, mas também melhoram a certeza da construção de clusters de poder computacional. Os clusters GPU exigem alto investimento inicial e longos ciclos de construção; se a demanda do cliente for instável, pode facilmente levar à baixa utilização do equipamento. Contratos de longo prazo permitem um planejamento mais claro do ritmo de construção, compra de servidores, implantação de racks e alocação de recursos de operação e manutenção.

A atualização da demanda da Xiaomi reflete que o consumo de poder computacional em modelos de grande escala, smartphones, automóveis e cenários AIoT está se expandindo. A demanda de IA da Xiaomi não vem apenas do treinamento de um único modelo, mas também pode envolver IA no lado do dispositivo de smartphones, cockpits inteligentes de automóveis, processamento de dados de direção autônoma, interação por voz, algoritmos de imagem, coordenação de dispositivos IoT e plataformas de pesquisa e desenvolvimento internas da empresa. A atualização de um cluster de dez mil placas para um cluster de poder computacional de escala ultra-grande significa que as tarefas de treinamento, ajuste fino, inferência e processamento de dados estão se transformando de demandas baseadas em projetos para demandas de infraestrutura de longo prazo.

A Kingsoft Cloud já realizou várias rodadas de atualizações em computação inteligente em nuvem e plataformas de IA. Sua plataforma de computação inteligente "Kingsoft Cloud Xingliu" foi atualizada de uma plataforma de gerenciamento de recursos para uma plataforma completa de treinamento e inferência de IA, cobrindo agendamento de recursos heterogêneos, gerenciamento de tarefas de treinamento, serviços de inferência e APIs de modelo. Para clientes de modelos de grande escala, a GPU subjacente é apenas o básico; o que realmente afeta a eficiência de uso é se os recursos podem ser alocados rapidamente, se as tarefas podem ser executadas de forma estável, se as falhas podem ser tratadas automaticamente e se os processos de treinamento e inferência podem ser conectados.

A construção de clusters de poder computacional GPU também impulsionará a demanda por uma série de equipamentos de comunicação e data center. Mais de 3.000 servidores GPU de oito placas correspondem a um grande número de conexões de rede de alta velocidade, switches, módulos ópticos, placas de rede, dispositivos de armazenamento, racks, sistemas de fornecimento e distribuição de energia e sistemas de resfriamento líquido ou a ar. Quanto maior a escala de poder computacional, mais importante é a arquitetura de rede; o treinamento de modelos de grande escala requer coordenação multi-máquina e multi-placa. Se a latência da rede e a largura de banda forem insuficientes, a utilização da GPU será reduzida, afetando, em última análise, a eficiência real de treinamento do cliente.

A tarefa de expansão da Kingsoft Cloud no segundo semestre recairá sobre o ritmo de entrega. O orçamento de dezenas de bilhões de yuans da Xiaomi corresponde a um pool de poder computacional de longo prazo em maior escala, enquanto o contrato de 5 anos da Alibaba corresponde a um cluster de servidores com produção claramente programável. Para os provedores de nuvem, o próximo passo é conectar a chegada dos servidores GPU, a instalação na sala de servidores, a depuração da rede, a integração da plataforma e a aceitação do cliente. Somente quando o cluster de poder computacional for entregue de forma estável, ele poderá ser verdadeiramente transformado em receita de treinamento, inferência e serviços em nuvem.

China

Informação e Comunicação Engenharia de inteligência artificial

Este boletim é uma compilação e reprodução de informações de parceiros estratégicos e da internet global, destinado apenas para troca de informações entre leitores. Em caso de infração ou outros problemas, por favor, informe-nos imediatamente, e este site fará as devidas modificações ou exclusões. A reprodução deste artigo é estritamente proibida sem autorização formal. E-mail: news@wedoany.com

Anterior：Telia Lituânia atualizará 500 estações base para expandir cobertura 5G

Próximo：Radius, do Reino Unido, concede aos clientes acesso à rede de carregamento de veículos elétricos pesados Milence em toda a Europa