De acordo com pt.wedoany.com-A empresa de internet chinesa ByteDance está em negociações com a Shanghai Tianshu Zhixin, uma empresa de chips inteligentes de inteligência artificial, para adquirir pelo menos 50 mil chips de inferência de IA, destinados principalmente a cargas de trabalho de inferência de grandes modelos. Os produtos atualmente em discussão correspondem à série de GPUs de inferência em nuvem "Zhikai" da Tianshu Zhixin, enquanto o cenário de treinamento corresponde principalmente à sua série "Tiange". Se o negócio for concluído, a Tianshu Zhixin se tornará um dos importantes fornecedores domésticos de GPU da ByteDance, depois da Huawei e da Cambricon.
Esta potencial aquisição aponta para novos avanços na construção de data centers e na estratégia de capacidade de computação doméstica da ByteDance. Em comparação com o treinamento de modelos, a etapa de inferência corresponde ao processo em que o grande modelo gera respostas a solicitações de usuários, lida com diálogos de múltiplas rodadas e conclui tarefas de geração de conteúdo, com alta frequência de chamadas e grande pressão de concorrência, sendo mais sensível à escala de fornecimento de chips e ao custo unitário. Com a expansão da base de usuários de produtos de IA como o Doubao, o fornecimento estável de chips de inferência está se tornando um elo crucial na infraestrutura de capacidade de computação das grandes empresas de internet.
A Tianshu Zhixin foi fundada em 2015, com sede em Xangai, e atua principalmente no ramo de GPUs de uso geral e chips de aceleração de IA. Sua linha de produtos já cobre treinamento, inferência e dispositivos de borda, onde a série "Tiange" é voltada para cenários de treinamento, a série "Zhikai" para cenários de inferência em nuvem e borda, e a série "Tongyang" para aplicações de borda, como robôs e terminais inteligentes. Se a ByteDance finalmente adotar a série "Zhikai", isso significará um avanço adicional na implantação em larga escala de chips de inferência nacionais em grandes plataformas de internet.
Do ponto de vista da cadeia de suprimentos, o aumento das compras de chips nacionais pela ByteDance não se trata apenas de complementar uma única fonte de fornecimento. A demanda por capacidade de computação para negócios de IA está mudando de tarefas de treinamento periódicas para serviços de inferência de longo prazo, alta frequência e baixa latência. As empresas precisam configurar simultaneamente recursos de chips de treinamento, chips de inferência, rede, armazenamento e data centers. Uma estratégia de múltiplos fornecedores ajuda a reduzir o impacto da volatilidade de uma única fonte de chips na continuidade dos negócios e também permite combinar soluções de hardware mais adequadas para diferentes modelos e cenários de negócios.
As grandes empresas de internet estão em uma corrida para construir fossos de capacidade de computação. No passado, os investimentos em capacidade de computação giravam mais em torno de servidores em nuvem e data centers de uso geral; agora, as aplicações de grandes modelos exigem que as empresas tenham maior capacidade de agendamento de chips de inferência de IA, capacidade de adaptação de modelos e capacidade de operação e manutenção de clusters. Quem conseguir suportar maior concorrência de inferência a um custo menor, terá um espaço de iteração de produto mais estável em chatbots, geração de vídeo, pesquisa e recomendação, publicidade e serviços empresariais inteligentes.
Os detalhes da transação ainda não foram finalizados, e a quantidade de compra, o ritmo de entrega, o cenário real de implantação e a escala de expansão subsequente ainda podem mudar. Para a Tianshu Zhixin, entrar na cadeia de suprimentos de capacidade de computação central da ByteDance será um marco importante em sua expansão de compras governamentais e clientes do setor para grandes clientes de internet; para a ByteDance, se a capacidade de computação doméstica pode operar de forma estável em cargas de trabalho de inferência reais afetará diretamente a estrutura de custos e a capacidade de serviço de seus produtos de IA.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









