De acordo com pt.wedoany.com-A primeira fábrica de tokens de Pequim — a Fábrica de Tokens Beijing Nº 1 — foi oficialmente instalada no Parque de Inovação e Indústria de Tecnologia da Informação da Zona de Desenvolvimento Econômico e Tecnológico de Pequim. Construída pela SoftPower Information Technology Co., Ltd., a primeira fase do projeto terá capacidade diária de produção de até 1,4 trilhão de tokens.
Token é a menor unidade de processamento de texto em IA, e a capacidade computacional determina a quantidade de tokens processados por segundo e o custo de uso. A fábrica é composta por diversos servidores e tem como objetivo transformar a capacidade computacional em um recurso público estável e acessível, atendendo à evolução dos grandes modelos de linguagem, desde diálogos simples até sistemas de execução contínua.
A Fábrica de Tokens Beijing Nº 1 foca em cenários de serviço de agentes inteligentes. Por meio de técnicas extremas de engenharia, ela maximiza o desempenho do hardware, integra algoritmos avançados de agendamento computacional e reutilização extrema de KV Cache. A fábrica garante disponibilidade de serviço igual ou superior a 99,9%, latência do primeiro caractere P90 inferior a 10 segundos com variação inferior a 20%, e taxa de acerto de cache igual ou superior a 90%. A operação é contínua 7×24 horas, com metade das tarefas respondendo em até 6 segundos, 90% das tarefas com tempo de resposta inferior a 10 segundos e variação controlada em até 20%.
A SoftPower também lançou globalmente o benchmark de desempenho da fábrica de tokens de código aberto, incluindo o framework de avaliação LoadGen 2.0. Esse benchmark é baseado em uma reestruturação profunda do MLPerf LoadGen, padrão da indústria, permitindo a transição de injeção estática concorrente para simulação dinâmica de comportamento, definindo e reproduzindo cenários caóticos reais em ambientes de teste. O benchmark utiliza um sistema de avaliação progressivo de três camadas (método de caracterização de carga caótica na camada inferior, três métodos de teste padrão na camada intermediária — potência nominal/negócio/precisão correta — e conjuntos de dados padrão voltados para diferentes áreas na camada superior) para avaliar e comparar a capacidade real de serviço de clusters computacionais. O LoadGen 2.0 é totalmente de código aberto.
Na próxima etapa, a Fábrica de Tokens Beijing Nº 1 se conectará a bases de energia verde em Zhangjiakou, Ulanqab e outras regiões, formando um cluster computacional integrado na região Pequim-Tianjin-Hebei, com meta de longo prazo de produção diária de 10 trilhões de tokens. Especialistas do setor avaliam que a implementação do projeto preenche a lacuna na oferta de capacidade computacional em larga escala e de alto nível no país, estabelecendo um padrão de referência para serviços e avaliação de capacidade computacional. Além disso, atrairá mais empresas upstream e downstream de IA, aprimorando continuamente a cadeia industrial de inteligência artificial da região.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









