A Rede Nacional de Supercomputação da China lança o serviço gratuito por tempo limitado de diálogo com o DeepSeek-V4, com milhões de tokens de contexto gratuitos_Boletins

A Rede Nacional de Supercomputação da China lança o serviço gratuito por tempo limitado de diálogo com o DeepSeek-V4, com milhões de tokens de contexto gratuitos

2026-04-27 16:10

Favoritos

De acordo com pt.wedoany.com-A plataforma da Rede Nacional de Supercomputação da China lançou oficialmente, em 26 de abril, o serviço gratuito por tempo limitado de diálogo com o DeepSeek-V4. Usuários empresariais, instituições de pesquisa e desenvolvedores individuais podem acessar a página Chat no site oficial da rede de supercomputação para experimentar gratuitamente o diálogo fluido em tempo real com o DeepSeek-V4, que suporta um contexto superlongo de milhões de tokens, sem a necessidade de implantar modelos por conta própria ou arcar com custos de poder computacional de inferência. A Rede Nacional de Supercomputação da China é uma plataforma nacional de serviços de poder computacional orientada pelo Ministério da Ciência e Tecnologia, já integrando dezenas de centros de supercomputação e centros de computação inteligente. Esta promoção gratuita por tempo limitado visa reduzir a barreira de uso de grandes modelos e acelerar a penetração da tecnologia de IA nos diversos setores.

O DeepSeek-V4 foi lançado e aberto pela DeepSeek em 24 de abril, com duas versões: V4-Pro, com um total de 1,6 trilhão de parâmetros, e V4-Flash, com um total de 284 bilhões de parâmetros. Ambos suportam nativamente um contexto de 1 milhão de tokens, adotam a arquitetura MoE (Modelo de Especialistas Mistos) e a tecnologia de atenção esparsa DSA (DSA Atenção Esparsa). O modelo alcançou resultados equivalentes ao GPT-5.4 na avaliação de raciocínio matemático AIME 2025 e no concurso de codificação LiveCodeBench, e na avaliação de conhecimento geral MMLU-Pro, apresentou uma melhoria de mais de 8 pontos percentuais em relação à geração anterior. Este é o primeiro grande modelo autodesenvolvido pela China a estar no mesmo patamar dos principais modelos fechados internacionais em termos de inteligência geral.

A plataforma da rede de supercomputação está equipada com um motor de aceleração de inferência dedicado para o DeepSeek-V4, que otimiza a compressão do Cache KV e a fusão de operadores para cenários de sequências longas de 1 milhão de tokens. Sob condições de contexto completo de 1 milhão de tokens, o atraso no primeiro token pode ser controlado em menos de 0,5 segundos, com uma taxa de geração token por token entre 60 e 80 tokens por segundo. A plataforma também oferece um SDK Python e interfaces API padronizadas. Os desenvolvedores podem integrar o DeepSeek-V4 em seus fluxos de trabalho existentes com algumas linhas de código, permitindo aplicações de contexto longo, como atendimento inteligente ao cliente, análise de documentos legais, revisão de artigos acadêmicos e continuação de romances longos.

Em termos de recursos de poder computacional, este serviço gratuito por tempo limitado conta com o apoio computacional conjunto do Centro Nacional de Supercomputação de Jinan, do Centro Nacional de Supercomputação de Shenzhen e do Centro Nacional de Supercomputação de Tianjin. As três instituições investiram no total mais de 2.000 GPUs especialmente dedicadas ao serviço de inferência do DeepSeek-V4. A primeira fase da promoção gratuita vai de 26 de abril a 26 de maio, e a plataforma ajustará dinamicamente a alocação de recursos conforme a demanda real de chamadas. Atualmente, a rede de supercomputação possui mais de 120.000 empresas usuárias registradas, cobrindo mais de 20 setores, como manufatura avançada, biomedicina, tecnologia financeira e novos materiais, e já realizou mais de 5 bilhões de tarefas de inferência de IA.

A rede de supercomputação também integrou simultaneamente o DeepSeek-V4 aos fluxos de chamada das ferramentas já existentes na plataforma. Os usuários podem, na mesma área de trabalho, testar o diálogo com o modelo e, em seguida, utilizar diretamente as ferramentas de ajuste fino, implantação quantizada e testes de estresse integradas à plataforma, realizando assim um ciclo completo, desde a seleção do modelo até a implementação da aplicação. A plataforma já disponibilizou 32 grandes modelos de código aberto, cobrindo diversas áreas como processamento de linguagem natural, visão computacional e computação científica. Todos os modelos suportam chamada com um clique e especificações de API unificadas. O vice-diretor do Departamento de Alta Tecnologia do Ministério da Ciência e Tecnologia da China, Wang Li, afirmou publicamente que a rede de supercomputação será construída como uma plataforma nacional de referência "Modelo como Serviço", acelerando a transformação e aplicação dos resultados da tecnologia de inteligência artificial através da reunião de poder computacional, modelos e ecossistema de desenvolvedores.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com