API DeepSeek-V4-Pro da China ajustada para 1/4 do preço original, estratégia de preços baixos de longo prazo reduz custos de chamada de modelos grandes_Boletins

API DeepSeek-V4-Pro da China ajustada para 1/4 do preço original, estratégia de preços baixos de longo prazo reduz custos de chamada de modelos grandes

2026-05-23 16:09

Favoritos

De acordo com pt.wedoany.com-Em 22 de maio, a página oficial de preços da DeepSeek mostrou que o preço da API do modelo DeepSeek-V4-Pro será oficialmente ajustado para 1/4 do preço original, após o término da promoção de 75% de desconto, às 23:59 do dia 31 de maio de 2026, horário de Pequim. Isso significa que o preço promocional temporário de 25% do valor original do modelo se tornará o novo preço oficial após o fim do período promocional.

Este ajuste altera diretamente a expectativa de custo para desenvolvedores que utilizam modelos de alta capacidade. O preço original do DeepSeek-V4-Pro era de 0,1 yuan/milhão de tokens para acerto de cache de entrada, 12 yuan/milhão de tokens para falha de cache de entrada e 24 yuan/milhão de tokens para saída; após o ajuste para 1/4 do preço original, os preços correspondentes são 0,025 yuan/milhão de tokens para acerto de cache de entrada, 3 yuan/milhão de tokens para falha de cache de entrada e 6 yuan/milhão de tokens para saída. A página de preços em inglês da DeepSeek mostra simultaneamente que o preço com desconto do DeepSeek-V4-Pro é de US$ 0,003625/milhão de tokens para entrada com acerto de cache, US$ 0,435/milhão de tokens para entrada com falha de cache e US$ 0,87/milhão de tokens para saída, sendo os preços antes do desconto de US$ 0,0145, US$ 1,74 e US$ 3,48, respectivamente.

O impacto deste ajuste de preço na indústria concentra-se no desenvolvimento de aplicações de IA, chamadas de agentes inteligentes e custos de substituição de modelos em nível empresarial. Se o preço da API for apenas uma promoção de curto prazo, geralmente é difícil para as equipas de desenvolvimento reestruturar os custos do produto a longo prazo com base nisso; com a redução oficial do preço, as empresas podem estimar de forma mais estável os custos de chamada ao implementar robôs de atendimento ao cliente, assistentes de código, perguntas e respostas em bases de conhecimento, análise de dados, fluxos de trabalho automatizados e sistemas multiagentes. Para cenários de chamada de alta frequência, o preço de saída e o preço de entrada com falha de cache são os principais componentes do custo. Ao fixar estes dois tipos de preço em 1/4 do valor original, o DeepSeek-V4-Pro reduzirá significativamente o custo unitário de raciocínio complexo, geração de texto longo, geração de código e orquestração de tarefas em várias rondas.

A página de preços do DeepSeek-V4-Pro também mostra que o comprimento do contexto do modelo é de 1M, o comprimento máximo de saída é de 384K, e suporta funcionalidades como Saída JSON, Chamadas de Ferramentas, Continuação de Prefixo de Diálogo e Preenchimento FIM; o limite de concorrência é de 500. Em comparação com o DeepSeek-V4-Flash, o V4-Pro é direcionado para tarefas de maior complexidade e tem um preço mais elevado, mas após a redução oficial para 1/4 do preço original, os desenvolvedores terão uma escolha estratificada mais clara entre "chamadas em lote de baixo custo" e "chamadas para tarefas complexas de alta capacidade".

A guerra de preços dos grandes modelos está a mudar de lançamentos pontuais para uma competição de capacidade operacional da plataforma. A redução do preço da API dos modelos impulsionará mais pequenos e médios desenvolvedores, fornecedores de software de setores verticais e equipas técnicas internas das empresas a tentar integrar grandes modelos nos sistemas de negócio existentes, mas o preço baixo por si só não substitui a estabilidade do modelo, capacidade de concorrência, processamento de contexto, chamadas de ferramentas, observabilidade e capacidades de segurança de dados. Para clientes empresariais, o preço da API é apenas uma parte do custo total de propriedade; a implementação real também deve considerar engenharia de prompts, estratégia de cache, frequência de chamada, repetição em caso de falha, registos de auditoria, controlo de permissões, integração de dados privados e segurança da camada de aplicação.

A DeepSeek já havia reduzido anteriormente o preço de acerto de cache de entrada em toda a sua gama de modelos. A página oficial de preços indica que o preço de acerto de cache de entrada para todos os modelos da gama foi reduzido para 1/10 do preço de lançamento, um ajuste de preço que entrou em vigor às 20:15 do dia 26 de abril de 2026, horário de Pequim. A redução do preço de acerto de cache é particularmente importante para contextos longos, prompts de sistema repetitivos, recuperação de bases de conhecimento e tarefas de agentes inteligentes, porque as aplicações empresariais frequentemente reintroduzem informações de contexto semelhantes, e o mecanismo de cache pode reduzir significativamente os custos de entrada repetitiva.

As variáveis subsequentes centram-se na experiência de uso real após o ajuste de preço, limites de concorrência, velocidade de migração dos desenvolvedores e estimativas de custos para aplicações empresariais. A página de preços da DeepSeek também alerta que os preços dos produtos podem sofrer alterações, a plataforma reserva-se o direito de modificar os preços e os utilizadores devem carregar saldo com base no uso real e consultar regularmente as informações de preços mais recentes. O que se pode confirmar nesta fase é que a API DeepSeek-V4-Pro será oficialmente ajustada para 1/4 do preço original após o fim do desconto de 75% em 31 de maio; isto não deve ser interpretado como acesso gratuito, concorrência ilimitada, ou aplicável simultaneamente a todos os carregamentos históricos e preços de plataformas de terceiros.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com

China

Este boletim é uma compilação e reprodução de informações de parceiros estratégicos e da internet global, destinado apenas para troca de informações entre leitores. Em caso de infração ou outros problemas, por favor, informe-nos imediatamente, e este site fará as devidas modificações ou exclusões. A reprodução deste artigo é estritamente proibida sem autorização formal. E-mail: news@wedoany.com

Anterior：Quase cem equipamentos de mineração da Lovol Heavy Industry da China são entregues em uma zona mineira do noroeste

Próximo：Tecnalia, da Espanha, concluiu 4.759 projetos de P&D e inovação em 2025, com receita de 156 milhões de euros