API DeepSeek-V4-Pro da China ajustada para 1/4 do preço original, estratégia de preços baixos de longo prazo reduz custos de chamada de modelos grandes
2026-05-23 16:09
Favoritos

De acordo com pt.wedoany.com-Em 22 de maio, a página oficial de preços da DeepSeek mostrou que o preço da API do modelo DeepSeek-V4-Pro será oficialmente ajustado para 1/4 do preço original, após o término da promoção de 75% de desconto, às 23:59 do dia 31 de maio de 2026, horário de Pequim. Isso significa que o preço promocional temporário de 25% do valor original do modelo se tornará o novo preço oficial após o fim do período promocional.

Este ajuste altera diretamente a expectativa de custo para desenvolvedores que utilizam modelos de alta capacidade. O preço original do DeepSeek-V4-Pro era de 0,1 yuan/milhão de tokens para acerto de cache de entrada, 12 yuan/milhão de tokens para falha de cache de entrada e 24 yuan/milhão de tokens para saída; após o ajuste para 1/4 do preço original, os preços correspondentes são 0,025 yuan/milhão de tokens para acerto de cache de entrada, 3 yuan/milhão de tokens para falha de cache de entrada e 6 yuan/milhão de tokens para saída. A página de preços em inglês da DeepSeek mostra simultaneamente que o preço com desconto do DeepSeek-V4-Pro é de US$ 0,003625/milhão de tokens para entrada com acerto de cache, US$ 0,435/milhão de tokens para entrada com falha de cache e US$ 0,87/milhão de tokens para saída, sendo os preços antes do desconto de US$ 0,0145, US$ 1,74 e US$ 3,48, respectivamente.

O impacto deste ajuste de preço na indústria concentra-se no desenvolvimento de aplicações de IA, chamadas de agentes inteligentes e custos de substituição de modelos em nível empresarial. Se o preço da API for apenas uma promoção de curto prazo, geralmente é difícil para as equipas de desenvolvimento reestruturar os custos do produto a longo prazo com base nisso; com a redução oficial do preço, as empresas podem estimar de forma mais estável os custos de chamada ao implementar robôs de atendimento ao cliente, assistentes de código, perguntas e respostas em bases de conhecimento, análise de dados, fluxos de trabalho automatizados e sistemas multiagentes. Para cenários de chamada de alta frequência, o preço de saída e o preço de entrada com falha de cache são os principais componentes do custo. Ao fixar estes dois tipos de preço em 1/4 do valor original, o DeepSeek-V4-Pro reduzirá significativamente o custo unitário de raciocínio complexo, geração de texto longo, geração de código e orquestração de tarefas em várias rondas.

A página de preços do DeepSeek-V4-Pro também mostra que o comprimento do contexto do modelo é de 1M, o comprimento máximo de saída é de 384K, e suporta funcionalidades como Saída JSON, Chamadas de Ferramentas, Continuação de Prefixo de Diálogo e Preenchimento FIM; o limite de concorrência é de 500. Em comparação com o DeepSeek-V4-Flash, o V4-Pro é direcionado para tarefas de maior complexidade e tem um preço mais elevado, mas após a redução oficial para 1/4 do preço original, os desenvolvedores terão uma escolha estratificada mais clara entre "chamadas em lote de baixo custo" e "chamadas para tarefas complexas de alta capacidade".

A guerra de preços dos grandes modelos está a mudar de lançamentos pontuais para uma competição de capacidade operacional da plataforma. A redução do preço da API dos modelos impulsionará mais pequenos e médios desenvolvedores, fornecedores de software de setores verticais e equipas técnicas internas das empresas a tentar integrar grandes modelos nos sistemas de negócio existentes, mas o preço baixo por si só não substitui a estabilidade do modelo, capacidade de concorrência, processamento de contexto, chamadas de ferramentas, observabilidade e capacidades de segurança de dados. Para clientes empresariais, o preço da API é apenas uma parte do custo total de propriedade; a implementação real também deve considerar engenharia de prompts, estratégia de cache, frequência de chamada, repetição em caso de falha, registos de auditoria, controlo de permissões, integração de dados privados e segurança da camada de aplicação.

A DeepSeek já havia reduzido anteriormente o preço de acerto de cache de entrada em toda a sua gama de modelos. A página oficial de preços indica que o preço de acerto de cache de entrada para todos os modelos da gama foi reduzido para 1/10 do preço de lançamento, um ajuste de preço que entrou em vigor às 20:15 do dia 26 de abril de 2026, horário de Pequim. A redução do preço de acerto de cache é particularmente importante para contextos longos, prompts de sistema repetitivos, recuperação de bases de conhecimento e tarefas de agentes inteligentes, porque as aplicações empresariais frequentemente reintroduzem informações de contexto semelhantes, e o mecanismo de cache pode reduzir significativamente os custos de entrada repetitiva.

As variáveis subsequentes centram-se na experiência de uso real após o ajuste de preço, limites de concorrência, velocidade de migração dos desenvolvedores e estimativas de custos para aplicações empresariais. A página de preços da DeepSeek também alerta que os preços dos produtos podem sofrer alterações, a plataforma reserva-se o direito de modificar os preços e os utilizadores devem carregar saldo com base no uso real e consultar regularmente as informações de preços mais recentes. O que se pode confirmar nesta fase é que a API DeepSeek-V4-Pro será oficialmente ajustada para 1/4 do preço original após o fim do desconto de 75% em 31 de maio; isto não deve ser interpretado como acesso gratuito, concorrência ilimitada, ou aplicável simultaneamente a todos os carregamentos históricos e preços de plataformas de terceiros.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com
Recomendações
A Westwell Technology da China apresenta o E-Truck S2 e o Q-Truck na TOC Europe na Alemanha, com plataforma de despacho de IA a entrar na logística verde portuária
2026-05-23
China avança na meta de pouso lunar tripulado antes de 2030, com a estação espacial a apoiar a exploração lunar em três frentes: talentos, tecnologia e sistema de transporte
2026-05-23
Setor de energia de Guizhou, na China, acelera integração com IA, Long Zugen propõe suprir deficiências em infraestrutura subterrânea e inspeção geral de segurança em minas
2026-05-23
MEXDC do México coloca a governança de IA na agenda dos data centers
2026-05-23
Administração Nacional de Dados da China impulsiona a ação "Elementos de Dados ×", com 43 cidades-piloto disponibilizando 38.000 produtos de dados
2026-05-23
EPB dos EUA e Universidade do Tennessee em Chattanooga estabelecem parceria quântica de 6,8 milhões de dólares; centro quântico municipal acelera comercialização de pesquisa
2026-05-23
Pesquisa do NLR dos EUA revela a origem da memória em materiais sinápticos optoeletrônicos de V₂O₅
2026-05-23
Aceleração do investimento em redes elétricas na China e inteligência artificial impulsionam a construção de resiliência climática
2026-05-23
Tecnalia, da Espanha, concluiu 4.759 projetos de P&D e inovação em 2025, com receita de 156 milhões de euros
2026-05-23
API DeepSeek-V4-Pro da China ajustada para 1/4 do preço original, estratégia de preços baixos de longo prazo reduz custos de chamada de modelos grandes
2026-05-23