Anthropic, dos EUA, lança Sonnet 5 com preço 60% menor para impulsionar IPO
2026-07-01 10:46
Favoritos

De acordo com pt.wedoany.com-A Anthropic lançou o Claude Sonnet 5, oferecendo desempenho próximo ao flagship a um preço intermediário, visando atrair desenvolvedores empresariais preocupados com custos. A empresa acelera seus planos de abertura de capital (IPO), e este modelo ajudará a testar se a alta avaliação do mercado privado pode resistir ao escrutínio do mercado público. A Anthropic o descreve como "o modelo Sonnet mais capacitado para agência até hoje", que se tornará o modelo padrão para usuários dos planos Free e Pro, estando também disponível para clientes Max, Team e Enterprise. O preço introdutório da API é de US$ 2 por milhão de tokens de entrada e US$ 10 por milhão de tokens de saída, válido até 31 de agosto; após essa data, os preços sobem para US$ 3 e US$ 15, respectivamente, ainda muito abaixo dos preços do modelo topo de linha da Anthropic, o Opus 4.8: US$ 5 para entrada e US$ 25 para saída.

O Sonnet 5, em relação ao seu antecessor Sonnet 4.6, apresentou melhorias significativas em todas as avaliações divulgadas pela Anthropic. No benchmark de programação agente SWE-bench Pro, o Sonnet 5 obteve 63,2%, contra 58,1% do Sonnet 4.6, aproximando-se dos 69,2% do Opus 4.8. Na avaliação de programação Terminal-Bench 2.1, o Sonnet 5 marcou 80,4%, o Sonnet 4.6 67,0% e o Opus 4.8 82,7%. Em raciocínio multidisciplinar, medido pelo "Último Exame Humano", o Sonnet 5 sem uso de ferramentas obteve 43,2%, e com ferramentas, 57,4%, este último praticamente empatado com os 57,9% do Opus 4.8. Em tarefas de uso de computador avaliadas pelo OSWorld-Verified, o Sonnet 5 atingiu 81,2%, acima dos 78,5% anteriores. No benchmark de trabalho do conhecimento GDPval-AA v2, a pontuação foi de 1.618, superando os 1.615 do Opus 4.8 e os 1.395 do Sonnet 4.6.

Benchmarks do Sonnet 5

Esses dados de avaliação mostram que o Sonnet 5 entrou em uma faixa de desempenho que se sobrepõe substancialmente à do modelo flagship da Anthropic, com um custo por token cerca de 60% menor no preço padrão. A ênfase na capacidade de agência reflete a mudança do foco da indústria de IA para sistemas que executam fluxos de trabalho de múltiplas etapas de forma autônoma. Sualeh Asif, cofundador do parceiro de acesso antecipado Cursor, afirmou que o modelo consegue manter o plano e entregar alterações limpas de múltiplas etapas, sendo também econômico. Daniel Shepard, engenheiro sênior da Zapier, descreveu que, ao testar um trabalho de automação de duas partes, o modelo conseguiu concluir uma tarefa que anteriormente "travava no meio do caminho".

OSWorld-Verified Sonnet 5

O Sonnet 5 utiliza um tokenizador atualizado, semelhante às mudanças introduzidas no Opus 4.7, que altera a forma como o modelo processa o texto. A mesma entrada pode ser mapeada para aproximadamente 1,0 a 1,35 vezes o número de tokens, dependendo do tipo de conteúdo. A Anthropic afirma que o preço introdutório foi calibrado para tornar a transição "aproximadamente neutra em custos", mas clientes empresariais que executam cargas de trabalho intensivas devem avaliar cuidadosamente casos de uso específicos. A divulgação de segurança da Anthropic mostra que as taxas de alucinação e bajulação do Sonnet 5 são menores que as do Sonnet 4.6, ele rejeita melhor solicitações maliciosas e é mais resistente a ataques de injeção de prompt em ambientes agênticos. Em auditorias de comportamento automatizadas, a pontuação geral do Sonnet 5 foi inferior à do Sonnet 4.6. No entanto, em comparação com o Opus 4.8, mais capaz, e com o Claude Mythos Preview, o Sonnet 5 apresentou "taxas de comportamento desalinhado ligeiramente mais altas". Na avaliação de desenvolvimento de exploração do Firefox 147, ambos os modelos Sonnet não conseguiram desenvolver uma exploração eficaz, ambos com 0,0%, mas a taxa de sucesso parcial do Sonnet 5 foi de 13,2%, superior aos 8,8% do Sonnet 4.6, ambos ainda muito abaixo dos 68,8% do Opus 4.8 e dos 88,4% do Mythos 5. A Anthropic ativou por padrão as proteções de segurança cibernética no Sonnet 5, que são as mesmas do Opus 4.7 e 4.8, mas menos restritivas que as do Fable 5. As organizações que já aderiram ao programa de verificação de rede obtêm automaticamente as mesmas permissões.

Sonnet 5 - Firefox 147

O lançamento do Sonnet 5 ocorre em um momento crítico para a Anthropic. A empresa apresentou confidencialmente seu prospecto de IPO à Comissão de Valores Mobiliários dos EUA no início de junho, descrito pela CNBC como "a oferta pública mais aguardada na história da tecnologia". De acordo com o The Guardian, em fevereiro, a Anthropic levantou US$ 30 bilhões em uma avaliação de US$ 380 bilhões, com uma receita anualizada de US$ 14 bilhões e "crescendo mais de dez vezes ao ano nos últimos três anos". No final de maio, a Anthropic concluiu uma rodada de financiamento Série H de US$ 65 bilhões, co-liderada pela Altimeter Capital, Sequoia Capital e outros, com uma avaliação pós-money de US$ 965 bilhões e uma taxa de receita operacional superior a US$ 47 bilhões. O analista da PitchBook, Harrison Rolfes, disse à CNBC que o número-chave é a margem bruta, que observadores externos ainda não viram. Nesse contexto, o Sonnet 5 visa aumentar a capacidade a um preço competitivo, demonstrando que a empresa pode entregar produtos atraentes em diferentes faixas de preço para impulsionar a adoção em massa. O governador da Califórnia, Gavin Newsom, anunciou um desconto de 50% no Claude para todas as agências estaduais, além de treinamento gratuito da força de trabalho. Kate Jensen, chefe da Anthropic para as Américas, disse que a medida visa "colocar o Claude a serviço das pessoas que mantêm a Califórnia funcionando".

Comportamento desalinhado do Sonnet 5

A Anthropic está em um campo cada vez mais concorrido. A OpenAI (que levantou US$ 122 bilhões em março com uma avaliação de US$ 852 bilhões) também busca um IPO; a SpaceX, de Elon Musk, fundiu-se com a xAI e precificou seu IPO a US$ 135 por ação, com uma avaliação de US$ 1,77 trilhão; Google, Meta e startups de IA asiáticas estão todas disputando o mesmo mercado empresarial. Gil Luria, chefe de pesquisa de tecnologia do D.A. Davidson, disse à CNBC que, embora a Anthropic "pareça estar na liderança" entre os modelos de IA de ponta, "a maior parte do uso atual deles é para experimentação e testes, o que pode não ser sustentável". O Sonnet 5, oferecendo desempenho próximo ao Opus a um preço de Sonnet, visa diretamente o objetivo de converter o uso experimental em receita de produção. Três coisas determinarão seu significado: a confiabilidade do agente no mundo real, a economia do tokenizador e a própria narrativa do IPO. Quando o documento S-1 for tornado público, os investidores examinarão qual nível gera a maior parte da receita e do lucro bruto. O analista da PitchBook, Rolfes, disse à CNBC que a janela de IPO de 2026 "ou se tornará o ciclo de IPO mais importante desde a era da internet, ou a lição mais cara que o mercado público já viu entre narrativa e fundamentos".

Este boletim é uma compilação e reprodução de informações de parceiros estratégicos e da internet global, destinado apenas para troca de informações entre leitores. Em caso de infração ou outros problemas, por favor, informe-nos imediatamente, e este site fará as devidas modificações ou exclusões. A reprodução deste artigo é estritamente proibida sem autorização formal. E-mail: news@wedoany.com