OpenAI e Broadcom lançam chip de inferência para LLM, Jalapeño
2026-06-25 08:55
Favoritos

De acordo com pt.wedoany.com-Em 24 de junho, a OpenAI, dos Estados Unidos, e a Broadcom, também americana, lançaram conjuntamente o primeiro processador inteligente, o Jalapeño. Este chip é projetado especificamente para inferência de modelos de linguagem de grande escala (LLM), sendo o primeiro acelerador de IA de uma plataforma de computação multigeracional desenvolvida em parceria. O objetivo é aumentar a velocidade, confiabilidade e acessibilidade dos serviços de IA, além de levar capacidades avançadas de IA para cenários de implantação em maior escala com maior eficiência. A OpenAI afirma que o Jalapeño é seu primeiro Processador Inteligente, com arquitetura voltada para as futuras necessidades de inferência de LLM.

O Jalapeño não é uma adaptação de um acelerador de IA genérico para um chip de inferência, mas sim um redesign centrado nos modelos, kernels, sistemas de serviço e requisitos de produto que a OpenAI opera diariamente. Em seu comunicado, a OpenAI mencionou que o chip é voltado para as características operacionais do ChatGPT, Codex, API e futuros produtos de agentes, otimizando principalmente a eficiência computacional, acesso à memória, conexão de rede e escalonamento na inferência de grandes modelos. Para serviços de LLM, a etapa de inferência impacta diretamente o tempo de espera do usuário, a estabilidade da resposta do sistema e o custo unitário de computação. Se a arquitetura do chip puder reduzir a movimentação de dados e aumentar a utilização do hardware, será possível obter maior eficiência em serviços de grande escala.

A OpenAI informou que amostras de engenharia do Jalapeño já estão executando cargas de trabalho de aprendizado de máquina em laboratório, na frequência e potência alvo, incluindo o GPT-5.3-Codex-Spark. A empresa ainda não divulgou os resultados finais dos testes de desempenho, mas testes iniciais indicam que o desempenho por watt do Jalapeño será significativamente superior ao estado da arte atual. A OpenAI também afirmou que publicará posteriormente um relatório técnico mais detalhado, explicando melhor o desempenho do chip em inferência, eficiência energética e implantação em sistemas.

O ciclo de desenvolvimento deste chip foi comprimido para 9 meses. A OpenAI afirma que o Jalapeño, desde o design inicial até a fabricação e tape-out, foi realizado em conjunto por ambas as empresas, utilizando modelos da OpenAI para acelerar parte do design e otimização. O design de chips geralmente envolve múltiplas etapas, como definição de arquitetura, verificação, implementação física, adaptação de software e preparação para fabricação, com ciclos longos e alto risco. Este projeto introduziu a capacidade de modelos no processo de design de chips, refletindo como as ferramentas de IA estão entrando na própria pesquisa e desenvolvimento de semicondutores. A Broadcom é responsável pela implementação do silício e suporte técnico de rede, e suas tecnologias, como o chip de rede Tomahawk, participarão da produção em escala da plataforma.

A OpenAI também está inserindo o Jalapeño em sua estratégia de infraestrutura full-stack de longo prazo. A empresa, antes vista principalmente como desenvolvedora de modelos e produtos de IA, agora, com o lançamento de seu próprio processador inteligente, está expandindo suas capacidades para arquitetura de chips, sistemas de memória, rede, escalonamento e sistemas de implantação. Greg Brockman, presidente e cofundador da OpenAI, afirmou que o Jalapeño faz parte da estratégia de infraestrutura full-stack de longo prazo da empresa, com o objetivo de tornar os recursos computacionais mais abundantes e a IA mais rápida, confiável e acessível.

De acordo com o planejamento de ambas as empresas, o Jalapeño será o primeiro passo de uma plataforma de computação multigeracional, com implantação inicial prevista para começar até o final de 2026 e continuar se expandindo nos próximos anos. A plataforma combinará os aceleradores projetados pela OpenAI, a implementação de silício, rede e tecnologias de conexão da Broadcom, e as capacidades de placas, racks e integração de sistemas da Celestica, do Canadá. Hock Tan, presidente e CEO da Broadcom, afirmou que a parceria apoiará a implantação de data centers de nível gigawatt em colaboração com a Microsoft e outros parceiros.

Para a OpenAI, o significado do chip de inferência reside em trazer o custo dos serviços de grandes modelos e a velocidade de resposta para um maior controle interno. O treinamento determina o limite superior da capacidade do modelo, enquanto a inferência determina se o modelo pode alcançar os usuários de forma estável e com baixo custo. Com o aumento das chamadas para ChatGPT, Codex, API e produtos de agentes, a infraestrutura de inferência precisa lidar simultaneamente com questões de throughput, latência, consumo de energia e confiabilidade. Se o Jalapeño atingir as expectativas em implantações futuras, fornecerá uma nova base de hardware para a OpenAI reduzir os custos dos serviços de IA e melhorar a estabilidade do acesso aos modelos.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com