Groq, dos EUA, conclui financiamento de US$ 650 milhões e visa expandir nuvem de inferência de IA para 200 megawatts
2026-06-24 08:47
Favoritos

De acordo com pt.wedoany.com-Em 22 de junho, horário local, a empresa americana de chips de inferência de IA Groq anunciou a conclusão de uma nova rodada de financiamento de crescimento de US$ 650 milhões. Esta rodada foi liderada pela Disruptive e Infinitum, com a participação contínua de alguns investidores existentes. Os recursos serão usados para acelerar a expansão da infraestrutura da nuvem de inferência de IA da Groq.

O foco atual dos negócios da Groq mudou para serviços de nuvem de inferência de IA em larga escala. A empresa opera atualmente 13 data centers na América do Norte, Europa, Oriente Médio e Ásia-Pacífico, atendendo a mais de 5 milhões de desenvolvedores e milhares de empresas nativas de IA, processando trilhões de tokens semanalmente. Os novos recursos serão usados para atualizar a infraestrutura existente dos data centers e implantar as mais recentes tecnologias de inferência da Groq, incluindo o sistema NVIDIA LPX.

De acordo com o planejamento da empresa, a Groq expandirá a capacidade total instalada de sua nuvem de inferência de IA para 200 megawatts até o final de 2027. Essa meta visa o rápido crescimento da demanda por poder computacional de inferência. Com a transição das aplicações de IA da fase de treinamento e validação experimental para a fase de implantação em produção, a demanda das empresas por poder computacional de inferência de baixa latência, alta concorrência e custo controlável está aumentando, e a nuvem de inferência está se tornando um componente importante da infraestrutura de IA, deixando de ser apenas um serviço auxiliar.

A base tecnológica central da Groq é a arquitetura do processador de inferência LPU, otimizada principalmente para tarefas de computação sequencial, como grandes modelos de linguagem. Diferentemente da fase de treinamento, os serviços de inferência enfatizam mais a operação contínua, a velocidade de resposta, o custo unitário, a estabilidade do serviço e a capacidade de escalonamento em larga escala. A expansão contínua da plataforma de nuvem pela Groq após este financiamento indica que seu foco comercial está mudando da mera demonstração de capacidade de chip para a oferta de serviços de nuvem de inferência sustentáveis.

A equipe de gestão também foi ajustada simultaneamente. Alan Rice ingressou na Groq como Diretor de Operações (COO), tendo anteriormente ocupado cargos relacionados a data centers na xAI e na Meta, com experiência em operações de infraestrutura em larga escala. Sinclair Schuller e Rakesh Malhotra assumirão, respectivamente, os cargos de Diretor de Tecnologia (CTO) e Diretor de Produto (CPO) a partir de julho, responsáveis por impulsionar a tecnologia da plataforma e o desenvolvimento de produtos de nível empresarial.

Este financiamento ocorre após a Groq ter firmado um acordo de licenciamento de tecnologia não exclusivo com a NVIDIA. A Groq afirmou que a próxima geração da plataforma LPX da NVIDIA já integra a tecnologia de inferência da Groq. Para a Groq, o licenciamento de tecnologia e a expansão dos negócios de nuvem avançam em paralelo, permitindo que a empresa não dependa mais apenas da venda de seus próprios chips, mas sustente o crescimento dos negócios com a plataforma de nuvem de inferência, o licenciamento de tecnologia e a capacidade de operação de data centers.

O mercado de poder computacional de IA está mudando de "quem consegue treinar modelos maiores" para "quem consegue operar modelos de forma estável a um custo menor". O treinamento determina o limite superior da capacidade do modelo, enquanto a inferência determina se a aplicação pode ser usada em escala. O investimento da Groq em data centers globais e na expansão da nuvem de inferência para 200 megawatts reflete que a competição por infraestrutura de IA está entrando em uma fase de operação contínua.

A pressão imediata sobre a Groq também é clara: a meta de 200 megawatts exige a sincronização de energia elétrica, espaço físico, refrigeração líquida, rede, fornecimento de chips e carga de clientes. Se a nuvem de inferência pode gerar receita de longo prazo depende não apenas da escala de poder computacional, mas também da competitividade de preços, do ecossistema de modelos, da fidelidade dos clientes empresariais e da estabilidade do serviço. Para as empresas de aplicação de IA, o que realmente importa não é o pico de poder computacional, mas a capacidade de inferência que pode ser acessada de forma estável, de baixo custo e a longo prazo.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com
Produtos Relacionados