De acordo com pt.wedoany.com-A empresa americana de chips de IA d-Matrix anunciou que sua plataforma de aceleração de inferência de inteligência artificial Corsair entrou em fase de produção total e começará a ser enviada em volume para clientes prioritários. A empresa, sediada em Santa Clara, Califórnia, EUA, está enviando produtos para provedores de serviços em nuvem de hiperescala, provedores de serviços Neocloud e laboratórios de IA de ponta, principalmente para cenários de inferência de IA em data centers.
O Corsair não é um chip de treinamento, com foco principal na inferência de grandes modelos.
Em aplicações de IA generativa, após a conclusão do treinamento do modelo, cada pergunta do usuário, interação por voz, geração de código e geração de conteúdo multimodal exigem que o backend realize cálculos de inferência. A d-Matrix afirma que o Corsair é voltado para tarefas de inferência de baixa latência, podendo formar sistemas de computação heterogêneos e desacoplados com GPUs, permitindo que diferentes unidades de computação assumam tarefas mais adequadas. A empresa considera esta produção total como um marco de entrega comercial, significando que o Corsair passa da validação com clientes iniciais para a fase de fornecimento em volume.
Para que as entregas possam aumentar em escala, a cadeia de suprimentos é um pré-requisito. A d-Matrix afirma que já garantiu contratos plurianuais de fornecimento e serviços de fabricação, e com base nisso, avançará com o envio dos produtos. A Alchip Technologies participou do design e suporte à produção em massa do Corsair, e sua administração afirma que as duas empresas colaboram desde a fase inicial de design do Corsair e continuarão a apoiar a escalabilidade da plataforma.
O portfólio de produtos da d-Matrix não se limita a uma única placa aceleradora. De acordo com a empresa, o Corsair pode ser combinado com o acelerador de E/S JetStream, a pilha de software Aviator e outros componentes para formar uma plataforma de inferência voltada para implantação em racks de data centers. As soluções de referência exibidas no site da empresa incluem vários servidores, várias placas aceleradoras e diferentes configurações de memória, com o objetivo de reduzir a sobrecarga de movimentação de dados na inferência de grandes modelos, melhorando a velocidade de resposta e o desempenho por unidade de consumo de energia.
Este marco de envio ocorre em um momento de mudança no foco da construção de infraestrutura de IA. Nos últimos dois anos, o investimento do mercado concentrou-se principalmente na expansão de clusters de treinamento e poder computacional de GPUs; com chatbots, aplicações de agentes, agentes de voz em tempo real e ferramentas de IA empresariais entrando em uso frequente, a latência, capacidade de concorrência e custo operacional do lado da inferência tornaram-se indicadores importantes nas compras dos clientes. Com o Corsair em produção total, a d-Matrix precisa agora demonstrar que sua plataforma pode operar de forma estável sob cargas de trabalho reais de data centers e ser compatível com servidores, redes, modelos e ecossistemas de software.
Os próximos marcos concentram-se na escala de implantação dos clientes, na validação de desempenho em nível de rack e no ritmo de fornecimento de longo prazo. Se o uso em volume pelos clientes prioritários progredir sem problemas, a d-Matrix garantirá uma posição de entrega mais definida na competição comercial de chips de inferência de IA nos EUA.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









