De acordo com pt.wedoany.com-A empresa Etched exibiu recentemente um chip de inferência de IA pronto para operação e divulgou a assinatura de contratos com clientes no valor de mais de US$ 1 bilhão. A empresa arrecadou US$ 800 milhões em várias rodadas de financiamento anteriormente não divulgadas, sendo que a rodada mais recente foi concluída em dezembro de 2025, captando US$ 500 milhões com uma avaliação pós-investimento de US$ 5 bilhões. Os investidores incluem VentureTech Alliance, Peter Thiel, Jane Street, Hudson River Trading, Jump Trading, Two Sigma, Stripes, Ribbit Capital, Radical Ventures, Primary VC, Positive Sum, além de diversos pesquisadores e empreendedores renomados na área de IA. A Etched afirmou que seu chip obteve sucesso na primeira prototipagem (A0) no processo N4P da TSMC, e planeja começar a enviar o primeiro sistema de inferência em nível de rack neste verão.

Fundada há menos de três anos, a empresa dedica-se a construir uma infraestrutura de inferência de IA verticalmente integrada, abrangendo chips personalizados, racks, redes, refrigeração, software e fabricação. Seu sistema já está operando modelos de IA de nível produtivo, incluindo DeepSeek, Qwen, Mamba e Llama, e suporta desde arquiteturas densas até sistemas massivos de Mistura de Especialistas (MoE) com parâmetros arbitrariamente grandes. Para garantir a capacidade de fabricação, a Etched abriu uma fábrica em Taiwan, enquanto constrói um data center de 2 megawatts, salas de teste e um laboratório de prototipagem de introdução de novos produtos (NPI) em sua sede em San José, com o objetivo de alcançar implantações em escala de gigawatts a partir de 2027.
A Etched também divulgou duas tecnologias de arquitetura diferenciadas. A tecnologia de Inferência de Baixa Tensão (LVI) reduz a tensão da matriz de computação do chip para menos da metade da dos aceleradores de IA tradicionais, o que, segundo a empresa, permite uma utilização sustentada de mais de 80% dos FLOPs de pico em inferência esparsa de MoE com trilhões de parâmetros, sem ocorrência de throttling térmico. A arquitetura de Memória em Nível de Cluster (CSM) combina HBM com memória compartilhada de baixa latência conectada por interconexões proprietárias, visando manter alta taxa de transferência enquanto reduz a latência de inferência. De acordo com a Etched, testes iniciais com clientes já demonstraram taxa de transferência, latência e eficiência energética líderes em cargas de trabalho de inferência, e mais dados de desempenho devem ser divulgados no final deste verão.
Os principais marcos de desenvolvimento incluem: arrecadação total de US$ 800 milhões em várias rodadas de financiamento, com a última rodada em dezembro de 2025 captando US$ 500 milhões com avaliação de US$ 5 bilhões; assinatura de contratos com clientes no valor de mais de US$ 1 bilhão; sucesso na primeira prototipagem no processo N4P da TSMC; primeiros sistemas de inferência em nível de rack planejados para envio no verão de 2026; sistema atualmente capaz de executar modelos como DeepSeek, Qwen, Mamba e Llama; data center de 2 megawatts, instalações de teste e laboratório de prototipagem NPI já construídos em San José, com fábrica de engenharia e fabricação em Taiwan; equipe composta por mais de 400 engenheiros oriundos da NVIDIA, Google TPU, Broadcom, SK hynix, TSMC e empresas de negociação quantitativa; objetivo de construir infraestrutura de inferência de IA em escala de gigawatts até 2027.
Gavin Uberti, cofundador e CEO da Etched, afirmou: "Reconhecemos desde cedo que a IA de ponta se tornaria uma das tecnologias mais economicamente significativas da história, mas a infraestrutura necessária para atender a esses modelos de forma sustentável e economicamente viável simplesmente não existia."









