De acordo com pt.wedoany.com-A Railway, provedora de PaaS, está utilizando inteligência artificial para projetar a implantação de seus data centers. A empresa revelou em uma postagem no blog que usa o Claude, da Anthropic, para planejar a construção dos sites de data centers "Gen 2".

O plano de implantação elaborado pelo Claude abrange quatro regiões geográficas, envolvendo oito ou nove data centers diferentes, incluindo "seis fornecedores, dezenas de provedores de rede, dezenas de técnicos, centenas de itens, milhares de cabos e uma grande quantidade de velcro". Todo esse trabalho precisa ser concluído dentro de uma janela de instalação de duas a três semanas.
A Railway opera atualmente em uma combinação do Google Cloud Platform (GCP), Amazon Web Services (AWS) e servidores bare-metal próprios implantados em data centers. Ao lançar os servidores bare-metal pela primeira vez, a empresa implantou a Gen 1 em oito fases, ao longo de 18 meses. No blog, a empresa explicou que, após montar o esqueleto inicial do site em cada região e preencher 20% da capacidade, dedicava alguns meses a outras tarefas e, em seguida, repetia o mesmo processo no próximo site. A partir do esqueleto inicial, a expansão era feita em lotes de 15% a 20% da capacidade do site, preenchendo-o gradualmente. No entanto, o crescimento da demanda e os problemas na cadeia de suprimentos, causados pela enorme procura por materiais que vão desde DRAM até fibra de vidro, limitaram essa velocidade.
A Railway forneceu ao Claude uma "estrutura" para operar, incluindo controle de versão da infraestrutura física, verificação de regras de design para equipamentos, cabos, racks ou sites, um banco de peças e um sistema de atributos e restrições. A empresa também tornou seu sistema interno de gerenciamento de infraestrutura de data center (DCIM) "em tempo real" e adicionou um conjunto de ferramentas MCP com habilidades de registro de processos. A construção real é realizada por um único contratante global, com equipes distribuídas em cada região geográfica onde a empresa opera.
Em termos de especificações de hardware, a Gen 2 utiliza "a mais recente geração de CPUs AMD Zen 5c EYPC, com 96 núcleos (192 threads), combinadas com DDR5, capacidade de armazenamento cinco vezes maior que a Gen 1 e placas de rede duplas ConnectX-6 de 100G." Os servidores de armazenamento da Gen 2 usam o mesmo chassi da Gen 1, reduzindo quatro SKUs para dois. Cada site Gen 2 é construído ao lado, e não sobre, seu site Gen 1, conectando ambos por fibra escura própria: links de 400G atravessam 4 caminhos diferentes, usando DWDM onde mais comprimentos de onda são necessários. Na maioria das regiões, é possível alcançar a região do maior provedor de serviços em nuvem mais próximo em muito menos de um milissegundo.
No início de junho, a Gen 2 estava online em três das quatro regiões: Oeste dos EUA (Califórnia), Leste dos EUA (Virgínia) e Amsterdã, Países Baixos, sendo a região restante Cingapura.
A Railway foi inicialmente construída no GCP, mas já havia afirmado anteriormente que isso trouxe "uma série de problemas que representam um risco existencial para o nosso negócio", incluindo impactos na precificação e dificuldade em entender as causas de problemas upstream. A empresa escreveu que, apesar de gastar milhões de dólares anualmente, o suporte recebido do Google Cloud era semelhante ao que se obtém gastando 100 dólares. Recentemente, o Google Cloud suspendeu um projeto da Railway após detectar um aumento na mineração de criptomoedas. Segundo fontes, várias contas de clientes foram suspensas, e a conta da Railway não conseguiu resolver as atividades de abuso em sua plataforma por anos. A comunicação entre as partes foi rápida, mas nenhum ticket de suporte formal foi aberto.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









