De acordo com pt.wedoany.com-A CIQ anunciou que sua plataforma Fuzzball agora oferece um ambiente de computação e inferência de IA pronto para produção para o NVIDIA DGX Spark. O DGX Spark é a primeira plataforma suportada, com suporte para mais plataformas no futuro. Equipes de IA podem obter um ambiente consistente em sua própria infraestrutura controlada para desenvolver, ajustar e implantar cargas de trabalho, operando da mesma forma desde um único DGX Spark até grandes clusters de GPU e data centers, sem necessidade de reconstrução à medida que a computação é escalada.
As equipes de IA gastam meses montando manualmente armazenamento, registros de contêineres, escalonadores, servidores de inferência e pipelines de implantação antes de colocar um modelo em produção, tendo que recomeçar cada vez que o ambiente de computação subjacente muda, atrasando a implantação e monetização de cargas de trabalho devido a atualizações de infraestrutura. O Fuzzball substitui esse trabalho por um ambiente de computação e inferência de IA pronto para uso, projetado especificamente para inferência local privada no DGX Spark. Para organizações que constroem cargas de trabalho de IA soberana (onde os dados não podem sair do local), isso fornece um caminho desde o ajuste privado de modelos até a inferência de produção, mantendo o controle sobre a infraestrutura subjacente, reduzindo o tempo desde a concepção do modelo até a execução do serviço de inferência de meses para dias.
Gregory Kurtzer, CEO e fundador da CIQ e criador do Rocky Linux, afirmou que o Fuzzball é o Kubernetes para computação intensiva em desempenho e o que as equipes de IA realmente precisam para possuir sua infraestrutura. A dificuldade da IA não é o modelo em si, mas executá-lo em escala sem reconstruir a infraestrutura subjacente devido a mudanças na computação. A maioria das equipes gasta meses lidando com esse problema antes da primeira carga de trabalho entrar em produção; o Fuzzball acaba com isso. Com centenas de modelos de fluxo de trabalho integrados, um único DGX Spark é um ambiente completo de desenvolvimento, teste e validação de IA desde o primeiro dia, e esses fluxos de trabalho podem ser executados sem alterações em milhares de sistemas e GPUs. A CIQ representa Controle de Inteligência (Controlling Intelligence), e o Fuzzball é a maneira como as equipes alcançam isso.
Com o Fuzzball, um único DGX Spark se torna um ambiente de desenvolvimento e implantação de IA funcional desde o primeiro dia, podendo ser escalado diretamente para infraestruturas maiores conforme a necessidade do projeto. Múltiplos sistemas DGX Spark podem trabalhar juntos em um ambiente Fuzzball unificado, oferecendo uma maneira prática para equipes pequenas escalarem gradualmente sua capacidade de computação local. Quando as cargas de trabalho excedem a capacidade local, os mesmos contêineres, ativos de modelo e definições de fluxo de trabalho podem ser migrados perfeitamente para implantações maiores de GPU NVIDIA, permitindo que os usuários escalem do NVIDIA DGX Spark para o NVIDIA GB300 NVL72 sem alterar o aplicativo, o modelo de orquestração Fuzzball ou o processo de implantação Fuzzball.
Para equipes de IA e HPC que antes gerenciavam cadeias de ferramentas independentes, o Fuzzball elimina a fragmentação operacional que impede a IA de passar da experimentação para a produção. A plataforma conecta sistemas DGX Spark locais e clusters HPC existentes à capacidade de nuvem e infraestrutura de GPU, incluindo sistemas NVIDIA GPU, tudo operando sob um único modelo operacional. O resultado é uma nova geração de computação acelerada, onde orquestração baseada em jobs, portabilidade de fluxo de trabalho, execução conteinerizada e inferência de produção trabalham juntos.
Bjorn Hovland, presidente da CIQ, destacou que organizações em setores regulamentados precisam escolher entre colocar IA em produção e manter dados em infraestrutura controlada; o Fuzzball elimina essa compensação. As equipes podem ajustar modelos privadamente no DGX Spark, operar esses modelos como serviços de inferência de produção e escalá-los para infraestruturas controladas maiores, sem alterar o ambiente subjacente. Para que a IA soberana seja viável, ela deve operar da mesma forma em todos os níveis de computação, e é exatamente isso que o Fuzzball no DGX Spark oferece. O DGX Spark é a primeira plataforma a executar essa funcionalidade, mas não será a última.









