De acordo com pt.wedoany.com-A Saturn Cloud, plataforma de desenvolvimento de IA voltada para operadores de nuvem de GPU, lançou a plataforma Token Factory, permitindo que equipes de IA empresariais realizem todo o fluxo de ajuste fino de modelos e inferência na infraestrutura de GPU do operador. A plataforma oferece suporte a operadores de neocloud, construtores de fábricas de IA e usuários empresariais no fornecimento de tarefas de ajuste fino gerenciadas, gerenciamento de conjuntos de dados e endpoints de inferência compatíveis com OpenAI para seus clientes, tudo cobrado por token e entregue com a marca do operador, sem necessidade de desenvolvimento ou manutenção de qualquer componente.
Os operadores de nuvem de GPU investem pesadamente em infraestrutura de aceleração, com sistemas NVIDIA Grace Blackwell, NVIDIA Blackwell e NVIDIA Hopper já amplamente implantados, e a receita de negócios de neocloud crescendo rapidamente. No entanto, o modelo de negócios de muitos operadores ainda se limita ao aluguel de capacidade de computação de GPU por hora. As necessidades dos clientes empresariais vão além da mera capacidade de computação; eles exigem ambientes de desenvolvimento gerenciados, orquestração de treinamento distribuído, pipelines de ajuste fino de modelos, login único (SSO) e controle de acesso baseado em funções (RBAC), rastreamento de uso e ferramentas de conformidade. A maioria dos operadores de nuvem de GPU não possui pessoal para construir internamente essa infraestrutura de plataforma, o que normalmente exigiria meses de desenvolvimento de engenharia e manutenção contínua.
Sebastian Metti, fundador da Saturn Cloud, afirmou que os operadores não deveriam ter que construir uma plataforma de desenvolvimento de IA do zero para tornar a infraestrutura de GPU acessível às equipes empresariais. A Saturn Cloud, desde o início, oferece ambientes gerenciados, orquestração de treinamento, ajuste fino, endpoints de inferência compatíveis com OpenAI e cobrança por token.
A plataforma Token Factory permite que equipes de IA ajustem e sirvam modelos abertos sem gerenciar infraestrutura. Os usuários simplesmente carregam conjuntos de dados, configuram tarefas de ajuste fino e implantam os modelos gerados em endpoints de inferência, tudo dentro do ambiente de marca do operador. As tarefas de ajuste fino suportam ajuste fino supervisionado (pesos completos e LoRA) em modelos abertos; quando a instância selecionada possui múltiplas GPUs, o sistema configura automaticamente o DeepSpeed multi-GPU. O usuário especifica o modelo base, o conjunto de dados e alguns hiperparâmetros, e a Saturn Cloud gera a configuração completa de treinamento, lidando com orquestração, novas tentativas e saída de checkpoints. Os frameworks de treinamento suportados incluem Axolotl, vLLM, Unsloth, TRL, PEFT e DeepSpeed.
Os conjuntos de dados são coleções de dados de treinamento tipados e validados, em formatos como conversacional, instrucional, texto ou pré-tokenizado. Os usuários podem carregar conjuntos de dados diretamente, importá-los de fontes externas (como S3, NFS) ou organizar dados em um workspace gerenciado, registrando-os posteriormente como conjuntos de dados do Token Factory. Todo o armazenamento de conjuntos de dados utiliza um sistema de arquivos paralelo de alto desempenho, em vez de armazenamento de objetos, para eliminar a sobrecarga de inicialização a frio e evitar a redução da utilização da GPU durante o treinamento.
A linhagem de checkpoints e artefatos é gerenciada automaticamente. Após a conclusão de uma tarefa de ajuste fino, os checkpoints gerados são registrados no registro de artefatos da Saturn Cloud, preservando a linhagem completa desde a execução do treinamento até os pesos do modelo. Os checkpoints podem ser imediatamente usados como entrada para implantação de endpoints de inferência. Os endpoints de inferência implantam modelos ajustados ou base como endpoints de serviço persistentes, com suporte de backend pelo vLLM, cada implantação possuindo um subdomínio independente, monitoramento de integridade e medição por token. As configurações de serviço (como dtype, comprimento máximo de contexto, quantização) são geradas no momento da implantação, sem necessidade de scripts de serviço personalizados. Todo o fluxo de trabalho é isolado por organização, com os recursos do Token Factory limitados ao escopo do locatário, garantindo que os conjuntos de dados, checkpoints e endpoints de um cliente não sejam visíveis para outros.
A Saturn Cloud oferece aos operadores de nuvem de GPU um caminho completo, desde a infraestrutura bare metal até uma plataforma de IA geradora de receita. A camada de funcionalidades voltada para operadores inclui branding de marca branca, cobrança por token e por hora de GPU, integração de locatários e provisionamento de autoatendimento, painéis de uso e relatórios de faturamento, além de ferramentas de segurança empresarial (incluindo SSO, RBAC e conformidade SOC 2). Sem a camada de plataforma, os operadores só podem vender tempo de computação, caindo em uma competição de preços; com a Saturn Cloud, eles podem vender a plataforma, competindo em experiência do desenvolvedor, postura de segurança e tempo de lançamento. A plataforma permite que os operadores passem por auditorias de segurança empresarial, pois as ferramentas de conformidade já estão implementadas, ao mesmo tempo que permite que os operadores exibam painéis de uso, controle de custos e gerenciamento de equipe para os locatários, e forneçam demonstrações do produto, em vez de folhas de especificações, para suas equipes de vendas.
Equipes de IA e desenvolvedores que trabalham na infraestrutura do operador obtêm ambientes de desenvolvimento gerenciados (com suporte a JupyterLab, VS Code, RStudio e acesso SSH), treinamento distribuído multi-GPU (com orquestração, novas tentativas e logs), o Token Factory para ajuste fino e serviço de modelos abertos, e suporte pré-configurado para NVIDIA CUDA, drivers de GPU e frameworks de IA. Os engenheiros podem usar todo o cluster de GPU do operador, incluindo sistemas NVIDIA Hopper, Blackwell e Blackwell Ultra, bem como sistemas de nível de rack NVIDIA GB200 NVL72. A Saturn Cloud é membro do programa de aceleração de startups NVIDIA Inception.
A Saturn Cloud se integra a parceiros de automação de infraestrutura no ecossistema, incluindo Mirantis k0rdent AI, Spectro Cloud, OpenNebula e Rafay. Operadores que gerenciam Kubernetes diretamente no backend da nuvem também podem implantar a Saturn Cloud sobre sua pilha existente, sem alterar a camada de infraestrutura.
Os recursos do Token Factory já estão disponíveis para operadores de nuvem de GPU, neoclouds e empresas que operam sua própria infraestrutura de GPU. Organizações interessadas em implantar a plataforma podem entrar em contato com a Saturn Cloud para uma avaliação.
A Saturn Cloud é uma plataforma de fábrica de tokens de IA para neoclouds, operadores de fábricas de IA e empresas, oferecendo ajuste fino gerenciado, serviço de modelos compatível com OpenAI (cobrado por token), ambientes gerenciados, treinamento distribuído e segurança e governança empresarial. A plataforma suporta múltiplas arquiteturas de GPU e pode ser implantada em ambientes de nuvem pública, nuvem privada e locais.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









