Sakana AI do Japão escolhe Google Cloud como infraestrutura para Sakana Fugu
2026-07-02 14:16
Favoritos

De acordo com pt.wedoany.com-A startup de IA Sakana AI escolheu o Google Cloud Gemini Enterprise Agent Platform como infraestrutura para seu sistema multiagente Sakana Fugu. O Google Cloud Japão publicou um artigo de caso em 29 de junho detalhando a parceria entre as duas empresas.

Sakana Fugu é um sistema multiagente que seleciona ou combina vários modelos de IA com base na dificuldade da tarefa, incluindo dois tipos: Fugu, focado na velocidade de raciocínio, e Fugu Ultra, de alto desempenho. Em algumas tarefas, o Fugu Ultra afirma superar o desempenho dos modelos de IA Claude Mythos Preview e Claude Fable 5 da empresa americana Anthropic.

No mecanismo de orquestração de vários modelos, o Google Cloud foi escolhido como infraestrutura. A Sakana AI afirma que a empresa foi fundada principalmente por engenheiros do Google e do Google DeepMind, tornando a adoção do Google Cloud uma tendência natural. Chi Sun, responsável pelo design da infraestrutura do Sakana Fugu, avaliou que o Google Cloud é uma infraestrutura de alta qualidade e estável, além de oferecer serviços gerenciados que permitem a colaboração entre vários modelos.

Chi Sun também mencionou que o Sakana Fugu é composto por três camadas: camada de front-end, camada de processamento intermediário e camada de modelo, e que a disponibilidade de todas as ferramentas necessárias para construir cada camada foi um dos motivos para sua adoção.

Na camada de front-end, os modelos são protegidos contra entradas inadequadas ou ataques DDoS por meio da função de segurança de rede Google Cloud Armor e da função de proteção de modelos e agentes Model Armor. A autenticação e proteção do usuário, bem como o gerenciamento de chaves de API, são realizados pela plataforma de desenvolvimento de aplicativos web Firebase.

A camada de processamento intermediário é responsável por tarefas como chamadas de modelo, processamento de logs e cache, e gravação de dados no data warehouse BigQuery.

A camada de modelo combina vários modelos para gerar respostas com base na consulta de entrada. Por meio do ambiente de execução sem servidor Cloud Run e da plataforma de IA Gemini Enterprise Agent Platform (antigo Vertex AI), são chamados modelos de empresas como Google dos EUA, OpenAI dos EUA e Anthropic.