FAR Labs dos Emirados Árabes Unidos abre plataforma de inferência de IA, com preços de alguns modelos até 91% mais baixos
2026-06-27 11:24
Favoritos

De acordo com pt.wedoany.com-A FAR Labs anunciou a abertura do registro para sua plataforma de inferência FAR AI, permitindo acesso a desenvolvedores, e divulgou os preços tabelados para várias implantações de modelos. Esta empresa de inteligência artificial e infraestrutura sediada em Abu Dhabi (pertencente à Dizzaract) visa ajudar desenvolvedores a reduzir os custos operacionais de aplicações de IA à medida que o uso de produtos de software e ferramentas automatizadas cresce.

FAR Labs libera acesso a plataforma de inferência de IA mais barata

O núcleo da plataforma é uma rede de inferência distribuída que combina as necessidades dos construtores com os recursos computacionais disponíveis. Os usuários podem acessar o sistema por meio de uma API compatível com OpenAI, selecionar entre vários modelos e iniciá-los rapidamente, enquanto suas cargas de trabalho são roteadas pelo FAR Orchestrator para execução em recursos de GPU. A FAR Labs destaca o custo como sua principal vantagem competitiva. A empresa afirma, por meio de comparações de referência com preços de outros provedores, que sua estrutura de rede permite oferecer preços significativamente mais baixos em determinadas implantações.

Especificamente, para o modelo Qwen3-30B-A3B, o preço tabelado da FAR AI é de US$ 0,03 por 1 milhão de tokens, enquanto a NextBit cobra US$ 0,35 e a DeepInfra, US$ 0,27. A empresa afirma que esse preço é até 91% menor que o destes últimos. Para o modelo Qwen2.5-72B-Instruct, a empresa lista o preço tabelado FP8 em US$ 0,17 por 1 milhão de tokens, enquanto a NovitaAI BF16 cobra US$ 0,39 e a DeepInfra FP8, US$ 0,38. Segundo a empresa, isso torna seu preço de 55% a 56% menor que o das alternativas listadas. Para o modelo Qwen3.5-122B-A10B, a FAR AI lista o preço tabelado FP8 em US$ 0,51 por 1 milhão de tokens. De acordo com a empresa, o custo dos tokens de saída é até 79% menor em comparação com provedores como AtlasCloud FP8 e SiliconFlow FP8.

Esta iniciativa da FAR Labs ocorre em um momento em que as empresas de IA enfrentam desafios econômicos diferentes dos primeiros anos. Embora o preço unitário dos tokens tenha caído drasticamente, os gastos totais com inferência continuam aumentando à medida que as empresas enviam mais solicitações de IA por meio de ferramentas de suporte ao cliente, agentes, assistentes, jogos e fluxos de trabalho internos. Essa mudança é particularmente importante para desenvolvedores que dependem de APIs proprietárias de empresas como OpenAI e Anthropic. À medida que os produtos escalam, as taxas recorrentes de inferência podem comprimir as margens de lucro e limitar o espaço para testes e expansão.

A FAR Labs afirma que sua vantagem de preço vem da utilização de recursos computacionais subutilizados, em vez de depender de grandes clusters de data centers dedicados. A plataforma usa capacidade de GPU disponível de dispositivos de consumo e data centers de pequenas e médias empresas, distribuindo o trabalho por meio de sua camada de orquestração focada em desempenho. A empresa também tenta abordar questões além do preço, afirmando que construtores que executam cargas de trabalho de produção precisam de sistemas privados, com roteamento confiável, baixa latência e prontos para uso em cenários reais. Sua camada de orquestração inclui inferência segura baseada em ambientes de execução confiáveis, pontuações de confiabilidade, suporte para modelos de código aberto e proprietários, e fluxos de vetores semânticos. De acordo com a FAR Labs, o sistema de roteamento é projetado em torno do tempo de atividade, continuidade da carga de trabalho e desempenho sensível à latência.

A empresa afirma que, durante a conferência SuperAI Singapore, várias conversas com desenvolvedores, fornecedores de GPU, equipes de modelos, investidores e executivos empresariais mencionaram o interesse nesse tipo de infraestrutura, apontando para a necessidade de infraestrutura de inferência mais rápida, confiável, de baixo custo e pronta para produção. A FAR AI está atualmente em fase de testes com parceiros fechados e oferece registro de acesso antecipado para construtores, fornecendo 1 milhão de tokens gratuitos para aqueles que se inscreverem no programa.

Em um comunicado, Ilman Shazhaev, fundador e CEO da Dizzaract, explicou a justificativa de mercado da empresa. "O preço da IA está caindo continuamente. Desde 2021, o custo por token caiu cerca de 99%. No entanto, as contas de IA estão aumentando porque o crescimento do uso é mais rápido que a queda dos preços. A inferência está se tornando o maior custo único da IA", disse ele. "Nossa vantagem de custo não é um desconto de queima de dinheiro. É estrutural."

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com