AethexAI, dos EUA, levanta 3 milhões de dólares e mira IA de voz na África e Oriente Médio
2026-06-04 11:07
Favoritos

De acordo com pt.wedoany.com-A AethexAI é uma startup focada na construção de produtos de IA de voz para os mercados da África e do Oriente Médio. Fundada no ano passado, já garantiu 3 milhões de dólares em financiamento pré-semente. Esta rodada foi liderada pela 4DX Ventures, com participação da Enza Capital, Dorm Room Fund, Mojo Ventures e Stanford GSB 26 Fund. Entre os investidores individuais estão professores da Universidade de Stanford, executivos de empresas de telecomunicações e pesquisadores de IA da Anthropic.

A empresa não utilizou ferramentas de orquestração existentes, como Vapi ou LiveKit, mas desenvolveu seus próprios modelos e camada de orquestração do zero para lidar com dialetos localizados de inglês, francês e árabe em seus mercados-alvo. A empresa também lançou uma plataforma empresarial para que os clientes testem a tecnologia e se registrem no serviço, além de fornecer APIs e SDKs para desenvolvedores experimentarem seus modelos.

A AethexAI foi fundada por Mariama Diallo e Ayooluwa Odemuyiwa. A CEO Diallo trabalhou anteriormente no Goldman Sachs e depois ingressou na ModelML, apoiada pela Y Combinator, onde foi responsável por produto e crescimento. O CTO Odemuyiwa é formado pelo Instituto de Tecnologia da Califórnia, trabalhou no Meta e estudou na Stanford Graduate School of Business. Ambos desejam construir produtos para mercados emergentes e começaram a buscar oportunidades.

Empresas globais estão correndo para adotar ferramentas de IA para automatizar operações, mas em alguns mercados os resultados não são bons. Os fundadores descobriram que, no Egito, uma central de atendimento automatizou a maioria das chamadas, mas acabou revertendo o sistema devido aos maus resultados. Vários centros de suporte na África relataram a eles que contratar engenheiros a um custo razoável para automatizar chamadas é um desafio de longo prazo.

“A latência e a instabilidade que vimos na automação de chamadas nesta região são muito graves. Se nos tornássemos orquestradores, talvez tivéssemos que usar grandes modelos hospedados fora da região, resultando em maior latência. Para que isso funcione, é necessário usar modelos muito pequenos e reduzir a latência em cada etapa”, explicou Odemuyiwa ao TechCrunch sobre a decisão da empresa de construir seus próprios modelos e camada de orquestração.

Laboratórios de IA geralmente gastam milhões de dólares em treinamento e aquisição de dados para implantar os modelos mais recentes. A AethexAI decidiu que modelos pequenos são suficientes para resolver problemas de latência e manter a precisão, desenvolvendo a série de modelos Kora, com parâmetros variando de 300 milhões a 1,7 bilhão. Para treinar esses modelos, a empresa usou gravações anônimas de centrais de atendimento parceiras e enviou discos rígidos para estações de rádio em toda a África para coletar dados de áudio. Para reduzir custos, a empresa estabeleceu uma rede de colaboradores composta por universitários para rotular dados e ler nomes locais em voz alta. Segundo a empresa, atualmente são processadas mais de 17.000 chamadas por dia.

Em termos de negócios, a empresa ajuda clientes que não estão familiarizados com IA de voz a identificar os casos de uso mais adequados para automação por meio de demonstrações ao vivo e workshops. Atualmente, a maioria dos casos de uso envolve cobranças, ativação de clientes ou chamadas de KYC (Conheça seu Cliente, processo padrão de verificação de identidade usado por bancos e empresas de telecomunicações). A empresa está contratando engenheiros de implantação de campo em regime de contrato para atender mercados locais e estabelecendo parcerias de canal com provedores de telecomunicações para lidar com o serviço telefônico de chamadas de IA de voz.

Walter Baddoo, cofundador e sócio-gerente da 4DX Ventures, acredita que os mercados da África e do Oriente Médio são fundamentalmente diferentes dos mercados que a maioria das empresas de IA de voz atende inicialmente. “As empresas na África e no Oriente Médio lidam com aproximadamente o triplo do volume de chamadas de suas contrapartes ocidentais, porque a voz ainda é o principal canal de interação com o cliente. Os sistemas existentes foram construídos para o mercado ocidental, caracterizados por infraestrutura de GPU de ponta, inglês padrão e ambiente de voz europeu. Isso cria uma lacuna real quando as empresas precisam lidar com dialetos, alternância de código e padrões de fala informais, e ainda funcionar dentro de sua infraestrutura telefônica existente e faixa de preço realista.”

Embora empresas como ElevenLabs, Deepgram, Sierra e Cognigy estejam se expandindo rapidamente globalmente, os mercados para os quais foram originalmente construídas nem sempre são os mesmos que estão entrando agora. Startups como a AethexAI estão apostando nessas lacunas — modelos focados em dialetos locais, parcerias de campo e infraestrutura construída para a região — representando um espaço de mercado que os gigantes não têm motivação nem arquitetura para preencher.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com