Tencent Cloud da China une-se à Soniox dos EUA para integrar transcrição de voz em tempo real à infraestrutura global de comunicações
2026-06-02 15:55
Favoritos

De acordo com pt.wedoany.com-A Tencent Cloud da China firmou recentemente uma parceria estratégica com a Soniox, empresa de IA de voz de São Francisco, nos EUA, integrando a tecnologia de transcrição de voz da Soniox à infraestrutura global do TRTC (Real-Time Audio and Video) da Tencent Cloud. Voltada para cenários empresariais como atendimento inteligente, assistentes de voz, tradução em tempo real e transcrição de reuniões, a solução oferece capacidade de desenvolvimento de aplicações de voz em tempo real multilíngues e de baixa latência.

Essa colaboração se concentra na interseção entre "processamento de linguagem + comunicação em tempo real", com o objetivo central de reduzir as barreiras para empresas implantarem aplicações globais de IA de voz. A Soniox oferece principalmente capacidade de reconhecimento de voz de alta precisão e baixa latência, suportando mais de 60 idiomas e lidando com cenários de alternância entre diferentes idiomas em uma mesma frase; o TRTC da Tencent Cloud, por sua vez, fornece uma rede de comunicação em tempo real de nível empresarial, abrangendo mais de 3.200 nós globais, com latência global inferior a 300 milissegundos, redução de ruído por IA e resistência a redes instáveis. Com a combinação, os desenvolvedores podem integrar diretamente a interface de transcrição de voz da Soniox no console da Tencent Cloud para construir aplicações de IA de voz para múltiplos mercados. Para empresas de comércio eletrônico transfronteiriço, educação online, reuniões remotas, colaboração empresarial, jogos sociais, atendimento financeiro e SaaS internacional, as aplicações de voz enfrentavam três problemas principais: primeiro, a grande variação na qualidade da rede entre diferentes países, causando atrasos e perda de pacotes na transmissão de voz em tempo real; segundo, o reconhecimento multilíngue exigia a adaptação a diferentes modelos e interfaces, elevando os custos de desenvolvimento e manutenção; terceiro, cenários como atendimento, tradução e atas de reuniões exigem alta precisão e velocidade de resposta, sendo difícil garantir uma experiência estável apenas com modelos de reconhecimento de voz ou apenas com links de comunicação. A Tencent Cloud e a Soniox colocam a rede de comunicação em tempo real e a tecnologia de transcrição de voz em um mesmo pipeline de entrega, ajudando as empresas a integrar entrada de voz, transmissão, reconhecimento, saída de texto e processamento de IA subsequente em uma infraestrutura de voz em tempo real mais completa, eliminando a necessidade de combinar separadamente serviços de comunicação, reconhecimento de voz e módulos de processamento multilíngue.

Esta parceria apoia as empresas no desenvolvimento de aplicações de voz para o mercado de língua inglesa, bem como para mercados multilíngues como árabe, hindi e malaio, com direções de aplicação incluindo atendimento inteligente, assistentes de voz, tradução em tempo real e transcrição de reuniões.

A IA de voz empresarial está passando de funcionalidades pontuais para a fase de implantação em produção. No passado, a transcrição de voz era mais usada para atas de reuniões, geração de legendas ou organização de gravações de atendimento, com processamento predominantemente offline e reconhecimento de um único idioma; com a popularização da IA generativa, robôs de atendimento em tempo real, colaboração transfronteiriça e hardware inteligente, a voz está se tornando uma importante porta de entrada para aplicações empresariais. O que realmente impacta a eficácia da implantação não é apenas se o modelo de reconhecimento consegue entender uma frase, mas também a qualidade do link de voz do usuário para a nuvem, a velocidade de retorno dos resultados do reconhecimento, a estabilidade em ambientes de rede fraca, a capacidade de reconhecimento contínuo em cenários de mistura de idiomas e a integração subsequente com grandes modelos, bases de conhecimento, sistemas de tickets e sistemas de tradução. O TRTC da Tencent Cloud fornece nós globais e baixa latência na camada de transmissão de áudio e vídeo em tempo real, enquanto a Soniox oferece reconhecimento multilíngue e processamento de alternância de idiomas na mesma frase na camada de transcrição de voz. Combinados, as empresas podem incorporar a entrada de voz mais rapidamente em centrais de atendimento, reuniões online, transmissões ao vivo transfronteiriças, treinamentos remotos e aplicações móveis. Para a indústria de TIC, essa colaboração também mostra que as plataformas de comunicação em tempo real estão evoluindo de ferramentas de chamada de áudio e vídeo para canais subjacentes de serviços de IA de voz, tradução, colaboração e automação. No futuro, quem conseguir orquestrar links de comunicação, reconhecimento de voz, processamento multilíngue e aplicações de IA em uma plataforma unificada terá mais facilidade para atender às necessidades de implantação global e operação de usuários multilíngues das empresas.

As variáveis futuras dessa parceria concentram-se na velocidade de adoção pelos clientes empresariais, na estabilidade do reconhecimento multilíngue em ambientes ruidosos reais, na coordenação de interfaces com aplicações de grandes modelos e na conformidade com requisitos de dados em diferentes países e regiões. À medida que mais empresas expandem atendimento, reuniões, treinamentos e atividades de marketing para o mercado global, a transcrição de voz em tempo real deixará de ser apenas uma função auxiliar para se tornar uma capacidade fundamental para comunicação entre idiomas, serviços automatizados e operações inteligentes. A colaboração entre Tencent Cloud e Soniox oferece um novo exemplo de combinação de produtos para provedores de serviços em nuvem chineses e empresas de IA de voz dos EUA no mercado global de comunicações empresariais.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com