Deepgram, em parceria com Fortanix e NVIDIA, direciona IA de voz local para implantação de computação confidencial
2026-06-03 17:36
Favoritos

De acordo com pt.wedoany.com-Recentemente, a empresa americana de infraestrutura de IA de voz em tempo real Deepgram firmou uma parceria com a empresa de segurança de dados Fortanix. Utilizando o Fortanix Confidential AI e os recursos de computação confidencial da NVIDIA, a parceria oferece soluções de implantação de IA de voz que podem ser executadas em ambientes locais para setores regulamentados. A solução é voltada para cenários como saúde, finanças, governo, atendimento ao cliente empresarial e operações internas, com foco na proteção da segurança dos dados de voz e dos pesos dos modelos durante o processo de inferência.

Esta colaboração leva a competição em IA de voz, que antes se concentrava em precisão de reconhecimento, baixa latência e capacidade multilíngue, para o próximo nível: "a capacidade de entrar em ambientes de negócios altamente sensíveis". Em muitos setores, os dados de voz contêm uma grande quantidade de informações privadas e segredos comerciais, como conversas entre médico e paciente, registros de transações financeiras, informações de identidade do cliente, conteúdo de reuniões corporativas, processos de tratamento de chamados e solicitações de serviços internos. Embora as soluções tradicionais de reconhecimento de voz ou agentes de voz baseados em nuvem sejam fáceis de integrar rapidamente, elas frequentemente encontram limitações em termos de residência de dados, auditoria de conformidade, proteção de propriedade intelectual de modelos e limites de segurança interna. A Deepgram adota uma abordagem de implantação localizada com esta solução, permitindo que as empresas executem recursos de reconhecimento de voz, síntese de fala e voz para voz em seus próprios ambientes. A Fortanix, por meio de sua tecnologia de IA confidencial e ambientes de execução confiáveis, fornece proteção de isolamento de hardware para dados de áudio e pesos de modelos em processamento, reduzindo os riscos de roubo de modelos, acesso não autorizado a dados ou exposição do processo de inferência à infraestrutura subjacente.

A solução é executada em GPUs que suportam a computação confidencial da NVIDIA, onde os dados de áudio e os pesos dos modelos de IA permanecem criptografados e isolados durante a fase de processamento ativo. A Deepgram, a Fortanix e a NVIDIA posicionam esta combinação como uma pilha de tecnologia pré-integrada voltada para ambientes de alta exigência de segurança.

A voz está se tornando uma nova porta de entrada para sistemas empresariais. No passado, a gravação de chamadas de call center, atas de reuniões, garantia de qualidade de atendimento ao cliente e transcrição de voz eram, em sua maioria, processos de pós-processamento, onde as empresas enviavam o áudio para o provedor de serviços e depois recebiam texto, resumos ou resultados de análise. Com a entrada de agentes de voz em tempo real em processos como atendimento ao cliente, registros médicos, manutenção em campo, help desk de TI e revisão de conformidade, os dados de voz passam a participar diretamente da tomada de decisões de negócios e da automação de execução. Os requisitos de segurança também se estendem de "criptografia em repouso e em trânsito" para "proteção durante o uso". A adição da computação confidencial resolve, na prática, um ponto crítico na implantação de produção de IA de voz: modelos e dados também precisam ser isolados durante a execução na GPU, e o administrador da plataforma, o sistema operacional subjacente e o ambiente de infraestrutura não devem ter acesso direto a dados ou ativos de modelo em texto claro. Para empresas regulamentadas, essa capacidade ajuda a executar aplicações de voz em tempo real dentro de seus próprios limites de segurança, mantendo ao mesmo tempo uma experiência de interação de baixa latência.

A Deepgram oferece recursos de voz para texto, texto para voz e voz para voz, e suporta modos de implantação como API em nuvem, auto-hospedagem e API local. A empresa afirma que mais de 200.000 desenvolvedores e 1.400 organizações já usam sua plataforma, que processou mais de 50.000 anos de áudio e transcreveu mais de 1 trilhão de palavras. Com esta parceria com a Fortanix e a NVIDIA, a Deepgram pode direcionar suas capacidades de IA de voz, antes mais focadas em desenvolvedores e clientes de plataforma, para hospitais, bancos, seguradoras, setor público, help desks internos de empresas e clientes de setores com altos requisitos de soberania de dados. O papel da Fortanix concentra-se em proteger a segurança de todo o ciclo de vida de dados, modelos de IA e aplicações em ambientes locais, multinuvem e de alta segurança, especialmente conectando computação confidencial, controle de chaves, execução de confiança zero e proteção de modelos.

As variáveis futuras concentram-se no custo real de implantação para as empresas, na disponibilidade de ambientes de computação confidencial em GPU, na adaptação para auditoria de conformidade e no grau de replicabilidade dos agentes de voz nos processos do setor. Se esta solução conseguir estabelecer casos de uso estáveis em setores regulamentados, a forma de implantação da IA de voz evoluirá de "prioridade de chamada em nuvem" para uma arquitetura híbrida de "execução local, modelo protegido, dados sem saída do perímetro". Para empresas de reconhecimento de voz e IA conversacional, o foco da concorrência futura recairá simultaneamente no desempenho do modelo, na capacidade de tempo real, na entrega privada, na integração de computação confidencial e na capacidade de conformidade regulatória do setor.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com