De acordo com pt.wedoany.com-A SoundWise.ai anunciou recentemente o lançamento de uma ferramenta de transcrição por inteligência artificial gratuita e permanente. Esta plataforma baseada em navegador converte áudio e vídeo em texto em mais de 98 idiomas, sem cobrança por minuto para usuários individuais e sem limite geral de uso.
A plataforma utiliza uma arquitetura de dois motores, incluindo um modelo de transcrição por IA gratuito executado localmente no dispositivo do usuário e uma camada opcional de aprimoramento em nuvem, SoundWise Pro. Esta última oferece precisão próxima ao nível humano, com velocidade até 10 vezes maior que a transcrição em tempo real. Ambos os motores cobrem desde anotações rápidas de podcasts até fluxos de trabalho profissionais de conversão de fala em texto para redações, salas de aula e equipes de conteúdo.
Eric, CEO da SoundWise, afirmou que o conteúdo de áudio e vídeo deve ser tão fácil de pesquisar, editar, citar, traduzir e reutilizar quanto outros documentos. A equipe construiu o SoundWise para lidar com o trabalho após a gravação, incluindo transformar entrevistas em artigos, palestras em notas de estudo, webinars em ativos de marketing e material bruto em texto utilizável pela equipe.
A ferramenta oferece transcrição por IA local gratuita, ilimitada e permanente. Os usuários podem transcrever arquivos de áudio e vídeo diretamente no navegador, sem cobrança por minuto para uso pessoal razoável e sem limites gerais de transcrição. Como o processamento é feito localmente, gravações sensíveis não saem do dispositivo do usuário. O SoundWise Pro roteia arquivos por meio de modelos otimizados em nuvem. De acordo com benchmarks internos, uma gravação de uma hora pode ser transcrita em cerca de 30 segundos, aproximadamente 120 vezes a velocidade em tempo real. A plataforma lida com conversão multilíngue de fala em texto em inglês, espanhol, mandarim, francês, alemão, japonês, coreano, árabe, português, russo e mais de 88 outros idiomas. Os tipos de arquivo suportados incluem MP3, WAV, FLAC, AAC, M4A, MP4, MOV, MKV e outros formatos de mídia comuns. A ferramenta de revisão de transcrição integrada oferece detecção automática de falantes e carimbos de tempo palavra por palavra, e as transcrições podem ser exportadas nos formatos TXT e PDF, com exportação para DOCX e legendas SRT em breve.
O SoundWise Free oferece conversão ilimitada de áudio e vídeo em texto, sem cobrança por minuto, sem necessidade de cartão de crédito e sem paywall de registro. Os arquivos são processados localmente pelo modelo de IA no navegador. De acordo com testes internos, o tempo médio de processamento para uma gravação de uma hora é de cerca de 10 minutos, dependendo do desempenho do dispositivo e da complexidade do arquivo. Esta abordagem local é projetada especificamente para estudantes, criadores independentes, pesquisadores acadêmicos e profissionais preocupados com privacidade que frequentemente lidam com conteúdo gravado, mas não precisam de armazenamento em nuvem ou processamento em segundo plano.
Para usuários que precisam de velocidade e escala, o SoundWise Pro move a transcrição para GPUs em nuvem, continuando a funcionar mesmo após o navegador ser fechado. Arquivos de áudio de uma hora são concluídos em cerca de 30 segundos. Os planos incluem transcrição ilimitada em nuvem, armazenamento ilimitado em nuvem, exportação em múltiplos formatos e acesso antecipado a recursos como legendas SRT e exportação DOCX, que serão lançados em breve. O SoundWise Pro custa US$ 20 por mês, ou US$ 10 por mês no plano anual.
O SoundWise visa integrar-se ao fluxo de trabalho de conversão de conteúdo falado em ativos escritos. Criadores de conteúdo e podcasters podem transcrever vídeos e áudio em legendas, postagens de blog, newsletters e postagens em redes sociais em minutos. Equipes de marketing e crescimento podem transformar webinars, chamadas de vendas, entrevistas com clientes e episódios de podcast em bases de conhecimento pesquisáveis e textos editáveis. Educadores e alunos podem contar com transcrições de palestras para converter aulas e seminários em guias de estudo, flashcards e notas de revisão. Jornalistas e pesquisadores qualitativos podem processar entrevistas e gravações de campo, incluindo etiquetas de falantes e carimbos de tempo, sem precisar reproduzir todo o trecho.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









