Microsoft dos EUA lança API de reconhecimento de fala no Windows e modelos de linguagem pequenos Aion_Boletins

Microsoft dos EUA lança API de reconhecimento de fala no Windows e modelos de linguagem pequenos Aion

2026-06-04 16:19

Favoritos

De acordo com pt.wedoany.com-De 2 a 3 de junho, a Microsoft dos EUA anunciou atualizações nas Windows AI APIs durante a Build 2026, incluindo uma nova API de reconhecimento de fala no dispositivo e o lançamento de dois modelos de linguagem pequenos voltados para execução local: Aion 1.0 Instruct e Aion 1.0 Plan. Esses recursos são direcionados principalmente a desenvolvedores do Windows 11, permitindo conversão de fala em texto, processamento inteligente de texto e execução de tarefas de agente local em PCs.

Esta atualização descentraliza ainda mais o processamento de linguagem para o lado do terminal. A nova API de reconhecimento de fala suporta a geração de transcrições em tempo real ou em lote a partir de microfones, fluxos de áudio e arquivos de áudio, podendo ser usada para geração de legendas, entrada por ditado, aplicativos de áudio e vídeo e ferramentas de acessibilidade. A Microsoft enfatiza que, ao ser executada localmente, essa capacidade pode gerar transcrições mesmo sem conexão com a internet, reduzindo a dependência de inferência em nuvem. Para softwares empresariais, ferramentas de reunião, registros de campo industrial, operação remota e manutenção, bem como sistemas de treinamento educacional, o valor da transcrição de fala no dispositivo reside na redução da latência, diminuição dos custos de chamada em nuvem e na capacidade de manter parte dos dados de fala sensíveis processados localmente no dispositivo. Com a entrada da IA em mais terminais de escritório e indústria, o reconhecimento de fala está se transformando de um módulo de função isolado para uma capacidade básica em nível de sistema operacional.

O Aion 1.0 Instruct é posicionado como um modelo de linguagem pequeno para cargas de trabalho no dispositivo, suportando tarefas inteligentes de texto como resumo, reformulação, reconhecimento de intenção e acessibilidade.

O Aion 1.0 Plan é voltado para cenários de raciocínio de agente local, com um modelo de 14 bilhões de parâmetros, suportando um contexto de 32 mil tokens e capacidade de chamada de ferramentas. Ele ajuda aplicativos a entender a intenção do usuário, chamar ferramentas, gerenciar arquivos e orquestrar subagentes. A Microsoft planeja que este modelo seja executado como parte do Windows em dispositivos qualificados, permitindo que alguns fluxos de agente desçam da nuvem para o dispositivo local. Para desenvolvedores, isso significa que aplicativos de desktop no futuro poderão invocar diretamente capacidades de compreensão de texto, reconhecimento de fala e orquestração de ferramentas no nível do sistema operacional, sem a necessidade de integrar serviços de modelo externos separadamente para cada aplicativo. Para os departamentos de TI empresariais, os modelos no dispositivo também trazem novas questões de governança, incluindo permissões de modelo, limites de acesso a arquivos, identificação de usuários, retenção de dados, desempenho do dispositivo e auditoria entre aplicativos. A adoção em larga escala em cenários empresariais dependerá se as capacidades de IA local e os mecanismos de gerenciamento de segurança amadurecerão simultaneamente.

A Microsoft também anunciou que as Windows AI APIs serão expandidas para mais PCs com Windows 11. Além do NPU, algumas capacidades também suportarão CPU e GPU. A API de reconhecimento de fala será inicialmente focada no inglês, com expansão gradual para mais mercados globais. Com a integração de modelos no dispositivo, reconhecimento de fala e capacidades de agente local no ecossistema de desenvolvimento do Windows, a tecnologia de processamento de linguagem está passando de interfaces de serviço em nuvem para o nível do sistema operacional do terminal, tornando-se um componente fundamental para desenvolvimento de aplicativos, interação acessível e fluxos de trabalho inteligentes empresariais.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com

EUA

Este boletim é uma compilação e reprodução de informações de parceiros estratégicos e da internet global, destinado apenas para troca de informações entre leitores. Em caso de infração ou outros problemas, por favor, informe-nos imediatamente, e este site fará as devidas modificações ou exclusões. A reprodução deste artigo é estritamente proibida sem autorização formal. E-mail: news@wedoany.com