De acordo com pt.wedoany.com-A Microsoft apresentou na conferência Build 2026 sete modelos internos da sua marca MAI, lançou novos processadores de servidor otimizados para agentes de IA, revelou a próxima geração de chips quânticos e integrou uma plataforma de agentes que abrange Windows, Azure e GitHub. A empresa descreveu este posicionamento como "autossuficiente", enfatizando a capacidade de fornecer a sua própria inteligência, os seus próprios chips e o seu próprio runtime, mas esta medida não representa uma rutura com a OpenAI, e sim a construção de uma alternativa controlável, mantendo a parceria.

Mustafa Suleyman, responsável pela área de IA da Microsoft, apresentou os sete modelos, que abrangem funcionalidades como raciocínio, codificação, geração de imagens, voz e transcrição. O modelo principal de raciocínio, MAI-Thinking-1, utiliza um design de especialistas mistos esparsos, com cerca de 35 mil milhões de parâmetros ativos e uma janela de contexto de 256.000 tokens, atualmente disponível em pré-visualização privada através do Microsoft Foundry, sem lançamento geral. A Microsoft afirma que avaliadores humanos em testes cegos preferiram este modelo ao Claude Sonnet 4.6 da Anthropic, e que o seu desempenho é equivalente ao do Claude Opus 4.6 no benchmark de codificação SWE-bench Pro. Outro modelo de codificação mais pequeno e eficiente, o MAI-Code-1-Flash, será integrado no editor dos utilizadores do GitHub Copilot. Estes modelos foram treinados de raiz com dados licenciados, sem destilação de conhecimento de outros laboratórios.
A Microsoft afirma que estes modelos utilizam um pipeline de treino chamado "máquina de escalada", que melhora continuamente em ciclos à medida que a capacidade computacional global se expande. A empresa concebeu os modelos MAI em conjunto com o acelerador de inferência Maia 200 e reportou ganhos de eficiência com esta combinação. A Microsoft também lançou a tecnologia Frontier Tuning, que permite aplicar aprendizagem por reforço dentro dos limites de conformidade do próprio cliente, adaptando o modelo a negócios específicos. A Microsoft citou um caso interno que mostra uma melhoria na taxa de conclusão de tarefas de 13% para 87%, e afirmou que uma versão adaptada para tarefas do Excel igualou o desempenho de modelos de ponta da OpenAI com um custo até 10 vezes inferior, mas estes dados provêm da Microsoft e ainda não foram verificados de forma independente.
Em termos de infraestrutura, a Microsoft lançou as máquinas virtuais Azure Cobalt 200 baseadas em Arm, agora em pré-visualização, que oferecem até 50% de melhoria no desempenho do processador dependendo da carga de trabalho, otimizadas para IA de agentes baseada em Linux. A empresa também adicionou o Azure HorizonDB, um serviço de aplicações de IA compatível com Postgres, com funcionalidades como pesquisa vetorial e capacidade de ligação ao Foundry e Fabric. Uma versão do Fabric com aceleração GPU, em testes internos da Microsoft em maio, mostrou-se sete vezes mais rápida do que três warehouses concorrentes na cloud, mas a empresa não divulgou benchmarks comparativos com concorrentes nomeados.
No domínio dos agentes, a Microsoft disponibilizou o SDK Agent 365 em disponibilidade geral e reorganizou a camada de conhecimento em torno do Foundry IQ (agora em disponibilidade geral), unificando o Work IQ, Fabric IQ, Azure SQL, pesquisa de ficheiros e fontes de dados externas, e adicionou o Web IQ para base em rede em tempo real. Uma nova aplicação de ambiente de trabalho do GitHub Copilot expande o Copilot de chat para tarefas de gestão e pedidos de pull, e o Visual Studio está a migrar para a base de software do GitHub Copilot. A Microsoft também apresentou o MDASH, um sistema de análise multi-modelo em pré-visualização privada alargada, que combina o Defender com o GitHub para detetar e corrigir vulnerabilidades, ao mesmo tempo que fornece contentores Windows para isolar agentes sob políticas.
Em termos de hardware, o Surface RTX Spark Dev Box, desenvolvido em parceria com a NVIDIA, oferece cerca de 1 petaflop de capacidade de IA local, enquanto o dispositivo conceptual Project Solara imagina máquinas que executam agentes em vez de aplicações. O CEO da Microsoft, Satya Nadella, apareceu ao lado de Jensen Huang, da NVIDIA, e Cristiano Amon, da Qualcomm. No campo da computação quântica, a Microsoft lançou o chip quântico de próxima geração Majorana 2, afirmando uma vida útil média do qubit de 20 segundos, uma fiabilidade 1000 vezes superior à geração anterior, e a perspetiva de alcançar 1 milhão de qubits num chip do tamanho da palma da mão, com o objetivo de lançar um computador quântico escalável em 2029.
Desde 2023, a dependência da Microsoft em relação à OpenAI definiu a sua estratégia de IA, mas ao possuir modelos próprios e concebê-los em conjunto com os chips Maia e Cobalt, a Microsoft ganhou margem para negociar custos. Atualmente, o MAI ainda não pode substituir a OpenAI ou a Anthropic no Copilot, e estes modelos continuam a processar a maior parte do tráfego de produção. A empresa ainda depende da NVIDIA para a capacidade de computação de treino e de parceiros de chips para os dispositivos que executam os agentes. Cada dado de desempenho partilhado pela Microsoft provém das suas próprias avaliações. O MAI-Thinking-1 está em pré-visualização privada, as máquinas virtuais Cobalt 200 estão em pré-visualização, o MDASH está em pré-visualização privada alargada, o Project Solara é um dispositivo conceptual, e os compradores atualmente não podem testar a maioria destas afirmações com as suas próprias cargas de trabalho. Os resultados do Frontier Tuning baseiam-se num caso interno e necessitam de verificação independente. O cronograma quântico ainda levará vários anos, e os roteiros quânticos de toda a indústria têm sofrido atrasos de longa data.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









