GSMA da França desenvolve corpus de telecomunicações com mais de 10 bilhões de tokens para suprir deficiências de modelos de IA
2026-06-26 10:17
Favoritos

De acordo com pt.wedoany.com-A Associação Global de Sistemas de Comunicação Móvel (GSMA), em parceria com a organização francesa de infraestrutura Pleias, desenvolveu o "Corpus Comum de Telecomunicações" (Telco Common Corpus), que contém mais de 10 bilhões de tokens de dados e compilações técnicas relacionadas a telecomunicações, com o objetivo de suprir as deficiências dos modelos de IA existentes na área de telecomunicações.

A GSMA aponta que os atuais testes de referência e plataformas de trabalho para IA já revelaram lacunas em diversas áreas, incluindo a gestão de redes. Para isso, a associação, em conjunto com a Pleias, está promovendo este projeto de corpus para preencher essas lacunas.

O corpus será disponibilizado gratuitamente, oferecendo literatura técnica, patentes, dados abertos e projetos de rede. A GSMA explica que essas informações são de difícil acesso direto por meio de métodos tradicionais de pesquisa, e as tentativas de uso de modelos de ponta existentes geralmente cobrem apenas áreas não relacionadas a telecomunicações.

A GSMA compromete-se que o corpus fornecerá os dados de treinamento abertos necessários para a indústria construir modelos de alto desempenho e infraestrutura de dados abertos. Todos os materiais foram validados, e o projeto é considerado a primeira tentativa de integrar o "sistema de conhecimento público de telecomunicações". A GSMA enfatiza que modelos gerais e de ponta ainda são fracos ao lidar com tarefas de redes operacionais reais, como corrigir problemas ou realizar raciocínios usando processos do Projeto de Parceria de Terceira Geração (3GPP). O corpus visa resolver esses problemas fornecendo dados de treinamento para modelos especializados em telecomunicações e gerando dados específicos com base em regras heurísticas de telecomunicações, em vez de coleta aleatória de dados.

Além disso, a GSMA afirma que o corpus evoluirá com a publicação de novos materiais, ajudando a atender às crescentes exigências de rastreabilidade de fontes, beneficiando assim operadoras, fabricantes de equipamentos, instituições de pesquisa e órgãos reguladores.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com