JD e instituições de pesquisa propõem tecnologia RLSD para reduzir custos de treinamento de modelos de raciocínio de IA_Boletins_Wedoany.com

Início Notícias Detalhes

JD e instituições de pesquisa propõem tecnologia RLSD para reduzir custos de treinamento de modelos de raciocínio de IA

2026-04-29 15:15

Favoritos

De acordo com pt.wedoany.com-O alto custo do treinamento de modelos de raciocínio de IA tem sido um desafio constante para as equipas empresariais. Investigadores da JD, em colaboração com várias instituições académicas, propuseram um novo paradigma de treino denominado RLSD, que visa construir agentes de raciocínio personalizados com menos recursos computacionais. Esta tecnologia combina aprendizagem por reforço com autodestilação, resolvendo os problemas de sinal esparso ou elevado custo computacional presentes nas abordagens tradicionais.

rlvr

Em experiências, o modelo treinado com RLSD obteve uma precisão média de 56,18% em múltiplos benchmarks de raciocínio visual, superando o modelo base e as técnicas padrão de RLVR. O coautor do artigo, Yang Chenxu, explicou que o RLSD desacopla a direção e a magnitude das atualizações, utilizando recompensas verificáveis para determinar a direção e alcançando um feedback refinado token a token através da autodestilação. Isto evita o problema de fuga de informação e mantém a estabilidade do treino.

O RLSD requer apenas uma propagação direta adicional e converge cerca de 2 vezes mais rápido que os métodos tradicionais. É aplicável a tarefas com recompensas verificáveis, como compilação de código ou verificação matemática, e pode fazer uso flexível de informação privilegiada. Esta tecnologia pode ser integrada de forma leve nas estruturas de código aberto existentes, oferecendo às empresas uma nova abordagem para otimizar modelos com dados internos.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com

Informação e Comunicação Engenharia de inteligência artificial

Anterior：Shougang Mining da China divulga resultados de caminhão de mineração autônomo

Próximo：Metrô de Jacarta, na Indonésia, e Metrô de Shenzhen, na China, assinam Memorando de Entendimento para cooperação

Solicitar Cotação

Sistema de monitorização e posicionamento de falhas de isolamento

Shanghai Complee Instrument Co., Ltd.

Solicitar Cotação

Radar Meteorológico de Banda C Série 714CD

Chengdu Zhongdian Jinjiang Information Industry Co., Ltd.

Solicitar Cotação

Solução de Instrumentação de Segurança SIS

Beijing Consen Automation Technology Co., Ltd.

Solicitar Cotação

Jiangsu Zhongtian Technology Co., Ltd.

Solicitar Cotação

Série DYJWGB-50 Dispositivo Terminal Remoto (RTU) com GPRS

Ningbo Donghai Group Co., Ltd.

Solicitar Cotação

WLAN | Ponto de acesso AirEngine 5776-56T

Solicitar Cotação

Subarranjo Tx de Antena de Matriz Faseada em Banda Ka

COXSAT TECHNOLOGY CO., LTD.

Solicitar Cotação

Condução Autônoma FAO

UniTTEC Co., Ltd.

Solicitar Cotação

Solução de Manutenção Inteligente

Chengdu Yunda Technology Co., Ltd.

Solicitar Cotação

Plataforma de Serviços de IA

YUNDING TECHNOLOGY CO., LTD.

Solicitar Cotação /unidade

Radar de Monitoramento Oceânico Multifuncional para Baixa Altura – Medição de Ambiente Dinâmico Marítimo e Atmosférico

Chengdu Dixin Technology Co., Ltd.

Solicitar Cotação

±1100kV Torre de Aço Angular para Corrente Contínua de Ultralta Tensão

Henan Dingli Pole & Tower Co., Ltd.

Recomendações

ELES da Eslovénia participa no projeto de modelo de rede elétrica com IA da UE

IEC Telecom Indonésia estabelece empresa local para expandir serviços de conectividade por satélite

TRAI da Índia impulsiona regulamentação de comunicação V2X para remodelar a conectividade rodoviária inteligente

TCS da Índia faz parceria com Anthropic para expandir implantação de IA generativa empresarial

DOST das Filipinas testará sistema de trânsito inteligente para veículos de emergência

Alibaba Cloud da China ativa região de nuvem pública em Johor, na Malásia

DOST das Filipinas testará sistema de trânsito inteligente para veículos de emergência

A Songyan Power da China lança o robô humanoide de consumo N2 com OpenHarmony

A Westwell expande sua estratégia de "IA + Nova Energia" para operações de carga aérea

Manz Asia entrega com sucesso o primeiro sistema de produção ECD para encapsulamento em painel de 310 mm do mundo

Boletins Mais Recentes

XCMG da China lança solução de mina inteligente com carbono zero no Cazaquistão

Na China, transferência de direitos minerários obtidos por cessão negociada é proibida se detidos por menos de 5 anos

ELES da Eslovénia participa no projeto de modelo de rede elétrica com IA da UE

Acidente no projeto de mina de prata Columba, da Kootenay Silver, no México, interrompe produção

FedEx inaugura instalação logística em Bundaberg, na Austrália, com capacidade para processar 1.500 pacotes por hora

Em 2026, o estado alemão do Sarre testa 44 trens a bateria Flirt Akku

Assembleia Geral da Hemlo Mining aprova migração para a Bolsa de Valores de Toronto

Departamento de Transportes dos EUA anuncia subsídio de 626,7 milhões de dólares para transporte multimodal em junho de 2026

Zoomlion da China obtém pedidos superiores a 1 bilhão de yuans na KOMATEK e aprofunda presença na Turquia

IEC Telecom Indonésia estabelece empresa local para expandir serviços de conectividade por satélite