De acordo com pt.wedoany.com-A KT anunciou no dia 16 que desenvolveu em conjunto com a Universidade da Coreia o benchmark de segurança "KSAFE-MM" para modelos de linguagem multimodal de grande escala, destinado a avaliar a segurança de modelos de inteligência artificial no contexto sociocultural coreano.
Este benchmark combina questões sociais e contexto cultural coreanos, sendo composto por dois subconjuntos: "KSAFE-MM-G" converte riscos globais comuns para o contexto cultural coreano para avaliação; "KSAFE-MM-C" é especificamente direcionado a temas exclusivos da sociedade coreana, como fraudes de depósito de aluguel (jeonse) e a disputa de Dokdo. O conjunto de dados total contém 14.135 amostras de avaliação, sendo atualmente o maior conjunto de dados de avaliação de segurança multimodal em coreano na Coreia do Sul. Até o momento, este benchmark já validou 12 modelos globais de linguagem multimodal de grande escala, incluindo Gemma e HyperCLOVA X.

Este benchmark é implementado por meio de um processo automatizado e universal. O "KSAFE-MM" realiza um processo automatizado de quatro etapas que abrange todo o ciclo, incluindo coleta de tópicos sensíveis baseada em comunidades locais, geração de consultas baseada em modelos, geração de imagens sintéticas e geração de consultas de jailbreak destinadas a contornar dispositivos de segurança ou restrições éticas de IA. A KT afirma que esse processo, sem necessidade de especialistas em áreas culturais específicas, permite construir rapidamente benchmarks de segurança que refletem as características locais, reduzindo custos e aumentando a eficiência.
A equipe de pesquisa conjunta da KT e da Universidade da Coreia, ao aplicar o mesmo processo em um experimento piloto em japonês, demonstrou que o benchmark pode ser aplicado imediatamente a qualquer círculo cultural global. Os resultados da pesquisa podem ser usados para verificação de segurança em ambientes reais de serviços de IA, testes de red team e avaliação de modelos de barreira de proteção. Os resultados da pesquisa e o benchmark serão divulgados nas plataformas arXiv e Hugging Face.
Park Jae-hyung, chefe do Frontier AI Lab do KT AX Future Technology Institute, afirmou que a divulgação pública do benchmark não se trata apenas de distribuir dados simplesmente, mas visa estabelecer as bases para o desenvolvimento conjunto de todo o ecossistema de pesquisa em segurança de IA. Ele espera que o KSAFE-MM se torne um padrão universal para a academia e a indústria verificarem a segurança da IA no contexto da língua e cultura coreanas.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









