De acordo com pt.wedoany.com-A IA está trazendo uma série de novas demandas para os centros de HPC. Os pesquisadores não estão mais focados apenas no treinamento de modelos; muitos estão começando a buscar serviços de inferência e agentes de IA como parte de suas pesquisas diárias. Para os centros de HPC, isso significa descobrir como fornecer esses serviços em larga escala e fazê-los funcionar em conjunto com a infraestrutura de HPC existente.
Essas questões foram o foco principal da sessão "Plataformas de IA Científica: Inferência, Agentes e Serviços de IA em Instalações de HPC" na conferência TPC26. A discussão reuniu palestrantes de laboratórios nacionais, centros de supercomputação, indústria e instituições de pesquisa, que compartilharam como estão construindo e operando serviços de IA para pesquisadores. Os participantes incluíram o Dr. İlkay Altıntaş, Diretor Científico de Dados do San Diego Supercomputer Center e Pesquisador Principal do National Data Platform; o Dr. Venkat Vishwanath, Líder de IA do Argonne Leadership Computing Facility; o Dr. Jason Haga, do National Institute of Advanced Industrial Science and Technology (AIST) do Japão; Samantha Sury, da HPE; a Dra. Paola Buitrago, do Pittsburgh Supercomputing Center; o Dr. Shoaja Fan; e o Dr. Dan Stanzione, Diretor Executivo do Texas Advanced Computing Center (TACC).

O Dr. Altıntaş iniciou a discussão com uma visão geral do National Research Platform, que fornece acesso a modelos de IA para pesquisadores por meio de serviços compartilhados. O Dr. Altıntaş afirmou que a plataforma deve ser vista em três níveis distintos, incluindo a camada de infraestrutura, que envolve computação, armazenamento e tudo ao redor, semelhante aos serviços de HPC, mas, em vez de horas-núcleo, considera tokens. O National Research Platform atualmente oferece nove modelos abertos, com o objetivo de capacitar pesquisadores a obter recursos de IA sem precisar implantar e gerenciar sua própria infraestrutura. Este tema foi recorrente ao longo da conferência, com os palestrantes discutindo como os centros de HPC estão se adaptando à crescente demanda por serviços de inferência e ferramentas de IA.
Construir esses serviços também requer infraestrutura projetada especificamente para inferência. A apresentação do Dr. Haga focou em fornecer uma visão geral dos esforços do Japão para avaliar uma série de aceleradores de IA e tecnologias de inferência por meio de um programa nacional de bancada de testes. Haga afirmou que o programa visa avaliar diversos aceleradores de IA de ponta e desenvolver tecnologias para fornecer serviços de inferência de alto desempenho, bem como métodos para acessar esses diferentes recursos computacionais. Para os pesquisadores, o hardware em si é muitas vezes secundário; o importante é se o serviço está disponível, tem bom desempenho e pode ser integrado ao seu trabalho, sem que precisem se tornar especialistas. O projeto visa ajudar pesquisadores a experimentar diferentes plataformas de hardware de IA e fornecer uma estrutura para implantar serviços de inferência, estudando como um portfólio mais amplo de aceleradores pode suportar futuras cargas de trabalho de IA científica.
As apresentações destacaram o desafio enfrentado pelas instalações de HPC: os pesquisadores não se importam com qual hardware está sendo executado, mas esperam cada vez mais que os serviços de IA estejam disponíveis quando necessário.

Embora a discussão tenha se concentrado principalmente em infraestrutura e tecnologia, o Dr. Stanzione acredita que as questões econômicas podem, no final, se tornar o maior desafio. Stanzione observou que os tokens, na verdade, custam dinheiro, e quando as pessoas usam muitos tokens, muitos laboratórios discutiram a possibilidade de abandonar seu uso nos últimos meses. À medida que os serviços de IA se tornam mais amplamente disponíveis, o uso aumenta rapidamente, trazendo um conjunto diferente de pressões em comparação com as cargas de trabalho tradicionais de HPC, especialmente quando as instituições tentam equilibrar demandas crescentes com orçamentos limitados. De acordo com Stanzione, o desafio de longo prazo pode não ser construir plataformas de inferência, mas encontrar maneiras de operá-las de forma sustentável. Ele afirmou que, entre muitas questões técnicas, o aspecto financeiro pode, a longo prazo, impulsionar as ações mais do que qualquer outro fator.
A discussão mostrou como as instalações de HPC estão se adaptando para a próxima fase das aplicações de IA. Embora grande parte da atenção da indústria ainda esteja focada em modelos e hardware, os palestrantes retornaram repetidamente às questões práticas e inevitáveis de fornecer IA como um serviço. Desde plataformas de inferência compartilhadas e bancadas de teste de aceleradores até a economia do consumo de tokens, os desafios discutidos nas apresentações sugerem que o futuro da IA científica pode depender tanto de operações e infraestrutura quanto dos avanços nos próprios modelos.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









