Производительность СК «Говорун» для задач ИИ выросла более чем на треть
Новости, 08 июля 2025
Пиковая производительность суперкомпьютера «Говорун» в Объединенном институте ядерных исследований достигла 2,2 петафлопс (ПФ) после завершения нового этапа модернизации, реализованного группой компаний РСК совместно с Лабораторией информационных технологий им. М. Г. Мещерякова. Установка нового оборудования открывает широкие возможности для внедрения методов машинного обучения в программу исследований Института.
Такой прирост производительности стал возможен благодаря интеграции двух новых вычислительных узлов на основе уникального серверного решения «РСК Экзастрим ИИ» на жидкостном охлаждении. Эти узлы были созданыспециально для СК «Говорун» с учетом его архитектурных особенностей. Каждый узел содержит восемь графических ускорителей NVIDIA H100. В результате пиковая производительность компоненты СК «Говорун» на графических ускорителях (GPU) выросла на 36%, достигнув 1,4 ПФ в операциях с числами двойной точности, а совокупная мощность всего комплекса составила 2,2 ПФ.
«Серверы «РСК Эксзастрим ИИ», установленные в суперкомпьютере «Говорун», являются современной модульной аппаратно-программной платформой для высокопроизводительных вычислений, направленных на решение научно-инженерных задач с помощью технологий искусственного интеллекта. Мы полагаем, что это позволит более широко и интенсивно внедрять различные методы глубокого обучения при реализации исследовательских программ ОИЯИ», — подчеркнул Сергей Шматов.
Конфигурация серверов «РСК Экзастрим ИИ», установленных в ОИЯИ:
- высота узла 2U,
- два процессора Intel Xeon Platinum 8468 (4-е поколение, 48 ядер, тактовая частота 2,1–3,8 ГГц, объем кэш-памяти 105 МБ),
- 8 графических ускорителей NVIDIA H100 (PCIe, 80 ГБ),
- 1 ТБ оперативной памяти,
- 16 ТБ емкости хранения данных на базе SSD-дисков с интерфейсом NVMe,
- 4 блока питания производства РСК,
- система прямого жидкостного охлаждения разработки РСК.
Параллельно с наращиванием вычислительной мощности была значительно расширена и система хранения данных (СХД) суперкомпьютера «Говорун». В конце 2024 года ее общая емкость увеличилась на 25%, достигнув 10 петабайт (ПБ), благодаря добавлению двух новых узлов RSC Tornado AFS емкостью 1 ПБ каждый. Их важной особенностью является поддержка технологии GPUDirect Storage (GDS), которая обеспечивает прямую передачу данных между хранилищем и памятью графических процессоров.
«Гибкая система конфигурирования, реализованная в СХД RSC Tornado AFS с помощью модуля “РСК БазИС СХД”, позволяет нам достигать наивысшей эффективности в использовании ресурсов суперкомпьютера «Говорун» для решения широкого круга задач, стоящих перед Институтом. Эти задачи могут требовать как высокой скорости для чтения или записи больших порций данных, так и обработки большого числа запросов к небольшим порциям данных. В частности, два новых сервера RSC Tornado AFS уже задействованы в качестве серверов для распределенной файловой системы Lustre и применяются для работы с данными мегасайенс-проекта NICA», — рассказал научный руководитель ЛИТ ОИЯИ Владимир Кореньков.
Расширение вычислительных мощностей и объемов хранения данных суперкомпьютера «Говорун» необходимо для ускорения комплексных теоретических и экспериментальных исследований в области физики высоких энергий, ядерной физики и физики конденсированных сред. Особое значение это имеет для реализации мегасайенс-проекта NICA. Этот уникальный ускорительный комплекс Лаборатории физики высоких энергий им. В. И. Векслера и А. М. Балдина позволит ученым воссоздать в лабораторных условиях особое состояние вещества, в котором пребывала Вселенная в первые мгновения после Большого Взрыва — кварк-глюонную плазму.
Суперкомпьютер «Говорун» — первый в мире гиперконвергентный комплекс для высокопроизводительных вычислений со 100% жидкостным охлаждением на «горячей воде», созданный специалистами ЛИТ ОИЯИ и группы компаний РСК в 2018 году и прошедший к настоящему времени уже несколько этапов модернизации. В основе построения гиперконвергентной системы лежит подход объединения ресурсов для вычисления и хранения на каждом узле системы. Это позволяет наиболее эффективно масштабировать общие ресурсы системы с увеличением количества узлов.
Группа компаний РСК — ведущий российский разработчик и интегратор «полного цикла» инновационных сверхплотных, масштабируемых, энергоэффективных гиперконвергентных решений для суперкомпьютеров и высокопроизводительных вычислений (HPC), центров обработки данных (ЦОД) и интеллектуальных систем хранения данных «по требованию» на основе различных процессорных архитектур и передового жидкостного охлаждения, а также целого ряда собственных ноу-хау.