COVID-19, хроника, комментарии: ЛИТ

Новости, 06 мая 2020

Важнейшей своей задачей Лаборатория информационных технологий ОИЯИ считает обеспечение непрерывности функционирования сетевой и информационно-вычислительной инфраструктуры ОИЯИ и всех компонент Многофункционального информационно-вычислительного комплекса (МИВК). Грид кластеры, облачная инфраструктура и высокопроизводительная платформа HybriLIT, в состав которой входит суперкомпьютер «Говорун», всегда настроены на режим работы «24х7». МИВК предоставляет ресурсы для решения различных задач в рамках многочисленных проектов, в реализации которых принимает участие ОИЯИ.

Для пользователей работа на МИВК всегда осуществляется в удаленном режиме, однако инженерно-технические службы полностью перевести в удаленный режим работы невозможно из-за специфики. Для службы системных администраторов удаленная работа не является чем-то экзотическим или новым. Мы так работали всегда, поскольку требуется обеспечить режим «24х7» без организации круглосуточных смен программистов. Просто изменились соотношения. Если раньше три четверти операций выполнялось с рабочего места, то теперь наоборот, три четверти выполняется из дома. В этом нам помогает система мониторинга, охватывающая все аспекты деятельности МИВК и обеспечивающая его надежную бесперебойную работоспособность. Система мониторинга контролирует все виды оборудования МИВК. При определенных критических условиях срабатывает система оповещения операторов по почте и с помощью SMS. Средства удаленного контроля позволяют операторам быстро проанализировать ошибки и принять меры к их исправлению, а для этого в ЛИТ продолжилось функционирование служб дежурных электриков, холодильщиков и операторов. При переходе ОИЯИ на удаленный режим работы МИВК продолжает функционировать в полном объеме.

В апреле завершилась работа по опытной эксплуатации и вводу в строй нового ленточного робота TS4500 общим объемом 40 ПБ. Работа по установке программного обеспечения велась частично с рабочих мест, частично удаленно. Причем первоначально решения обкатывались на полигоне, а не на действующем оборудовании. Опытная эксплуатация проходила в основном в удаленном режиме. Таким образом, к настоящему моменту система долговременного хранения данных состоит из TS3500 и TS4500 и ориентирована на обслуживание на паритетных началах экспериментов NICA и CMS.

Как известно, распределенные вычисления являются определяющими в процессе обработки и хранения данных экспериментов на Большом адронном коллайдере LHC. Проект WLCG (Всемирный вычислительный грид для LHC) обеспечивает совместную работу более чем 170 ресурсных центров в 42 странах. Сейчас эксперименты, входящие в этот проект, предоставляют вычислительные ресурсы для научных программ борьбы с COVID, в частности, в рамках проекта Folding@Home (F@H, FAH, https://foldingathome.org/), который использует распределенные вычисления для проведения компьютерного моделирования свертывания молекул белка и в марте этого года подключился к исследованию коронавируса 2019-nCoV. В соответствии с рекомендацией целевой группы ЦЕРН «Борьба с COVID», для упрощения процесса предоставления свободных ресурсов проекта WLCG и централизации распределения нагрузки, эксперименты LHC приложили усилия для интеграции своих систем управления рабочей нагрузкой с приложением F@H, поэтому эта деятельность полностью прозрачна для сайтов и не требует каких-либо дополнительных действий с их стороны. Таким образом и грид кластеры Tier1 и Tier2 ОИЯИ, обеспечивающие поддержу экспериментов на LHC, тоже участвуют в этом процессе в единой команде CERN & LHC Computing.

Особо напряженно работает сетевая служба, на плечи которой легло обеспечение бесперебойной работы видео-совещаний, семинаров и просто удаленной работы сотрудников ОИЯИ из дома. Регулярно оказывалась поддержка по вопросам настройки удаленного доступа (VPN соединений) сотрудникам, работающим в дистанционном режиме; произведено переключение VPN соединения с квотированного по трафику на безлимитный, увеличены квоты на почтовых ящиках @jinr.ru и т.п.

Гетерогенная вычислительная платформа HybriLIT, состоящая из учебно-тестового полигона и суперкомпьютера (СК) «Говорун», всегда предоставляла пользователям возможность использовать вычислительные ресурсы и сервисы в удаленном режиме. В период удаленной работы пользователей загрузка всех вычислительных компонент СК «Говорун» не изменилась и по-прежнему близка к 100 процентам.

Активно продолжают свои вычисления сотрудники ЛТФ, проводя расчеты в рамках квантовой хромодинамики (КХД) на решетках, в частности продолжаются работы по изучению свойств сильнокоррелированных систем с помощью решеточного моделирования.

Помимо расчетов для теоретических исследований ресурсы СК «Говорун» продолжают активно использоваться для задач генерации и реконструкции экспериментов мегапроекта NICA. В настоящее время для генерации и реконструкции событий эксперимента MPD используется не только вычислительная CPU-компонента суперкомпьютера «Говорун», но и иерархическая гиперконвергентная система обработки и хранения данных с программно-определяемой архитектурой, реализованная на базе твердотельных дисков Intel SSD с интерфейсом NVMe под управлением файловой системы Lustre, что позволяет значительно ускорить работу с данными. Для управления задачами генерации и реконструкции событий, а также для управления данными применяется промежуточное программное обеспечение DIRAC, которое обеспечивает возможности использования, в том числе «холодного» хранилища под управлением географически распределенной файловой системы EOS. А это, в свою очередь, позволяет подключить систему обработки и хранения данных, реализованную на суперкомпьютере «Говорун», к географически распределенным хранилищам, так называемым Data Lake.

Также, с использованием ресурсов СК «Говорун», была выполнена обработка экспериментальных данных установки ВМ@N, включающая конвертацию сырых данных, реконструкцию и физический анализ, а также генерация и обработка смоделированных данных эксперимента.

Использование гиперконвергентной архитектуры СК «Говорун» позволило развернуть сервис централизованной базы данных установки ВМ@N, использующейся для получения и записи информации, необходимой для проведения моделирования и обработки данных эксперимента. Данный сервис предназначен для удобного управления данными, хранящимися в базе данных, а именно, для просмотра, изменения и визуализации информации о сеансах эксперимента ВМ@N, работы с геометрией детекторов, параметрами эксперимента, а также информации о смоделированных файлах. Также сервис предоставляет суммарную информацию по экспериментальным и моделированным данным.

В совокупности, с учетом теоретических расчетов в рамках квантовой хромодинамики на решетках, генерации и реконструкции данных для всех экспериментов ускорительного комплекса NICA, для реализации этого мегапроекта было задействовано свыше 85 процентов ресурсов СК «Говорун».

Результаты, полученные коллаборациями MPD и ВМ@N с использованием ресурсов СК «Говорун» и сервисов, развернутых на платформе HybriLIT, были представлены удаленно на прошедших коллаборационных митингах.

На базе платформы HybriLIT продолжается активная разработка программного обеспечения и сервисов для совместных проектов ЛИТ и ЛТФ, а именно, виртуальной исследовательской среды для моделирования физических процессов в гибридных наноструктурах, состоящих из сверхпроводников и магнетиков, а также для совместного проекта ЛИТ и ЛРБ по созданию информационной системы (ИС) для анализа поведенческих и патоморфологических изменений в центральной нервной системе (ЦНС) при исследовании воздействия ионизирующего излучения и других факторов на биологические объекты.

Разрабатываемая ИС на базе методов машинного и глубокого обучения и нейросетевых подходов позволит обеспечить хранение и доступ к экспериментальным данным в удобной для комплексного статистического анализа форме.

Использование в рамках создаваемой ИС нейронных сетей и алгоритмов машинного обучения позволит решить сложные задачи медицинской диагностики и нетривиальные задачи патоморфологов при исследовании гистологических препаратов, снижая временные и энергозатраты и исключая человеческий фактор.

Результаты работ в рамках совместного проекта ЛИТ и ЛРБ были доложены молодыми сотрудниками лабораторий Д. М. Маровым, А. И. Аникиной, А. С. Булатовым, И. А. Колесниковой на XXVII Научно-практической конференции студентов, аспирантов и молодых специалистов, проходившей удаленно в государственном университете «Дубна» с 14 по 27 апреля, а доклады Д. М. Марова, А. И. Аникиной стали победителями на подсекции «Распределенные вычисления и аналитика больших данных».

В удаленном режиме работы особую актуальность приобретает обеспечение непрерывности образовательного процесса для студентов и аспирантов Государственного университета «Дубна». Учебно-тестовый полигон платформы HybriLIT активно используется в настоящее время для обеспечения проведения удаленных курсов и выполнения практических занятий в рамках курсов по технологиям параллельного программирования студентами Международной школы по информационным технологиям «Аналитика больших данных».

13 апреля в Nature Physics опубликована работа международной исследовательской группы, в которой, в рамках международного сотрудничества ОИЯИ, участвовали сотрудники ЛИТ — О. Чулуунбаатар и ЛТФ — Ю. В. Попов по проведению кинематически полного экспериментального измерения характеристик комптоновского рассеяния на свободных атомах с помощью высокоэффективного метода ионной импульсной спектроскопии с холодной мишенью (COLd Target Recoil Ion Momentum Spectroscopy, COLTRIMS), и дала ему адекватное теоретическое описание. Экспериментаторы из университета Гёте (Франкфурт на Майне, Германия) направили мощный фотонный пучок синхротрона Petra III (DESY, Гамбург) через сверхзвуковую струю гелия.

Метод COLTRIMS позволил измерить не только импульс рассеянного электрона, но и импульс отдачи иона гелия для отдельных актов рассеяния, что с учетом закона сохранения энергии-импульса дало возможность полностью восстановить кинематические характеристики процесса рассеяния. Кроме того, использование этого метода решило проблему очень малого сечения комптоновской ионизации в диапазоне энергий фотона порядка нескольких кэВ, которое примерно на шесть порядков меньше, чем типичное сечение фотопоглощения. Все это открывает возможности для использования комптоновского рассеяния как еще одного инструмента атомной спектроскопии наравне с такими мощными методами изучения атомов и молекул, как (е, 2е), (ион, ион е) и другие. Теоретическое описание данного явления базируется на расчетах, проведенных на СК «Говорун».

По информации дирекции ЛИТ