Тенденции и перспективы развития распределенных вычислений и аналитики Больших данных для поддержки проектов класса мегасайенс

Семинары

Cеминар ЛФВЭ

Дата и время: пятница, 18 января 2019 г., в 11:30

Место: Большой конференц-зал, корпус 215, Лаборатория физики высоких энергий им. В.И. Векслера и А.М. Балдина

Тема семинара: «Тенденции и перспективы развития распределенных вычислений и аналитики Больших данных для поддержки проектов класса мегасайенс»

Докладчик: В.В. Кореньков (ЛИТ)

Аннотация:
Эксперименты на Большом Адронном Коллайдере (БАК) в ЦЕРН играют ведущую роль в научных исследованиях в физике элементарных частиц, ядерной физике и в области аналитики Больших Данных (БД). Глобальная распределенная система для обработки, хранения и анализа данных WLCG -Worldwide LHC Computing GRID — объединяет ресурсы около 180 компьютерных центров в 50 странах мира. Общий объем хранения данных составляет более 1000 Петабайт. Анализ данных ведется с использованием высокопроизводительных комплексов (Грид), академических, национальных и коммерческих ресурсов облачных вычислений, суперкомпьютеров и других ресурсов. Российские центры НИЦ КИ и ОИЯИ участвуют в интеграции распределенных неоднородных ресурсов и развитии технологий БД для обеспечения проектов в физике высоких энергий, астрофизике, биоинформатике и др. В ОИЯИ ведутся работы по сооружению комплекса НИКА, который требует новых подходов к анализу данных. Установки класса мегасайенс создаются в крупных организациях России и других странах (PIC, FAIR, ELI, SKA и др.). Представлен обзор интегрированных инфраструктур мегапроектов и тенденции их эволюции. Внимание уделяется новым направлениям в создании хранилищ данных (DataLake), интеграции БД, суперкомпьютерных технологий, методов машинного обучения.