Введение в проект EGEE

28
EGEE-II INFSO-RI- 031688 Enabling Grids for E-sciencE www.eu-egee.org Введение в проект EGEE Олешко С.Б. Петербургский институт ядерной физики г.Гатчина

description

Введение в проект EGEE. Олешко С.Б. Петербургский институт ядерной физики г.Гатчина. Название проекта. EGEE- Enabling Grigs for E-sciencE Развертывание инфраструктуры Грид для науки. Содержание. Основные цели и задачи проекта Функциональность проекта EGEE - PowerPoint PPT Presentation

Transcript of Введение в проект EGEE

Page 1: Введение в проект  EGEE

EGEE-II INFSO-RI-031688

Enabling Grids for E-sciencE

www.eu-egee.org

Введение в проект EGEE

Олешко С.Б.Петербургский институт ядерной физикиг.Гатчина

Page 2: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 2

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Название проекта

EGEE- Enabling Grigs for E-sciencE

Развертывание инфраструктуры

Грид для науки

Page 3: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 3

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Содержание

• Основные цели и задачи проекта

• Функциональность проекта EGEE

• Основные направления работ в проекте

• Ресурсы EGEE-II

• Проект БАК (LHC)

• LCG : LHC computing GRID

• Роль ЦЕРНа в EGEE

• Россия в проекте EGEE

Page 4: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 4

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Основные цели и задачи проекта

• Обеспечить создание высокопроизводительной продукционной GRID инфраструктуры, ее поддержку и развитие

• Предоставлять круглосуточный доступ к вычислительным ресурсам независимо от их географического положения

• Объединить национальные, региональные и тематические грид-разработки в единую цельную грид-инфраструктуру для поддержки научных исследований

• Привлекать пользователей из различных сфер деятельности (медицина, экономика, культура,… ) и обеспечить им высокий уровень обучения и поддержки

Page 5: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 5

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Функциональность проекта EGEE

• Упрощённый доступ. EGEE уменьшает издержки, связанные с разнообразием не связанных между собой систем учёта пользователей. Пользователи могут объединяться в виртуальные организации с доступом к grid – инфраструктуре, содержащей нужные каждому пользователю рабочие ресурсы.

• Выполнение вычислений по требованию. Эффективно распределяя ресурсы, grid-технологии значительно сокращают время

ожидания доступа к ним.• Географически распределённый доступ. Инфраструктура доступна отовсюду, где обеспечен хороший доступ к сети. Ресурсы

становятся широко доступными.• Исключительно большой объём ресурсов. Благодаря согласованности ресурсов и пользовательских групп, в прикладной

работе в рамках EGEE будут доступны ресурсы таких объёмов, какие не может предоставить ни один компьютерный центр.

• Совместное использование программного обеспечения и данных. Благодаря единой структуре вычислительных средств, в EGEE пользователям легко совместно использовать программное обеспечение и базы данных и разрабатывать программное обеспечение.

• Высокий уровень поддержки приложений. Компетентность всех участников EGEE обеспечивает тщательную, всестороннюю

поддержку всех основных приложений.

Page 6: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 6

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Временные рамки проекта

Апрель 2004: проект стартовал

Page 7: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 7

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

EGEE-II: Участники и партнёры

• Более 90 партнёров • 36 стран• 12 федераций

Ведущие международные и национальные Грид проекты в Европе, США, Азии

Всего ~80 потенциальных стран-партнёров, участвующих в партнёрских и других проектах:

–BalticGrid, SEE-GRID, EUMedGrid, EUChinaGrid, EUIndiaGrid, EELA, Naregi, OSG, TeraGrid

Page 8: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 8

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Ресурсы EGEE-II сейчас• 237 центров в 45 странах

• ~36 000 CPU

• ~ 5 PB дисковой памяти, + tape MSS

• распределённое управление

• >200 ВО из различных областей науки

98k зад./день

Page 9: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 9

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Мониторинг узлов EGEE

Page 10: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 10

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Мониторинг узлов EGEE

Page 11: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 11

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Активности в EGEE

• NA2 – Распространение информацииWEB сайты, e-почта, презентации, визиты, конференции ,публикации,...• NA3 – ОбучениеПодготовка обучающих материалов. Проведение курсов• NA4 – Применение и поддержка Grid-структуры в

приложенияхПоддержка приложений использующихся в EGEE. Привлечение

пользователей. Определение общих интерфейсов и инструментария..• SA1 – Поддержка функционирования Европейского GridМониторинг и управление Grid структурой. Распространение Grid ПО и

включение новых вычислительных ресурсов.Поддержка пользователей.• SA2 – Обеспечение сетевыми ресурсамиВзаимодействие с сетевыми провайдерами. Решение сетевых проблем.• SA3 – Интеграция, тестирование и сертификация Grid ПО

• JRA1 – Ре-инжиниринг ППО gLite.Стандартизация созданного ППО. Адаптация и оптимизация под другие

платформы и требования.

Page 12: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 12

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Управление ГРИД EGEE

Операционный центр управления (OMС)

- ЦЕРН - общая координацияЦентры базовой инфраструктуры (CIC) - 5 центров (Великобритания, Франция, ЦЕРН, Италия, Россия)

- обеспечение постоянной (24x7) работы базовых грид-служб, мониторинг системы;

- реализация и контроль за выполнением правил, выработанных OMS

- обеспечение поддержки узлов 2-го уровня

Региональные операционные центры (ROC) ~ 11 центров

- поддержка пользователей и администраторов ресурсов

- координация региональных ресурсов

Page 13: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 13

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Ресурсные центры

CIC

CICCIC

CICCIC

CICCIC

CICCIC

CICCIC

RCRC

RCRC RCRC

RCRC

RCRC

ROCROC

RCRC

RCRC

RCRCRCRC

RCRCRCRC

ROCROC

RCRC

RCRC RCRC

RCRC

RCRC

ROCROC

RCRC

RCRC

RCRC

RCRC

ROCROC

OMCOMC

RC = Resource Centre

Page 14: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 14

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

О ЦЕРНе (CERN)

• Расположен на границе Щвейцарии-Франции. Крупнейший в мире исследовательский центр по ФВЭ

• Работают представители ~500 университетов и институтов (штат~2500чел., 6500 визитеров из ~40 стран)

• Сделано много открытий и разработано много новых технологии, включая WWW.

• Большинство Нобелевских лауреатов по физике последних лет так или иначе связаны с ЦЕРН.

Page 15: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 15

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Большой адронный коллайдер (LHC)

• Длина окружности ускорителя – 27 км.• Запуск – в 2008 году

Page 16: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 16

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Эксперименты на БАК

Page 17: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 17

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Место для детектора ATLAS

Page 18: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 18

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Детектор ATLAS

Page 19: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 19

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Данные БАК

• 40 000 000 столкновений в секунду

• После фильтрации, остаётся только 100 событий в секунду

• Объём оцифрованных данных для одного события ~ 1Мб

• За год необходимо записать 1010 событий = 10 Петабайт данных в год

1 Мегабайт (1MB) Цифровая фотография

1 Гигабайт (1GB) = 1000MB DVD фильм

1 Терабайт (1TB) = 1000GB Объём всех книг, изданных за год в мире

1 Петабайт (1PB) = 1000TB Производит за год один эксперимент БАК

1 Экзобайт (1EB) = 1000 PB Объём информации, которую производит за год всё человечество

CMS LHCb ATLAS ALICE

Page 20: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 20

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Необходимость ГРИД для БАК

• Объём получаемых данных БАК соответствует 20 миллионам записанных CD дисков в год. Где их хранить?

• Анализ данных LHC потребует вычислительных мощностей, эквивалентных мощности 100000 самых современных процессоров. Где их взять?

• Ресурсы ЦЕРН уже сейчас составляют более 1000 2-х процессорных ПК и 1 Пб памяти на дисках и на лентах. Но этого мало!!!

Выход – объединение вычислительных ресурсов физиков всего мира

Конкорд(15 Км)

Воздушный шар(30 Км)

Стопка CD дисков с данными БАК за 1 год (~ 20 Км)

Монблан(4.8 Км)

Page 21: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 21

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Роль ЦЕРНа в проекте EGEE

• Эксперименты на LHC предполагают беспрецедентное использование компьютеров для хранения и обработки данных.

• LHC Computing GRID (LCG проект) и GRID технологии являются ответственностью CERN. ППО LCG-2 было выбрано как стартовая версия для EGEE (EGEE-0).

По этим принципам CERN является головным партнером в EGEE проекте.

Page 22: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 22

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Распределение время/ВО

Page 23: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 23

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Распределение время/регион

Page 24: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 24

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Участие России в проекте EGEE

В целях обеспечения полномасштабного участия России в этом проекте был образован консорциум РДИГ (Российский ГРИД для интенсивных операций с данными – Russian Data Intensive GRID, RDIG) для эффективного выполнения работ по проекту и развитию в России инфраструктуры EGEE, с вовлечением на следующих этапах проекта других организаций из различных областей науки, образования и промышленности.

Консорциум РДИГ, согласно принятой в проекте EGEE структуре, входит в проект в качестве региональной федерации “Россия” (“Russia).

Сейчас в РДИГ (http://www.egee-rdig.ru) входят 15 институтов (в 2003 году - 8)

Page 25: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 25

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

РДИГ (кол-во заданий)

Page 26: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 26

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

РДИГ (% кол-ва заданий/сайт)

Page 27: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 27

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Заключение

• EGEE – самая большая в мире грид-инфраструктура, используемая в интересах многих областей науки

• Постоянно растёт число виртуальных организаций и приложений

• Россия участвует в деятельности EGEE• РДИГ – первая реальная ГРИД-инфраструктура в России• Первый ГРИД-проект всероссийского уровня , поддержанный

Правительством России• Для участников – опыт работы в большом общеевропейском

проекте по эгидой ЕС

Page 28: Введение в проект  EGEE

Saint-Petersburg, EGEE tutorial, 6.12.2007 28

Enabling Grids for E-sciencE

EGEE-II INFSO-RI-031688

Европейская Грид инициатива (EGI)

• Необходимость подготовки постоянной, общей Грид инфраструктуры

• Поддержка долговременной Европейской e-инфраструктуры, независимо от выполняемых краткосрочных (1-2 года) проектов

• Координация интеграции и взаимодействия между Национальными Грид Инфраструктурами (NGI)

• Управление Европейским уровнем производственной Грид инфраструктуры для широкого круга научных дисциплин совместно с NGIs.