Technological Methods Analysis in the Field of Exaflops ...Тезис 1. darpa...

9
© 2017. Molyakov Andrey Sergeevich & Eisymont Leonid Konstantinovich. This is a research/review paper, distributed under the terms of the Creative Commons Attribution-Noncommercial 3.0 Unported License http://creative commons. org/licenses/by-nc/3.0/), permitting all non-commercial use, distribution, and reproduction inany medium, provided the original work is properly cited. Technological Methods Analysis in the Field of Exaflops Supercomputers Development Approaching By Molyakov Andrey Sergeevich & Eisymont Leonid Konstantinovich Peter the Great St. Petersburg Polytechnic University Abstract- In this article author describe new supercomputing developing roadmaps, illustrates how to solve Moore’s Law problem. Author shows two different ways of creating new high-productive clusters: evaluative and revolutionary. There are new era so-called “Post Moore”. It means specialists all over the World should together in collaboration create new electronic components, architecture principles, design criteria and etc. GJCST-E Classification: B.7.1 TechnologicalMethodsAnalysisintheFieldofExaflopsSupercomputersDevelopmentApproaching Strictly as per the compliance and regulations of: Online ISSN: 0975-4172 & Print ISSN: 0975-4350 Publisher: Global Journals Inc. (USA) Type: Double Blind Peer Reviewed International Research Journal Volume 17 Issue 2 Version 1.0 Year 2017 Information & Technology Global Journal of Computer Science and Technology: H

Transcript of Technological Methods Analysis in the Field of Exaflops ...Тезис 1. darpa...

Page 1: Technological Methods Analysis in the Field of Exaflops ...Тезис 1. darpa (представляет военных и ... Тактовая частота(ghz) 0.7 0.85 1.6 2.3

© 2017. Molyakov Andrey Sergeevich & Eisymont Leonid Konstantinovich. This is a research/review paper, distributed under the terms of the Creative Commons Attribution-Noncommercial 3.0 Unported License http://creative commons. org/licenses/by-nc/3.0/), permitting all non-commercial use, distribution, and reproduction inany medium, provided the original work is properly cited.

Technological Methods Analysis in the Field of Exaflops Supercomputers Development Approaching

By Molyakov Andrey Sergeevich & Eisymont Leonid Konstantinovich Peter the Great St. Petersburg Polytechnic University

Abstract- In this article author describe new supercomputing developing roadmaps, illustrates how to solve Moore’s Law problem. Author shows two different ways of creating new high-productive clusters: evaluative and revolutionary. There are new era so-called “Post Moore”. It means specialists all over the World should together in collaboration create new electronic components, architecture principles, design criteria and etc.

GJCST-E Classification: B.7.1

TechnologicalMethodsAnalysisintheFieldofExaflopsSupercomputersDevelopmentApproaching

Strictly as per the compliance and regulations of:

Online ISSN: 0975-4172 & Print ISSN: 0975-4350Publisher: Global Journals Inc. (USA)Type: Double Blind Peer Reviewed International Research JournalVolume 17 Issue 2 Version 1.0 Year 2017Information & TechnologyGlobal Journal of Computer Science and Technology: H

Page 2: Technological Methods Analysis in the Field of Exaflops ...Тезис 1. darpa (представляет военных и ... Тактовая частота(ghz) 0.7 0.85 1.6 2.3

Technological Methods Analysis in the Field of Exaflops Supercomputers Development

Approaching

© 2017 Global Journals Inc. (US)

Globa

l Jo

urna

l of C

ompu

ter Sc

ienc

e an

d Te

chno

logy

V

olum

e XVII

Issu

e II

Versio

n I

37

Year

2017

(

)H

Molyakov Andrey Sergeevich α & Eisymont Leonid Konstantinovich σ

I. Innovative Projects of New Supercomputers Developing

аиболее заметным явлением в начале работ поэкзамасштабной и экзафлопсной тематике былопроведение рабочих групп по инициативе

DARPA. Далее, в 2010 году, была запущена новаяпрограмма DARPA UHPC развития экзамасштабныхтехнологий. В этой программе участвуют четырегруппы, каждая из которых, состоит из коммерческихкомпаний, национальных лабораторий и университетов: проект Runnemede (Intel), проект Echelon (NVIDIA/Cray), проект X-calibr (Лаборатория Sandia), проект Angstrom (MIT).

В соответствии с исторически сложившимисятрадициями, DARPA в своих работах заняла нишуинновационных проектов, а DOE (Министерствоэнергетики США) проводило большей частьюэволюционную линию по созданию рекордно крупныхсуперкомпьютеров, прежде всего в двухультракомпьютерных центрах в Окриджской иАргонской лаборатории.

Тезис 1. DARPA (представляет военных иразведывательные службы США) не справилась вполной мере с задачами создания перспективных системпетафлопсного уровня реальной производительности(программа DARPA HPCS) и настолько неудачно началаработы по экзамасштабным технологиям (программыDARPA UHPC и OHPC), что можно говорить об ихтупиковости и близком преждевременном закрытии. Всвязи с этим, ответственность за выполнение работ поэкзамасштабной тематике теперь возлагается на DOE.

Тезис 2. Неудачи начала работ поэкзамасштабным системам объясняются низкимуровнем инновационности проектов DARPA UHPC ислабым вовлечением талантливых разработчиков в этипроекты.

Тезис 3. Инновационный стиль в виде работинновационнного характера, от алгоритмов иприкладного программного обеспечения до элементно-конструкторской базы, противопоставляется стратегииэволюционного развития за счет постепенного введенияулучшений, “инкрементному” развитию, котороесчитается тупиковым в долгосрочной перспективе, новыгодно экономически основным промышленнымвендорам (Intel, IBM, Cray, NVIDIA и др.).

Тезис 4. В качестве ключевой темыпродвижения к экзамасштабным системам ставитсявопрос создания новых моделей организации ивыполнения параллельных программ. Выделяются дваподхода, эволюционный и инновационный.

Тезис 5. Переход инициативы по работамэкзамасштабной тематики к DOI и необходимостьпреобладания в этих работах инновационного подходаобъясняется тем, что США могут потерять мировоелидерство в данной области, а это место будетнемедленно занято другими странами, вероятнее всегоиз Азиатско-Тихоокеанского региона. Эти страныпойдут на любые риски в выборе наиболееоптимальных стратегий, поскольку находятся в ролидогоняющих. В связи с этим, подключение самоймощной в США научно-технической инфраструктурыDOE в виде не только научных национальныхлабораторий, но и национальных лабораторий ядерногооружейного комплекса к решению этой ставшейважнейшей проблемы современности, которые также искоординируют работу ведущих университетов ипромышленных вендоров, – принципиальнонеобходимо.

Тезис 6. Стремление к мировому лидерствуСША в области экзамасштабных систем и ихприложений должно быть совмещено с международнымсотрудничеством по этой линии с целью эффективногоиспользования мировых интеллектуальных ресурсов идостижений.

Тезис 7. Разработка экзамасштабных систем итехнологий их применения для решения важнейшихзадач к концу 2020 года рассматривается каккачественный переход в области основ и технологий, организации соответствующей инфраструктурыисследований и разработок для создания системзеттафлопса и йотафлопса, в которых будут примененыновейшие достижения нанотехнологий.

Н

Authorα: e-mail: [email protected]

Abstract- In this article authors describe new supercomputingdeveloping roadmaps, illustrate how to solve Moore’s Law problem. Author shows two different ways of creating new high-productive clusters: evaluative and revolutionary. There are new era so-called “Post Moore”. It means specialists all over the World should together in collaboration create new electronic components, architecture principles, design criteria and etc.

Page 3: Technological Methods Analysis in the Field of Exaflops ...Тезис 1. darpa (представляет военных и ... Тактовая частота(ghz) 0.7 0.85 1.6 2.3

© 20 7 Global Journa ls Inc. (US)1

Globa

l Jo

urna

l of C

ompu

ter Sc

ienc

e an

d Te

chno

logy

V

olum

e XVII

Issu

e II

Versio

n I

38

Year

2017

(

)H

Technological Methods Analysis in the Field of Exaflops Supercomputers Development Approaching

Таким образом, для формирования мнения опроектах экзафлопсной тематики можно теперьрассматривать, в основном, работы DоE. Формированиекрупного проекта DoE по созданию экзафлопсноймашины на эволюционных или инновационныхпринципах задерживается. Сейчас выполняетсямножество небольших проектов по разнымнаправлениям большим количеством групп.

В целом, в настоящее время в DoE имеютсяследующие направления работ по тематикеэкзамасштабных систем (это сейчас называют “exascale ecosystem”, экзамасштабная экосистема, которые в2013 году должны дополниться направлением OS/R или«Экзамасштабные операционные системы и системыподдержки выполнения программ» (Exascale Operating and Runtime Systems).

Далее приведем краткие сведения об этихпрограммах. Эта информация специальноструктурирована так, чтобы в будущем вноситьдальнейшие уточнения.

В части технологии создания процессора этотпроект связан с работами по линии архитектуры Intel MIC (Many Integrated Core), которая в настоящее времястала называться Xeon Phi. Это микропроцессор сомножеством облегченных 4-х тредовых ядер с системойкоманд X86 и векторными расширениями. В 2012 годувышел образец сопроцессорной платы Knight Corner стаким микропроцессором, изготовленным потехнологии 22 нм, имеющим более 50 процессорныхядер. Эта плата содержит 8 Гбайт памяти GDDR5 иподключается через шину PCI Express. Производительность такого сопроцессора около 1 Тфлопс. Этот сопроцессор виден приложению как

вычислительный узел, работающий под управлениемОС Linux, так что его использование ожидается болеепростым, чем современных графических процессоров.

В части технологии памяти Intel в этом проектебудет работать с Micron Technologies над созданиемгибридного куба памяти (HMC, Hybrid Memory Cube). Это вариант технологии 3D сборки кристалловпроцессоров и памяти, что должно значительноповысить пропускную способность интерфейсапроцессора с памятью и снизить задержки обращений кпамяти.

Например, экзамасштабные приложенияразрабатываются уже в настоящее время в центрахразработки, как и специальное оборудование для этихприложений. Так что вероятен и вариант появления неодного (например, в Окриджской лаборатории), анескольких образцов экзамасштабных систем, причем вэтих центрах со-разработки, т.е. в Лос-Аламосской иАргонской лаборатории, лаборатории Сандиа.

Кстати, Лос-Аламосская лаборатория илаборатория Сандиа образовали недавно совместныйцентр ASEC, причем лаборатория Сандиа такжесотрудничает с Окриджской лабораторией в рамкахработ образованного в DoE Института перспективныхархитектур и алгоритмов. Лаборатория Сандиа и Лос-Аламосская лаборатория имеют мощныйпроизводственный комплекс, выполняющий все видыработ, включая и работы по нанотехнологиям.

В таблицах 1 и 2 приведены “дорожные карты” реализации суперкомпьютеров эволюционногонаправления в Окриджской и Аргонской лабораториях. Рубеж в 30 PFlops взят в 2012 году.

Таблица 1: Оценки характеристик систем, создаваемых на этапах экзафлопсного проекта с применением тяжелых” процессорных ядер

Системнаяхарактеристика

Годы внедрения системы2009 2011 2015 2018

Общая пиковаяпроизводительность 2 PF 20 PF 100-200 PF 1 EF

Общий объемоперативной памяти

0.3 PB 1 PB 5 PB 10 PB

Пиковаяпроизводительность узла 125 GF 200 GF 400 GF 1-10 TF

Пропускная способность памяти узла 25 GB/s 40 GB/s 100 GB/s 200-400 GB/sКоличество ядер в узле(параллелизм узла) 12 32 0(100) 0(1000)

Пропускная способностьсетевого интерфейса узла 1.5 GB/s 10 GB/s 25 GB/s 50 GB/s

Количество узлов в системе 18,700 100,000 500,000 0(Million)Количество ядер в системе (общий параллелизм) 225,000 3 Million 50 Million 0(Billion)Общая мощностьпотребления 6 MW ~10 MW ~10 MW ~ 20 MW

Объемвнешней памяти 15 PB 30 PB 150 PB 300 PB

Пропускная способность ввода-вывода 0.2 TB/s 2 TB/s 10 TB/s 20 TB/sMTTI, время междупрерываниями по сбою или отказу системы

Days Days Days 0(1Day)

Page 4: Technological Methods Analysis in the Field of Exaflops ...Тезис 1. darpa (представляет военных и ... Тактовая частота(ghz) 0.7 0.85 1.6 2.3

© 2017 Global Journals Inc. (US)

Globa

l Jo

urna

l of C

ompu

ter Sc

ienc

e an

d Te

chno

logy

V

olum

e XVII

Issu

e II

Versio

n I

39

Year

2017

(

)H

Technological Methods Analysis in the Field of Exaflops Supercomputers Development Approaching

В Окриджской лаборатории потенциалмодернизации суперкомпьютера ХС30 до 100 Pflops, адля Аргонской лаборатории разрабатывается новыйсуперкомпьютер IBM BlueGene/R спроизводительностью до 100 Pflop/s, он будет введен вэксплуатацию в 2015 году. Кроме того, фирма IBM

готовит новый вариант суперкомпьютера на базе новогомикропроцессора Power 8. По информации изэкспертной среды, это 256 ядер, ядра трех типов –суперкскалярные, легкие и легкие с векторнвмиускорителями, все ядра 6-тредовые.

Таблица 2: Оценки характеристик систем, создаваемых на этапах экзафлопсного проекта “легкого” направления

Системнаяхарактеристика

Годы внедрения системы2004 2007 2012 2015 2019

Наименование системы/этапа BG/L BG/P BG/Q (ONE) TWO THREEОбщая пиковаяпроизводительность 0.37 PF 1 PF 27 PF 309 PF 1127 PF

(1.127 EF)Общий объемоперативной памяти 0.034 PB 0.151 PB 2.147

PB8.590 PB 25.770

PBПиковаяпроизводительность узла 5.6 GF 14 GF 205 GF 1.178 TF 4.301 TF

Пропускная способностьпамяти узла 5.6 GB/s 13.6 GB/s 42.6 GB/s ? ?

Объем памяти узла 0.5 GB 2-4 GB 16 GB ? ?Количество ядер в узле(параллелизм узла) 2 4 16 32 96

Тактовая частота (GHz) 0.7 0.85 1.6 2.3 2.8Количество запускаемыхопераций за такт в ядре 4 4 8 16 16

Пропускная способностьсетевого интерфейса узла

2.1GB/s –3D torus0.7GB/s – tree

5.1GB/s-3D torus1.7GB/s-tree

40 GB/s-5D torus4 GB/s extlinc

? ?

Количество узлов в системе 65536 73728 131072 262144 262144Количество ядер в системе(общий параллелизм)

0.13Million

0.3Million

2Million

8Million

25Million

Общая мощность потребления 2.5MW 4.8MW 8MW 30MW 40MWКоличество узлов в стойке 1024 1024 512 1024 1024Количество стоек 64 72 256 256 256

Пиковая производительность стойки 5.7 TF 14 TF 105 TF 1.206PF

4.404PF

За 2011−2014 годы NUDT разработал новуюсуперкомпьютерную систему Tianhe-2 − шифр «ПолетДракона», с производительностью 30 Petaflops.Ожидается использование микропроцессоров Godson-3C или Godson-4A, мультитредовых микропроцессоровFT-1500, новой версии коммуникационной сети Arch. Эта разработка противопоставляется американскомусуперкомпьютеру IBM Sequoia на 18-ядерных (4 тредав ядре) микропроцессорах PowerPC и 5-мерной сетитипа тор. Ставится цель превзойти американскийсуперкомпьютер в 1.5 раза. Есть сведения, что этотсуперкомпьютер уже практически готов, но этоскрывается.

До 2016 года четырем ведущимисследовательским центрам Китая МинистерстваОбороны, Министерства энергетики и Министерстваобразования и промышленных технологий Китая ( этоNational Air and Space Intelligence Center (NASIC), NUDT, ICT и National Applied Research Laboratories (NARL)) поставлена задача разработать и ввести вэксплуатацию вычислительный комплекс под кодовымназванием «Тайваньский ястреб» производительностью

100 Petaflops. При этом важнейшую роль должнасыграть тайваньская фабрика TSMC; она на 60% принадлежит Китаю, на 20% принадлежит Японии, на20% − иностранному капиталу США и ЗападнойЕвропы (по данным конца 2011 года). По данным насентябрь 2012 года доля Китая в TSMC составляет уже75−80%.

Гетерогенный суперкомпьютер, включающийтри типа массово-мультитредовых микропроцессоров, классические суперскалярные микропроцессоры, графические микропроцессоры и сетевыемикропроцессоры. Базовый микропроцессор − СТ-2, возможны его модификации. Конструктив 4D c жидкостной системой охлаждения. Здесь будутиспользоваться новые микропроцессоры линейкиGodson-3 и Godson-4 c тяжелыми суперскалярнымиядрами, а также линейка Godson-T с легкими ядрами(типа микропроцессора Tilera).

Начиная с 2007 года Япония не имела систем, входящих в первую десятку списка Top500, т.е. системпетафлопсного класса производительности. Новые

Page 5: Technological Methods Analysis in the Field of Exaflops ...Тезис 1. darpa (представляет военных и ... Тактовая частота(ghz) 0.7 0.85 1.6 2.3

© 20 7 Global Journa ls Inc. (US)1

Globa

l Jo

urna

l of C

ompu

ter Sc

ienc

e an

d Te

chno

logy

V

olum

e XVII

Issu

e II

Versio

n I

40

Year

2017

(

)H

Technological Methods Analysis in the Field of Exaflops Supercomputers Development Approaching

планы развития имели цель изменить эту ситуацию, чтои произошло сначала осенью 2010 года (Tsunami 2.0), апотом летом 2011 года (К-компьютер).

Tsubami 2.0 был о запущен осенью 2010 года ипопал на 4-е место ноябрьского списка Top500 c пиковой производительностью 2,39 PFLOPS ипроизводительностью на тесте Linpack около 1.2 PFLOPS. C 2013 по 2015 планируется разработатьобновленную версию Tsubame 3.0 производительностью 30 PFlops, потребляемаямощность оценивается на уровне 1 MW, а стоимость –около 65 млн. долларов. Суперкомпьютеры Tsubame можно отнести к суперкомпьютерам традиционногокластерного типа. Это направление не считается какосновное, определяющее будущее областисуперкомпьютерных вычислений Японии. Работыведутся в Токийском технологическом институте.

К-компьютер – cамый мощный и статусныйсуперкомпьютер Японии, разработанный по программесоздания перспективных стратегическихсуперкомпьютеров. Головная организация этого проекта- Институт физических и химических исследований(RIKEN). Этот институт наиболее приближен кМинистерству образования, культуры, спорта, науки итехнологии (MEXT), отвечающего засуперкомпьютерную тематику, является егоисследовательским центром. Этот проект можносчитать японским ответом на американский проектDARPA HPCS.

В общей сложности, этот проект создания К-компьютера обошелся в 1 млрд. евро (около 1.5 млрд. долларов). Пиковая производительность К-компьютера~ 10 PFLOPS, производительность на тесте Linpack –8-9 PFLOPS, но самая важная характеристика –возможность достижения на реальных приложенияхпроизводительности около 1 PFLOPS. В качестве такихприложений разработчики ориентировались на 8 прикладных областей, при этом в качестве главныхобластей были выделены нанотехнологии и областьживых систем.

Имеются также партнерские проектыгосударственного и частного сектора, ориентированныена разработку программного обеспечения системэкзауровня. Один из таких проектов – EADI (Exascale Application and Data Initiative), возглавляемый фирмойFujitsu и представляющий собой заключительный этапразработки 10 PFLOPS-ой системы (RITKEN NGS, К-компьютер) для японского правительства. EADI – этокомплексный проект, который включает всенаправления работ Fujitsu по линии экзафлопсныхвычислений.

Особняком стоит проект создания военногосуперкомпьютера экзамасштабного уровня «Стрелавремени», который рассматривается далее в этомразделе. Ведутся работы по био- и квантовымкомпьютерам, но информации о созданиисуперкомпьютеров на этих технологиях пока нет.

До недавнего времени в Западной Европебольшая часть работ в области суперкомпьютеров исуперкомпьютерных вычислений была связана сразработкой того или иного программного обеспечения, множества приложений, а также новыми направлениямив области элементно-конструкторских технологий. Значительная часть специалистов работала и работает вфилиалах американских фирм, причем их привлечениек такой работе со стороны американцев – сознательнаяи широко проводимая политика использованиязарубежных высококвалифицированных ресурсов винтересах США.

Оригинальных инновационныхсуперкомпьютерных проектов, тем более связанных сразработкой собственной элементной базы, не было, хотя возможности для таких работ явно были и есть, нопроводилась политика полностью ориентироваться вэтих вопросах на американские разработки. Исключением была только разработкакоммуникационной сети EXTOLL.

В последние два года ситуация стала меняться, появилась политическая воля иметь в Европе большуюсамостоятельность в такой важнейшей отрасли, каксуперкомпьютерные технологии и их приложения. Всвязи с этим, появились инновационные проектысоздания аппаратных средств мультипетафлопсных иэкзафлопсных систем, например DEEP (c применениемXeon Phi, сети EXTOLL, правда при значительномучастии Intel), Mont Blanc (ядра ARM и графическиеускорители Nvidia). Запущен крупнейший проектразработки программного обеспечения экзамасштабныхсистем CREST.

При этом ряд проектов был запущен с сильнымучастием российской компании Т-платформы, котораякроме кластерных суперкомпьютеров при этомвыходила и на инновационные возможности созданиясобственной элементно-компонентной базы. Естьмнение, что именно это и было главной причинойзанесения компании Т-платформы в марте 2013 года вСША в черный список.

Знаковых успехов по линии созданиямультипетафлопсных суперкомпьютеров ипродвижения к экзафлопсным системам пока нет, хотянесколько крупных кластеров собственной разработкиуже попали в верхнюю часть списка Top500 иорганизовано несколько вычислительных центров, ориентированных в будущем на вычисленияэкзафлопсного уровня.

Самый мощный суперкомпьютерпетафлопсного уровня был недавно разработан в ФГУПРФЯЦ-ВНИИЭФ (г.Саров). Эта организация являетсяреальным лидером в сегменте суперкомпьютероввысшего диапазона производительности. Очевидно, чтоименно на эту организацию сделана ставкаПравительством в вопросе создания суперкомпьютеровуровня 10, 100 и 1000 Пфлопс. Это предприятиеядерного оружейного комплекса и атомной

Page 6: Technological Methods Analysis in the Field of Exaflops ...Тезис 1. darpa (представляет военных и ... Тактовая частота(ghz) 0.7 0.85 1.6 2.3

© 2017 Global Journals Inc. (US)

Globa

l Jo

urna

l of C

ompu

ter Sc

ienc

e an

d Te

chno

logy

V

olum

e XVII

Issu

e II

Versio

n I

41

Year

2017

(

)H

Technological Methods Analysis in the Field of Exaflops Supercomputers Development Approaching

промышленности, что все объясняет. ГК «Росатом» подготовила в мае 2011 года Концепцию поэкзафлопсным технологиям, в ее подготовкеучаствовали несколько организаций (Департаментразвития научно-производственного блока ядкрногооружейного комплекса, ФГУП «РФЯЦ-ВНИИЭФ», ФГУП РФЯЦ-ВНИИТФ, Департамент развитияМинобрнауки России, ФГУП «НИИ «Квант», ИПМ им. М.В.Келдыша РАН, ИПС им. А.К. Айламазяна РАН, НИИСИ РАН, МСЦ РАН, НИИММ им. Н.Г. Чеботаревапри КГУ, ННГУ им.Н.И.Лобачевского, МГУ им. М.В.Ломоносова, МАИ, МГТУ им. Н.Э. Баумана), аФГУП РФЯЦ-ВНИИЭФ была головной.

Т-платформы и МГУ им, М.В.Ломоносова – этодругая группа разработчиков, они недавно подписалиМеморандум о намерениях по сотрудничеству в областисоздания суперкомпьютеров нового поколенияэкзафлопсного уровня. Это конкуренты группы, возглавляемой ФГУП «РФЯЦ-ВНИИЭФ».

Основу еще одной группы составляют ИПМим. М.В.Келдыша РАН и ФГУП НИИ «Квант» – двеорганизации с большой историей в несколькодесятилетий совместных работ. Кроме сотрудничества сФГУП”РФЯЦ-ВНИИЭФ они ведут ряд проектовсамостоятельно, поскольку работают главным образомв других прикладных областях. В последнее время кэтой группе присоединились ЗАО «ВТ-Консалтинг», ООО «Е-троник», СПбГПУ, ФГУП ВО «Внештехника», Центр инженерных разработок физического факультетаМГУ. Всегда было сотрудничество с ИПС им. А.К. Айламазяна РАН и ОАО «НИЦЭВТ», МСЦ.

По инновационной линии пока созданы трицентра соразработки специальных экзафлопсныхсуперкомпьютеров для следующих областей: материаловедение (LANL – головнной исполнитель), перспективные реакторы (ANL – головной исполнитель) и процессы горения (SNL – головной исполнитель). Этонаправление можно охарактеризовать как оптимизациюприменения КМОП-технологий. Ведется множествонебольших проектов фундаментальных исследований, причем одно из основных направлений – новые моделиорганизации параллельных программ для экзафлопсныхсуперкомпьютеров, новые run-time системы иоперационные системы, новые средства параллельногопрограммирования.

Крупная инновационная программа разработкив DoE инновационного экзафлопсногосуперкомпьютера ожидается после 2013 года. Внастоящее время для поддержки основныхпромышленных вендоров запущена предапрительнаяпрограмма FastForward по разработке процессоров имодулей памяти, а также системы хранения данных. Помнению авторов, наибольший интерес представляетпроект фирм Cray/NVIDIA Echelon.

Китай традиционно виртуозно воспринимает, копирует и развивает чужие проекты, применяя приэтом новейшие технологии, которые также часто имеют

иностранное происхождение, часто из Японии, Сингапура и Тайваня. Ведутся эволюционные иинновационные направления. Главный разработчик –Министерство обороны Китая в виде NUDT, университета оборонных технологий Китая.

По эволюционной линии авторы оцениваютотставание китая от США не более 2-3 лет. В настоящеевремя собран суперкомпьютер Tianhe-2 (проект «Полетдракона») с производительностью 30 Пфлопс. Этаразработка пока не афишируется, применяетсяамериканская и собственная элементная база, какмикропроцессоры, так и сетевые СБИС. В 2016 годудолжен быть построен 100 Пфлопсныйсуперкомпьютер (проект «Тайваньский ястреб»).

По инновационной линии пока известно лишьо проекте СТ-2 создания военного суперкомпьютера(проект «Удар грома») экзафлопсного уровняпроизводительности для ршения информационныхзадач, на базе которого посредством изменения балансав используемых микропроцессорах разного типа можнопостроить экзафлопсный суперкомпьютер и для научно-технических расчетов. По имеющимся сведениям, воснову этого проекта были положены российскийпроект СКСН Ангара и американский ParalleX.

Япония более самостоятельна и креативна всвоих проектах, отличается сильной закрытостью. Имеются эволюционное и инновационное направление. По эволюционному направлению был разработансуперкомпьютер Tsubame и K-компьютер (10 петафлопс), причем если в Tsubame используетсяамериканская элементная база, то в К-компьютере –собственная. Намечено создание Tsubame-3 производительностью 30 петафлопс.

По инновационной линии известен пока лишьпроект военного суперкомпьютера «Стрела времени», который разрабатывается Силами самообороны Японии, но за счет изменения состава микропроцессоров ввычислительных узлах может быть переориентированна решение научно-технических задач.

По линии работ по элементной базе пост-Муровской эры достигнуты заметные результаты вобласти сверхпроводниковой электроники, которыеможно расценивать как не хуже американских, поквантовым клеточным автоматам и квантовымкомпьютерам. Традиционно сильны позиции покоммуникационным сетям, где их можно считатьмировым лидером.

Западная Европа ведет проекты экзафлопсныхсуперкомпьютеров эволюционного типа DEEP и Mont Blanc, это новое явление, раньше разработкойсобственных аппаратных средств так активно незанимались, использовалась американская техника. Естьпотенциал организации и самостоятельныхинновационных проектов, но слишком многоспециалистов работают на США и Китай. Обсуждаетсявопрос создания европейского микроэлектронногогиганта типа фирмы Intel. Организовано несколько

Page 7: Technological Methods Analysis in the Field of Exaflops ...Тезис 1. darpa (представляет военных и ... Тактовая частота(ghz) 0.7 0.85 1.6 2.3

© 2017 Global Journals Inc. (US)© 20 7 Global Journa ls Inc. (US)1

Globa

l Jo

urna

l of C

ompu

ter Sc

ienc

e an

d Te

chno

logy

V

olum

e XVII

Issu

e II

Versio

n I

42

Year

2017

(

)H

Technological Methods Analysis in the Field of Exaflops Supercomputers Development Approaching

центров выполнения экзафлопсных вычислений, многоработ ведется по программному обеспечению дляэкзафлопсных систем.

В России пока только сформулированаКонцепция экзафлопсных технологий, крупное целевоефинансирование пока не открыто, но финансированиеотдельных небольших исследовательских проектов уженачалось.

Количество публикаций по этой тематике вРоссии невелико. Судя по открытым данным, отставание России от США в классе задач с хорошейпространственно-временной локализацией обращений кпамяти составляет около 10 раз (тест Linpack, рейтингTop500), а в классе задач с плохой пространственно-временной локализацией – не менее 100 раз (тест BFS, рейтинг Graph500, тест RandomAccess, рейтингHPCChallenge).

II. Supercomputers of Post Moore’s Era

Считается, что предел развития кремниевыхтехнологий – около 5 нм. Имеются оценки, что этотпредел будет достигнут в 2020-2024 году, а проблемыначнутся уже после 2014 года, когда будет достигнутуровень 14-15 нм. Это пессимистические прогнозы.

Оптимистичные прогнозы по развитию КМОП-технологий обычно исходят от фирмы Intel. Внастоящее время Intel и еще три фирмы в мире (TSMC, STMicroelectronics и Samsung) промышленно освоилитехнологию 22 нм, это произошло в 2012 году, в товремя, как по прогнозам это должно было произойти в2016 году.

Важны также планы по усовершенствованиюмодулей памяти, поскольку от них сильно зависитсейчас быстродействие и энергопотребление систем. Фирма Intel ведет работы совместно с фирмой Micron Technologies над созданием гибридного куба памяти(HMC, Hybrid Memory Cube).

Оптимистические прогнозы развитиякремниевых технологий в настоящее время несколькоуспокаивают, но уже не позволяют снятьнапряженность в исследованиях и разработках поновым вариантам элементной базы для логических схеми памяти, вариантов соединения компонентовкристаллов и собственно кристаллов. Cрок достиженияпредела развития кремниевых технологий (окончаниядействия закона Мура) близок и темпы приближения кнему опережают предсказания, что видно на примеретехнологий 22 нм. Работы по созданию новыхтехнологий элементной базы ведутся уже несколькодесятилетий, но в настоящее время ни одна из них неготова для практического использования вместокремниевых технологий и пока речь может идти овыборе тех, которые можно было бы использовать хотябы через 10 лет.

Вместе с тем, для отдельных вычислительныхустройств и даже блоков готовые решения есть, есть иявно приоритетные направления исследований по

элементной базе будущих суперкомпьютеров с уровнемпроизводительности зетта (1021) и более уровня.

Тем не менее, круг занятых в этих работахроссийских специалистов стал обозначаться, началасьработа с ними как с экспертами данной области. Вдальнейшем это поможет дать более точные иобъективные оценки, но уже первый опыт изученияэтих направлений показал, что эту работу уже поравести непрерывно, содействовать координации.

Достижение физических ограничений КМОП-технологий и проводимые работы по новымтехнологиям, которые напрямую связаны с наномироми квантовыми эффектами, сделали вновь актуальныминесколько забытые в разработчикамисуперкомпьютеров в период успешного действия законаМура вопросы по физическим ограничениямпроизводительности вычислительных систем. Приоценке и систематизации работ по разным вариантамперспективной элементной базы и оценке пределовповышения производительности суперкомпьютеров (этобыло одной из задач данного прогноза) оказалосьудобным использовать базовые положения этих работ, аименно: оценку минимальных энергетических затрат(ограничение Лэндауэра); утверждение о зависимостивычислений и выделяемого тепла, т.е. связи междуинформацией и термодинамикой (принцип Неймана-Лэндауэра).

По представленному в разделе материалуможно акцентировать внимание на следующихаспектах:

1. В настоящее время промышленно освоенакремниевая (КМОП) технология 22 нм, но всегочетырьмя фирмами в мире – Intel, TSMC, Samsung и STMicroelectronics. По прогнозу Intel, уровень 5 нм будет достигнут уже в 2020 году. Считается, что дальнейшая миниатюризация невозможна, азакон Мура перестанет работать не позже 2024 года.

2. Эффективное использование КМОП-технологий вближайшее время и вплоть до окончания действиязакона Мура связано с различными приемамиоптимизации: архитектуры (специализированныепроцессоры и ускорители), микроархитектуры; соединений на кристалле и между кристаллами; конструктивов в виде 3D сборки модулей и 3D СБИС. Работы такого типа ведутся ирассматриваются как основные при созданииэкзафлопсных суперкомпьютеров, но они связаны спреодолением слишком многих проблем.

3. Новые решения в области элементно-конструкторской базы (технологий пост-Муровскойэры) могут облегчить создание экзафлопсныхсуперкомпьютеров и стать основой для созданиясуперкомпьютеров следующих уровнейпроизводительности. Основные задачи приразработке новых вариантов элементной базы: повысить частоту работы, снизить

Page 8: Technological Methods Analysis in the Field of Exaflops ...Тезис 1. darpa (представляет военных и ... Тактовая частота(ghz) 0.7 0.85 1.6 2.3

© 2017 Global Journals Inc. (US)

Globa

l Jo

urna

l of C

ompu

ter Sc

ienc

e an

d Te

chno

logy

V

olum

e XVII

Issu

e II

Versio

n I

43

Year

2017

(

)H

Technological Methods Analysis in the Field of Exaflops Supercomputers Development Approaching

энергопотребление, добиться высокого уровняинтеграции.

4. Современные микропроцессоры работают начастоте 3-6 GHz. Устройства на базесверхпроводниковых технологий (RSFQ) могутработать на частоте нескольких сотен GHz, попубликациям известны образцы, работавшие начастотах 20GHz и 80 GHz. Устройства на базеквантовых клеточных автоматов (QCA) могутработать на частоте порядка THz.

5. Теоретический предел затрат на обработку одногобита информации в обычных компьютерахнереверсивного типа составляет kT ln2 (ограничение Лэндауэра, далее для простоты kT). Для устройств на современных КМОП-технологияххарактерна оценка затрат на бит обрабатываемойинформации около 1000000 kT. Из публикацийизвестно о получении на экспериментальномсумматоре на базе RQL-технологии(оптимизированного варианта RSFQ-технологий) затрат на один бит в 1000 kT. Было такжеопубликовано, что при использовании nSQUID технологии (еще один оптимизированный вариантRSFQ) было получено, что на устройстве типасдвиговый регистр затраты на один бит составляютнесколько kT. Это обнадеживающие результаты, носледует признать, что такие технологии покапригодны для создания реконфигурируемыхрешающих полей арифметических устройств дляреализации потоковых вычислений.Работ по продвижению этих технологий еще много, эти технологии будут наверняка применяться всочетании с КМОП-технологиями.

6. Ограничение Лэндауэра и требование обеспеченияработы без сбоев на протяжении длительныхотрезков времени для обычных суперкомпьютеровнереверсивного типа (без специальных мер посохранению энергии при обработке информации) обуславливают верхнюю границу физическидостижимой производительностисуперкомпьютеров в несколько десятков экзафлопс, это ограничение получило название «точкаСтерлинга».

7. Дальнейший рост производительности возможенпосле принципиального пересмотрасуперкомпьютеров и перехода к их реверсивнойорганизации, а также применении хотя бы в видеускорительных блоков квантовых компьютеров ианалоговых компьютеров, возможно такжепостроенных на квантовых принципах.

8. Важнейшим первым в истории вычислительныхсистем примером компьютера последнего типаявляется 128-кубитовый квантовый компьютерканадской фирмы D-Wave. Процессор этогокомпьютера быстрее двух процессоров Xeon (2.6 GHz) на переборном алгоритме глобальной

минимизации на четыре порядка, но требует дляработы температуры, близкой к абсолютному нулю.

9. Работы по вариантам перспективной элементнойбазы пост-Муровской эры отлично организованы нафедеральном уровне в США, активно ведутся вЯпонии. Эти две страны – явные мировые лидеры вэтом плане.

III. Summary

1. Есть значительные проблемы при созданииэкзафлопсных суперкомпьютеров попроизводительности и энергопотреблению (сеть, память и процессор), отказоустойчивости ипродуктивности программирования.

2. Элементно-конструкторская база позволяетиспользовать мультиядерность (1000-кратно), повышенную пропускную способность кристалловпо вводу-выводу (3D-компоновка, TSV), оптическиесоединения между платами («Holley», WDM-технологии) и внутри кристаллов (нанотрубки), новая технология памяти (HMC, NVRAM).

3. Есть архитектурно-программные решения –массовая мультитредовость и модель разделениявычислений/доступа к данным (MT и DAE), потоковость (MD/DF), локализация данных ивычислений (RPC), гибридность/функциональнаяспециализация (10x10), глобально-адресуемаяпамять (PGAS/APGAS/HPGAS), интеллектуальнаяотказоустойчивость (Resilience).

4. Подходы к решению – эволюционный (DoE NNSA/ASCR), умеренно-инновационный (DoE ASCR), агрессивно инновационный (DARPA), инновационно-эволюционный&эмуляционный (DoE ASCR, NSF).

5. Cложность проблем и неочевидность решений зарубежом потребовала привлечения ресурсов нетолько на федеральном уровне, но и нарегиональном и мировом. Цели работ поэкзамасштабной тематике (DARPA) и экзафлопсной(DoE) имеют отличия, но методы их достижения вомногом совпадают. Зарубежный опыт показывает, что в организационном плане важным являетсяцентрализованная формулировка целей работ иуправления ими (формирование и поддержка«силового поля»). Работы по экзафлопснымсуперкомпьютерам находятся на переходном этапеот применения только кремниевых технологий кпереходу на применение пост-Муровскихперспективных технологий.

References Références Referencias

1. Моляков, А.C. Тихоокеанско–азиатскиепетафлопсы / А.C. Моляков, В.С. Горбунов, П.В. Забеднов // Открытые системы. СУБД. – 2011. –№7. – С. 26 – 29.

Page 9: Technological Methods Analysis in the Field of Exaflops ...Тезис 1. darpa (представляет военных и ... Тактовая частота(ghz) 0.7 0.85 1.6 2.3

© 20 7 Global Journa ls Inc. (US)1

Globa

l Jo

urna

l of C

ompu

ter Sc

ienc

e an

d Te

chno

logy

V

olum

e XVII

Issu

e II

Versio

n I

44

Year

2017

(

)H

Technological Methods Analysis in the Field of Exaflops Supercomputers Development Approaching

2. Олифер, В.Г.. Компьютерные сети / В.Г. Олифер. –СПб.: Изд – во Питер, 2004. – 199 с.

3. Моляков, А.С. Исследование скрытых механизмовуправления ОС на различных платформах /А.С. Моляков // Известия Южного ФедеральногоУниверситета..Технические науки. – Таганрог: Изд– во ТТИ ЮФУ, 2007. – №1. – C. 137 – 138.