Hpc 1.24.02.2013.
Transcript of Hpc 1.24.02.2013.
![Page 1: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/1.jpg)
АЛ-31 для СУ-27 Двигатель для «Сухой «Суперджет»
15 лет 6 лет
50 опытных образцов 8 тестовых образцов
3.5 млрд долларов 600 млн евро
![Page 2: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/2.jpg)
Лишь 5% продукции производится без моделирования
"Суперкомпьютерные технологии в современном мире стали стратегической областью, без которой невозможно дальнейшее развитие. Мощность национальных суперкомпьютеров сейчас так же важна, как мощность электростанций или количество боеголовок."
![Page 3: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/3.jpg)
Современное состояние отрасли высокопроизводительных
вычислений
Кизько Б. А., 5085/2, ИИТ, ФГБОУ ВПО СПбГПУ
2013
![Page 4: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/4.jpg)
High-performance computing (HPC)
top500.org
![Page 5: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/5.jpg)
1978 г. - Intel 8086 4.77 Мгц
2004 г. - Intel Pentium 4 3.46 GHz
2005 г. - Intel Pentium 4 3.8 GHz
2005 г. - 2 вычислительных ядра: AMD Athlon 64 X2, IBM PowerPC 970 и Intel Pentium D
Центральные процессоры (CPU)
![Page 6: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/6.jpg)
2005 г. - 2 вычислительных ядра
2007 г. - 4 ядра CPU
2010 г. - 6 ядер (12 ядер для серверов)
2011 г. - 8 ядер (16 ядер)
"Мультиядерная эволюция"
![Page 7: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/7.jpg)
1994 г. - MPI 1 (Интерфейс передачи сообщений)
1997 г. – OpenMP
2010г. – DirectCompute (DirectX 10)2011 г. - C++11 AMP (MS VS 2012)
C#, Java. 2 вида многозадачности.
Как использовать многоядерность?
![Page 8: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/8.jpg)
N - кол-во процессоров (ядер)
"Если мы можем распараллелить 3/4 всей программы, то максимальный выигрыш составит 4 раза."
Закон Амдала ( Amdahl Law)
1
(1+P) + N
PS =
![Page 9: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/9.jpg)
GPUCg, GLSL, HLSL
![Page 10: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/10.jpg)
GPUGeneral-Purpose Computing on Graphics Processing Unit
![Page 11: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/11.jpg)
NVIDIA Compute Unified Device Architecture
ноябрь 2006 г. - первый GPU с DirectX 10, GeForce 8800 GTX с архитектурой CUDA
• Учёт требований IEEE к арифметическим операциям
• Набор команд, ориентированный на вычисления
• Произвольный доступ к памяти для чтения и записи
• CUDA Toolkit и CUDA SDK
![Page 12: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/12.jpg)
NVIDIA Compute Unified Device Architecture
NVIDIA Tesla
Intel Core i5 – 110 Гфлопс – 100 ВтCore 2 Duo – 19 Гфлопс - 90 Вт
Tesla K20X – 3,95 Тфлопс – 225 Вт
![Page 13: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/13.jpg)
Cray Titan29 октября 2012
18 688 AMD Opteron (16 ядер в каждом)18688 Tesla K20X9 МВт, 404 кв. м
20 петафлопс (1015) – 1 место
![Page 14: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/14.jpg)
NVIDIA Compute Unified Device Architecture
Язык программирования C с расширениямиРаспространённость GPU
GeForce 8, 9, 100, 200, 300, 400, 500, 600
![Page 15: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/15.jpg)
NVIDIA CUDA. Применение
Прирост производительности CPU CPU
2 операций MD5: 100 Tesla = 10000 CPU - 2 дня
SHA-1: Phenom II X4 3.4 GHz vs GF GTX 560 Ti (49152 потока) - 10 раз
Core2 Duo 2.26 GHz vs GF 9300M (8192 потока) - 3 раза
50
![Page 16: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/16.jpg)
NVIDIA CUDA. Применение
Медицицина. TechniScan Svara - УЗИ35 Гб данных за 15 минут2 Tesla C1060 - 20 минут
Гидродинамика. Кэмбридж
Моделирование ПАВ. P&G2 Tesla = Cray XT3 (128 CPU) или IBM BlueGene/L
(1024 CPU)
Геология, финансы, криптография...
![Page 17: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/17.jpg)
NVIDIA CUDA. Применение
Наличие оптимизированных версий библиотек FFT и BLAS, SPARSE, RAND, NPP...
Поддержка готовым ПО (MAGMA, Video Encoder, Adobe Photoshop, Folding@Home, Seti@Home, CoreAVC, Cyberlink Power Director, ...
![Page 18: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/18.jpg)
Open Compute Language
Khronos Group: AMD, Intel, Motorola, Apple, NVIDIA, IBM, ARM
2008 г. - OpenCL 1.01 декабря 2012 г. - OpenCL 1.2
C99 с новыми ключевыми словами
Открытый стандарт
Широкая поддержка оборудования
Прирост в WinZip 16.5 на AMD APU - 45%
![Page 19: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/19.jpg)
HSA Foundation
AMD, ARM, Samsung, Texas Instruments, Qualcomm, MediaTek, Imagination Technologies
![Page 20: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/20.jpg)
Intel
Larrabee -> Xeon Phi
Архитектура x86Много ядер Pentium в одном чипе с общей памятью
![Page 21: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/21.jpg)
Взаимодействие NVIDIA с ВУЗами
269 университетов мираСПбГПУ, СПбГУ, "Дубна", ОИЯИ, МИЭТ, МГТУ им. Баумана, МАИ,
"Курчатовский институт", МГУ им. Ломоносова, ...
декабрь 2009 - научно-образовательный центр "Параллельные вычисления", Дубна
![Page 22: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/22.jpg)
Список источников1. Сайты HSA Foundation, NVIDIA, AMD, Khronos Group2. thg.ru - подробный обзор Intel Xeon Phi3. Wikipedia4. Статьи с habrahabr.ru5. Сайт научно-образовательного центра "Параллельные вычисления" http://www.parallel-compute.ru/6. opencl.org7. gpgpu.org8. Результаты НИР на 3-4 курсах. Научный руководитель - Семьянов П. В.
![Page 23: Hpc 1.24.02.2013.](https://reader035.fdocuments.net/reader035/viewer/2022062216/5592da6e1a28abef3b8b4585/html5/thumbnails/23.jpg)
Благодарю за внимание!