http://www.intel.com/education Intel® Higher Education Program
Многоядерные микропроцессоры: прогресс и
последствия Задачи образования
Многоядерные микропроцессоры: прогресс и
последствия Задачи образования
ФорумФорум«Новые горизонты образования»«Новые горизонты образования»
Секция: Прогресс индустрии многоядерных вычислительных Секция: Прогресс индустрии многоядерных вычислительных систем и преподавание инструментов и технологий систем и преподавание инструментов и технологий
параллельного программированияпараллельного программирования
В.Ф.КурякинВ.Ф.КурякинIntel NNIntel NN
Москва, 29 мартаМосква, 29 марта 200 20066
2
http://www.intel.com/education Intel® Higher Education Program
СодержаниеСодержание ВведениеВведение
Обзор многоядерных архитектур и Обзор многоядерных архитектур и технологийтехнологий Закон МураЗакон Мура Методы повышения производительностиМетоды повышения производительности Многоядерность: всюду и навсегдаМногоядерность: всюду и навсегда Обеспечение эффективности новых архитектурОбеспечение эффективности новых архитектур Что отсюда следует?Что отсюда следует?
Программы Интел в области образованияПрограммы Интел в области образования В частности, параллельного программированияВ частности, параллельного программирования
ДискуссияДискуссия
3
http://www.intel.com/education Intel® Higher Education Program
ВведениеВведение
Корпорация Корпорация Intel Intel и компьютерная индустрия и компьютерная индустрия переходят на многоядерные архитектурыпереходят на многоядерные архитектуры
Эффективное использование вычислительных Эффективное использование вычислительных возможностей многоядерных архитектур для возможностей многоядерных архитектур для повышения производительности требуют повышения производительности требуют разработки новых параллельных приложенийразработки новых параллельных приложений
Корпорация Корпорация Intel Intel стремится к поддержке стремится к поддержке лидирующих образовательных и научных центров лидирующих образовательных и научных центров в подготовке нового поколения специалистов и в подготовке нового поколения специалистов и разработчиков в области архитектурно-разработчиков в области архитектурно-зависимого программирования и многопоточных зависимого программирования и многопоточных приложений для многоядерных архитектурприложений для многоядерных архитектур
4
http://www.intel.com/education Intel® Higher Education Program
Обзор многоядерных архитектур и
технологий
Обзор многоядерных архитектур и
технологий
информация заимствована из презентации John H. Crawford (2003, закон Мура), презентаций с IDF’Spring2006, с сайтов упомянутых компаний
5
http://www.intel.com/education Intel® Higher Education Program
Закон Муракак основа планирования компьютерной
индустрии
Закон Муракак основа планирования компьютерной
индустрии
6
http://www.intel.com/education Intel® Higher Education Program
Закон Мура - первоначальноЗакон Мура - первоначально
В В 19651965 году Гордон Мур нарисовал графики году Гордон Мур нарисовал графики изменений числа транзисторов в интегральных изменений числа транзисторов в интегральных схемах с минимальной стоимостью на один схемах с минимальной стоимостью на один транзистортранзистор,, и обнаружил, что и обнаружил, что Приведенная к транзистору цена быстро падалаПриведенная к транзистору цена быстро падала Число транзисторов на одну схему удваивалось каждый Число транзисторов на одну схему удваивалось каждый
годгод
7
http://www.intel.com/education Intel® Higher Education Program
Закон Мура: производительность зависит от числа транзисторовЗакон Мура: производительность зависит от числа транзисторов
Закон Мура описывает рост производительности. Производительность, измеренная в миллионах инструкций в секунду (MIPS), растет вследствие увеличения числа транзисторов.
8
http://www.intel.com/education Intel® Higher Education Program
Закон Мура – современная формулировкаЗакон Мура – современная формулировка
В В ’70’70х тренд изменилсях тренд изменился Удвоение – каждые 18-24 месяцаУдвоение – каждые 18-24 месяца
Это выражение применяется теперь к любым Это выражение применяется теперь к любым трендам составного роста в полупроводниковой трендам составного роста в полупроводниковой промышленностипромышленности Производительность, частота, мощностьПроизводительность, частота, мощность, …, … Стоимость производства кремниевых пластинСтоимость производства кремниевых пластин
Закон Мура – программа непрерывных улучшенийЗакон Мура – программа непрерывных улучшений
Основа для пошагового планирования изменений в технологиях каждые Основа для пошагового планирования изменений в технологиях каждые 2-3 2-3 года:года: Сжать размеры на 0.7 в каждом поколенииСжать размеры на 0.7 в каждом поколении Уменьшить задержки на 0.7 в каждом поколенииУменьшить задержки на 0.7 в каждом поколении Увеличить диаметр кремниевой пластиныУвеличить диаметр кремниевой пластины Увеличить размер кристаллаУвеличить размер кристалла
9
http://www.intel.com/education Intel® Higher Education Program
Закон Мура - результатыЗакон Мура - результаты Число транзисторов на кристалл удваивается каждые 18-Число транзисторов на кристалл удваивается каждые 18-
24 месяца24 месяца Производительность процессоров удваивается каждые 18 Производительность процессоров удваивается каждые 18
месяцевмесяцев Вынужденный цикл – быстрее, дешевле, менее энергоемкоВынужденный цикл – быстрее, дешевле, менее энергоемко
Бескомпромиссное управление микропроцессорной революциейБескомпромиссное управление микропроцессорной революцией
““Если бы автомобильная промышленность Если бы автомобильная промышленность усовершенствовалась столь же быстро как усовершенствовалась столь же быстро как полупроводниковаяполупроводниковая, , то Ролс-Ройс пробегал бы то Ролс-Ройс пробегал бы 1/2 1/2 миллиона миль на галлон бензина, и было бы миллиона миль на галлон бензина, и было бы дешевле его выбрасывать, чем платить за парковкудешевле его выбрасывать, чем платить за парковку.”.”
Гордон МурГордон Мур
10
http://www.intel.com/education Intel® Higher Education Program
Методы повышенияпроизводительностиМетоды повышенияпроизводительности
11
http://www.intel.com/education Intel® Higher Education Program
Составляющие производительностиСоставляющие производительности
ВремяВремя = # = # инструкцийинструкций ( (длина путидлина пути))
* * ЦиклЦикл//ИнструкцияИнструкция ( (Arch…)Arch…)
* * СекундыСекунды//ЦиклЦикл (1/ (1/ЧастотаЧастота))
ПроизводительностьПроизводительность ~ 1/ ~ 1/ВремяВремя = benchmark = = benchmark =
Тест производительностиТест производительности / # / #инструкцийинструкций
* * ИнструкцийИнструкций//Цикл (Цикл (IPC)IPC)
* * ЦиклыЦиклы//СекундаСекунда ( (ЧастотаЧастота))
Посмотрим, из чего складывается производительностьПосмотрим, из чего складывается производительность……
12
http://www.intel.com/education Intel® Higher Education Program
Рост производительности: 1000x за 17 лет
Рост производительности: 1000x за 17 лет
1
10
100
1000
10000
Jan-85 Jan-87 Jan-89 Jan-91 Jan-93 Jan-95 Jan-97 Jan-99 Jan-01 Jan-03 Jan-05
Начало производства
SP
EC
int2
000
13
http://www.intel.com/education Intel® Higher Education Program
Рост частоты: 200x Ускорение транзисторов: 40хРост частоты: 200x Ускорение транзисторов: 40х
1
10
100
1000
10000
Jan-85 Jan-87 Jan-89 Jan-91 Jan-93 Jan-95 Jan-97 Jan-99 Jan-01 Jan-03 Jan-05
Introduction Date
Clo
ck F
req
uen
cy
1
10
100
1000
10000
Tra
nsi
sto
r S
pee
du
p F
acto
r
1 0.8
.35.25
.18.13
1.5
0.5 40x
2.6x
конвейеризация
1.7хУлучшения в процессе производства
14
http://www.intel.com/education Intel® Higher Education Program
Факторы роста производительностиФакторы роста производительности Увеличение частоты (200х)Увеличение частоты (200х)
Ускорение транзисторов (Ускорение транзисторов (~40x)~40x) Постоянные улучшения в процессах (Постоянные улучшения в процессах (~~1.71.7x)x) Конвейеризация (Конвейеризация (~~2.6х)2.6х)
SPECint2000/MHzSPECint2000/MHz ~~ IPCIPC (5x)(5x)
ProcessorProcessor ~IPC ~IPC factorfactor
386386 11
486486 2.52.5
486 DX2486 DX2 2.252.25
PentiumPentium 44
Pentium ProPentium Pro 55
Pentium IIIPentium III 5.75.7
Pentium 4Pentium 4 4.44.4
1000 ~= 70 (40*1.7) * 15 (2.6 * 5.7)
15х – прямой или косвенный вклад улучшений архитектуры в рост производительности
Итак – две главные компоненты повышения производительности - технологические улучшения (ускорение транзисторов) - усовершенствования в архитектуре процессоров и компьютеров ~15x
15
http://www.intel.com/education Intel® Higher Education Program
Улучшения uArch – GHz & IPC*Улучшения uArch – GHz & IPC* Обеспечены ростом числа транзисторовОбеспечены ростом числа транзисторов
Более глубокий конвейер обеспечивает рост частотыБолее глубокий конвейер обеспечивает рост частоты (GHz) (GHz) Более широкий конвейер обеспечивает увеличениеБолее широкий конвейер обеспечивает увеличение IPC IPC
Методы увеличенияМетоды увеличения IPC: IPC: Конвейеризация для повышения пропускной способности на 1 тактКонвейеризация для повышения пропускной способности на 1 такт
(486) (486) Параллельный выход инструкцийПараллельный выход инструкций (Pentium (Pentium®®)) Предсказание ветвленийПредсказание ветвлений (Pentium (Pentium®®) ) Изменение порядка выполнения Изменение порядка выполнения (Pentium Pro/II)(Pentium Pro/II) SIMD (MMX, SSE, SSE2, SSE3,…) (Pentium MMX/II,III,IV, …)SIMD (MMX, SSE, SSE2, SSE3,…) (Pentium MMX/II,III,IV, …) Кэш трейсовКэш трейсов (Pentium 4) (Pentium 4) HyperThreading (Pentium 4)HyperThreading (Pentium 4) Многоядерность (Многоядерность (Pentium D)Pentium D)
Преодоление задержек с доступом к главной памятиПреодоление задержек с доступом к главной памяти КэшКэш (486) (486) Разбиение кэшей и их увеличениеРазбиение кэшей и их увеличение (Pentium) (Pentium) Много-уровневые гигантские кэшиМного-уровневые гигантские кэши…… Рост частоты и пропускной способности Рост частоты и пропускной способности FSBFSB
*IPC is Instructions Per Clock
16
http://www.intel.com/education Intel® Higher Education Program
Производительность процессора увеличилась – но повысилась ли производительность приложений??
Производительность процессора увеличилась – но повысилась ли производительность приложений?? Главные пути повышения производительностиГлавные пути повышения производительности
технологические улучшения (ускорение транзисторов) технологические улучшения (ускорение транзисторов) усовершенствования в архитектуре процессоров и усовершенствования в архитектуре процессоров и
компьютеровкомпьютеров Производительность подсистемы памятиПроизводительность подсистемы памяти
Технологические улучшения дают прирост Технологические улучшения дают прирост производительности в чистом виде, формально они производительности в чистом виде, формально они не требуют изменений в программахне требуют изменений в программах
Улучшения в архитектуре Улучшения в архитектуре обязательнообязательно предполагают комплексные изменения как в предполагают комплексные изменения как в приложениях, так и в инструментарии приложениях, так и в инструментарии программирования, а также изменений во всех программирования, а также изменений во всех компонентах компьютеракомпонентах компьютера
17
http://www.intel.com/education Intel® Higher Education Program
Многоядерность: всюду и навсегдаМногоядерность: всюду и навсегда
18
http://www.intel.com/education Intel® Higher Education Program
Двух-ядерные процессоры IBMДвух-ядерные процессоры IBM Power4 – Power4 – самый первый 2-ядерный, 200самый первый 2-ядерный, 2001 (1 (на 180нм!)на 180нм!)
Power5 – Power5 – ядра те же самые, система кэшей/памяти ядра те же самые, система кэшей/памяти изменена радикально, 2004изменена радикально, 2004
8-way 8-way реализация, допускает построение 8реализация, допускает построение 8--ми ми процессорной процессорной SMPSMP системы прямо, 16, 32, 64 - системы прямо, 16, 32, 64 - блокамиблоками
19
http://www.intel.com/education Intel® Higher Education Program
Двух-ядерные процессоры AMDДвух-ядерные процессоры AMD
OpteronOpteron Dual-Core Dual-Core для серверов/рабочих станций, 2004для серверов/рабочих станций, 2004 Исполнения: 1-Исполнения: 1-way, 2-way, 8-wayway, 2-way, 8-way Первоначально – 130нм, теперь – 90нмПервоначально – 130нм, теперь – 90нм
Athlon Dual-Core X2 Athlon Dual-Core X2 для рынка для рынка PCPC Для ноутбуков - нетДля ноутбуков - нет
20
http://www.intel.com/education Intel® Higher Education Program
Двух-ядерные процессоры IntelДвух-ядерные процессоры Intel Процессоры, базирующиеся на Р4 ядре
Pentium D – 2004, начало (основан на двух ядрах Pentium 4 (Prescott) c HT) Кодовые имена (для разных сегментов рынка)
Smithfield, Presler, Cider Mill – для рынка РС, Dempsey (DP), Paxville (MP), Tulsa – для рынка серверов и рабочих станций
Выпускаются по 90нм технологии, с 2006 по 65нм
Процессоры, базирующиеся на ядрах Pentium M и его усовершенствованиях в uArch
Стартуют с 65нм технологии! Обеспечивают наилучшие в индустрии показатели как производительности, так и
производительность/ватт
Conroe: >40% рост производительности и >40% уменьшение энергопотребления По сравнению с сильнейшим на сегодня процессором Pentium® D processor 950 (кодовое имя
Pressler)
Woodcrest: >80% рост производительности и > 35% уменьшение энергопотребления
По сравнению с сильнейшим на сегодня процессором Dual-Core Intel® Xeon processor 2.8GHz (кодовое имя Paxville DP)
Merom: значительно улучшает большинство свойств предшественника, уже являющегося лидером среди мобильных устройств, >20% рост производительности (2х для мультимедиа)
По сравнению с сильнейшим в индустрии Intel® Core™ Duo processor (кодовое имя Yonah)
Массовое производство Conroe (для РС), Woodcrest (сервера/рабочие станции), Merom (мобильные) развертывается в конце 2006, начале 2007
Kentsfield – первый 4-х ядерный процессор (два Conroe) для РС – 1H’07
21
http://www.intel.com/education Intel® Higher Education Program
22
http://www.intel.com/education Intel® Higher Education Program
23
http://www.intel.com/education Intel® Higher Education Program
Данные по много-ядерным процессорамДанные по много-ядерным процессорам
2007 2009 20102005 2006 2008
Niagara-II 1.4 Ghz65 nm
Niagara 1.2 Ghz90 nm IBM
many coreAMD
many core
Sun Sun лидирует в разработке много-ядерных процессоровлидирует в разработке много-ядерных процессоров Двух-ядерный процессор – в 2004 годуДвух-ядерный процессор – в 2004 году Niagara-II Niagara-II обещаетобещает удвоение производительности по сравнению с удвоение производительности по сравнению с Niagara-INiagara-I
IBM IBM обладает большим потенциалом для разработки много-ядерных системобладает большим потенциалом для разработки много-ядерных систем Cell (Cell (процессор для процессор для Sony PlayStation – 8 Sony PlayStation – 8 упрощенных ядер под управлением упрощенных ядер под управлением
Power) Power) является первым опытом разработки многоядерных системявляется первым опытом разработки многоядерных систем Однако никакой конкретной информации от Однако никакой конкретной информации от IBM IBM по полным многоядерным по полным многоядерным
системам нетсистемам нет
AMD AMD способен на разработку много-ядерных системспособен на разработку много-ядерных систем Конкретной информации о много-ядерных проектах нетКонкретной информации о много-ядерных проектах нет AMD AMD будет трудно (финансово) поддерживать много проектовбудет трудно (финансово) поддерживать много проектов
Имеющиеся скалярные и двух-ядерные и много-ядерные Имеющиеся скалярные и двух-ядерные и много-ядерные
Интел однозначно участвует в многоядерной гонкеИнтел однозначно участвует в многоядерной гонке Интел представил первый четырех-ядерный процессор для серверов/рабочих Интел представил первый четырех-ядерный процессор для серверов/рабочих
станций и РС (станций и РС (IDF’Spring2006)IDF’Spring2006)
2009-2010 roadmap very speculative
SunNiagara-III
24
http://www.intel.com/education Intel® Higher Education Program
Сервера Sun Fire T1000/T2000 Сервера Sun Fire T1000/T2000 1U 1U ии 2U 2U модули в стойкимодули в стойки
1U T1000 8 DIMMs and 1 PCI Express slot1U T1000 8 DIMMs and 1 PCI Express slot 2U T2000 16 DIMMs and 3 PCI Express + 2 PCI-X slots2U T2000 16 DIMMs and 3 PCI Express + 2 PCI-X slots
1.0 1.0 илиили 1.2 Ghz UltraSPARC T1 (Niagara) 1.2 Ghz UltraSPARC T1 (Niagara) 8 ядер, до 8 ядер, до 32 32 потоковпотоков Только однопроцессорное исполнениеТолько однопроцессорное исполнение
Сильнейшее решение по пропускной Сильнейшее решение по пропускной способности на сетевых приложенияхспособности на сетевых приложениях
Продается с декабря Продается с декабря 20052005 T1000 T1000 нижняя ценанижняя цена $3495 $3495 T2000 T2000 нижняя ценанижняя цена $8295 $8295
Pictures from:Sun T1000/T2000 Web site
25
http://www.intel.com/education Intel® Higher Education Program
Niagara: резюмеNiagara: резюме Огромная пропускная способность Огромная пропускная способность
при низком отношении при низком отношении производительность/ваттпроизводительность/ватт
Дорогая Дорогая 2222-слойная-слойная платаплата
Высокая производительность для Высокая производительность для приложений, которыеприложений, которые Могут запускать все 32 потокаМогут запускать все 32 потока Требуют большой пропускной Требуют большой пропускной
способности памятиспособности памяти Согласуются с внутренними Согласуются с внутренними
кэшами для поддержки активности кэшами для поддержки активности всех ядер и нитейвсех ядер и нитей
Пока – только однопроцессорный Пока – только однопроцессорный дизайндизайн
2-ое поколение2-ое поколение Niagara-II Niagara-II – в – в разработке (разработке (20072007, , 65 nm 65 nm))
Niagara die plot from Spring Processor Forum 2005
• Q4’05 systems available• 8 ядер, 32 нитей, только UP • 4 DDR2-400 порта, 16 байт каждый• Полная реализация SPARC 64-bit ISA• Частота 1.2 Ghz• Реализация по 90 nm технологии на
фабрике T.I.• Пиковая мощность 79W, 75° C
From VendorSpeculation
26
http://www.intel.com/education Intel® Higher Education Program
Первый 4-ядерный процессор ИнтелПервый 4-ядерный процессор Интел
Clovertown – процессор семейства Zeon для рынка серверов/рабочих станций
Kentsfield – первый 4-х ядерный процессор (два Conroe) для РС – 1H’07
27
http://www.intel.com/education Intel® Higher Education Program
Обеспечение эффективности новых архитектур
Обеспечение эффективности новых архитектур
28
http://www.intel.com/education Intel® Higher Education Program
Сложнее архитектура – сложнее программирование??Сложнее архитектура – сложнее программирование??
Для обеспечения оптимального использования возможностей Для обеспечения оптимального использования возможностей процессоров необходимо при разработке алгоритмов и процессоров необходимо при разработке алгоритмов и программировании максимально учитывать эти возможностипрограммировании максимально учитывать эти возможности
Большая часть (но не вся!) возможностей повышения Большая часть (но не вся!) возможностей повышения производительности заложена в параллельном исполнении производительности заложена в параллельном исполнении инструкций, но способов распараллеливания много:инструкций, но способов распараллеливания много: КонвейеризацияКонвейеризация СуперскалярностьСуперскалярность SIMDSIMD HTHT Много-ядерность - многопоточностьМного-ядерность - многопоточность
Несмотря на прогресс в повышении производительности памяти, Несмотря на прогресс в повышении производительности памяти, она была, есть и будет главным препятствием повышения она была, есть и будет главным препятствием повышения производительностипроизводительности Иерархия огромных кэшейИерархия огромных кэшей FSB – FSB – частота уже 1333частота уже 1333MHzMHz Двойная независимая Двойная независимая FSBFSB Память Память FD-DIMM FD-DIMM
29
http://www.intel.com/education Intel® Higher Education Program
ПроблемыПроблемы Алгоритм не распараллеливается или плохо Алгоритм не распараллеливается или плохо
распараллеливаетсяраспараллеливается Новый алгоритм? Прямо по заказу?Новый алгоритм? Прямо по заказу?
Чем больше потоков, тем более жадным до памяти Чем больше потоков, тем более жадным до памяти становится процессорстановится процессор Но производительность памяти растет заметно медленнее, Но производительность памяти растет заметно медленнее,
чем производительность процессорачем производительность процессора Новые приложения работают с относительно большим Новые приложения работают с относительно большим
объемом данных (машинное зрение, распознавание, объемом данных (машинное зрение, распознавание, анализ данных – классификация /кластеризация)анализ данных – классификация /кластеризация)
СинхронизацияСинхронизация Ядра (потоки) могут ждать друг друга из-за малой Ядра (потоки) могут ждать друг друга из-за малой
пропускной способности шины и памятипропускной способности шины и памяти Меж-связи между ядрами? Локальная (на ядре) Меж-связи между ядрами? Локальная (на ядре)
буферизация? Процессоры еще сложнее???буферизация? Процессоры еще сложнее???
30
http://www.intel.com/education Intel® Higher Education Program
Программирование и эффективностьПрограммирование и эффективность В чем опасность для индустрии современного В чем опасность для индустрии современного
состояния программирования?состояния программирования? Как и ранее, использование архитектурных особенностей требует Как и ранее, использование архитектурных особенностей требует
квалификации и опыта, а их как всегда не хватаетквалификации и опыта, а их как всегда не хватает Однако много-ядерность эту ситуацию обостряет значительно: Однако много-ядерность эту ситуацию обостряет значительно:
неожиданно проблемы, с которыми имели дело только избранные, неожиданно проблемы, с которыми имели дело только избранные, встали перед массовым программистом и пользователем, а он к встали перед массовым программистом и пользователем, а он к этому во всех отношениях не готов (?)этому во всех отношениях не готов (?)
Как следствие заявленная производительность не будет Как следствие заявленная производительность не будет подтверждаться на практике, и индустрия может столкнуться с подтверждаться на практике, и индустрия может столкнуться с проблемой невостребованности или задержки с продвижением проблемой невостребованности или задержки с продвижением новых технологийновых технологий
Значение эффективности инструментов и Значение эффективности инструментов и технологий программирования значительно технологий программирования значительно возрастаетвозрастает
Что имеется? Формально все инструменты и Что имеется? Формально все инструменты и технологии естьтехнологии есть
31
http://www.intel.com/education Intel® Higher Education Program
Что распараллеливать и как?Что распараллеливать и как? Анализ производительностиАнализ производительности
Для определения узких мест (где потеря Для определения узких мест (где потеря производительности?)производительности?)
Дизайн (создание потоков)Дизайн (создание потоков) Нужны ли изменения в алгоритмах?Нужны ли изменения в алгоритмах? Какой подход в реализации выгоднее?Какой подход в реализации выгоднее?
OpenMPOpenMP Явные потоки (Явные потоки (pthreads, system calls,…)pthreads, system calls,…) Передача сообщений (Передача сообщений (MPI)MPI) DVM DVM или что-то еще… или что-то еще…
ОтладкаОтладка Потенциальная десинхронизация потоковПотенциальная десинхронизация потоков В каком потоке ошибка?В каком потоке ошибка?
Оптимизация кодаОптимизация кода Оптимизация как отдельного потока, так и много-поточного Оптимизация как отдельного потока, так и много-поточного
кодакода
32
http://www.intel.com/education Intel® Higher Education Program
Поддержка цикла разработки в инструментах ИнтелПоддержка цикла разработки в инструментах Интел
Автоматическое распараллеливание и оптимизация, организация потоков через прагмы
Использование предельно оптимизированных вычислительных ядер сокращают время разработки
Отладка в одном потоке и в много-поточном комплексе
Анализ производительности в одном потоке и эффективности многопоточного распараллеливания
33
http://www.intel.com/education Intel® Higher Education Program
Что отсюда следует?Что отсюда следует?
34
http://www.intel.com/education Intel® Higher Education Program
Образование и повышение квалификации – ключевой аспект
Образование и повышение квалификации – ключевой аспект Инструменты и технологии (параллельного) Инструменты и технологии (параллельного)
программирования в условиях массовости должны быть программирования в условиях массовости должны быть изменены или значительно усовершенствованны. Как? В изменены или значительно усовершенствованны. Как? В каком направлении?каком направлении?
Перед системой образования стоит задача качественного Перед системой образования стоит задача качественного изменения в подготовке и переподготовки кадров. Чему изменения в подготовке и переподготовки кадров. Чему учить?учить? Использованию конкретных инструментов (языков, отладчиков, Использованию конкретных инструментов (языков, отладчиков,
компиляторов, библиотек,…). Но они устаревают ежегодно!компиляторов, библиотек,…). Но они устаревают ежегодно! Фундаментальным понятиям, глубокой ориентации в Фундаментальным понятиям, глубокой ориентации в
архитектурах и алгоритмах. Но тогда выпускники могут оказаться архитектурах и алгоритмах. Но тогда выпускники могут оказаться совершенно несостоятельными практически, не обладая совершенно несостоятельными практически, не обладая твердыми техническими навыкамитвердыми техническими навыками
Кого учить?? Кого учить?? Системных программистов (они разработают эффективные Системных программистов (они разработают эффективные
инструменты для остальных программистов)? инструменты для остальных программистов)? Всех программистов?? Но когда они выучат все остальное??Всех программистов?? Но когда они выучат все остальное?? Всех инженеров?? Но ведь для них компьютер только Всех инженеров?? Но ведь для них компьютер только
вспомогательный инструмент…вспомогательный инструмент…
35
http://www.intel.com/education Intel® Higher Education Program
Программы Интел в области образования
Программы Интел в области образования
36
http://www.intel.com/education Intel® Higher Education Program
Модель внедренияМодель внедрения
Унив n
Унив 1
Ключевые Университеты
Дополнительные Университеты
Гранты Intel на создание
учебных курсов
Семинар по учебным
программамУнив 15
Унив 1
Унив 15
Унив 1
Intel® Higher Education Curriculum
Forum
Семинар по учебным
программам
37
http://www.intel.com/education Intel® Higher Education Program
Разработка учебных программРазработка учебных программ ГрантыГранты:: будут выделены творческим коллективам из ведущих будут выделены творческим коллективам из ведущих
образовательных и научных центровобразовательных и научных центров В рамках конкурса проектов творческие коллективы подготовят В рамках конкурса проектов творческие коллективы подготовят
предложения по разработке учебных курсовпредложения по разработке учебных курсов В предложение должны включаться запросы на оборудование для учебных В предложение должны включаться запросы на оборудование для учебных
компьютерных классовкомпьютерных классов
СеминарСеминар:: запланирован на 2 квартал 2006 года в США, даст запланирован на 2 квартал 2006 года в США, даст возможность участвующим в программе профессорам из разных стран возможность участвующим в программе профессорам из разных стран обменяться идеями и опытом по разработке учебных программ обменяться идеями и опытом по разработке учебных программ
Intel® Higher Education Curriculum Forum:Intel® Higher Education Curriculum Forum: будет создана будет создана on-line on-line страница страница в Интернет для обмена информацией о разработке учебного плана в Интернет для обмена информацией о разработке учебного плана между участниками программы со всего мирамежду участниками программы со всего мира
ОбучениеОбучение:: Intel® Software College Classes Intel® Software College Classes будут проводится в будут проводится в различных странах для обучения преподавателей инструментам и различных странах для обучения преподавателей инструментам и технологиям технологиям Intel Intel для разработки программного обеспечениядля разработки программного обеспечения
ПоддержкаПоддержка:: Всех участников будет поддерживать программа «раннего Всех участников будет поддерживать программа «раннего доступа», содержащая информацию о новейших инструментах и доступа», содержащая информацию о новейших инструментах и технологияхтехнологиях
38
http://www.intel.com/education Intel® Higher Education Program
Внедрение образовательных курсовВнедрение образовательных курсов Intel® Higher Education Curriculum ForumIntel® Higher Education Curriculum Forum
Отобранные курсы будут доступны на веб-сайтеОтобранные курсы будут доступны на веб-сайте Online Online форумфорум будет поддерживать внедрение и будет поддерживать внедрение и
развитие курсовразвитие курсов
Семинары по разработке учебного планаСеминары по разработке учебного плана Семинары планируются в разных странах для Семинары планируются в разных странах для
демонстрации достижений и обмена опытом демонстрации достижений и обмена опытом между университетами по разработке и между университетами по разработке и внедрению курсов внедрению курсов
В каждом двухдневном семинаре примут участие В каждом двухдневном семинаре примут участие около 15 университетовоколо 15 университетов
Корпорация Корпорация Intel Intel берет на себя расходы по берет на себя расходы по проведению семинарапроведению семинара
39
http://www.intel.com/education Intel® Higher Education Program
ДискуссияДискуссия
40
http://www.intel.com/education Intel® Higher Education Program
Возможные темыВозможные темы Какие инструменты и технологии Какие инструменты и технологии
(параллельного) программирования (параллельного) программирования наиболее предпочтительны, или наиболее предпочтительны, или эффективны?эффективны?
Какие области приложений наиболее Какие области приложений наиболее актуальны, где много-ядерные актуальны, где много-ядерные процессоры окажутся наиболее процессоры окажутся наиболее эффективными?эффективными?
Как и где следует обучать?Как и где следует обучать?
41
http://www.intel.com/education Intel® Higher Education Program
BackupBackup
42
http://www.intel.com/education Intel® Higher Education Program
Itanium Dual-core RoadmapItanium Dual-core RoadmapIntel Itanium Processor Roadmap
ProcessorBrand
ProcessorNo.
Core / FSB
CacheLaunch
Date
Price @Launch
Itanium 2 (Dual Core)(Montecito)
90501.60GHz /
533MHz24MB Q2'06 $3,690
Itanium 2 (Dual Core)(Montecito)
90401.60GHz /
533MHz18MB Q2'06 $1,980
Itanium 2 (Dual Core)(Montecito)
90301.60GHz /
533MHz2MB Q2'06 $1,550
Itanium 2 (Dual Core)(Montecito)
90201.42GHz /
533MHz12MB Q2'06 $910
Itanium 2 (Single Core)(Montecito)
90101.60GHz /
533MHz6MB Q2'06 $700
43
http://www.intel.com/education Intel® Higher Education Program
IA Dual-Core RoadmapIA Dual-Core RoadmapIntel Xeon Processor Roadmap
Processor Brand
ProcessorNo.
Core /FSB
CacheLaunchDate
Price @Launch
Xeon Processor DP(Woodcrest Bin-0)
51603.0GHz /1333MHz
4MB Q3'06 $850
Xeon Processor DP(Woodcrest Bin-1)
51502.66GHz /1333MHz
4MB Q3'06 $690
Xeon Processor DP(Woodcrest Bin-2)
51402.33GHz /1333MHz
4MB Q3'06 $455
Xeon Processor DP(Woodcrest Bin-3)
51302.0GHz /1333MHz
4MB Q3'06 $320
Xeon Processor DP(Woodcrest Bin-4)
51201.86GHz /106MHz
4MB Q3'06 $260
Xeon Processor DP(Woodcrest Bin-5)
51101.60GHz /1066MHz
4MB Q3'06 $210
Xeon Processor DP(Dempsey Bin-0)
50803.73GHz /1066MHz
2x2MB
Q2'06 $850
Xeon Processor DP(Dempsey Bin-??)
50703.46GHz / 1066MHz
2x2MB
Q2'06 $690
Xeon Processor DP(Dempsey Bin-3)
50603.2GHz /1066MHz
2x2MB
Q2'06 $455
Xeon Processor DP(Dempsey Bin-5)
50503.0GHz /667MHz
2x2MB
Q2'06 $320
44
http://www.intel.com/education Intel® Higher Education Program
Updated Platform DefinitionsAVERILL FUNDAMENTAL AVERILL FUNDAMENTAL
*T’s
Pentium® D Processor 900 sequence
(Presler, no VT)
Intel® Q963 Express Chipset
w/ ICH8
Intel GbE LAN
Net
wo
rkin
gC
hip
set
Pro
cess
or
EM64T, EISTT
AVERILL PROFESSIONAL AVERILL PROFESSIONAL *T
’s
Intel® Core™ processor family
(Conroe)
Intel® Q965 Express Chipset
w/ ICH8-DO
Intel® PRO/1000 (Nineveh)
Net
wo
rkin
gC
hip
set
Pro
cess
or
Intel® Virtualization Technology
Intel® Active Mgmt Technology
EM64T, EIST
T
Q963
45
http://www.intel.com/education Intel® Higher Education Program
Intel® AMT and Intel® VT – Compare, Contrast, Compliment
Intel® AMT
Virtual Appliances
with Intel® VT
Intel AMT Alone
• OOB management
• Asset info store in NVM
• Circuit Breaker
• Secure wake
• Remote diagnostics & boot
• Most intelligence & remediation paths in mgmt console
Virtual Appliance Alone
• Tamper-resistant security or mgmt “watchdog” for User OS
• Highly programmable application environment
• Local intelligence & remediation paths
• No Intel AMT features
When Used Together
• All benefits of each individually, plus:
• OOB management of both User OS & appliance*
• Appliance access to Circuit Breaker, NVM, secure wake*
• Intelligence & remediation paths distributed to best local or console option
46
http://www.intel.com/education Intel® Higher Education Program
1.171.29 1.30 1.32
1.00 1.00 1.00 1.00
0.00
0.50
1.00
1.50
2.00
PCWorldbench* 5 SYSmark* 2004 SE PCMark*05 - CPU WebMark* 2004
Nor
mal
ized
to A
MD
* A
thlo
n64*
FX
60 P
roce
ssso
r(2
x1M
B L
2 C
ache
, 2.6
0 G
Hz)
.
Conroe = uncommon performance on common tests
Conroe Performance: Desktop Application Performance
AMD expected to add DDR2 support mid 2006AMD expected to add DDR2 support mid 2006
Pre-production Processor code-name “Conroe” (4 MB L2, 2.66 GHz, 1066 MHz FSB)
AMD* Athlon64* FX60 Processor (2x1 MB L2 Cache, 2.60 GHz)
*Other names and brands may be claimed as the property of others
ProductivityProductivityProductivityProductivity InternetInternetInternetInternet
Conroe 17% above
comp
ConsumerConsumerConsumerConsumer
Conroe measured on pre-production hardware and drivers. Final performance information may vary from these results
Conroe 29% above
comp
Conroe 30% above
comp
Conroe 32% above
comp
Top Related