Архитектура современных ЭВМ
description
Transcript of Архитектура современных ЭВМ
![Page 1: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/1.jpg)
Архитектура современных
ЭВМ
Кафедра Параллельных вычислений (ИВМиМГ)Кафедра Параллельных вычислительных технологий
• Маркова Валентина Петровна, [email protected]• Куликов Игорь Михайлович, [email protected]
![Page 2: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/2.jpg)
Определение архитектуры компьютера
• Архитектура компьютера – логическая организация компьютера с точки зрения программиста, (программно-видимые средства)– IA-32, Intel Core, AMD x86-64, STI Cell, IBM POWER
• Микроархитектура компьютера – совокупность аппаратных решений для серии процессоров, реализующих ее программную модель– IA-32 (Intel Architecture 32 bit) представлена
двумя микроархитектурами: • P6 (Pentium Pro, Pentium II и Pentium III)• NetBurst (Celeron, Pentium 4, Xeon ,….)
![Page 3: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/3.jpg)
Архитектурные принципы компьютера фон Неймана
• Принцип программного управления
• Принцип хранимой программы• Синхронное функционирование• Принцип условного перехода• Принцип использования
двоичной системы счисления• Принцип иерархичности ЗУ
![Page 4: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/4.jpg)
Схема компьютерафон Неймана
Арифметико-логическое устройство
Управляющее устройство
Оперативная память
Внешняя память
Порты ввода
Порты вывода
Устройства ввода
Устройства вывода
![Page 5: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/5.jpg)
Выполнение команды
Регистры
СК РИ
УУ
АЛУ
ОЗУ
Инструкции
Данные
Сигналы Управления
Адрес
Передача данных
Управляющие сигналы
![Page 6: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/6.jpg)
Выполнение команды
Регистры
СК РИ
УУ
АЛУ
ОЗУ
Инструкции
Данные
Сигналы Управления
Адрес
Передача данных
Управляющие сигналы
![Page 7: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/7.jpg)
Машины потока команд
Характерной чертой компьютеров фон
Неймана является наличие глобально адресуемой памяти и счетчика команд, которые позволяют УУ многократно повторять один и тот же цикл действий:1) Извлечение очередной команды
машинного кода,2) Декодирование и выполнение команды
в автоматическом режиме. В результате глобально адресуемая память и счетчик команд создают поток команд, которые УУ декодирует, а АЛУ исполняют.
![Page 8: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/8.jpg)
Управляющие стратегии вычислений
• Команда выполняется, если предыду-щая команда, определенная в машин-ном коде, выполнена (control flow).
• Команда выполняется, когда требуе-мые операнды готовы (data flow).
• Команда выполняется, когда ее резу-льтат требуется другой команде (demand driven).
• Команда выполняется, когда появля-ются частичные образы данных (pattern driven).
![Page 9: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/9.jpg)
Узкие места архитектуры фон Неймана
• Последовательное выпол-нение команд.
• Хранение данных и прог-раммы в одном ОЗУ.
• Один канал связи.
![Page 10: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/10.jpg)
Усовершенствования архитектуры фон
Неймана
• Усовершенствования в области CБИС-технологий.• Программного обеспечения. • Архитектурные
усовершенствования.
![Page 11: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/11.jpg)
Прогресс в СБИС-технологиях. Закон Мура
![Page 12: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/12.jpg)
Усовершенствование ПО
• Языки программирования ВУ.• Компиляторы.• Библиотеки подпрограмм.• Параллельные языки програм-
мирования.• Коммуникационные
библиотеки.
![Page 13: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/13.jpg)
Архитектурные усовершенствования
Оптимизация подсистемы памяти
• Контроллер памяти• Высокоскоростная
шина• Кэш и иерархия памяти• Виртуальная память• Аппаратная
предвыборка данных и команд
Оптимизация выполнения команд
• Конвейеризация• Упрощение набора
команд• Истинный параллелизм
– Данные – Инструкции– Потоки– Программы
![Page 14: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/14.jpg)
Очень сложное ядро
![Page 15: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/15.jpg)
Характеристикисуперкомпьютера Roadrunner
(№1 http://www.top500.org)
• Процессоры– PowerXCell 8i 3.2 ГГц (12 240 шт.)– Opteron DC 1.8 ГГц (6 562 шт.)
• Всего ядер 122 400• Общая память 98 Тбайт• Производительность
– 1026 TFlops (макс)– 1375.78 TFlops (пиковая)– 437 MFlops/watt
• Энергопотребление 2.35 мегаватт
![Page 16: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/16.jpg)
Иерархия памяти
КЭШ данных
КЭШ команд
Общий КЭШ
второго уровня
ПА
МЯ
ТЬ
Данные
Команды
![Page 17: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/17.jpg)
Конвейер команд
1 2
1 2
1 2
1 2
1 2
Ступени
Выборка команды
Декодирование команды
Выборка операндов
Вычисление операции
Запись результата
Время
1я к
оман
да
1я к
оман
да
22я ко
манда
я ко
манда
3
3
3
33я ко
манда
я ко
манда
![Page 18: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/18.jpg)
Конвейер команд
1 2 3 4 5 6
1 2 3 4 5 6
1 2 3 4 5 6
1 2 3 4 5 6
1 2 3 4 5 6
Ступени
Выборка команды
Декодирование команды
Выборка операндов
Вычисление операции
Запись результата
Время
Латентность конвейера
1я к
оман
да
1я к
оман
да
22я ко
манда
я ко
манда
33я ко
манда
я ко
манда
7
7
7
7
7
8
8
8
8
8
9
9
9
9
9
Все ступени конвейера активны
![Page 19: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/19.jpg)
Параллелизм на уровне инструкций (ILP)
INT
FP
MEM
BR
Окно команд
![Page 20: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/20.jpg)
Параллелизм на уровне инструкций (ILP)
Время
![Page 21: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/21.jpg)
Параллелизм на уровне нитей (TLP)
INT
FP
MEM
BR
Окно команд
Окно команд
Нить №1
Нить №2
![Page 22: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/22.jpg)
Параллелизм на уровне нитей (TLP)
Время
Нить №1
Нить №2
![Page 23: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/23.jpg)
Многоядерность(Multi-Core)
Окно команд
Окно команд
Процесс №1
Процесс №2
![Page 24: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/24.jpg)
Основные проблемы
• Power Wall – стена мощности• Процессоры греются
• Memory Wall – стена памяти• Память медленнее процессоров
• Frequency Wall – стена частоты• Транзисторы маленькие, процессоры большие
• Complexity Wall – стена сложности• Процессоры больше управляют вычислениями,
чем вычисляют
![Page 25: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/25.jpg)
Итоги
• Современные архитектуры произрастают из корняфон-Неймана
• Оптимизации идут экстенсивно вплоть до стен (walls)
![Page 26: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/26.jpg)
Разработка IBM: 500 GHz
![Page 27: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/27.jpg)
Intel Polaris80 ядер, 1 ТФлопс
![Page 28: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/28.jpg)
University of Texas at Austin
![Page 29: Архитектура современных ЭВМ](https://reader030.fdocuments.net/reader030/viewer/2022033016/568131eb550346895d984f39/html5/thumbnails/29.jpg)
Алмазные кристаллы
• 1000 vs 150 °C• 200 vs 20 Вольт