Sima Dezső
-
Upload
honoria-merritt -
Category
Documents
-
view
40 -
download
1
description
Transcript of Sima Dezső
![Page 1: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/1.jpg)
Sima Dezső
Többmagos/sokmagosprocesszorok-1
2012. Október
Version 3.0
![Page 2: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/2.jpg)
Áttekintés
1. Többmagos processzorok megjelenésének szükségszerűsége•
2. Homogén többmagos processzorok •
3. Heterogén többmagos processzorok•
2.1 Hagyományos többmagos processzorok•
3.1 Mester/szolga elvű többmagos processzorok•
3.2 Csatolt többmagos processzorok•
4. Kitekintés•
2.2 Sokmagos processzorok•
![Page 3: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/3.jpg)
1. Többmagos processzorok megjelenésének szükségszerűsége
![Page 4: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/4.jpg)
1.1 ábra: Az integrált áramkörök gyártási technológiájának fejlődése
1. Többmagos processzorok megjelenésének szükségszerűsége (1)
Shrinking: ~ 0.7/2 Years
![Page 5: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/5.jpg)
1. Többmagos processzorok megjelenésének szükségszerűsége (2)
IC gyártási technológia
Moore szabály
• azonos tranzisztorszám ½ Si területen
(Jelenleg: lineáris zsugorítás ~ 0.7x/2 év)
• azonos területen 2x annyi tranzisztor
Két évente
Kétévente kb. duplázódik az egy lapkán megvalósítható
ltranzisztorok száma
![Page 6: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/6.jpg)
Possible use of surplus transistors
Wider processor width Core enhancements Cache enhancements
superscalar
• branch prediction• speculative loads• ...
L2/L3enhancements
(size, associativity ...)
1. Gen. 2. Gen.
1 2 4
pipeline
A tranzisztorszámok duplázódása ~ két évente
Mire használhatók fel a többlet-tranzisztorok
a mikroarchitektúra fejlesztésében?Moore szabály
1. Többmagos processzorok megjelenésének szükségszerűsége (3)
![Page 7: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/7.jpg)
A többlet tranzisztorok felhasználása többmagos processzorként
A többmagos processzorok megjelenésének szükségszerűsége
Növekvő tranzisztorszámok Egyre csökkenő teljesítményhozam
1. Többmagos processzorok megjelenésének szükségszerűsége (4)
![Page 8: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/8.jpg)
1.3 ábra: Intel többmagos processzorainak robbanásszerű elterjedése
1. Többmagos processzorok megjelenésének szükségszerűsége (5)
![Page 9: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/9.jpg)
1. Többmagos processzorok megjelenésének szükségszerűsége (7)
1.4 ábra: Többmagos processzorok főbb osztályai
Desktops
Heterogenous multicores
Homogenous multicores
Multicore processors
Manycore processors
Servers
with >8 cores
ConventionalMC processors
Master/slavearchitectures
Add-onarchitectures
MPC
CPU GPU
2 ≤ n ≤ 8 cores
General purpose computing
Prototypes/ experimental systems
MM/3D/HPCproduction stage
HPCnear future
![Page 10: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/10.jpg)
2. Homogén többmagos processzorok
![Page 11: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/11.jpg)
2. Homogén többmagos procdesszorok (1)
2.1 ábra: Többmagos processzorok főbb osztályai
Desktops
Heterogenous multicores
Homogenous multicores
Multicore processors
Manycore processors
Servers
with >8 cores
ConventionalMC processors
Master/slavearchitectures
Add-onarchitectures
MPC
CPU GPU
2 ≤ n ≤ 8 cores
General purpose computing
Prototypes/ experimental systems
MM/3D/HPCproduction stage
HPCnear future
![Page 12: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/12.jpg)
2.8 ábra: Többmagos processzorok főbb osztályai
Desktops
Heterogenous multicores
Homogenous multicores
Multicore processors
Manycore processors
Servers
with >8 cores
ConventionalMC processors
Master/slavearchitectures
Add-onarchitectures
MPC
CPU GPU
2 ≤ n ≤ 8 cores
General purpose computing
Prototypes/ experimental systems
MM/3D/HPCproduction stage
HPCnear future
2.2 Sokmagos processzorok (1)
![Page 13: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/13.jpg)
2.2 Sokmagos processzorok
2.2 Sokmagos processzorok•
2.2.2 Intel Tiled processszora•
2.2.1 Intel Larrabee processzora•
2.2.3 Intel SCC•
2.2.4 Intel MIC•
![Page 14: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/14.jpg)
2.2.1 Intel Larrabee processzora
2.2.1 Intel Larrabee processzora (1)
![Page 15: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/15.jpg)
Larrabee
Intel’s Tera-Scale kezdeményezésének részeként.
Projekt kezdete ~ 2005Az első nem nyilvános prezentáció: 03/2006 (visszavonva) Az első nyilvános prezentáció: 08/2008 (SIGGRAPH)Bejelentett megjelenés ~ 2009Visszavonás: 2010 vége
• Teljesítmény (cél): 2 TFlops
• Előzmények:
• Célok:
Nem egyetlen termék, hanem egy termékcsalád alapjául szolgáló bázis architektúra.
Nagyteljesítményű grafikai processzor, HPC
2.2.1 Intel Larrabee processzora (2)
![Page 16: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/16.jpg)
2.9 ábra: A GPU-orientált Larrabe blokk diagramja (2008 aug. SIGGRAPH)
Basic architecture
16-byte széles SIMD feldolgozó egységek
2.2.1 Intel Larrabee processzora (3)
![Page 17: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/17.jpg)
2.10 ábra: GPU-orientált Larrabee alaplapja (2006, túlhaladott)
2.2.1 Intel Larrabee processzora (4)
Multi GPU?
![Page 18: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/18.jpg)
2.11 ábra: Négyfoglalatos MP szerver célú Larrabee rendszer architektúrája
CSI: Common Systems Interface (csomagalapú soros IF)
2.2.1 Intel Larrabee processzora (5)
![Page 19: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/19.jpg)
2.2.2 Intel 80-magos Tile processzora
![Page 20: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/20.jpg)
• Intel Tera-Scale kezdeményezésének első megvalósítása
Bejelentése IDF 9/2006
Megjelenése 2/2007
• Cél: Tera-Scale kísérleti chip
(több, mint 100 projekt között)
• Előzmények:
80-magos Tile Processzor
2.2.2 Intel 80-magos Tile processzora (1)
![Page 21: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/21.jpg)
Intel
Bisection bandwidth: If the network is segmented into two equal parts, this is the bandwidth between the two parts
Mezosynchronous clock Same clock frequency, different phase
2.2.2 Intel 80-magos Tile processzora (2)
![Page 22: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/22.jpg)
Intel
2.2.2 Intel 80-magos Tile processzora (3)
![Page 23: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/23.jpg)
Intel
(Clocks run with the same frequency but unknown phases
FP Multiply-Accumulate(AxB+C)
2.2.2 Intel 80-magos Tile processzora (4)
![Page 24: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/24.jpg)
Figure: On board implementation of the 80-core Tile Processor
http://www.legitreviews.com/article/460/1/
2.2.2 Intel 80-magos Tile processzora (5)
![Page 25: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/25.jpg)
Intel
WIMP stands for "window, icon, menu, pointing device",
2.2.2 Intel 80-magos Tile processzora (6)
![Page 26: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/26.jpg)
Intel
2.2.2 Intel 80-magos Tile processzora (7)
![Page 27: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/27.jpg)
Intel
VLIW
2.2.2 Intel 80-magos Tile processzora (8)
![Page 28: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/28.jpg)
Intel
2.2.2 Intel 80-magos Tile processzora (9)
![Page 29: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/29.jpg)
Intel
2.2.2 Intel 80-magos Tile processzora (10)
(Pentium II)
![Page 30: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/30.jpg)
Intel
NoC: No Cache
2.2.2 Intel 80-magos Tile processzora (11)
![Page 31: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/31.jpg)
Intel
2.2.2 Intel 80-magos Tile processzora (12)
![Page 32: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/32.jpg)
2.2.3 Intel SCC (Single-chip Cloud Computer)
![Page 33: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/33.jpg)
• 12/2009: Announced
• 9/2010: Many-core Application Research Project (MARC) initiative started on the SCC platform
• Designed in Braunschweig and Bangalore
• 48 core, 2D-mesh system topology, message passing
Intel SCC (Single-chip Cloud Computer)
2.2.3 Intel SCC (Single-chip Cloud Computer) (1)
![Page 34: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/34.jpg)
Intel
2.2.3 Intel SCC (Single-chip Cloud Computer) (2)
![Page 35: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/35.jpg)
Intel
(350 nm)
2.2.3 Intel SCC (Single-chip Cloud Computer) (3)
![Page 36: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/36.jpg)
Intel
(Joint Test Action Group)Standard Test Access Port
2.2.3 Intel SCC (Single-chip Cloud Computer) (4)
![Page 37: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/37.jpg)
Intel
2.2.3 Intel SCC (Single-chip Cloud Computer) (5)
![Page 38: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/38.jpg)
2009
2.2.3 Intel SCC (Single-chip Cloud Computer) (6)
![Page 39: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/39.jpg)
2009
2.2.3 Intel SCC (Single-chip Cloud Computer) (7)
![Page 40: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/40.jpg)
Intel
2.2.3 Intel SCC (Single-chip Cloud Computer) (8)
![Page 41: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/41.jpg)
Intel
(Message Passing Buffer)
2.2.3 Intel SCC (Single-chip Cloud Computer) (9)
![Page 42: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/42.jpg)
2.2.4 Intel MIC (Many Integrated Cores) - Xeon Phi(Knights Corner)
![Page 43: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/43.jpg)
2.2.4 Intel MIC (Many Integrated Cores) (1)
A Larrabee projekt továbbfejlesztése
Cél: Adatpárhuzamos gyorsító (GPGPU-k “kiszorítására”)
Bejelentés: 5/2010 (International Supercomputing Conference)
Gyártás: 2012 vége
50 mag, 22 nm
Bevezetés
![Page 44: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/44.jpg)
https://www-304.ibm.com/services/learning/content/pdfs/IBM_May_9th_2012_Business_Partners_-_Intel_MIC_Overview_Public_Deck.pdf
2.2.4 Intel MIC (Many Integrated Cores) (2)
![Page 45: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/45.jpg)
https://www-304.ibm.com/services/learning/content/pdfs/IBM_May_9th_2012_Business_Partners_-_Intel_MIC_Overview_Public_Deck.pdf
2.2.4 Intel MIC (Many Integrated Cores) (3)
![Page 46: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/46.jpg)
G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012
2.2.4 Intel MIC (Many Integrated Cores) (4)
![Page 47: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/47.jpg)
G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012
2.2.4 Intel MIC (Many Integrated Cores) (5)
![Page 48: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/48.jpg)
G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012
2.2.4 Intel MIC (Many Integrated Cores) (6)
![Page 49: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/49.jpg)
G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012
2.2.4 Intel MIC (Many Integrated Cores) (7)
![Page 50: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/50.jpg)
G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012
Heavily customized Pentium P54C
2.2.4 Intel MIC (Many Integrated Cores) (8)
![Page 51: Sima Dezső](https://reader035.fdocuments.net/reader035/viewer/2022062321/56812b73550346895d8f93d9/html5/thumbnails/51.jpg)
http://h30613.www3.hp.com/media/files/downloads/Non-FilmedSessions/BB3330_Lafferty.pdf
2.2.4 Intel MIC (Many Integrated Cores) (9)