A rkitektura P araleloak IF - EHU Arquitecturas paralelas 9. Herramientas para la...

Click here to load reader

  • date post

    02-Feb-2016
  • Category

    Documents

  • view

    223
  • download

    0

Embed Size (px)

Transcript of A rkitektura P araleloak IF - EHU Arquitecturas paralelas 9. Herramientas para la...

Presentación de PowerPointArquitecturas paralelas
9. Herramientas para la programación de aplicaciones paralelas: OpenMP y MPI (introducción).
Computadores de alta velocidad (la lista top500).
Arquitecturas Paralelas FI - EHU
Array
Vectorial
MP
P
C
bus
Sistemas SMP / sistemas SIMD
Sistemas masivamente paralelos MPP
Las mejores prestaciones (velocidad de cálculo): comunicación de baja latencia y elevado ancho de banda, en algunos casos procesadores con diseño específico, software de control muy optimizado, etc.
Pero coste muy elevado.
9
Lista de los 500 supercomputadores más rápidos del mundo ejecutando el banco de pruebas LINPACK.
Se mide el valor de Rmax, Nmax y N1/2.
También se empieza a medir la potencia consumida.
Sistemas de ecuaciones lineales densos (cálculo matricial). Permite obtener velocidades muy altas (un máximo virtual).
Top500 (www.top500.org)
Lista nº 40 - noviembre 2012
Más o menos aceptado por todos los fabricantes.
Análisis de tendencias / evolución del mercado.
Top500
Top5+
Fabricantes
Top5 (diciembre 12)
Más BueGene/Q: (4): Mira, 48x, USA; (5) JUQUEEN, 24x, Juelich; (9) Fermi, 10x, Bologna
Rank
Computer
Cores
1 mpp
Titan, Cray XK7 Opteron 6274, 16 core 2,2 GHz Cray Gemini, NVIDIA K20x
560.640
-
Sequoia, BlueGene/Q Power BQC, 16c – 1,60 GHz Custom (torus 5D)
1.572.864 (96x1024x16)
16,3 20,1
3 cluster
K computer, Fujitsu SPARC67 viiifx - 2 GHz Tofu interc., 6D torus/mesh
705.027
147.456
186.368
Cant.
arquitectura del sistema
33.664 cores – 637 TF/s
>> 39.208 cores – 0,7 PF/s (0,3%)
11 Curie thin nodes, CEA
Bullx B510 Xeon E5 (8c), Infniband, 77.184 c. – 1.359 TF/s
20 Tera-100, CEA

>> 620.248 c.- 6,5 PF/s (4%)
>> Europa: Alemania (19 - 10,2 PF/s), G.B. (24 – 7,3 PF/s), Italia (7 - 2,4 PF/s)
Total: 31,2 PF/s (20%)
Arquitecturas Paralelas FI - EHU
Arina, Arinaz (260 núcleos, Itanium2)
Guinness (440 núcleos, Xeon)
Maiz (40 núcleos, Opteron)
4 servidores
Arquitecturas Paralelas FI - EHU
Software adquirido:
CFX, dinámica de fluidos
WIEN2K, estr. electrónica de sólidos
Qsite, proteínas
Gigabit Ethernet
1,4 Gb/s (x2)
5,6 Tb/s bisección
Shared memory: 128 GB × 160 = 20 TB
*
65 nm CMOS
350 million transistors
*