ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª)...
-
Upload
virginia-cardenas-araya -
Category
Documents
-
view
216 -
download
0
Transcript of ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª)...
arqPar Presentación Curso 14/15
Departamento: Sistemas Informáticos (A.T.C.)(Bloque IV - Planta 4ª)
Profesores:Pablo Carazo D4417 email: [email protected]
TABLÓN DE ANUNCIOS: <==> www.dia.eui.upm.esNormas del CursoTutoríasNotasExámenes
PRÁCTICAS: Laboratorio 4405
Martes y 11’00 a 13’00Jueves 18’00 a 19’00
arqPar Presentación 2
Secretaria
L y J(15’00 a 18’00)
Mi despacho
Tablón
“Aumento de prestaciones”
• Alta productividad • Alto rendimiento
3 en un año
Más tareas en el mismo tiempo
Un año
6 meses
Misma tarea en menos tiempo
• + gente• + ahínco• mejor
• + CPU’s• + GHz• algoritmo
arqPar Presentación 3
arqPar Objetivo 4
• Poner a trabajar juntos a varios procesadores (2 ... 10.000 ...)
Decenas de núcleos
RED
¿Buses?
15 Miles de núcleos61 16
Intel AMD Oracle
8 núcleos 8 núcleos 16 núcleos
OBJETIVOS: “Aumento de prestaciones”
arqPar Presentación 5
• ALTERNATIVAS AL MODELO DE VON NEWMANN
Poner a trabajar juntos a varios procesadores (2..10000)
• PARALELISMO INTERNO Arquitecturas
superescalares
• IMPLEMENTACIONES CONCRETAS (Prácticas)
• PARALELISMO DE DATOS Sistólicos
VectorialesGPU’s y CUDA
Intel AMD Oracle
8 núcleos 8 núcleos 16 núcleos
arqPar Presentación 6
Programa de Teoría Horas
1 INTRODUCCIÓN 5
2 CONECTIVIDAD 6
3 MÁQUINAS MIMD 7
4 MÁQUINAS SIMD y SIMT 6
5 SUPERESCALARES 5
Bibliografía
• Transparencias => WWW
• “Interconnection networks. …” José Duato y …, 2003
• “Parallel Computer Architecture. A Hw/Sw approach”. David E. Culler y Jaswinder Pal Singh, 1999
• “Modern Processor Design. ...” J.P. Shen y M.H. Lipasti, 2005
arqPar Presentación 7
Programa de Prácticas
• Entorno•Cluster de 8 PC’s -4 núcleos- (En total 32 núcleos) + …•Lenguaje de programación “C”•MPI “Message Passing Interface”
• Planificación 2 3 4 5 6 Febrero
9 10 11 12 13 Formar ¿grupos? de prácticas
16 17 18 19 20
23 24 25 26 27
5 Mar ... Hacer una práctica ... 23Abril
2 turnos aprendizaje entorno MPI
Paralelizar
Ordenación, Primos, Viajante,
Cifrado, Genéticos, .....
Gráficos (Fractales, Sobel, ...)
¿ Mayo => CUDA + Parallella ?
arqPar Presentación 8
arqPar Presentación 9
arqPar Presentación 10
FFT + Fgauss + FFT’
arqPar Presentación 11
Ordenaciónmaestro
esclavo1 esclavo2 esclavoN
Muy habitual un proceso x núcleo
arqPar Presentación 12
Un modelo de Práctica: Ordenación paralela
¿Cómo es nuestro cluster?
arqPar Presentación 13
Pentium Core 2 Quad Q66002,4GHz • 8ML2 • 4GB • 500GB
Red E.U.I.Switch
GigaEthernet
pc1pc2pc3pc5 pc4
pc6
pc7pc8
Core i7
arqPar Presentación 14
Pentium Core 2 Quad Q82002,4GHz • 4ML2 • 2GB • 300GB
PC10 PC11
arqPar Presentación 15
2 Xeon E5520 Quad2,26GHz • 8ML3 • 12GB • 500GB
arqPar Presentación 16
3 * NVIDIA GEFORCE GTX 6602GB GDDR5 960 núcleos 1,03 GHz
arqPar Presentación 17
34,245 seg
1,329 seg8,840 seg
MPI4 núcleos
1,809 seg
MPI32 núcleos
arqPar Presentación 18
Parallella Epiphany-16 Desktop Computer16 núcleos 600MHz => 19,2 GFlops
Zynq dual core ARM-A9 1GB SDRAM
µSD
µHDMI
µUSB GigabitEthernet
arqPar Presentación 19
arqPar Presentación 20
arqPar Presentación 21
Conocimientos que vienen bien:
• Arquitectura de Computadores: Caches, pipeline, …
• Redes de Computadores: Redes locales, …
• Unix y Linux: Entorno de prácticas Linux
• Fundamentos de Programación: Programar en C
• Programación Orientada a Objetos y Concurrente
arqPar Presentación 22
ActividadHoras
presencialesHoras no
presenciales Horas totales
Clases
Prácticas
Presentación artículos
Tests
Tutorías
Totales
26
24
4
1
1
56
26
48
14
12
0
100
52
72
18
13
1
156
arqPar Presentación 23
• Evaluación no continua [Decirlo antes del 2 Marzo]Teoría 6 puntos
Prácticas 4 puntosT + P >= 5
• Evaluación continuaTeoría 4 puntos (Asistencia [1] + tests [3])
Trabajo 2 puntos (Exposición o Escrito)
Prácticas 4 puntos (Funcionando en 1 .. 16 núcleos)
• “Descripción y uso del supercomputador #1 TOP500 Nov 2013”
• "Why On-Chip Cache Coherence is Here to Stay“, 2012
• “Bulldozer: An Approach to Multithreaded Compute Performance”, 2011
• “Efficient Hardware Barrier Synchronization in Many-Core CMPs”, 2012
• “An Introduction to the Intel QuickPath Interconnect”, 2009
=> ¡ La NO asistencia se penaliza !
Competencia Análisis y Síntesis