ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª)...

23
arqPar Presentación Curso 14/15 Departamento: Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: [email protected] TABLÓN DE ANUNCIOS: <==> www.dia.eui.upm.es Normas del Curso Tutorías Notas Exámenes PRÁCTICAS: Laboratorio 4405 Martes y 11’00 a 13’00 Jueves 18’00 a 19’00

Transcript of ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª)...

Page 1: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación Curso 14/15

Departamento: Sistemas Informáticos (A.T.C.)(Bloque IV - Planta 4ª)

Profesores:Pablo Carazo D4417 email: [email protected]

TABLÓN DE ANUNCIOS: <==> www.dia.eui.upm.esNormas del CursoTutoríasNotasExámenes

PRÁCTICAS: Laboratorio 4405

Martes y 11’00 a 13’00Jueves 18’00 a 19’00

Page 2: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación 2

Secretaria

L y J(15’00 a 18’00)

Mi despacho

Tablón

Page 3: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

“Aumento de prestaciones”

• Alta productividad • Alto rendimiento

3 en un año

Más tareas en el mismo tiempo

Un año

6 meses

Misma tarea en menos tiempo

• + gente• + ahínco• mejor

• + CPU’s• + GHz• algoritmo

arqPar Presentación 3

Page 4: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Objetivo 4

• Poner a trabajar juntos a varios procesadores (2 ... 10.000 ...)

Decenas de núcleos

RED

¿Buses?

15 Miles de núcleos61 16

Intel AMD Oracle

8 núcleos 8 núcleos 16 núcleos

Page 5: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

OBJETIVOS: “Aumento de prestaciones”

arqPar Presentación 5

• ALTERNATIVAS AL MODELO DE VON NEWMANN

Poner a trabajar juntos a varios procesadores (2..10000)

• PARALELISMO INTERNO Arquitecturas

superescalares

• IMPLEMENTACIONES CONCRETAS (Prácticas)

• PARALELISMO DE DATOS Sistólicos

VectorialesGPU’s y CUDA

Intel AMD Oracle

8 núcleos 8 núcleos 16 núcleos

Page 6: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación 6

Programa de Teoría Horas

1 INTRODUCCIÓN 5

2 CONECTIVIDAD 6

3 MÁQUINAS MIMD 7

4 MÁQUINAS SIMD y SIMT 6

5 SUPERESCALARES 5

Bibliografía

• Transparencias => WWW

• “Interconnection networks. …” José Duato y …, 2003

• “Parallel Computer Architecture. A Hw/Sw approach”. David E. Culler y Jaswinder Pal Singh, 1999

• “Modern Processor Design. ...” J.P. Shen y M.H. Lipasti, 2005

Page 7: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación 7

Programa de Prácticas

• Entorno•Cluster de 8 PC’s -4 núcleos- (En total 32 núcleos) + …•Lenguaje de programación “C”•MPI “Message Passing Interface”

• Planificación 2 3 4 5 6 Febrero

9 10 11 12 13 Formar ¿grupos? de prácticas

16 17 18 19 20

23 24 25 26 27

5 Mar ... Hacer una práctica ... 23Abril

2 turnos aprendizaje entorno MPI

Paralelizar

Ordenación, Primos, Viajante,

Cifrado, Genéticos, .....

Gráficos (Fractales, Sobel, ...)

¿ Mayo => CUDA + Parallella ?

Page 8: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación 8

Page 9: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación 9

Page 10: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación 10

FFT + Fgauss + FFT’

Page 11: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación 11

Page 12: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

Ordenaciónmaestro

esclavo1 esclavo2 esclavoN

Muy habitual un proceso x núcleo

arqPar Presentación 12

Un modelo de Práctica: Ordenación paralela

¿Cómo es nuestro cluster?

Page 13: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación 13

Pentium Core 2 Quad Q66002,4GHz • 8ML2 • 4GB • 500GB

Red E.U.I.Switch

GigaEthernet

pc1pc2pc3pc5 pc4

pc6

pc7pc8

Core i7

Page 14: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación 14

Pentium Core 2 Quad Q82002,4GHz • 4ML2 • 2GB • 300GB

PC10 PC11

Page 15: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación 15

2 Xeon E5520 Quad2,26GHz • 8ML3 • 12GB • 500GB

Page 16: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación 16

3 * NVIDIA GEFORCE GTX 6602GB GDDR5 960 núcleos 1,03 GHz

Page 17: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación 17

34,245 seg

1,329 seg8,840 seg

MPI4 núcleos

1,809 seg

MPI32 núcleos

Page 18: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación 18

Parallella Epiphany-16 Desktop Computer16 núcleos 600MHz => 19,2 GFlops

Zynq dual core ARM-A9 1GB SDRAM

µSD

µHDMI

µUSB GigabitEthernet

Page 19: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación 19

Page 20: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación 20

Page 21: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación 21

Conocimientos que vienen bien:

• Arquitectura de Computadores: Caches, pipeline, …

• Redes de Computadores: Redes locales, …

• Unix y Linux: Entorno de prácticas Linux

• Fundamentos de Programación: Programar en C

• Programación Orientada a Objetos y Concurrente

Page 22: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación 22

ActividadHoras

presencialesHoras no

presenciales Horas totales

Clases

Prácticas

Presentación artículos

Tests

Tutorías

Totales

26

24

4

1

1

56

26

48

14

12

0

100

52

72

18

13

1

156

Page 23: ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@eui.upm.es.

arqPar Presentación 23

• Evaluación no continua [Decirlo antes del 2 Marzo]Teoría 6 puntos

Prácticas 4 puntosT + P >= 5

• Evaluación continuaTeoría 4 puntos (Asistencia [1] + tests [3])

Trabajo 2 puntos (Exposición o Escrito)

Prácticas 4 puntos (Funcionando en 1 .. 16 núcleos)

• “Descripción y uso del supercomputador #1 TOP500 Nov 2013”

• "Why On-Chip Cache Coherence is Here to Stay“, 2012

• “Bulldozer: An Approach to Multithreaded Compute Performance”, 2011

• “Efficient Hardware Barrier Synchronization in Many-Core CMPs”, 2012

• “An Introduction to the Intel QuickPath Interconnect”, 2009

=> ¡ La NO asistencia se penaliza !

Competencia Análisis y Síntesis