ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª)...

arqPar Presentación Curso 14/15

Departamento: Sistemas Informáticos (A.T.C.)(Bloque IV - Planta 4ª)

Profesores:Pablo Carazo D4417 email: [email protected]

TABLÓN DE ANUNCIOS: <==> www.dia.eui.upm.esNormas del CursoTutoríasNotasExámenes

PRÁCTICAS: Laboratorio 4405

Martes y 11’00 a 13’00Jueves 18’00 a 19’00

arqPar Presentación 2

Secretaria

L y J(15’00 a 18’00)

Mi despacho

Tablón

“Aumento de prestaciones”

• Alta productividad • Alto rendimiento

3 en un año

Más tareas en el mismo tiempo

Un año

6 meses

Misma tarea en menos tiempo

• + gente• + ahínco• mejor

• + CPU’s• + GHz• algoritmo


arqPar Objetivo 4

• Poner a trabajar juntos a varios procesadores (2 ... 10.000 ...)

Decenas de núcleos

RED

¿Buses?

15 Miles de núcleos61 16

Intel AMD Oracle

8 núcleos 8 núcleos 16 núcleos

OBJETIVOS: “Aumento de prestaciones”


• ALTERNATIVAS AL MODELO DE VON NEWMANN

Poner a trabajar juntos a varios procesadores (2..10000)

• PARALELISMO INTERNO Arquitecturas

superescalares

• IMPLEMENTACIONES CONCRETAS (Prácticas)

• PARALELISMO DE DATOS Sistólicos

VectorialesGPU’s y CUDA

Intel AMD Oracle

8 núcleos 8 núcleos 16 núcleos


Programa de Teoría Horas

1 INTRODUCCIÓN 5

2 CONECTIVIDAD 6

3 MÁQUINAS MIMD 7

4 MÁQUINAS SIMD y SIMT 6

5 SUPERESCALARES 5

Bibliografía

• Transparencias => WWW

• “Interconnection networks. …” José Duato y …, 2003

• “Parallel Computer Architecture. A Hw/Sw approach”. David E. Culler y Jaswinder Pal Singh, 1999

• “Modern Processor Design. ...” J.P. Shen y M.H. Lipasti, 2005


Programa de Prácticas

• Entorno•Cluster de 8 PC’s -4 núcleos- (En total 32 núcleos) + …•Lenguaje de programación “C”•MPI “Message Passing Interface”

• Planificación 2 3 4 5 6 Febrero

9 10 11 12 13 Formar ¿grupos? de prácticas

16 17 18 19 20

23 24 25 26 27

5 Mar ... Hacer una práctica ... 23Abril

2 turnos aprendizaje entorno MPI

Paralelizar

Ordenación, Primos, Viajante,

Cifrado, Genéticos, .....

Gráficos (Fractales, Sobel, ...)

¿ Mayo => CUDA + Parallella ?


FFT + Fgauss + FFT’

Ordenaciónmaestro

esclavo1 esclavo2 esclavoN

Muy habitual un proceso x núcleo


Un modelo de Práctica: Ordenación paralela

¿Cómo es nuestro cluster?


Pentium Core 2 Quad Q66002,4GHz • 8ML2 • 4GB • 500GB

Red E.U.I.Switch

GigaEthernet

pc1pc2pc3pc5 pc4

pc6

pc7pc8

Core i7


Pentium Core 2 Quad Q82002,4GHz • 4ML2 • 2GB • 300GB

PC10 PC11


2 Xeon E5520 Quad2,26GHz • 8ML3 • 12GB • 500GB


3 * NVIDIA GEFORCE GTX 6602GB GDDR5 960 núcleos 1,03 GHz


34,245 seg

1,329 seg8,840 seg

MPI4 núcleos

1,809 seg

MPI32 núcleos


Parallella Epiphany-16 Desktop Computer16 núcleos 600MHz => 19,2 GFlops

Zynq dual core ARM-A9 1GB SDRAM

µSD

µHDMI

µUSB GigabitEthernet


Conocimientos que vienen bien:

• Arquitectura de Computadores: Caches, pipeline, …

• Redes de Computadores: Redes locales, …

• Unix y Linux: Entorno de prácticas Linux

• Fundamentos de Programación: Programar en C

• Programación Orientada a Objetos y Concurrente


ActividadHoras

presencialesHoras no

presenciales Horas totales

Clases

Prácticas

Presentación artículos

Tests

Tutorías

Totales

26

24

4

1

1

56

26

48

14

12

0

100

52

72

18

13

1

156


• Evaluación no continua [Decirlo antes del 2 Marzo]Teoría 6 puntos

Prácticas 4 puntosT + P >= 5

• Evaluación continuaTeoría 4 puntos (Asistencia [1] + tests [3])

Trabajo 2 puntos (Exposición o Escrito)

Prácticas 4 puntos (Funcionando en 1 .. 16 núcleos)

• “Descripción y uso del supercomputador #1 TOP500 Nov 2013”

• "Why On-Chip Cache Coherence is Here to Stay“, 2012

• “Bulldozer: An Approach to Multithreaded Compute Performance”, 2011

• “Efficient Hardware Barrier Synchronization in Many-Core CMPs”, 2012

• “An Introduction to the Intel QuickPath Interconnect”, 2009

=> ¡ La NO asistencia se penaliza !

Competencia Análisis y Síntesis

ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª)...

Documents

Transcript of ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª)...