Procesadores superescalares Introducción. Universidad de SonoraArquitectura de Computadoras2...

Procesadores superescalaresIntroducción

Universidad de Sonora Arquitectura de Computadoras 2

IntroducciónEl término “superescalar” (superscalar) fue acuñado

a fines de los 80s.Todas las CPUs modernas son superescalares.Es un desarrollo de la arquitectura con pipeline.Las etapas del pipeline se replican y en cada ciclo

de reloj se emiten varias instrucciones.Las instrucciones pueden terminar en desorden.Las instrucciones pueden emitirse en desorden.Se generan nuevos peligros por dependencias.

IntroducciónAl emitir varias instrucciones por ciclo el CPI (ciclos

por instrucción) es menor a 1.Una CPU de 6 GHz que emite 4 instrucciones a la

vez puede ejecutar hasta 24 mil millones de instrucciones por segundo para un CPI de 0.25.

En vez de CPI se usa IPC (instrucciones por ciclo de reloj) = 1 / CPI.

Un CPI de 0.25 es igual a un IPC de 4.

HistoriaEl primer paso hacia una arquitectura superescalar

fue agregar otra unidad de ejecución al pipeline.Supercomputadoras como Control Data 6600 y

7600, Cray-1 y algunas mainframes de IBM.

HistoriaEl siguiente paso es duplicar el pipeline.

DefinicionesGrado. Número de instrucciones que el CPU intenta

ejecutar (no hay garantía que lo pueda lograr).Scheduling. En que orden se ejecutan las

instrucciones. Hay dos opciones: Estático, cuando el hardware no tiene control. Dinámico, cuando el hardware puede reordenar.

Emisión (issue). Una instrucción se emite cuando sus operandos son obtenidos (fetched).

DefinicionesEjecución. Una instrucción se ejecuta, después de

ser emitida, cuando sus operandos están listos. Hay dos opciones: En orden del programa. Fuera de orden.

Especulación. Se intenta adivinar los brincos y el resultado de algunas otras instrucciones como por ejemplo que un lw/sw consecutivos no se refieren a la misma dirección.

DefinicionesCompromiso (commit). Una instrucción se

compromete cuando es seguro que se va a completar. En MIPS, la instrucción se compromete cuando llega al final de la etapa MEM.

Escribir (write back). Después de ejecutarse, la instrucción escribe el resultado.

Retiro. Después de escribir, la instrucción es retirada del pipeline. También se dice que la instrucción ha sido completada.

ClasificaciónSuperescalares estáticos.

El scheduling es estático. Las instrucciones se emiten y ejecutan en orden.

La emisión es dinámica. El hardware puede decidir no emitir todas las instrucciones que puede si hay dependencias.

Superescalares dinámicos.Las instrucciones se emiten en orden, pero se

ejecutan fuera de orden (scheduling dinámico).

ClasificaciónSuperescalares dinámicos con especulación.

Ejecución fuera de orden (scheduling dinámico).Capacidad para especular brincos.

Clasificación

Peligros (hazards)Los superescalares tienen tres clases de peligros:

estructurales, de datos y de control.Hay tres peligros de datos: RAW (read-after-write),

WAW (write-after-write) y WAR (write-after-read).Los peligros de datos se generan por dependencias

entre instrucciones.Además de la dependencia de datos, también

conocida como dependencia de datos verdadera que puede producir un peligro RAW, hay dos dependencias de nombre.

Dependencias de nombre1. Dependencias de salida.

Dos instrucciones guardan sus resultados en la misma parte.

Si son ejecutadas fuera de orden, la primera instrucción sobrescribe el resultado de la segunda.

Puede producir un peligro WAW. Ejemplo:

1. add $t0, $t1, $t2

2. lw $s0, 4($t0)

3. add $t0, $t2, $t3

Dependencias de nombreHay una dependencia de salida entre 1 y 3.El orden de ejecución 3-2-1 genera un peligro WAW.

Dependencias de nombre2. Antidependencias.

La primera instrucción necesita un valor que la segunda instrucción actualiza.

Si son ejecutadas fuera de orden, la primera instrucción lee el valor actualizado.

Puede producir un peligro WAR (write-after-read). Ejemplo:

1. add $t4, $t0, 1

2. move $t0, $a0 La instrucción 2 no puede correr antes de la 1.

Dependencias de nombre Dos soluciones básicas:

1. Renombrar los registros.

2. Usar un buffer para reordenar (reorder buffer o ROB).

Renombrar registrosEl hardware mantiene una lista grande de registros.Los registros son invisibles al programador y no

necesariamente son registros físicos.Se asignan dinámicamente según se necesitan.Puede haber varias versiones de un registro físico al

mismo tiempo.

Renombrar registrosEjemplo:

1. mul r2, r2, r3 ; r2 = r2 * r32. add r4, r2, 1 ; r4 = r2 + 13. add r2, r3, 1 ; r2 = r3 + 14. div r5, r2, r4 ; r5 = r2 / r4

Hay una dependencia de salida entre 1 y 3.Hay una antidependencia entre 2 y 3.Hay una dependencia de datos entre 3 y 4.La instrucción 3 no puede comenzar hasta que la 1

haya terminado y la 2 haya comenzado.

Renombrar registrosLos registros se pueden etiquetar:

1. mul r2_b, r2_a, r3_a ; r2 = r2 * r3

2. add r4_b, r2_b, 1 ; r4 = r2 + 1

3. add r2_c, r3_a, 1 ; r2 = r3 + 1

4. div r5_b, r2_c, r4_b ; r5 = r2 / r4

Ahora la instrucción 3 puede comenzar porque usa un registro r2 “diferente” que 1 y 2.

Las etiquetas funcionan como historia de cada registro: r2_c es la versión mas nueva de r2, mientras que r2_a es la versión mas vieja.

ROBProvee registros adicionales.Mantiene el resultado de una instrucción desde que

termina hasta que se compromete.Cada entrada en el ROB tiene 4 campos:

Tipo de instrucción: brinco, sw u operación de registro.Registro destino si es sw u operación de registro.Valor de la instrucción.Indicador si la instrucción terminó y el valor es válido.

Las entradas están ordenados en cola (FIFO).

ROBSi una instrucción necesita el valor de un registro,

primero debe buscarlo en el ROB, de atrás hacia delante, y si no lo encuentra entonces lo toma del registro físico.

ConclusiónLos procesadores superescalares son una

extensión de la arquitectura pipeline simple que emiten y pueden ejecutar varias instrucciones a la vez.

Producen mas peligros y requieren soluciones mas sofisticadas que el pipeline simple.

Pueden alcanzar CPIs menores a 1.

Procesadores superescalares Introducción. Universidad de SonoraArquitectura de Computadoras2...

Documents

Transcript of Procesadores superescalares Introducción. Universidad de SonoraArquitectura de Computadoras2...

Programación en MIPS. Universidad de SonoraArquitectura de Computadoras2 Programación en MIPS Camino típico: 1. Ensamblador de MIPS. Traduce instrucciones.

Arquitectura de Computadorasweblidi.info.unlp.edu.ar/catedras/arquitecturaP2003/teorias/Notas cl… · procesamiento superescalar (2) Excepciones precisas Por ejemplo: los resultados

TEMA 3 Lanzamiento múltiple, Límites de ILP, Multithreading · AC — Tema 3 Más ILP: Lanzamiento múltiple Alternativas Procesador Superescalar con planificación estática Procesador

Arquiteturas Paralelas e Distribuídas - Aula 4 - ￼Arquitetura Superescalar

Ley de Amdahl. Universidad de SonoraArquitectura de Computadoras2 Definición Evalúa como cambia el rendimiento al mejorar una parte de la computadora.

Memoria Cachés. Universidad de SonoraArquitectura de Computadoras2 Introducción Caché es el nivel de memoria situada entre el procesador y la memoria.

Aula 12 Organização de Computadores Processadores Paralelos - Superescalar Profa. Débora Matos.

New INDEX 1. DEFINICIÓ DE PROCESSADOR SUPERESCALAReia.udg.es/~puiggali/superescalar.pdf · 2002. 3. 8. · El grau de paral.lelisme d’un processador superescalar ens definirà

Rendimiento de la CPU y sus factores. Universidad de SonoraArquitectura de Computadoras2 Rendimiento ¿Cómo se puede definir el rendimiento de un sistema.

SESC: SuperESCalar Simulatorsesc.sourceforge.net/sescdoc.pdf · SESC is a microprocessor architectural simulator developed primarily by the i-acoma research group at UIUC and various

Adelantos Científicos y Tecnológicos Precursores de las Computadoras2

Scheduling dinámico Algoritmo de Tomasulo. Universidad de SonoraArquitectura de Computadoras2 Introducción Desarrollado por Robert Tomasulo para la super-

3.4 PROCESAMIENTO DE LAS INSTRUCCIONES DE SALTO. Se ha estudiado las dependencias de datos RAW,WAR y WAW en el procesamiento superescalar de instrucciones.

ARQUITETURA E ORGANIZAÇÃO DE COMPUTADORESda Arquitetura Superpipeline •Compreender o funcionamento da Arquitetura Superescalar •Introduzir o conceito de multiprocessamento •Apresentar

Organização e Arquitetura de Computadoresguilherme/oac/material/Cap13.pdf · 2009-11-10 · Organização e Arquitetura de Computadores ... O que é Superescalar? As arquiteturas

MIPS Intermedio. Universidad de SonoraArquitectura de Computadoras2 Seudo-instrucciones Son instrucciones que el ensamblador reconoce pero que no existen.

ALU Unidad aritmético-lógica. Universidad de SonoraArquitectura de Computadoras2 Definición La ALU (unidad aritmético-lógica) es el dispositivo que se.

Memoria Otros temas sobre cachés. Universidad de SonoraArquitectura de Computadoras2 Otros temas 1. Estrategias de búsqueda de bloque. 2. Estrategias.

Unidad 1 Arquitectura de Computadoras2

El procesador Diseño del control. Universidad de SonoraArquitectura de Computadoras2 Datapath MIPS simple.

Arquiteturas Paralelas e Distribuídas - Aula 4 - Arquitetura Superescalar