Mini Curso Programação Paralela utilizando OpenMP - SACTA 2013

Mini Curso: Programação Paralela utilizando OpenMP

Arthur F. Lorenzon Antonio Carlos S. B. F.

Henrique O. GresslerMárcia C. Cera

Quem somos...

● Arthur Francisco Lorenzon:

● Bacharel em CC pela UNIPAMPA

● Aluno do PPGC/UFRGS

● Integrante do Laboratório de Sistemas Embarcados – UFRGS

● Henrique de Oliveira Gressler

● Márcia Cristina Cera

● Antonio Carlos S. B. Filho

Quem somos...

● Arthur Francisco Lorenzon

● Henrique de Oliveira Gressler:

● Bacharel em Ciência da Computação pela UNIPAMPA

Quem somos...

● Márcia Cristina Cera:

● Doutorado em Computação pela UFRGS

● Professora Adjunta da UNIPAMPA

● Pesquisadora da área de PPD

Quem somos...

● Antonio Carlos S. B. Filho:

● Pós-Doutorado em Computação – UFRGS

● Professor Adjunto da UFRGS

● Bolsista de Produtividade em Pesquisa do CNPq – Nível 2

Experiência dos Palestrantes...

● Diversas aplicações paralelizadas utilizando OpenMP

● Diversos trabalhos publicados utilizando OpenMP

● Participação em eventos/grupos de pesquisa:

● Maratona de Programação Paralela – Petrópolis/RJ 2012

● Grupo de Estudos para Maratonas de Prog. Paralela – GEMPP

● Trabalho de Conclusão de Curso

Objetivos deste Mini-Curso

● Programação Paralela

● Técnicas de Programação Paralela com OpenMP

● Teoria

● Prática

● Desafios Futuros para a área de PPD

Roteiro

● Evolução dos Microprocessadores

● Cenário Atual

● Programar Paralelo, Porque? Onde? Como?

● OpenMP:

● Noções Básicas

● Paralelismo de Laços

● Paralelismo de Seções

● Diretivas de Sincronização

● Desafios Futuros

Evolução dos Microprocessadores

Sobreposição na execução de etapas da instrução

IF ID EX ME WBIF ID EX ME WB

IF ID EX ME WB

Múltiplas Unidades FuncionaisHardware: SuperscalarSoftware: VLIW

Melhora do desempenho utilizando técnicas de computação paralela!

Preocupação com gerenciamento de energia!!!

Paralelismo no Nível de ThreadAumento da Performance

Arquiteturas Multi-Core

● De forma simplificada um processador multi-core é colocar dois ou mais processadores num mesmo processador/chip.

● Trabalho de processsamento ficará dividido entre os cores.

CPU 0 CPU 1

Programação Paralela

“Programação Paralela é a capacidade de dividirmos

uma carga de trabalho entre vários processadores

dinamicamente e de forma eficiente!”

O que paralelizar?

● Previsão do tempo e do clima

● Cálculos matemáticos

● Processamento de imagens

● Simuladores

● Componentes de Jogos*

Porque Paralelizar?

● Processamento simultâneo de diversas tarefas

● Melhorar aproveitamento do hardware – ciclos ociosos

● Aumentar o desempenho da CPU

● Aplicações mais rápidas e eficientes – Redução do tempo de computação

Cenário Atual

Arquiteturas Multicore

Ferramentas

Motivos

Aplicações

Prós Contra

Cenário Atual

Arquiteturas Multicore

Ferramentas

Motivos

Aplicações

Prós Contra

Pensamento e ProgramaçãoSequencial

Programar Paralelo é Díficil?

Identificando Oportunidades de Paralelismo

● Estudar a aplicação:

● Tempo de execução● Ferramentas de geração de profile● Avaliar potênciais funções e loops

● Identificar tarefas que possam ser executadas concorrentemente

● Definir a maneira mais eficiente de paraleliza-lá

● Obter um código paralelo ideal pode levar horas, dias, semanas e até meses

1. Preparar a tinta = 30 s;

2. Pintar 300 estacas = 3000 s;

3. Aguardar tinta secar = 30 s;

Quanto tempo levará um pintor?

Exemplo

3060 s

Exemplo

3060 s

1530 s 1560 s

Quanto tempo levarão dois pintores?

Exemplo

3060 s

1530 s 1560 s

Quanto tempo levarão dois pintores?

Exemplo

● Sempre existirão partes sequenciais em um programa!

1. Preparar a tinta

2. Pintar 300 estacas

3. Aguardar tinta secar

Região Paralela

Região Sequencial

Exemplo

● Sempre existirão partes sequenciais em um programa!

1. Preparar a tinta

2. Pintar 300 estacas

3. Aguardar tinta secar

Região Paralela

Região Sequencial

Pintar 150

Secar a tinta

Preparar a tinta

Pintar 150Pintar 300

Secar a tinta

Preparar a tinta

Sequencial:

Paralelo:

Modelos de Programação Paralela

Memória Distribuída Memória Compartilhada

● Open Multi-Processing

● Teve início por volta de 1997

● Padrão que define como os compiladores devem gerar códigos paralelos através de diretivas e funções. (Não é linguagem!)

● Disponível para Fortran 77, Fortran 90, C e C++

● Baseia-se na criação de várias threads que compartilham o mesmo recurso de memória

● Regiões Privadas

● Regiões Compartilhadas

Noções Básicas de OpenMP

● Open Multi-Processing

● Teve início por volta de 1997

● Padrão que define como os compiladores devem gerar códigos paralelos através de diretivas e funções. (Não é linguagem!)

● Disponível para Fortran 77, Fortran 90, C e C++

● Baseia-se na criação de várias threads que compartilham o mesmo recurso de memória

● Regiões Privadas

● Regiões Compartilhadas

● Facilidade de conversão de programas seqüenciais em paralelos

● Fácil compreensão e uso das diretivas

● Minimiza a interferência na estrutura do algoritmo

● Compila e executa em ambientes paralelo e sequencial

● Maneira simples de explorar o paralelismo

● Facilidade de conversão de programas seqüenciais em paralelos

● Fácil compreensão e uso das diretivas

● Minimiza a interferência na estrutura do algoritmo

● Compila e executa em ambientes paralelo e sequencial

● Maneira simples de explorar o paralelismo

!!! CUIDADO !!!

OpenMP é simples, mas demanda conhecimento: - Aplicação - Arquitetura - Melhor “opção” de paralelismo

Modelo de Programação

Elementos do OpenMP

#pragma omp diretiva [cláusula]

omp_serviço(...)OMP_NOME

● Consiste em uma linha de código com significado especial para o compilador.

● Identificadas pelo #pragma omp

● Formato padrão:

#pragma omp nome_diretiva [cláusula,...] novaLinha

● Inclusão header: “omp.h”

Diretivas de Compilação

Construtor ParaleloConstrutores de Compartilhamento de Trabalho

Diretivas de Sincronização

● Diretiva mais importante do OpenMP

● Informa ao compilador a área que deverá ser executada em paralelo

Construtor Paralelo

#include <omp.h>int main(){

#pragma omp parallel{printf(“Ola Mundo\n”);

if, private, shared, firstprivate, default,

copyin, reduction num_threads

● Exemplos:● www.inf.ufrgs.br/~aflorenzon/curso_OpenMP/

● gcc nome_programa.c -o nome_saida -fopenmp

● hello.c e exemplo1.c

Construtor Paralelo

#pragma omp parallel{

for(i=0;i<n;i++)a[i] = b[i]+c[i];

Construtor Paralelo

for(i=0;i<n;i++)a[i] = b[i]+c[i];

O que há de errado com o código ao lado?

Construtor Paralelo

for(i=0;i<n;i++)a[i] = b[i]+c[i];

O que há de errado com o código ao lado?

Variáveis compartilhadas entre todas as

threads, por padrão!

Construtor Paralelo

#pragma omp parallel private(i){

for(i=0;i<n;i++)a[i] = b[i]+c[i];

Variáveis de controlede laço devem ser

privadas à cada thread!

● Construtor de Compartilhamento de Trabalho:

● Responsáveis pela distribuição de trabalho entre as threads e determinam como o trabalho será dividido entre as threads.

● Necessariamente interna a uma região paralela.

#pragma omp construtor[clausula [clausula] …]

– #pragma omp for

– #pragma omp sections

– #pragma omp single

Construtor Paralelo

● #pragma omp for

– Iterações dos laços for são executadas em paralelo.

– Número de iterações deve ser previamente conhecido e não possui variação durante a execução – (while).

– Implementa SIMD (Single Instruction Multiple Data).

Construtor de Trabalho

● #pragma omp for

– Iterações dos laços for são executadas em paralelo.

– Número de iterações deve ser previamente conhecido e não possui variação durante a execução – (while).

– Implementa SIMD (Single Instruction Multiple Data).

#pragma omp parallel private(i){ #pragma omp for

for(i=0;i<n;i++) a[i] = b[i]+c[i];

Ex: ex_omp_for_1.c

● #pragma omp for

– Schedulers alteram a forma como as iterações do loop são distribuídas entre as threads

– #pragma omp for schedule (name_schedule, chunk)

– Guided, Dynamic, Static and Runtime

● Cláusula schedule:

Construtores de Trabalho

Ex: ex_omp_for_static.c

ex_omp_for_dynamic.cex_omp_for_guided.c

Intervalo

● Nos vemos novamente as 21:00 hs para a segunda etapa do curso!

● OpenMP Sections

● Diretivas de Sincronização

● Desafios Futuros

● Considerações Finais

● #pragma omp sections

– Utilizado para dividir tarefas entre as threads em blocos de códigos que não possuem iterações.

#pragma omp parallel {

#pragma omp sections{

#pragma omp sectioninstrução

#pragma omp sectioninstruçao

– Utilizado para dividir tarefas entre as threads em blocos de códigos que não possuem iterações.

#pragma omp sectioninstrução

#pragma omp sectioninstruçao

Região paralela

Indica que cada thread irá executar um bloco

de instruções diferentes

Qual instrução que cadathread irá executar

Fim região paralela

– Manter coerência entre número de blocos x número de threads– Mais blocos → algumas threads irão executar mais de um bloco– Mais threads → algumas threads ficarão ociosas– Apenas uma thread → execução seqüencial– Implementa MIMD (Multiple Instructions Multiple Data)

Serial Paralelo

#pragma omp sectionsoma_vet(a,b,c);

#pragma omp sectionmult_vet(a,b,d);

#pragma omp sectiondiv_vet(a,b,e);

#pragma omp sectionsub_vet(a,b,f);

Ex1: ex_omp_sections.cEx1: ex_omp_sections.c

#pragma omp sectionsoma_vet(a,b,c);

#pragma omp sectionmult_vet(a,b,d);

#pragma omp sectiondiv_vet(a,b,e);

#pragma omp sectionsub_vet(a,b,f);

Ex1: ex_omp_sections.cEx1: ex_omp_sections.c

Ex1: ex_omp_sections.cEx2: ex_omp_sections_2.c./ex_omp_sections_2 numero_threads

Ex1: ex_omp_sections.comp_set_num_threads(NUM)

● #pragma omp single

● Trecho de código será executado apenas por uma thread

● Demais threads aguardam em uma barreira implícita

#pragma omp singleprintf(“Inicio região paralela\n”);

#pragma omp for…

● Primeiro devemos entender o que são “condições de corrida”

● Quando duas ou mais threads tentam atualizar, ao mesmo tempo, uma mesma variável

● Quando uma thread atualiza uma variável e outra acesso o valor ao mesmo tempo

● Quando isto acontece, o resultado tende a ser incorreto!

● Primeiro devemos entender o que são “condições de corrida”

● Quando duas ou mais threads tentam atualizar, ao mesmo tempo, uma mesma variável

● Quando uma thread atualiza uma variável e outra acesso o valor ao mesmo tempo

● Quando isto acontece, o resultado tende a ser incorreto!

Diretivas de sincronização garantem que o acesso ou atualização de uma determinada variável

Compartilhada aconteça no momento certo

● Construtores:

● Critical:

– Restringe a execução de uma determinada tarefa a apenas uma thread por vez

● Atomic

● Barrier

● Construtores:

● Critical:

– Restringe a execução de uma determinada tarefa a apenas uma thread por vez

● Atomic:

– Um local específico da memória deve ser atualizado atomicamente, ao invés de deixar várias threads tentarem escrever nele

– Em essência, esta directiva prevê uma seção mini-critical.

● Barrier

● Construtores:

● Critical

● Atomic

● Barrier:

– Utilizada para sincronizar todas as threads em um determinado ponto do código

● Classificadas em:

● Funções de ambiente de execução

● Funções de bloqueio

● Funções de tempo

Funções de Interface

● Paralelismo utilizando tasks!

● Utilizado para paralelizar algoritmos irregulares:

● Recursividade

● Repetições utilizando While

● Exemplos de aplicações:

● Algoritmos de ordenação → Merge sort, Quick sort...

● Manipulação de ponteiros → Listas

OpenMP Avançado

● #pragma omp task

● Interna a uma região paralela

● Thread que executar o #pragma omp task criará uma nova task

OpenMP Avançado

#pragma omp single nowaitsort();

void sort(){….for(i=0;i<N;i++){

#pragma omp tasksort();

● Poderosa API de programação paralela

● Fácil implementação

● Pouca modificação do código sequencial

● Bastante utilizada para computação hibrida (MPI + OpenMP)

Resumo OpenMP

Desafios Futuros - Exascale

Desafios Futuros – Eficiência Energética

● Eficiência Energética

● Aumentar/Manter desempenho

● Diminuir o consumo de energia

● Arquiteturas Heterogêneas

Desafios Futuros

● Eficiência Energética

● Aumentar/Manter desempenho

● Diminuir o consumo de energia

● Arquiteturas Heterogêneas

Desafios Futuros

Muito Obrigado!Perguntas

gresslerbwg@gmail.commarcia.cera@unipampa.edu.br

Arthur F. Lorenzon Antonio Carlos S. B. F.

Henrique O. GresslerMárcia C. Cera

aflorenzon@inf.ufrgs.brcaco@inf.ufrgs.br

Mini Curso Programação Paralela utilizando OpenMP - SACTA 2013

Documents

Transcript of Mini Curso Programação Paralela utilizando OpenMP - SACTA 2013

MSc in Bioinformatics for Genomics and Drug Designmscbioinformatics.uab.cat/base/myimages/MsBioinformatics/MSc... · • Modelos de programación paralela (Pthreads, OpenMP, MPI,

Introdução à programação paralela em Fortran usando OpenMP ... · OMP GET NUM THREADS() Retorna o numero de threads utilizadas em uma se˘c~ao paralela OMP GET MAX THREADS()

IMPLEMENTACIÓN DE COMPUTACIÓN DE ALTO … · programaciÓn paralela en cÓdigos computacionales ... 2 implementaciÓn de algoritmos ... numÉrica con openmp para la regla del trapecio

Лекция 6 - mkurnosov.net · OpenMP 2.5 (2005), OpenMP 3.0 (2008), OpenMP 3.1 (2011), OpenMP 4.0 (2013) Требуется поддержка со стороны компилятора

OpenMP API 5.0 Page 1 OpenMP 5.0 API Syntax Reference Guide · 2018-11-08 · 2018 OpenMP AR OMP111802OMP5 OpenMP API 5.0 Page 1 OpenMP 5.0 API Syntax Reference Guide ® Directives

Empowering Communities through Venture Philanthropy · partners: the ei is a strategic partnership of ivn and the sacta-rashi foundation. in the galilee panhandle, ivn and sacta-rashi

OpenMP - dcce.ibilce.unesp.braleardo/cursos/hpc/openMP2020.… · Programa OpenMP começa com um thread sequencial Para criar novos threads o usuário define uma região paralela

Introduction to OpenMP Introduction OpenMP basics OpenMP directives, clauses, and library routines.

Parallel Programming with OpenMP part 1 – OpenMP v2.5

Programação Paralela e Distribuída - OpenMP Roteiro

OpenMP API 5.0 Page 1 OpenMP 5.0 API Syntax Reference Guide€¦ · OpenMP API 5.0 Page 1 OpenMP 5.0 API Syntax Reference Guide ® Directives and Constructs An OpenMP executable directive

Programming Irregular Applications with OpenMP · 1 1 Programming Irregular Applications with OpenMP* * The name “OpenMP” is the property of the OpenMP Architecture Review Board.

OpenMP Basics and MPI/OpenMP Scaling - NERSC

Programación paralela con OpenMP - ocw.uc3m.esocw.uc3m.es/ingenieria-informatica/arquitectura-de-computadores/... · Programación paralela con OpenMP Programación paralela con

Apostila de Introdução ao OpenMP - UFSCbosco.sobral/ensino/ine5645/Apostila...Apostila de Introdução ao OpenMP INE5645 – Programação Paralela e Distribuída Prof. João Bosco

Sharbani bhattacharya sacta 2014

Programación Paralela Programación en memoria compartida: OpenMP 1 PROGRAMACIÓN PARALELA Modelos de programación paralela Programación en memoria compartida:

C OpenMP - cc.u-tokyo.ac.jp · C OpenMP 1. OpenMP OpenMP Architecture Review Board ARB

Computação paralela utilizando OpenMP para aplicações matemáticos

OpenMP · 2011-07-05 · OpenMP ... pc ?