Projeto BELIEVe Andamento de projeto - ieav.cta.br - Angelo.pdf · Andamento de projeto . Junho /...
Transcript of Projeto BELIEVe Andamento de projeto - ieav.cta.br - Angelo.pdf · Andamento de projeto . Junho /...
Participantes
EFA
Angelo Passaro
Onofre Felix de Lima Neto (Sgto)
Roberto Y. Tanaka
Ademar Muraro Jr.
Nancy M. Abe
Marcos A. Rugierri Franco
Antônio C. J. Paes
ENU
Alexandre D. Caldeira
Lamartine N. F. Guimarães
Mauricio A. P. Rosa
Francisco Dias Rocamora Jr
Lucio Marcos de Freitas
ParticipantesColaborações
Antônio L. Ribeiro (EFO)
Felipe Leonardo Lôbo Medeiros (EIN)
Augusto B. d’Oliveira (IBILCE-UNESP)
José Marcio Machado (IBILCE-UNESP)
Estudantes
Walter Schimidt, Odirlei Mantoan (IC-UBC)
Marco Antonio Hidalgo Cunha (IC-UNITAU)
Gleber Nelson Marques (Dout./CNPq)
Tarefas – CGP&D/2002
Pacotes de EF Paralelos E1 E2 E3 E4 Bibl. Simulação de Sistemas F1 F2 F3 F4 F5 F6
Integradores Numéricos G1 G2 G3 G4 G5 Aplicativos (MCNP, Octave, MATLAB,...) H1 H2 H3 H4
Treinamento Software de Termohidráulica J1 J2 J3 J4 J5
Ações Objetos Es
tudar
Ad
equa
ção
Anali
sar
Para
lelism
o
Imple
men
tar
Adqu
irir
hard
ware
Instal
ar
Testa
r
Docu
menta
r
Tarefa – Instalação/ adequação deAplicativos
Adaptação do módulo de montagem de sistema deequações (MEF) para equação de Poisson 3D
Instalação MCNP (Monte Carlo)
Experimentos com MATLAB
Desempenho - FEM Montagem e resolução
Tempo (haste)
Leitura : 3,8%
Estr. Matriz : 3,4%
Montagem : 32%
Resolução : 58,6%
Cálculos derivados : 2% 0 2 4 6 8 10
processadores
0
2
4
6
spee
dup
montagem da matriz
total
paralelaexecuçãodetemposequencialexecuçãodetempospeedup =
MCNP - PVMTempo de Execução
• número de ciclos
• número de histórias/ciclo
Tempo de execução por número de nós (1.000 histórias)
00:00:00
00:01:26
00:02:53
00:04:19
00:05:46
00:07:12
00:08:38
00:10:05
00:11:31
1 1 2 3 4 5 6 7 8
Speedup (1.000 histórias)
0
1
2
3
4
1 1 2 3 4 5 6 7 8
número de nóssp
eed
up
Eficiência (1.000 histórias)
0
20
40
60
80
100
120
1 1 2 3 4 5 6 7 8
número de nós
Efi
ciên
ci
100*n
speedupeficiência =
MCNP - PVMSoftware MCNP (Monte Carlo N Particle transport)
0 20000 40000 60000 80000 100000Histórias
0
2
4
6
8
spee
dup
0
20
40
60
80
100
Efic
iênc
ia
speedup
Eficiência
Avaliação com 8 nós
Tarefas – CGP&D/2002
Ações Objetos Es
tuda
r Ad
equa
ção
Anal
isar
Pa
rale
lism
o
Impl
emen
tar
Adqu
irir
hard
ware
Inst
alar
Test
ar
Cluster de PCs A1 A2 A3 A4 Bibliotecas Matemáticas B1 B2 B3 Software de óptica integrada C1 C2 C3 C4
Métodos de IA D1 D2 D3 D4 D5 Pacotes de EF Paralelos E1 E2 E3 E4
Docu
men
tar
Tarefa – Instalação / testes de Bibliotecas Matemáticas
BLAS (Basic Linear Algebra System) – processamento seqüencial : pacote otimizado testado e resultados em fase de documentação;
LAPACK (Linear Algebra Package) – processamento seqüencial : pacote otimizado testado e resultados em fase de documentação;
BLACS (Basic Linear Algebra Communication Subprograms) – processo de instalação documentado;
SCALAPACK (Scalable Linear Algebra Package) – processamento paralelo pacote otimizado testado e resultados em fase de documentação;
SUPERLU – processamentos seqüencial e paralelo – Bibliotecas instaladas, mas a avaliação de desempenho ainda não foi realizada; e
ARPACK – processamento seqüencial : Biblioteca instalada, mas a avaliação de desempenho ainda não foi realizada.
Hierarquia de softwareScaLAPACK
PBLAS
LAPACK
BLASBLACS
Message Passing Primitives
(MPI, PVM, etc)
Independente de plataforma
Específico de plataforma
ARPACK
SUPERLU
PARPACK
Global
Local
Atlas – Desempenhomatriz x matriz
400 800 1200 1600 2000ordem da matriz
0
1000
2000
3000De
sem
penh
o (M
flops
)
K = 30
K = 130
K = 200
ATLAS
NETLIB
Desempenho Resolução de sistema linear
0 2000 4000 6000 8000N
0
500
1000
1500
2000
tem
po (s
) tempo de resolucao
tempo de execucao
DesempenhoResolução de Sistema Matricial
0 20 40 60 80tempo (s)
0
20
40
60
80
100
porc
enta
gem
"front-end"Sistema Matricial (N=5400)
ATLAS
CPU (usuario)
CPU (sistema)
SWAP
RAM
Atlas – Desempenho
0 20 40 60 80 100 120 140tempo (s)
0
40
80
120
porc
enta
gem
"front-end" Sistema Matricial (N=5600)ATLAS
CPU (usuario)
CPU (sistema)
SWAP
RAM
Atlas – Desempenho
0 400 800 1200 1600tempo (s)
0
40
80
120
porc
enta
gem
"front-end" Sistema Matricial (N=7000)ATLAS
CPU (usuario)
CPU (sistema)
SWAP
RAM
Scalapack – DesempenhoResolução de sistema linear
0 2 4 6 8 10processadores
0
4
8
spee
dup
ATLASNETLIB
paralelaexecuçãodetemposequencialexecuçãodetempospeedup =
Equações: 5000
Scalapack – DesempenhoResolução de sistema linear
Equações: 5000
2 4 6 8 10numero de estações
0
100
200
300
400
tem
po d
e re
solu
cao
(s) Scalapack
otimizada
Netlib
Scalapack - Desempenho
0 100 200 300 400 500tempo (s)
0
40
80
120
porc
enta
gem
BELIEVe Sistema Matricial (N=5000)
Grid 2x2
CPU master
CPU cluster102
RAM master
RAM cluster102
swap
master: 2%
nós : 0%
Tarefas – CGP&D/2002
Ações Objetos Es
tuda
r Ad
equa
ção
Anal
isar
Pa
rale
lism
o
Impl
emen
tar
Adqu
irir
hard
ware
Inst
alar
Test
ar
Cluster de PCs A1 A2 A3 A4 Bibliotecas Matemáticas B1 B2 B3 Software de óptica integrada C1 C2 C3 C4
Métodos de IA D1 D2 D3 D4 D5 Pacotes de EF Paralelos E1 E2 E3 E4
Docu
men
tar
Tarefa – Expansão do cluster
ClusterPrevisto
16
10
5
Atual
9
18
7,2
Ago/2003
+1 cluster
• número de nós
• Desemp. Pico (Gflops)
• D. sustentável (Gflops)
Formação de RH
Iniciação científica (2002/2003)
Avaliação de bibliotecas matemáticas – TGI – UBC (2 alunos)Paralelização de programas com MATLAB – IC/FAPESP – UNITAU
Doutorado (2002/2003)
Projeto Ótimo Multidisciplinar de Dispositivos e Componentesde Óptica Integrada – INPESimulações computacionais em problemas de magneto-aerodinâmica – INPE /CNPq - Convênio UNESP/CTA –Laboratório de Aerotermodinâmica e Hipersônica da EFO
Indices
Publicações (2003): 2 congresso nacional1 congresso internacional1 TGI
Palestras proferidas (2002/2003) : 3
Documentos internos: 2 publicados1 em fase de revisão2 em elaboração
Perspectivas
Paralelização de aplicações em eletromagnetismoutilizando MATLAB
Cálculos de dinâmica caótica
Adequação de software para solução da Equação deTransporte Matricial
Implementação de formulação de Elementos Finitos para resolução de problemas de magnetoaerodinâmica
Paralelização de software de óptica integrada (EF)
PPA – 2004 - 2007
Formação anual de dez mil doutores como meta para 2006;
Popularização da ciência e tecnologia C&T (Sempre que possível, as propostas deverão conter mecanismos de divulgação, à população, dos resultados obtidos, em particular aqueles que dizem respeito aos benefícios para o seu bem-estar e para o desenvolvimento econômico -IEAv).
As propostas que integrem, de forma cooperativa, outros institutos de pesquisa e, eventualmente, o setor produtivo, serão altamente estimuladas. (INPE, UNESP, ITA)