Arquitetura Volta NVIDIA TESLA V100 GPUwiki.icmc.usp.br/images/f/f1/G15_1.pdf · NVIDIA Tesla D870...

Kleber Yuji Inoue - 8604297 Oton Papa - 9292883

Victor França - 9790781

NVIDIA TESLA V100 GPU - Arquitetura Volta

Acrônimo de Compute Unified Device Architecture - CUDA

● Extensão para a linguagem de programação C,C++,Java,Fortran e Python ● Possibilita o uso de computação paralela, possibilitando com que a GPU consiga realizar

algumas operações com mais rapidez, como processamento de vídeo, análises sísmicas, simulações de dinâmica dos fluidos e previsão do tempo.

● Desvantagens:○ Renderização de texturas não é suportada pela CUDA.○ Diversas cópias realizadas entre uma memória e outra pode causar impactos no

desempenho geral das aplicações, mas varia de acordo com o barramento○ Funciona apenas em placas da NVIDIA.

Evolução Histórica

● NVIDIA Tesla C870 GPU○ Lançado em 2 de maio de 2007○ Possui um núcleo de computação com 128 processadores○ Frequência (Clock): 1.35 GHz○ Ambiente de desenvolvimento para a GPU baseado na linguagem C (CUDA)○ Memória dedicada 1.5 GB○ Largura de banda: 76.8 GB/s○ Possui 681 milhões de transistores

3Fonte: https://cnet1.cbsistatic.com/img/upg5P49FKJ3dayctbsq3FivQmQM=/830x467/2010/04/28/7dd31920-f8a0-40e4-a290-aad191866f46/7dd31920-f8a0-40e4-a290-aad191866f46.jpg

● NVIDIA Tesla D870 GPU○ Lançado em 2 de maio de 2007○ Dois NVIDIA Tesla C870 GPU com 128 processadores em cada GPU○ Frequência (Clock): 1.35 GHz○ Ambiente de desenvolvimento para a GPU baseado na linguagem C (CUDA)○ Memória dedicada: 1.5 GB em cada GPU (3 GB)○ Largura de banda: 2x 76.8 GB/s

4Fonte: https://www.techpowerup.com/gpu-specs/images/c/1543.jpg

● NVIDIA Tesla P100 GPU○ Lançado em junho de 2016○ Possui 15.3 bilhões de transistores○ Frequência (Clock): 1.12 GHz○ Largura de banda: 732 GB/s

5Fonte: https://images-na.ssl-images-amazon.com/images/I/41LnQd8YRQL._SX425_.jpg

Estado da Arte

● NVIDIA Tesla V100 GPU (PCIe)○ Lançado em 21 de junho de 2017○ Possui 21.1 bilhões de transistores em um espaço de 815mm²○ Frequência (Clock): 1.37 GHz○ 640 Tensor Cores○ 5020 CUDA Cores○ Largura de Banda 900GB/s

6Fonte: https://www.nvidia.com/content/dam/en-zz/es_em/Solutions/Data-Center/tesla-v100/data-center-tesla-v100-pcie-625-ud@2x.jpg

Estado da Arte● NVIDIA Tesla V100 GPU (NVLINK)

Otimização da versão PCle versão IBM POWER x86;

○ Integrado a PCI Express - barramento encontrado em placas-mãe utilizados em expansão gráfica, som , rede;

○ Interconexão Nvlink - otimização do tempo de processamento, desbloqueio total da GPU;○ Aumento de throughput;○ Recursos de memória unificada;○ GPUS ⅓ do tamanho padrão; ○ Otimização do gargalo da versão Pcle;

7Fontes: https://www.em360tech.com/wp-content/uploads/2017/09/nvidia-tesla-v100-nvlink.jpg https://videocardz.com/50056/nvidia-launches-nvlink-worlds-first-high-speed-gpu-interconnect

Comparativo de Performance:

8Fontes:https://www.fudzilla.com/news/graphics/41420-nvidia-nvlink-2-0-arrives-in-ibm-servers-next-year

Ilustração da NVLink com 2 GPUs:

NVidia arquitetura Volta● Volta, um codinome de microarquitetura GPU desenvolvido pela Nvidia, sucede a Pascal. Foi

anunciado pela primeira vez como uma futura ambição de roadmap em março de 2013. No entanto, o primeiro produto não foi anunciado até maio de 2017.

● A arquitetura é nomeada após Alessandro Volta. Foi o primeiro chip da NVIDIA a apresentar núcleos Tensor.

● Núcleos especialmente projetados que possuem desempenho de aprendizado profundo superior ao dos núcleos regulares CUDA.

● Inicialmente focado para a utilização de carros autônomos.

NVIDIA Arquitetura Volta - V100 Composição

Fonte: https://www.nvidia.com.br/object/prbr_08072017b.html

A arquitetura de computação de placa de vídeo mais poderosa do mundo, criada para impulsionar a próxima onda de avanços em inteligência artificial e computação de alto desempenho.

Tecnologias avançadasA placa de vídeo Tesla V100 supera as gerações anteriores de placas de vídeo NVIDIA com tecnologias inovadoras que permitem

quebrar a barreira de 100 teraflops de desempenho de deep learning. Ela inclui:

● Tensor Cores combinada a CUDA cores, projetada para acelerar as cargas de trabalho de AI. Equipada com 640 Tensor Cores, a V100 oferece 120 teraflops de desempenho de deep learning, equivalente ao desempenho de 100 CPUs.

● Nova arquitetura de placa de vídeo com mais de 21 bilhões de transistores. Combina núcleos CUDA e Tensor Cores em uma arquitetura unificada, fornecendo o desempenho de um supercomputador de AI em uma única placa de vídeo.

● NVLink™ fornece a próxima geração de placas de vídeo de link de interconexão com alta velocidade e placas de vídeo para CPUs, com até 2 vezes o throughput da geração anterior NVLink.

● 900 GB/s HBM2 RAM, desenvolvida em colaboração com a Samsung, atinge 50% mais largura de banda de memória do que as placas de vídeo da geração anterior, essencial para suportar a extraordinária produção computacional da Volta.

● Software otimizado para Volta, incluindo software CUDA, cuDNN e TensorRT ™, cujos frameworks e aplicativos principais podem facilmente ser usados para acelerar a AI e a pesquisa.

Volta Tensor Cores

Fontes: http://images.nvidia.com/content/volta-architecture/pdf/volta-architecture-whitepaper.pdf

Volta GV100 Streaming Multiprocessor (SM)

BLAS Level 3

Volta Tensor Cores

Fontes: https://www.nvidia.com/en-us/data-center/tensorcore/https://devblogs.nvidia.com/programming-tensor-cores-cuda-9/

● Voltados para o processamento de rotinas direcionadas a aplicações de IA e deep learning.● Cada Tensor Core fornece uma matriz de 4x4 que realiza a seguinte operação:

○ D = (A * B) + C● Volta Tensor Core realiza as operações em paralelo, realizando as operações ao mesmo tempo.

Principais resultados alcançados

Fonte: https://www.nvidia.com/en-us/data-center/tensorcore/ 13

A GPU entrega 125 TFLOPS (Tera Floating-points Operations Per Second). Portanto os desenvolvedores podem executar algoritmos de deep learning usando FP16 e FP32.

Por utilizar o Volta Tensor Core, a GPU é 3x mais eficiente que a versão anterior (NVIDIA Tesla P100).

Contribuição Para Sociedade

Fonte: http://images.nvidia.com/content/volta-architecture/pdf/volta-architecture-whitepaper.pdf14

O princípio de criação está atrelado a deep learning e contribuições para as tarefas do dia a dia, que requerem muitas análises para a tomada de decisão mais eficiente.

Podemos destacar:

● Treinamento de carros autônomos;● Assistente pessoal virtual, exemplo: Cortana, Siri;● Reagir o mais próximo a realidade;● “ Refazer “ imagens danificadas/baixa resolução;● Utilizada para auxílio na saúde, exemplo: como curar o câncer; ● Aplicativos de Inteligência Artificial, e auxílio de data centers;

*Vídeo:https://www.youtube.com/watch?time_continue=87&v=5TUk5BtM0Bc

Referências Bibliográficashttps://images.nvidia.com/content/technologies/volta/pdf/tesla-volta-v100-datasheet-letter-fnl-web.pdf

https://www.nvidia.com/en-us/data-center/tesla-p100/

https://la.nvidia.com/docs/IO/43395/D870-SystemSpec-SP-03718-001_v01.pdf

https://www.nvidia.com.br/object/tesla_d870_br.html

https://la.nvidia.com/docs/IO/43395/c870-BoardSpec_BD-03399-001_v04.pdf

https://www.nvidia.com.br/object/tesla_c870_br.htm

https://canaltech.com.br/hardware/O-que-e-a-CUDA/ https://www.oficinadanet.com.br/post/14818-o-que-e-cudal

https://www.tecmundo.com.br/computacao-grafica/10507-nvidia-cuda-o-que-e-e-como-funciona.htm

Referências Bibliográficashttps://www.tecmundo.com.br/computacao-grafica/10507-nvidia-cuda-o-que-e-e-como-funciona.htm

https://canaltech.com.br/hardware/O-que-e-a-CUDA/ https://www.oficinadanet.com.br/post/14818-o-que-e-cuda

https://images.nvidia.com/content/pdf/v100-application-performance-guide.pdf

https://www.nvidia.com/en-us/data-center/volta-gpu-architecture/ https://www.nvidia.com.br/object/prbr_08072017b.html

https://en.wikipedia.org/wiki/Nvidia_Tesla

Arquitetura Volta NVIDIA TESLA V100 GPUwiki.icmc.usp.br/images/f/f1/G15_1.pdf · NVIDIA Tesla D870...

Documents

Transcript of Arquitetura Volta NVIDIA TESLA V100 GPUwiki.icmc.usp.br/images/f/f1/G15_1.pdf · NVIDIA Tesla D870...

NVIDIA Teslaシリーズ 製品カタログNVIDIA TESLA C2050は、GPUコンピューティングに特化した次世代のCUDA GPUアーキテクチャFermiを元に設計された最新TESLA

VPX3U-TESLA-M6 - NVIDIA, AMD, Xilinx · NVIDIA GRID™ 2.0 vGPU virtualization PCIe x16 Gen3 WOLF’s VPX3U-TESLA-M6 board leverages NVIDIA ® Tesla® Maxwell-2 28nm GPU technology,

HPC Computing with CUDA and Tesla Hardwarejbaker/PDC-Sp12/slides/CUDA... · HPC Computing with CUDA and Tesla Hardware Tim Lanfear, NVIDIA. ... NVIDIA Switch NVIDIA Tesla GPU NVIDIA

NVIDIA GPU コンピューティングaccc.riken.jp/wp-content/uploads/2015/06/secure_4716...NVIDIA GPU コンピューティング エヌビディア ジャパン Tesla Quadro 事業部

TESLA K40 GPU ACTIVE ACCELERATOR - Nvidia · Tesla K40 GPU Active Accelerator BD-06949-001_v03 | 1 OVERVIEW The NVIDIA® Tesla® K40 graphics processing unit (GPU) active accelerator

Tesla GPU Computing - Nvidia · 2015-10-14 · 미루웨어 Tesla GPU Computing Unutu 장점(개발머쉰) 2015.01 캐노니컬은 6개월마다 새로운 배포판을 출시핚다는

NVIDIA Tesla P100images.nvidia.com/content/pdf/tesla/whitepaper/pascal...NVIDIA Tesla P100 WP-08019-001_v01.2 | 5 Tesla P100: Revolutionary Performance and Features for GPU Computing

: NVIDIA DGX SYSTEM · TESLA GPUs & SYSTEMS TESLA GPU NVIDIA DGX FAMILY NVIDIA HGX SYSTEM OEM CLOUD. Image result for aws logo. 6. DATACENTER SERVERS WORKSTATIONS. NVIDIA ENTERPRISE

NVIDIA TESLA V100 GPU ARCHITECTUREimages.nvidia.com/content/volta-architecture/pdf/volta... · wp-08608-001_v1.1 | august 2017 nvidia tesla v100 gpu architecture the world’s most

© NVIDIA Corporation 2009 Mark Harris NVIDIA Corporation Tesla GPU Computing A Revolution in High Performance Computing.

TESLA P100 PCIe GPU ACCELERATOR - Nvidia · 2017-09-07 · Tesla P100 PCIe GPU Accelerator PB-08248-001_v01 | 11 SUPPORT INFORMATION CERTIFICATES AND AGENCIES Certifications Windows

NVIDIA (IVA) · 2019-11-11 · ai 都市 公共の 安全性 ビジネスの 洞察 gpu nvidia tesla nvidia tesla® または gpu nvidia® jetson™ nvidia gpu jetson 駐車場の配置

Dell PowerEdge C4130 & NVIDIA Tesla K80 GPU accelerators€¦ · A Principled Technologies test report 3 Dell PowerEdge C4130 & NVIDIA Tesla K80 GPU accelerators Our tests showed

NVIDIA TESLA V100 GPU ACCELERATOR · 2019-02-21 · nvidia tesla v100 . gpu accelerator. 가장 진보된 데이터 센터 gpu. nvidia tesla v100은 ai, hpc 및 graphic 가속을

NVIDIA Tesla C870 GPU Computing Processor Board · April 14, 2008 | BD-03399-001_v04 1 NVIDIA Tesla C870 Overview The NVIDIA® Tesla™ C870 GPU computing processor board is a PCI

NVIDIA TESLA GPU COMPUTING REVOLUTIONIZING HIGH … · 2012-05-09 · NVIDIA TESLA GPUS ARE REVOLUTIONIZING COMPUTING CUDA PARALLEL COMPUTING ARCHITECTURE CUDA™ is NVIDIA’s parallel

TESLA P100 PCIe GPU ACCELERATOR - Nvidia

Cray NVIDIA sumitg@nvidia · GPU Computing Technology –Tesla with CUDA ... Broadcast 112 512 MB

NVIDIA Tesla P100 Graphics Processing Unit (GPU) with HBM2 - … · 2017. 10. 19. · NVIDIA Tesla P100 Graphics Processing Unit (GPU) with HBM2 Title: NVIDIA Tesla P100 GPU with

GPU - NVIDIA · Tesla V100 AI HPC GPU WP-08608-001_v1.1 | 3 NVIDIA NVLink™ NVIDIA NVLink GPU GPU/CPU Volta GV100 NVLink 300 GB/s GP100 NVLink 160 GB/s IBM Power 9 CPU

NVIDIA Teslaシリーズ製品カタログNVIDIA TESLA C2050は、GPUコンピューティングに特化した次世代のCUDA GPUアーキテクチャFermiを元に設計された最新TESLA

NVIDIA GPU コンピューティングaccc.riken.jp/wp-content/uploads/2015/06/secure_4716...NVIDIA GPU コンピューティングエヌビディアジャパン Tesla Quadro 事業部

NVIDIA (IVA) · 2019-11-11 · ai 都市公共の安全性ビジネスの洞察 gpu nvidia tesla nvidia tesla® または gpu nvidia® jetson™ nvidia gpu jetson 駐車場の配置