Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

35
林楠 NVIDIA中国区开发者技术主管 新一代DirectXNVIDIA GPUWindows系统上的开发

Transcript of Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

Page 1: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

林楠 – NVIDIA中国区开发者技术主管

新一代DirectX与 NVIDIA GPU在Windows系统上的开发

Page 2: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

NVIDIA Maxwell架构目标

DirectX12新增硬件特性

Maxwell支持的其它新特性

新特效技术展望

演讲概要

Page 3: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

在已有的28纳米节点上用新架构来提升性能

大幅度提高能耗比

专为提供最好的DirectX 12支持而设计

专注于新的图形特性

在复杂的动态场景中提供实时全局照明(GI)效果

提供质量更高的可编程抗锯齿(AA)接口

内存工作集(working set)管理

可扩展的2D图形加速功能

为各项DirectX 12提供最佳硬件平台

NVIDIA Maxwell架构目标

Page 4: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

NVIDIA Maxwell架构目标

DirectX12新增硬件特性 保守边界光栅化(Conservative Rasterization)

有序光栅视图(Raster Ordered Views)

拼接资源(Tiled Resources)

Maxwell支持的其它新特性

新特效技术展望

演讲概要

Page 5: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

Direct3D 12

最新高性能图形API

更加接近底层硬件, 更多直接的硬件访问

可运行于微软所支持的各种硬件平台

有多种优秀开发工具所支持

为各大硬件厂商提供支持

Page 6: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

DirectX 12 特性 提升CPU效率

新的API在多核CPU上可并行渲染

每一个核上的开销也得到了有效的缩减

优化GPU效率并增加了新特性

通过使用索引来提高资源绑定的灵活性

数据管理和传输的效率更高

更加直接的工作调度模型

多种新硬件特性

NVIDIA展台提供演示

Page 7: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

常规光栅化

如果像素中心点未被三角形覆盖,则不输出

保守边界光栅化:

输出所有触及三角形的像素

应用举例:

光线追踪阴影

体素化(Voxelization)

第二代Maxwell GPU都支持此特性

GTX 960 / 970 / 980 / Titan X

DX12保守边界光栅化

Page 8: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

没有ROV: pixel shader的输出是无序的

ROV可保证pixel shader按特定顺序输出

可以用来解决很多问题:

可编程的透明混合操作

高效灵活的画序无关(OIT)透明算法

延迟渲染: 任意打包g-buffer数据

第二代Maxwell GPU都支持此特性

有序化输出会带来性能损失

深度复杂性会影响性能

DX12有序光栅视图(ROVs)

Page 9: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

拼接2D & 3D贴图和数组 通过虚拟内存的方式来存储海和使用海量数据

DX11.2提供2D拼接资源

DX12增加3D拼接资源

应用 贴图流(texture streaming) / 剪切映射(Clipmaps)

自适应阴影映射(adaptive shadow map)

稀疏多分辨率渲染 (Sparse multi-resolution rendering)

稀疏体素网格(Sparse voxel grids)

第二代Maxwell GPU都支持此特性

性能取决于具体应用

DX12 拼接资源

Page 10: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

NVIDIA Maxwell架构目标

DirectX12新增硬件特性

Maxwell支持的其它新特性 多向投影(Multi-Projection)加速

可编程抗锯齿

新特效技术展望

演讲概要

Page 11: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

Maxwell支持: 快速geometry shader

快速多视口投射(viewport multi-casting)

可以加速以下特效: 体素化(voxelization)

渲染至立方贴图(cube-map rendering)

层叠式阴影映射(cascaded shadow maps)

多分辨率渲染(multi-resolution rendering)

第二代Maxwell GPU都支持此特性

Maxwell多向投影加速

Page 12: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

新的高级多重采样特性

pixel shader可指定所有子像素的位置

pixel shader可获知每一个子像素是否通过了深度测试

带来了一系列新的抗锯齿技术

多帧采样抗锯齿(Multi-frame sampled AA)

聚合G-Buffer抗锯齿(Aggregate G-Buffer AA)

累积抗锯齿(Accumulative AA)

第二代Maxwell GPU都支持此特性

抗锯齿质量更高,速度更快

Maxwell可编程抗锯齿

Page 13: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

NVIDIA Maxwell架构目标

DirectX12新增硬件特性

Maxwell支持的其它新特性

Maxwell支持的其它新特性 光线追踪阴影(Raytraced Shadows)

稀疏流体模拟(Sparse fluid simulation)

基于体素的全局照明(Voxel Based Global Illumination) Aggregate G-Buffer AA

VR Direct

演讲概要

Page 14: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

光线追踪阴影

使用光线追踪来生成精细的阴影效果

应用DX12的保守边界光栅化来加速

Page 15: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

传统的阴影映射 SM = 8K x 8K (256 MB)

Page 16: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

光线追踪阴影 SM = 3K x 3K (36 MB)

PM = 1K x 1K x 64 ( 256 MB )

Page 17: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

硬件需求 最低: D3D feature level 11

推荐: D3D feature level 12 (保守边界光栅化可大幅提高速度)

哪些游戏会使用光线追踪阴影: 需要大量清晰阴影的游戏

在游戏中可能被归为“高”或“极高”级别的画面效果

已集成到Unreal 4引擎中

光线追踪阴影 – 硬件考量

Page 18: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

流体模拟往往需要大量的数据 以往的算法受限于有限的内存

使用DX12的拼接3D资源特性 仅在含有流体的网格上存储和计算

节省内存空间, 降低计算时间

稀疏流体模拟

Page 19: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

稀疏流体模拟演示

Page 20: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

硬件需求

最低及推荐: D3D feature level 12

由于缺乏拼接3D资源, D3D Feature level 11只能进行小范围的流体模拟

那些游戏会使用稀疏流体模拟: 大范围、可交互的烟雾/火焰/流水效果

在游戏中可能被归为“高”或“极高”级别的画面效果

稀疏流体模拟–硬件考量

Page 21: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

基于体素的全局照明 - VXGI

使用物理规律模拟光的传播

提供最逼真的光照效果

在Maxwell与DX12有大幅度的性能提升

利用了多种硬件新特性来加速

保守边界光栅化

多向投影加速

拼接资源

Page 22: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

forums.unrealengine.com, user “rabellogp”

无间接照明

Page 23: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

forums.unrealengine.com, user “rabellogp”

光照贴图 (静态)

Page 24: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

forums.unrealengine.com, user “rabellogp”

VXGI (动态)

Page 25: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

硬件需求 最低: D3D feature level 11

推荐: 高端DX12 feature level硬件(可利用多种新特性加速)

在游戏中的应用

精致的动态光照

在游戏中可能被归为“极高”级别的画面效果 已集成到Unreal 4引擎中

VXGI – 硬件考量

Page 26: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

延迟渲染专用

延迟渲染是现在的主流渲染方法

同MSAA相比, 效果更好, 内存占用更少

AGAA 2A与32x MSAA效果相当

使用了Maxwell提供的可编程抗锯齿特性

更快: 只处理可见的子像素

更好: 通过改编自像素位置来提升效果

聚合G-Buffer抗锯齿 - AGAA

Page 27: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

AGAA演示

Page 28: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

硬件需求 最低及推荐: Maxwell GPUs (NVIDIA GTX 960/970/980/Titan X)

在游戏中的应用: 可取代MSAA, 达到更好更快的抗锯齿效果

AGAA – 硬件考量

Page 29: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

来自NVIDIA的VR技术统称

包括软件和硬件的技术

用于提高VR的渲染性能

降低响应延迟

加速立体渲染

NVIDIA VR Direct

Page 30: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

避免运动眩晕的要素:

画面帧率 > 90帧/秒

画面对头部转动的响应时间 < 20毫秒

VR Direct: 降低延迟

Scott W. Vincent

转头到画面改变 ≤ 20 ms

Franklin Heijnen

Page 31: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

如何把响应时间控制在20毫秒内?

需要硬件和驱动提供“Timewarp”技术 GPU在每次输出图像至显示之前, 即时针对当前的头盔位置进行一次画面调整

VR Direct: Timewarp

Page 32: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

Timewarp技术可将延迟有效的将至 20毫秒以下

对于帧率小于60的游戏也有效!

支持Timewarp技术的NVIDIA GPU:

部分500和600系列的GPU, 所有700和900系列的GPU

未来的GPU会有更好的支持

VR Direct: Timewarp

Page 33: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

VR Direct: VR SLI

API

同一组渲染指令

Page 34: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

发送一次渲染指令, 同时绘制双眼的图像

提升帧率

降低延迟

双卡性能难以接近单卡的两倍

很多观察点无关的工作被重复做了, 比如阴影的投射

硬件需求

NVIDIA Geforce 500及以上系列

VR Direct: VR SLI

Page 35: Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

问&答