Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)
-
Upload
jose-fajardo -
Category
Technology
-
view
2.835 -
download
4
Transcript of Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)
林楠 – NVIDIA中国区开发者技术主管
新一代DirectX与 NVIDIA GPU在Windows系统上的开发
NVIDIA Maxwell架构目标
DirectX12新增硬件特性
Maxwell支持的其它新特性
新特效技术展望
演讲概要
在已有的28纳米节点上用新架构来提升性能
大幅度提高能耗比
专为提供最好的DirectX 12支持而设计
专注于新的图形特性
在复杂的动态场景中提供实时全局照明(GI)效果
提供质量更高的可编程抗锯齿(AA)接口
内存工作集(working set)管理
可扩展的2D图形加速功能
为各项DirectX 12提供最佳硬件平台
NVIDIA Maxwell架构目标
NVIDIA Maxwell架构目标
DirectX12新增硬件特性 保守边界光栅化(Conservative Rasterization)
有序光栅视图(Raster Ordered Views)
拼接资源(Tiled Resources)
Maxwell支持的其它新特性
新特效技术展望
演讲概要
Direct3D 12
最新高性能图形API
更加接近底层硬件, 更多直接的硬件访问
可运行于微软所支持的各种硬件平台
有多种优秀开发工具所支持
为各大硬件厂商提供支持
DirectX 12 特性 提升CPU效率
新的API在多核CPU上可并行渲染
每一个核上的开销也得到了有效的缩减
优化GPU效率并增加了新特性
通过使用索引来提高资源绑定的灵活性
数据管理和传输的效率更高
更加直接的工作调度模型
多种新硬件特性
NVIDIA展台提供演示
常规光栅化
如果像素中心点未被三角形覆盖,则不输出
保守边界光栅化:
输出所有触及三角形的像素
应用举例:
光线追踪阴影
体素化(Voxelization)
第二代Maxwell GPU都支持此特性
GTX 960 / 970 / 980 / Titan X
DX12保守边界光栅化
没有ROV: pixel shader的输出是无序的
ROV可保证pixel shader按特定顺序输出
可以用来解决很多问题:
可编程的透明混合操作
高效灵活的画序无关(OIT)透明算法
延迟渲染: 任意打包g-buffer数据
第二代Maxwell GPU都支持此特性
有序化输出会带来性能损失
深度复杂性会影响性能
DX12有序光栅视图(ROVs)
拼接2D & 3D贴图和数组 通过虚拟内存的方式来存储海和使用海量数据
DX11.2提供2D拼接资源
DX12增加3D拼接资源
应用 贴图流(texture streaming) / 剪切映射(Clipmaps)
自适应阴影映射(adaptive shadow map)
稀疏多分辨率渲染 (Sparse multi-resolution rendering)
稀疏体素网格(Sparse voxel grids)
第二代Maxwell GPU都支持此特性
性能取决于具体应用
DX12 拼接资源
NVIDIA Maxwell架构目标
DirectX12新增硬件特性
Maxwell支持的其它新特性 多向投影(Multi-Projection)加速
可编程抗锯齿
新特效技术展望
演讲概要
Maxwell支持: 快速geometry shader
快速多视口投射(viewport multi-casting)
可以加速以下特效: 体素化(voxelization)
渲染至立方贴图(cube-map rendering)
层叠式阴影映射(cascaded shadow maps)
多分辨率渲染(multi-resolution rendering)
第二代Maxwell GPU都支持此特性
Maxwell多向投影加速
新的高级多重采样特性
pixel shader可指定所有子像素的位置
pixel shader可获知每一个子像素是否通过了深度测试
带来了一系列新的抗锯齿技术
多帧采样抗锯齿(Multi-frame sampled AA)
聚合G-Buffer抗锯齿(Aggregate G-Buffer AA)
累积抗锯齿(Accumulative AA)
第二代Maxwell GPU都支持此特性
抗锯齿质量更高,速度更快
Maxwell可编程抗锯齿
NVIDIA Maxwell架构目标
DirectX12新增硬件特性
Maxwell支持的其它新特性
Maxwell支持的其它新特性 光线追踪阴影(Raytraced Shadows)
稀疏流体模拟(Sparse fluid simulation)
基于体素的全局照明(Voxel Based Global Illumination) Aggregate G-Buffer AA
VR Direct
演讲概要
光线追踪阴影
使用光线追踪来生成精细的阴影效果
应用DX12的保守边界光栅化来加速
传统的阴影映射 SM = 8K x 8K (256 MB)
光线追踪阴影 SM = 3K x 3K (36 MB)
PM = 1K x 1K x 64 ( 256 MB )
硬件需求 最低: D3D feature level 11
推荐: D3D feature level 12 (保守边界光栅化可大幅提高速度)
哪些游戏会使用光线追踪阴影: 需要大量清晰阴影的游戏
在游戏中可能被归为“高”或“极高”级别的画面效果
已集成到Unreal 4引擎中
光线追踪阴影 – 硬件考量
流体模拟往往需要大量的数据 以往的算法受限于有限的内存
使用DX12的拼接3D资源特性 仅在含有流体的网格上存储和计算
节省内存空间, 降低计算时间
稀疏流体模拟
稀疏流体模拟演示
硬件需求
最低及推荐: D3D feature level 12
由于缺乏拼接3D资源, D3D Feature level 11只能进行小范围的流体模拟
那些游戏会使用稀疏流体模拟: 大范围、可交互的烟雾/火焰/流水效果
在游戏中可能被归为“高”或“极高”级别的画面效果
稀疏流体模拟–硬件考量
基于体素的全局照明 - VXGI
使用物理规律模拟光的传播
提供最逼真的光照效果
在Maxwell与DX12有大幅度的性能提升
利用了多种硬件新特性来加速
保守边界光栅化
多向投影加速
拼接资源
硬件需求 最低: D3D feature level 11
推荐: 高端DX12 feature level硬件(可利用多种新特性加速)
在游戏中的应用
精致的动态光照
在游戏中可能被归为“极高”级别的画面效果 已集成到Unreal 4引擎中
VXGI – 硬件考量
延迟渲染专用
延迟渲染是现在的主流渲染方法
同MSAA相比, 效果更好, 内存占用更少
AGAA 2A与32x MSAA效果相当
使用了Maxwell提供的可编程抗锯齿特性
更快: 只处理可见的子像素
更好: 通过改编自像素位置来提升效果
聚合G-Buffer抗锯齿 - AGAA
AGAA演示
硬件需求 最低及推荐: Maxwell GPUs (NVIDIA GTX 960/970/980/Titan X)
在游戏中的应用: 可取代MSAA, 达到更好更快的抗锯齿效果
AGAA – 硬件考量
来自NVIDIA的VR技术统称
包括软件和硬件的技术
用于提高VR的渲染性能
降低响应延迟
加速立体渲染
NVIDIA VR Direct
避免运动眩晕的要素:
画面帧率 > 90帧/秒
画面对头部转动的响应时间 < 20毫秒
VR Direct: 降低延迟
Scott W. Vincent
转头到画面改变 ≤ 20 ms
Franklin Heijnen
如何把响应时间控制在20毫秒内?
需要硬件和驱动提供“Timewarp”技术 GPU在每次输出图像至显示之前, 即时针对当前的头盔位置进行一次画面调整
VR Direct: Timewarp
Timewarp技术可将延迟有效的将至 20毫秒以下
对于帧率小于60的游戏也有效!
支持Timewarp技术的NVIDIA GPU:
部分500和600系列的GPU, 所有700和900系列的GPU
未来的GPU会有更好的支持
VR Direct: Timewarp
VR Direct: VR SLI
API
左
右
同一组渲染指令
发送一次渲染指令, 同时绘制双眼的图像
提升帧率
降低延迟
双卡性能难以接近单卡的两倍
很多观察点无关的工作被重复做了, 比如阴影的投射
硬件需求
NVIDIA Geforce 500及以上系列
VR Direct: VR SLI
问&答