AMD Multicore Technology Leading to the Next...
Transcript of AMD Multicore Technology Leading to the Next...
AMD MulticoreTechnology Leading to the Next Generation
2006年9月22日
Owen LiuAMD 中国、香港区技术经理
2
我们的目标:以最高的价值创造最佳的客户体验
客户
和最
终用
户
更好的客户体验
协作
协作
工艺快速、小巧、低功耗的亚微型结构
制造生产速度、精度和敏捷度
ArchitectureDirect connect: unlocking the true potential of multi-core
软件优化应用,提高总体生产率和满意度
架构直连架构:释放多核处理器的真正潜力
适时地提供合适的
解决方案。
3
Fab 36: 成功量产并稳步向65nm 工艺转移
AMD Fab 36
AMD Fab 30/38
在未来3 年将德累斯顿的产能提高4倍的完整计划
预期于2008年中发布45nm 产品
将我们独有的制造优势发挥到新高度-精益制造
旨在2008年时满足1/3的市场需求
预定于2006年第四季度发运65nm 产品
4
如何将这些要求转化成芯片和平台设计层面优先考虑的因素
忠实客户关注我们的设计方向
不断提高性能和能效
平衡单线程与多线程的性能
在各种工作负载下提供高性能
轻松快捷地调整设计,以满足瞬息万变的市场需求
在正确的时间推出正确的技术
并行设计
5
其它
模块化设计致力于缩短开发周期,提供高度定制化的解决方案
或
内存控制器
MC计算核心
C
2 级高速缓存
L2
3 级高速缓存
L3
交叉开关
CB
控制器
CO
超传输总线
HT
1 级高速缓存
L1
I/O 接口
IO
时钟
CL
直连
C1
C2
C3
C4 MC
CL CB
L1 L2 L3
CO
HT1 HT2
HT3 HT4
直连
C1
MC
CL
L1 L2
CO
HT1 HT2
IO
HT3
C2
6
台式机
双核
服务器/台式机
四核
推动下一代 AMD64 领先优势
每瓦性能领先优势
增强的 RAS
满足各种工作负载的性能
平台兼容性
可扩展性和平衡能力
增强的虚拟化
服务器和台式机的新架构
2007 年中推出
7
进一步了解 AMD 的下一代服务器和台式机架构
真正的四核硅片为 65 纳米绝缘硅和以后技术
而优化
可扩展的、共享的3 级高速缓存
IPC 增强CPU 核心
• 32B 取指令
• 增强分支预测
• 无序加载执行
• 每周期最多 4 次 DP FLOP• 双 128 位 SSE 数据流
• 每周期双 128 位加载
• 位操纵扩展 (LZCNT/POPCNT)• SSE 扩展 (EXTRQ/INSERTQ, MOVNTSD/MOVNTSS)
增强的直连架构和北桥
• HT-3 链接(每秒最高5.2GT)
• 增强交叉开关
• DDR2 并具有迁移到DDR3 的途径
• 可适时使用 FBDIMM• 增强的电源管理
• 增强的 RAS
8
DICE:独立核心动态调用
100% 工作负载 100% 工作负载
100% 工作负载 100% 工作负载
100% 功耗状态
能动态和独立地调整核心的频率,从而改善能效
9
100% 工作负载 33% 工作负载
33% 工作负载 33% 工作负载
DICE:独立核心动态调用
60% 功耗状态
能够动态和独立地调整内核的频率,从而改善能效
10
100% 工作负载 50% 工作负载
暂停工作 暂停工作
DICE:独立核心动态调用
45% 功耗状态
能够动态和独立地调整内核的频率,从而提高能效
11
在平台性能和能效方面持续领先
2006 年
2007 年 提高 60%
提高 150%2008 年
每瓦性能
数据来源:AMD 规划
性能预测基于 2006 年的性能模型和基准
12
关键性能的提高对企业至关重要
数据库
Web 服务
客户机服务器
Java
HPC
1倍 2倍 3 倍
应用性能提高
数据来源:AMD 规划
2007年
2008年
性能预测基于 2006 年的性能模型和基准
13
创新解决方案
注重追求低功耗和超低功耗
笔记本电脑
以多元化设计更好地服务于客户和最终用户
服务器性能/扩展性
服务器
台式机单一设计方向
14
核心与片上北桥芯片间的电源层分离
针对移动而优化的片上
北桥芯片
HyperTransport 3 包含链接电源管理
AMD 新移动处理器核心的能效提高
15
提高能效的新设计细节
两个核心可根据应用需求而开始或停止工作
超传输总线的吞吐量根据核心状态动态调节
两种技术协同工作,延长了电池的续航时间
DDR2 内存控制器
ComputeCore 1
ComputeCore 2
系统请求接口
交叉开关
HyperTransport™3技术
64 位
64 位
计算处理器 1 计算处理器 2
16
技术路线图:服务器和工作站
2006年 2007年 2008年
直连架构 2.0更大高速缓存易管理性
提高虚拟化水平增强 RASFBDIMM
I/O 虚拟化PCI Express 210 千兆位以太网
TCP 卸载串行 SCSI串行 ATA II硬件 RAID
处理器
芯片组和平台
双核AMD 虚拟化
安全性内存 RAS
DDR2
PCI Express千兆位以太网
TCP 卸载串行 SCSI串行 ATA II硬件 RAID
下一代核心四核处理器
3 级高速缓存超传输总线 3.0
电源管理增强功能
128 位 FPU提高了 IPC
超传输总线 3.0PCI Express千兆位以太网
TCP 卸载串行 SCSI串行 ATA II硬件 RAID
17
技术路线图:笔记本电脑
2006年 2007年
64 位双核DDR2
AMD 虚拟化多核电源管理
数字媒体加速技术
Vista Aero Ready UMASATA2/AHCI
高清音频高清 DVD 和蓝光Draft 802.11n
2008年
65 纳米新核心超传输总线 3.0链接电源管理分离电源层
低压和超低电压
HDMI高清视频硬件加速
WWAN802.11n/3G
混合硬盘
45 纳米下一代核心
DDR3
下一代显示卡下一代无线连接
处理器
芯片组和平台
18
2008年2007年2006年
技术路线图:台式机
主流
稳定的平台
性能
刀片 PC, 瘦客户机纤巧外形机
处理器AMD 虚拟化和安全性,
DDR2 能效90nm 65nm
CSIP 管理的平台
低功耗DDR2
AMD 虚拟化和安全性
双核, DDR2AMD 虚拟化和安全性
Vista®能力
4x4 双处理器双核
多显卡
下一代核心加大高速缓存
超传输总线 3.0
双核超传输总线 3.0
为Vista®做好准备
超传输总线3.0
四核处理器超传输总线3.0
为Vista®做好准备
4x4+ 双处理器四核
多显卡
核心更新加大高速缓存
超传输总线 3.0
双核, DDR3超传输总线3.0PCIe Gen II
超传输总线3.0DDR3
四核处理器, DDR3超传输总线3.0PCIe Gen II
4x4++ 双处理器四核, DDR3
多显卡
19
体验 Muscle Car 游戏
加装Blower, Nitro 和 Pipe而你得到什么?
20
PCI Express
ATI CROSSFIRE™ 或NVIDIA® SLI™多显卡解决方案
PCI Express
超传输总线技术
PCIExpress Tunnel
芯片组
今日发布:“4x4” 玩家平台
充分利用直连架构的独特优势
扩展我们传奇的游戏和玩家平台的性能
双核 FX
核心 1 核心 2
双核 FX
核心 1 核心 2
双 GPU 显卡
21
多核心和多插槽是未来方向
• 玩家在高端内容创制和游戏之间同步切换
• 玩家经常同时运行平均 7-8 个应用
• 数字媒体应用是多线程程序
• 控制台开发正在加速多核代码的编写
• 多线程游戏进入拐点,20 多款PC游戏正在开发
22
工作负载的多元化和专用处理器的商机
Java
XML
向量浮点
媒体处理
提高能效和性能的最佳途径
• 提供通用功能的专门优化解决方案• 不使用时下降到低功耗状态• 受到现代API的支持
符合模块化要求
• 协处理器成为另一个(可选)的 “IP 模块”• 微架构:命令交付,同步,流式传输
现在和将来都蕴藏许多可能的商机
23
今天:HyperTransport HTX™ 能进行第一代的系统级协同处理
HyperTransport主机
HyperTransport HTX™扩展槽
HyperTransport HTX™插卡
HTX 连接器
24
AMD 皓龙插槽
Torrenza 远景图
提高性能
插卡
PCIe 加速器
HTX 加速器
PCI-E
芯片组
加速器
芯片组
AMD 皓龙插槽
“插槽填充”
加速器
皓龙插槽
包集成 核心集成加
速器
CP
U
加速
器
核心
NB
25
• 保证拥有一个完整的软件生态系统
• 帮助改进基于软件需求的芯片设计
• 通过软件合作增进收入
• 保证为基于AMD处理器的平台提供基本软件基础支持
AMD 的软件目标
26
主要关注技术领域
AMD 平台
操作系统设备驱动程序,BIOS
开
发
工
具
管
理并存基础设施
• 安全/虚拟化 “AMD-V”• 病毒防护
• 媒介基础设施
• 数据库, 中间件, Java虚拟机(JVM)
用户应用• 关键型任务, IT基础设施
• 开发、打包定制化应用• 办公, 上网, 瘦客户机
• 高性能计算(HPC),计算机辅助设计(CAD), Monte Carlo
• 软件开发• 数字内容创建(DCC), 音频, 视频
• 游戏, 照片, 视频, 个性化应用
27
软件生态系统合作伙伴
28
位于德累斯顿的AMD 操作系统研究中心
•目标– 推动芯片设计为现代的操作系统提供更好的架构
– 通过操作系统开发推动面向客户的操作系统优化
• 最初专注于Linux
– 推动操作系统范围内的下列软/硬件技术发展
• 分析及性能优化
• 多核架构支持
• 功耗管理
• 虚拟化
• 系统管理
• 安全性 由 Chris Schlaeger创建并运营,他曾是
Novell/SuSE产品开发副总裁
29
商用软件SQLserver, DB2, SAP,
eTrust, Hyperion, PowerCenter8, TIBCO
库NUMA和核心感知性能库
(ACML, APML, libnuma)
操作系统多核/多节点进程调度,
内存核高速缓存协调及分配, SMP PowerNow!
(MSFT, Novell, RH, Solaris)
BIOS关键ACPI数据单元:MADT, SRAT, SLITSMP PowerNow!
管理程序多核/多节点进程调度,内存核高速缓存协调,
SMP 客户优化(VMware, Xen, MSFT)
Java虚拟机(JVMs)NUMA感知线程化
内存分配, 和垃圾收集器(Sun, BEA, IBM)
调试器支持多节点/多核系统间
的多线程应用
分析器即将推出的AMD多节点/多核
多线程应用工具
编译器自动和指向
(OpenMP, MPI) 多线程应用
(PGI, MSFT, GCC, Sun)
多功能开发工具策略
多核/多节点系统
30
为客户带来最大化利益的综合领先优势
全面发挥AMD64 和直连架构优势
扩大X86兼容性和投资保护收益
为差异化和高附加值提供更多机会
打开了惠及整个生态系统的架构之门
AMD64: 创新的平台.
持续的性能和能效改善
31