面向GPGPU的人工智能...
Transcript of 面向GPGPU的人工智能...
科大讯飞
更加强调产品和市场意识,做事规范化、透明化,从发展愿景到企业使命的思考和强化
公司上市
2008
在竞争更加激烈的人工智能时代,公司更加强调开放合作、客户导向等
发布云平台和输入法
2010
更加强调客户价值、战略落地的执行力、以及人工智能产业生态的构建。
人工智能产业领导者和生态构建
2016
大学生创业充分体现初创公司的追逐梦想,激情创新,不畏巨头、敢为人先的创业精神
公司成立
1999
人工智能嘴巴-语音合成
2006-2013 比赛语种英语
2012年英语合成自然度首次超过普通发音人
2014-2015 比赛语种印地语
2016 英文故事合成多维度主观感受全面领先
4.7
4.2
3.6 3.5 3.1
2.5 2.3 2.3 2.3
1.7 1.5
0
1
2
3
4
5
A C I F B G D H J K E
自然语音
自 然 度
科大讯飞:唯一自然度大于4分的系统
30
35
40
愉悦感
停顿节奏
重读
声调
情感
耐听性
L讯飞系统
第二名系统
《Hansel And Gretel》 That night, Gretel had nightmares about monsters in the woods. "I'm scared," she said, from under the covers. "What are we going to do?“ "Don't worry," said Hansel, who was lying wide awake. "I have an idea." Quietly, he tiptoed outside.
STOP
实时会议转写-讯飞听见
讯飞自创的FSMN框架,很好地解决了篇章级、口语化的语音识别难题,满足在演讲、即
兴发言、自由讨论等多种转写场景下的使用。
演讲 即兴发言 自由讨论
89.8%
85.6%
70.7%
92.8%
89.6%
80.3%
多种转写场景效果显著提升
单向LSTM FSMN
客服机器人-晓嫚
、
软银Pepper机器人 • 产品特点:
情绪识别、智能语音、关节灵活; 根据场景可定制机器人显示屏APP功能
• 应用场所: 软银营业厅:迎宾、促销员 商场、超市:促销活动、导览 旅游游客中心:介绍景点信息
• 效果反馈:Softbank东京银座营业厅,在放置Pepper机器人后,客流量较放置前提高了87%
晓曼向总书记问好
2016.04.26 2016.05.22 2016.07.01
晓曼给刘总当秘书 晓曼参与录制人工智能系列纪录片
晓曼在中国智能客服峰会首次担当主持人
大堂经理“晓曼”的”大智慧“获得新闻联播的垂青
2016.07.22 2016.07.23
-
讯飞“晓曼”机器人:
• 成为业界关注度最高的首个实用服务机器人
类人答题机器人
• 科技部启动首个中国人工智能的重大项目“类人答题机器人”
2014年8月,讯飞作为该项目的总牵头单位,正式启动讯飞超脑计划,研发基于类
人神经网络的认知智能系统
目标:机器人也能考上大学!
语言理解
知识表示
联想推理
自主学习
最新进展:口语评测机器可替代老师
0.987
0.979 0.978 0.977 0.977 0.977 0.976 0.976 0.976 0.975 0.975
0.965
0.97
0.975
0.98
0.985
0.99
总分相关度
1.98
2.38 2.38 2.4 2.43 2.45 2.45 2.47 2.5 2.52 2.52
0
0.5
1
1.5
2
2.5
3
总分平均误差
口语评测技术已在广东省高考英语口语考试中大规模应用
1.一键获取方案
讯飞开放平台 www.xfyun.cn
2.安装麦克风阵列模块
形态丰富多样,适配各类场景
4.云端服务&差异化定制
业务深度适配,专属贴心服务
3.集成SDK
能力自由选择,集成轻松便捷
1.一键获取方案
讯飞开放平台 www.xfyun.cn
2.安装麦克风阵列模块
形态丰富多样,适配各类场景
4.云端服务&差异化定制
业务深度适配,专属贴心服务
3.集成SDK
能力自由选择,集成轻松便捷
强大的计算能力是人工智能关键因素
• 人脑:神经元网络
– 1010 – 1011 神经元
– 1014 – 1015 突触连接
– 功能分区协作
• 知识通过连接关系来隐式表示
• 推理依赖分布并行计算实现
人脑的神经元及突触
人脑的神经元网络图
108 –> 1014
即使摩尔定律继续生效也需要20年+!
基础函数优化
Torch
TensorFlow
CNTK
Caffe
……
Tesla K20m
Tesla K40
Tesla M40
Tesla P40
……
参考了大量的开源代码
深入学习不同GPGPU的架构
阅读了大量的论文
性能提升 + 显存节约
0
2000
4000
6000
8000
10000
12000
14000
16000
0 128 256 384 512 640 768 896 102411521280140815361664
速度 (samples/sec)
0
2000
4000
6000
8000
10000
12000
0 128 256 384 512 640 768 896 102411521280140815361664
显存(MB)
讯飞
开源
开源
讯飞
后记
• 难点 • 业内没有成熟深度学习平台的解决方案
• 算法 + 软件 + 硬件
• 还没有真正位深度学习定制的加速芯片 • GPGPU很快但是还不够快,同时功耗较大
• 期望 • 更全的软硬一体的解决方案
• 功耗更低的GPGPU计算方案