智能的载体:探究深度学习的硬件组成
相关报告
- 2014-2018年中国炼油机械行业市场全面深度调查研究及投资研究报告(2013-12-30)
- 2015-2020年中国镂铣机械行业市场主要领域调查分析报告(2015-08-27)
- 2014-2018年中国市政机械行业市场深度剖析及投资前景趋势研究报告(2014-04-05)
- 中国抗生素机械行业市场深度调查研究及投资咨询报告(2018-07-20)
- 2015-2020年中国植保机械行业市场深度剖析及投资前景趋势研究报告(2015-03-19)
- 2015-2020年中国抗生素机械行业市场重点层面调查研究报告(2015-09-25)
- 全国制药机械行业深度调查暨市场分析报告(2014-12-15)
- 2016-2022年中国注塑机械区域行业市场调查研究及发展分析报告(2015-11-05)
- 2015-2020年中国排灌机械行业市场深度调查分析及投资战略研究报告(2015-03-19)
- 2015-2020年中国食品成型机械行业市场主要领域调查分析报告(2015-09-07)
人工智能的灵魂是算法,而CPU、GPU、FPGA等硬件是承载这些灵魂的躯体,它们是深度学习软件的运行平台。
中央处理器(CPU):在系统中起到控制者的作用,侧重于处理复杂逻辑问题,通常支持一个或多个指令集下的大量指令保证程序的通用性和灵活度。专用于复杂流程控制的架构极为复杂,导致CPU电路规模庞大,限制了每颗芯片上CPU的数目。虽然多发射、超标量、MIMD、多核等架构上的进步增强了CPU的并行处理能力,但总的来说并行度仍旧有限。在应对深度学习算法这种计算密集型任务时处理时间会非常长,使用CPU来完成海量数据训练的方案实用性较差。
图形处理器(GPU):内部拥有多达数千个流处理器,每个核心都可以独立完成数学运算。理论上GPU的并行处理能力和核心数目成正比,在浮点计算能力等指标上可达CPU的上千倍。因此GPU适用于处理那些流程复杂度较低、包含大量数学运算、数据彼此没有依赖关系、便于拆分以并行处理的任务。深度神经网络同一层上的神经元彼此独立可以并行计算,BP、Auto-Encoder、CNN等算法能够以矢量运算(矩阵相乘、矩阵相加、矩阵向量乘法等)的形式进行处理,因此使用GPU来训练深度神经网络可以充分发挥其高效并行的特点,能够极大的缩短海量数据的训练时间。
2016年5月NVIDIA发布了专用于人工智能研究领域的DGX-1小型化超级计算机。DGX-1拥有8颗最新的TeslaP100GPU和2颗IntelXeonE5服务器CPU,拥有7TBSSD硬盘。其浮点计算能力达170TFLOPS,是Xeon处理器的56倍,花费2个小时就完成了原先在CPU上需要150小时(6.25天)的训练任务,加速达75倍。
现场可编程门阵列(FPGA):是可重构的芯片,可通过预编程将其配置成所需电路,为算法的硬件实现带来了极高的灵活度。设计者可以在FPGA能够提供的资源范围内,通过大量复制处理核心达到极高的并行度,而CPU、GPU核心数目是固定不变的。同时,CPU、GPU需要耗费相当的性能和资源来提供对软件通用性的支持,而FPGA可以优化掉无关电路,专注于算法的实现。CPU、GPU的各个核心需要共享内存、总线等资源,这些资源的带宽通常是系统性能的瓶颈,而FPGA的灵活性使得设计者可以为各个模块分配独享的资源,从架构上避免了这类问题,达到了更高的性能。这一切使得FPGA能够以较少的硬件满足用户需求,减少了供电、散热等组件和电能消耗,能够以更小的体积进行部署。
FPGA内部的IO、基于LUT的底层细粒度电路以及互联矩阵是可重构的,但可重构性带来了额外开销,它的运行频率要低于同样工艺下的CPU和GPU。并且FPGA价格高昂,大容量、高性能型FPGA的价格动辄上万人民币。因此开发专用于人工神经网络的定制芯片是大势所趋。
人工智能定制芯片是对神经网络结构的天然模拟,它在神经元规模、功耗、处理速度上远优于CPU、GPU、FPGA等方案。它在架构上尽可能贴近神经网络的结构,不再像传统方案的那样采用软硬件来“等效模拟”神经的结构,进而避免了这种等效模拟所产生的软硬件开销,极大的提高了神经元的规模和性能。它的神经元在需要时才会运行,而传统的同步电路需要使用高频时钟不断驱动所有模块,因此人工智能定制芯片可以达到传统芯片所难想象的运行功耗。全定制设计可以最大化挖掘芯片的性能潜力并去除功能无关的冗余逻辑,使得人工智能定制芯片可以达到很高的工作频率。
训练深度神经网络需要各种技巧,例如网络结构的选取、神经元个数的设定、权重参数的初始化、学习率的调整、Mini-batch的控制等等。即便对这些技巧十分精通,也需要多次训练和反复摸索尝试才能得到一个性能良好的神经网络。由于深度神经网络参数众多、结构复杂、需要使用海量数据进行训练,这使得深度神经网络的设计、训练和调优是一个非常耗时的任务。如果可以通过高性能硬件加速训练,就可以在同样的时间内进行更多的调试。对于大规模的训练数据和模型来说,更可以将难以完成的任务变成可能。而在使用深度学习系统处理未知数据时,则需要考虑其大批量部署时的成本,在满足需求的基础上倾向于低成本的解决方案。将深度学习与机器视觉结合起来是未来自动化行业发展的必由之路。
本文地址:http://www.zwzyzx.com/show-334-235708-1.html
相关资讯
- 塑料模具行业利润水平的变动趋势及原因(2014-08-19)
- 持续的经济增长和稳定的国防投入为军工行业的发展奠定了坚实基础(2015-01-18)
- 紧固件行业的快速发展带动了冷镦成形装备市场需求增长(2015-08-05)
- 国内外注塑机行业技术水平及技术特点(2016-03-10)
- 国内特种电源市场竞争格局情况(2016-01-17)
- 国家政策大力扶持,LED照明产业环境良好发展(2014-06-30)
- 中国航发成立——两机专项指日可待(2016-08-15)
- 专业照明与上、下游行业的关联性情况(2015-07-07)
合作媒体
最新报告
定制出版
热门报告
免责声明
中为咨询所引述的资料是用于行业市场研究以及讨论和交流,并注明出处,部分内容是由相关机构提供。若有异议请及时联系本公司,我们将立即依据相关法律对文章进行删除或作相应处理。查看详细》》