News

CECA Seminar Summary: UIUC Prof. Deming Chen Talks about Computing Acceleration in IoT

2019-06-04

  2019年5月28日,伊利诺伊大学厄巴纳-香槟分校陈德铭教授受邀为北京大学高能效计算与应用中心的师生献上了题为“Reconfigurable Computing, Machine Learning, Hardware Security andTheir Confluence in the IoT Era”的精彩学术讲座。本次讲座由中心梁云老师主持,获得中心全体师生及其他校内外师生的积极参加。

  陈德铭教授报告中

  首先陈教授介绍了物联网(IoT)的几个重要环节,其中包括了IoT应用、微服务平台与库、以及底层的硬件加速器。为了更好地实现IoT应用,陈教授提出四个关键点,识别(identity)、交互(communication)、感知(sensors)、计算(compute)。今天讲座的主题关注IoT的计算加速部分。

  在加速器设计中,主要的难点在于设计的复杂度与开发效率,原因有四点:

一、SoC的体系结构灵活,设计空间庞大;

二、为了完成复杂的功能函数,需要复杂的逻辑电路;

三、设计的成本不断提升;

四、SoC功能难以验证与纠错。

  针对这些挑战,陈教授提出从两个角度提出解决方案,第一是高层次自动化的软硬件协同实现,第二是IP核重用与神经网络构建器(DNNbuilder)。

  解决方案一:基于高层次综合技术。高层次综合可以实现直接使用 C、C++ 以及 SystemC 语言规范对可编程器件进行编程,无需手动创建 RTL,从而可加速 IP 创建。对于这种使用高级语言的硬件开发流程,陈教授提出SoC软硬件协同设计分析模型。对于给定的具体应用,该模型可以有效分析出各个功能函数需要被哪一类硬件平台加速,对于一些以控制为主的功能函数,在CPU端进行加速,对于一些计算密集度高的函数将被放在硬件上加速(例如GPU和FPGA)。实验结果表明,基于该解决方案的软硬件协同设计可以达到平均80倍以上的性能提升(与Intel Xeon CPU相比)。

 

  解决方案二:陈教授提出了一个端到端的完整开发工具DNNBuilder。DNNBuilder能够自动地将深度神经网络部署到端FPGA中与云FPGA中。从应用层面,DNNBuilder的输入为训练数据集、DNN的拓扑定义与深度学习开源框架。然后DNNBuilder会根据现有已经实现好的硬件IP对深度神经网络进行性能分析与模型构建。之后,构建完成的模型将会在给定的数据集上训练。

  以上为本次讲座的内容摘要。