新闻动态

祝贺张超通过博士论文答辩

2017-06-08 点击数 148次

       2017年6月5日,中心在理科5号楼410会议室组织了张超同学的博士论文答辩。张超同学的指导教师为中心特聘研究员孙广宇博士。中心罗国杰老师、孙广宇老师、梁云老师,北京大学信息科学技术学院代亚非教授,清华大学汪玉副教授,中科院韩银和研究员等作为评委参加了答辩。

       张超同学以“赛道存储器的高可靠性和高能效研究”为题进行了答辩汇报。此次答辩会上,张超同学认真讲解了博士论文的研究意义与学术贡献,并就各位评委提出的问题进行了清楚、细致的回答。评委们一致认为,张超同学在答辩过程中,准备充分、表述清楚,对评委的提问做出了准确的回答,评委们投票一致同意,通过张超博士学位论文答辩,并建议授予其理学博士学位。

       张超同学在读期间发表学术论文18篇,包括系统结构领域顶级会议ISCA,MICRO等。他在系统结构领域的突出成果获得了老师们的一致认可。张超同学在读期间获得了CECA最佳研究生称号。

 

附:论文摘要

       新一轮以大数据为基础的信息技术革命对存储硬件提出了新的挑战。新计算系统迫切需要更大容量、更快速度的存储硬件;然而传统存储设备却面临增长迟缓、功耗高企等问题。非易失存储在访问速度、数据易失性、静态能耗、存储密度等方面都被证明相比传统存储器具有强劲优势。自旋矩传输磁存储器 (STT-RAM)、相变存储器 (PCM) 和电阻式存储器 (RRAM) 等新型非易失存储技术 (NVM) 被广泛证明具有替代现有存储硬件的巨大潜力。将数据存储在纳米尺度的条带型结构上,赛道存储 (RM) 进一步强化了非易失存储在访问速度和存储密度方面的优势。然而,为访问条带上的数据,赛道存储引入了“移动操作”,继而导致额外开销随不同访问方式而变化。所以如何优化数据访问方式来减少移动操作成为一个研究热点。同时,利用赛道存储独特的移动操作,加速部分特殊计算,成为另一个研究热点。然而,从可靠性层面讲,如何设计和构造一款可靠的赛道存储仍然是一个没有被解决的问题。

       本文综合考察电路模型和系统架构,针对赛道存储的电路模型、位置错误、移动发热、读写不对称、场景优化等问题,为赛道存储提出了一套高可靠性高能效的设计方案。

       本文的研究内容和创新点主要包括以下五个方面:

       1. 赛道存储的电路级模型。 赛道存储器的模型可配置变量过多,导致前人使用的赛道存储在结构上差异过大,电路级的模型抽象极不统一,从而限制了体系结构层面的研究。本文从赛道存储的物理运行机制出发,构建赛道存储电路布局、位置错误模型、热力模型等。这一级别的模型,为后续赛道存储的研究提供了简明可靠的描述方法,为其可靠性研究和能效优化创造了基础。

       2. 位置错误的检测和纠正。不可靠的移动操作导致赛道存储中数据在被访问时发生位移,继而导致错误的数据访问。与传统方法所针对的``值错误''不同,不可靠的移动操作引入了一种新的错误类型:``位置错误''。针对移动操作引发的位置错误问题,本文提出基于位置校验码的高保真回放技术,设计了编码方式和自适应性架构。有效解决了移动操作所引发的``位置错误'',有效保障了存储的可靠性。基于亚阈值移动和位置错误纠错码的高保真回放技术能够将赛道存储的平均无故障时间从几微秒提高到上百年。而其性能损失却可以忽略不计。

       3. 移动操作的温度控制方法。基于磁畴壁的赛道存储在移动操作过程中需要较大的电流密度,过密集的移动操作会导致存储芯片迅速发热对可靠性产生较大影响。针对移动过程中发热过快的问题,本文利用配额制度,提出了基于移动操作的温度控制方法。这一易于实现的方案可以有效控制存储芯片的温度升高。基于配额制度的移动操作控制技术,将移动操作在时间和空间维度进行分散,在将最终室温工作环境下存储芯片温度限制在100摄氏度内时,只带来3.5%的性能损失。

       4. 针对非对称读写特性的缓存旁路方法。由于读写机制相对独立,赛道存储的读写代价通常是不对称的。这降低了传统以对称存储为目标设计的缓存优化策略的效率。针对以赛道存储为代表的读写不对称存储,本文提出了基于统计的缓存旁路方法,改善非易失缓存的能效。实验证明,这一种基于统计的方法既能有效的提高系统能效,又能以较小的设计开销被实现在现有处理器中。利用基于统计的缓存旁路技术,缓存的能耗和性能被优化了10%左右。

       5. 依场景进行的能效优化。赛道存储额外的移动操作导致其性能随访问模式的改变而有所变化,因此针对不同的应用都有不同的最佳工作模式。针对不同的赛道存储应用场景,本文对存储电路设计和使用方法进行了探索,分别提出优化方案。这些方案使得赛道存储被应用在通用处理器缓存、计算机主存中时都能各自工作在较好的能效点。利用基于 RM-SRAM 混合存储单元,减少了上下文切换引起的开销,从而提高了约14%的性能。

       赛道存储的高可靠性和高能效研究是一个涉及层面众多的课题。本文发现,纵向整合多个层面的领域知识,往往能简单有效地解决单个层面上无法解决的问题:利用系统结构层面的设计方案,可以有效规避电路层面可能出现的可靠性问题;利用器件提供的特殊功能,可以事半功倍地提升系统结构层面的性能;而针对不同应用场景,有效组合电路和系统结构的设计方案,往往可以有效提高这些领域的效率。本文正是基于这一研究思路,设计了可靠性和能效的优化方案。本文相关内容在多个系统结构领域的国际重要会议及期刊上发表,希望能够为后来关于赛道存储的研究提供借鉴。