新闻动态

未名·芯论坛|3月29日 第十四期顺利举办

3月29日下午14时,由北京大学集成电路学院、集成电路高精尖创新中心、北京大学国家集成电路产教融合创新平台、集成电路科学与未来技术北京实验室、后摩尔时代微纳电子学科创新引智基地、北京大学校友会半导体分会联合主办的“未名·芯”论坛系列讲座第十四期在线下成功举办。本期邀请到中国科学院计算技术研究所副研究员陈晓明博士为大家带来主题为“存算一体电路、架构与系统设计”的报告。讲座由集成电路学院助理教授黄鹏主持,共计50余人参加。

活动现场

陈晓明博士从存算一体技术的发展背景展开本次讲座,他针对存算一体架构和系统的关键问题和挑战进行了深入浅出的讲解,分享了他们课题组在相关领域的杰出研究工作。

接着,陈博士谈到由于现有以计算为中心的层次化存储系统无法高效地处理访存不规则和计算访存比低的任务,因此数据密集型应用、工艺技术和新型器件的发展推动了以数据为中心的存算一体技术的研究和应用。陈博士分别就面向神经网络、图计算和线性代数的存算一体研究进行了透彻地介绍。

陈晓明博士

在面向神经网络的存算一体研究中,陈博士介绍了一种多功能可重构的存算一体架构ReFeMAT。基于统一的存算阵列,ReFeMAT架构可由存储器、卷积神经网络加速器、内容寻址器和逻辑计算器灵活配置得到。针对如何将任务映射到存算一体架构上才能充分发挥硬件性能的问题,陈博士的课题组构建了统一的编译框架,根据前端输入,把编译过程抽象成了四个中间优化层,可针对不同的高吞吐或低延迟场景分别进行优化。

在面向图计算的存算一体研究中,陈博士介绍了图计算的特点以及硬件加速会面临的挑战,在同时考虑图的数据结构和算法的访存特征后,提出了图数据在多HMC上的最优分布思路。针对跨HMC通信不规则,同步代价大的问题,陈博士提出了GraphRing架构,通过规则化跨HMC通信流来提供更高的跨HMC通信带宽。

在面向线性代数的存算一体研究中,为了高效地进行稀疏矩阵向量乘法计算,陈博士构建了CAM阵列和MAC阵列,CAM阵列用于检索非零元的索引,MAC阵列用于进行浮点乘加计算。此外,陈博士还介绍了指数均衡、提前结束和负载平衡三种方法来进一步优化稀疏矩阵向量乘法计算。

提问环节,陈博士和现场师生进行了广泛而深入的交流,大家对统一的编译框架、可重构通用架构、矩阵稀疏化、存内计算设计空间探索等问题方面进行了提问,陈博士逐一进行了解答。

个人简介:

陈晓明,中国科学院计算技术研究所副研究员、博士生导师,国家优秀青年科学基金获得者。分别于2009年、2014年从清华大学电子工程系获得学士、博士学位。研究方向为集成电路设计自动化(EDA)和计算机体系结构,研究成果已应用于国产EDA软件,发表论文100余篇、专著1本。先后获得ASP-DAC 2022最佳论文奖、2018年首届阿里巴巴达摩院青橙奖、2018年中国科协青年人才托举工程、2015年欧洲设计与自动化协会(EDAA)杰出博士论文奖等学术奖励。

技术文字:韩丽霞