新闻动态

【暑期课程】第四课:清微智能架构师杨建勋“面向生成式AI的可重构智能芯片”讲座顺利举办

7月4日下午13时,由北京大学集成电路学院、集成电路高精尖创新中心、北京大学国家集成电路产教融合创新平台、集成电路科学与未来技术北京实验室、后摩尔时代微纳电子学科创新引智基地联合主办的《集成电路设计技术与产业应用发展》暑期课程继续如期举办。本期课程邀请到清微智能科技有限公司架构师杨建勋博士为大家带来主题为“面向生成式AI的可重构智能芯片”的报告。北京大学博雅特聘教授叶乐主持讲座。

杨博士的报告内容深入浅出,围绕AI算法的演变与现状、大模型时代AI芯片的机遇与挑战、以及面向大模型的可重构智能芯片三个主要部分展开,报告剖析了当前大模型的算法特点,分析了算法对芯片算力、存储和通信提出的严峻挑战,并对比了当前国内外产业界对解决这些挑战所采用的不同技术路线。

在AI算法的演变与现状部分,杨博士首先回顾了神经网络的发展历程,从注意力机制、Transformer模型架构到在不同应用领域内的代表性网络。然后讨论了大模型的预训练、微调和推理的流程,和当前大模型持续发展的演进规律。以及混合专家系统(MoE),专家组合(CoE)等前沿大模型发展技术方案。

杨博士随后指出:芯片是AI发展的技术基石和战略制高点,算力决定了智能化水平,随着模型规模和计算复杂度的不断增加,对算力、存储和通信能力的需求也日益增长。这些挑战集中体现在算力墙、存储墙、带宽墙和单芯片制造瓶颈上。随后杨博士以量化数据的方式详细阐述了大模型在预训练、微调和推理过程中对芯片性能提出的各种需求。同时杨博士强调了当前广泛采用的分布式计算解决方案,他指出,面向大模型的分布式计算对AI芯片结构提出了四个方面的挑战:架构上无法同时适配不同任务需求的存算通配比问题,硬件算力增长速度由于工艺和带宽限制无法跟上模型发展速度的问题,影响性能释放和成本的功耗问题,以及可靠性问题。

在探讨AI芯片架构创新的环节中,杨博士指出,在摩尔定律变缓和当前的时代背景下,AI芯片架构创新成为发展的唯一突破口。之后,杨博士对比分析了共享存储和数据流分布式存储架构的特性,并指出后者更加适配深度学习模型的数据流图特点。他进一步指出,以共享存储计算为代表的英伟达类GPU架构存在计算架构天然能耗大、算力增长存在瓶颈和成本投入过高的问题。并阐述了数据流计算架构天然匹配AI算法,存储带宽需求更低,数据搬运路径更短,算力扩展能力更强等优点。最后,杨博士强调AI芯片的设计不仅局限于硬件微架构本身,需要与应用、算法、编程模型、软件栈等层级进行协同设计。

在提问环节,杨博士就可重构计算硬件资源利用率提升、编程友好性、计算完备性、硬件可配置性与成本折衷等方面与大家进行了深入的讨论和交流。

【个人介绍】

杨建勋博士,于2023年毕业于清华大学。博士期间参与多款AI芯片的设计和流片,相关研究成果发表于JSSC,TCAS-I,VLSI,HPCA等芯片领域和计算机体系结构领域的顶级会议和期刊。博士毕业后加入北京清微智能科技有限公司,负责云端芯片架构设计与研发。

【企业介绍】

清微智能科技有限公司是可重构计算(CGRA)领导企业,专注于可重构计算芯片的创新研发和产业应用,面向云端训推一体,视频分析,大模型微调、安防监控等计算场景,提供高性能算力支持,致力于打造自主可控的可重构通用计算生态。目前已量产10多款高能效芯片,TX8系列大算力芯片成功流片。进入中移动产品体系,客户包含海康、国网、阿里、商汤、腾讯、华为等。本报告回顾了生成式AI发展历程,剖析了AI发展对芯片算力、存储和通信带来的新挑战,对比并介绍了可重构计算芯片技术路线在新场景、新需求下的优势,将技术创新与AI算法应用发展紧密联系。