新闻动态

未名·芯论坛|12月14日第三十九期顺利举办

12月14日上午9时30分,由北京大学集成电路学院、集成电路高精尖创新中心、北京大学国家集成电路产教融合创新平台、集成电路科学与未来技术北京实验室、后摩尔时代微纳电子学科创新引智基地、北京大学校友会半导体分会联合主办的“未名·芯”论坛系列讲座第三十九期在线下成功举办。本期邀请到燧原科技的首席产品架构师鲍敏祺先生为大家带来主题为“AIGC大模型趋势下的AI大芯片架构探索”的报告,讲座由集成电路学院叶乐副教授主持。

鲍敏祺从AI大语言模型的发展趋势切入,指出未来芯片的算力性能需求仍是指数级增长,同时也需要考虑到商业落地方面的性价比;在此背景下,芯片架构的设计需要从多个维度来评分确定,包括低精度和稀疏性的优化、微架构的优化、软件系利用率、系统可扩展性以及端到端的数据安全性。

针对上述几个评价维度,鲍敏祺进行了更具体的阐释:低精度优化能够降低数据搬运功耗和显存容量,但需重点考虑数据精度对算法精度带来的影响;结构化稀疏存在一定的部署收益,但当前对上层算法不友好,需要考虑到fine-tuned的时间代价;微架构优化能够提升数据的搬运效率,这是提升AI整体能效比的核心;软件使用效率方面,异构系统引入的软件调度和寻址开销需重点考虑,此外数据和计算的依赖、并行计算之间的交互依赖也会影响到整体效率;高效互联拓展是系统可扩展性的基础,但业界仍缺乏统一和高效的标准;对于高性能隐私计算,芯片还需适应国内的系统AI计算机密、完整性。

最后,鲍敏祺对AI发展的未来方向做了总结。未来的AI大芯片架构设计需要在高性能运算同时保护用户隐私安全,在软件的易用性和高能效比之间找到平衡,重点关注Transformer大模型可能的相关优化以及图计算领域,且研究如何从芯片到板卡到系统的高性能扩展方案。

在提问环节中,同学们积极踊跃地就讲座内容展开讨论和交流,鲍敏祺做了深入而细致的解答,使得同学们进一步加强了对大模型架构的理解和研究热情。

会后,燧原科技团队和叶乐等老师以及许多同学们围绕SRAM存算一体应用于大算力AI芯片主题开展了圆桌会议,叶乐老师就SRAM存算一体做了简短的汇报。


燧原科技专注人工智能领域云端和边缘算力产品,致力为通用人工智能打造算力底座,提供原始创新、具备自主知识产权的AI加速卡、系统集群和软硬件解决方案。凭借其高算力、 高能效比的创新架构和高效易用的软件平台,产品可广泛应用于泛互联网、智算中心、智慧城市,智慧金融、科学计算、自动驾驶等多个行业和场景。


个人简介:

鲍敏祺先生在燧原科技主要负责AI大芯片的产品架构设计,拥有十多年SoC芯片设计和验证经验,曾深耕形式验证、动态仿真、功耗验证与设计等技术领域,带领团队多次实现了成功流片到顺利量产的目标,显著提升了AI大芯片的能效比。

鲍敏祺先生于2009年加入AMD显卡多媒体部门,从事显卡IP和SOC芯片的设计验证工作,后就职于逐点半导体担任设计验证负责人,2017年加入Synopsys从事AI EDA解决方案的工作,期间主导支持多个头部互联网公司AI大芯片设计验证落地。