随着大数据时代的到来以及人工智能的飞速发展,以图像为代表的海量且高速生成的多源化数据给当前的存储系统带来了严峻挑战。传统的图像存储基于冯诺依曼计算架构,采用JPEG、JPEG2000、BPG等编码对图像进行压缩后存储于机械硬盘、固态硬盘(闪存)等外存。然而,在应对当前图像存储需求时,上述过程仍存在一定的挑战:在编码层面,传统技术中固定模式的时域-频域变换和量化矩阵,使其在应对多源图像数据压缩任务时难以同时获得高质量还原图像和高压缩效率;在器件层面,基于磁盘和闪存的等外存设备由于器件单元的存储容量有限,制约了存储密度的进一步提升;在架构层面,由于外部存储单元与处理器单元分离,导致图像数据在压缩和解压缩过程中需要反复传输,造成了大量时间和能量的损耗,限制了存储效率的提升。
图1:近外存的存内计算架构
针对以上关键问题,北京大学集成电路学院/集成电路高精尖创新中心研究团队首次提出了一种近外存的存内计算架构用于多源图像数据的高效压缩-存储-解压缩(图1)。该架构将外存模块和存内计算模块集成在同一单元中,利用忆阻器交叉阵列加速图像压缩网络,有效降低了数据搬运造成的能耗和延迟。基于此架构,利用忆阻器芯片和卷积自编码器图像压缩网络构建了存储系统,设计了适用于图像压缩任务的网络映射方案和阵列操作模式。同时,提出了一种分步硬件感知训练方案和转置卷积等效变换,用于提升存储系统的重构图像质量和解码效率。利用上述设计,基于忆阻芯片硬件演示了包含图像压缩/解压缩和数据存储/读取等在内的完整系统功能(图2)。
图2:系统功能硬件演示
进一步,根据系统构建和优化方案,对存储系统性能进行了评估。结果表明,基于近外存的存内计算架构的存储系统在图像压缩-存储-解压缩过程中的延迟和能耗相比冯诺依曼架构下基于CPU/GPU的存储系统,分别减小了20/5.6倍和180/91倍。同时,经过训练的存储系统对不同类型的图像数据集均表现出了良好的压缩和解压缩效果,重构图像的峰值信噪比均大于33 dB。本项研究中近外存的存内计算架构的提出为人工智能时代下大量且多源数据的高能效、高密度存储提供了一种新的解决方案和技术路径。
相关成果以“Memristor-based storage system with convolutional autoencoder-based image compression network”为题,发表在《自然-通讯》(Nature Communications)上(论文链接:https://www.nature.com/articles/s41467-024-45312-0)。北京大学集成电路学院博士生冯玉林为第一作者,黄鹏助理教授、刘力锋教授为通讯作者。该研究工作得到了科技创新2030-重大项目、国家自然科学基金优青和面上项目以及111计划、集成电路高精尖创新中心的资助。