项目简介
卷积运算作为一种线性运算,在信号系统方面占据非常重要的地位,包括图像识别、地震勘测、超声诊断、人工智能等系统中广泛存在着卷积运算。利用传统的通用处理器CPU做卷积计算,存在计算效率低、速度慢,无法满足数据实时处理的需求,利用GPU做卷积方案也存在硬件资源开销大的问题。
本项目基于NOR FLASH闪存器件研发了高效卷积算子,并进一步开发了低功耗高速卷积计算芯片。利用NOR FLASH器件实现乘法计算,利用NOR FLASH阵列实现卷积运算以及卷积运算的并行执行,解决了传统计算方式存在的数据搬运问题,提高了计算效率,能够满足数据低能耗、实时处理的需求。
图1基于闪存器件的高效卷积计算芯片
图2硬件卷积神经网络演示系统
应用范围
可用于集成到各种边缘和终端智能设备中,如智能手机、智能摄像头、自动驾驶车辆等,为这些设备提供更高效的图像处理能力,从而提升产品性能和用户体验;以及应用于数据中心,尤其是需要处理大量图像数据的场合(如云服务提供商、大型社交媒体等),该技术可以显著提高数据处理速度和准确性,同时降低能耗;此外,在医疗影像分析领域,还可以加快图像处理速度,提高诊断效率。
项目阶段
本项目目前处于研发阶段,在卷积范式构建、卷积核映射、块卷积实现等方面取得系列阶段性成果,开发了存算一体高效卷积计算芯片,并搭建了具有高可靠性、高能效的硬件卷积神经网络,相关成果发表在IEDM、TCAS-I、TED等国际权威会议和期刊上。
知识产权
相关研究成果已获得3项国家发明专利授权。
1、专利号:CN201710063036.8
一种基于NOR FLASH阵列的卷积运算方法
一种基于NOR FLASH存储结构实现卷积运算的方法,所述NOR FLASH存储结构包括多个NOR flash单元组成的阵列,卷积运算的方法包括以下步骤:将卷积核矩阵的元素存储到NOR flash单元阵列中;输入矩阵的元素转换成电压施加在NOR flash单元的栅端;在NOR flash单元的源端施加一个驱动电压,通过NOR flash单元的漏端收集每一列的电流值,得到卷积运算结果。
2、专利号:CN201710024111.X
实现图像卷积的编码型闪存系统及工作方法
本发明提供了一种实现图像卷积的编码型闪存系统,用于对输入图像进行卷积处理,包括:输入模块、编码型闪存阵列、控制器、字线控制单元、位线控制单元和输出模块。此外,本发明还提供了一种实现图像卷积的编码型闪存系统的工作方法,将输入图像矩阵的像素点转化成编码型闪存阵列的输入电压,与卷积核进行卷积处理,整合各编码型闪存输出的电流值,得到卷积后的输出图像。本发明采用硬件结构实现了卷积的高效、并行计算,同时还实现了存储计算的一体化。
3、专利号:CN201710104061.6
一种实现图像卷积的编码型闪存系统和方法
本发明实施例提供了一种实现图像卷积的编码型闪存系统,所述系统包括编码型闪存阵列,所述编码型闪存阵列包括:n2个第一编码型闪存单元、n2个第二编码型闪存单元、第一字线、第二字线、n2条位线、第一导线、第二导线以及运算放大器。其中,每个所述编码型闪存单元包括源端、栅端和漏端,用于存储卷积核数据。字线与编码型闪存单元的栅端相连,用于施加驱动电压。位线连接相应的一对第一编码型闪存单元和第二编码型闪存单元的漏端,用于传输像素矩阵中的相应一个元素。导线与编码型闪存单元的源端相连。运算放大器包括正输入端、负输入端和输出端,所述正输入端与所述第一导线相连,所述负输入端与所述第二导线相连,所述输出端用于输出卷积处理结果。
合作方式
合作开发、技术转让、技术许可。
联系方式
邮箱:kjkfb@pku.edu.cn