收录:
摘要:
本发明公开了一种基于FPGA的稀疏激活感知型神经网络加速器,包括了读命令发生器、数据分配器、Tm个运算子通道、大小为Tm×Tn的乘累加阵列、由Tn个加法树组成的加法树组、功能模块和输出缓存。数据分配器将片外存储器读入的数据分配给尽可能少的运算子通道。运算通道将权重和非0激活送入到乘累加阵列,乘累加阵列进行运算卷积乘累加。本发明还提供一种基于FPGA的稀疏激活神经网络运算数据流,它重建非0激活值的位置并且匹配对应的权重。本发明具有很高的数据复用性,减少了数据的搬移节省功耗,未用到的运算子通道及其后续模块被门控时钟所关闭,同样节省了功耗,它可以高效感知稀疏激活,使绝大部分为非0激活所进行的运算,加快了运算速度。
关键词:
通讯作者信息:
电子邮件地址: