本网讯(集成电路学院 张梦雅)近日,集成电路学院吴秀龙教授团队与北京大学杨玉超教授团队合作,针对如何高效地提取基于事件型的语音信号的时空特征与简化语音识别的脉冲神经网络复杂度,提高硬件系统的计算能效等研究挑战,首次提出了一种基于具有可调节衰减时间核的LiCoO2动态忆阻器的硬件DTSN神经元(dynamic time-surface neurons),其中衰减时间核的结构包括zero-sum时间核(Ktzs)和指数时间核(Kt)两种形式,该神经元具有高效提取音频信号中事件流的时空特征功能。该项成果以“基于动态忆阻器时间表面神经元的音频事件信号时空特征提取”为题,发表在《科学·进展》(Science Advances)上(DOI: 10.1126/sciadv.adl2767)。其中,安徽大学为第一单位,我校集成电路学院21级博士生吴旭磊和北京大学集成电路学院2020级博士生党丙杰为共同第一作者,吴秀龙教授和北京大学杨玉超教授为共同通讯作者。
图.忆阻时间表面神经元(DTSN)与语音识别硬件系统
研究人员设计的硬件DTSN神经元由薄膜晶体管(TFT)与Au/CoLiO2/Au动态忆阻器串联集成(1TFT1R),其中TFT作为可调电阻和分压器件。DTSN神经元在接收固定脉冲信号条件下,DTSN神经元的动力学具有可重构特性,随着栅极电压的增大可以实现zero-sum时间核到指数时间核的转换。在这项工作中,基于DTSN神经元的时间核动力学可将语音信号中的时空特征转化为时间表面(time-surface)表示,作为后端脉冲神经网络训练学习的语音信号特征值,实现了具有低功耗、高能效计算的轻量级脉冲神经网络模型的语音识别硬件系统。该硬件系统由基于DTSN神经元的语音事件信号特征提取层与浅层脉冲神经网络分类器两部分构成,实现了前端的语音信号处理和后端语音识别过程识别一体化。由于基于忆阻器的DTSN神经元的zero-sum时间核具有高效的语音事件信号特征提取能力和抗噪声能力,极大地简化了针对语音识别的脉冲神经网络硬件化复杂度、提高了语音识别的精度(95.91%)与鲁棒性。