学校主站 设为首页 加入收藏 联系我们

当前位置: 学院首页 >> 合作交流 >> 通知公告 >> 正文

我校研究生在国际语音信号处理和人工智能研究领域的顶级期刊发表学术论文

发布时间:2016年12月01日 作者:研究生院  点击次数:

近日,我校计算机学院2014级博士研究生张晖在张学良副教授及高光来教授的指导下,在国际上公认的语音信号处理和人工智能研究领域的顶级期刊(SCI影响因子为2.475)《IEEE Transactions on Audio, Speech and Language Processing》发表了学术论文《A Pairwise Algorithm Using the Deep Stacking Network for Speech Separation and Pitch Estimation》,该论文对单通道下语音与噪声分离这一公认难题(鸡尾酒会问题)进行了深入研究,提出了一种基于深度堆叠网络(Deep Stacking Network, DSN)的方法,该方法将传统语音信号处理方法和深度学习有机地结合起来。

传统语音信号处理方法和深度学习方法各有优劣:传统信号处理建立在对信号理解基础之上,但有严格的前提假设,如果实际情况不满足假设,则性能大幅下降。深度学习方法有很强的建模能力,但缺乏可解释性,且泛化性能极度依赖于训练数据。该研究将二者相结合,挖掘了传统语音信号处理方法的理论优势,克服了深度神经网络过分依赖训练数据,导致泛化性能下降的问题,这一研究为深度学习在语音分离的研究提供了新的思路。(该研究的前期工作发表在语音信号处理顶级会议ICASSP 2015

论文的研究工作得到了国家自然科学基金、内蒙古自治区自然科学基金的支持。

 

版权所有(C) 2005 [内蒙古大学研究生院] 保留所有权
地址: 内蒙古呼和浩特市 大学西路235号 内蒙古大学研究生院  邮编:  010021  E_mail:ndgs@imu.edu.cn     蒙ICP16002391号-1