基本信息

张鹏远  男  研究员 博导  中国科学院声学研究所
电子邮件: zhangpengyuan@hccl.ioa.ac.cn
通信地址: 北京市海淀区北四环西路21号
邮政编码: 100190

部门/实验室:声学所

研究领域

语音识别与理解

语音合成

情感识别

丰富音频检测

语音信号处理

招生信息

   
招生专业
081002-信号与信息处理
招生方向
语音识别与理解,语音合成,情感识别
丰富音频检测
语音信号处理

教育背景

2004-09--2007-07   中国科学院声学研究所   博士

工作经历

   
工作简历
2016-03~现在, 中国科学院声学研究所, 研究员
2015-10~现在, 中国科学院大学, 岗位教授
2013-04~2014-03,英国谢菲尔德大学, 公派访问学者
2010-01~2016-02,中国科学院声学研究所, 副研究员
2007-07~2009-12,中国科学院声学研究所, 助理研究员

教授课程

语音识别技术
语音信号处理
语音识别与理解

专利与奖励

   
奖励信息
(1) 中国科学院杰出科技成就奖, 一等奖, 院级, 2014
专利成果
( 1 ) 一种低资源嵌入式语音识别的拒识方法, 发明, 2018, 第 1 作者, 专利号: ZL201410387404.0
( 2 ) 数据驱动的基于奇异值分解的神经网络声学模型裁剪方法, 发明, 2015, 第 1 作者, 专利号: 2015102638492
( 3 ) 一种基于字和词混合语言模型的汉语语音关键词检索方法, 发明, 2015, 第 1 作者, 专利号: 2015102910792
( 4 ) 一种基于长短时记忆网络的语言模型重估方法, 发明, 2015, 第 1 作者, 专利号: 2015108446937
( 5 ) 一种连续语音流中的叠音检测方法, 发明, 2015, 第 2 作者, 专利号: 2015108853365
( 6 ) 一种神经网络声学模型压缩及语音识别方法, 发明, 2015, 第 1 作者, 专利号: 2015108810444
( 7 ) 一种拼音拼读的发音质量评测系统, 发明, 2015, 第 2 作者, 专利号: 2015109042305
( 8 ) 基于前向神经网络语言模型的汉语语音关键词检索方法, 发明, 2015, 第 1 作者, 专利号: 2015109061664
( 9 ) 一种基于多尺度马尔科夫假设的语言模型得分规则方法, 发明, 2017, 第 1 作者, 专利号: 201710790753.0
( 10 ) 一种基于统计规律的中文词汇表未登录词比率的估计方法, 发明, 2018, 第 1 作者, 专利号: 201611049017.1
( 11 ) 一种基于N元文法神经网络语言模型的语音识别方法, 发明, 2018, 第 1 作者, 专利号: 201810928881.1
( 12 ) 一种基于空时残差神经网络的远场语音识别方法, 发明, 2018, 第 1 作者, 专利号: 2018110309522
( 13 ) 一种基于生成对抗网络的语言模型数据增强方法, 发明, 2018, 第 1 作者, 专利号: 201810064982.9

出版信息

   
发表论文
(1) Tailoring an Interpretable Neural Language Model, IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2019, 通讯作者
(2) Automatic Speech Recognition System with Output-Gate Projected Gated Recurrent Unit, IEICE Transactions on Information and Systems, 2019, 通讯作者
(3) Self-attention Based Prosodic Boundary Prediction for Chinese Speech Synthesis, ICASSP, 2019, 通讯作者
(4) AN AUDIO SCENE CLASSIFICATION FRAMEWORK WITH EMBEDDED FILTERS AND A DCT-BASED TEMPORAL MODULE, ICASSP, 2019, 通讯作者
(5) Improving language modeling with an adversarial critic for automatic speech recognition, Interspeech, 2018, 第 2 作者
(6) Deep convolutional neural network with scalogram for audio scene modeling, Interspeech, 2018, 第 2 作者
(7) Multichannel asr with knowledge distillation and generalized cross correlation feature, SLT, 2018, 第 3 作者
(8) Improving Multichannel Speech Recognition with Generalized Cross Correlation Inputs and Multitask Learning, ICASSP, 2018, 第 3 作者
(9) Investigation on the combination of batch normalization and dropout in blstm-based acoustic modeling for asr, Interspeech, 2018, 第 4 作者
(10) Discriminatively learned network for i-vector based speaker recognition, Electronics Letters, 2018, 第 3 作者
(11) 基于对抗训练策略的语言模型数据增强技术, 自动化学报, 2018, 通讯作者
(12) Improve Multichannel Speech Recognition with Temporal and Spatial Information, IEICE TRANSACTIONS on Information and Systems, 2018, 第 2 作者
(13) 基于注意力LSTM和多任务学习的远场语音识别, 清华大学学报, 2018, 通讯作者
(14) Evaluating Modeling Units and Sub-word Features in Language Models for Turkish ASR, ISCSLP, 2018, 第 3 作者
(15) Space-Time Residual LSTM Architechture for Distant Speech Recognition, ISCSLP, 2018, 第 3 作者
(16) Multilingual Speech Recognition Training and Adaptation with Language-Specific Gate Units, ISCSLP, 2018, 第 4 作者
(17) 基于改进主题分布特征的神经网络语言模型, 电子与信息学报, 2018, 通讯作者
(18) Handling OOVWords in Mandarin Spoken Term Detection with an Hierarchical n-Gram Language Model, Chinese Journal of Electronics, 2017, 通讯作者
(19) 一种小资源下语音识别算法设计与优化, 清华大学学报, 2017, 第 1 作者
(20) 基于递归神经网络的语音识别快速解码算法, 电子与信息学报, 2017, 通讯作者
(21) Attention-based LSTM with Multi-task Learning for Distant Speech, INTERSPEECH, 2017, 第 2 作者
(22) Handling OOV Words in Mandarin Spoken Term Detection withAn Hierarchical N-gram Laguange Model, Chinese Journal of Electronics, 2016, 第 2 作者
(23) 基于SVD的DNN裁剪方法和重训练研究, 清华大学学报, 2016, 第 2 作者
(24) An Unsupervised Vocabulary Selection Technique for Chinese Automatic Speech Recognition, IEEE Workshop on Spoken Language Technology, 2016, 第 2 作者
(25) Improved End-to-End Speech Recognition Using Adaptive Per-Dimensional Learning Rate Methods, IEICE Transactions, 2016, 第 2 作者
(26) Enhanced Out of Vocabulary Word Detection Using Local Acoustic Information, IEEE IIH-MSP, 2014, 第 3 作者
(27) Semi-supervised dnn training in meeting recognition, IEEE Spoken Language Technology, 2014, 第 1 作者
(28) Using neural network front-ends on far field multiple microphones based speech recognition, ICASSP, 2014, 第 2 作者

科研活动

   
科研项目
( 1 ) 多语言言语数据的获取、标注和分析, 主持, 国家级, 2016-01--2020-12
( 2 ) ****技术研究与实现, 主持, 国家级, 2016-06--2017-06
( 3 ) ****关键词识别技术研究, 主持, 国家级, 2015-10--2016-10
( 4 ) 语种无关的语音关键词检测技术研究, 主持, 市地级, 2015-08--2016-12
( 5 ) “语音地图”构建的理论与技术研究, 主持, 国家级, 2016-01--2018-12
( 6 ) ****技术研究, 主持, 国家级, 2016-12--2019-12
( 7 ) ****识别技术研究, 主持, 国家级, 2017-04--2018-03
( 8 ) ****技术研究与实现, 主持, 国家级, 2017-11--2018-11
( 9 ) 大规模连续语音识别领域的声学模型算法开发和改进, 主持, 院级, 2017-06--2018-05
( 10 ) 适用于在线语音识别的声学模型拓扑结构研究, 主持, 院级, 2017-10--2018-10
( 11 ) ****挖掘与分析, 主持, 省级, 2016-10--2020-12
( 12 ) Multi-source Speech Recognition with Permutation Invariant Training, 主持, 院级, 2018-07--2019-06
参与会议
(1)IMPROVING MULTICHANNEL SPEECH RECOGNITION WITH GENERALIZED CROSS CORRELATION INPUTS AND MULTITASK LEARNING   2018年国际声学、语音与信号处理会议   2018-04-15
(2)Attention-based LSTM with Multi-task Learning for Distant Speech Recognition   2016年国际语音通信协会年会   2017-08-20
(3)A DNN-HMM Approach to Non-negative Matrix Factorization Based Speech Enhancement   2016年国际语音通信协会年会   2016-09-07

指导学生

已指导学生

卢春晖  硕士研究生  081002-信号与信息处理  

现指导学生

缪浩然  博士研究生  081002-信号与信息处理  

刘畅  博士研究生  081002-信号与信息处理  

刘作桢  硕士研究生  081002-信号与信息处理  

柳宗铭  硕士研究生  085208-电子与通信工程  

杨润延  博士研究生  081002-信号与信息处理  

刘育坤  博士研究生  081002-信号与信息处理  

李昭奇  博士研究生  081002-信号与信息处理  

高长丰  硕士研究生  081002-信号与信息处理