
李军锋 男 博导 中国科学院声学研究所
国家杰青、优青、中科院人才计划
电子邮件: lijunfeng@hccl.ioa.ac.cn
通信地址: 北京市北四环西路21号
邮政编码: 100190
个人简介
中国科学院声学研究所研究员、中国科学院大学岗位教授、博士生导师;国家杰出青年基金获得者、优秀青年基金获得者、中国科学院人才计划入选者。
主要从事音频信号处理与智能声学基础理论及应用的研究工作,先后主持国家自然科学基金杰青、优青、领域基金重点项目、后勤开放课题等;解决了制约声学在若干场景中应用的难题,服务于国家重大战略需求。
招生信息
招生专业
招生方向
语音信号处理、3D听觉技术、深度学习在语音信号处理中的应用
工作经历
工作简历
社会兼职
2014-01-01-今,Speech Communication, Subject Editor
2009-05-31-2016-12-31,Journal of Recent Patents on Signal Processing, 编委
教授课程
本科生毕业设计(电子信息工程)
专利与奖励
奖励信息
(2) 助听器双耳语音增强技术, 一等奖, 其他, 2007
(3) 两输入-两输出语音增强技术, 一等奖, 其他, 2006
专利成果
[2] 李军锋, 陈道成, 姚鼎鼎, 颜永红. 一种主动噪声消除方法、装置、电子设备和存储介质. CN: CN113889068A, 2022-01-04.
[3] 李军锋, 顾建军, 颜永红. 一种残余回声及噪声消除方法及装置. CN: CN112863535A, 2021-05-28.
[4] 李军锋, 孙兴伟, 颜永红. 混响语音的混响抑制方法及装置. CN: CN112687284A, 2021-04-20.
[5] 栾书明, 李军锋, 颜永红. 一种声学回波消除与去混响方法及装置. CN: CN111768796A, 2020-10-13.
[6] 李军锋, 程龙彪, 夏日升, 颜永红. 一种基于深度学习的双通道声源定位方法. CN: CN111239686B, 2021-12-21.
[7] 李军锋, 尹路, 颜永红. 一种基于深度学习降低MFCC特征失真的语音增强方法. CN: CN111243617A, 2020-06-05.
[8] 李军锋, 宋思远, 颜永红. 一种多通道远场语音增强方法. CN: CN111081267A, 2020-04-28.
[9] 李军锋, 尹路, 颜永红. 一种基于深度学习的多人语音分离方法. CN: CN109584903A, 2019-04-05.
[10] 李军锋, 孙兴伟, 夏日升, 颜永红. 一种基于深度学习的双耳语音增强方法. CN: CN109448751A, 2019-03-08.
[11] 夏日升, 姚鼎鼎, 李军锋, 颜永红. 一种声源高度角控制方法和系统. CN: CN109637550A, 2019-04-16.
[12] 李军锋, 高飞, 颜永红. 一种提升远场语音识别的前端处理方法和系统. CN: CN109523999A, 2019-03-26.
[13] 李军锋, 李煦, 颜永红. 一种无监督单传声器语音降噪方法及系统. CN: CN108574911A, 2018-09-25.
[14] 李军锋, 李煦, 颜永红. 一种基于性别融合信息的语音降噪方法. CN: CN108573698A, 2018-09-25.
[15] 李军锋, 李煦, 颜永红. 一种基于NMF算法的单传声器语音分离方法. CN: CN108573711A, 2018-09-25.
[16] 李军锋, 孙兴伟, 杨磊, 王立众, 夏日升. 一种5-2通道音频转换优化方法. CN: CN107968984A, 2018-04-27.
[17] 李军锋, 房倩倩, 夏日升, 颜永红. 基于人耳听觉特性的音频重放系统均衡方法. CN: CN106559722A, 2017-04-05.
[18] 夏日升, 李军锋, 颜永红. 一种串声消除滤波器的生成方法及三维声音重放方法. CN: CN105792075A, 2016-07-20.
[19] 应冬文, 李军锋, 冯永强, 潘接林, 颜永红. 一种基于支配相关的多稀疏声源定位方法. CN: CN105403860A, 2016-03-16.
[20] 李军锋, 夏日升, 颜永红. 一种房间混响合成方法. CN: CN104703111A, 2015-06-10.
[21] 应冬文, 李军锋, 冯永强, 潘接林, 颜永红. 一种声源定位方法及装置. CN: CN103076593B, 2014-09-10.
[22] 应冬文, 李军锋, 冯永强, 潘接林, 颜永红. 一种声源定位方法及装置. CN: CN103076593A, 2013-05-01.
[23] 李军锋, 夏日升, 付强, 颜永红. 一种基于耳机的虚拟3D重放方法. CN: CN102665156A, 2012-09-12.
[24] 应冬文, 颜永红, 付强, 潘接林, 李军锋. 一种噪声功率谱估计与语音活动性检测方法. CN: CN102800322A, 2012-11-28.
[25] 李军锋, 李娟, 付强, 颜永红. 一种三维声场合成中的距离感合成方法. CN: CN102790931A, 2012-11-21.
[26] 颜永红, 周瑜, 孙艳庆, 李军锋. 一种用于语音情感识别的语音情感特征提取方法. CN: CN101930733A, 2010-12-29.
[27] 姚鼎鼎, 赵佳乐, 李军锋, 颜永红. 一种基于听觉感知特性的头相关传输函数客观评价方法及系统. CN: CN117979218A, 2024-05-03.
[28] 姚鼎鼎, 赵佳乐, 李军锋, 颜永红. 一种个性化头相关传输函数预测方法及系统. 202311520131.8, 2023-11-15.
[29] 姚鼎鼎, 赵佳乐, 李军锋, 颜永红. 一种个性化头相关传输函数预测方法及系统. CN: CN117372624A, 2024-01-09.
[30] 姚鼎鼎, 赵佳乐, 李军锋, 颜永红. 基于稀疏测量的个性化头相关传输函数预测方法及装置. CN: CN116506795A, 2023-07-28.
[31] 姚鼎鼎, 阮小园, 李军锋, 颜永红. 一种耳机虚拟声像头外化方法. CN: CN116456264A, 2023-07-18.
[32] 李军锋, 王洋洋, 颜永红. 一种语音增强方法. CN: CN114581832A, 2022-06-03.
[33] 李军锋, 程龙彪, 姚鼎鼎, 顾建军, 颜永红. 一种目标语音信号的干扰信号生成方法及装置. CN: CN114337908B, 2024-04-12.
[34] 李军锋, 程龙彪, 姚鼎鼎, 顾建军, 颜永红. 一种目标语音信号的干扰信号生成方法及装置. CN: CN114337908A, 2022-04-12.
[35] 栾书明, 李军锋, 颜永红. 一种声学回波消除与去混响方法及装置. CN: CN111768796B, 2024-05-03.
出版信息
发表论文
(2) A novel semi-blind source separation framework towards maximum signal-to-interference ratio, SIGNAL PROCESSING, 2024, 第 3 作者 通讯作者
(3) Adversarial multi-task underwater acoustic target recognition: Toward robustness against various influential factors, J. Acoust. Soc. Am., 2024, 第 4 作者
(4) Efficient prediction of individual head-related transfer functions based on 3D meshes, Applied Acoustics, 2024,
(5) Effects of spatial configuration and fundamental frequency on speech intelligibility in multiple-talker conditions in the ipsilateral horizontal plane and median plane, The Journal of the Acoustical Society of America, 2024,
(6) Scale-certainty geometrically constrained independent vector analysis for determined blind source separation, APPLIED ACOUSTICS, 2023, 第 3 作者 通讯作者
(7) Three-stage hybrid neural beamformer for multi-channel speech enhancement, JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, 2023, 第 3 作者
(8) The effect of source sparsity on independent vector analysis for blind source separation, SIGNAL PROCESSING, 2023, 第 4 作者 通讯作者
(9) Further investigation of horizontal sound localization in noise, INTER-NOISE 2023, 2023, 第 4 作者
(10) Exploring Auditory Attention Decoding using Speaker Features, INTERSPEECH 2023, 2023, 第 4 作者
(11) 声学发音模型辅助建模的发音错误检测与诊断, Mispronunciation detection and diagnosis with acoustic pronunciation model aided modeling, 声学学报, 2023, 第 3 作者
(12) TF-NSSE: A time���������frequency domain neuro-steered speaker extractor, Applied Acoustics, 2023,
(13) An individualization approach for head-related transfer function in arbitrary directions based on deep learning, The Journal of the Acoustical Society of America Express Letters, 2022, 第 4 作者
(14) A Secondary Path-Decoupled Active Noise Control Algorithm Based on Deep Learning, IEEE SIGNAL PROCESSING LETTERS, 2022, 第 4 作者 通讯作者
(15) Estimation Reliability Function Assisted Sound Source Localization With Enhanced Steering Vector Phase Difference, IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2021, 第 4 作者 通讯作者
(16) 结合卷积神经网络与混响时间注意力机制的混响抑制, 声学学报, 2021, 第 1 作者 通讯作者
(17) A mixed-order modeling approach for head-related transfer function in the spherical harmonic domain, APPLIED ACOUSTICS, 2021, 第 1 作者 通讯作者
(18) An integrated multi-channel approach for joint noise reduction and dereverberation, APPLIED ACOUSTICS, 2021, 第 5 作者 通讯作者
(19) FSCNet: Feature-Specific Convolution Neural Network for Real-Time Speech Enhancement, IEEE SIGNAL PROCESSING LETTERS, 2021, 第 2 作者 通讯作者
(20) Binaural rendering technology over loudspeakers and headphones, ACOUSTICAL SCIENCE AND TECHNOLOGY(AST), 2020, 第 3 作者 通讯作者
(21) Improving generative adversarial networks for speech enhancement through regularization of latent representation, Speech Communication, 2020, 第 1 作者 通讯作者
(22) Improving generative adversarial networks for speech enhancement through regularization of latent representations, SPEECH COMMUNICATION, 2020, 第 3 作者 通讯作者
(23) 近似窄带假设下的最小方差无失真响应波束形成, Narrowband approximation based minimum variance distortionless response beamforming, 声学学报, 2020, 第 3 作者
(24) The role of specral cues in vertical plane elevation perception, Acoustical Science and Technology, 2020, 第 1 作者 通讯作者
(25) A Two-stage Phase-aware Approach for Monaural Multi-talker Speech Separation, IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, 2020, 第 2 作者 通讯作者
(26) 基于深度学习的两阶段联合声学回波和混响抑制技术, A Two-stage Deep Learning Based Method for Acoustic Echo Cancellation and Speech Dereverberation, 信号处理, 2020, 第 4 作者
(27) A Model Compression Method With Matrix Product Operators for Speech Enhancement, IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2020, 第 4 作者 通讯作者
(28) A SUBBAND ENERGY MODIFICATION METHOD FOR ELEVATION CONTROL IN MEDIAN PLANE, 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2019, 第 2 作者
(29) 早晚期混响划分对理想比值掩蔽在语音识别性能上的影响, Effect of ideal ratio mask using different early and late reverberation partition methods on speech recognition performance, 声学学报, 2019, 第 4 作者
(30) A DEEP LEARNING BASED BINAURAL SPEECH ENHANCEMENT APPROACH WITH SPATIAL CUES PRESERVATION, 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2019, 第 3 作者
(31) A parametric elevation control approach for binaural reproduction, APPLIED ACOUSTICS, 2019, 第 2 作者 通讯作者
(32) 一种参数化仰角控制方法, APPLIED ACOUSTICS, 2019, 第 2 作者
(33) A Deep Learning Based Binaural Speech Enhancement Approach with Spatial Cues Preservation, PROC. ICASSP 2019, 2019, 第 3 作者
(34) Target Speaker Localization Based on the Complex Watson Mixture Model and Time-Frequency Selection Neural Network, APPLIED SCIENCES, 2018, 第 2 作者
(35) 基于听觉感知特性的双耳音频处理技术*, Binaural audio technologies based on human auditory perception, 应用声学, 2018, 第 1 作者
(36) Contributions of the glottal source and vocal tract cues to emotional vowel perception in the valence-arousal space, JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, 2018, 第 2 作者
(37) Target Speaker Localization Based on the Complex Watson Mixture Model and Time-Frequency Selection Neural Network, APPLIED SCIENCES-BASEL, 2018, 第 2 作者
(38) A Stochastic Approximation Method with Enhanced Robustness for Crosstalk Cancellation, CHINESE JOURNAL OF ELECTRONICS, 2017, 第 4 作者 通讯作者
(39) An improved free-field cross-talk cancellation method based on the spherical head model, APPLIED ACOUSTICS, 2017, 第 3 作者 通讯作者
(40) Window-Dominant Signal Subspace Methods for Multiple Short-Term Speech Source Localization, IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2017, 第 3 作者
(41) 基于人耳听觉特性的房间冲激响应多点均衡, Multiple-point equalization of room impulse response based on human perception characteristics, 声学技术, 2017, 第 3 作者
(42) Window-domain signal processing methods for multiple short-term speech source localization, IEEE/ACM Trans. on Audio, Speech and Language Processing, 2017, 第 1 作者
(43) 面向语音增强的约束序贯高斯混合模型噪声功率谱估计, 声学学报, 2017, 第 5 作者
(44) An improved 5-2 channel downmix algorithm for 3D audio reproduction, ADVANCES IN INTELLIGENT INFORMATION HIDING AND MULTIMEDIA SIGNAL PROCESSING, VOL 1, 2017, 第 5 作者
(45) Investigation on advanced audio algorithms architecture for portable devices, The Journal of Audio Engineering Society, 2016, 第 1 作者 通讯作者
(46) Speech Intelligibility Enhancement in Noisy Reverberant Conditions, 201610THINTERNATIONALSYMPOSIUMONCHINESESPOKENLANGUAGEPROCESSINGISCSLP, 2016, 第 1 作者 通讯作者
(47) Enhancing Stereo Signals with High-Order Ambisonics Spatial Information, IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, 2016, 第 3 作者 通讯作者
(48) A ROBUST STOCHASTIC APPROXIMATION METHOD FOR CROSSTALK CANCELLATION, DAFX 16: 19TH INTERNATIONAL CONFERENCE ON DIGITAL AUDIO EFFECTS, 2016, 第 3 作者
(49) A local representation of the head-related transfer function, JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, 2016, 第 5 作者
(50) Investigation on Audio Algorithms Architecture for Stereo Portable Devices, JOURNAL OF THE AUDIO ENGINEERING SOCIETY, 2016, 第 6 作者 通讯作者
(51) 一种基于物理特性和感知特性的混响模拟方法, A hybrid physically- and perceptually-based approach for reverberation simulation, 中国科学. 信息科学, 2015, 第 3 作者
(52) 基于功率谱包络动态分割的鲁棒语音端点检测, Speech Endpoint Detection Based on the Dynamic Segmentation of Power Spectral Envelope, 北京理工大学学报, 2015, 第 5 作者
(53) A spatial extraction method to derive high-order ambisonics data from Stereo sources, Journal of Information Hiding and Multimedia Signal Processing, 2015, 第 1 作者
(54) A hybrid approach for reverberation simulation, IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, 2015, 第 2 作者
(55) Effect of the division of early and late reflections on intelligibility of reverberant noisy speech with binary masking, The Journal of the Acoustical Society of America, 2015, 第 1 作者
(56) Effect of the division between early and late reflections on intelligibility of ideal binary-masked speech, JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, 2015, 第 1 作者 通讯作者
(57) 两扬声器配置下的串声消除系统参数优化设置, Parameters design and optimization of crosstalk cancellation system for two loudspeaker configuration, 计算机应用, 2014, 第 2 作者
(58) Investigation of objective measures for intelligibility prediction of noise-reduced speech for Chinese, Japanese, and English, JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, 2014, 第 1 作者 通讯作者
(59) Binaural Sound Source Localization in Noisy Reverberant Environments Based on Equalization-Cancellation Theory, IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, 2014, 第 2 作者
(60) 面向语音增强的序贯隐马尔可夫模型时频语音存在概率估计, Time-frequency speech presence probability estimation based on sequential hidden markov model for speech enhancement, 声学学报, 2014, 第 4 作者
(61) A sound image externalization approach for headphone reproduction by simulating binaural room impulse response, Chinese Journal of Electronics, 2014, 第 1 作者
(62) A Sound Image Externalization Approach for Headphone Reproduction by Simulating Binaural Room Impulse Responses, CHINESE JOURNAL OF ELECTRONICS, 2014, 第 2 作者
(63) Investigation of objective measures for intelligibility prediction of noise-reduced speech for Chinese, Japanese and English,, THE JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, 2014, 第 1 作者
(64) A Sound Image Externalization Approach for Headphone Reproduction by Simulating Binaural Room Impulse Responses, A Sound Image Externalization Approach for Headphone Reproduction by Simulating Binaural Room Impulse Responses, 电子学报:英文版, 2014, 第 2 作者
(65) Objective and Subjective Investigation on a Novel Method for Digital Reverberator Parameters Estimation, IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2014, 第 3 作者
(66) Advanced Audio Spatializer combined with a Multipoint Equalization System, PROCEEDINGS OF THE 2014 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), 2014, 第 5 作者
(67) 语音中元音和辅音的听觉感知研究, Perception of vowels and consonants in speech, 应用声学, 2013, 第 2 作者
(68) Two-Microphone Noise Reduction Using Spatial Information-Based Spectral Amplitude Estimation, IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, 2012, 第 4 作者
(69) Harmonic Structure Features for Robust Speaker Diarization, ETRI JOURNAL, 2012, 第 3 作者
(70) Objective and subjective intelligibility evaluations of noise-reduction algorithms in Mandarin, ACOUSTICS 2012, 2012, 第 1 作者
(71) Comparative intelligibility investigation of single-channel noise-reduction algorithms for Chinese, Japanese, and English, JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, 2011, 第 1 作者 通讯作者
(72) Two-stage binaural speech enhancement with Wiener filter for high-quality speech communication, SPEECH COMMUNICATION, 2011, 第 1 作者 通讯作者
(73) Integrating meaningful signal extraction for intelligent binaural speech enhancement, Journal of Signal Processing, 2011, 第 1 作者
(74) A hybrid speech emotion recognition system based on spectral and prosodic features, IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, 2010, 第 2 作者
(75) A hybrid microphone array post-filter in a diffuse noise field, APPLIED ACOUSTICS, 2008, 第 1 作者 通讯作者
(76) Adaptive beta-order generalized spectral subtraction for speech enhancement, SIGNAL PROCESSING, 2008, 第 1 作者 通讯作者
(77) A two-microphone noise reduction method in highly non-stationary multiple-noise-source environments, IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, 2008, 第 1 作者 通讯作者
(78) A noise reduction system based on hybrid noise estimation technique and post-filtering in arbitrary noise environments, SPEECH COMMUNICATION, 2006,
(79) Noise reduction method based on generalized subtractive beamformer, MARUZEN COMPANY LTD, 第 1 作者
(80) TF-NSSE: A Time-Frequency Domain Neuro-Steered Speaker Extractor, APPLIED ACOUSTICS, 第 4 作者 通讯作者
发表著作
科研活动
科研项目
( 2 ) 噪声环境下的3D听觉技术研究, 负责人, 研究所自主部署, 2024-09--2026-08
( 3 ) 虚拟现实听觉空间定位的机制研究, 参与, 国家任务, 2023-10--2025-10
( 4 ) XXX3D听觉建模研究, 参与, 国家任务, 2022-10--2024-10
( 5 ) 多声源场景中听觉注意状态的解码预测模型, 参与, 国家任务, 2022-10--2025-10
( 6 ) 听觉注意信息介入的语音增强, 参与, 国家任务, 2021-12--2026-11
( 7 ) XXX研究, 负责人, 国家任务, 2021-10--2024-09
( 8 ) 发声与言语功能障碍康复训练系统, 负责人, 国家任务, 2021-01--2023-12
( 9 ) 基于深度学习的声学虚拟现实/增强现实技术, 负责人, 中国科学院计划, 2020-01--2022-12
( 10 ) XXX研究, 负责人, 国家任务, 2019-08--2021-12
( 11 ) XXX技术, 负责人, 国家任务, 2019-07--2020-06
( 12 ) 多语言语音可懂度增强, 负责人, 国家任务, 2018-01--2020-12
( 13 ) 三维声场的高精度听觉呈现, 负责人, 国家任务, 2017-01--2019-12
( 14 ) 混响环境下双耳声源定位的研究及应用, 参与, 国家任务, 2017-01--2020-12
( 15 ) 移动终端三维声场技术, 参与, 国家任务, 2015-01--2017-12
( 16 ) 互联网环境中文言语信息处理与深度计算的基础理论和方法, 负责人, 国家任务, 2013-01--2017-12
( 17 ) 面向下一代互联网的超临场感声通信应用研究, 参与, 国家任务, 2011-08--2016-07
( 18 ) 双耳语音可懂度增强技术研究, 负责人, 国家任务, 2011-01--2013-12
( 19 ) 语音听感知及其应用研究, 负责人, 中国科学院计划, 2010-08--2014-12
指导学生
已指导学生
房倩倩 硕士研究生 085208-电子与通信工程
方向阳 硕士研究生 085208-电子与通信工程
王琪 博士研究生 081002-信号与信息处理
姚鼎鼎 博士研究生 081002-信号与信息处理
高飞 硕士研究生 081002-信号与信息处理
白海钏 博士研究生 081002-信号与信息处理
孙兴伟 博士研究生 081002-信号与信息处理
傅明明 硕士研究生 085208-电子与通信工程
姚升余 博士研究生 081002-信号与信息处理
王子腾 博士研究生 081002-信号与信息处理
尹路 博士研究生 081002-信号与信息处理
蒿晓阳 硕士研究生 081002-信号与信息处理
栾书明 硕士研究生 081002-信号与信息处理
宋思远 硕士研究生 085208-电子与通信工程
陈道成 博士研究生 081002-信号与信息处理
高键 硕士研究生 081002-信号与信息处理
顾建军 博士研究生 081002-信号与信息处理
王洋洋 硕士研究生 085208-电子与通信工程
张宇航 硕士研究生 081002-信号与信息处理
程龙彪 博士研究生 081002-信号与信息处理
李伟 硕士研究生 085400-电子信息
阮小园 硕士研究生 085400-电子信息
现指导学生
王成仲 博士研究生 081002-信号与信息处理
邱泽林 博士研究生 081002-信号与信息处理
谢源 博士研究生 081002-信号与信息处理
冯帆 硕士研究生 085400-电子信息
赵佳乐 博士研究生 081002-信号与信息处理
李向前 硕士研究生 081002-信号与信息处理