基本信息

周若华 男 博导 中国科学院声学研究所
理学博士 研究员 博士生导师
中科院%%%%(A类引进国外杰出人才)
电子邮件: zhouruohua@hccl.ioa.ac.cn
通信地址: 北京市海淀区北四环西路21号DSP大楼三层
邮政编码: 100190
研究领域
【1】声纹识别
【2】语种识别
【3】音频检索
【4】音乐信号处理
【5】机器学习
招生信息
招生专业
081002-信号与信息处理
招生方向
语音信号与信息处理,音乐信号与信息处理
教育背景
2001-07--2006-02 瑞士联邦工学院 博士
1994-09--1997-07 中国科学院微电子研究所 硕士
1990-09--1994-07 北京理工大学 学士
1994-09--1997-07 中国科学院微电子研究所 硕士
1990-09--1994-07 北京理工大学 学士
工作经历
工作简历
2010-10~现在, 中国科学院声学研究所, 研究员(声纹识别、语种识别、音乐信号处理学术带头人)
2010-10~2015-04,中国科学院声学研究所, %%%%——引进海外杰出人才(A类)
2010-10~2015-04,中国科学院声学研究所, %%%%——引进海外杰出人才(A类)
教授课程
语音信号处理
专利与奖励
奖励信息
(1) 基于海云计算的智能语音处理系统研究, 一等奖, 部委级, 2014
(2) 面向新疆地区的语音自动识别系统, 一等奖, 部委级, 2013
(2) 面向新疆地区的语音自动识别系统, 一等奖, 部委级, 2013
专利成果
( 1 ) 一种说话人识别方法, 发明, 2015, 第 1 作者, 专利号: ZL201210555152.9
( 2 ) 一种用于语种识别的语种模型的训练方法及系统, 发明, 2015, 第 1 作者, 专利号: ZL201210560716.8
( 3 ) 一种基于共有鉴别性子空间映射的语种识别方法及装置, 发明, 2015, 第 1 作者, 专利号: ZL201210587263.8
( 4 ) 一种基于音视频信息的自动音乐记谱方法及系统, 发明, 2012, 第 1 作者, 专利号: 201210122443.9
( 5 ) 一种说话人识别方法, 发明, 2014, 第 1 作者, 专利号: 201410334124.3
( 6 ) 一种语种识别模型的训练方法及语种识别方法, 发明, 2014, 第 1 作者, 专利号: 201410336650.3
( 7 ) 一种敲击弦乐器的音乐多音符估计方法及系统, 发明, 2014, 第 1 作者, 专利号: 201410325609.6
( 8 ) 一种应用于语种识别的鉴别性特征提取方法, 发明, 2015, 第 1 作者, 专利号: 201510280471.7
( 9 ) 一种应用于语种识别的短时语音时长扩展方法, 发明, 2016, 第 1 作者, 专利号: 201610236672.1
( 10 ) 一种采用总变化量因子的语种识别方法及系统, 发明, 2013, 第 2 作者, 专利号: 201310495417.5
( 11 ) 一种随机数字口令相关的说话人识别方法及装置, 发明, 2018, 第 1 作者, 专利号: 201810039718.X
( 2 ) 一种用于语种识别的语种模型的训练方法及系统, 发明, 2015, 第 1 作者, 专利号: ZL201210560716.8
( 3 ) 一种基于共有鉴别性子空间映射的语种识别方法及装置, 发明, 2015, 第 1 作者, 专利号: ZL201210587263.8
( 4 ) 一种基于音视频信息的自动音乐记谱方法及系统, 发明, 2012, 第 1 作者, 专利号: 201210122443.9
( 5 ) 一种说话人识别方法, 发明, 2014, 第 1 作者, 专利号: 201410334124.3
( 6 ) 一种语种识别模型的训练方法及语种识别方法, 发明, 2014, 第 1 作者, 专利号: 201410336650.3
( 7 ) 一种敲击弦乐器的音乐多音符估计方法及系统, 发明, 2014, 第 1 作者, 专利号: 201410325609.6
( 8 ) 一种应用于语种识别的鉴别性特征提取方法, 发明, 2015, 第 1 作者, 专利号: 201510280471.7
( 9 ) 一种应用于语种识别的短时语音时长扩展方法, 发明, 2016, 第 1 作者, 专利号: 201610236672.1
( 10 ) 一种采用总变化量因子的语种识别方法及系统, 发明, 2013, 第 2 作者, 专利号: 201310495417.5
( 11 ) 一种随机数字口令相关的说话人识别方法及装置, 发明, 2018, 第 1 作者, 专利号: 201810039718.X
出版信息
发表论文
(1) Polyphonic Piano Transcription with a Note-Based Music Language Model, Applied Sciences, 2018, 通讯作者
(2) 应用于短时语音语种识别的时长扩展方法, 清华大学学报(自然科学版), 2018, 通讯作者
(3) Two-Stage Approach to Note-Level Transcription of a Specific Piano, Applied Sciences, 2017, 通讯作者
(4) 应用于语种识别的加权音素对数似然比特征, 清华大学学报(自然科学版), 2017, 通讯作者
(5) Window-Dominant Signal Subspace Methods for Multiple Short-Term Speech Source Localization, IEEE/ACM Transactions on Audio Speech and Language Processing, 2017, 第 2 作者
(6) PLF Optimization for Target Language Detection, Chinese Journal of Electronics, 2017, 通讯作者
(7) Characterization vector extraction using Neural Network for speaker recognition, Proceedings - 2016 8th International Conference on Intelligent Human-Machine Systems and Cybernetics, IHMSC 2016, 2016, 第 3 作者
(8) Robust multiple speech source localization based on phase difference regression, ISCSLP 2016, 2016, 第 4 作者
(9) Robust speaker recognition using a library of cross-domain variation compensation transforms, IET Electronics Letters, 2016, 通讯作者
(10) A General Bayesian Model for Speaker Verification, Chinese Journal of Electronics, 2016, 通讯作者
(11) Cross-domain variation compensation for robust speaker verification, IET Electronics Letters, 2015, 通讯作者
(12) Feature recovery for noise-robust speaker verification, IET Electronics Letters, 2015, 通讯作者
(13) Automatic Piano Music Transcription Using Audio-Visual Features, Chinese Journal of Electronics, 2015, 通讯作者
(14) 基于SVM一对多得分规整的语种识别方法, 网络新媒体技术, 2015, 第 5 作者
(15) Phonotactic language recognition using dynamic pronunciation and language branch discriminative information, Speech Communication, 2015, 通讯作者
(16) Multipitch Onset Detection Via Temporal Segmentation And Segmental Analysis, ICSV2014, 2014, 第 3 作者
(17) Vowel based neural networks for speaker verification, ISCE2014, 2014, 第 3 作者
(18) Voice biometrics using linear Gaussian model, IET Biometrics, 2014, 通讯作者
(19) Language recognition system using language branch discriminative information, ICASSP 2014, 2014, 通讯作者
(20) A new feature for speech\music discrimination, ISCE2014, 2014, 第 3 作者
(21) locality Preserving Discriminant Projection for Total-Variability-Based Language Recognition, Advances in Intelligent Systems and Computing, 2014, 通讯作者
(22) Modeling prosodic features with probabilistic linear discriminant analysis for speaker verification, Shengxue Xuebao, 2014, 通讯作者
(23) Locality Preserving Discriminant Projection for Total-variability-Based Language Recognition , Foundations and Practical Applications of Cognitive Systems and Information Processing, 2014, 通讯作者
(24) Enhanced Voice Activity Detection based on Automatic Segmentation and Event Classification, Journal of Computational Information Systems, 2014, 通讯作者
(25) 高斯PLDA 在说话人确认中的应用及其联合估计, 自动化学报, 2014, 通讯作者
(26) 基于PLDA的多信道多语音说话人确认研究, 网络新媒体技术, 2014, 第 2 作者
(27) 基于语支鉴别性的音素相关语种识别方法, 网络新媒体技术, 2014, 第 4 作者
(28) 基于非负矩阵分解的钢琴多音符估计, 网络新媒体技术, 2014, 第 3 作者
(29) Language-pair scoring method based on SVM for language recognition, Applied Mechanics and Materials, 2013, 通讯作者
(30) Speaker Recognition Using Sparse Probabilistic Linear Discriminant Analysis, IEICE TRANSACTIONS on Fundamentals of Electronics, Communications and Computer Sciences, 2013, 通讯作者
(31) 基于SVM一对一分类的语种识别方法, 清华学报, 2013, 通讯作者
(32) 快速准确的自动音乐/语音分段方法, 清华学报, 2013, 通讯作者
(33) 一个快速自动音乐记谱方法, 声学学报, 2010, 第 1 作者
(34) A Computationally Efficient Method for Polyphonic Pitch Estimation, EURASIP Journal on Advances in Signal Processing, 2009, 第 1 作者
(35) Music Onset Detection Based on Resonator Time-frequency Image, IEEE Transactions On Audio, Speech And Language Processing, 2008, 第 1 作者
(36) A New Time-frequency Representations for Music Signal Analysis, A Real-Time Polyphonic Music Transcription System, ISSPP 2007, 2007, 第 1 作者
(37) Music Onset Detection Combining Energy-based and Pitch-Based Approaches, MIREX2007, 2007, 第 1 作者
(38)
(2) 应用于短时语音语种识别的时长扩展方法, 清华大学学报(自然科学版), 2018, 通讯作者
(3) Two-Stage Approach to Note-Level Transcription of a Specific Piano, Applied Sciences, 2017, 通讯作者
(4) 应用于语种识别的加权音素对数似然比特征, 清华大学学报(自然科学版), 2017, 通讯作者
(5) Window-Dominant Signal Subspace Methods for Multiple Short-Term Speech Source Localization, IEEE/ACM Transactions on Audio Speech and Language Processing, 2017, 第 2 作者
(6) PLF Optimization for Target Language Detection, Chinese Journal of Electronics, 2017, 通讯作者
(7) Characterization vector extraction using Neural Network for speaker recognition, Proceedings - 2016 8th International Conference on Intelligent Human-Machine Systems and Cybernetics, IHMSC 2016, 2016, 第 3 作者
(8) Robust multiple speech source localization based on phase difference regression, ISCSLP 2016, 2016, 第 4 作者
(9) Robust speaker recognition using a library of cross-domain variation compensation transforms, IET Electronics Letters, 2016, 通讯作者
(10) A General Bayesian Model for Speaker Verification, Chinese Journal of Electronics, 2016, 通讯作者
(11) Cross-domain variation compensation for robust speaker verification, IET Electronics Letters, 2015, 通讯作者
(12) Feature recovery for noise-robust speaker verification, IET Electronics Letters, 2015, 通讯作者
(13) Automatic Piano Music Transcription Using Audio-Visual Features, Chinese Journal of Electronics, 2015, 通讯作者
(14) 基于SVM一对多得分规整的语种识别方法, 网络新媒体技术, 2015, 第 5 作者
(15) Phonotactic language recognition using dynamic pronunciation and language branch discriminative information, Speech Communication, 2015, 通讯作者
(16) Multipitch Onset Detection Via Temporal Segmentation And Segmental Analysis, ICSV2014, 2014, 第 3 作者
(17) Vowel based neural networks for speaker verification, ISCE2014, 2014, 第 3 作者
(18) Voice biometrics using linear Gaussian model, IET Biometrics, 2014, 通讯作者
(19) Language recognition system using language branch discriminative information, ICASSP 2014, 2014, 通讯作者
(20) A new feature for speech\music discrimination, ISCE2014, 2014, 第 3 作者
(21) locality Preserving Discriminant Projection for Total-Variability-Based Language Recognition, Advances in Intelligent Systems and Computing, 2014, 通讯作者
(22) Modeling prosodic features with probabilistic linear discriminant analysis for speaker verification, Shengxue Xuebao, 2014, 通讯作者
(23) Locality Preserving Discriminant Projection for Total-variability-Based Language Recognition , Foundations and Practical Applications of Cognitive Systems and Information Processing, 2014, 通讯作者
(24) Enhanced Voice Activity Detection based on Automatic Segmentation and Event Classification, Journal of Computational Information Systems, 2014, 通讯作者
(25) 高斯PLDA 在说话人确认中的应用及其联合估计, 自动化学报, 2014, 通讯作者
(26) 基于PLDA的多信道多语音说话人确认研究, 网络新媒体技术, 2014, 第 2 作者
(27) 基于语支鉴别性的音素相关语种识别方法, 网络新媒体技术, 2014, 第 4 作者
(28) 基于非负矩阵分解的钢琴多音符估计, 网络新媒体技术, 2014, 第 3 作者
(29) Language-pair scoring method based on SVM for language recognition, Applied Mechanics and Materials, 2013, 通讯作者
(30) Speaker Recognition Using Sparse Probabilistic Linear Discriminant Analysis, IEICE TRANSACTIONS on Fundamentals of Electronics, Communications and Computer Sciences, 2013, 通讯作者
(31) 基于SVM一对一分类的语种识别方法, 清华学报, 2013, 通讯作者
(32) 快速准确的自动音乐/语音分段方法, 清华学报, 2013, 通讯作者
(33) 一个快速自动音乐记谱方法, 声学学报, 2010, 第 1 作者
(34) A Computationally Efficient Method for Polyphonic Pitch Estimation, EURASIP Journal on Advances in Signal Processing, 2009, 第 1 作者
(35) Music Onset Detection Based on Resonator Time-frequency Image, IEEE Transactions On Audio, Speech And Language Processing, 2008, 第 1 作者
(36) A New Time-frequency Representations for Music Signal Analysis, A Real-Time Polyphonic Music Transcription System, ISSPP 2007, 2007, 第 1 作者
(37) Music Onset Detection Combining Energy-based and Pitch-Based Approaches, MIREX2007, 2007, 第 1 作者
(38)
发表著作
(1) 机器听觉:原理,算法与系统 (章节:音乐起始检测), Chapter: Music Onset Detection,In book Machine Audition: Principles, Algorithms and Systems, IGI Global, 2010-07, 第 1 作者
科研活动
科研项目
( 1 ) 应用于钢琴计算机辅助教学的自动音乐记谱技术的研究, 主持, 国家级, 2011-01--2013-12
( 2 ) 中科院“%%%%”项目, 主持, 国家级, 2011-01--2015-04
( 3 ) 实际应用情况下的哼唱搜索关键技术研究, 主持, 市地级, 2011-01--2013-12
( 4 ) 说话人识别技术研究, 主持, 国家级, 2013-06--2014-07
( 5 ) 电话语音关键技术研究, 主持, 部委级, 2014-05--2016-06
( 6 ) 互联网语音分析关键技术研究, 主持, 国家级, 2014-05--2015-06
( 7 ) 广播音频数字水印与内容监管关键技术研究, 主持, 部委级, 2015-01--2017-02
( 8 ) 智能语音处理系统, 主持, 国家级, 2015-10--2017-10
( 9 ) 音频内容分析与理解, 参与, 部委级, 2012-01--2017-06
( 10 ) 音视频语音分离检索技术, 主持, 部委级, 2015-06--2016-06
( 11 ) 小语种识别试点项目, 主持, 国家级, 2015-10--2016-10
( 12 ) 小语种识别在线实验, 主持, 国家级, 2015-10--2016-10
( 13 ) 互联网复杂信道小语种识别, 主持, 国家级, 2015-04--2016-03
( 14 ) 基于短时语音的声纹识别技术研究, 主持, 国家级, 2016-06--2019-05
( 15 ) 声纹在线分析子系统, 参与, 国家级, 2017-01--2018-12
( 16 ) 新型音视频管控技术研究, 参与, 国家级, 2016-12--2019-12
( 2 ) 中科院“%%%%”项目, 主持, 国家级, 2011-01--2015-04
( 3 ) 实际应用情况下的哼唱搜索关键技术研究, 主持, 市地级, 2011-01--2013-12
( 4 ) 说话人识别技术研究, 主持, 国家级, 2013-06--2014-07
( 5 ) 电话语音关键技术研究, 主持, 部委级, 2014-05--2016-06
( 6 ) 互联网语音分析关键技术研究, 主持, 国家级, 2014-05--2015-06
( 7 ) 广播音频数字水印与内容监管关键技术研究, 主持, 部委级, 2015-01--2017-02
( 8 ) 智能语音处理系统, 主持, 国家级, 2015-10--2017-10
( 9 ) 音频内容分析与理解, 参与, 部委级, 2012-01--2017-06
( 10 ) 音视频语音分离检索技术, 主持, 部委级, 2015-06--2016-06
( 11 ) 小语种识别试点项目, 主持, 国家级, 2015-10--2016-10
( 12 ) 小语种识别在线实验, 主持, 国家级, 2015-10--2016-10
( 13 ) 互联网复杂信道小语种识别, 主持, 国家级, 2015-04--2016-03
( 14 ) 基于短时语音的声纹识别技术研究, 主持, 国家级, 2016-06--2019-05
( 15 ) 声纹在线分析子系统, 参与, 国家级, 2017-01--2018-12
( 16 ) 新型音视频管控技术研究, 参与, 国家级, 2016-12--2019-12
指导学生
已指导学生
陈艳妮 硕士研究生 085208-电子与通信工程
杨朔 硕士研究生 085208-电子与通信工程
现指导学生
林辉 博士研究生 081002-信号与信息处理
白兴 博士研究生 081002-信号与信息处理
陈道成 博士研究生 081002-信号与信息处理
刘珈麟 博士研究生 081002-信号与信息处理
高键 硕士研究生 081002-信号与信息处理
张学帅 博士研究生 081002-信号与信息处理
联合指导博士生
学生 | 培养单位 | 学位 类别 | 学科专业 | 入学/毕业 |
黄厚军 | 中国科学院声学研究所 | 博士 | 说话人识别 | 2011/2016 |
张健 | 中国科学院信息工程研究所 | 博士 | 语种识别 | 2013/2016 |
陈志高 | 中国科学院声学研究所 | 博士 | 说话人识别 | 2016/2021 |
苗晓晓 | 中国科学院声学研究所 | 博士 | 语种识别 | 2015/2020 |
王琪 | 中国科学院声学研究所 | 博士 | 音乐信号处理 | 2015/2018 |
万玉龙 | 中国科学院声学研究所 | 博士 | 音乐信号处理 | 2009/2014 |
王宪亮 | 中国科学院声学研究所 | 博士 | 语种识别 | 2010/2015 |
许云飞 | 中国科学院声学研究所 | 博士 | 说话人识别 | 2010/2015 |
杨海 | 中国科学院声学研究所 | 博士 | 说话人识别 | 2008/2013 |
梁春燕 | 中国科学院声学研究所 | 博士 | 说话人识别 | 2009/2014 |
杨金超 | 中国科学院声学研究所 | 博士 | 语种识别 | 2008/2013 |