基本信息

王文超 男 中国科学院声学研究所
电子邮件: wangwenchao@hccl.ioa.ac.cn
通信地址: 北京市海淀区北四环西路21号中国科学院声学研究所
邮政编码:
电子邮件: wangwenchao@hccl.ioa.ac.cn
通信地址: 北京市海淀区北四环西路21号中国科学院声学研究所
邮政编码:
招生信息
招生专业
081002-信号与信息处理
招生方向
语音信号处理,人工智能,水声目标识别
教育背景
2014-09--2019-06 中国科学院声学研究所 工学博士
2010-09--2014-06 西安电子科技大学 工学学士
2010-09--2014-06 西安电子科技大学 工学学士
工作经历
工作简历
2023-11~现在, 中国科学院声学研究所, 副研究员
2021-10~2023-11,中国科学院声学研究所, 助理研究员
2019-07~2021-10,中国科学院声学研究所, 博士后
2021-10~2023-11,中国科学院声学研究所, 助理研究员
2019-07~2021-10,中国科学院声学研究所, 博士后
专利与奖励
奖励信息
(1) 智能语音能力平台关键技术及其在智能客服行业应用, 二等奖, 省级, 2019
专利成果
( 1 ) 一种语音检测模型训练和语音检测方法, 发明专利, 2023, 第 1 作者, 专利号: CN116597818A
( 2 ) 一种融合分布对齐和对抗学习的无监督跨域声纹识别方法, 发明专利, 2021, 第 3 作者, 专利号: CN112820301A
( 3 ) 一种融合分布对齐和对抗学习的无监督跨域声纹识别方法, 2023, 第 3 作者, 专利号: CN112820301B
( 4 ) 全连接多尺度的残差网络及其进行声纹识别的方法, 专利授权, 2021, 第 1 作者, 专利号: CN111833886B
( 5 ) 一种基于空洞卷积神经网络的端到端语种识别分类方法, 发明专利, 2021, 第 3 作者, 专利号: CN113539238A
( 6 ) 一种说话人分段聚类方法及装置, 专利授权, 2019, 第 6 作者, 专利号: CN109859742A
( 7 ) 一种针对声纹识别的语音降噪方法及装置, 专利授权, 2019, 第 2 作者, 专利号: CN110070874A
( 2 ) 一种融合分布对齐和对抗学习的无监督跨域声纹识别方法, 发明专利, 2021, 第 3 作者, 专利号: CN112820301A
( 3 ) 一种融合分布对齐和对抗学习的无监督跨域声纹识别方法, 2023, 第 3 作者, 专利号: CN112820301B
( 4 ) 全连接多尺度的残差网络及其进行声纹识别的方法, 专利授权, 2021, 第 1 作者, 专利号: CN111833886B
( 5 ) 一种基于空洞卷积神经网络的端到端语种识别分类方法, 发明专利, 2021, 第 3 作者, 专利号: CN113539238A
( 6 ) 一种说话人分段聚类方法及装置, 专利授权, 2019, 第 6 作者, 专利号: CN109859742A
( 7 ) 一种针对声纹识别的语音降噪方法及装置, 专利授权, 2019, 第 2 作者, 专利号: CN110070874A
出版信息
发表论文
(1) Prototype Division for Self-Supervised Speaker Verification, IEEE SIGNAL PROCESSING LETTERS, 2024, 通讯作者
(2) Synthetic Speech Detection Based on Temporal Consistency and Distribution of Speaker Features, IEEE SIGNAL PROCESSING LETTERS, 2024, 通讯作者
(3) The Impact of Silence on Speech Anti-Spoofing, IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP), 2023, 通讯作者
(4) PCF: ECAPA-TDNN with progressive channel fusion for speaker verification, ICASSP2023, 2023, 第 3 作者
(5) UALF: A learnable front-end for intelligent underwater acoustic classification system, OCEAN ENGINEERING, 2023, 第 3 作者
(6) How to make embeddings suitable for PLDA, COMPUTER SPEECH AND LANGUAGE, 2023, 通讯作者
(7) Underwater Acoustic Target Recognition based on Smoothness-inducing Regularization and Spectrogram-based Data Augmentation, Ocean Engineering, 2023, 第 3 作者
(8) The effect of silence and dual-band fusion in anti-spoofing system, Interspeech, 2021, 第 2 作者
(9) Adaptive Margin Circle Loss for Speaker Verification, Interspeech, 2021, 通讯作者
(10) D-MONA: A dilated mixed-order non-local attention network for speaker and language recognition, NEURAL NETWORKS, 2021, 第 3 作者
(11) A feature optimization approach based on inter-class and intra-class distance for ship type classification, SENSORS, 2020, 第 4 作者
(12) MULTIPLE TEMPORAL SCALES BASED SPEAKER EMBEDDINGS LEARNING FOR TEXT-DEPENDENT SPEAKER RECOGNITION, 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2019, 通讯作者
(13) Identity Vector Extraction Using Shared Mixture of PLDA for Short-Time Speaker Recognition, Identity Vector Extraction Using Shared Mixture of PLDA for Short-Time Speaker Recognition, 电子学报(英文), 2019, 通讯作者
(14) Identity Vector Extraction Using Shared Mixture of PLDA for Short-Time Speaker Recognition, CHINESE JOURNAL OF ELECTRONICS, 2019, 通讯作者
(2) Synthetic Speech Detection Based on Temporal Consistency and Distribution of Speaker Features, IEEE SIGNAL PROCESSING LETTERS, 2024, 通讯作者
(3) The Impact of Silence on Speech Anti-Spoofing, IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP), 2023, 通讯作者
(4) PCF: ECAPA-TDNN with progressive channel fusion for speaker verification, ICASSP2023, 2023, 第 3 作者
(5) UALF: A learnable front-end for intelligent underwater acoustic classification system, OCEAN ENGINEERING, 2023, 第 3 作者
(6) How to make embeddings suitable for PLDA, COMPUTER SPEECH AND LANGUAGE, 2023, 通讯作者
(7) Underwater Acoustic Target Recognition based on Smoothness-inducing Regularization and Spectrogram-based Data Augmentation, Ocean Engineering, 2023, 第 3 作者
(8) The effect of silence and dual-band fusion in anti-spoofing system, Interspeech, 2021, 第 2 作者
(9) Adaptive Margin Circle Loss for Speaker Verification, Interspeech, 2021, 通讯作者
(10) D-MONA: A dilated mixed-order non-local attention network for speaker and language recognition, NEURAL NETWORKS, 2021, 第 3 作者
(11) A feature optimization approach based on inter-class and intra-class distance for ship type classification, SENSORS, 2020, 第 4 作者
(12) MULTIPLE TEMPORAL SCALES BASED SPEAKER EMBEDDINGS LEARNING FOR TEXT-DEPENDENT SPEAKER RECOGNITION, 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2019, 通讯作者
(13) Identity Vector Extraction Using Shared Mixture of PLDA for Short-Time Speaker Recognition, Identity Vector Extraction Using Shared Mixture of PLDA for Short-Time Speaker Recognition, 电子学报(英文), 2019, 通讯作者
(14) Identity Vector Extraction Using Shared Mixture of PLDA for Short-Time Speaker Recognition, CHINESE JOURNAL OF ELECTRONICS, 2019, 通讯作者
科研活动
科研项目
( 1 ) 面向特定说话人的伪造语音检测技术, 负责人, 国家任务, 2023-01--2025-12