基本信息
苏荣锋  男  硕导  中国科学院深圳先进技术研究院
电子邮件: rf.su@siat.ac.cn
通信地址: 广东省深圳市南山区西丽深圳大学城学苑大道1068号
邮政编码:

招生信息

   
招生专业
081203-计算机应用技术
招生方向
语音识别
声纹识别

教育背景

2014-09--2020-07   中国科学院大学   博士
2008-10--2011-07   德国布伦瑞克工业大学   硕士
2003-09--2007-07   上海市华东理工大学   理学士

工作经历

   
工作简历
2014-09~2020-07,中国科学院大学, 博士
2012-05~现在, 中国科学院深圳先进技术研究院, 高级工程师
2008-10~2011-07,德国布伦瑞克工业大学, 硕士
2003-09~2007-07,上海市华东理工大学, 理学士

专利与奖励

   
专利成果
( 1 ) 基于超声的多模态发音数据采集方法和系统, 2023, 第 1 作者, 专利号: CN202310553170.1

( 2 ) 一种基于音素信息的声纹识别方法及电子设备, 2023, 第 2 作者, 专利号: CN202310321109.4

( 3 ) 基于柔性传感器的抑郁症多模态生理数据采集方法和系统, 2023, 第 3 作者, 专利号: CN202310289987.2

( 4 ) 一种多模态发音数据采集方法与系统, 2023, 第 1 作者, 专利号: ZL202011423644.3

( 5 ) 一种呼吸、喉、嗓音之间动态关系的建模方法, 2022, 第 2 作者, 专利号: CN202211331841.1

( 6 ) 一种基于情景感知的多模态抑郁症检测系统, 2022, 第 1 作者, 专利号: CN110728997B

( 7 ) 一种声纹识别方法, 2021, 第 5 作者, 专利号: CN202111262103.1

( 8 ) 一种基于语音识别的言语功能自动评估系统和方法, 2021, 第 2 作者, 专利号: CN113496696A

( 9 ) 一种基于语音识别的构音障碍自动评估系统和方法, 2021, 第 2 作者, 专利号: CN112927696A

( 10 ) 一种针对认知障碍的语音识别系统, 2021, 第 2 作者, 专利号: CN112908317A

( 11 ) 基于眼动反馈的情绪识别能力自适应训练方法及其装置, 2021, 第 4 作者, 专利号: CN202110389075.3

( 12 ) 基于循环特征提取的音乐生成模型的训练方法、训练装置, 2021, 第 5 作者, 专利号: CN202110379387.6

( 13 ) 音乐生成模型的训练方法及训练装置、存储介质、设备, 2021, 第 5 作者, 专利号: CN202110378669.4

出版信息

   
发表论文
(1) On-the-fly Feature Based Speaker Adaptation for Dysarthric and Elderly Speech Recognition, Interspeech, 2023, 第 3 作者
(2) Audio-video database from subacute stroke patients for dysarthric speech intelligence assessment and preliminary analysis, BIOMEDICAL SIGNAL PROCESSING AND CONTROL, 2023, 第 7 作者
(3) Phonetic versus spatial processes during motor-oriented imitations of visuo-labial and visuo-lingual speech: A functional near-infrared spectroscopy study, EUROPEAN JOURNAL OF NEUROSCIENCE, 2022, 第 3 作者
(4) Respiratory and laryngeal influences on voice in post-stroke dysarthria: a pilot study, ISCSLP, 2022, 第 4 作者
(5) A New Method for Predicting Severity Level of Dysarthric Speech Based on Joint Feature-Sample Selection using Audio-Visual Data, IALP, 2022, 第 6 作者
(6) A Multi-level Acoustic Feature Extraction Framework for Transformer Based End-to-End Speech Recognition, Interspeech, 2022, 第 2 作者
(7) An Investigation of Magnitude-Based and Phase-Based Features for Large-Scale Speaker Identification, IALP, 2022, 第 3 作者
(8) A Phone-Level Speaker Embedding Extraction Framework with Multi-Gate Mixture-of-Experts Based Multi-Task Learning, ISCSLP, 2022, 第 3 作者
(9) Identification of Mild Cognitive Impairment Among Chinese Based on Multiple Spoken Tasks, JOURNAL OF ALZHEIMERS DISEASE, 2021, 第 4 作者
(10) Exploiting Cross-Domain Visual Feature Generation for Disordered Speech Recognition, Interspeech2020, 2020, 第 6 作者
(11) Cross-Domain Deep Visual Feature Generation for Mandarin Audio-Visual Speech Recognition, IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2020, 第 1 作者
(12) Towards the speech features of early-stage dementia: Design and application of the Mandarin elderly cognitive speech database, Interspeech, 2019, 第 5 作者
(13) Exploiting Visual Features using Bayesian Gated Neural Networks for Disordered Speech Recognition, Interspeech2019, 2019, 第 5 作者
(14) Gaussian Process Neural Networks for Speech Recognition, 19TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2018), VOLS 1-6, 2018, 第 6 作者
(15) Semi-supervised Cross-domain Visual Feature Learning for Audio-Visual Broadcast Speech Transcription, 19TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2018), VOLS 1-6, 2018, 通讯作者
(16) Multimodal Learning Using 3D Audio-Visual Data or Audio-Visual Speech Recognition, 2017 INTERNATIONAL CONFERENCE ON ASIAN LANGUAGE PROCESSING (IALP), 2017, 通讯作者
(17) Convolutional Neural Network Bottleneck Features for bi-directional Generalized Variable Parameter HMMs, 2016 IEEE INTERNATIONAL CONFERENCE ON INFORMATION AND AUTOMATION (ICIA), 2016, 通讯作者
(18) A multi-channel/multi-speaker interactive 3D Audio-Visual Speech Corpus in Mandarin, 2016 10TH INTERNATIONAL SYMPOSIUM ON CHINESE SPOKEN LANGUAGE PROCESSING (ISCSLP), 2016, 第 2 作者
(19) Efficient Use of DNN Bottleneck Features in Generalized Variable Parameter HMMs for Noise Robust Speech Recognition, Interspeech2015, 2015, 第 1 作者
(20) Automatic Complexity Control of Generalized Variable Parameter HMMs for Noise Robust Speech Recognition, IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2015, 通讯作者
(21) Generalized Variable Parameter HMMs Based Acoustic-to-articulatory Inversion, 16TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2015), VOLS 1-5, 2015, 第 4 作者
(22) Deep neural network bottleneck features for generalized variable parameter HMMs, Interspeech2014, 2014, 第 2 作者
(23) AUTOMATIC MODEL COMPLEXITY CONTROL FOR GENERALIZED VARIABLE PARAMETER HMMS, 2013 IEEE WORKSHOP ON AUTOMATIC SPEECH RECOGNITION AND UNDERSTANDING (ASRU), 2013, 通讯作者

科研活动

   
科研项目
( 1 ) 智能语音及声纹联合实验室, 负责人, 其他国际合作项目, 2021-03--2024-03