苏荣锋-中国科学院大学-UCAS

招生信息

招生专业

081104-模式识别与智能系统
085400-电子信息
081203-计算机应用技术

招生方向

语音识别
声纹识别

教育背景

2014-09--2020-07   中国科学院大学   博士
2008-10--2011-07   德国布伦瑞克工业大学   硕士
2003-09--2007-07   上海市华东理工大学   理学士

工作经历

工作简历

2014-09~2020-07,中国科学院大学, 博士
2012-05~现在, 中国科学院深圳先进技术研究院, 高级工程师
2008-10~2011-07,德国布伦瑞克工业大学, 硕士
2003-09~2007-07,上海市华东理工大学, 理学士

专利与奖励

专利成果

（ 1 ）基于超声的多模态发音数据采集方法和系统, 2023, 第 1 作者, 专利号: CN202310553170.1

（ 2 ）一种基于音素信息的声纹识别方法及电子设备, 2023, 第 2 作者, 专利号: CN202310321109.4

（ 3 ）基于柔性传感器的抑郁症多模态生理数据采集方法和系统, 2023, 第 3 作者, 专利号: CN202310289987.2

（ 4 ）一种多模态发音数据采集方法与系统, 2023, 第 1 作者, 专利号: ZL202011423644.3

（ 5 ）一种呼吸、喉、嗓音之间动态关系的建模方法, 2022, 第 2 作者, 专利号: CN202211331841.1

（ 6 ）一种基于情景感知的多模态抑郁症检测系统, 2022, 第 1 作者, 专利号: CN110728997B

（ 7 ）一种声纹识别方法, 2021, 第 5 作者, 专利号: CN202111262103.1

（ 8 ）一种基于语音识别的言语功能自动评估系统和方法, 2021, 第 2 作者, 专利号: CN113496696A

（ 9 ）一种基于语音识别的构音障碍自动评估系统和方法, 2021, 第 2 作者, 专利号: CN112927696A

（ 10 ）一种针对认知障碍的语音识别系统, 2021, 第 2 作者, 专利号: CN112908317A

（ 11 ）基于眼动反馈的情绪识别能力自适应训练方法及其装置, 2021, 第 4 作者, 专利号: CN202110389075.3

（ 12 ）基于循环特征提取的音乐生成模型的训练方法、训练装置, 2021, 第 5 作者, 专利号: CN202110379387.6

（ 13 ）音乐生成模型的训练方法及训练装置、存储介质、设备, 2021, 第 5 作者, 专利号: CN202110378669.4

出版信息

发表论文

（1） On-the-fly Feature Based Speaker Adaptation for Dysarthric and Elderly Speech Recognition, Interspeech, 2023, 第 3 作者
（2） Audio-video database from subacute stroke patients for dysarthric speech intelligence assessment and preliminary analysis, BIOMEDICAL SIGNAL PROCESSING AND CONTROL, 2023, 第 7 作者
（3） Phonetic versus spatial processes during motor-oriented imitations of visuo-labial and visuo-lingual speech: A functional near-infrared spectroscopy study, EUROPEAN JOURNAL OF NEUROSCIENCE, 2022, 第 3 作者
（4） Respiratory and laryngeal influences on voice in post-stroke dysarthria: a pilot study, ISCSLP, 2022, 第 4 作者
（5） A New Method for Predicting Severity Level of Dysarthric Speech Based on Joint Feature-Sample Selection using Audio-Visual Data, IALP, 2022, 第 6 作者
（6） A Multi-level Acoustic Feature Extraction Framework for Transformer Based End-to-End Speech Recognition, Interspeech, 2022, 第 2 作者
（7） An Investigation of Magnitude-Based and Phase-Based Features for Large-Scale Speaker Identification, IALP, 2022, 第 3 作者
（8） A Phone-Level Speaker Embedding Extraction Framework with Multi-Gate Mixture-of-Experts Based Multi-Task Learning, ISCSLP, 2022, 第 3 作者
（9） Identification of Mild Cognitive Impairment Among Chinese Based on Multiple Spoken Tasks, JOURNAL OF ALZHEIMERS DISEASE, 2021, 第 4 作者
（10） Exploiting Cross-Domain Visual Feature Generation for Disordered Speech Recognition, Interspeech2020, 2020, 第 6 作者
（11） Cross-Domain Deep Visual Feature Generation for Mandarin Audio-Visual Speech Recognition, IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2020, 第 1 作者
（12） Towards the speech features of early-stage dementia: Design and application of the Mandarin elderly cognitive speech database, Interspeech, 2019, 第 5 作者
（13） Exploiting Visual Features using Bayesian Gated Neural Networks for Disordered Speech Recognition, Interspeech2019, 2019, 第 5 作者
（14） Gaussian Process Neural Networks for Speech Recognition, 19TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2018), VOLS 1-6, 2018, 第 6 作者
（15） Semi-supervised Cross-domain Visual Feature Learning for Audio-Visual Broadcast Speech Transcription, 19TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2018), VOLS 1-6, 2018, 通讯作者
（16） Multimodal Learning Using 3D Audio-Visual Data or Audio-Visual Speech Recognition, 2017 INTERNATIONAL CONFERENCE ON ASIAN LANGUAGE PROCESSING (IALP), 2017, 通讯作者
（17） Convolutional Neural Network Bottleneck Features for bi-directional Generalized Variable Parameter HMMs, 2016 IEEE INTERNATIONAL CONFERENCE ON INFORMATION AND AUTOMATION (ICIA), 2016, 通讯作者
（18） A multi-channel/multi-speaker interactive 3D Audio-Visual Speech Corpus in Mandarin, 2016 10TH INTERNATIONAL SYMPOSIUM ON CHINESE SPOKEN LANGUAGE PROCESSING (ISCSLP), 2016, 第 2 作者
（19） Efficient Use of DNN Bottleneck Features in Generalized Variable Parameter HMMs for Noise Robust Speech Recognition, Interspeech2015, 2015, 第 1 作者
（20） Automatic Complexity Control of Generalized Variable Parameter HMMs for Noise Robust Speech Recognition, IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2015, 通讯作者
（21） Generalized Variable Parameter HMMs Based Acoustic-to-articulatory Inversion, 16TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2015), VOLS 1-5, 2015, 第 4 作者
（22） Deep neural network bottleneck features for generalized variable parameter HMMs, Interspeech2014, 2014, 第 2 作者
（23） AUTOMATIC MODEL COMPLEXITY CONTROL FOR GENERALIZED VARIABLE PARAMETER HMMS, 2013 IEEE WORKSHOP ON AUTOMATIC SPEECH RECOGNITION AND UNDERSTANDING (ASRU), 2013, 通讯作者

科研活动

科研项目

（ 1 ）智能语音及声纹联合实验室, 负责人, 其他国际合作项目, 2021-03--2024-03