基本信息

苏荣锋 男 硕导 中国科学院深圳先进技术研究院
email: rf.su@siat.ac.cn
address: 广东省深圳市南山区西丽深圳大学城学苑大道1068号
postalCode:
email: rf.su@siat.ac.cn
address: 广东省深圳市南山区西丽深圳大学城学苑大道1068号
postalCode:
招生信息
招生专业
081203-计算机应用技术
招生方向
语音识别声纹识别情感识别
教育背景
2014-09--2020-07 中国科学院大学 博士2008-10--2011-07 德国布伦瑞克工业大学 硕士2003-09--2007-07 上海市华东理工大学 理学士
工作经历
工作简历
2014-09~2020-07,中国科学院大学, 博士2012-05~现在, 中国科学院深圳先进技术研究院, 高级工程师2008-10~2011-07,德国布伦瑞克工业大学, 硕士2003-09~2007-07,上海市华东理工大学, 理学士
专利与奖励
专利成果
( 1 ) 基于超声的多模态发音数据采集方法和系统, 2023, 第 1 作者, 专利号: CN202310553170.1( 2 ) 一种基于音素信息的声纹识别方法及电子设备, 2023, 第 2 作者, 专利号: CN202310321109.4( 3 ) 基于柔性传感器的抑郁症多模态生理数据采集方法和系统, 2023, 第 3 作者, 专利号: CN202310289987.2( 4 ) 一种多模态发音数据采集方法与系统, 2023, 第 1 作者, 专利号: ZL202011423644.3( 5 ) 一种呼吸、喉、嗓音之间动态关系的建模方法, 2022, 第 2 作者, 专利号: CN202211331841.1( 6 ) 一种基于情景感知的多模态抑郁症检测系统, 2022, 第 1 作者, 专利号: CN110728997B( 7 ) 一种声纹识别方法, 2021, 第 5 作者, 专利号: CN202111262103.1( 8 ) 一种基于语音识别的言语功能自动评估系统和方法, 2021, 第 2 作者, 专利号: CN113496696A( 9 ) 一种基于语音识别的构音障碍自动评估系统和方法, 2021, 第 2 作者, 专利号: CN112927696A( 10 ) 一种针对认知障碍的语音识别系统, 2021, 第 2 作者, 专利号: CN112908317A( 11 ) 基于眼动反馈的情绪识别能力自适应训练方法及其装置, 2021, 第 4 作者, 专利号: CN202110389075.3( 12 ) 基于循环特征提取的音乐生成模型的训练方法、训练装置, 2021, 第 5 作者, 专利号: CN202110379387.6( 13 ) 音乐生成模型的训练方法及训练装置、存储介质、设备, 2021, 第 5 作者, 专利号: CN202110378669.4
出版信息
发表论文
(1) On-the-fly Feature Based Speaker Adaptation for Dysarthric and Elderly Speech Recognition, Interspeech, 2023, 第 3 作者(2) Audio-video database from subacute stroke patients for dysarthric speech intelligence assessment and preliminary analysis, BIOMEDICAL SIGNAL PROCESSING AND CONTROL, 2023, 第 7 作者(3) Phonetic versus spatial processes during motor-oriented imitations of visuo-labial and visuo-lingual speech: A functional near-infrared spectroscopy study, EUROPEAN JOURNAL OF NEUROSCIENCE, 2022, 第 3 作者(4) Respiratory and laryngeal influences on voice in post-stroke dysarthria: a pilot study, ISCSLP, 2022, 第 4 作者(5) A New Method for Predicting Severity Level of Dysarthric Speech Based on Joint Feature-Sample Selection using Audio-Visual Data, IALP, 2022, 第 6 作者(6) A Multi-level Acoustic Feature Extraction Framework for Transformer Based End-to-End Speech Recognition, Interspeech, 2022, 第 2 作者(7) An Investigation of Magnitude-Based and Phase-Based Features for Large-Scale Speaker Identification, IALP, 2022, 第 3 作者(8) A Phone-Level Speaker Embedding Extraction Framework with Multi-Gate Mixture-of-Experts Based Multi-Task Learning, ISCSLP, 2022, 第 3 作者(9) Identification of Mild Cognitive Impairment Among Chinese Based on Multiple Spoken Tasks, JOURNAL OF ALZHEIMERS DISEASE, 2021, 第 4 作者(10) Exploiting Cross-Domain Visual Feature Generation for Disordered Speech Recognition, Interspeech2020, 2020, 第 6 作者(11) Cross-Domain Deep Visual Feature Generation for Mandarin Audio-Visual Speech Recognition, IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2020, 第 1 作者(12) Towards the speech features of early-stage dementia: Design and application of the Mandarin elderly cognitive speech database, Interspeech, 2019, 第 5 作者(13) Exploiting Visual Features using Bayesian Gated Neural Networks for Disordered Speech Recognition, Interspeech2019, 2019, 第 5 作者(14) Gaussian Process Neural Networks for Speech Recognition, 19TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2018), VOLS 1-6, 2018, 第 6 作者(15) Semi-supervised Cross-domain Visual Feature Learning for Audio-Visual Broadcast Speech Transcription, 19TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2018), VOLS 1-6, 2018, 第 1 作者(16) Multimodal Learning Using 3D Audio-Visual Data or Audio-Visual Speech Recognition, 2017 INTERNATIONAL CONFERENCE ON ASIAN LANGUAGE PROCESSING (IALP), 2017, 第 1 作者(17) Convolutional Neural Network Bottleneck Features for bi-directional Generalized Variable Parameter HMMs, 2016 IEEE INTERNATIONAL CONFERENCE ON INFORMATION AND AUTOMATION (ICIA), 2016, 第 1 作者(18) A multi-channel/multi-speaker interactive 3D Audio-Visual Speech Corpus in Mandarin, 2016 10TH INTERNATIONAL SYMPOSIUM ON CHINESE SPOKEN LANGUAGE PROCESSING (ISCSLP), 2016, 第 2 作者(19) Efficient Use of DNN Bottleneck Features in Generalized Variable Parameter HMMs for Noise Robust Speech Recognition, Interspeech2015, 2015, 第 1 作者(20) Automatic Complexity Control of Generalized Variable Parameter HMMs for Noise Robust Speech Recognition, IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2015, 第 1 作者 通讯作者(21) Generalized Variable Parameter HMMs Based Acoustic-to-articulatory Inversion, 16TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2015), VOLS 1-5, 2015, 第 4 作者(22) Deep neural network bottleneck features for generalized variable parameter HMMs, Interspeech2014, 2014, 第 2 作者(23) AUTOMATIC MODEL COMPLEXITY CONTROL FOR GENERALIZED VARIABLE PARAMETER HMMS, 2013 IEEE WORKSHOP ON AUTOMATIC SPEECH RECOGNITION AND UNDERSTANDING (ASRU), 2013, 第 1 作者 通讯作者
科研活动
科研项目
( 1 ) 智能语音及声纹联合实验室, 负责人, 其他国际合作项目, 2021-03--2024-03