基本信息

张学帅  男    中国科学院声学研究所
电子邮件: zhangxueshuai@mail.ioa.ac.cn
通信地址: 北京市海淀区中国科学院声学研究所
邮政编码:100190

研究领域

声纹识别;语种识别;音频事件检测;智慧医疗;水声识别

招生信息

专业型硕士、学术型硕士

招生专业
081002-信号与信息处理
招生方向
声纹识别,语种识别,音频事件检测,目标识别,智慧医疗

工作经历

   
工作简历
2021-07~2024-04,中国科学院声学研究所, 特种组组长

专利与奖励

   
奖励信息
(1) 中国电子协会科技进步的二等奖, 二等奖, 其他, 2024
(2) DCASE2023音频事件检测TASK4A冠军, 一等奖, 其他, 2023
(3) 中国人工智能大赛同源变种音频检索B级奖, 一等奖, 市地级, 2019
专利成果
( 1 ) 利用音频判别模型对音频进行判别的判别设备及存储介质, 发明专利, 2022, 第 2 作者, 专利号: CN114400024A

( 2 ) 利用音频判别模型进行音频判别的方法和装置, 发明专利, 2021, 第 2 作者, 专利号: CN113724731A

( 3 ) 一种多个说话人的语音转折点检测方法及装置, 发明专利, 2021, 第 2 作者, 专利号: CN112951212A

( 4 ) 一种音频检索方法及装置, 发明专利, 2021, 第 3 作者, 专利号: CN113157967A

( 5 ) 一种基于变速模板的音频样例检索方法, 2023, 第 3 作者, 专利号: CN111382302B

( 6 ) 一种基于指纹权重的音频样例检索方法, 发明专利, 2020, 第 2 作者, 专利号: CN111382303A

出版信息

   
发表论文
(1) Prototype Division for Self-Supervised Speaker Verification, IEEE SIGNAL PROCESSING LETTERS, 2024, 第 3 作者
(2) Snore sound features based on percussive enhancing and positional encoding combined with multi-task learning for OSAHS detection(ICASSP2024), ICASSP 2024-2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2024, 第 2 作者  通讯作者
(3) ONE-EPOCH TRAINING WITH SINGLE TEST SAMPLE IN TEST TIME FOR BETTER GENERALIZATION OF COUGH-BASED COVID-19 DETECTION MODE(ICASSP2024), ICASSP 2024-2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2024, 第 2 作者  通讯作者
(4) Multi-dimensional frequency dynamic convolution with confident mean teacher for sound event detection, ICASSP 2023-2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2023, 第 2 作者  通讯作者
(5) Piecewise Position Encoding in Convolutional Neural Network for Cough-Based Covid-19 Detection, ICASSP 2023-2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2023, 第 2 作者  通讯作者
(6) Robust Cough Feature Extraction and Classification Method for COVID-19 Cough Detection Based on Vocalization Characteristics., Conference of the International Speech Communication Association, 2022, 第 1 作者
(7) 静音掩蔽和频域分段的音频指纹检索算法, Audio fingerprint retrieval method using anti-fingerprint and frequency domain segmentation, 声学学报, 2022, 第 2 作者
(8) Cough-based COVID-19 detection with multi-band long-short term memory and convolutional neural networks, Proceedings of the 2nd International Symposium on Artificial Intelligence for Medicine Sciences, 2021, 第 2 作者  通讯作者
(9) Robust audio retrieval method based on anti-noise fingerprinting and segmental matching, ELECTRONICS LETTERS, 2020, 第 1 作者
(10) Speaker Diarization System based on DPCA Algorithm For Fearless Steps Challenge Phase-2, 2019, 第 1 作者
(11) 基于指纹权重的音频模板检索方法, Audio retrieval method based on weighted DNA, 中国科技论文, 2018, 第 1 作者

科研活动

   
科研项目
( 1 ) 基于声学特征的肺部疾病自动诊断方法研究, 负责人, 国家任务, 2021-11--2023-08
( 2 ) 2022年度特别研究助理考核优秀研究所匹配经费, 负责人, 研究所自主部署, 2023-10--2023-12
( 3 ) 音频声场协同融合技术, 参与, 国家任务, 2023-10--2026-10
( 4 ) 人工智能音视频伪造技术风险评估研究, 参与, 国家任务, 2022-01--2024-12