
许家铭 男 副研究员 硕导 中国科学院自动化研究所
电子邮件: jiaming.xu@ia.ac.cn
通信地址: 北京市海淀区中关村东路95号智能化大厦808室
邮政编码:100190
听觉模型与认知计算团队招收硕博生、博士后、工程师、实习生,欢迎联系。
团队Github: https://github.com/aispeech-lab
(注:本团队2021年硕博生招生名额已满,感谢关注 - 2020.08.25)
研究领域
研究方向围绕智能语音交互系统中语音识别抗噪差和语言理解能力低的两大痛点问题展开,具体如下:
1. 多模态协同感知
2. 语音与语言处理
3. 语音分离与识别
4. 智能问答与对话
在相关领域发表论文40余篇,包括AAAI, IJCAI, NeurIPS, ACL, EMNLP, ECML-PKDD, COLING, ICASSP, INTERSPEECH和Neural Networks等国际会议和期刊。相关研究得到科技部、国家自然科学基金、北京市科委、中国科学院等项目经费支持,并与国内外多家科研院所和企业开展合作研究。
招生信息
招生专业
招生方向
多模态协同感知
语音与语言处理
欢迎对智能语音交互感兴趣的同学加入团队,共同探索听觉、语言感知与理解过程中的关键科学问题和技术问题。
教育背景
工作经历
工作简历
2016-02~2018-10,中国科学院自动化研究所, 助理研究员
社会兼职
2020-10~今, 中国计算机学会, 语音对话与听觉专委会, 委员
2017-12~今, 中文信息学会, 青年工作委员会, 委员
2020-10~今, 人工智能学会, 青年工作委员会, 委员
AAAI, ACL, ICONIP等程序委员会委员
IEEE TNNLS, Neural Networks, EMNLP, COLING, ICASSP, INTERSPEECH等国际会议和期刊审稿人
专利与奖励
奖励信息
(2) IBM PowerAI2017 Q3: AI马拉松编程, 二等奖, 其他, 2017
(3) NLPCC2016 Shared Task: 基于文档的开放域自动问答评测, 二等奖, 其他, 2016
(4) NDBC2015 Cup: 短文本语义相关度计算, 三等奖, 其他, 2015
(5) JIST2015 Challenge: 基于链接数据的实体类型预测, 二等奖, 其他, 2015
专利成果
( 2 ) 一种基于层次卷积网络的实体与段落链接方法, 发明, 2018, 第 3 作者, 专利号: ZL201510372795.3
( 3 ) 一种基于深度语义特征学习的短文本聚类方法, 发明, 2018, 第 2 作者, 专利号: ZL201510270028.1
( 4 ) 一种基于多粒度主题模型的短文本哈希学习方法, 发明, 2018, 第 2 作者, 专利号: ZL201410729347.X
( 5 ) 一种基于层次化记忆网络的问答方法, 发明, 2019, 第 1 作者, 专利号: ZL201610447676.4
( 6 ) Auditory Selection Method and Device based on Memory and Attention Model, 发明, 2020, 第 1 作者, 专利号: US 16/632,373
( 7 ) 基于记忆和注意力模型的听觉选择方法和装置, 发明, 2017, 第 1 作者, 专利号: 201711127669.7
( 8 ) 基于物理环境博弈的自主进化智能对话方法、系统、装置, 发明, 2019, 第 1 作者, 专利号: 201910014369.0
( 9 ) 基于有监督学习听觉注意的语音提取方法、系统、装置, 发明, 2018, 第 1 作者, 专利号: 201811558212.6
( 10 ) 语音增强方法、装置、存储介质、电子设备, 发明, 2019, 第 2 作者, 专利号: 201910663257.8
( 11 ) 语音增强方法、装置、存储介质、电子设备, 发明, 2019, 第 1 作者, 专利号: 201910631894.7
( 12 ) 语音发出者身份识别方法、装置、计算机设备及存储介质, 发明, 2019, 第 2 作者, 专利号: 201910766157.8
( 13 ) 会议纪要生成方法、装置、计算机设备及存储介质, 发明, 2019, 第 1 作者, 专利号: 201910766155.9
( 14 ) 视觉声纹辅助的语音分离方法及装置, 发明, 2019, 第 1 作者, 专利号: 201911252373.7
( 15 ) 基于人工智能的视觉对话方法、装置及电子设备, 发明, 2019, 第 3 作者, 专利号: 201911294260.3
( 16 ) 记忆为核心的智能问答方法及系统, 发明, 2020, 第 3 作者, 专利号: 202010792981.3
出版信息
发表著作
(1) 许家铭, 石晶, 徐波. 听觉系统与鸡尾酒会问题, The Auditory System at the Cocktail Party, 机械工业出版社, 2020-12, 第 1 作者
发表论文 [Google Scholar]
(26) Chenxing Li, Jiaming Xu, Nima Mesgarani, Bo Xu. Speaker and Direction Inferred Dual-Channel Speech Separation, ICASSP, 2021
(25) Yunzhe Hao, Jiaming Xu, Bo Xu. WASE: Learning When to Attend for Speaker Extraction in Cocktail Party Environments, ICASSP, 2021
(24) Yunzhe Hao, Jiaming Xu, Jing Shi, Peng Zhang, Lei Qin, Bo Xu. A Unified Framework for Low-Latency Speaker Extraction in Cocktail Party Environments, INTERSPEECH, 2020, 通讯作者
(23) Jing Shi, Jiaming Xu, Yusuke Fujita, Shinji Watanabe, Bo Xu. Speaker-Conditional Chain Model for Speech Separation and Extraction, INTERSPEECH, 2020, 第 2 作者
(22) Jing Shi, Xuankai Chang, Pengcheng Guo, Shinji Watanabe, Yusuke Fujita, Jiaming Xu, Bo Xu, Lei Xie. Sequence to Multi-Sequence Learning via Conditional Chain Mapping for Mixture Signals, NeurIPS, 2020, 其他作者
(21) Feilong Chen, Fandong Meng, Jiaming Xu, Peng Li, Bo Xu, Jie Zhou. DMRM: A Dual-channel Multi-hop Reasoning Model for Visual Dialog, AAAI, 2020, 通讯作者
(20) Xiang Cheng, Yunzhe Hao, Jiaming Xu, Bo Xu. LISNN: Improving Spiking Neural Networks with Lateral Interactions for Robust Object Recognition, IJCAI, 2020, 通讯作者
(19) Jing Shi, Jiaming Xu, Yiqun Yao, Bo Xu. Concept Learning through Deep Reinforcement Learning with Memory-Augmented Neural Networks, Neural Networks, 2019, 第 2 作者
(18) 黄雅婷, 石晶, 许家铭, 徐波. 鸡尾酒会问题与相关听觉模型的研究现状与展望, Research Advances and Perspectives on the Cocktail Party Problem and Related Auditory Models, 自动化学报, 2019, 通讯作者
(17) Yiqun Yao, Jiaming Xu, Bo Xu. The World in My Mind: Visual Dialog with Adversarial Multi-modal Feature Encoding, NAACL, 2019, 第 2 作者(16) Xiuyi Chen, Jiaming Xu, Bo Xu. A Working Memory Model for Task-oriented Dialog Response Generation, ACL, 2019, 第 2 作者
(15) 刘广灿, 曹宇, 许家铭, 徐波. 基于对抗正则化的自然语言推理, Natural Language Inference Based on Adversarial Regularization, 自动化学报, 2019, 通讯作者
(14) Jing Shi, Jiaming Xu, Bo Xu. Which Ones Are Speaking? Speaker-inferred Model for Multi-talker Speech Separation, INTERSPEECH, 2019, 第 2 作者
(13) Jiaming Xu, Jing Shi, Guangcan Liu, Xiuyi Chen, Bo Xu. Modeling Attention and Memory for Auditory Selection in a Cocktail Party Environment, AAAI, 2018, 第 1 作者
(12) Jing Shi, Jiaming Xu#, Guangcan Liu, Bo Xu. Listen, Think and Listen Again: Capturing Top-down Auditory Attention for Speaker-independent Speech Separation, IJCAI, 2018, 共同 1 作
(11) Yiqun Yao, Jiaming Xu, Jing Shi, Bo Xu. Learning to Activate Logic Rules for Textual Reasoning, Neural Networks, 2018, 第 2 作者
(10) Yiqun Yao, Jiaming Xu, Feng Wang, Bo Xu. Cascaded Mutual Modulation for Visual Reasoning, EMNLP, 2018, 第 2 作者
(9) Peng Zhou, Jiaming Xu, Zhenyu Qi, Hongyun Bao, Zhineng Chen, Bo Xu. Distant Supervision for Relation Extraction with Hierarchical Selective Attention, Neural Networks, 2018, 第 2 作者
(8) Jiaming Xu, Bo Xu, Peng Wang, Suncong Zheng, Guanhua Tian, Jun Zhao, Bo Xu. Self-Taught Convolutional Neural Networks for Short Text Clustering, Neural Networks, 2017, 第 1 作者
(7) Peng Wang, Bo Xu, Jiaming Xu, Guanhua Tian, Chenglin Liu, Hongwei Hao. Semantic Expansion using Word Embedding Clustering and Convolutional Neural Network for Improving Short Text Classification, Neurocomputing, 2016, 其他作者
(6) Suncong Zheng, Jiaming Xu, Hongyun Bao, Zhenyu Qi, Jie Zhang, Hongwei Hao, Bo Xu. Joint Learning of Entity Semantics and Relation Pattern for Relation Extraction, ECML, 2016, 通讯作者
(5) Peng Zhou, Zhenyu Qi, Suncong Zheng, Jiaming Xu, Hongyun Bao, Bo Xu. Text Classification Improved by Integrating Bidirectional LSTM with Two-dimensional Max Pooling, COLING, 2016, 其他作者
(4) Jiaming Xu, Jing Shi, Yiqun Yao, Suncong Zheng, Bo Xu, Bo Xu. Hierarchical Memory Networks for Answer Selection on Unknown Words, COLING, 2016, 第 1 作者
(3) Suncong Zheng, Jiaming Xu, Peng Zhou, Hongyun Bao, Zhenyu Qi, Bo Xu. A Neural Network Framework for Relation Extraction: Learning Entity Semantic and Relation Pattern, Knowledge-Based Systems, 2016, 第 2 作者
(2) Jiaming Xu, Peng Wang, Guanhua Tian, Bo Xu, Jun Zhao, Fangyuan Wang, Hongwei Hao. Convolutional Neural Networks for Text Hashing, IJCAI, 2015, 第 1 作者
(1) Peng Wang, Jiaming Xu, Bo Xu, Chenglin Liu, Heng Zhang, Fangyuan Wang, Hongwei Hao. Semantic Clustering and Convolutional Neural Network for Short Text Categorization, ACL, 2015, 第 2 作者