刘建-中国科学院大学-UCAS

研究领域

嵌入式语音识别、语音信号处理、音频水印

招生信息

招收硕士研究生和工程硕士研究生

招生专业

081002-信号与信息处理

招生方向

语音识别
语音信号处理

教育背景

1993-08--1999-07 中科院声学所理学博士
1988-09--1993-07 中国科学技术大学工学学士

学历

1996--1999 中国科学院声学研究所博士
1993--1996 中国科学院声学研究所硕士
1988--1993 中国科学技术大学学士

工作经历

工作经历
4/2002 ~ now 2002年加入中国科学院声学研究所，现任研究员；主要研究方向包括语音信号处理、语音识别、数字音频水印技术等，发表文章近20篇，完成专利申请10余个，获得软件著作权7项
7/1999 ~ 4/2002 1999年博士毕业后，加入英特尔中国研究中心，在语音组任高级研究员；并于199年和2000年由于表现优异，曾两次荣获英特尔公司微处理器实验室Division Recognition Award ；2001年任语音平台组部门经理

专利与奖励

专利成果

[1] 周军, 张震, 李成章, 李鹏, 刘建, 石瑾, 刘睿霖, 颜永红. 文本处理模型训练方法、语音文本处理方法及装置. CN: CN113420121B, 2023-07-28.
[2] 周军, 张震, 李成章, 李鹏, 刘建, 石瑾, 刘睿霖, 颜永红. 文本处理模型训练方法、语音文本处理方法及装置. CN: CN113420121A, 2021-09-21.
[3] 张学君, 张震, 王晗, 李鹏, 刘建, 石瑾, 刘睿霖, 颜永红. 语言模型的训练方法、NLP任务处理方法及装置. CN: CN113420123A, 2021-09-21.
[4] 高圣翔, 黄远, 杨晶超, 孙晓晨, 沈亮, 林格平, 刘发强, 胡琦, 刘建, 颜永红. 基于深度递归非负矩阵分解的音频场景分类方法及系统. CN: CN112712096A, 2021-04-27.
[5] 李超, 王佩, 张学帅, 邹学强, 刘建, 徐杰, 胡琦. 一种基于变速模板的音频样例检索方法. CN: CN111382302B, 2023-08-11.
[6] 李超, 张学帅, 邹学强, 刘建, 王中华, 胡琦. 一种基于指纹权重的音频样例检索方法. CN: CN111382303A, 2020-07-07.
[7] 李超, 王佩, 张学帅, 邹学强, 刘建, 徐杰, 胡琦. 一种基于变速模板的音频样例检索方法. CN: CN111382302A, 2020-07-07.
[8] 石光, 胡琦, 李超, 张学帅, 徐杰, 邹学强, 刘建. 一种用于音频检索的模板自动清洗方法及系统. CN: CN111354352B, 2023-07-14.
[9] 石光, 胡琦, 李超, 张学帅, 徐杰, 邹学强, 刘建. 一种用于音频检索的模板自动清洗方法及系统. CN: CN111354352A, 2020-06-30.
[10] 白海钏, 计哲, 高圣翔, 颜永红, 刘建, 周若华. 基于遗传算法优化模型参数的音频带宽扩展方法及系统. CN: CN109599123A, 2019-04-09.
[11] 王丽, 张鹏远, 刘建, 颜永红. 一种拼音拼读的发音质量评测系统. CN: CN106856095A, 2017-06-16.
[12] 颜永红, 陈梦喆, 潘接林, 刘建. 一种基于深度神经网络的自动语音叠音检测方法. CN: CN106611604A, 2017-05-03.
[13] 颜永红, 郭宇弘, 赵学敏, 刘建. 一种在音频中嵌入和解出水印的方法和装置. CN: CN103077724A, 2013-05-01.
[14] 周若华, 颜永红, 王宪亮, 刘建. 一种基于共有鉴别性子空间映射的语种识别方法及装置. CN: CN103077709A, 2013-05-01.
[15] 颜永红, 赵学敏, 郭宇弘, 刘建. 一种用于版权管理的数字音频水印算法. CN: CN102074240A, 2011-05-25.
[16] 颜永红, 潘接林, 刘建, 李明, 曹川. 基于音频频谱特征分析的演唱音色明亮度客观评测方法. CN: CN101650941A, 2010-02-17.
[17] 颜永红, 潘接林, 刘建, 李明, 曹川. 基于音频频谱特征分析的演唱音色纯净度的客观评测方法. CN: CN101650940A, 2010-02-17.
[18] 颜永红, 吴晓, 李明, 刘建, 潘接林. 一种单音旋律曲线的匹配方法. CN: CN101447186A, 2009-06-03.
[19] 颜永红, 李明, 曹川, 刘建, 潘接林. 一种演唱的评分系统和方法. CN: CN101430876A, 2009-05-13.
[20] 李明, 刘建, 颜永红. 一种基于能量的音符切分方法. CN: CN1963919A, 2007-05-16.
[21] 庹凌云, 余洪涌, 刘建, 颜永红. 一种目录搜索方法及相关的系统. CN: CN1892647A, 2007-01-10.
[22] 雷赟, 刘建, 颜永红. 一种自同步的音频水印方法. CN: CN1848829A, 2006-10-18.
[23] 杜云峰, 刘建. 一种基于变换域的数字音频混合方法. CN: CN1770256A, 2006-05-10.
[24] 刘建, 赵庆卫, 颜永红, 邵健. 一种基于语音识别及语音分析的发音评估方法. CN: CN1750121A, 2006-03-22.
[25] 程晓斌, 李晓东, 刘建, 颜永红. 一种自适应谷点降噪方法及系统. CN: CN1700306A, 2005-11-23.
[26] 程晓斌, 李晓东, 刘建, 颜永红. 子带自适应谷点降噪系统和方法. CN: CN1700305A, 2005-11-23.
[27] 韩疆, 庹凌云, 潘接林, 刘建, 颜永红, 王俊杰. 一种语音识别中的并行搜索方法. 中国: CN1201285, 2005-05-11.
[28] 刘建, 颜永红, 庹凌云, 孙宝海, 潘接林, 韩疆, 苗路广. 一种便携式数字移动通讯设备及其语音控制方法和系统. CN: CN1703923A, 2005-11-30.
[29] 李明, 刘建, 汪俊杰, 庹凌云, 颜永红, 孙宝海. 一种基于数字信号处理的语音变声方法. CN: CN1248191C, 2006-03-29.
[30] 潘接林, 韩疆, 刘建, 颜永红, 庹凌云, 张建平. 语音识别系统及用于语音识别系统的特征矢量集的压缩方法. CN: CN1190773C, 2005-02-23.
[31] 潘接林, 韩疆, 刘建, 颜永红, 庹凌云, 张建平. 语音识别系统及用于语音识别系统的特征矢量集的压缩方法. CN: CN1455389A, 2003-11-12.
[32] 张建平, 颜永红, 潘接林, 韩疆, 刘建. 一种对话交互前端的回声消除和语音检测方法及装置. 中国: CN1491018, 2004-04-21.
[33] 潘接林, 韩疆, 刘建, 颜永红, 庹凌云, 张建平. 一种语音识别系统. 中国: CN1284134, 2006-11-08.
[34] 韩疆, 刘建, 潘接林, 颜永红, 庹凌云, 张建平. 语音识别置信度评价方法和系统及应用该方法的听写装置. CN: CN1223985C, 2005-10-19.
[35] 刘建, 汪俊杰, 颜永红, 张建平. 一种嵌入式语音合成方法及系统. CN: CN1455386A, 2003-11-12.

出版信息

发表论文

[1] 杨润延, 程高峰, 刘建. 基于端到端语音识别的关键词检索技术研究. 计算机科学[J]. 2022, 49(1): 53-58, http://lib.cqvip.com/Qikan/Article/Detail?id=7106430422.
[2] 何文龙, 高长丰, 黎塔, 刘建. 基于对抗训练的端到端语音翻译研究. 信号处理[J]. 2021, 37(5): 893-901, http://lib.cqvip.com/Qikan/Article/Detail?id=7104751012.
[3] Yao Haitao, Xu Ji, Liu Jian, IEEE. Multi-Lingual Unsupervised Acoustic Modeling Using Multi-Task Deep Neural Network under Mismatch Conditions. PROCEEDINGS OF 2016 8TH IEEE INTERNATIONAL CONFERENCE ON COMMUNICATION SOFTWARE AND NETWORKS (ICCSN 2016)null. 2016, 139-144, [4] Zhao, Xuemin, Guo, Yuhong, Liu, Jian, Yan, Yonghong, Fu, Qiang. Logarithmic Adaptive Quantization Projection for Audio Watermarking. IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS[J]. 2012, E95D(5): 1436-1445, https://www.webofscience.com/wos/woscc/full-record/WOS:000304573100028.
[5] Cao, Chuan, Li, Ming, Wu, Xiao, Suo, Hongbin, Liu, Jian, Yan, Yonghong. Automatic Singing Performance Evaluation for Untrained Singers. IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS[J]. 2009, E92D(8): 1596-1600, https://www.webofscience.com/wos/woscc/full-record/WOS:000269648000014.
[6] Cao Chuan, Li Ming, Liu Jian, Yan Yonghong, ISCAINST SPEECH COMMUNICATION ASSOC. An Objective Singing Evaluation Approach by Relating Acoustic Measurements to Perceptual Ratings. INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5null. 2008, 2058-2061, http://apps.webofknowledge.com/CitedFullRecord.do?product=UA&colName=WOS&SID=5CCFccWmJJRAuMzNPjj&search_mode=CitedFullRecord&isickref=WOS:000277026101089.
[7] Cao Chuan, Li Ming, Liu Jian, Yan Yonghong, Yuan BZ, Ruan QQ, Tang XF. A Study on Singing Performance Evaluation Criteria for Untrained Singers. ICSP: 2008 9TH INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING, VOLS 1-5, PROCEEDINGSnull. 2008, 1476-1479, http://apps.webofknowledge.com/CitedFullRecord.do?product=UA&colName=WOS&SID=5CCFccWmJJRAuMzNPjj&search_mode=CitedFullRecord&isickref=WOS:000270665400355.
[8] 颜永红, 雷赟, 刘建, 严波. 窄带的自同步音频水印算法. 计算机学报[J]. 2008, 31(7): 1283-1290, http://lib.cqvip.com/Qikan/Article/Detail?id=27675996.
[9] Li Ming, Lei Yun, Liu Jian, Yan Yonghong, Fang WC, Pan JS, Shieh CS, Huang HC. A novel audio watermarking in wavelet domain. IIH-MSP: 2006 INTERNATIONAL CONFERENCE ON INTELLIGENT INFORMATION HIDING AND MULTIMEDIA SIGNAL PROCESSING, PROCEEDINGSnull. 2006, 27-+, http://apps.webofknowledge.com/CitedFullRecord.do?product=UA&colName=WOS&SID=5CCFccWmJJRAuMzNPjj&search_mode=CitedFullRecord&isickref=WOS:000244122100007.
[10] 韩疆, 刘晓星, 潘接林, 张建平, 颜永红, 张鹏远, 吕萍, 刘建. 一种网络信息安全中的语音关键词检测系统. 2004, http://kns.cnki.net/KCMS/detail/detail.aspx?QueryID=0&CurRec=98&recid=&FileName=ZGTH200408003017&DbName=CPFD9908&DbCode=CPFD&yx=&pr=&URLID=&bsm=.