基本信息

黎塔 男 博导 中国科学院声学研究所
电子邮件: lita@hccl.ioa.ac.cn
通信地址: 北京市北四环西路21号
邮政编码:
电子邮件: lita@hccl.ioa.ac.cn
通信地址: 北京市北四环西路21号
邮政编码:
招生信息
招生专业
081002-信号与信息处理
招生方向
语音信号处理,语音识别
教育背景
2005-09--2010-07 中国科学院声学研究所 博士1999-09--2003-07 南京大学 本科学历,学士
工作经历
工作简历
2018-07~现在, 中国科学院声学研究所, 研究员2012-12~2018-06,中国科学院声学研究所, 副研究员2010-07~2012-12,中国科学院声学研究所, 助理研究员
专利与奖励
奖励信息
(1) 北京市科技进步奖, 二等奖, 省级, 2019(2) 中国科学院杰出成就奖, 特等奖, 院级, 2014
专利成果
[1] 颜永红, 王寻, 张鹏远, 黎塔, 周军. 一种基础心音识别方法及设备. CN: CN111938691B, 2022-03-18.[2] 程高峰, 杨润延, 黎塔, 张鹏远, 颜永红. 一种语音关键词检索方法、系统和电子装置. CN: CN113192535A, 2021-07-30.[3] 赵江江, 李昭奇, 任玉玲, 李青龙, 黎塔, 颜永红. 语音关键词识别方法和装置. CN: CN111798840A, 2020-10-20.[4] 黎塔, 邬龙, 张鹏远, 颜永红. 一种端到端远场语音识别方法及系统. CN: CN111179920A, 2020-05-19.[5] 黎塔, 张震, 程高峰, 万辛, 颜永红. 一种基于无网格最大互信息准则的神经网络训练加速方法. CN: CN108629412A, 2018-10-09.[6] 张鹏远, 张一珂, 黎塔, 颜永红. 一种基于统计规律的中文词汇表未登录词比率的估计方法. CN: CN108109624A, 2018-06-01.
出版信息
发表论文
(1) 基于wav2vec预训练的样例关键词识别, Query-by-Example with Acoustic Word Embeddings Using wav2vec Pretraining, 计算机科学, 2022, 通讯作者(2) Neural keyword confidence estimation for open-vocabulary keyword spotting, ELECTRONICS LETTERS, 2022, 通讯作者(3) 基于对抗训练的端到端语音翻译研究, 信号处理, 2021, 第 3 作者(4) Keyword search using attention-based end-to-end ASR and framesynchronous phoneme alignments, IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP), 2021, 第 4 作者(5) Improves Neural Acoustic Word Embeddings Query by Example Spoken Term Detection with Wav2vec Pretraining and Circle Loss, iscslp2021, 2021, 通讯作者(6) RNN-T BASED OPEN-VOCABULARY KEYWORD SPOTTING IN MANDARIN WITH MULTI-LEVEL DETECTION, 2021 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP 2021), 2021, 第 2 作者(7) Semantic Features Based N-Best Rescoring Methods for Automatic Speech Recognition, APPLIED SCIENCES-BASEL, 2019, 通讯作者(8) 基于多时间尺度的深层说话人特征提取研究, 网络新媒体技术, 2019, 通讯作者(9) Improving Hybrid CTC/Attention Architecture with Time-Restricted Self-Attention CTC for End-to-End Speech Recognition, Applied Sciences, 2019, 第 2 作者(10) Improving Hybrid CTC/Attention Architecture with Time-Restricted Self-Attention CTC for End-to-End Speech Recognition, APPLIED SCIENCES-BASEL, 2019, 通讯作者(11) Space-Time Residual LSTM Architechture for Distant Speech Recognition, 2018 11TH INTERNATIONAL SYMPOSIUM ON CHINESE SPOKEN LANGUAGE PROCESSING (ISCSLP), 2018, 第 4 作者(12) 电话交谈语音识别中基于LSTM-DNN语言模型的重评估方法研究, Revaluation based on LSTM-DNN language model in telephone conversation speech recognition, 重庆邮电大学学报. 自然科学版, 2016, 第 3 作者(13) Improved Mandarin Spoken Term Detection by Using Deep Neural Network for Keyword Verification, 2014 10TH INTERNATIONAL CONFERENCE ON NATURAL COMPUTATION (ICNC), 2014, 第 2 作者(14) Speeding up Deep Neural Networks for Speech Recognition on ARM Cortex-A Series Processors, 2014 10TH INTERNATIONAL CONFERENCE ON NATURAL COMPUTATION (ICNC), 2014, 第 3 作者(15) A Prefix Tree Based n-best List Re-scoring Strategy for Recurrent Neural Network Language Model, CHINESE JOURNAL OF ELECTRONICS, 2014, 第 2 作者(16) Enhanced Out of Vocabulary Word Detection Using Local Acoustic Information, 2014 TENTH INTERNATIONAL CONFERENCE ON INTELLIGENT INFORMATION HIDING AND MULTIMEDIA SIGNAL PROCESSING (IIH-MSP 2014), 2014, 第 2 作者(17) Prefix Tree based N-best list Re-scoring for Recurrent Neural Network Language Model used in Speech Recognition System, 14TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2013), VOLS 1-5, 2013, 第 3 作者(18) 利用二重打分方法的激活词语音识别, 声学技术, 2013, 第 2 作者(19) 嵌入式语音识别中一种高效的图搜索算法, 东南大学学报:自然科学版, 2009, 第 1 作者
科研活动
科研项目
( 1 ) 面向多语言层次化和结构化的声学模型建模方法与系统集成, 参与, 国家级, 2016-01--2020-12( 2 ) 语音信号技术合作项目, 主持, 院级, 2019-06--2020-06( 3 ) 客服机器人质检分析, 主持, 院级, 2019-08--2024-12( 4 ) 基于领域先验的汉语语音识别结果纠错技术研究, 主持, 市地级, 2016-12--2020-12