基本信息
黎塔  男  博导  中国科学院声学研究所
电子邮件: lita@hccl.ioa.ac.cn
通信地址: 北京市北四环西路21号
邮政编码:

招生信息

   
招生专业
081002-信号与信息处理
招生方向
语音信号处理,语音识别

教育背景

2005-09--2010-07   中国科学院声学研究所   博士
1999-09--2003-07   南京大学   本科学历,学士

工作经历

   
工作简历
2018-07~现在, 中国科学院声学研究所, 研究员
2012-12~2018-06,中国科学院声学研究所, 副研究员
2010-07~2012-12,中国科学院声学研究所, 助理研究员

专利与奖励

   
奖励信息
(1) 北京市科技进步奖, 二等奖, 省级, 2019
(2) 中国科学院杰出成就奖, 特等奖, 院级, 2014
专利成果
[1] 颜永红, 王寻, 张鹏远, 黎塔, 周军. 一种基础心音识别方法及设备. CN: CN111938691B, 2022-03-18.

[2] 程高峰, 杨润延, 黎塔, 张鹏远, 颜永红. 一种语音关键词检索方法、系统和电子装置. CN: CN113192535A, 2021-07-30.

[3] 赵江江, 李昭奇, 任玉玲, 李青龙, 黎塔, 颜永红. 语音关键词识别方法和装置. CN: CN111798840A, 2020-10-20.

[4] 黎塔, 邬龙, 张鹏远, 颜永红. 一种端到端远场语音识别方法及系统. CN: CN111179920A, 2020-05-19.

[5] 黎塔, 张震, 程高峰, 万辛, 颜永红. 一种基于无网格最大互信息准则的神经网络训练加速方法. CN: CN108629412A, 2018-10-09.

[6] 张鹏远, 张一珂, 黎塔, 颜永红. 一种基于统计规律的中文词汇表未登录词比率的估计方法. CN: CN108109624A, 2018-06-01.

出版信息

   
发表论文
(1) 基于wav2vec预训练的样例关键词识别, Query-by-Example with Acoustic Word Embeddings Using wav2vec Pretraining, 计算机科学, 2022, 通讯作者
(2) Neural keyword confidence estimation for open-vocabulary keyword spotting, ELECTRONICS LETTERS, 2022, 通讯作者
(3) 基于对抗训练的端到端语音翻译研究, 信号处理, 2021, 第 3 作者
(4) Keyword search using attention-based end-to-end ASR and framesynchronous phoneme alignments, IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP), 2021, 第 4 作者
(5) Improves Neural Acoustic Word Embeddings Query by Example Spoken Term Detection with Wav2vec Pretraining and Circle Loss, iscslp2021, 2021, 通讯作者
(6) RNN-T BASED OPEN-VOCABULARY KEYWORD SPOTTING IN MANDARIN WITH MULTI-LEVEL DETECTION, 2021 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP 2021), 2021, 第 2 作者
(7) Semantic Features Based N-Best Rescoring Methods for Automatic Speech Recognition, APPLIED SCIENCES-BASEL, 2019, 通讯作者
(8) 基于多时间尺度的深层说话人特征提取研究, 网络新媒体技术, 2019, 通讯作者
(9) Improving Hybrid CTC/Attention Architecture with Time-Restricted Self-Attention CTC for End-to-End Speech Recognition, Applied Sciences, 2019, 第 2 作者
(10) Improving Hybrid CTC/Attention Architecture with Time-Restricted Self-Attention CTC for End-to-End Speech Recognition, APPLIED SCIENCES-BASEL, 2019, 通讯作者
(11) Space-Time Residual LSTM Architechture for Distant Speech Recognition, 2018 11TH INTERNATIONAL SYMPOSIUM ON CHINESE SPOKEN LANGUAGE PROCESSING (ISCSLP), 2018, 第 4 作者
(12) 电话交谈语音识别中基于LSTM-DNN语言模型的重评估方法研究, Revaluation based on LSTM-DNN language model in telephone conversation speech recognition, 重庆邮电大学学报. 自然科学版, 2016, 第 3 作者
(13) Improved Mandarin Spoken Term Detection by Using Deep Neural Network for Keyword Verification, 2014 10TH INTERNATIONAL CONFERENCE ON NATURAL COMPUTATION (ICNC), 2014, 第 2 作者
(14) Speeding up Deep Neural Networks for Speech Recognition on ARM Cortex-A Series Processors, 2014 10TH INTERNATIONAL CONFERENCE ON NATURAL COMPUTATION (ICNC), 2014, 第 3 作者
(15) A Prefix Tree Based n-best List Re-scoring Strategy for Recurrent Neural Network Language Model, CHINESE JOURNAL OF ELECTRONICS, 2014, 第 2 作者
(16) Enhanced Out of Vocabulary Word Detection Using Local Acoustic Information, 2014 TENTH INTERNATIONAL CONFERENCE ON INTELLIGENT INFORMATION HIDING AND MULTIMEDIA SIGNAL PROCESSING (IIH-MSP 2014), 2014, 第 2 作者
(17) Prefix Tree based N-best list Re-scoring for Recurrent Neural Network Language Model used in Speech Recognition System, 14TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2013), VOLS 1-5, 2013, 第 3 作者
(18) 利用二重打分方法的激活词语音识别, 声学技术, 2013, 第 2 作者
(19) 嵌入式语音识别中一种高效的图搜索算法, 东南大学学报:自然科学版, 2009, 第 1 作者

科研活动

   
科研项目
( 1 ) 面向多语言层次化和结构化的声学模型建模方法与系统集成, 参与, 国家级, 2016-01--2020-12
( 2 ) 语音信号技术合作项目, 主持, 院级, 2019-06--2020-06
( 3 ) 客服机器人质检分析, 主持, 院级, 2019-08--2024-12
( 4 ) 基于领域先验的汉语语音识别结果纠错技术研究, 主持, 市地级, 2016-12--2020-12