基本信息

宗成庆 中科院自动化研究所研究员,博士生导师
电子邮件:cqzong@nlpr.ia.ac.cn
通信地址:北京市海淀区中关村东路95号 中科院自动化所 
邮政编码:100190

研究领域

自然语言处理,机器翻译,文本数据挖掘,人机对话系统等

招生信息

招收计算机相关专业的博士生和硕士研究生。

招生专业
081203-计算机应用技术
081104-模式识别与智能系统
招生方向
自然语言处理
机器翻译
文本分类,网络内容理解

教育背景

1995-03--1998-03   中国科学院计算技术研究所   博士
出国学习工作

2004年10月至2005年至2月,在法国信息数学与应用研究院(IMAG)做短期高访。

1999年和2001年两次在日本国际电气通信基础技术研究所(ATR)做客座研究员。

工作经历

1990.7 ~ 1995.3 山东工业大学计算机系,讲师

1998.5 ~ 2000.4 中国科学院自动化研究所,博士后

2000.4 ~ 2004.6 中国科学院自动化研究所,副研究员

2004.6 至今         中国科学院自动化研究所,研究员,博士生导师


社会兼职
2017-11-27-2017-12-01,第8届自然语言处理联合学术会议(IJCNLP), 大会主席
2017-08-18-2017-08-24,第26届国际人工智能联合会议(IJCAI), 领域主席
2017-07-20-2017-07-21,中国人工智能大会(CCAI'2017), “语言智能与应用”论坛主席
2017-01-01-今,中国中文信息学会, 副理事长
2016-12-31-今,亚洲自然语言处理联合会(AFNLP), 副主席
2016-08-23-2016-08-24,中国人工智能大会(CCAI'2016), 程序委员会共同主席
2015-07-26-2015-07-30,第53届国际计算语言学学会年会(ACL)和第7届亚洲自然语言处理联合学术会议(IJCNLP), 程序委员会共同主席(PC Co-Chair)
2014-12-31-2016-12-30,亚洲自然语言处理联合会(AFNLP), 秘书长
2014-01-01-今,《自动化学报》, 副主编
2014-01-01-2015-12-31,国际计算语言学学会汉语特别兴趣组(SIGHAN), 主席
2013-01-01-今,国际计算语言学委员会(ICCL), 委员
2012-01-01-今,Machine Translation, 编委
2011-10-29-2016-12-31,中国中文信息学会, 常务理事
2010-06-30-今,ACM Transactions on Asian Language Information Processing, 副主编(Associate Editor)
2010-01-01-今,Journal of Computer Science and Technology, 编委
2009-10-15-今,北京大学计算语言学教育部重点实验室学术委员会, 副主任
2009-07-31-今,IEEE Intelligent Systems, 编委
2008-07-31-今,国家自然科学基金委员会重大研究计划“视听觉信息的认知计算”指导专家组, 成员
2005-10-31-今,中国人工智能学会, 理事

教授课程

自然语言处理
文本数据挖掘
自然语言理解

专利与奖励

   
奖励信息
(1) 国家科学技术进步奖, 二等奖, 国家级, 2015
(2) 中国中文信息学会“钱伟长中文信息处理科学技术奖”, 一等奖, 部委级, 2014
(3) 中国电子学会科技进步奖, 一等奖, 部委级, 2014
(4) 国务院政府特殊津贴, , 国家级, 2012
(5) 中国学科院“朱李月华优秀教师”奖, , 院级, 2010
(6) 第23届亚太地区语言、信息与计算国际会议(PACLIC)最佳论文奖, , 其他, 2009
(7) 中国科学院研究生院集中教学突出贡献奖, , 研究所(学校), 2008
(8) 中国科学院王宽诚博士后工作奖励基金, , 院级, 1998
专利成果
( 1 ) 口语会话中句子边界识别方法, 发明, 2006, 第 1 作者, 专利号: ZL031475
( 2 ) 一种新的面向文本分类的特征向量权重的方法及装置, 发明, 2007, 第 1 作者, 专利号: ZL200410
( 3 ) 一种基于标点处理的层次化汉语长句句法分析方法及装置, 发明, 2008, 第 1 作者, 专利号: ZL200510
( 4 ) 一种新的汉语口语解析方法及装置, 发明, 2008, 第 1 作者, 专利号: ZL200510109335.8
( 5 ) 基于概率主题词的两级组合文本分类方法, 发明, 2009, 第 1 作者, 专利号: ZL200610011747.2
( 6 ) 一种基于语块的中文机构名翻译方法及装置, 发明, 2011, 第 1 作者, 专利号: ZL200610011923.2
( 7 ) 一种拼音和汉字相结合的汉外口语自动翻译方法, 发明, 2011, 第 2 作者, 专利号: ZL200910244513.6
( 8 ) 一种汉英短语翻译对自动抽取与过虑方法, 发明, 2010, 第 1 作者, 专利号: ZL 2008 0055782.3
( 9 ) 一种汉英词语自动对齐方法, 发明, 2011, 第 1 作者, 专利号: ZL 2008 1 0055783.8
( 10 ) 一种基于依存连贯性约束的双语词语自动对齐方法, 发明, 2015, 第 1 作者, 专利号: CN102708098B
( 11 ) 一种基于谓词论元结构的统计机器翻译方法, 发明, 2015, 第 1 作者, 专利号: CN103020045B
( 12 ) 构建树结构及基于树结构的机器翻译系统的方法, 发明, 2014, 第 1 作者, 专利号: ZL201210068782.3
( 13 ) 一种基于模糊树到精确树的统计机器翻译方法, 发明, 2016, 第 1 作者, 专利号: CN102117270B
( 14 ) 一种双语联合语义角色的标注方法, 发明, 2016, 第 1 作者, 专利号: CN101908042B

出版信息

主要包括学术论文和专著。

发表论文
(1) Towards Zero Unknown Word in Neural Machine Translation, In Proceedings of the 25th International Joint Conference on Artificial Intelligence (IJCAI'16), 2016, 第 3 作者
(2) Learning Generalized Features for Semantic Role Labeling, ACM Transactions on Asian Language and Low-Resource Language Information Processing (TALLIP), 2016, 第 2 作者
(3) Bilingual Semantic Role Labeling Inference via Dual Decomposition, ACM Transactions on Asian Language and Low-Resource Language Information Processing (TALLIP), 2015, 第 3 作者
(4) Exploring Diverse Features for Statistical Machine Translation Model Filtering, IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP), 2015, 第 3 作者
(5) Deep Neural Networks in Machine Translation: An Overview, IEEE Intelligent Systems, 2015, 第 2 作者
(6) Dual Sentiment Analysis: Considering Two Sides of One Review, IEEE Transactions on Knowledge and Data Engineering (TKDE), 2015, 第 3 作者
(7) Domain Adaptation for Syntactic and Semantic Dependency Parsing Using Deep Belief Networks, Transactions of Association for Computational Linguistics (TACL), 2015, 第 3 作者
(8) A Unified Model for Solving the OOV Problems of Chinese Word Segmentation, ACM Transactions on Asian Language and Low-Resource Language Information Processing (TALLIP), 2015, 第 2 作者
(9) Towards Machine Translation in Semantic Vector Space, ACM Transactions on Asian Language and Low-Resource Language Information Processing (TALLIP), 2015, 第 4 作者
(10) New Input Method for Human Translators: Integrating Machine Translation Effectively and Imperceptibly, In Proceedings of the 24th International Joint Conference on Artificial Intelligence (IJCAI), 2015, 第 4 作者
(11) Enhancing Grammatical Cohesion: Generating Transitional Expressions for SMT, In Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics (ACL), June 23 - 25, 2014, Baltimore, USA. Pages 850-860, 2014, 第 3 作者
(12) Dynamically Integrating Cross-Domain Translation Memory into Phrase-Based Machine Translation during Decoding, In Proceedings of the 25th International Conference on Computational Linguistics (COLING), 23-29 August 2014, Dublin, Ireland, Pages 398-408, 2014, 第 2 作者
(13) Multi-Predicate Semantic Role Labeling, In Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), October 25-29, 2014, Doha, Qatar. Pages 363-373, 2014, 第 2 作者
(14) A Unified Approach for Effectively Integrating Source-side Syntactic Reordering Rules into Phrase-based Translation, Language Resources and Evaluation, 2013, 第 2 作者
(15) Feature Ensemble plus Sample Selection: A Comprehensive Approach to Domain Adaptation for Sentiment Classification, IEEE Intelligent Systems, 2013, 第 2 作者
(16) Syntax-Based Translation with Bilingually Lexicalized Synchronous Tree Substitution Grammars, IEEE Transactions on Audio, Speech and Language Processing, 2013, 第 3 作者
(17) A Substitution-Translation-Restoration Framework for Handling Unknown Words in Statistical Machine Translation, Journal of Computer Science and Technology(JCST), 2013, 第 3 作者
(18) A Joint Model to Simultaneously Identify and Align Bilingual Named Entities, Computational Linguistics, 2013, 第 2 作者
(19) Integrating Generative and Discriminative Character-Based Models for Chinese Word Segmentation, ACM Transactions on Asian Language Information Processing(TALIP), 2012, 第 2 作者
(20) Multi-Domain Sentiment Classification with Classier Combination, Journal of Computer Science and Technology , 2011, 第 3 作者
(21) Augmenting String-to-Tree Translation Models with Fuzzy Use of Source-side Syntax, Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2011, 第 3 作者
(22) Automatic Evaluation of Chinese Translation Output: Word-Level or Character-Level, Proceedings of ACL-HLT , 2011, 第 2 作者
(23) Ensemble of feature sets and classification algorithms for sentiment classification, Information Sciences, 2011, 第 2 作者
(24) On Jointly Recognizing and Aligning Bilingual Named Entities, Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics (ACL), 2010, 第 2 作者
(25) Joint Inference for Bilingual Semantic Role Labeling, Proceedings of the 2010 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2010, 第 2 作者
(26) A Minimum Error Weighting Combination Strategy for Chinese Semantic Role Labeling, Proceedings of the 23rd International Conference on Computational Linguistics (COLING), 2010, 第 2 作者
(27) A Character-Based Joint Model for Chinese Word Segmentation, Proceedings of the 23rd International Conference on Computational Linguistics (COLING), 2010, 第 2 作者
(28) Exploring the Use of Word Relation Features for Sentiment Classification, Proceedings of the 23rd International Conference on Computational Linguistics (COLING) , 2010, 第 2 作者
(29) Phrase Structure Parsing with Dependency Structure, Proceedings of the 23rd International Conference on Computational Linguistics (COLING), 2010, 第 2 作者
(30) A Novel Reordering Model Based on Multi-layer Phrase for Statistical Machine Translation, Proceedings of the 23rd International Conference on Computational Linguistics (COLING), 2010, 第 3 作者
(31) Chinese Research and Development in Natural Language Technology, IEEE Intelligent Systems, 2009, 第 1 作者
(32) A Structure-based Model for Chinese Organization Name Translation, ACM Transactions on Asian Language Information Processing, 2008, 第 2 作者
(33) Sentence Type Based Reordering Model for Statistical Machine Translation, Proceedings of the 22nd Conference on Computational Linguistics (COLING), 2008, 第 2 作者
(34) An Approach to Automatic Acquisition of Translation Templates Based on Phrase Structure Ex, IEEE Transactions on Audio, Speech, and Language Processing, 2006, 第 2 作者
(35) Toward Practical Spoken Language Translation, Machine Translation, 2005, 第 1 作者
发表著作
( 1 ) 统计自然语言处理(第1版), Statistical Natural Language Processing, 清华大学出版社, 2008-05, 第 1 作者
( 2 ) 统计机器翻译, Statistical Machine Translation, 电子工业出版社, 2012-09, 第 1 作者
( 3 ) 统计自然语言处理(第2版), Statistical Natural Language Processing, 清华大学出版社, 2013-08, 第 1 作者

科研活动

承担国家、部委及各大企业支持的科研项目,包括理论研究、关键技术研发和应用系统实现。以下仅列出近年来承担的部分国家和部委项目。

科研项目
( 1 ) 汉语多层次语篇分析理论方法研究与应用, 主持, 国家级, 2014-01--2018-01
( 2 ) 基于云计算的海量文本语义计算框架与开放域自动问答验证系统, 主持, 国家级, 2012-01--2014-12
( 3 ) 语言认知与跨语言理解, 参与, 部委级, 2015-07--2018-12
( 4 ) 面向维汉机器翻译的维吾尔语命名实体识别研究, 参与, 部委级, 2013-06--2015-05

合作情况

长期与国内外众多大学、科研院所和公司保持友好的合作关系。

指导学生

已指导学生

曹文洁  博士研究生  081104-模式识别与智能系统  

周玉  博士研究生  081104-模式识别与智能系统  

柴春光  硕士研究生  081203-计算机应用技术  

左云存  硕士研究生  081104-模式识别与智能系统  

李幸  硕士研究生  081104-模式识别与智能系统  

陈克利  硕士研究生  081104-模式识别与智能系统  

刘丁  硕士研究生  081104-模式识别与智能系统  

徐昉  硕士研究生  081203-计算机应用技术  

何彦青  博士研究生  081104-模式识别与智能系统  

刘鹏  博士研究生  081104-模式识别与智能系统  

吴晓锋  博士研究生  081104-模式识别与智能系统  

陈钰枫  博士研究生  081104-模式识别与智能系统  

张华  博士研究生  081104-模式识别与智能系统  

李寿山  博士研究生  081104-模式识别与智能系统  

方李成  硕士研究生  081104-模式识别与智能系统  

鉴萍  博士研究生  081104-模式识别与智能系统  

李茂西  博士研究生  081104-模式识别与智能系统  

周可艳  博士研究生  081104-模式识别与智能系统  

夏睿  博士研究生  081203-计算机应用技术  

张家俊  博士研究生  081104-模式识别与智能系统  

庄涛  博士研究生  081104-模式识别与智能系统  

汪昆  博士研究生  081104-模式识别与智能系统  

王志国  博士研究生  081203-计算机应用技术  

向露  硕士研究生  085211-计算机技术  

张志琳  硕士研究生  085211-计算机技术  

翟飞飞  博士研究生  081104-模式识别与智能系统  

杨海彤  博士研究生  081203-计算机应用技术  

涂眉  博士研究生  081104-模式识别与智能系统  

现指导学生

吴惠甲  博士研究生  081104-模式识别与智能系统  

李小青  博士研究生  081104-模式识别与智能系统  

刘洋  博士研究生  081104-模式识别与智能系统  

李俊杰  博士研究生  081203-计算机应用技术  

王少楠  博士研究生  081104-模式识别与智能系统  

亢晓勉  博士研究生  081104-模式识别与智能系统  

黄国平  博士研究生  081104-模式识别与智能系统  

董传海  博士研究生  081104-模式识别与智能系统  

周龙  硕士研究生  081104-模式识别与智能系统  

赵阳  博士研究生  081104-模式识别与智能系统  

李浩然  博士研究生  081104-模式识别与智能系统  

杜倩龙  博士研究生  081104-模式识别与智能系统  

王唯康  博士研究生  081104-模式识别与智能系统  

李梅   硕士研究生  081104-模式识别与智能系统  

孙静远   硕士研究生  081104-模式识别与智能系统  

刘宇宸   博士研究生  081104-模式识别与智能系统  

王亦宁  博士研究生  081104-模式识别与智能系统