基本信息
宗成庆  男  博导  中国科学院自动化研究所
电子邮件: cqzong@nlpr.ia.ac.cn
通信地址: 北京市海淀区中关村东路95号中科院自动化所NLPR
邮政编码: 100190

研究领域

自然语言处理,机器翻译,文本数据挖掘,人机对话系统等

招生信息

招收计算机相关专业的博士生和硕士研究生。

招生专业
081203-计算机应用技术
081104-模式识别与智能系统
招生方向
自然语言处理
机器翻译
文本分类,网络内容理解

教育背景

1995-03--1998-03   中国科学院计算技术研究所   博士
出国学习工作

2004年10月至2005年至2月,在法国信息数学与应用研究院(IMAG)做短期高访。

1999年和2001年两次在日本国际电气通信基础技术研究所(ATR)做客座研究员。

工作经历

1990.7 ~ 1995.3 山东工业大学计算机系,讲师

1998.5 ~ 2000.4 中国科学院自动化研究所,博士后

2000.4 ~ 2004.6 中国科学院自动化研究所,副研究员

2004.6 至今         中国科学院自动化研究所,研究员,博士生导师


主要学术任职
2022-01-01-2022-12-31,ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), Associate Editor
2022-01-01-今,IEEE Intelligent Systems, Member of Editorial Board
2021-08-01-2021-08-06,The joint conference of the 59th Annual Meeting of the Association for Computational Linguistics (ACL) and the 10th International Joint Conference on Natural Language Processing (IJCNLP), Bangkok, Thailand, August 1-6, 2021, General chair
2021-04-28-今,清华大学-中国移动通信集团联合研究院学术委员会, 委员
2020-10-01-2024-09-30,国家科技图书文献中心计算机网络服务系统专家委员会, 委员
2020-09-13-2020-09-18,The 28th International Conference on Computational Linguistics (COLING), PC Co-Chair(程序委员会共同主席)
2019-01-27-2019-02-01,The Thirty-Third AAAI Conference on Artificial Intelligence (AAAI), Area Chair (领域主席)
2019-01-01-2020-12-31,亚洲自然语言处理联合会(AFNLP), 主席
2018-08-25-2018-08-29,The 7th CCF International Conference on Natural Language Processing and Chinese Computing (NLPCC), Conference Co-Chair (大会主席)
2018-07-28-2018-07-29,中国人工智能大会(CCAI'2018), 程序委员会共同主席
2018-07-13-2018-07-19,The 27th International Joint Conference on Artificial Intelligence (IJCAI) and the 23rd European Conference on Artificial Intelligence (ECAI), Area Chair (领域主席)
2017-11-27-2017-12-01,The 8th International Joint Conference on Natural Language Processing (IJCNLP), Conference Chair (大会主席)
2017-08-16-2017-08-22,The 26th International Joint Conference on Artificial Intelligence (IJCAI), Area Chair (领域主席)
2017-07-20-2017-07-21,中国人工智能大会(CCAI'2017), “语言智能与应用”论坛主席
2017-01-01-今,中国中文信息学会, 副理事长
2017-01-01-2018-12-31,亚洲自然语言处理联合会(AFNLP), 副主席
2016-08-23-2016-08-24,中国人工智能大会(CCAI'2016), 程序委员会共同主席
2015-07-26-2015-07-31,The 53rd Annual Meeting of the Association for Computational Linguistics (ACL) and the 7th International Joint Conference on Natural Language Processing (IJCNLP), PC Co-Chair (程序委员会主席)
2015-01-01-2016-12-31,亚洲自然语言处理联合会(AFNLP), 秘书长
2014-01-01-今,《自动化学报》, 副主编
2014-01-01-2015-12-31,国际计算语言学学会汉语特别兴趣组(SIGHAN), 主席
2013-01-01-今,国际计算语言学委员会(ICCL), 委员
2012-01-01-今,Machine Translation, 编委
2011-10-29-2016-12-31,中国中文信息学会, 常务理事
2010-08-23-2010-08-27,The 23rd International Conference on Computational Linguistics (COLING), Organization Committee Co-Chair (组委员会主席)
2010-06-30-今,ACM Transactions on Asian Language Information Processing, 副主编(Associate Editor)
2010-01-01-今,Journal of Computer Science and Technology, 编委
2009-10-15-今,北京大学计算语言学教育部重点实验室学术委员会, 副主任
2009-08-02-2009-08-07,The 47th Annual Meeting of the Association for Computational Linguistics (ACL) and the 4th International Joint Conference on Natural Language Processing (IJCNLP), Tutorial Co-Chair (讲座主席)
2009-07-31-今,IEEE Intelligent Systems, 编委
2008-07-31-今,国家自然科学基金委员会重大研究计划“视听觉信息的认知计算”指导专家组, 成员
2005-10-31-今,中国人工智能学会, 理事

教授课程

自然语言处理
文本数据挖掘
自然语言理解

获得荣誉、奖励和专利情况


奖励与荣誉
(1) 新疆维吾尔自治区科技进步奖二等奖, 二等奖, 部委级, 2019
(2) 宝钢优秀教师奖, 国家级, 2019
(3) 中国科学院优秀导师奖, , 院级, 2019
(4) 中国科学院优秀导师奖, 部委级, 2018
(5) 第6届自然语言处理与中文计算(NLPCC)最佳论文奖, , 其他, 2017
(6) 北京市优秀教师, , 省级, 2017
(7) 中国科学院教育教学成果奖, 二等奖, 院级, 2016
(8) 国家科学技术进步奖, 二等奖, 国家级, 2015
(9) 中国电子学会科技进步奖, 一等奖, 部委级, 2014
(10) 中国中文信息学会“钱伟长中文信息处理科学技术奖”, 一等奖, 部委级, 2014
(11) 国务院政府特殊津贴, , 国家级, 2012
(12) 中国学科院“朱李月华优秀教师”奖, , 院级, 2010
(13) 第23届亚太地区语言、信息与计算国际会议(PACLIC)最佳论文奖, , 其他, 2009
(14) 中国科学院研究生院集中教学突出贡献奖, , 研究所(学校), 2008
(15) 中国科学院王宽诚博士后工作奖励基金, , 院级, 1998
获得的荣誉和奖励

  1. 新疆维吾尔自治区科技进步奖二等奖,省部级,2019

  2. 宝钢优秀教师奖,国家级,2019

  3. 中国科学院优秀导师奖,省部级,2019

  4. 中国科学院优秀导师奖,省部级,2018

  5. 北京市优秀教师, 省部级, 2017

  6. 中国科学院教育教学成果奖, 二等奖, 院级, 2016

  7. 国家科学技术进步奖, 二等奖, 国家级, 2015

  8. 中国电子学会科技进步奖, 一等奖, 部委级, 2014

  9. 中国中文信息学会“钱伟长中文信息处理科学技术奖”, 一等奖, 部委级, 2014

  10. 国务院政府特殊津贴, 国家级, 2012

  11. 中国学科院“朱李月华优秀教师”奖, 院级, 2010

  12. 第23届亚太地区语言、信息与计算国际会议(PACLIC)最佳论文奖, 其他, 2009

  13. 中国科学院研究生院集中教学突出贡献奖, 校级, 2008

  14. 中国科学院王宽诚博士后工作奖励基金, 院级, 1998


获得专利情况

  1. 口语会话中句子边界识别方法, 发明, 2006, 第 1 作者, 专利号: ZL031475

  2. 一种新的面向文本分类的特征向量权重的方法及装置, 发明, 2007, 第 1 作者, 专利号: ZL200410

  3. 一种基于标点处理的层次化汉语长句句法分析方法及装置, 发明, 2008, 第 1 作者, 专利号: ZL200510

  4. 一种新的汉语口语解析方法及装置, 发明, 2008, 第 1 作者, 专利号: ZL200510109335.8

  5. 基于概率主题词的两级组合文本分类方法, 发明, 2009, 第 1 作者, 专利号: ZL200610011747.2

  6. 一种基于语块的中文机构名翻译方法及装置, 发明, 2011, 第 1 作者, 专利号: ZL200610011923.2

  7. 一种拼音和汉字相结合的汉外口语自动翻译方法, 发明, 2011, 第 2 作者, 专利号: ZL200910244513.6

  8. 一种汉英短语翻译对自动抽取与过虑方法, 发明, 2010, 第 1 作者, 专利号: ZL 2008 0055782.3

  9. 一种汉英词语自动对齐方法, 发明, 2011, 第 1 作者, 专利号: ZL 2008 1 0055783.8

  10. 一种基于依存连贯性约束的双语词语自动对齐方法, 发明, 2015, 第 1 作者, 专利号: CN102708098B

  11. 一种基于谓词论元结构的统计机器翻译方法, 发明, 2015, 第 1 作者, 专利号: CN103020045B

  12. 构建树结构及基于树结构的机器翻译系统的方法, 发明, 2014, 第 1 作者, 专利号: ZL201210068782.3

  13. 一种基于模糊树到精确树的统计机器翻译方法, 发明, 2016, 第 1 作者, 专利号: CN102117270B

  14. 一种双语联合语义角色的标注方法, 发明, 2016, 第 1 作者, 专利号: CN101908042B


出版信息

发表的学术专著:

[ 1 ] 宗成庆,统计自然语言处理(第2版), 清华大学出版社, 2013-08

[ 2 ] 宗成庆,统计自然语言处理(第1版), 清华大学出版社, 2008-05

[ 2 ] 宗成庆,张霄军译,统计机器翻译(Statistical Machine Translation), 电子工业出版社, 2012-09


近年来发表的主要论文:

  1. Comparison Study on Critical Components in Composition Model for Phrase Representation, ACM Transactions on Asian Language and Low-Resource Language Information Processing (TALLIP), Vol. 16, No. 3, Article 16, 25 pages, January 2017. 第2作者

  2. Implicit Discourse Relation Recognition for English and Chinese with Multiview Modeling and Effective Representation Learning. ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), Vol.16, No. 3, Article 19, 21 pages, March 2017. 第3作者

  3. Learning Sentence Representation with Guidance of Human Attention. In Proceedings of the 26th International Joint Conference on Artificial Intelligence (IJCAI), Melbourne, Australia, August 19-25, 2017 , pp. 4137-4143. 第3作者

  4. A Dynamic Window Network for CCG Supertagging,  In Proceedings of the 31st AAAI Conference on Artificial Intelligence (AAAI-17), California, USA, February 4–9, 2017, pages 3337-3343. 第3作者

  5. Long Zhou, Wenpeng Hu, Jiajun Zhang and Chengqing Zong. Neural System Combination for Machine Translation. In Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (ACL2017),Vancouver, Canada, July 30-August 4, 2017, pp. 378-384. 第4作者

  6. Multi-modal Summarization for Asynchronous Collection of Text, Image, Audio and Video. In Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing (EMNLP-17), Copenhagen, Denmark. September 9-11, 2017, pp. 1103--1113. 第5作者

  7. Exploiting Word Internal Structures for Generic Chinese Sentence Representation. In Proceedings of Conference on Empirical Methods in Natural Language Processing (EMNLP), Copenhagen, Denmark, September 9-11, 2017, pp. 298-303. 第3作者

  8. Towards Zero Unknown Word in Neural Machine Translation, In Proceedings of the 25th International Joint Conference on Artificial Intelligence (IJCAI'16), 2016. 第3作者

  9. Learning Generalized Features for Semantic Role Labeling, ACM Transactions on Asian Language and Low-Resource Language Information Processing (TALLIP), 2016, 第 2 作者

  10. Bilingual Semantic Role Labeling Inference via Dual Decomposition, ACM Transactions on Asian Language and Low-Resource Language Information Processing (TALLIP), 2015, 第 3 作者

  11. Exploring Diverse Features for Statistical Machine Translation Model Filtering, IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP), 2015, 第 3 作者

  12. Deep Neural Networks in Machine Translation: An Overview, IEEE Intelligent Systems, 2015, 第 2 作者

  13. Dual Sentiment Analysis: Considering Two Sides of One Review, IEEE Transactions on Knowledge and Data Engineering (TKDE), 2015, 第 3 作者

  14. Domain Adaptation for Syntactic and Semantic Dependency Parsing Using Deep Belief Networks, Transactions of Association for Computational Linguistics (TACL), 2015, 第 3 作者

  15. A Unified Model for Solving the OOV Problems of Chinese Word Segmentation, ACM Transactions on Asian Language and Low-Resource Language Information Processing (TALLIP), 2015, 第 2 作者

  16. Towards Machine Translation in Semantic Vector Space, ACM Transactions on Asian Language and Low-Resource Language Information Processing (TALLIP), 2015, 第 4 作者

  17. New Input Method for Human Translators: Integrating Machine Translation Effectively and Imperceptibly, In Proceedings of the 24th International Joint Conference on Artificial Intelligence (IJCAI), 2015, 第 4 作者

  18. Enhancing Grammatical Cohesion: Generating Transitional Expressions for SMT, In Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics (ACL), June 23 - 25, 2014, Baltimore, USA. Pages 850-860, 2014, 第 3 作者

  19. Dynamically Integrating Cross-Domain Translation Memory into Phrase-Based Machine Translation during Decoding, In Proceedings of the 25th International Conference on Computational Linguistics (COLING), 23-29 August 2014, Dublin, Ireland, Pages 398-408, 2014, 第 2 作者

  20. Multi-Predicate Semantic Role Labeling, In Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), October 25-29, 2014, Doha, Qatar. Pages 363-373, 2014, 第 2 作者

  21. A Unified Approach for Effectively Integrating Source-side Syntactic Reordering Rules into Phrase-based Translation, Language Resources and Evaluation, 2013, 第 2 作者

  22. Feature Ensemble plus Sample Selection: A Comprehensive Approach to Domain Adaptation for Sentiment Classification, IEEE Intelligent Systems, 2013, 第 2 作者

  23. Syntax-Based Translation with Bilingually Lexicalized Synchronous Tree Substitution Grammars, IEEE Transactions on Audio, Speech and Language Processing, 2013, 第 3 作者

  24. A Substitution-Translation-Restoration Framework for Handling Unknown Words in Statistical Machine Translation, Journal of Computer Science and Technology(JCST), 2013, 第 3 作者

  25. A Joint Model to Simultaneously Identify and Align Bilingual Named Entities, Computational Linguistics, 2013, 第 2 作者

  26. Integrating Generative and Discriminative Character-Based Models for Chinese Word Segmentation, ACM Transactions on Asian Language Information Processing(TALIP), 2012, 第 2 作者

  27. Multi-Domain Sentiment Classification with Classier Combination, Journal of Computer Science and Technology , 2011, 第 3 作者

  28. Augmenting String-to-Tree Translation Models with Fuzzy Use of Source-side Syntax, Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2011, 第 3 作者

  29. Automatic Evaluation of Chinese Translation Output: Word-Level or Character-Level, Proceedings of ACL-HLT , 2011, 第 2 作者

  30. Ensemble of feature sets and classification algorithms for sentiment classification, Information Sciences, 2011, 第 2 作者

  31. On Jointly Recognizing and Aligning Bilingual Named Entities, Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics (ACL), 2010, 第 2 作者

  32. Joint Inference for Bilingual Semantic Role Labeling, Proceedings of the 2010 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2010, 第 2 作者

  33. A Minimum Error Weighting Combination Strategy for Chinese Semantic Role Labeling, Proceedings of the 23rd International Conference on Computational Linguistics (COLING), 2010, 第 2 作者

  34. A Character-Based Joint Model for Chinese Word Segmentation, Proceedings of the 23rd International Conference on Computational Linguistics (COLING), 2010, 第 2 作者

  35. Exploring the Use of Word Relation Features for Sentiment Classification, Proceedings of the 23rd International Conference on Computational Linguistics (COLING) , 2010, 第 2 作者

  36. Phrase Structure Parsing with Dependency Structure, Proceedings of the 23rd International Conference on Computational Linguistics (COLING), 2010, 第 2 作者

  37. A Novel Reordering Model Based on Multi-layer Phrase for Statistical Machine Translation, Proceedings of the 23rd International Conference on Computational Linguistics (COLING), 2010, 第 3 作者

  38. Chinese Research and Development in Natural Language Technology, IEEE Intelligent Systems, 2009, 第 1 作者

  39. A Structure-based Model for Chinese Organization Name Translation, ACM Transactions on Asian Language Information Processing, 2008, 第 2 作者

  40. Sentence Type Based Reordering Model for Statistical Machine Translation, Proceedings of the 22nd Conference on Computational Linguistics (COLING), 2008, 第 2 作者

  41. An Approach to Automatic Acquisition of Translation Templates Based on Phrase Structure Ex, IEEE Transactions on Audio, Speech, and Language Processing, 2006, 第 2 作者

  42. Toward Practical Spoken Language Translation, Machine Translation, 2005, 第 1 作者

科研活动

承担国家、部委及各大企业支持的科研项目,包括理论研究、关键技术研发和应用系统实现。以下仅列出近年来承担的部分国家和部委项目。

近年承担的主要科研项目
( 1 ) 汉语多层次语篇分析理论方法研究与应用, 主持, 国家级, 2014-01--2018-01
( 2 ) 基于云计算的海量文本语义计算框架与开放域自动问答验证系统, 主持, 国家级, 2012-01--2014-12
( 3 ) 语言认知与跨语言理解, 参与, 部委级, 2015-07--2018-12
( 4 ) 面向维汉机器翻译的维吾尔语命名实体识别研究, 参与, 部委级, 2013-06--2015-05

合作情况

长期与国内外众多大学、科研院所和公司保持友好的合作关系。

指导学生

已指导学生

曹文洁  博士研究生  081104-模式识别与智能系统  

周玉  博士研究生  081104-模式识别与智能系统  

柴春光  硕士研究生  081203-计算机应用技术  

左云存  硕士研究生  081104-模式识别与智能系统  

李幸  硕士研究生  081104-模式识别与智能系统  

陈克利  硕士研究生  081104-模式识别与智能系统  

刘丁  硕士研究生  081104-模式识别与智能系统  

徐昉  硕士研究生  081203-计算机应用技术  

何彦青  博士研究生  081104-模式识别与智能系统  

刘鹏  博士研究生  081104-模式识别与智能系统  

吴晓锋  博士研究生  081104-模式识别与智能系统  

陈钰枫  博士研究生  081104-模式识别与智能系统  

张华  博士研究生  081104-模式识别与智能系统  

李寿山  博士研究生  081104-模式识别与智能系统  

方李成  硕士研究生  081104-模式识别与智能系统  

鉴萍  博士研究生  081104-模式识别与智能系统  

李茂西  博士研究生  081104-模式识别与智能系统  

周可艳  博士研究生  081104-模式识别与智能系统  

夏睿  博士研究生  081203-计算机应用技术  

张家俊  博士研究生  081104-模式识别与智能系统  

庄涛  博士研究生  081104-模式识别与智能系统  

汪昆  博士研究生  081104-模式识别与智能系统  

王志国  博士研究生  081203-计算机应用技术  

向露  硕士研究生  085211-计算机技术  

张志琳  硕士研究生  085211-计算机技术  

翟飞飞  博士研究生  081104-模式识别与智能系统  

杨海彤  博士研究生  081203-计算机应用技术  

涂眉  博士研究生  081104-模式识别与智能系统  

现指导学生

吴惠甲  博士研究生  081104-模式识别与智能系统  

李小青  博士研究生  081104-模式识别与智能系统  

刘洋  博士研究生  081104-模式识别与智能系统  

李俊杰  博士研究生  081203-计算机应用技术  

王少楠  博士研究生  081104-模式识别与智能系统  

亢晓勉  博士研究生  081104-模式识别与智能系统  

黄国平  博士研究生  081104-模式识别与智能系统  

董传海  博士研究生  081104-模式识别与智能系统  

周龙  硕士研究生  081104-模式识别与智能系统  

赵阳  博士研究生  081104-模式识别与智能系统  

李浩然  博士研究生  081104-模式识别与智能系统  

杜倩龙  博士研究生  081104-模式识别与智能系统  

王唯康  博士研究生  081104-模式识别与智能系统  

李梅   硕士研究生  081104-模式识别与智能系统  

孙静远   硕士研究生  081104-模式识别与智能系统  

刘宇宸   博士研究生  081104-模式识别与智能系统  

王亦宁  博士研究生  081104-模式识别与智能系统