基本信息

宗成庆 中科院自动化研究所研究员,博士生导师
电子邮件:cqzong@nlpr.ia.ac.cn
通信地址:北京市海淀区中关村东路95号 中科院自动化所 
邮政编码:100190

研究领域

自然语言处理,机器翻译,文本数据挖掘,人机对话系统等

招生信息

招收计算机相关专业的博士生和硕士研究生。

招生专业
081203-计算机应用技术
081104-模式识别与智能系统
招生方向
自然语言处理
机器翻译
文本分类,网络内容理解

教育背景

1995-03--1998-03   中国科学院计算技术研究所   博士
出国学习工作

2004年10月至2005年至2月,在法国信息数学与应用研究院(IMAG)做短期高访。

1999年和2001年两次在日本国际电气通信基础技术研究所(ATR)做客座研究员。

工作经历

1990.7 ~ 1995.3 山东工业大学计算机系,讲师

1998.5 ~ 2000.4 中国科学院自动化研究所,博士后

2000.4 ~ 2004.6 中国科学院自动化研究所,副研究员

2004.6 至今         中国科学院自动化研究所,研究员,博士生导师


主要学术任职
2017-11-27-2017-12-01,第8届自然语言处理联合学术会议(IJCNLP), 大会主席
2017-08-18-2017-08-24,第26届国际人工智能联合会议(IJCAI), 领域主席
2017-07-20-2017-07-21,中国人工智能大会(CCAI'2017), “语言智能与应用”论坛主席
2017-01-01-今,中国中文信息学会, 副理事长
2016-12-31-今,亚洲自然语言处理联合会(AFNLP), 副主席
2016-08-23-2016-08-24,中国人工智能大会(CCAI'2016), 程序委员会共同主席
2015-07-26-2015-07-30,第53届国际计算语言学学会年会(ACL)和第7届亚洲自然语言处理联合学术会议(IJCNLP), 程序委员会共同主席(PC Co-Chair)
2014-12-31-2016-12-30,亚洲自然语言处理联合会(AFNLP), 秘书长
2014-01-01-今,《自动化学报》, 副主编
2014-01-01-2015-12-31,国际计算语言学学会汉语特别兴趣组(SIGHAN), 主席
2013-01-01-今,国际计算语言学委员会(ICCL), 委员
2012-01-01-今,Machine Translation, 编委
2011-10-29-2016-12-31,中国中文信息学会, 常务理事
2010-06-30-今,ACM Transactions on Asian Language Information Processing, 副主编(Associate Editor)
2010-01-01-今,Journal of Computer Science and Technology, 编委
2009-10-15-今,北京大学计算语言学教育部重点实验室学术委员会, 副主任
2009-07-31-今,IEEE Intelligent Systems, 编委
2008-07-31-今,国家自然科学基金委员会重大研究计划“视听觉信息的认知计算”指导专家组, 成员
2005-10-31-今,中国人工智能学会, 理事

教授课程

自然语言处理
文本数据挖掘
自然语言理解

获得的荣誉、奖励和专利情况


获得的荣誉和奖励

  1. 北京市优秀教师, 省部级, 2017

  2. 中国科学院教育教学成果奖, 二等奖, 院级, 2016

  3. 国家科学技术进步奖, 二等奖, 国家级, 2015

  4. 中国电子学会科技进步奖, 一等奖, 部委级, 2014

  5. 中国中文信息学会“钱伟长中文信息处理科学技术奖”, 一等奖, 部委级, 2014

  6. 国务院政府特殊津贴, 国家级, 2012

  7. 中国学科院“朱李月华优秀教师”奖, 院级, 2010

  8. 第23届亚太地区语言、信息与计算国际会议(PACLIC)最佳论文奖, 其他, 2009

  9. 中国科学院研究生院集中教学突出贡献奖, 校级, 2008

  10. 中国科学院王宽诚博士后工作奖励基金, 院级, 1998


获得专利情况

  1. 口语会话中句子边界识别方法, 发明, 2006, 第 1 作者, 专利号: ZL031475

  2. 一种新的面向文本分类的特征向量权重的方法及装置, 发明, 2007, 第 1 作者, 专利号: ZL200410

  3. 一种基于标点处理的层次化汉语长句句法分析方法及装置, 发明, 2008, 第 1 作者, 专利号: ZL200510

  4. 一种新的汉语口语解析方法及装置, 发明, 2008, 第 1 作者, 专利号: ZL200510109335.8

  5. 基于概率主题词的两级组合文本分类方法, 发明, 2009, 第 1 作者, 专利号: ZL200610011747.2

  6. 一种基于语块的中文机构名翻译方法及装置, 发明, 2011, 第 1 作者, 专利号: ZL200610011923.2

  7. 一种拼音和汉字相结合的汉外口语自动翻译方法, 发明, 2011, 第 2 作者, 专利号: ZL200910244513.6

  8. 一种汉英短语翻译对自动抽取与过虑方法, 发明, 2010, 第 1 作者, 专利号: ZL 2008 0055782.3

  9. 一种汉英词语自动对齐方法, 发明, 2011, 第 1 作者, 专利号: ZL 2008 1 0055783.8

  10. 一种基于依存连贯性约束的双语词语自动对齐方法, 发明, 2015, 第 1 作者, 专利号: CN102708098B

  11. 一种基于谓词论元结构的统计机器翻译方法, 发明, 2015, 第 1 作者, 专利号: CN103020045B

  12. 构建树结构及基于树结构的机器翻译系统的方法, 发明, 2014, 第 1 作者, 专利号: ZL201210068782.3

  13. 一种基于模糊树到精确树的统计机器翻译方法, 发明, 2016, 第 1 作者, 专利号: CN102117270B

  14. 一种双语联合语义角色的标注方法, 发明, 2016, 第 1 作者, 专利号: CN101908042B


出版信息

发表的学术专著:

[ 1 ] 宗成庆,统计自然语言处理(第2版), 清华大学出版社, 2013-08

[ 2 ] 宗成庆,统计自然语言处理(第1版), 清华大学出版社, 2008-05

[ 2 ] 宗成庆,张霄军译,统计机器翻译(Statistical Machine Translation), 电子工业出版社, 2012-09


近年来发表的主要论文:

  1. Comparison Study on Critical Components in Composition Model for Phrase Representation, ACM Transactions on Asian Language and Low-Resource Language Information Processing (TALLIP), Vol. 16, No. 3, Article 16, 25 pages, January 2017. 第2作者

  2. Implicit Discourse Relation Recognition for English and Chinese with Multiview Modeling and Effective Representation Learning. ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), Vol.16, No. 3, Article 19, 21 pages, March 2017. 第3作者

  3. Learning Sentence Representation with Guidance of Human Attention. In Proceedings of the 26th International Joint Conference on Artificial Intelligence (IJCAI), Melbourne, Australia, August 19-25, 2017 , pp. 4137-4143. 第3作者

  4. A Dynamic Window Network for CCG Supertagging,  In Proceedings of the 31st AAAI Conference on Artificial Intelligence (AAAI-17), California, USA, February 4–9, 2017, pages 3337-3343. 第3作者

  5. Long Zhou, Wenpeng Hu, Jiajun Zhang and Chengqing Zong. Neural System Combination for Machine Translation. In Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (ACL2017),Vancouver, Canada, July 30-August 4, 2017, pp. 378-384. 第4作者

  6. Multi-modal Summarization for Asynchronous Collection of Text, Image, Audio and Video. In Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing (EMNLP-17), Copenhagen, Denmark. September 9-11, 2017, pp. 1103--1113. 第5作者

  7. Exploiting Word Internal Structures for Generic Chinese Sentence Representation. In Proceedings of Conference on Empirical Methods in Natural Language Processing (EMNLP), Copenhagen, Denmark, September 9-11, 2017, pp. 298-303. 第3作者

  8. Towards Zero Unknown Word in Neural Machine Translation, In Proceedings of the 25th International Joint Conference on Artificial Intelligence (IJCAI'16), 2016. 第3作者

  9. Learning Generalized Features for Semantic Role Labeling, ACM Transactions on Asian Language and Low-Resource Language Information Processing (TALLIP), 2016, 第 2 作者

  10. Bilingual Semantic Role Labeling Inference via Dual Decomposition, ACM Transactions on Asian Language and Low-Resource Language Information Processing (TALLIP), 2015, 第 3 作者

  11. Exploring Diverse Features for Statistical Machine Translation Model Filtering, IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP), 2015, 第 3 作者

  12. Deep Neural Networks in Machine Translation: An Overview, IEEE Intelligent Systems, 2015, 第 2 作者

  13. Dual Sentiment Analysis: Considering Two Sides of One Review, IEEE Transactions on Knowledge and Data Engineering (TKDE), 2015, 第 3 作者

  14. Domain Adaptation for Syntactic and Semantic Dependency Parsing Using Deep Belief Networks, Transactions of Association for Computational Linguistics (TACL), 2015, 第 3 作者

  15. A Unified Model for Solving the OOV Problems of Chinese Word Segmentation, ACM Transactions on Asian Language and Low-Resource Language Information Processing (TALLIP), 2015, 第 2 作者

  16. Towards Machine Translation in Semantic Vector Space, ACM Transactions on Asian Language and Low-Resource Language Information Processing (TALLIP), 2015, 第 4 作者

  17. New Input Method for Human Translators: Integrating Machine Translation Effectively and Imperceptibly, In Proceedings of the 24th International Joint Conference on Artificial Intelligence (IJCAI), 2015, 第 4 作者

  18. Enhancing Grammatical Cohesion: Generating Transitional Expressions for SMT, In Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics (ACL), June 23 - 25, 2014, Baltimore, USA. Pages 850-860, 2014, 第 3 作者

  19. Dynamically Integrating Cross-Domain Translation Memory into Phrase-Based Machine Translation during Decoding, In Proceedings of the 25th International Conference on Computational Linguistics (COLING), 23-29 August 2014, Dublin, Ireland, Pages 398-408, 2014, 第 2 作者

  20. Multi-Predicate Semantic Role Labeling, In Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), October 25-29, 2014, Doha, Qatar. Pages 363-373, 2014, 第 2 作者

  21. A Unified Approach for Effectively Integrating Source-side Syntactic Reordering Rules into Phrase-based Translation, Language Resources and Evaluation, 2013, 第 2 作者

  22. Feature Ensemble plus Sample Selection: A Comprehensive Approach to Domain Adaptation for Sentiment Classification, IEEE Intelligent Systems, 2013, 第 2 作者

  23. Syntax-Based Translation with Bilingually Lexicalized Synchronous Tree Substitution Grammars, IEEE Transactions on Audio, Speech and Language Processing, 2013, 第 3 作者

  24. A Substitution-Translation-Restoration Framework for Handling Unknown Words in Statistical Machine Translation, Journal of Computer Science and Technology(JCST), 2013, 第 3 作者

  25. A Joint Model to Simultaneously Identify and Align Bilingual Named Entities, Computational Linguistics, 2013, 第 2 作者

  26. Integrating Generative and Discriminative Character-Based Models for Chinese Word Segmentation, ACM Transactions on Asian Language Information Processing(TALIP), 2012, 第 2 作者

  27. Multi-Domain Sentiment Classification with Classier Combination, Journal of Computer Science and Technology , 2011, 第 3 作者

  28. Augmenting String-to-Tree Translation Models with Fuzzy Use of Source-side Syntax, Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2011, 第 3 作者

  29. Automatic Evaluation of Chinese Translation Output: Word-Level or Character-Level, Proceedings of ACL-HLT , 2011, 第 2 作者

  30. Ensemble of feature sets and classification algorithms for sentiment classification, Information Sciences, 2011, 第 2 作者

  31. On Jointly Recognizing and Aligning Bilingual Named Entities, Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics (ACL), 2010, 第 2 作者

  32. Joint Inference for Bilingual Semantic Role Labeling, Proceedings of the 2010 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2010, 第 2 作者

  33. A Minimum Error Weighting Combination Strategy for Chinese Semantic Role Labeling, Proceedings of the 23rd International Conference on Computational Linguistics (COLING), 2010, 第 2 作者

  34. A Character-Based Joint Model for Chinese Word Segmentation, Proceedings of the 23rd International Conference on Computational Linguistics (COLING), 2010, 第 2 作者

  35. Exploring the Use of Word Relation Features for Sentiment Classification, Proceedings of the 23rd International Conference on Computational Linguistics (COLING) , 2010, 第 2 作者

  36. Phrase Structure Parsing with Dependency Structure, Proceedings of the 23rd International Conference on Computational Linguistics (COLING), 2010, 第 2 作者

  37. A Novel Reordering Model Based on Multi-layer Phrase for Statistical Machine Translation, Proceedings of the 23rd International Conference on Computational Linguistics (COLING), 2010, 第 3 作者

  38. Chinese Research and Development in Natural Language Technology, IEEE Intelligent Systems, 2009, 第 1 作者

  39. A Structure-based Model for Chinese Organization Name Translation, ACM Transactions on Asian Language Information Processing, 2008, 第 2 作者

  40. Sentence Type Based Reordering Model for Statistical Machine Translation, Proceedings of the 22nd Conference on Computational Linguistics (COLING), 2008, 第 2 作者

  41. An Approach to Automatic Acquisition of Translation Templates Based on Phrase Structure Ex, IEEE Transactions on Audio, Speech, and Language Processing, 2006, 第 2 作者

  42. Toward Practical Spoken Language Translation, Machine Translation, 2005, 第 1 作者

科研活动

承担国家、部委及各大企业支持的科研项目,包括理论研究、关键技术研发和应用系统实现。以下仅列出近年来承担的部分国家和部委项目。

近年承担的主要科研项目
( 1 ) 汉语多层次语篇分析理论方法研究与应用, 主持, 国家级, 2014-01--2018-01
( 2 ) 基于云计算的海量文本语义计算框架与开放域自动问答验证系统, 主持, 国家级, 2012-01--2014-12
( 3 ) 语言认知与跨语言理解, 参与, 部委级, 2015-07--2018-12
( 4 ) 面向维汉机器翻译的维吾尔语命名实体识别研究, 参与, 部委级, 2013-06--2015-05

合作情况

长期与国内外众多大学、科研院所和公司保持友好的合作关系。

指导学生

已指导学生

曹文洁  博士研究生  081104-模式识别与智能系统  

周玉  博士研究生  081104-模式识别与智能系统  

柴春光  硕士研究生  081203-计算机应用技术  

左云存  硕士研究生  081104-模式识别与智能系统  

李幸  硕士研究生  081104-模式识别与智能系统  

陈克利  硕士研究生  081104-模式识别与智能系统  

刘丁  硕士研究生  081104-模式识别与智能系统  

徐昉  硕士研究生  081203-计算机应用技术  

何彦青  博士研究生  081104-模式识别与智能系统  

刘鹏  博士研究生  081104-模式识别与智能系统  

吴晓锋  博士研究生  081104-模式识别与智能系统  

陈钰枫  博士研究生  081104-模式识别与智能系统  

张华  博士研究生  081104-模式识别与智能系统  

李寿山  博士研究生  081104-模式识别与智能系统  

方李成  硕士研究生  081104-模式识别与智能系统  

鉴萍  博士研究生  081104-模式识别与智能系统  

李茂西  博士研究生  081104-模式识别与智能系统  

周可艳  博士研究生  081104-模式识别与智能系统  

夏睿  博士研究生  081203-计算机应用技术  

张家俊  博士研究生  081104-模式识别与智能系统  

庄涛  博士研究生  081104-模式识别与智能系统  

汪昆  博士研究生  081104-模式识别与智能系统  

王志国  博士研究生  081203-计算机应用技术  

向露  硕士研究生  085211-计算机技术  

张志琳  硕士研究生  085211-计算机技术  

翟飞飞  博士研究生  081104-模式识别与智能系统  

杨海彤  博士研究生  081203-计算机应用技术  

涂眉  博士研究生  081104-模式识别与智能系统  

现指导学生

吴惠甲  博士研究生  081104-模式识别与智能系统  

李小青  博士研究生  081104-模式识别与智能系统  

刘洋  博士研究生  081104-模式识别与智能系统  

李俊杰  博士研究生  081203-计算机应用技术  

王少楠  博士研究生  081104-模式识别与智能系统  

亢晓勉  博士研究生  081104-模式识别与智能系统  

黄国平  博士研究生  081104-模式识别与智能系统  

董传海  博士研究生  081104-模式识别与智能系统  

周龙  硕士研究生  081104-模式识别与智能系统  

赵阳  博士研究生  081104-模式识别与智能系统  

李浩然  博士研究生  081104-模式识别与智能系统  

杜倩龙  博士研究生  081104-模式识别与智能系统  

王唯康  博士研究生  081104-模式识别与智能系统  

李梅   硕士研究生  081104-模式识别与智能系统  

孙静远   硕士研究生  081104-模式识别与智能系统  

刘宇宸   博士研究生  081104-模式识别与智能系统  

王亦宁  博士研究生  081104-模式识别与智能系统