基本信息

陈玉博  男    中国科学院自动化研究所 模式识别国家重点实验室
电子邮件: yubo.chen@nlpr.ia.ac.cn
通信地址: 北京市海淀区中关村东路95号自动化所智能化大厦711办公室

邮政编码:100190

个人主页:http://www.nlpr.ia.ac.cn/cip/yubochen/index.html

课题组招收硕博生、工程师、实习生,欢迎有意向的同学与我联系。

研究领域

自然语言处理:

计算语言学、深度学习下的自然语言处理

知识图谱和信息抽取:

实体识别、实体消歧、关系抽取、事件抽取、事件关系抽取

大规模预训练语言模型:

大规模语言模型中的的知识分析与萃取、知识增强的大规模语言模型、面向大规模语言模型的数据工程、大规模语言模型的能力评测

招生信息


招生专业

081203-计算机应用技术

081104-模式识别与智能系统

招生方向
自然语言处理,知识图谱,信息抽取,事件抽取

教育背景

2012-09--2017-07   中国科学院大学   工学博士学位
2008-09--2012-07   北京化工大学   工学学士学位

工作经历

   
工作简历
2019-10~现在, 中国科学院自动化研究所, 副研究员
2017-07~2019-10,中国科学院自动化研究所, 助理研究员
社会兼职
2022-12-01-今,中国中文信息学会青年工作委员会, 秘书长
2017-07-31-今,中国中文信息学会语言与知识计算委员会, 委员

教授课程

知识图谱
知识图谱与语义计算
知识图谱导论

专利与奖励

奖励信息

  • 2022年入选中国科学院青年创新促进会,2022

  • 2021年获中国电力科学院有限公司科学技术进步奖一等奖

  • 《知识图谱》课程入选中国科学院大学校级研究生优秀课程(2021年)

  • 2020年入选“第五届中国科协青年人才托举工程”, 国家级, 2020

  • 2019年北京市科学技术进步奖一等奖(个人排名第五), 一等奖, 省级, 2019

  • 中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖(个人排名第四), 一等奖, 专项, 2018

  •  第十九届中国计算语言学大会(CCL 2020)最佳论文奖, 其他, 2020

  •  2020年全国知识图谱与语义计算大会(CCKS 2020)最佳论文奖, 其他, 2020

  •  CCF-腾讯犀牛鸟科研基金-优秀奖, 专项, 2020

  •  CCF-腾讯犀牛鸟科研基金-优秀专利奖, 专项, 2020

  •  中国科学院自动化研究所“十佳员工”, 研究所(学校), 2019

  •  中国科学院自动化研究所模式识别国家重点实验室“优秀员工”, 研究所(学校), 2019

  •  2017年北京市优秀毕业生, 省级, 2017

  •  中国科学院大学优秀毕业生, 研究所(学校), 2017

  •  第五届全国知识图谱与语义计算大会(CCKS 2017)“最佳论文奖”, 其他, 2017

  •  第四届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD 2016)“最佳论文奖”,  其他, 2016


专利成果

  • 基于知识巩固的增量事件识别方法、系统、装置, 发明, 2020, 第 1 作者, 专利号: 202011244409.x

  • 基于联邦学习的分布式语言关系识别方法、系统和装置, 发明, 2020, 第 2 作者, 专利号: 202011285430.4

  • 基于对抗模仿学习的事件识别及分类方法、系统、装置, 发明, 2021, 第 1 作者, 专利号: 201910440322.0

  • 基于自注意力机制的中文命名实体识别方法、系统、装置, 发明, 2020, 第 1 作者, 专利号: 201811621018.8

  • 基于多语注意力机制的事件识别及分类方法及装置, 发明, 2020, 第 1 作者, 专利号: 201711463578.0


出版信息

​在ACL、EMNLP、COLING、AAAI、IJCAII等国际重要会议和期刊发表学术论文40余篇,出版《知识图谱》《知识图谱:算法与实践》专著两本,由人工智能学会推荐入选十三五国家重点图书出版规划教材,连续多年在中国科学院大学主讲《知识图谱》课程,2021 年获得中国科学院大学优秀课程。Google Scholar引用量4100余次,多次获得最佳论文奖(NLP-NABD 2016、CCKS 2017、CCL 2020、CCKS 2020),指导学生多次获得国际/国内学术评测奖励(NAACL-SMM4H 2021 社交媒体健康信息挖掘赛道冠军,SemEval 2022中文复杂命名实体识别赛道亚军,CCKS 2020医疗命名实体识别赛道冠军,万创杯天池中医药说明书实体识别挑战赛亚军,DCIC 2021数字中国创新大赛医疗大数据赛道亚军等)。更全的论文列表请参考:http://www.nlpr.ia.ac.cn/cip/yubochen/publications_cn.html


发表论文
(1) Event Process Typing via Hierarchical Optimal Transport, Association for the Advancement of Artificial Intelligence(AAAI 2023), 2023, 第 2 作者
(2) Zero-Shot Cross-Lingual Event Argument Extraction with Language-Oriented Prefix-Tuning, Association for the Advancement of Artificial Intelligence(AAAI 2023), 2023, 第 3 作者
(3) Generating Temporally-ordered Event Sequences via Event Optimal Transport, Proceedings of the 29th International Conference on Computational Linguistics(COLING 2022), 2022, 第 2 作者
(4) Multi-turn and Multi-Granularity Reader for Document-level Event Extraction, ACM Transactions on Asian and Low-Resource Language Information Processing(ACM TALLIP), 2022, 第 2 作者
(5) Document-Level Relation Extraction via Pair-Aware and Entity-Enhanced Representation Learning, Proceedings of the 29th International Conference on Computational Linguistics(COLING 2022), 2022, 第 3 作者
(6) A Good Neighbor, A Found Treasure: Mining Treasured Neighbors for Knowledge Graph Entity Typing, The 2022 Conference on Empirical Methods in Natural Language Processing (EMNLP 2022), 2022, 第 3 作者
(7) CN-AutoMIC: Distilling Chinese Commonsense Knowledge from Pretrained Language Models, The 2022 Conference on Empirical Methods in Natural Language Processing (EMNLP 2022), 2022, 第 3 作者
(8) CogKGE: A Knowledge Graph Embedding Toolkit and Benchmark for Representing Multi-source and Heterogeneous Knowledge, Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics(ACL 2022)demo, 2022, 第 7 作者
(9) Augmentation, Retrieval, Generation: Event Sequence Prediction with a Three-Stage Sequence-to-Sequence Approach, Proceedings of the 29th International Conference on Computational Linguistics(COLING 2022), 2022, 第 3 作者
(10) Script Event Prediction via Multilingual Event Graph Networks, ACM Transactions on Asian and Low-Resource Language Information Processing (ACM TALLIP), 2022, 第 2 作者
(11) What the role is vs. What plays the role:Semi-supervised Event Argument Extraction via Dual Question Answering, AAAI 2021, 2021, 第 2 作者
(12) CogNet: Bridging Linguistic Knowledge, World Knowledge and Commonsense Knowledge, AAAI 2021 Demo, 2021, 第 2 作者
(13) Knowledge-Enriched Event Causality Identification via Latent Structure Induction Networks, ACL 2021, 2021, 第 3 作者
(14) Uncertain Local-to-Global Networks for Document-Level Event Factuality Identification, EMNLP 2021, 2021, 第 2 作者
(15) Distantly Supervised Relation Extraction in Federated Settings, EMNLP 2021, 2021, 第 2 作者
(16) CogIE: An Information Extraction Toolkit for Bridging Texts and CogNet, ACL 2021 Demo, 2021, 第 2 作者
(17) Automatic ICD Coding via Interactive Shared Representation Networks with Self-distillation Mechanism, ACL 2021, 2021, 第 3 作者
(18) A Large-Scale Chinese Multimodal NER Dataset with Speech Clues, 59TH ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS AND THE 11TH INTERNATIONAL JOINT CONFERENCE ON NATURAL LANGUAGE PROCESSING (ACL-IJCNLP 2021), VOL 1, 2021, 第 3 作者
(19) Improving Event Causality Identification via Self-Supervised Representation Learning on External Causal Statement, ACL FINDINGS 2021, 2021, 第 3 作者
(20) A Large-Scale Chinese NER Dataset with Speech Clues., ACL 2021, 2021, 第 3 作者
(21) Extracting Events and Their Relations from Texts: A Survey on Recent, AI Open, 2021, 第 2 作者
(22) Set Generation Networks for End-to-End Knowledge Base Population, EMNLP 2021, 2021, 第 3 作者
(23) Multi-Task Self-Supervised Learning for Script Event Prediction, CIKM 2021, 2021, 第 2 作者
(24) Uncertainty-Aware Self-Training for Semi-Supervised Event Temporal Relation Extraction, CIKM-2021, 2021, 第 3 作者
(25) Multi-Sentence Argument Linking via An Event-Aware Hierarchical Encoder, CIKM 2021, 2021, 第 2 作者
(26) Named Entity Recognition via Noise Aware Training Mechanism with Data Filter, ACL 2021 findings, 2021, 第 2 作者
(27) Document-level Event Extraction via Parallel Prediction Networks, ACL 2021, 2021, 第 3 作者
(28) LearnDA: Learnable Knowledge-Guided Data Augmentation for Event Causality Identification, ACL 2021, 2021, 第 3 作者
(29) Incorporate Lexicon into Self-training: A Distantly Supervised Chinese Medical NER, NLPCC, 2021, 第 5 作者
(30) CroAno : A Crowd Annotation Platform for Improving Label Consistency of Chinese NER Dataset, EMNLP 2021 Demo, 2021, 第 4 作者
(31) Probing into the Root: A Dataset for Reason Extraction of Structural Events from Financial Documents, EACL 2021, 2021, 第 3 作者
(32) NSRL: Named Entity Recognition with Noisy Labels via Selective Review Learning, CCKS, 2021, 第 2 作者
(33) Event Extraction as Machine Reading Comprehension, EMNLP 2020, 2020, 第 2 作者
(34) Knowledge Guided Metric Learning for Few-Shot Text Classification, 2020, 第 2 作者
(35) Clinical-Coder: Assigning Interpretable ICD-10 Codes to Chinese Clinical Notes, 58TH ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS (ACL 2020): SYSTEM DEMONSTRATIONS, 2020, 第 4 作者
(36) Incremental Event Detection via Knowledge Consolidation Networks, EMNLP 2020, 2020, 第 2 作者
(37) Multi-Specialty Domain Adaptation for Chinese Medical Named Entity Recognition, CCKS 2020(Best Paper Award), 2020, 第 3 作者
(38) FedED: Federated Learning via Ensemble Distillation for Medical Relation Extraction, EMNLP 2020, 2020, 第 2 作者
(39) How Does Context Matter? On the Robustness of Event Detection with Context-Selective Mask Generalization, EMNLP 2020 findings, 2020, 第 2 作者
(40) Event Coreference Resolution via a Multi-loss Neural Network without Using Argument Information, 2020, 第 2 作者
(41) HyperCore: Hyperbolic and Co-graph Representation for Automatic ICD Coding, Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics(ACL 2020), 2020, 第 2 作者
(42) Towards Causal Explanation Detection with Pyramid Salient-Aware Network, 2020, 第 2 作者
(43) Knowledge Enhanced Event Causality Identification with Mention Masking Generalizations, IJCAI 2020, 2020, 第 2 作者
(44) Chinese Named Entity Recognition via Adaptive Multi-pass Memory Network with Hierarchical Tagging Mechanism, China National Conference on Chinese Computational Linguistics (CCL 2020), 2020, 第 2 作者
(45) Meta learning for Event Argument Extraction via Domain-Specific Information Enhanced, CCKS, 2020, 第 2 作者
(46) Extracting event and their relations from texts: A survey on recent research progress and challenges, AI OPEN, 2020, 第 2 作者
(47) Event co-reference resolution via a multi-loss neural network without using argument information, SCIENCE CHINA. INFORMATION SCIENCE, 2019, 第 2 作者
(48) 基于联合标注和全局推理的篇章级事件抽取, Document-level Event Extraction Based on Joint Labeling and Global Reasoning, 中文信息学报, 2019, 第 3 作者
(49) Event co-reference resolution via a multi-loss neural net work without using argument information, Event co-reference resolution via a multi-loss neural network without using argument information, 中国科学:信息科学(英文版), 2019, 通讯作者
(50) Exploiting the Ground-Truth: An Adversarial Imitation Based Knowledge Distillation Approach for Event Detection, THIRTY-THIRD AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE / THIRTY-FIRST INNOVATIVE APPLICATIONS OF ARTIFICIAL INTELLIGENCE CONFERENCE / NINTH AAAI SYMPOSIUM ON EDUCATIONAL ADVANCES IN ARTIFICIAL INTELLIGENCE, 2019, 第 2 作者
(51) Event Co-reference Resolution via a Multi-loss Neural Network without Using Argument Information, SCIENCE CHINA INFORMATION SCIENCES, 2019, 通讯作者
(52) Relation and Fact Type Supervised Knowledge Graph Embedding via Weighted Scores, CHINESE COMPUTATIONAL LINGUISTICS, CCL 2019, 2019, 第 2 作者
(53) Leverage Lexical Knowledge for Chinese Named Entity Recognition via Collaborative Graph Network, EMNLP 2019, 2019, 
(54) Neural Cross-Lingual Event Detection with Minimal Parallel Resources, EMNLP 2019, 2019, 
(55) Adversarial Training for Relation Classification with Attention based Gate Mechanism, CCKS 2018, 2018, 第 1 作者
(56) Event Detection via Gated Multilingual Attention Mechanism, 2018, 第 2 作者
(57) DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Labeled Training Data, 56TH ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS (ACL 2018): PROCEEDINGS OF SYSTEM DEMONSTRATIONS, 2018, 第 2 作者
(58) Collective Event Detection via a Hierarchical and Bias Tagging Networks with Gated Multi-level Attention Mechanisms., EMNLP2018(CCF B), 2018, 
(59) Event Detection via Gated Multilingual Attention Mechanism, THIRTY-SECOND AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE / THIRTIETH INNOVATIVE APPLICATIONS OF ARTIFICIAL INTELLIGENCE CONFERENCE / EIGHTH AAAI SYMPOSIUM ON EDUCATIONAL ADVANCES IN ARTIFICIAL INTELLIGENCE, 2018, 第 2 作者
(60) Adversarial Transfer Learning for Chinese Named Entity Recognition with Self-Attention Mechanism., EMNLP2018(CCF B), 2018, 
(61) Exploiting Argument Information to Improve Event Detection via Supervised Attention Mechanisms, PROCEEDINGS OF THE 55TH ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS (ACL 2017), VOL 1, 2017, 第 2 作者
(62) Improving Event Detection via Information Sharing Among Related Event Types, CHINESE COMPUTATIONAL LINGUISTICS AND NATURAL LANGUAGE PROCESSING BASED ON NATURALLY ANNOTATED BIG DATA, CCL 2017, 2017, 第 2 作者
(63) Automatically Labeled Data Generation for Large Scale Event Extraction, PROCEEDINGS OF THE 55TH ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS (ACL 2017), VOL 1, 2017, 通讯作者
(64) Attention-based Event Relevance Model for Stock Price Movement Prediction, 2017, 第 1 作者
(65) Automatically Labeled Data Generation for Large Scale Event Extraction, 2017, 第 1 作者
(66) Exploiting Argument Information to Improve Event Detection via Supervised Attention Mechanisms, 2017, 第 3 作者
(67) Improving Event Detection via Information Sharing among Related Event Types, 2017, 第 4 作者
(68) Event Extraction via Bidirectional Long Short-Term Memory Tensor Neural Networks, 2016, 第 1 作者
(69) Leveraging FrameNet to Improve Automatic Event Detection, 2016, 第 5 作者
(70) 融合多种特征的实体链接技术研究, Entity Linking Based on Multiple Features, 中文信息学报, 2016, 第 2 作者
(71) Leveraging FrameNet to Improve Automatic Event Detection, PROCEEDINGS OF THE 54TH ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, VOL 1, 2016, 第 2 作者
(72) Event Extraction via Dynamic Multi-Pooling Convolutional Neural Networks, 2015, 第 1 作者
(73) Event Extraction via Dynamic Multi-Pooling Convolutional Neural Networks, PROCEEDINGS OF THE 53RD ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS AND THE 7TH INTERNATIONAL JOINT CONFERENCE ON NATURAL LANGUAGE PROCESSING, VOL 1, 2015, 通讯作者
(74) Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks, 2015, 
(75) Learning the Distinctive Pattern Space Features for Relation Extraction, 2014, 第 2 作者
(76) The CASIA Entity linking System at TAC 2013, 2014, 第 3 作者
(77) Group Non-negative Matrix Factorization with Natural Categories for Question Retrieval in Community Question Answer Archives, COLING 2014, 2014, 第 1 作者
(78) 基于表示学习的中文分词算法探索, Chinese Word Segment Based on Character Representation Learning, 中文信息学报, 2013, 第 3 作者
(79) Walk and learn: A two-stage approach for opinion words and opinion targets co-extraction, INTERNATIONAL WORLD WIDE WEB CONFERENCE, 2013, 
(80) Towards Faster and Better Retrieval Models for Question Search, INTERNATIONAL CONFERENCE ON INFORMATION AND KNOWLEDGE MANAGEMENT (CIKM), 2013, 
(81) CASIA@QALD-3: A Question Answering System over Linked Data, PRO-CEEDINGS OF THE CROSS-LANGUAGE EVALUATION FORUM, 2013, 
(82) Mining opinion words and opinion targets in a two-stage framework, ANNUAL MEETING OF ASSOCIATION FOR COMPUTATIONAL LINGUISTICS (ACL), 2013, 
发表著作

《知识图谱》, Knowledge Graph, 高等教育出版社, 2018-12, 第 4 作者

《知识图谱:算法与实践》, Knowledge Graph:Algorithm and Practice, 高等教育出版社, 2022-3, 第 4 作者


科研活动

   
科研项目
( 1 ) 面向非结构化文本的大规模事件信息抽取关键技术研究, 负责人, 国家任务, 2019-01--2021-12
( 2 ) 知识获取与知识图谱, 负责人, 国家任务, 2019-01--2021-12
( 3 ) 大规模多粒度军事知识体系构建与集成平台, 参与, 中国科学院计划, 2020-11--2025-11
( 4 ) 面向军事博弈的知识体系 构建与服务平台, 负责人, 研究所自选, 2021-04--2023-04
( 5 ) 以自然语言为核心的语义理解研究, 参与, 国家任务, 2020-11--2023-10
( 6 ) 面向抑郁症智能诊疗的可解释对话系统研究, 参与, 中国科学院计划, 2020-01--2022-12
( 7 ) 面向案件审判全流程的智能问答技术及平台, 参与, 国家任务, 2018-07--2021-06
( 8 ) 知识关联与事件推理类问题求解关键技术与系统, 参与, 国家任务, 2019-05--2022-04
( 9 ) 大规模知识关联和文本语义计算方法及应用验证, 参与, 国家任务, 2016-01--2020-12
( 10 ) 建设《中国大百科全书》第三版百科知识图谱, 参与, 企业委托, 2017-12--2018-12
( 11 ) 知识图谱自动构建技术合作项目, 参与, 企业委托, 2017-07--2019-08
( 12 ) 症状知识图谱的构建及应用, 参与, 企业委托, 2018-09--2020-11
( 13 ) 金融知识图谱和问答系统, 参与, 企业委托, 2016-12--2019-12
( 14 ) 面向对话文本的事件知识抽取关键技术研究, 负责人, 企业委托, 2019-01--2021-12
( 15 ) 事件图谱构建与应用关键技术研究, 负责人, 企业委托, 2020-03--2021-03
( 16 ) 面向复杂应用场景的事件知识抽取关键技术研究, 负责人, 国家任务, 2022-01--2025-12
( 17 ) 中科院青促会项目, 负责人, 中国科学院计划, 2022-01--2025-12
参与会议
(1)信息抽取前沿技术综述   第十八届中国计算语言学大会(CCL 2019)   2019-10-18
(2)Collective Event Detection via a Hierarchical and Bias Tagging Networks with Gated Multi-level Attention Mechanisms   2018-11-04
(3) Automatically Labeled Data Generation for Large Scale Event Extraction   2017-07-30
(4)Event Extraction via Bidirectional Long Short-Term Memory Tensor Neural Networks   2016-10-14
(5)Event Extraction via Dynamic Multi-Pooling Convolutional Neural Networks   2015-07-26

合作情况

   
项目协作单位

华为

云知声

蚂蚁金服

阿里巴巴

Baidu

Tecent

中国大百科出版集团

指导/协助指导学生

已毕业学生:

刘健  博士研究生 (毕业去向:北京交通大学)

左新宇 博士研究生 (毕业去向:腾讯)

何霖 硕士研究生(毕业去向:京东)

隋典伯 博士研究生(毕业去向:哈尔滨工业大学(威海))

李筑聪 硕士研究生(毕业去向:复旦攻读博士学位)

杨航 博士研究生(毕业去向:百度)

曹鹏飞 博士研究生(毕业去向:中科院自动化所)

周波 博士研究生(毕业去向:华为)

黄修胜  硕士研究生(毕业去向:北京智源人工智能研究院攻读博士学位)


在读学生:

王晨皓  博士研究生

周阳     博士研究生

李嘉淳  博士研究生

付佳   硕士研究生

门天逸 博士研究生

苑红榜  硕士研究生

秦晓彤 硕士研究生

陈宇恒 硕士研究生

杜鹏帆 硕士研究生

张晨龙 硕士研究生

谢甲宽 直博生

郝煜朴 博士研究生



实习生:

罗坤  (北京科技大学)

周桐   (北京邮电大学,实习已结束,留组工作)

张保礼 (北京邮电大学,实习已结束,留组工作)

闫晨薇  (北京邮电大学,实习已结束,推免北邮博士)
蔡硕玮 (华南理工大学,实习已结束,香港科大攻读硕士)

吴顺 (北京交通大学,实习已结束,留组工作)

薛智朋 (北京交通大学,实习已结束,留组工作)

杨语晴 (中国科学院大学,实习已结束,保送复旦大学)

周宇洋  (北京邮电大学,实习已结束,香港攻读博士学位

干震   (北京化工大学,实习已结束,滴滴