基本信息

陈玉博  男    中国科学院自动化研究所 模式识别国家重点实验室
电子邮件: yubo.chen@nlpr.ia.ac.cn
通信地址: 北京市海淀区中关村东路95号自动化所智能化大厦711办公室

邮政编码:100190

个人主页:http://www.nlpr.ia.ac.cn/cip/yubochen/index.html

课题组招收硕博生、工程师、实习生,欢迎有意向的同学与我联系。

研究领域

自然语言处理:

计算语言学、深度学习下的自然语言处理

知识图谱和信息抽取:

实体识别、实体消歧、关系抽取、事件抽取、事件关系抽取

招生信息


招生专业

081203-计算机应用技术

081104-模式识别与智能系统

招生方向
自然语言处理,知识图谱,信息抽取,事件抽取

教育背景

2012-09--2017-07   中国科学院大学   工学博士学位
2008-09--2012-07   北京化工大学   工学学士学位

工作经历

   
工作简历
2019-10~现在, 中国科学院自动化研究所, 副研究员
2017-07~2019-10,中国科学院自动化研究所, 助理研究员
社会兼职
2020-12-31-今,中国中文信息学会青年工作委员会, 执行委员
2017-07-31-今,中国中文信息学会语言与知识计算委员会, 委员

教授课程

知识图谱
知识图谱与语义计算
知识图谱导论

专利与奖励

奖励信息

  • 2022年入选中国科学院青年创新促进会,2022

  • 2021年获中国电力科学院有限公司科学技术进步奖一等奖

  • 《知识图谱》课程入选中国科学院大学校级研究生优秀课程(2021年)

  • 2020年入选“第五届中国科协青年人才托举工程”, 国家级, 2020

  • 2019年北京市科学技术进步奖一等奖(个人排名第五), 一等奖, 省级, 2019

  • 中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖(个人排名第四), 一等奖, 专项, 2018

  •  第十九届中国计算语言学大会(CCL 2020)最佳论文奖, 其他, 2020

  •  2020年全国知识图谱与语义计算大会(CCKS 2020)最佳论文奖, 其他, 2020

  •  CCF-腾讯犀牛鸟科研基金-优秀奖, 专项, 2020

  •  CCF-腾讯犀牛鸟科研基金-优秀专利奖, 专项, 2020

  •  中国科学院自动化研究所“十佳员工”, 研究所(学校), 2019

  •  中国科学院自动化研究所模式识别国家重点实验室“优秀员工”, 研究所(学校), 2019

  •  2017年北京市优秀毕业生, 省级, 2017

  •  中国科学院大学优秀毕业生, 研究所(学校), 2017

  •  第五届全国知识图谱与语义计算大会(CCKS 2017)“最佳论文奖”, 其他, 2017

  •  第四届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD 2016)“最佳论文奖”,  其他, 2016


专利成果

  • 基于知识巩固的增量事件识别方法、系统、装置, 发明, 2020, 第 1 作者, 专利号: 202011244409.x

  • 基于联邦学习的分布式语言关系识别方法、系统和装置, 发明, 2020, 第 2 作者, 专利号: 202011285430.4

  • 基于对抗模仿学习的事件识别及分类方法、系统、装置, 发明, 2021, 第 1 作者, 专利号: 201910440322.0

  • 基于自注意力机制的中文命名实体识别方法、系统、装置, 发明, 2020, 第 1 作者, 专利号: 201811621018.8

  • 基于多语注意力机制的事件识别及分类方法及装置, 发明, 2020, 第 1 作者, 专利号: 201711463578.0


出版信息

在ACL、EMNLP、COLING、AAAI、IJCAII等国际重要会议和期刊发表学术论文40余篇,出版《知识图谱》《知识图谱:算法与实践》专著两本,Google Scholar引用量2800余次,多次获得最佳论文奖(NLP-NABD 2016、CCKS 2017、CCL 2020),指导学生多次获得国际/国内学术评测奖励(NAACL-SMM4H 2021 社交媒体健康信息挖掘赛道冠军,SemEval 2022中文复杂命名实体识别赛道亚军,CCKS 2020医疗命名实体识别赛道冠军,万创杯天池中医药说明书实体识别挑战赛亚军,DCIC 2021数字中国创新大赛医疗大数据赛道亚军等)。更全的论文列表请参考:http://www.nlpr.ia.ac.cn/cip/yubochen/publications_cn.html


发表论文
  • CogKGE: A Knowledge Graph Embedding Toolkit and Benchmark for Representing Multi-source and Heterogeneous Knowledge     , ACL 2022    Demo

  • Uncertain Local-to-Global Networks for Document-Level Event Factuality Identification , EMNLP 2021,2021 第 2 作者 

  • Distantly Supervised Relation Extraction in Federated Settings , EMNLP 2021,2021 第 2 作者 

  • Set Generation Networks for End-to-End Knowledge Base Population , EMNLP 2021,2021 第 3 作者 

  • CroAno : A Crowd Annotation Platform for Improving Label Consistency of Chinese NER Dataset, ACL 2021 Demo,2021 第 4 作者     

  • Uncertainty-Aware Self-Training for Semi-Supervised Event Temporal Relation Extraction, CIKM 2021,2021, 第 3作者     

  • Multi-Sentence Argument Linking via An Event-Aware Hierarchical Encoder, CIKM 2021,2021, 第 2 作者     

  • Multi-Task Self-Supervised Learning for Script Event Prediction, CIKM 2021,2021, 第 2 作者

  • CogIE: An Information Extraction Toolkit for Bridging Texts and CogNet, ACL 2021 Demo, 2021, 第 2 作者

  • Named Entity Recognition via Noise Aware Training Mechanism with Data Filter, ACL 2021 findings, 2021, 第 2 作者

  • Knowledge-Enriched Event Causality Identification via Latent Structure Induction Networks, ACL 2021, 2021, 第 3 作者

  • A Large-Scale Chinese NER Dataset with Speech Clues., ACL 2021, 2021, 第 3 作者

  • LearnDA: Learnable Knowledge-Guided Data Augmentation for Event Causality Identification, ACL 2021, 2021, 第 3 作者

  • Improving Event Causality Identification via Self-Supervised Representation Learning on External Causal Statement., ACL 2021 findings, 2021, 第 3 作者

  • Automatic ICD Coding via Interactive Shared Representation Networks with Self-distillation Mechanism, ACL 2021, 2021, 第 3 作者

  • Document-level Event Extraction via Parallel Prediction Networks, ACL 2021, 2021, 第 3 作者

  • Knowledge Guided Metric Learning for Few-Shot Text Classification, NAACL 2021, 2021, 第 2 作者

  • What the role is vs. What plays the role:Semi-supervised Event Argument Extraction via Dual Question Answering, AAAI 2021, 2021, 第 2 作者

  • CogNet: Bridging Linguistic Knowledge,World Knowledge and Commonsense Knowledge, AAAI 2021 Demo, 2021, 第 2 作者

  • Towards Causal Explanation Detection with Pyramid Salient-Aware Network, COLING 2020, 2020, 第 2 作者

  • Incremental Event Detection via Knowledge Consolidation Networks, EMNLP 2020, 2020, 第 2 作者

  • Event Extraction as Machine Reading Comprehension, EMNLP 2020, 2020, 第 2 作者

  • How Does Context Matter? On the Robustness of Event Detection with Context-Selective Mask Generalization, EMNLP 2020 findings, 2020, 第 2 作者

  • FedED: Federated Learning via Ensemble Distillation for Medical Relation Extraction, EMNLP 2020, 2020, 第 2 作者

  • Knowledge Enhanced Event Causality Identification with Mention Masking Generalizations, IJCAI 2020, 2020, 第 2 作者

  • HyperCore: Hyperbolic and Co-graph Representation for Automatic ICD Coding, ACL 2020, 2020, 第 2 作者

  • Towards Causal Explanation Detection with Pyramid Salient-Aware Network, CCL 2020 (Best Paper Award), 2020, 第 2 作者

  • Multi-Specialty Domain Adaptation for Chinese Medical Named Entity Recognition, CCKS 2020(Best Paper Award), 2020, 第 3 作者

  • Clinical-Coder: Assigning Interpretable ICD-10 Codes to Chinese Clinical Notes, ACL 2020 Demo, 2020, 第 4 作者

  • Leverage Lexical Knowledge for Chinese Named Entity Recognition via Collaborative Graph Network, EMNLP 2019, 2019, 第 2 作者

  • Neural Cross-Lingual Event Detection with Minimal Parallel Resources, EMNLP 2019, 2019, 第 2 作者

  • Exploiting the Ground-Truth: An Adversarial Imitation Based Knowledge Distillation Approach for Event Detection, AAAI 2019, 2019, 第 2 作者

  • Event Co-reference Resolution via a Multi-loss Neural Network without Using Argument Information, SCIENCE CHINA Information Sciences, 2019, 第 2 作者

  • Collective Event Detection via a Hierarchical and Bias Tagging Networks with Gated Multi-level Attention Mechanisms, EMNLP 2018, 2018, 第 1 作者

  • Adversarial Transfer Learning for Chinese Named Entity Recognition with Self-Attention Mechanism, EMNLP 2018, 2018, 第 2 作者

  • DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Labeled Training Data, ACL 2018 Demo, 2018, 第 2 作者

  • Event Detection via Gated Multilingual Attention Mechanism, AAAI 2018, 2018, 第 2 作者

  • Event Coreference Resolution via a Multi-loss Neural Network without Using Argument Information, CCKS 2018, 2018, 第 2 作者

  • Adversarial Training for Relation Classification with Attention based Gate Mechanism, CCKS 2018, 2018, 第 2 作者

  • Automatically Labeled Data Generation for Large Scale Event Extraction, ACL 2017, 2017, 第 1 作者

  • Exploiting Argument Information to Improve Event Detection via Supervised Attention Mechanisms, ACL 2017, 2017, 第 2 作者

  • Improving Event Detection via Information Sharing Among Related Event Types, CCL 2017, 2017, 第 2 作者

  • Attention-based Event Relevance Model for Stock Price Movement Prediction, CCKS 2017(Best Paper Award), 2017, 第 2 作者

  • Event Extraction via Bidirectional Long Short-Term Memory Tensor Neural Networks, NLP-NABD 2016(Best Paper Award), 2016, 第 1 作者

  • Leveraging FrameNet to Improve Automatic Event Detection, ACL 2016, 2016, 第 2 作者

  • Event Extraction via Dynamic Multi-Pooling Convolutional Neural Networks, ACL 2015, 2015, 第 1 作者

  • Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks, EMNLP 2015, 2015, 第 3 作者

  • Group Non-negative Matrix Factorization with Natural Categories for Question Retrieval in Community Question Answer Archives, COLING 2014, 2014, 第 2 作者

  • The CASIA Entity linking System at TAC 2013, TAC 2013, 2013, 第 1 作者

  • Towards Faster and Better Retrieval Models for Question Search, CIKM 2013, 2013, 第 2 作者

  • Mining Opinion Words and Opinion Targets in a Two-Stage Framework, ACL 2013, 2013, 第 4 作者

  • Walk and Learn: A Two-Stage Approach for Opinion Words and Opinion Targets Co-Extraction, WWW 2013, 2013, 第 4 作者

  • CASIA@QALD-3: A Question Answering System over Linked Data, CLEF 2013, 2013, 第 3 作者


发表著作

《知识图谱》, Knowledge Graph, 高等教育出版社, 2018-12, 第 4 作者

《知识图谱:算法与实践》, Knowledge Graph:Algorithm and Practice, 高等教育出版社, 2022-3, 第 4 作者


科研活动

   
科研项目
( 1 ) 面向非结构化文本的大规模事件信息抽取关键技术研究, 主持, 国家级, 2019-01--2021-12
( 2 ) 知识获取与知识图谱, 主持, 国家级, 2019-01--2021-12
( 3 ) 大规模多粒度知识体系构建与集成平台, 参与, 部委级, 2020-11--2025-11
( 4 ) 知识体系构建与服务平台, 主持, 市地级, 2021-04--2023-04
( 5 ) 以自然语言为核心的语义 理解研究, 参与, 国家级, 2020-11--2023-10
( 6 ) 面向抑郁症智能诊疗的可解释对话系统研究, 参与, 部委级, 2020-01--2022-12
( 7 ) 面向案件审判全流程的智能问答技术及平台, 参与, 国家级, 2018-07--2021-06
( 8 ) 知识关联与事件推理类问题求解关键技术与系统, 参与, 国家级, 2019-05--2022-04
( 9 ) 大规模知识关联和文本语义计算方法及应用验证, 参与, 国家级, 2016-01--2020-12
( 10 ) 建设《中国大百科全书》第三版百科知识图谱, 参与, 院级, 2017-12--2018-12
( 11 ) 知识图谱自动构建技术合作项目, 参与, 院级, 2017-07--2019-08
( 12 ) 症状知识图谱的构建及应用, 参与, 院级, 2018-09--2020-11
( 13 ) 金融知识图谱和问答系统, 参与, 院级, 2016-12--2019-12
( 14 ) 面向对话文本的事件知识抽取关键技术研究, 主持, 院级, 2019-01--2021-12
( 15 ) 事件图谱构建与应用关键技术研究, 主持, 院级, 2020-03--2021-03
参与会议
(1)信息抽取前沿技术综述   第十八届中国计算语言学大会(CCL 2019)   2019-10-18
(2)Collective Event Detection via a Hierarchical and Bias Tagging Networks with Gated Multi-level Attention Mechanisms   2018-11-04
(3) Automatically Labeled Data Generation for Large Scale Event Extraction   2017-07-30
(4)Event Extraction via Bidirectional Long Short-Term Memory Tensor Neural Networks   2016-10-14
(5)Event Extraction via Dynamic Multi-Pooling Convolutional Neural Networks   2015-07-26

合作情况

   
项目协作单位

华为

云知声

蚂蚁金服

阿里巴巴

Baidu

Tecent

中国大百科出版集团

协助指导学生

已毕业学生:

刘健  博士研究生 (毕业去向:北京交通大学)

左新宇 博士研究生 (毕业去向:腾讯)

何霖 硕士研究生(毕业去向:京东)



在读学生:

隋典伯 博士研究生

曹鹏飞 博士研究生

杨航     博士研究生

周波     博士研究生

王晨皓  博士研究生

周阳     博士研究生

李筑聪  硕士研究生

黄修胜  硕士研究生

李嘉淳  博士研究生

付佳   硕士研究生

门天逸 博士研究生

苑红榜  硕士研究生

秦晓彤 硕士研究生

陈宇恒 硕士研究生

杜鹏帆 硕士研究生



实习生:

干震   (北京化工大学)

周桐   (北京邮电大学)

周宇洋  (北京邮电大学)

罗坤  (北京科技大学)

张保礼 (北京邮电大学,实习已结束,留组工作)

闫晨薇  (北京邮电大学,实习已结束,推免北邮博士)
蔡硕玮 (华南理工大学,实习已结束,香港科大攻读硕士)

吴顺 (北京交通大学,实习已结束,留组工作)

薛智朋 (北京交通大学,实习已结束,留组工作)

杨语晴 (中国科学院大学,实习已结束,保送复旦大学)