
陈玉博 男 中国科学院自动化研究所 模式识别国家重点实验室
电子邮件: yubo.chen@nlpr.ia.ac.cn
通信地址: 北京市海淀区中关村东路95号自动化所智能化大厦711办公室
邮政编码:100190
个人主页:http://www.nlpr.ia.ac.cn/cip/yubochen/index.html
课题组招收硕博生、工程师、实习生,欢迎有意向的同学与我联系。
研究领域
自然语言处理:
计算语言学、深度学习下的自然语言处理
知识图谱和信息抽取:
实体识别、实体消歧、关系抽取、事件抽取、事件关系抽取
招生信息
招生专业
081203-计算机应用技术
081104-模式识别与智能系统
招生方向
教育背景
工作经历
工作简历
社会兼职
2017-07-31-今,中国中文信息学会语言与知识计算委员会, 委员
教授课程
专利与奖励
奖励信息
2022年入选中国科学院青年创新促进会,2022
2021年获中国电力科学院有限公司科学技术进步奖一等奖
《知识图谱》课程入选中国科学院大学校级研究生优秀课程(2021年)
2020年入选“第五届中国科协青年人才托举工程”, 国家级, 2020
2019年北京市科学技术进步奖一等奖(个人排名第五), 一等奖, 省级, 2019
中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖(个人排名第四), 一等奖, 专项, 2018
第十九届中国计算语言学大会(CCL 2020)最佳论文奖, 其他, 2020
2020年全国知识图谱与语义计算大会(CCKS 2020)最佳论文奖, 其他, 2020
CCF-腾讯犀牛鸟科研基金-优秀奖, 专项, 2020
CCF-腾讯犀牛鸟科研基金-优秀专利奖, 专项, 2020
中国科学院自动化研究所“十佳员工”, 研究所(学校), 2019
中国科学院自动化研究所模式识别国家重点实验室“优秀员工”, 研究所(学校), 2019
2017年北京市优秀毕业生, 省级, 2017
中国科学院大学优秀毕业生, 研究所(学校), 2017
第五届全国知识图谱与语义计算大会(CCKS 2017)“最佳论文奖”, 其他, 2017
第四届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD 2016)“最佳论文奖”, 其他, 2016
专利成果
基于知识巩固的增量事件识别方法、系统、装置, 发明, 2020, 第 1 作者, 专利号: 202011244409.x
基于联邦学习的分布式语言关系识别方法、系统和装置, 发明, 2020, 第 2 作者, 专利号: 202011285430.4
基于对抗模仿学习的事件识别及分类方法、系统、装置, 发明, 2021, 第 1 作者, 专利号: 201910440322.0
基于自注意力机制的中文命名实体识别方法、系统、装置, 发明, 2020, 第 1 作者, 专利号: 201811621018.8
基于多语注意力机制的事件识别及分类方法及装置, 发明, 2020, 第 1 作者, 专利号: 201711463578.0
出版信息
在ACL、EMNLP、COLING、AAAI、IJCAII等国际重要会议和期刊发表学术论文40余篇,出版《知识图谱》《知识图谱:算法与实践》专著两本,Google Scholar引用量2800余次,多次获得最佳论文奖(NLP-NABD 2016、CCKS 2017、CCL 2020),指导学生多次获得国际/国内学术评测奖励(NAACL-SMM4H 2021 社交媒体健康信息挖掘赛道冠军,SemEval 2022中文复杂命名实体识别赛道亚军,CCKS 2020医疗命名实体识别赛道冠军,万创杯天池中医药说明书实体识别挑战赛亚军,DCIC 2021数字中国创新大赛医疗大数据赛道亚军等)。更全的论文列表请参考:http://www.nlpr.ia.ac.cn/cip/yubochen/publications_cn.html
发表论文
CogKGE: A Knowledge Graph Embedding Toolkit and Benchmark for Representing Multi-source and Heterogeneous Knowledge , ACL 2022 Demo
Uncertain Local-to-Global Networks for Document-Level Event Factuality Identification , EMNLP 2021,2021 第 2 作者
Distantly Supervised Relation Extraction in Federated Settings , EMNLP 2021,2021 第 2 作者
Set Generation Networks for End-to-End Knowledge Base Population , EMNLP 2021,2021 第 3 作者
CroAno : A Crowd Annotation Platform for Improving Label Consistency of Chinese NER Dataset, ACL 2021 Demo,2021 第 4 作者
Uncertainty-Aware Self-Training for Semi-Supervised Event Temporal Relation Extraction, CIKM 2021,2021, 第 3作者
Multi-Sentence Argument Linking via An Event-Aware Hierarchical Encoder, CIKM 2021,2021, 第 2 作者
Multi-Task Self-Supervised Learning for Script Event Prediction, CIKM 2021,2021, 第 2 作者
CogIE: An Information Extraction Toolkit for Bridging Texts and CogNet, ACL 2021 Demo, 2021, 第 2 作者
Named Entity Recognition via Noise Aware Training Mechanism with Data Filter, ACL 2021 findings, 2021, 第 2 作者
Knowledge-Enriched Event Causality Identification via Latent Structure Induction Networks, ACL 2021, 2021, 第 3 作者
A Large-Scale Chinese NER Dataset with Speech Clues., ACL 2021, 2021, 第 3 作者
LearnDA: Learnable Knowledge-Guided Data Augmentation for Event Causality Identification, ACL 2021, 2021, 第 3 作者
Improving Event Causality Identification via Self-Supervised Representation Learning on External Causal Statement., ACL 2021 findings, 2021, 第 3 作者
Automatic ICD Coding via Interactive Shared Representation Networks with Self-distillation Mechanism, ACL 2021, 2021, 第 3 作者
Document-level Event Extraction via Parallel Prediction Networks, ACL 2021, 2021, 第 3 作者
Knowledge Guided Metric Learning for Few-Shot Text Classification, NAACL 2021, 2021, 第 2 作者
What the role is vs. What plays the role:Semi-supervised Event Argument Extraction via Dual Question Answering, AAAI 2021, 2021, 第 2 作者
CogNet: Bridging Linguistic Knowledge,World Knowledge and Commonsense Knowledge, AAAI 2021 Demo, 2021, 第 2 作者
Towards Causal Explanation Detection with Pyramid Salient-Aware Network, COLING 2020, 2020, 第 2 作者
Incremental Event Detection via Knowledge Consolidation Networks, EMNLP 2020, 2020, 第 2 作者
Event Extraction as Machine Reading Comprehension, EMNLP 2020, 2020, 第 2 作者
How Does Context Matter? On the Robustness of Event Detection with Context-Selective Mask Generalization, EMNLP 2020 findings, 2020, 第 2 作者
FedED: Federated Learning via Ensemble Distillation for Medical Relation Extraction, EMNLP 2020, 2020, 第 2 作者
Knowledge Enhanced Event Causality Identification with Mention Masking Generalizations, IJCAI 2020, 2020, 第 2 作者
HyperCore: Hyperbolic and Co-graph Representation for Automatic ICD Coding, ACL 2020, 2020, 第 2 作者
Towards Causal Explanation Detection with Pyramid Salient-Aware Network, CCL 2020 (Best Paper Award), 2020, 第 2 作者
Multi-Specialty Domain Adaptation for Chinese Medical Named Entity Recognition, CCKS 2020(Best Paper Award), 2020, 第 3 作者
Clinical-Coder: Assigning Interpretable ICD-10 Codes to Chinese Clinical Notes, ACL 2020 Demo, 2020, 第 4 作者
Leverage Lexical Knowledge for Chinese Named Entity Recognition via Collaborative Graph Network, EMNLP 2019, 2019, 第 2 作者
Neural Cross-Lingual Event Detection with Minimal Parallel Resources, EMNLP 2019, 2019, 第 2 作者
Exploiting the Ground-Truth: An Adversarial Imitation Based Knowledge Distillation Approach for Event Detection, AAAI 2019, 2019, 第 2 作者
Event Co-reference Resolution via a Multi-loss Neural Network without Using Argument Information, SCIENCE CHINA Information Sciences, 2019, 第 2 作者
Collective Event Detection via a Hierarchical and Bias Tagging Networks with Gated Multi-level Attention Mechanisms, EMNLP 2018, 2018, 第 1 作者
Adversarial Transfer Learning for Chinese Named Entity Recognition with Self-Attention Mechanism, EMNLP 2018, 2018, 第 2 作者
DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Labeled Training Data, ACL 2018 Demo, 2018, 第 2 作者
Event Detection via Gated Multilingual Attention Mechanism, AAAI 2018, 2018, 第 2 作者
Event Coreference Resolution via a Multi-loss Neural Network without Using Argument Information, CCKS 2018, 2018, 第 2 作者
Adversarial Training for Relation Classification with Attention based Gate Mechanism, CCKS 2018, 2018, 第 2 作者
Automatically Labeled Data Generation for Large Scale Event Extraction, ACL 2017, 2017, 第 1 作者
Exploiting Argument Information to Improve Event Detection via Supervised Attention Mechanisms, ACL 2017, 2017, 第 2 作者
Improving Event Detection via Information Sharing Among Related Event Types, CCL 2017, 2017, 第 2 作者
Attention-based Event Relevance Model for Stock Price Movement Prediction, CCKS 2017(Best Paper Award), 2017, 第 2 作者
Event Extraction via Bidirectional Long Short-Term Memory Tensor Neural Networks, NLP-NABD 2016(Best Paper Award), 2016, 第 1 作者
Leveraging FrameNet to Improve Automatic Event Detection, ACL 2016, 2016, 第 2 作者
Event Extraction via Dynamic Multi-Pooling Convolutional Neural Networks, ACL 2015, 2015, 第 1 作者
Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks, EMNLP 2015, 2015, 第 3 作者
Group Non-negative Matrix Factorization with Natural Categories for Question Retrieval in Community Question Answer Archives, COLING 2014, 2014, 第 2 作者
The CASIA Entity linking System at TAC 2013, TAC 2013, 2013, 第 1 作者
Towards Faster and Better Retrieval Models for Question Search, CIKM 2013, 2013, 第 2 作者
Mining Opinion Words and Opinion Targets in a Two-Stage Framework, ACL 2013, 2013, 第 4 作者
Walk and Learn: A Two-Stage Approach for Opinion Words and Opinion Targets Co-Extraction, WWW 2013, 2013, 第 4 作者
CASIA@QALD-3: A Question Answering System over Linked Data, CLEF 2013, 2013, 第 3 作者
发表著作
《知识图谱》, Knowledge Graph, 高等教育出版社, 2018-12, 第 4 作者
《知识图谱:算法与实践》, Knowledge Graph:Algorithm and Practice, 高等教育出版社, 2022-3, 第 4 作者
科研活动
科研项目
参与会议
合作情况
项目协作单位
华为
云知声
蚂蚁金服
阿里巴巴
Baidu
Tecent
中国大百科出版集团
协助指导学生
已毕业学生:
刘健 博士研究生 (毕业去向:北京交通大学)
左新宇 博士研究生 (毕业去向:腾讯)
何霖 硕士研究生(毕业去向:京东)
在读学生:
隋典伯 博士研究生
曹鹏飞 博士研究生
杨航 博士研究生
周波 博士研究生
王晨皓 博士研究生
周阳 博士研究生
李筑聪 硕士研究生
黄修胜 硕士研究生
李嘉淳 博士研究生
付佳 硕士研究生
门天逸 博士研究生
苑红榜 硕士研究生
秦晓彤 硕士研究生
陈宇恒 硕士研究生
杜鹏帆 硕士研究生
实习生:
干震 (北京化工大学)
周桐 (北京邮电大学)
周宇洋 (北京邮电大学)
罗坤 (北京科技大学)
张保礼 (北京邮电大学,实习已结束,留组工作)
闫晨薇 (北京邮电大学,实习已结束,推免北邮博士)
蔡硕玮 (华南理工大学,实习已结束,香港科大攻读硕士)
吴顺 (北京交通大学,实习已结束,留组工作)
薛智朋 (北京交通大学,实习已结束,留组工作)
杨语晴 (中国科学院大学,实习已结束,保送复旦大学)