基本信息

柳厅文  男  研究员 博士生导师  中国科学院信息工程研究所第二研究室
电子邮件: liutingwen@iie.ac.cn
通信地址: 海淀区闵庄路甲89号A3楼
邮政编码: 100093

个人简介

中国科学院信息工程研究所研究员、博士生导师,中国科学院大学网络空间安全学院岗位教授,国家重点研发计划青年科学家项目负责人,中国科学院青年创新促进会会员,中国科学院信息工程研究所引进优秀青年人才。2007年7月毕业于哈尔滨工业大学获学士学位,2013年毕业于中国科学院计算技术研究所获博士学位,导师是方滨兴院士和郭莉教授。研究方向为知识图谱、自然语言处理、网络公害治理、开源情报分析,以构建大规模知识图谱并赋能信息内容安全行业智能应用为目标,先后主持和参与中科院先导专项、国家重点研发计划、军队预研项目、国家部委重大工程、国家自然科学基金等多项重要科研任务。近年来在ACL、WWW、SIGIR、ICDE等领域重要会议期刊上发表高水平论文50余篇,获得授权专利10余项,获得省部级科技进步二等奖一次、2016年度百度&西交大大数据竞赛一等奖、2021年度全国信息检索挑战杯二等奖、DSC 2021 最佳论文亚军。连续多年担任WWW、SIGIR、CIKM、TKDE等10余个领域顶级会议、期刊的程序委员和审稿人。培养学生多人次获得中国科学院院长特别奖、北京市优秀毕业生、国家奖学金等荣誉,毕业去向包括阿里、百度、腾讯等互联网大厂,以及北京大学、中科院信工所等科研单位。 

教育背景

2007-09--2013-01   中国科学院大学   工学博士
2003-09--2007-07   哈尔滨工业大学   工学学士

工作经历


工作简历
2021-10~现在, 中国科学院信息工程研究所, 研究员
2015-10~2021-10,中国科学院信息工程研究所, 副研究员
2013-04~2015-10,中国科学院信息工程研究所, 助理研究员
社会兼职
2020-06-30-今,中国中文信息学会语言与知识计算专委会委员,
2020-02-17-今,中国中文信息学会青年工作委员会委员,

教授课程

知识图谱构建与安全应用
深度学习与安全

专利与奖励

   
奖励信息
(1) 全国信息检索挑战杯中文命名实体识别算法鲁棒性评测, 二等奖, 其他, 2021
(2) 中国科学院青年创新促进会, 部委级, 2020
(3) 第二届百度&西安交通大学大数据竞赛, 一等奖, 其他, 2016
(4) 社会网站关键技术及应用, 二等奖, 部委级, 2016
(5) CCML 2015机器学习竞赛, 二等奖, 其他, 2015
(6) 中国科学院信息工程研究所引进优秀青年人才, 研究所(学校), 2014
(7) 中国科学院计算技术研究所优秀学术论文, 一等奖, 研究所(学校), 2011
代表性专利
[1] 亚静, 柳厅文, 张盼盼, 李全刚, 时金桥, 郭莉. 一种针对URL的分词方法及装置. CN: CN108228710B, 2021-09-28.

[2] 李全刚, 柳厅文, 李彦增, 王学宾, 亚静, 李柢颖, 时金桥. 一种基于中文字符词性特征的目标实体识别方法及装置. CN: CN108959242B, 2021-07-27.

[3] 柳厅文, 张盼盼, 亚静, 李全刚, 时金桥. 一种基于多示例学习的可疑威胁指标验证方法及系统. CN: CN110020190B, 2021-06-01.

[4] 柳厅文, 郁博文, 王玉斌, 张振宇, 亚静. 一种半开放信息抽取的方法及装置. CN: CN112651234A, 2021-04-13.

[5] 王玉斌, 柳厅文, 薛梦鸽, 李全刚, 苏涛宇, 崔诗尧. 基于融入结构化实体信息的缩写项目名称识别方法及电子装置. CN: CN112651243A, 2021-04-13.

[6] 亚静, 张盼盼, 柳厅文, 王玉斌, 李全刚, 王学宾, 时金桥. 一种基于开源信息的可疑威胁指标主动验证方法和系统. CN: CN109194605B, 2020-08-25.

[7] 时金桥, 亚静, 柳厅文, 舒晓波, 张振宇, 张盼盼, 郭莉. 一种面向钓鱼URL检测的相似样本集构造方法. CN: CN107798080B, 2020-05-22.

[8] 柳厅文, 李全刚, 李柢颖, 亚静, 时金桥, 谭建龙. 一种基于文本内容的信息源识别方法与装置. CN: CN107451433B, 2020-05-22.

[9] 柳厅文, 闫旸, 赵佳鹏, 李柢颖, 张盼盼, 李全刚, 亚静, 时金桥, 郭莉. 一种基于隐式马尔科夫模型的科技类复合短语识别方法. CN: CN106569997B, 2019-12-10.

[10] 李全刚, 柳厅文, 王玉斌, 李柢颖, 时金桥, 亚静, 郭莉. 一种面向评价性文本的核心实体识别方法及装置. CN: CN106570179B, 2019-11-19.

[11] 李全刚, 柳厅文, 王玉斌, 李柢颖, 时金桥, 亚静, 郭莉. 一种基于字模型的评论文本实体识别方法及装置. CN: CN106776555B, 2019-11-15.

[12] 柳厅文, 王玉斌, 时金桥, 亚静, 李全刚. 一种基于用户名相似度的跨网站用户关联方法. CN: CN106126654B, 2019-10-18.

[13] 柳厅文, 张洋, 亚静, 李全刚, 时金桥, 郭莉. 一种最小距离字符串计算查找方法. CN: CN105913094B, 2019-06-21.

[14] 柳厅文, 张洋, 亚静, 李全刚, 时金桥, 郭莉. 一种基于视觉的字符串相似度计算方法及相似性判断方法. CN: CN106127222B, 2019-06-04.

[15] 亚静, 柳厅文, 张浩亮, 时金桥. 一种网络安全日志模板抽取方法及装置. CN: CN105049247B, 2019-04-26.

[16] 柳厅文, 亚静, 张浩亮, 时金桥, 赵佳鹏, 闫旸, 李全刚, 张洋. 一种面向新闻标题的人物关系抽取方法. CN: CN105608070B, 2019-01-25.

[17] 亚静, 柳厅文, 时金桥, 张盼盼, 张振宇, 王玉斌, 李全刚. 一种基于词序列的钓鱼URL检测方法及系统. CN: CN107992469A, 2018-05-04.

[18] 柳厅文, 时金桥, 张洋, 闫旸, 郭莉, 张浩亮, 亚静. 一种基于自学习规则的项目名实体识别方法及系统. CN: CN104965818B, 2018-01-05.

[19] 张浩亮, 柳厅文, 时金桥, 亚静, 郭莉, 胡兰兰, 季月英, 闫旸. 一种开放式的多源数据采集系统及方法. CN: CN104111983B, 2017-12-19.

[20] 时金桥, 柳厅文, 李柢颖, 李全刚, 亚静, 谭建龙. 一种功性能描述信息识别方法及装置. CN: CN107301167A, 2017-10-27.

[21] 柳厅文, 闫旸, 李全刚, 亚静, 王玉斌, 时金桥, 郭莉. 一种基于社团划分的无监督复合短语识别方法. CN: CN106897264A, 2017-06-27.

[22] 柳厅文, 闫旸, 赵佳鹏, 李全刚, 亚静, 时金桥, 郭莉. 基于图的最大紧密度划分的复合短语无监督识别方法. CN: CN106649265A, 2017-05-10.

[23] 亚静, 王玉斌, 柳厅文, 时金桥, 李全刚. 一种识别用户名缩写现象的方法. CN: CN106168946A, 2016-11-30.

[24] 蒲以国, 陈小军, 时金桥, 郭莉, 柳厅文, 文新, 徐睿. 一种基于多属性的误发邮件检测方法. CN: CN104794176A, 2015-07-22.

[25] 柳厅文, 张浩亮, 闫旸, 时金桥, 亚静, 季月英. 一种确定文本视觉相似度的方法. CN: CN104375982A, 2015-02-25.

[26] 时金桥, 柳厅文, 李全刚. 一种通信网络模拟数据生成方法. CN: CN103763151A, 2014-04-30.

[27] 时金桥, 柳厅文, 李全刚. 一种面向通信网络的用户行为模式挖掘方法及系统. CN: CN103744994A, 2014-04-23.

[28] 孙永, 柳厅文, 刘洋, 杨威, 刘庆云, 郑超, 杨嵘, 周舟. 度量正则表达式状态复杂度的方法及装置. CN: CN103632048A, 2014-03-12.

[29] 柳厅文, 李全刚, 时金桥. 一种动态通信网络构建方法及装置. CN: CN103336865A, 2013-10-02.

出版信息

   
代表性论文
(1) Improving Distantly-Supervised Named Entity Recognition with Self-Collaborative Denoising Learning, SIGIR, 2022, 通讯作者
(2) Enhancing Deep Paraphrase Identification Via Leveraging Word Alignment Information, ICASSP, 2021, 通讯作者
(3) Discontinuous Named Entity Recognition as Maximal Clique Discovery, EMNLP, 2021, 通讯作者
(4) Few-Shot Event Detection with Prototypical Amortized Conditional Random Field, Findings of ACL, 2021, 通讯作者
(5) Enhancing Pre-trained Chinese Character Representation with Word-aligned Attention, ACL, 2021, 通讯作者
(6) NA-Aware Machine Reading Comprehension for Document-Level Relation Extraction, ECML-PKDD, 2021, 通讯作者
(7) CasEE: A Joint Learning Framework with Cascade Decoding for Overlapping Event Extraction, Findings of ACL, 2021, 第 7 作者
(8) Deep Structural Point Process for Learning Temporal Interaction Networks, ECML-PKDD, 2021, 通讯作者
(9) Semi-Open Information Extraction, WWW, 2021, 通讯作者
(10) From What to Why: Improving Relation Extraction with Rationale Graph, Findings of ACL, 2021, 通讯作者
(11) SEPC: Improving Joint Extraction of Entities and Relations by Strengthening Entity Pairs Connection, ADVANCES IN KNOWLEDGE DISCOVERY AND DATA MINING, PAKDD 2021, PT I, 2021, 通讯作者
(12) FITAnnotator: A Flexible and Intelligent Text Annotation System (Demo Paper), NAACL, 2021, 通讯作者
(13) Maximal Clique Based Non-Autoregressive Open Information Extraction, EMNLP, 2021, 通讯作者
(14) Heterogeneous Graph Neural Networks for Query-focused Summarization, SDM, 2021, 第 2 作者
(15) Label Noise Robust Curriculum for Deep Paraphrase Identification, 2020 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), 2020, 通讯作者
(16) A Compare-Aggregate Model with External Knowledge for Query-focused Summarization, WISE 2020, 2020, 通讯作者
(17) SLGAT: Soft Labels Guided Graph Attention Networks, ADVANCES IN KNOWLEDGE DISCOVERY AND DATA MINING, PAKDD 2020, PT I, 2020, 通讯作者
(18) Learning to Prune Dependency Trees with Rethinking for Neural Relation Extraction, COLING, 2020, 通讯作者
(19) Distilling Knowledge from Well-Informed Soft Labels for Neural Relation Extraction, AAAI, 2020, 通讯作者
(20) TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking, COLING, 2020, 第 4 作者
(21) Document-level Relation Extraction with Dual-tier Heterogeneous Graph, COLING, 2020, 通讯作者
(22) Porous Lattice-based Transformer Encoder for Chinese NER, 2020, 通讯作者
(23) Aspect Level Sentiment Classification with Unbiased Attention and Target Enhanced Representations, PROCEEDINGS OF THE 35TH ANNUAL ACM SYMPOSIUM ON APPLIED COMPUTING (SAC'20), 2020, 第 2 作者
(24) Inductive Unsupervised Domain Adaptation for Few-Shot Classification via Clustering, ECML-PKDD, 2020, 通讯作者
(25) Bipartite Graph Embedding via Mutual Information Maximization, WSDM, 2020, 通讯作者
(26) DRG2vec: Learning Word Representations from Definition Relational Graph, 2020 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), 2020, 通讯作者
(27) Fine-grained Semantics-aware Heterogeneous Graph Neural Networks, WISE, 2020, 通讯作者
(28) Joint Entity Linking and Relation Extraction with Neural Networks for Knowledge Base Population, 2020 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), 2020, 通讯作者
(29) BiG-Transformer: Integrating Hierarchical Features for Transformer via Bipartite Graph, 2020 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), 2020, 通讯作者
(30) Adaptive Attentional Network for Few-Shot Knowledge Graph Completion, EMNLP, 2020, 第 6 作者
(31) Coarse-to-Fine Pre-training for Named Entity Recognition, EMNLP, 2020, 通讯作者
(32) Edge-Enhanced Graph Convolution Networks for Event Detection with Syntactic Relation, Findings of EMNLP, 2020, 通讯作者
(33) ICNet: Incorporating Indicator Words and Contexts to Identify Functional Description Information, 2019 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), 2019, 通讯作者
(34) Beyond Word Attention: Using Segment Attention in Neural Relation Extraction, IJCAI, 2019, 通讯作者
(35) Revising Attention with Position for Aspect-Level Sentiment Classification, ICANN, 2019, 通讯作者
发表著作
(1) ElasticSearch 可扩展的开源弹性搜索解决方案, 电子工业出版社, 2015-01, 第 2 作者

科研活动

   
科研项目
( 1 ) 面向骨干网DPI系统的资源消耗攻击防御技术研究, 负责人, 国家任务, 2014-01--2016-12
( 2 ) 基于大数据分析的互联网XXXX系统研制, 负责人, 国家任务, 2014-07--2016-06
( 3 ) 面向互联网开源知识库的XX分析, 参与, 研究所自选, 2015-10--2016-06
( 4 ) 大数据挖掘技术及系统(重研子课题), 负责人, 国家任务, 2016-12--2020-11
( 5 ) 基于样本学习的关键词抽取技术及系统(某部委科研项目), 负责人, 国家任务, 2017-08--2018-07
( 6 ) 协同检测与分析关键技术研究(C类先导课题), 负责人, 中国科学院计划, 2019-01--2019-12
( 7 ) 网络探测分析技术研究(预研项目), 负责人, 国家任务, 2019-01--2020-12
( 8 ) 协同检测与分析关键技术研究(C类先导课题), 负责人, 中国科学院计划, 2020-01--2020-12
( 9 ) 协同检测与分析关键技术研究(C类先导课题), 负责人, 中国科学院计划, 2021-01--2021-12
( 10 ) 协同检测与分析关键技术研究(C类先导课题), 负责人, 中国科学院计划, 2022-01--2022-12
( 11 ) 面向网络公害治理的知识图谱构建理论研究(青年科学家项目), 负责人, 国家任务, 2021-12--2024-11

指导学生

已指导学生

舒晓波  硕士研究生  083900-网络空间安全  

李彦增  硕士研究生  085211-计算机技术  

谢明轩  硕士研究生  085211-计算机技术  

笪城源  硕士研究生  085211-计算机技术  

现指导学生

刘天昀  硕士研究生  085400-电子信息  

王继平  硕士研究生  085400-电子信息  

张舸航  硕士研究生  081203-计算机应用技术  

张竞文  硕士研究生  085400-电子信息