基本信息

柳厅文   中国科学院信息工程研究所研究员
电子邮件: liutingwen@iie.ac.cn
通信地址: 海淀区闵庄路甲89号A3楼
邮政编码: 100093

个人简介

中国科学院信息工程研究所研究员,中国科学院大学网络空间安全学院岗位教授,国家重点研发计划青年科学家,中国科学院青年创新促进会会员,中国科学院信息工程研究所引进优秀青年人才。2013年博士毕业于中国科学院计算技术研究所,导师是方滨兴院士和郭莉教授。作为负责人承担中科院C类先导专项课题、军队预研项目、国家自然科学基金等多项重要科研任务,主要工作是知识图谱构建及其在内容安全中的应用,研究兴趣包括信息抽取、文本匹配和知识图谱等。近年来以第一或通讯作者身份发表高水平论文20余篇,获得授权专利10余项,连续多年担任KDD、WWW、SIGIR、EMNLP、WSDM、TKDE、TASLP等重要会议期刊的程序委员和审稿人。

教育背景

2007-09--2013-01   中国科学院大学   工学博士
2003-09--2007-07   哈尔滨工业大学   工学学士

工作经历


工作简历
2021-10~现在, 中国科学院信息工程研究所, 研究员
2015-10~2021-10,中国科学院信息工程研究所, 副研究员
2013-04~2015-10,中国科学院信息工程研究所, 助理研究员
社会兼职
2020-06-30-今,中国中文信息学会语言与知识计算专委会委员,
2020-02-17-今,中国中文信息学会青年工作委员会委员,

教授课程

知识图谱构建与安全应用
深度学习与安全

专利与奖励

   
奖励信息
(1) 全国信息检索挑战杯中文命名实体识别算法鲁棒性评测, 二等奖, 其他, 2021
(2) 中国科学院青年创新促进会, 部委级, 2020
(3) 第二届百度&西安交通大学大数据竞赛, 一等奖, 其他, 2016
(4) 社会网站关键技术及应用, 二等奖, 部委级, 2016
(5) CCML 2015机器学习竞赛, 二等奖, 其他, 2015
(6) 中国科学院信息工程研究所引进优秀青年人才, 研究所(学校), 2014
(7) 中国科学院计算技术研究所优秀学术论文, 一等奖, 研究所(学校), 2011
代表性专利
[1] 李全刚, 柳厅文, 李彦增, 王学宾, 亚静, 李柢颖, 时金桥. 一种基于中文字符词性特征的目标实体识别方法及装置. CN: CN108959242B, 2021-07-27.

[2] 柳厅文, 郁博文, 王玉斌, 张振宇, 亚静. 一种半开放信息抽取的方法及装置. CN: CN112651234A, 2021-04-13.

[3] 王玉斌, 柳厅文, 薛梦鸽, 李全刚, 苏涛宇, 崔诗尧. 基于融入结构化实体信息的缩写项目名称识别方法及电子装置. CN: CN112651243A, 2021-04-13.

[4] 亚静, 张盼盼, 柳厅文, 王玉斌, 李全刚, 王学宾, 时金桥. 一种基于开源信息的可疑威胁指标主动验证方法和系统. CN: CN109194605B, 2020-08-25.

[5] 时金桥, 亚静, 柳厅文, 舒晓波, 张振宇, 张盼盼, 郭莉. 一种面向钓鱼URL检测的相似样本集构造方法. CN: CN107798080B, 2020-05-22.

[6] 柳厅文, 李全刚, 李柢颖, 亚静, 时金桥, 谭建龙. 一种基于文本内容的信息源识别方法与装置. CN: CN107451433B, 2020-05-22.

[7] 柳厅文, 闫旸, 赵佳鹏, 李柢颖, 张盼盼, 李全刚, 亚静, 时金桥, 郭莉. 一种基于隐式马尔科夫模型的科技类复合短语识别方法. CN: CN106569997B, 2019-12-10.

[8] 李全刚, 柳厅文, 王玉斌, 李柢颖, 时金桥, 亚静, 郭莉. 一种面向评价性文本的核心实体识别方法及装置. CN: CN106570179B, 2019-11-19.

[9] 李全刚, 柳厅文, 王玉斌, 李柢颖, 时金桥, 亚静, 郭莉. 一种基于字模型的评论文本实体识别方法及装置. CN: CN106776555B, 2019-11-15.

[10] 柳厅文, 王玉斌, 时金桥, 亚静, 李全刚. 一种基于用户名相似度的跨网站用户关联方法. CN: CN106126654B, 2019-10-18.

[11] 柳厅文, 张盼盼, 亚静, 李全刚, 时金桥. 一种基于多示例学习的可疑威胁指标验证方法及系统. CN: CN110020190A, 2019-07-16.

[12] 柳厅文, 张洋, 亚静, 李全刚, 时金桥, 郭莉. 一种最小距离字符串计算查找方法. CN: CN105913094B, 2019-06-21.

[13] 柳厅文, 张洋, 亚静, 李全刚, 时金桥, 郭莉. 一种基于视觉的字符串相似度计算方法及相似性判断方法. CN: CN106127222B, 2019-06-04.

[14] 亚静, 柳厅文, 张浩亮, 时金桥. 一种网络安全日志模板抽取方法及装置. CN: CN105049247B, 2019-04-26.

[15] 亚静, 柳厅文, 张盼盼, 李全刚, 时金桥, 郭莉. 一种针对URL的分词方法及装置. 中国: CN108228710A, 2018-06-29.

[16] 亚静, 柳厅文, 时金桥, 张盼盼, 张振宇, 王玉斌, 李全刚. 一种基于词序列的钓鱼URL检测方法及系统. 中国: CN107992469A, 2018-05-04.

[17] 柳厅文, 时金桥, 张洋, 闫旸, 郭莉, 张浩亮, 亚静. 一种基于自学习规则的项目名实体识别方法及系统. 中国: CN104965818B, 2018-01-05.

[18] 张浩亮, 柳厅文, 时金桥, 亚静, 郭莉, 胡兰兰, 季月英, 闫旸. 一种开放式的多源数据采集系统及方法. 中国: CN104111983B, 2017.12.19.

[19] 时金桥, 柳厅文, 李柢颖, 李全刚, 亚静, 谭建龙. 一种功性能描述信息识别方法及装置. 中国: CN107301167A, 2017-10-27.

[20] 柳厅文, 闫旸, 李全刚, 亚静, 王玉斌, 时金桥, 郭莉. 一种基于社团划分的无监督复合短语识别方法. 中国: CN106897264A, 2017-06-27.

[21] 柳厅文, 闫旸, 赵佳鹏, 李全刚, 亚静, 时金桥, 郭莉. 基于图的最大紧密度划分的复合短语无监督识别方法. 中国: CN106649265A, 2017-05-10.

[22] 亚静, 王玉斌, 柳厅文, 时金桥, 李全刚. 一种识别用户名缩写现象的方法. 中国: CN106168946A, 2016.11.30.

[23] 柳厅文, 亚静, 张浩亮, 时金桥, 赵佳鹏, 闫旸, 李全刚, 张洋. 一种面向新闻标题的人物关系抽取方法. 中国: CN105608070A, 2016-05-25.

[24] 蒲以国, 陈小军, 时金桥, 郭莉, 柳厅文, 文新, 徐睿. 一种基于多属性的误发邮件检测方法. 中国: CN104794176A, 2015-07-22.

[25] 柳厅文, 张浩亮, 闫旸, 时金桥, 亚静, 季月英. 一种确定文本视觉相似度的方法. 中国: CN104375982A, 2015-02-25.

[26] 时金桥, 柳厅文, 李全刚. 一种面向通信网络的用户行为模式挖掘方法及系统. 中国: CN103744994A, 2014.04.23.

[27] 时金桥, 柳厅文, 李全刚. 一种通信网络模拟数据生成方法. 中国: CN103763151A, 2014-04-30.

[28] 孙永, 柳厅文, 刘洋, 杨威, 刘庆云, 郑超, 杨嵘, 周舟. 度量正则表达式状态复杂度的方法及装置. 中国: CN103632048A, 2014-03-12.

[29] 柳厅文, 李全刚, 时金桥. 一种动态通信网络构建方法及装置. 中国: CN103336865A, 2013.10.02.

出版信息

   
代表性论文
(1) FITAnnotator: A Flexible and Intelligent Text Annotation System (Demo Paper), NAACL, 2021, 第 4 作者
(2) From What to Why: Improving Relation Extraction with Rationale Graph, Findings of ACL, 2021, 第 5 作者
(3) CasEE: A Joint Learning Framework with Cascade Decoding for Overlapping Event Extraction, Findings of ACL, 2021, 第 7 作者
(4) Improving Joint Extraction of Entities and Relations by Strengthening Entity Pairs Connection, PAKDD, 2021, 第 3 作者
(5) Enhancing Deep Paraphrase Identification via Leveraging Word Alignment Information, ICASSP, 2021, 第 2 作者
(6) Heterogeneous Graph Neural Networks for Query-focused Summarization, SDM, 2021, 第 2 作者
(7) Bipartite Graph Embedding via Mutual Information Maximization, WSDM, 2021, 第 5 作者
(8) Maximal Clique Based Non-Autoregressive Open Information Extraction, EMNLP, 2021, 第 4 作者
(9) Improving Distantly-Supervised Named Entity Recognition with Self-Collaborative Denoising Learning, Findings of EMNLP, 2021, 第 3 作者
(10) Deep Structural Point Process for Learning Temporal Interaction Networks, ECML, 2021, 第 6 作者
(11) NA-Aware Machine Reading Comprehension for Document-Level Relation Extraction, ECML, 2021, 第 4 作者
(12) Discontinuous Named Entity Recognition as Maximal Clique Discovery, ACL, 2021, 第 4 作者
(13) Few-Shot Event Detection with Prototypical Amortized Conditional Random Field, Findings of ACL, 2021, 第 4 作者
(14) Semi-Open Information Extraction, WWW, 2021, 第 4 作者
(15) Joint Entity Linking and Relation Extraction with Neural Networks for Knowledge Base Population, IJCNN, 2020, 第 3 作者
(16) Aspect level sentiment classification with unbiased attention and target enhanced representations, SAC, 2020, 第 2 作者
(17) SLGAT: Soft Labels Guided Graph Attention Networks, PAKDD, 2020, 第 3 作者
(18) Label Noise Robust Curriculum for Deep Paraphrase Identification, IJCNN, 2020, 第 2 作者
(19) Distilling Knowledge fromWell-Informed Soft Labels for Neural Relation Extraction, AAAI, 2020, 第 4 作者
(20) Enhancing Pre-trained Chinese Character Representation with Word-aligned Attention, ACL, 2020, 第 4 作者
(21) Document-level Relation Extraction with Dual-tier Heterogeneous Graph, COLING, 2020, 第 4 作者
(22) DRG2vec: Learning Word Representations from Definition Relational Graph, IJCNN, 2020, 第 4 作者
(23) BiG-Transformer: Integrating Hierarchical Features for Transformer via Bipartite Graph, IJCNN, 2020, 第 5 作者
(24) Inductive Unsupervised Domain Adaptation for Few-Shot Classification via Clustering, ECML-PKDD, 2020, 第 3 作者
(25) Learning to Prune Dependency Trees with Rethinking for Neural Relation Extraction, COLING, 2020, 第 4 作者
(26) Porous Lattice Transformer Encoder for Chinese NER, COLING, 2020, 第 3 作者
(27) TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking, COLING, 2020, 第 4 作者
(28) Adaptive Attentional Network for Few-Shot Knowledge Graph Completion, EMNLP, 2020, 第 6 作者
(29) Coarse-to-Fine Pre-training for Named Entity Recognition, EMNLP, 2020, 第 4 作者
(30) Edge-Enhanced Graph Convolution Networks for Event Detection with Syntactic Relation, Findings of EMNLP, 2020, 第 3 作者
(31) A Compare-Aggregate Model with External Knowledge for Query-Focused Summarization, WISE, 2020, 第 2 作者
(32) Fine-grained Semantics-aware Heterogeneous Graph Neural Networks, WISE, 2020, 第 3 作者
(33) ICNet: Incorporating Indicator Words and Contexts to Identify Functional Description Information, IJCNN, 2019, 第 4 作者
(34) Revising Attention with Position for Aspect-Level Sentiment Classification, ICANN, 2019, 第 2 作者
(35) Beyond Word Attention: Using Segment Attention in Neural Relation Extraction, IJCAI, 2019, 第 3 作者
(36) Character-based BiLSTM-CRF Incorporating POS and Dictionaries for Chinese Opinion Target Extraction, ACML, 2018, 第 2 作者
(37) You Have More Abbreviations than You Know A Study of AbbrevSquatting Abuse, ICCS, 2018, 第 3 作者
(38) Mining Host Behavior Patterns From Massive Network and Security Logs, ICCS, 2017, 第 2 作者
(39) Identifying Users across Different Sites using Usernames, ICCS, 2016, 第 2 作者
(40) Towards quantifying visual similarity of domain names for combating typosquatting abuse, MILCOM, 2016, 第 1 作者
(41) An automatic approach to extract the formats of network and security log messages, MILCOM, 2015, 第 2 作者
(42) A Self-learning Rule-Based Approach for Sci-tech Compound Phrase Entity Recognition, APWeb, 2015, 第 1 作者
(43) Towards Fast and Optimal Grouping of Regular Expressions via DFA Size Estimation, JSAC, 2014, 第 1 作者
(44) An efficient regular expressions compression algorithm from a new perspective, INFOCOM, 2011, 第 1 作者
发表著作
(1) ElasticSearch 可扩展的开源弹性搜索解决方案, 电子工业出版社, 2015-01, 第 2 作者

科研活动

   
科研项目
( 1 ) 面向骨干网DPI系统的资源消耗攻击防御技术研究, 主持, 国家级, 2014-01--2016-12
( 2 ) 基于大数据分析的互联网XXXX系统研制, 主持, 国家级, 2014-07--2016-06
( 3 ) 面向互联网开源知识库的XX分析, 参与, 市地级, 2015-10--2016-06
( 4 ) 大数据挖掘技术及系统(重研子课题), 主持, 国家级, 2016-12--2020-11
( 5 ) 基于样本学习的关键词抽取技术及系统(某部委科研项目), 主持, 国家级, 2017-08--2018-07
( 6 ) 协同检测与分析关键技术研究(C类先导课题), 主持, 部委级, 2019-01--2019-12
( 7 ) 网络探测分析技术研究(预研项目), 主持, 国家级, 2019-01--2020-12
( 8 ) 协同检测与分析关键技术研究(C类先导课题), 主持, 部委级, 2020-01--2020-12

指导学生

已指导学生

舒晓波  硕士研究生  083900-网络空间安全  

李彦增  硕士研究生  085211-计算机技术  

现指导学生

郭一涵  硕士研究生  083900-网络空间安全  

谢明轩  硕士研究生  085211-计算机技术  

笪城源  硕士研究生  085211-计算机技术  

刘天昀  硕士研究生  085400-电子信息  

王继平  硕士研究生  085400-电子信息  

张舸航  硕士研究生  081203-计算机应用技术  

张竞文  硕士研究生  085400-电子信息