基本信息

         :刘燕兵    博士,正高级工程师,博士生导师

工作单位:中国科学院信息工程研究所

信息内容安全技术国家工程实验室

联系地址北京市海淀区闵庄路甲91A3楼,邮编:100093

电子邮件liuyanbing@iie. ac.cn

部门/实验室:第二研究室

工作经历

l  2012.1至今:中国科学院信息工程研究所,助理研究员、副研究员(2013年)、正高级工程师(2018

l  2006.7-2011.12中国科学院计算技术研究所,研究实习员(2006年)、助理研究员(2008年)

教育背景

l  2008.9-2012.7:中国科学院计算技术研究所,工学博士,专业:计算机软件与理论

l  2003.9-2006.7中国科学院计算技术研究所,工学硕士,专业:计算机软件与理论

l  1999.9-2003.7武汉理工大学数学系,理学学士,专业:信息与计算科学

研究方向

从事模式串匹配与信息过滤、图数据分析与挖掘等领域的关键技术研究,在国内外重要学术期刊会议上发表学术论文40余篇。作为骨干参与了科技部973/863、工信部重大工程和242信息安全专项、发改委建设项目、中科院先导专项等20余项课题的研发工作。研发的信息内容过滤系列算法库,广泛应用于工信部、广电总局、保密局等部门的重大工程系统中。

目前开展的具体研究方向包括:

1、模式串匹配与信息过滤:面向信息内容安全管理的应用需求,研究大规模精确串匹配、复杂正则表达式匹配、IP规则匹配、自动机算法、压缩文本索引、字符串相似性搜索、度量空间搜索、流式格式文档解析、加密文档GPU破解加速等技术,提升高速网络流内容识别、过滤与检测的效率。

2、图计算与图数据挖掘:基于网络空间和物理世界的多源异构社会媒体数据,构建大规模关系结构网络,研究图数据分析与挖掘关键技术,包括:图数据索引与查询、子图模式匹配、图划分、图数据可视化、图数据计算模型与系统等,支持关系结构网络上的关键结点、关键社区、异常行为、安全事件的检测与挖掘。

论文专利软著

模式串匹配、文本索引、信息过滤方向:

1.        Yuhai Lu, Yanbing Liu, Chunyan Zhang, Jianlong Tan, A Data-Deduplication-Based Matching Mechanism for URL Filtering, 2018 IEEE International Conference on Communications (ICC), pages:1-6, 2018

2.        Xudong Liu, Yanbing Liu, Jian Li, Jing Yu, Jianlong Tan, A STT-Partition-based Parallel Algorithm for Pattern Matching on GPU and CPU, International Journal of Computer and Communication Engineering (IJCCE), 4(2):90-99, 2015

3.        Yan Shao, Yanbing Liu, Jianlong Tan, Accelerating DFA Construction by Parallelizing Subset Construction, International Standard Conference on Trustworthy Computing and Services (ISCTCS), pages:16-24, 2014

4.        Yanbing Liu, Qingyun Liu, Ping Liu, Jianlong Tan, Li Guo, A Factor-searching-based Multiple String Matching Algorithm for Intrusion Detection, 2014 IEEE International Conference on Communications (ICC), pages:653-658, 2014

5.        Yu Zhang, PingLiu, Yanbing Liu, Aiping Li, Cuilan Du, Dongjin Fan, Attacking Pattern Matching Algorithms Based on the Gap between Average-case and Worst-case Complexity, The 5th International Conference on Communication Software and Networks (ICCSN), be published in Journal of Advances in Computer Network (JACN), 1(3):228-233, 2013

6.        Lei Jiang, Jianlong Tan, Yanbing Liu, Binxing Fang, ClusterFA: A Memory-Efficient DFA Structure for Network Intrusion Detection. In Proceedings of the 7th ACM Symposium on Information, Computer and Communications Security (ASIACCS), pages:65-66, 2012

7.        Shuai Niu, Yanbing Liu, Xinbo Song, Speeding Up Double-Array Trie Construction for String Matching, International Standard Conference on Trustworthy Computing and Services (ISCTCS), pages:572-579, 2012

8.        Tingwen Liu, Yifu Yang, Yanbing Liu, Yong Sun, Li Guo, An Efficient Regular Expressions Compression Algorithm From A New Perspective, The 30th IEEE International Conference on Computer Communications (INFOCOM), pages:2129-2137, 2011

9.        Jianlong Tan, Xia Liu, Yanbing Liu, Ping Liu, Speeding Up Pattern Matching by Optimal Partial String Extraction, IEEE Conference on Computer Communications Workshops (INFOCOM WKSHPS), pages:1030-1035, 2011

10.    Guangming Tan, Ping Liu, Dongbo Bu, Yanbing Liu, Revisiting Multiple Pattern Matching Algorithms for Multi-Core Architecture, Journal of Computing Science and Technology (JCST), 26(5): 866-874, 2011

11.    Yanbing Liu, Li Guo, Muyi Guo and Ping Liu, Accelerating DFA Construction by Hierarchical Merging, The 9th IEEE International Symposium on Parallel and Distributed Processing with Applications (ISPA), pages:1-6, 2011 EI检索号:20113314241124

12.    Yanbing Liu, Li Guo, Ping Liu, Jianlong Tan, Compressing Regular Expressions' DFA Table by Matrix Decomposition, The 15th International Conference on Implementation and Application of Automata (CIAA), pages:282-289, 2010

13.    Yanbing Liu, Yifu Yang, Ping Liu, Jianlong Tan, A Table Compression Method for Extended Aho-Corasick Automaton, The 14th International Conference on Implementation and Application of Automata (CIAA), pages:84-93, 2009

14.    Jianlong Tan, Yanbing Liu, Ping Liu, Accelerating Multiple String Matching by Using Cache-efficient Strategy, The 9th International Conference on Web-Age Information Management (WAIM)pages:539-545, 2008

15.    Ping Liu, Yanbing Liu, Jianlong Tan, A Partition-Based Efficient Algorithm for Large Scale Multiple-String MatchingThe 12th Symposium on String Processing and Information Retrieval (SPIRE)pages:399-404, 2005

16.    王歧,卢毓海,刘洋,刘燕兵,谭建龙,孙波,支持模式串动态更新的多模式匹配Karp-Rabin算法,计算机工程与应用,53(4): 39-442017

17.    张萍,何慧敏,张春燕,曹聪,刘燕兵,谭建龙,FilterFA:一种基于字符集规约的模式串匹配算法,通信学报,37(12):103-1142016

18.    张春燕,谭建龙,刘燕兵,郭莉,基于GPU的精确串匹配算法综述,计算机应用研究,33(7):1921-19282016

19.    张萍,谭建龙,刘燕兵,郭莉,HashTrie:一种空间高效的多模式串匹配算法,通信学报,36(10):172-1802015

20.    熊刚,何慧敏,于静,刘燕兵,郭莉,HybridFA: 一种基于统计的AC自动机空间优化技术,通信学报,36(7):31-392015

21.    路炜,张宇,周美孜,刘燕兵,王春露,高性能文本索引系统的设计与实现,中国科技论文,9(1):92-952014

22.    路炜,刘燕兵,王春露,刘庆云,郭莉,压缩的全文自索引算法研究,计算机应用与软件,31(3):11-152014

23.    刘燕兵,邵妍,王勇,刘庆云,郭莉,一种面向大规模URL过滤的多模式串匹配算法,计算机学报,37(5):1159-11692014

24.    郭莉,张鹏,刘燕兵,王鹏,姜磊,社会计算与舆情的研究进展与趋势,第23届全国信息保密学术会议,79-972013

25.    王晓娟,谭建龙,刘燕兵,刘金刚,基于自动机理论的PDF文本内容抽取,计算机应用,32(09):2491-24952012

26.    邵妍,刘燕兵,谭建龙,郭莉,基于概率统计模型的快递地址自动分类方法,计算机工程,38(23): 277-2802012

27.    林磊,刘燕兵,谭建龙,郭莉,一种基于MPHFBloom FilterURL查找算法,第八届中国通信学会学术年会会议论文集,2011

28.    何慧敏,刘燕兵,谭建龙,郭莉一种基于子串识别的多模式串匹配算法,中国计算机大会(计算机应用与软件期刊发表),28(11):10-142011

29.    张宇,刘萍,刘燕兵,谭建龙,郭莉,WuManber算法的复杂度攻击,计算机研究与发展,48(8):1381-13892011

30.    刘夏,刘萍,刘燕兵,谭建龙,面向移动终端的URL过滤方法,计算机工程与应用,47(18):68-722011

31.    邵妍,刘燕兵,刘萍,郭莉,基于SSE指令集的串匹配算法优化,第三届中国计算机网络与信息安全学术会议,2010

32.    刘萍,刘燕兵,方滨兴,郭莉,对串匹配算法中模式串与文本之间关系的研究,软件学报,21(7):1503-15142010

33.    刘燕兵,刘萍,谭建龙,郭莉,基于存储优化的多模式串匹配算法,计算机研究与发展,46(10):1768-17762009

34.    杨毅夫,刘燕兵,刘萍,郭牧怡,郭莉,正则表达式的DFA压缩算法,通信学报,30(10A):36-422009

35.    杨毅夫,刘燕兵,刘萍,郭莉,串匹配算法中的自动机紧缩存储技术,计算机工程,35(21):39-412009

36.    谭建龙,刘萍,刘燕兵,郭莉,一种可适应字符分布特征的多串匹配算法,中国计算机大会,2009

37.    郭莉,谭建龙,刘萍,刘燕兵,面向信息内容安全的串匹配技术,信息技术快报,6(5):1-242008

38.    刘萍,刘燕兵,谭建龙,郭莉,对多模式串匹配算法性能评测方法的探讨,2007年全国网络与信息安全技术研讨会,489-4952007

39.    曹京,刘燕兵,刘萍,谭建龙,郭莉,定序窗口布尔表达式匹配技术研究,通信学报,28(12):125-1302007

40.    陈小军,张志斌,刘燕兵,郭莉,大规模多串匹配算法的访存行为分析,计算机工程与应用,43(26):106-1092007

41.    郭莉,刘燕兵,谭建龙,基于存储压缩的多模式串匹配算法,全国第八届计算语言学联合学术会议,591-5932005

42.    刘燕兵,谭建龙,郭莉,可动态增删关键词的串匹配算法,计算机工程与应用,41(35):138-1402005

 

图计算、图数据挖掘、跨媒体检索方向:

43.    Jing Yu, Yuhang Lu, Weifeng Zhang, Zengchang Qin, Yanbing Liu, Yue Hu, Learning cross-modal correlations by exploring inter-word semantics and stacked co-attention, Pattern Recognition Letters(PRL), 2018(accepted)

44.    Jing Yu, Yuhang Lu, Zengchang Qin, Weifeng Zhang, Yanbing Liu, Jianlong Tan, Li Guo, Modeling Text with Graph Convolutional Network for Cross-Modal Information Retrieval, The 2018 Pacific-Rim Conference on Multimedia(PCM), pages: 223-234, 2018

45.    Yuhang Lu, Jing Yu, Yanbing Liu, Weifeng Zhang, Jianlong Tan and Li Guo, Fine-grained Correlation Learning with Stacked Co-attention Networks for Cross-modal Information Retrieval, The 11th International Conference on Knowledge Science, Engineering and Management (KSEM), pages:213-225, 2018

46.    Jing Yu, Xiaomei Liu, Yanbing Liu, Yue Hu, Multiple Pattern Graph Correlations for Efficient Graph Pattern Matching, 14th ACS/IEEE International Conference on Computer Systems and Applications(AICCSA)-workshop, 2017

47.    Meizi Zhou, Jing Yu, Yanbing Liu, Qiong Dai, Li Guo, PatternTreeISO: A Pattern Graph Correlation Framework for Accelerating Subgraph Isomorphism over Large Graphs, ACM CIKM 2016 Workshops: the 1st workshop on Big Network Analytics (BigNet'16), 2016

48.    Yu Zhang, Yanbing Liu, Jing Yu, Ping Liu, and Li Guo, VSEP: A Distributed Algorithm for Graph Edge Partitioning, 15th International Conference on Algorithms and Architectures for Parallel Processing (ICA3PP) Workshops: the 6th International Workshop on Trust, Security and Privacy for Big Data (TrustData 2015), pages:71-84, 2015

49.    Yu Zhang, Gang Xiong, Yanbing Liu, Mengya Liu, Ping Liu, Li Guo, Delta-K2-tree for Compact Representation of Web Graphs, The 16th Asia-Pacific Web Conference (APWeb), pages:270-281, 2014

50.    李高超,李犇,卢毓海,刘梦雅,刘燕兵,基于二级索引结构的图压缩算法,通信学报,2018(6):109-1152018

51.    刘梦雅,刘燕兵,于静,郭莉,孙志刚,图数据分析系统计算模型综述,计算机应用研究,34 (11):3204-32132017

52.    于静,刘燕兵,张宇,刘梦雅,谭建龙,郭莉,大规模图数据匹配技术综述,计算机研究与发展,52(2):391-4092015

53.    张宇,刘燕兵,熊刚,贾焰,刘萍,郭莉,图数据表示与压缩技术综述,软件学报,25(9):1938-19522014

 

自然语言处理、社交网络分析、异常检测、深度学习方向:

54.    Zhezhou Kang, Xiaoxue Li, Yanan Cao, Yanmin Shang, Yanbing Liu, Li Guo, Hierarchical Attention Networks for User Profile Inference in Social Media Systems, The 27th International Conference on Artificial Neural Networks(ICANN), pages: 805-816, 2018

55.    Wenpeng Liu, Yanan Cao, Yanbing Liu, Yue Hu, Jianlong Tan, Reinforcement Learning for Joint Extraction of Entities and Relations, The 27th International Conference on Artificial Neural Networks(ICANN), pages: : 263-272, 2018

56.    Dongjie Zhang, Zheng Fang, Yanan Cao, Yanbing Liu, Xiaojun Chen, Attention-Based RNN Model for Joint Extraction of Intent and Word Slot Based on a Tagging Strategy, The 27th International Conference on Artificial Neural Networks(ICANN), pages: 178-188, 2018

57.    Wenpeng Liu, Yanan Cao, Cong Cao, Yanbing Liu, Jianlong Tan and Li Guo, An Adversarial Training Framework for  Relation Classification, International Conference On Computational Science(ICCS), pages:194-205, 2018

58.    Hao Xu, Yanan Cao, Yanmin Shang, Yanbing Liu, Jianlong Tan, Li Guo, Adversarial Reinforcement Learning for Chinese Text Summarization, International Conference On Computational Science(ICCS), pages: 519-532, 2018

59.    Fangfang Yuan, Yanan Cao, Yanmin Shang, Yanbing Liu, Jianlong Tan, Binxing Fang, Insider Threat Detection with Deep Neural Network, International Conference On Computational Science(ICCS), pages: 43-54, 2018

60.    Hao Xu, Yanan Cao, Ruipeng Jia, Yanbing Liu, Jianlong Tan, Sequence Generative Adversarial Network for Long Text Summarization, ICTAI, pages:242-248, 2018

61.    Qingyue Wang, Yanjing Song, Hao Liu, Yanan Cao, Yanbing Liu, Li Guo, A Sequence Transformation Model for Chinese Named Entity Recognition, KSEM, pages:491-502, 2018

62.    Jie Xie, Cong Cao, Yanbing Liu, Yanan Cao, Baoke Li and Jianlong Tan, Column Concept Determination for Chinese Web Tables via Convolutional Neural Network, International Conference On Computational Science(ICCS), pages: 533-544, 2018

63.    Yanan Cao, Shi Wang, Xiaoxue Li, Cong Cao, Yanbing Liu, Jianlong Tan, Inferring Social Network User's Interest Based on Convolutional Neural Network, ICONIP, pages: 657-666, 2017

64.    Zheng Fang, Yanan Cao, Yanmin Shang, Yanbing Liu, Jianlong Tan, Li Guo, A Co-training Method for Identifying the Same Person Across Social Networks, 2017 IEEE GlobalSIP Symposium on Deep Learning for Intelligent Multimedia Analytics & Security, pages:1412-1416, 2017

65.    Xiaoxue Li, Yanan Cao, Yanmin Shang, Yanbing Liu, Jianlong Tan, Li Guo, Mining Values of User's Missing Attributes via Neural Network, The 10th International Conference on Knowledge Science, Engineering and Management (KSEM), pages:274-286, 2017

 

书籍章节:

1.        Yanbing Liu, Distributed Hash Tables, Chapter 4 in the book Foundations of Computer Systems Research, Chief editor: Weisong Shi, Higher Education Press, 2010

2.        译著:柔性字符串匹配,电子工业出版社,ISBN71210385872007,课题组成员合作翻译(原著:Flexible Pattern Matching in Strings: Practical on-line search algorithms for texts and biological sequences, Cambridge University Press, 2002

专利:

1.        孙恭鑫,卢毓海,刘燕兵,张春燕,谭建龙,郭莉,基于字符集变换的自动机空间压缩方法及系统(提交中)

2.        孙恭鑫,卢毓海,刘燕兵,张春燕,谭建龙,郭莉,用于自动机空间压缩的线性同余字符集变换方法及系统(提交中)

3.        曹聪,张路,曹亚男,刘燕兵,谭建龙,郭莉,一种基于卷积神经网络的面向智能专家推荐的用户画像方法(提交中)

4.        曹聪,张路,刘燕兵,曹亚男,谭建龙,郭莉,一种基于支持向量机的面向智能专家推荐的用户画像方法(提交中)

5.        于静,唐钰葆,刘小梅,刘燕兵,曹聪,谭建龙,郭莉,一种基于弱结构相关性的多模式图索引构建方法(提交中)

6.        于静,郭晶晶,刘小梅,刘燕兵,曹聪,谭建龙,郭莉,一种面向多模式图匹配的并行加速方法(提交中)

7.        曹亚男,徐灏,尚燕敏,刘燕兵,谭建龙,郭莉,一种基于生成对抗网络的中文摘要生成方法(提交中)

8.        卢毓海,王翔,刘燕兵,谭建龙,郭莉,一种从正则表达式中抽取最长精确子串的方法(提交中)

9.        曹聪,谢洁,刘燕兵,曹亚男,谭建龙,郭莉,一种基于文本分类的中文表格列标签恢复方法和系统,申请号:201811524302.3(受理日期:2018.12.13

10.    曹亚男,李晓雪,尚燕敏,刘燕兵,谭建龙,一种基于卷积神经网络的用户属性推断方法和装置,申请号:201810124041X(受理日期:2018.02.07

11.    张春燕,刘燕兵,曹聪,卢毓海,袁方方,谭建龙,郭莉,数字查找树的压缩表示方法、系统、存储介质及规则匹配装置,申请号:201810119184.1受理日期:2018.02.06

12.    马伟,鲁睿,刘燕兵,杜翠兰,杨博,柳毅,易立,李睿,李赫男,施慧,一种空间互联网管控方法及系统,申请号:201711294213.X(受理日期:2017.12.08

13.    马伟,鲁睿,刘燕兵,杜翠兰,杨博,柳毅,易立,李睿,李赫男,施慧,卫星互联网中不良用户的检测方法及系统,申请号:201711259304.X(受理日期:2017.12.04

14.    袁方方,刘燕兵,曹聪,卢毓海,张春燕,谭建龙,郭莉,一种串匹配场景下随机模式串集合生成方法、设备和可读存储介质,申请号:201711103789.3(受理日期:2017.11.10

15.    刘燕兵,王歧,卢毓海,张春燕,袁方方,谭建龙,郭莉,一种针对Gzip压缩数据的过滤方法及系统,申请号:201711070628.9(受理日期:2017.11.03

16.    刘燕兵,刘小梅,于静,曹聪,谭建龙,郭莉,一种基于结构相关性的多模式图匹配方法,申请号:201711023877.2(受理日期:2017.10.27

17.    于静,郭晶晶,刘燕兵,曹聪,谭建龙,郭莉,一种基于力导引算法的图数据可视化布局加速方法,申请号:201710992552.9(受理日期:2017.10.23

18.    刘燕兵,袁方方,曹聪,卢毓海,张春燕,谭建龙,郭莉,一种串匹配场景下数据集生成方法、设备和可读存储介质,申请号:201710589808.1(受理日期:2017.07.19

19.    卢毓海,张春燕,刘燕兵,谭建龙,郭莉,URL匹配方法、URL匹配设备及存储介质,申请号:2017104510435(受理日期:2017.06.15

20.    刘燕兵,卢毓海,王歧,张春燕,谭建龙,郭莉,一种并行的数据差分方法及系统,申请号:201710121255.7(受理日期:2017.03.02

21.    刘燕兵,卢毓海,王晓娟,张春燕,谭建龙,郭莉,一种增量式的自动机更新方法与系统,申请号:201710112499.9(受理日期:2017.02.28

22.    刘燕兵,卢毓海,张春燕,张萍,谭建龙,郭莉,一种基于位图的布尔表达式存储、匹配方法及系统,申请号:201610811459.9(受理日期:2016.09.09

23.    刘燕兵,张春燕,卢毓海,谭建龙,郭莉,一种高效的静态哈希表实现方法及系统,申请号:201610793354.5(受理日期:2016.09.02

24.    张萍,刘燕兵,谭建龙,郭莉,一种空间高效的多模式串匹配方法和系统,申请号:201510236364.4(公开日期:2015.09.16

25.    张春燕,张宇,刘燕兵,谭建龙,郭莉,一种对稀疏矩阵进行压缩和查询的方法及系统,专利号:201510152316.7(授权日期:2018.08.21

26.    张宇,刘萍,刘燕兵,郭莉,陈训逊,李楠宁,薛晨,一种对WuManber算法进行测试的方法和系统,专利号:201110161094.7(计算所,授权日期:2014.11.19

27.    刘燕兵,何慧敏,刘萍,谭建龙,郭莉,确定自动机状态转换表的空间压缩方法,专利号:201010226250.9(计算所,授权日期:2012.07.11

28.    杨毅夫,刘燕兵,刘萍,郭莉,一种有效的对确定自动机空间进行压缩的方法,专利号:200910090556.3(计算所,授权日期:2012.01.25

29.    谭建龙,刘燕兵,刘萍,郭莉,一种关键词匹配方法和系统,专利号:200710175751.7(计算所,授权日期:2009.08.19

软件著作权登记:

1.        卢毓海,于跃,刘燕兵,谭建龙,郭莉,基于GPU加速的PDF密码破解软件V1.0,软著登记号:2016SR070325

2.        李勇刚,刘燕兵,谭建龙,郭莉,基于GPU加速的rar密码破解软件V1.0,软著登记号:2016SR255840

3.        网络信息过滤引擎工具软件简称 KNIFE V1.0,软著登记号:2008SR16984

4.        正则表达式随机测试数据生成软件 V1.0简称Regex Test Data Wizard,软著登记号:2009SR02395


算法软件

l  MultiREGEX (Multiple Regular Expression Matching)多正则表达式匹配引擎:

简介:该软件是一款面向高速网络内容处理的以DFA技术为核心的多正则表达式匹配算法引擎,主要特点包括:兼容PERL语法规范,支持部分典型的特殊语法功能(贪婪、反向引用);多线程安全;包含本课题组研发的DFA空间压缩算法、DFA构建加速技术、正则表达式规则分组算法、反向引用匹配方法等。

该软件获得2010CNCERT中国信息安全技术公开赛(正则表达式匹配技术评比大赛)第一名。

l  KNIFE (Kits of Network Information Filtering Engine) 网络信息过滤引擎:

简介:该软件是一款以多模式串匹配算法为核心的实时网络内容处理引擎,主要包括三个组件:规则匹配引擎,文档识别与内容提取,编码识别与编码转换。其中规则匹配引擎集成了20余种多模式串匹配算法(包括经典算法和本课题组研发的新算法),能够有效地支持高达1000万规模的特征串匹配。

该软件广泛应用于十几个大型网络安全系统。

科研项目

1.      国家自然科学基金青年基金项目:复杂规则实时检测的模型和算法研究(课题号:61202477起止日期:2013.1-2015.12),角色:项目负责人

2.      国家自然科学基金面上项目:面向高速网络内容安全处理的专用系统结构(课题号:61070026起止日期:2011.1-2013.12),角色:项目执行负责人

3.      国家973基础研究计划重点项目(课题号:2007CB311103起止日期:2007.11-2011.11),角色:项目骨干

4.      中国科学院战略性先导科技专项: 媒体内容安全监管关键技术(课题号:XDA06031000起止日期:2012.1-2016.12),角色:项目骨干

5.      发改委项目:信息内容安全技术国家工程实验室建设项目(2009-2013),角色:项目骨干