基本信息

曹聪  男  硕导  中国科学院信息工程研究所
电子邮件: caocong@iie.ac.cn
通信地址: 北京市海淀区树村路19号
邮政编码:100085


中国科学院信息工程研究所信息内容识别过滤研究组负责人,中国指挥与控制学会网络空间测绘专委会委员,国家科技奖励评审专家,WWW、EMNLP等会议审稿人。长期从事自然语言处理、数据挖掘等方面研究工作,在EMNLP、ICASSP、Cogsci等国际知名会议上发表学术论文30余篇,申请发明专利24项,授权5项,登记软件著作权5项。近五年作为课题负责人和课题骨干承担国家重点研发计划、省部级重点项目、地方政府重大工程等项目8项,累计承担科研经费达7000余万元。先后获得所级优秀员工、室主任特别奖、室级优秀员工等荣誉。

研究领域

自然语言处理

数据挖掘


招生信息

   
招生专业
083900-网络空间安全
招生方向
自然语言处理
数据挖掘

教育背景

2009-09--2016-01   中国科学院计算技术研究所   博士
2005-09--2009-07   中国石油大学(华东)   学士
学历
研究生

学位
博士

工作经历


工作简历
2019-10~现在, 中国科学院信息工程研究所, 高级工程师
2016-03~2019-10,中国科学院信息工程研究所, 助理研究员
社会兼职
2023-05-01-今,国家科技奖励评审专家, 委员
2023-04-01-今,中国指挥控制学会网络空间测绘专委会, 委员

专利与奖励

   
专利成果
[1] 袁方方, 李志平, 曹亚男, 张春燕, 卢毓海, 曹聪, 刘燕兵. 基于异质图鲁棒对抗学习的恶意域名检测方法和装置. CN: CN116668076A, 2023-08-29.
[2] 曹聪, 冯佳丽, 曹亚男, 袁方方, 李保珂, 卢毓海, 刘燕兵. 一种基于提示学习的半结构化网页属性值抽取方法和系统. CN: CN116628303A, 2023-08-22.
[3] 曹聪, 冯佳丽, 曹亚男, 袁方方, 李保珂, 卢毓海, 刘燕兵. 一种基于提示学习的半结构化网页属性值抽取方法和系统. 202310462355.1, 2023-04-26.
[4] 曹聪, 郭点点, 袁方方, 张啸梁, 卢毓海, 刘燕兵, 谭建龙. 一种融合图结构信息的知识图谱推理方法. 202310373927.9, 2023-04-10.
[5] 曹聪, 郭点点, 袁方方, 张啸粱, 卢毓海, 刘燕兵, 谭建龙. 一种融合图结构信息的知识图谱推理方法. CN: CN116468122A, 2023-07-21.
[6] 刘燕兵, 徐阳焰, 袁方方, 苏马婧, 卢毓海, 曹聪. 一种基于核对齐推理的对比自蒸馏BERT加速方法及装置. CN: CN116663532A, 2023-08-29.
[7] 刘燕兵, 徐阳焰, 袁方方, 张啸梁, 苏马婧, 王大魁, 曹聪. 基于协同元学习的推理加速方法及装置. CN: CN116484839A, 2023-07-25.
[8] 曹聪, 王志平, 袁方方, 张春燕, 卢毓海, 刘燕兵, 谭建龙. 一种基于多粒度情感的对话推荐方法及系统. CN: CN115630145A, 2023-01-20.
[9] 曹聪, 王志平, 袁方方, 张春燕, 卢毓海, 刘燕兵, 谭建龙. 一种基于多粒度情感的对话推荐方法及系统. CN115630145A, 2022-09-26.
[10] 卢毓海, 王晓琳, 曹聪, 袁方方, 张春燕, 刘燕兵. 面向相似文本的正则表达式自动生成方法、系统及介质. CN115587223A, 2022-09-01.
[11] 卢毓海, 王晓琳, 曹聪, 袁方方, 张春燕, 刘燕兵. 面向相似文本的正则表达式自动生成方法、系统及介质. CN: CN115587223A, 2023-01-10.
[12] 刘燕兵, 夏辉, 袁方方, 张啸梁, 曹聪, 卢毓海, 谭建龙. 一种基于稠密子图的图压缩方法和系统. CN: CN115439564A, 2022-12-06.
[13] 刘燕兵, 夏辉, 袁方方, 张啸梁, 曹聪, 卢毓海, 谭建龙. 一种基于稠密子图的图压缩方法和系统. CN115439564A, 2022-08-03.
[14] 刘燕兵, 夏辉, 袁方方, 张春燕, 曹聪, 卢毓海, 谭建龙. 一种稠密子图抽取方法和系统. CN115424025A, 2022-08-03.
[15] 刘燕兵, 夏辉, 袁方方, 张春燕, 曹聪, 卢毓海, 谭建龙. 一种稠密子图抽取方法和系统. CN: CN115424025A, 2022-12-02.
[16] 袁方方, 胡成, 刘燕兵, 曹聪, 卢毓海, 肖奎, 谭建龙. 一种基于异质图传播网络的恶意域名检测方法和系统. CN115442075A, 2022-08-02.
[17] 袁方方, 胡成, 刘燕兵, 曹聪, 卢毓海, 肖奎, 谭建龙. 一种基于异质图传播网络的恶意域名检测方法和系统. CN: CN115442075A, 2022-12-06.
[18] 袁方方, 田腾, 刘燕兵, 曹聪, 张春燕, 谭建龙, 郭莉. 一种基于深度支持向量数据描述的DGA域名检测方法及系统. CN116170168A, 2022-03-15.
[19] 袁方方, 田腾, 刘燕兵, 卢毓海, 曹聪, 谭建龙. 一种基于深度强化学习的恶意域名检测方法和装置. CN: CN114050912A, 2022-02-15.
[20] 袁方方, 田腾, 刘燕兵, 卢毓海, 曹聪, 谭建龙. 一种基于深度强化学习的恶意域名检测方法和装置. CN: CN114050912B, 2023-04-07.
[21] 唐钰葆, 于静, 曹聪, 刘燕兵, 谭建龙, 郭莉. 一种基于图卷积神经网络的文本分类方法及系统. CN: CN110929029A, 2020-03-27.
[22] 曹聪, 张路, 刘燕兵, 曹亚男, 谭建龙, 郭莉. 一种基于支持向量机的面向智能专家推荐的用户画像方法. CN: CN111597330A, 2020-08-28.
[23] 曹聪, 张路, 刘燕兵, 曹亚男, 谭建龙, 郭莉. 一种基于卷积神经网络的面向智能专家推荐的用户画像方法. CN: CN111581368A, 2020-08-25.
[24] 曹聪, 谢洁, 刘燕兵, 曹亚男, 谭建龙, 郭莉. 一种基于文本分类的中文表格列标签恢复方法和系统. CN: CN109710725A, 2019-05-03.
[25] 于静, 唐钰葆, 刘小梅, 刘燕兵, 曹聪, 谭建龙, 郭莉. 一种面向弱结构相关性的多模式图索引构建方法及系统. CN: CN109783696A, 2019-05-21.
[26] 于静, 郭晶晶, 刘小梅, 刘燕兵, 曹聪, 谭建龙, 郭莉. 一种面向多模式图匹配的并行加速方法. CN: CN109614520A, 2019-04-12.
[27] 张春燕, 刘燕兵, 曹聪, 卢毓海, 袁方方, 谭建龙, 郭莉. 数字查找树的压缩表示方法、系统、存储介质及规则匹配装置. CN: CN108399152A, 2018-08-14.
[28] 袁方方, 刘燕兵, 曹聪, 卢毓海, 张春燕, 谭建龙, 郭莉. 一种串匹配场景下随机模式串集合生成方法、设备和可读存储介质. CN: CN108073679A, 2018-05-25.
[29] 刘燕兵, 刘小梅, 于静, 曹聪, 谭建龙, 郭莉. 一种基于结构相关性的多模式图匹配方法. CN: CN107885797A, 2018-04-06.
[30] 于静, 郭晶晶, 刘燕兵, 曹聪, 谭建龙, 郭莉. 一种基于力导引算法的图数据可视化布局优化方法. CN: CN107818149A, 2018-03-20.

出版信息

   
发表论文
[1] Yanhe Fu, Yi Liu, Yanan Cao, Yubing Ren, Qingyue Wang, Fang Fang, Cong Cao. A Multi-granularity Similarity Enhanced Model for Implicit Event Argument Extraction. NLPCCnull. 2023, [2] 高意, 袁方方, 曹聪, 苏马靖, 王大魁, 刘燕兵. Few-shot Malicious Domain Detection on Heterogeneous Graph with Meta-learning. International Conference on Computer Supported Cooperative Work in Design (CSCWD 2018)null. 2023, [3] 李志平, 袁方方, 曹聪, 王大魁, 冯佳丽, 李保柯, 刘燕兵. Self-supervised Deep Heterogeneous Graph Neural Networks with Contrastive Learning. International Conference on Computational Sciencenull. 2023, [4] 徐阳焰, 袁方方, 曹聪, 张啸梁, 苏马靖, 王大魁, 刘燕兵. MetaBERT: Collaborative Meta-Learning for Accelerating BERT Inference. International Conference on Computer Supported Cooperative Work in Designnull. 2023, [5] Jiali Feng, Cong Cao, Fangfang Yuan, Xiaoliang Zhang, Zhiping Li, Yanbing Liu, Jianlong Tan. DOM2R-Graph: A Web Attribute Extraction Architecture with Relation-Aware Heterogeneous Graph Transformer. International Conference Neural Information Processing(ICONIP)null. 2022, [6] Baoke Li, Cong Cao, Fangfang Yuan, Yanbing Liu, Baohui Li, Bingxing Fang. EPGraph: An Efficient Graph Computing Model in Persistent Memory System. IEEE International Symposium on Parallel and Distributed Processing with Applications (ISPA)null. 2022, [7] Zhiping Li, Fangfang Yuan, Yanbing Liu, Cong Cao, Fang Fang, Jianlong Tan. Heterogeneous Graph Attention Network for Malicious Domain Detection. 31st International Conference on Artificial Neural Networks(ICANN)null. 2022, [8] Cheng Hu, Fangfang Yuan, Yanbing Liu, Cong Cao, Chunyan Zhang, Jianlong Tan. Malicious Domain Detection with Heterogeneous Graph Propagation Network. Wireless Algorithms, Systems, and Applications(WASA)null. 2022, [9] Kong, Yawei, Zhang, Lu, Ma, Can, Cao, Cong. HSAN: A HIERARCHICAL SELF-ATTENTION NETWORK FOR MULTI-TURN DIALOGUE GENERATION. 2021 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP 2021)[J]. 2021, 7433-7437, [10] Lu Zhang, Yawei Kong, Fang Fang, Cong Cao, Yanan Cao, Yanbin Liu, Can Ma. Human-Like Storyteller: A Hierarchical Network with Gated Memory for Visual Storytelling. International Conference on Computational Sciencenull. 2021, [11] Baoke Li, Cong Cao, Yanbing Liu. D2Graph: An Efficient and Unified Out-of-Core Graph Computing Model. The 19th IEEE International Symposium on Parallel and Distributed Processing with Applications (ISPA)null. 2021, [12] Yubao Tang, Zhezhou Li, Cong Cao, Fang fang, Yanan Cao, Yanbing Liu, Jianhui Fu. Knowledge-Based Diverse Feature Transformation for Few-Shot Relation Classification. The 14th International Conference on Knowledge Science, Engineering and Managementnull. 2021, [13] Jie Xie, Yuhai Lu, Cong Cao, Zhenzhen Li, Yangyang Guan, Yanbing Liu. Joint Entity Linking for Web Tables with Hybrid Semantic Matching. COMPUTATIONAL SCIENCE – ICCS 2020null. 2020, 12138: 618-631, https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7302827/.
[14] Ruipeng Jia, Yanan Cao, Hengzhu Tang, Fang Fang, Cong Cao, Shi Wang. Neural Extractive Summarization with Hierarchical Attentive Heterogeneous Graph Network. EMNLP[J]. 2020, [15] Xie, Jie, Cao, Cong, Liu, Yanbing, Cao, Yanan, Li, Baoke, Tan, Jianlong. Column Concept Determination for Chinese Web Tables via Convolutional Neural Network. COMPUTATIONAL SCIENCE - ICCS 2018, PT III[J]. 2018, 10862: 533-544, [16] Yanbing Liu. Inferring Social Network User's Interest Based on Convolutional Neural Network. ICONIP. 2017, [17] 张萍, 何慧敏, 张春燕, 曹聪, 刘燕兵, 谭建龙. FilterFA:一种基于字符集规约的模式串匹配算法. 通信学报[J]. 2016, 37(12): 103-114, http://lib.cqvip.com/Qikan/Article/Detail?id=670960532.

科研活动

   
科研项目
( 1 ) 多模态融合分析, 负责人, 中国科学院计划, 2022-06--2024-06
( 2 ) 智能化平台, 负责人, 地方任务, 2022-03--2024-02
( 3 ) 评奖业务平台, 负责人, 国家任务, 2018-08--2024-12
( 4 ) 精准专家推荐算法设计, 负责人, 国家任务, 2018-07--2021-06
( 5 ) 安全分析平台子课题, 负责人, 国家任务, 2020-07--2022-07
( 6 ) 行为分析平台子课题, 负责人, 国家任务, 2016-06--2019-10
( 7 ) 社交网络相关研制子课题, 负责人, 国家任务, 2016-01--2018-10
( 8 ) 全网统一安全管理与威胁态势预警关键技术及系统子课题, 负责人, 国家任务, 2016-07--2019-06

指导学生

   
协助指导学生情况

  年级 姓名      学位类别    毕业去向                          获得奖项

2017级   谢   洁        硕士              百度          所级优秀学生、三好学生、百度4S计划优秀校招生

2018级   张   路        硕士              快手          中国科学院大学优秀大学生、优秀毕业论文、三好学生

2018级   唐钰葆        硕士              读博                                        --

2019级   王志平        硕士              京东                                        --

2020级   冯佳丽        硕士              快手          优秀毕业论文、优秀毕业生提名、三好学生

2021级   杨宇凌        直博              --              优秀共产党员、优秀学生干部、三好学生

2021级   付   煜        硕士              --                                             --

2022级   郭点点        硕士              --       百度多任务识别大赛东部赛区二等奖、优秀共青团员