曹聪-中国科学院大学-UCAS

基本信息

曹聪男硕导中国科学院信息工程研究所
电子邮件： caocong@iie.ac.cn
通信地址：北京市海淀区树村路19号
邮政编码：100085

中国科学院信息工程研究所信息内容识别过滤研究组负责人，中国指挥与控制学会网络空间测绘专委会委员，国家科技奖励评审专家，WWW、EMNLP等会议审稿人。长期从事自然语言处理、数据挖掘等方面研究工作，在EMNLP、ICASSP、Cogsci等国际知名会议上发表学术论文30余篇，申请发明专利24项，授权5项，登记软件著作权5项。近五年作为课题负责人和课题骨干承担国家重点研发计划、省部级重点项目、地方政府重大工程等项目8项，累计承担科研经费达7000余万元。先后获得所级优秀员工、室主任特别奖、室级优秀员工等荣誉。

研究领域

自然语言处理

数据挖掘

招生信息

招生专业

083900-网络空间安全

招生方向

自然语言处理
数据挖掘

教育背景

2009-09--2016-01 中国科学院计算技术研究所博士
2005-09--2009-07 中国石油大学（华东）学士

学历

研究生

学位

博士

工作经历

工作简历

2019-10~现在, 中国科学院信息工程研究所, 高级工程师
2016-03~2019-10,中国科学院信息工程研究所, 助理研究员

社会兼职

2023-05-01-今,国家科技奖励评审专家, 委员
2023-04-01-今,中国指挥控制学会网络空间测绘专委会, 委员

论文与专利

发表论文

[1] Yangyan Xu, Cong Cao, Fangfang Yuan, Rongxin Mi, Dakui Wang, Yanbing Liu, Majing Su: Data-Efficient Knowledge Distillation with Teacher Assistant-Based Dynamic Objective Alignment. ICCS 2024: 181-195

[2] Yi Gao, Fangfang Yuan, Jinglin Yang, Dakui Wang, Cong Cao, Yanbing Liu: Semi-supervised Malicious Domain Detection Based on Meta Pseudo Labeling. ICCS 2024: 312-324

[3] Qingyue Wang, Yanan Cao, Piji Li, Yanhe Fu, Zheng Lin, Cong Cao, Shi Wang, Li Guo: Confident Slot Iterative Learning for Multi-Domain Dialogue State Tracking. CogSci 2023

[4] Baoke Li, Cong Cao, Fangfang Yuan, Yuling Yang, Majing Su, Yanbing Liu, Jianhui Fu: NPGraph: An Efficient Graph Computing Model in NUMA-Based Persistent Memory Systems. CollaborateCom 2023: 205-222 (Best Paper)

[5] Yu Fu, Cong Cao, Yuling Yang, Yuhai Lu, Fangfang Yuan, Dakui Wang, Yanbing Liu: Mulan: A Multi-Level Alignment Model for Video Question Answering. EMNLP 2023: 5475-5489

[6] angyan Xu, Fangfang Yuan, Cong Cao, Xiaoliang Zhang, Majing Su, Dakui Wang, Yanbing Liu: MetaBERT: Collaborative Meta-Learning for Accelerating BERT Inference. CSCWD 2023: 119-124

[7] Yi Gao, Fangfang Yuan, Cong Cao, Majing Su, Dakui Wang, Yanbing Liu: Few-shot Malicious Domain Detection on Heterogeneous Graph with Meta-learning. CSCWD 2023: 727-732

[8] Diandian Guo, Majing Su, Cong Cao, Fangfang Yuan, Xiaoliang Zhang, Yanbing Liu, Jianhui Fu: Curvature-Driven Knowledge Graph Embedding for Link Prediction. CSCWD 2023: 1226-1231

[9] Zhiping Li, Fangfang Yuan, Cong Cao, Dakui Wang, Jiali Feng, Baoke Li, Yanbing Liu: Self-supervised Deep Heterogeneous Graph Neural Networks with Contrastive Learning. ICCS 2023: 268-282

[10] Yangyan Xu, Fangfang Yuan, Cong Cao, Majing Su, Yuhai Lu, Yanbing Liu: A Contrastive Self-distillation BERT with Kernel Alignment-Based Inference. ICCS 2023: 553-565

[11] Yuling Yang, Jiali Feng, Baoke Li, Fangfang Yuan, Cong Cao, Yanbing Liu: EDDVPL: A Web Attribute Extraction Method with Prompt Learning. ICONIP 2023: 474-484

[12] Yuhai Lu, Xiaolin Wang, Fangfang Yuan, Cong Cao, Xiaoliang Zhang, Yanbing Liu: RegexClassifier: A GNN-Based Recognition Method for State-Explosive Regular Expressions. ISCC 2023: 1039-1045

[13] Yanhe Fu, Yi Liu, Yanan Cao, Yubing Ren, Qingyue Wang, Fang Fang, Cong Cao: A Multi-granularity Similarity Enhanced Model for Implicit Event Argument Extraction. NLPCC 2023: 98-110

[14] Yi Gao, Zhiping Li, Fangfang Yuan, Xiaoliang Zhang, Dakui Wang, Cong Cao, Yanbing Liu: Robust Malicious Domain Detection Against Adversarial Attacks on Heterogeneous Graph. SMC 2023: 2028-2033

[15] Zhiping Li, Fangfang Yuan, Yanbing Liu, Cong Cao, Fang Fang, Jianlong Tan: Heterogeneous Graph Attention Network for Malicious Domain Detection. ICANN 2022: 506-518

[16] Jiali Feng, Cong Cao, Fangfang Yuan, Xiaoliang Zhang, Zhiping Li, Yanbing Liu, Jianlong Tan: DOM2R-Graph: A Web Attribute Extraction Architecture with Relation-Aware Heterogeneous Graph Transformer. ICONIP 2022: 468-479

[17] Baoke Li, Cong Cao, Fangfang Yuan, Yanbing Liu, Baohui Li, Binxing Fang: EPGraph: An Efficient Graph Computing Model in Persistent Memory System. ISPA/BDCloud/SocialCom/SustainCom 2022: 9-17

[18] Cheng Hu, Fangfang Yuan, Yanbing Liu, Cong Cao, Chunyan Zhang, Jianlong Tan: Malicious Domain Detection with Heterogeneous Graph Propagation Network. WASA 2022: 545-556

[19] Yuhai Lu, Chunyan Zhang, Cong Cao, Yanbing Liu, Jianlong Tan: BV-CEI: A Compact Implementation of Interval Query Indexing Algorithm. BigDataSE 2021: 80-86

[20] Lu Zhang, Yawei Kong, Fang Fang, Cong Cao, Yanan Cao, Yanbing Liu, Can Ma: Human-Like Storyteller: A Hierarchical Network with Gated Memory for Visual Storytelling. ICCS 2021: 257-270

[21] Yawei Kong, Lu Zhang, Can Ma, Cong Cao: HSAN: A Hierarchical Self-Attention Network for Multi-Turn Dialogue Generation. ICASSP 2021: 7433-7437

[22] Baoke Li, Cong Cao, Yuhai Lu, Yanbing Liu, Baohui Li, Binxing Fang, Jianhui Fu: D2Graph: An Efficient and Unified Out-of-Core Graph Computing Model. ISPA/BDCloud/SocialCom/SustainCom 2021: 193-201

[23] Yubao Tang, Zhezhou Li, Cong Cao, Fang Fang, Yanan Cao, Yanbing Liu, Jianhui Fu: Knowledge-Based Diverse Feature Transformation for Few-Shot Relation Classification. KSEM 2021: 101-114

[24] Ruipeng Jia, Yanan Cao, Hengzhu Tang, Fang Fang, Cong Cao, Shi Wang: Neural Extractive Summarization with Hierarchical Attentive Heterogeneous Graph Network. EMNLP 2020: 3622-3631

[25] Jie Xie, Yuhai Lu, Cong Cao, Zhenzhen Li, Yangyang Guan, Yanbing Liu: Joint Entity Linking for Web Tables with Hybrid Semantic Matching. ICCS 2020: 618-631

专利成果

[1] 袁方方, 李志平, 曹亚男, 张春燕, 卢毓海, 曹聪, 刘燕兵. 基于异质图鲁棒对抗学习的恶意域名检测方法和装置. CN: CN116668076A, 2023-08-29.
[2] 曹聪, 冯佳丽, 曹亚男, 袁方方, 李保珂, 卢毓海, 刘燕兵. 一种基于提示学习的半结构化网页属性值抽取方法和系统. CN: CN116628303A, 2023-08-22.
[3] 曹聪, 冯佳丽, 曹亚男, 袁方方, 李保珂, 卢毓海, 刘燕兵. 一种基于提示学习的半结构化网页属性值抽取方法和系统. 202310462355.1, 2023-04-26.
[4] 曹聪, 郭点点, 袁方方, 张啸梁, 卢毓海, 刘燕兵, 谭建龙. 一种融合图结构信息的知识图谱推理方法. 202310373927.9, 2023-04-10.
[5] 曹聪, 郭点点, 袁方方, 张啸粱, 卢毓海, 刘燕兵, 谭建龙. 一种融合图结构信息的知识图谱推理方法. CN: CN116468122A, 2023-07-21.
[6] 刘燕兵, 徐阳焰, 袁方方, 苏马婧, 卢毓海, 曹聪. 一种基于核对齐推理的对比自蒸馏BERT加速方法及装置. CN: CN116663532A, 2023-08-29.
[7] 刘燕兵, 徐阳焰, 袁方方, 张啸梁, 苏马婧, 王大魁, 曹聪. 基于协同元学习的推理加速方法及装置. CN: CN116484839A, 2023-07-25.
[8] 曹聪, 王志平, 袁方方, 张春燕, 卢毓海, 刘燕兵, 谭建龙. 一种基于多粒度情感的对话推荐方法及系统. CN: CN115630145A, 2023-01-20.
[9] 曹聪, 王志平, 袁方方, 张春燕, 卢毓海, 刘燕兵, 谭建龙. 一种基于多粒度情感的对话推荐方法及系统. CN115630145A, 2022-09-26.
[10] 卢毓海, 王晓琳, 曹聪, 袁方方, 张春燕, 刘燕兵. 面向相似文本的正则表达式自动生成方法、系统及介质. CN115587223A, 2022-09-01.
[11] 卢毓海, 王晓琳, 曹聪, 袁方方, 张春燕, 刘燕兵. 面向相似文本的正则表达式自动生成方法、系统及介质. CN: CN115587223A, 2023-01-10.
[12] 刘燕兵, 夏辉, 袁方方, 张啸梁, 曹聪, 卢毓海, 谭建龙. 一种基于稠密子图的图压缩方法和系统. CN: CN115439564A, 2022-12-06.
[13] 刘燕兵, 夏辉, 袁方方, 张啸梁, 曹聪, 卢毓海, 谭建龙. 一种基于稠密子图的图压缩方法和系统. CN115439564A, 2022-08-03.
[14] 刘燕兵, 夏辉, 袁方方, 张春燕, 曹聪, 卢毓海, 谭建龙. 一种稠密子图抽取方法和系统. CN115424025A, 2022-08-03.
[15] 刘燕兵, 夏辉, 袁方方, 张春燕, 曹聪, 卢毓海, 谭建龙. 一种稠密子图抽取方法和系统. CN: CN115424025A, 2022-12-02.
[16] 袁方方, 胡成, 刘燕兵, 曹聪, 卢毓海, 肖奎, 谭建龙. 一种基于异质图传播网络的恶意域名检测方法和系统. CN115442075A, 2022-08-02.
[17] 袁方方, 胡成, 刘燕兵, 曹聪, 卢毓海, 肖奎, 谭建龙. 一种基于异质图传播网络的恶意域名检测方法和系统. CN: CN115442075A, 2022-12-06.
[18] 袁方方, 田腾, 刘燕兵, 曹聪, 张春燕, 谭建龙, 郭莉. 一种基于深度支持向量数据描述的DGA域名检测方法及系统. CN116170168A, 2022-03-15.
[19] 袁方方, 田腾, 刘燕兵, 卢毓海, 曹聪, 谭建龙. 一种基于深度强化学习的恶意域名检测方法和装置. CN: CN114050912A, 2022-02-15.
[20] 袁方方, 田腾, 刘燕兵, 卢毓海, 曹聪, 谭建龙. 一种基于深度强化学习的恶意域名检测方法和装置. CN: CN114050912B, 2023-04-07.
[21] 唐钰葆, 于静, 曹聪, 刘燕兵, 谭建龙, 郭莉. 一种基于图卷积神经网络的文本分类方法及系统. CN: CN110929029A, 2020-03-27.
[22] 曹聪, 张路, 刘燕兵, 曹亚男, 谭建龙, 郭莉. 一种基于支持向量机的面向智能专家推荐的用户画像方法. CN: CN111597330A, 2020-08-28.
[23] 曹聪, 张路, 刘燕兵, 曹亚男, 谭建龙, 郭莉. 一种基于卷积神经网络的面向智能专家推荐的用户画像方法. CN: CN111581368A, 2020-08-25.
[24] 曹聪, 谢洁, 刘燕兵, 曹亚男, 谭建龙, 郭莉. 一种基于文本分类的中文表格列标签恢复方法和系统. CN: CN109710725A, 2019-05-03.
[25] 于静, 唐钰葆, 刘小梅, 刘燕兵, 曹聪, 谭建龙, 郭莉. 一种面向弱结构相关性的多模式图索引构建方法及系统. CN: CN109783696A, 2019-05-21.
[26] 于静, 郭晶晶, 刘小梅, 刘燕兵, 曹聪, 谭建龙, 郭莉. 一种面向多模式图匹配的并行加速方法. CN: CN109614520A, 2019-04-12.
[27] 张春燕, 刘燕兵, 曹聪, 卢毓海, 袁方方, 谭建龙, 郭莉. 数字查找树的压缩表示方法、系统、存储介质及规则匹配装置. CN: CN108399152A, 2018-08-14.
[28] 袁方方, 刘燕兵, 曹聪, 卢毓海, 张春燕, 谭建龙, 郭莉. 一种串匹配场景下随机模式串集合生成方法、设备和可读存储介质. CN: CN108073679A, 2018-05-25.
[29] 刘燕兵, 刘小梅, 于静, 曹聪, 谭建龙, 郭莉. 一种基于结构相关性的多模式图匹配方法. CN: CN107885797A, 2018-04-06.
[30] 于静, 郭晶晶, 刘燕兵, 曹聪, 谭建龙, 郭莉. 一种基于力导引算法的图数据可视化布局优化方法. CN: CN107818149A, 2018-03-20.

出版信息

科研活动

科研项目

（ 1 ）多模态融合分析, 负责人, 中国科学院计划, 2022-06--2024-06
（ 2 ）智能化平台, 负责人, 地方任务, 2022-03--2024-02
（ 3 ）评奖业务平台, 负责人, 国家任务, 2018-08--2024-12
（ 4 ）精准专家推荐算法设计, 负责人, 国家任务, 2018-07--2021-06
（ 5 ）安全分析平台子课题, 负责人, 国家任务, 2020-07--2022-07
（ 6 ）行为分析平台子课题, 负责人, 国家任务, 2016-06--2019-10
（ 7 ）社交网络相关研制子课题, 负责人, 国家任务, 2016-01--2018-10
（ 8 ）全网统一安全管理与威胁态势预警关键技术及系统子课题, 负责人, 国家任务, 2016-07--2019-06

指导学生

协助指导学生情况

年级姓名学位类别毕业去向获得奖项

2017级谢洁硕士百度所级优秀学生、三好学生、百度4S计划优秀校招生

2018级张路硕士快手中国科学院大学优秀大学生、优秀毕业论文、三好学生

2018级唐钰葆硕士读博 --

2019级王志平硕士京东 --

2020级冯佳丽硕士快手优秀毕业论文、优秀毕业生提名、三好学生

2021级杨宇凌直博 -- 优秀共产党员、优秀学生干部、三好学生

2021级付煜硕士 -- --

2022级郭点点硕士 -- 百度多任务识别大赛东部赛区二等奖、优秀共青团员