曹聪 男 硕导 中国科学院信息工程研究所
电子邮件: caocong@iie.ac.cn
通信地址: 北京市海淀区树村路19号
邮政编码:100085
中国科学院信息工程研究所信息内容识别过滤研究组负责人,中国指挥与控制学会网络空间测绘专委会委员,国家科技奖励评审专家,WWW、EMNLP等会议审稿人。长期从事自然语言处理、数据挖掘等方面研究工作,在EMNLP、ICASSP、Cogsci等国际知名会议上发表学术论文30余篇,申请发明专利24项,授权5项,登记软件著作权5项。近五年作为课题负责人和课题骨干承担国家重点研发计划、省部级重点项目、地方政府重大工程等项目8项,累计承担科研经费达7000余万元。先后获得所级优秀员工、室主任特别奖、室级优秀员工等荣誉。
研究领域
自然语言处理
数据挖掘
招生信息
招生专业
招生方向
教育背景
学历
学位
工作经历
工作简历
社会兼职
2023-04-01-今,中国指挥控制学会网络空间测绘专委会, 委员
论文与专利
发表论文
[1] Yangyan Xu, Cong Cao, Fangfang Yuan, Rongxin Mi, Dakui Wang, Yanbing Liu, Majing Su: Data-Efficient Knowledge Distillation with Teacher Assistant-Based Dynamic Objective Alignment. ICCS 2024: 181-195
[2] Yi Gao, Fangfang Yuan, Jinglin Yang, Dakui Wang, Cong Cao, Yanbing Liu: Semi-supervised Malicious Domain Detection Based on Meta Pseudo Labeling. ICCS 2024: 312-324
[3] Qingyue Wang, Yanan Cao, Piji Li, Yanhe Fu, Zheng Lin, Cong Cao, Shi Wang, Li Guo: Confident Slot Iterative Learning for Multi-Domain Dialogue State Tracking. CogSci 2023
[4] Baoke Li, Cong Cao, Fangfang Yuan, Yuling Yang, Majing Su, Yanbing Liu, Jianhui Fu: NPGraph: An Efficient Graph Computing Model in NUMA-Based Persistent Memory Systems. CollaborateCom 2023: 205-222 (Best Paper)
[5] Yu Fu, Cong Cao, Yuling Yang, Yuhai Lu, Fangfang Yuan, Dakui Wang, Yanbing Liu: Mulan: A Multi-Level Alignment Model for Video Question Answering. EMNLP 2023: 5475-5489
[6] angyan Xu, Fangfang Yuan, Cong Cao, Xiaoliang Zhang, Majing Su, Dakui Wang, Yanbing Liu: MetaBERT: Collaborative Meta-Learning for Accelerating BERT Inference. CSCWD 2023: 119-124
[7] Yi Gao, Fangfang Yuan, Cong Cao, Majing Su, Dakui Wang, Yanbing Liu: Few-shot Malicious Domain Detection on Heterogeneous Graph with Meta-learning. CSCWD 2023: 727-732
[8] Diandian Guo, Majing Su, Cong Cao, Fangfang Yuan, Xiaoliang Zhang, Yanbing Liu, Jianhui Fu: Curvature-Driven Knowledge Graph Embedding for Link Prediction. CSCWD 2023: 1226-1231
[9] Zhiping Li, Fangfang Yuan, Cong Cao, Dakui Wang, Jiali Feng, Baoke Li, Yanbing Liu: Self-supervised Deep Heterogeneous Graph Neural Networks with Contrastive Learning. ICCS 2023: 268-282
[10] Yangyan Xu, Fangfang Yuan, Cong Cao, Majing Su, Yuhai Lu, Yanbing Liu: A Contrastive Self-distillation BERT with Kernel Alignment-Based Inference. ICCS 2023: 553-565
[11] Yuling Yang, Jiali Feng, Baoke Li, Fangfang Yuan, Cong Cao, Yanbing Liu: EDDVPL: A Web Attribute Extraction Method with Prompt Learning. ICONIP 2023: 474-484
[12] Yuhai Lu, Xiaolin Wang, Fangfang Yuan, Cong Cao, Xiaoliang Zhang, Yanbing Liu: RegexClassifier: A GNN-Based Recognition Method for State-Explosive Regular Expressions. ISCC 2023: 1039-1045
[13] Yanhe Fu, Yi Liu, Yanan Cao, Yubing Ren, Qingyue Wang, Fang Fang, Cong Cao: A Multi-granularity Similarity Enhanced Model for Implicit Event Argument Extraction. NLPCC 2023: 98-110
[14] Yi Gao, Zhiping Li, Fangfang Yuan, Xiaoliang Zhang, Dakui Wang, Cong Cao, Yanbing Liu: Robust Malicious Domain Detection Against Adversarial Attacks on Heterogeneous Graph. SMC 2023: 2028-2033
[15] Zhiping Li, Fangfang Yuan, Yanbing Liu, Cong Cao, Fang Fang, Jianlong Tan: Heterogeneous Graph Attention Network for Malicious Domain Detection. ICANN 2022: 506-518
[16] Jiali Feng, Cong Cao, Fangfang Yuan, Xiaoliang Zhang, Zhiping Li, Yanbing Liu, Jianlong Tan: DOM2R-Graph: A Web Attribute Extraction Architecture with Relation-Aware Heterogeneous Graph Transformer. ICONIP 2022: 468-479
[17] Baoke Li, Cong Cao, Fangfang Yuan, Yanbing Liu, Baohui Li, Binxing Fang: EPGraph: An Efficient Graph Computing Model in Persistent Memory System. ISPA/BDCloud/SocialCom/SustainCom 2022: 9-17
[18] Cheng Hu, Fangfang Yuan, Yanbing Liu, Cong Cao, Chunyan Zhang, Jianlong Tan: Malicious Domain Detection with Heterogeneous Graph Propagation Network. WASA 2022: 545-556
[19] Yuhai Lu, Chunyan Zhang, Cong Cao, Yanbing Liu, Jianlong Tan: BV-CEI: A Compact Implementation of Interval Query Indexing Algorithm. BigDataSE 2021: 80-86
[20] Lu Zhang, Yawei Kong, Fang Fang, Cong Cao, Yanan Cao, Yanbing Liu, Can Ma: Human-Like Storyteller: A Hierarchical Network with Gated Memory for Visual Storytelling. ICCS 2021: 257-270
[21] Yawei Kong, Lu Zhang, Can Ma, Cong Cao: HSAN: A Hierarchical Self-Attention Network for Multi-Turn Dialogue Generation. ICASSP 2021: 7433-7437
[22] Baoke Li, Cong Cao, Yuhai Lu, Yanbing Liu, Baohui Li, Binxing Fang, Jianhui Fu: D2Graph: An Efficient and Unified Out-of-Core Graph Computing Model. ISPA/BDCloud/SocialCom/SustainCom 2021: 193-201
[23] Yubao Tang, Zhezhou Li, Cong Cao, Fang Fang, Yanan Cao, Yanbing Liu, Jianhui Fu: Knowledge-Based Diverse Feature Transformation for Few-Shot Relation Classification. KSEM 2021: 101-114
[24] Ruipeng Jia, Yanan Cao, Hengzhu Tang, Fang Fang, Cong Cao, Shi Wang: Neural Extractive Summarization with Hierarchical Attentive Heterogeneous Graph Network. EMNLP 2020: 3622-3631
[25] Jie Xie, Yuhai Lu, Cong Cao, Zhenzhen Li, Yangyang Guan, Yanbing Liu: Joint Entity Linking for Web Tables with Hybrid Semantic Matching. ICCS 2020: 618-631
专利成果
[1] 袁方方, 李志平, 曹亚男, 张春燕, 卢毓海, 曹聪, 刘燕兵. 基于异质图鲁棒对抗学习的恶意域名检测方法和装置. CN: CN116668076A, 2023-08-29.
[2] 曹聪, 冯佳丽, 曹亚男, 袁方方, 李保珂, 卢毓海, 刘燕兵. 一种基于提示学习的半结构化网页属性值抽取方法和系统. CN: CN116628303A, 2023-08-22.
[3] 曹聪, 冯佳丽, 曹亚男, 袁方方, 李保珂, 卢毓海, 刘燕兵. 一种基于提示学习的半结构化网页属性值抽取方法和系统. 202310462355.1, 2023-04-26.
[4] 曹聪, 郭点点, 袁方方, 张啸梁, 卢毓海, 刘燕兵, 谭建龙. 一种融合图结构信息的知识图谱推理方法. 202310373927.9, 2023-04-10.
[5] 曹聪, 郭点点, 袁方方, 张啸粱, 卢毓海, 刘燕兵, 谭建龙. 一种融合图结构信息的知识图谱推理方法. CN: CN116468122A, 2023-07-21.
[6] 刘燕兵, 徐阳焰, 袁方方, 苏马婧, 卢毓海, 曹聪. 一种基于核对齐推理的对比自蒸馏BERT加速方法及装置. CN: CN116663532A, 2023-08-29.
[7] 刘燕兵, 徐阳焰, 袁方方, 张啸梁, 苏马婧, 王大魁, 曹聪. 基于协同元学习的推理加速方法及装置. CN: CN116484839A, 2023-07-25.
[8] 曹聪, 王志平, 袁方方, 张春燕, 卢毓海, 刘燕兵, 谭建龙. 一种基于多粒度情感的对话推荐方法及系统. CN: CN115630145A, 2023-01-20.
[9] 曹聪, 王志平, 袁方方, 张春燕, 卢毓海, 刘燕兵, 谭建龙. 一种基于多粒度情感的对话推荐方法及系统. CN115630145A, 2022-09-26.
[10] 卢毓海, 王晓琳, 曹聪, 袁方方, 张春燕, 刘燕兵. 面向相似文本的正则表达式自动生成方法、系统及介质. CN115587223A, 2022-09-01.
[11] 卢毓海, 王晓琳, 曹聪, 袁方方, 张春燕, 刘燕兵. 面向相似文本的正则表达式自动生成方法、系统及介质. CN: CN115587223A, 2023-01-10.
[12] 刘燕兵, 夏辉, 袁方方, 张啸梁, 曹聪, 卢毓海, 谭建龙. 一种基于稠密子图的图压缩方法和系统. CN: CN115439564A, 2022-12-06.
[13] 刘燕兵, 夏辉, 袁方方, 张啸梁, 曹聪, 卢毓海, 谭建龙. 一种基于稠密子图的图压缩方法和系统. CN115439564A, 2022-08-03.
[14] 刘燕兵, 夏辉, 袁方方, 张春燕, 曹聪, 卢毓海, 谭建龙. 一种稠密子图抽取方法和系统. CN115424025A, 2022-08-03.
[15] 刘燕兵, 夏辉, 袁方方, 张春燕, 曹聪, 卢毓海, 谭建龙. 一种稠密子图抽取方法和系统. CN: CN115424025A, 2022-12-02.
[16] 袁方方, 胡成, 刘燕兵, 曹聪, 卢毓海, 肖奎, 谭建龙. 一种基于异质图传播网络的恶意域名检测方法和系统. CN115442075A, 2022-08-02.
[17] 袁方方, 胡成, 刘燕兵, 曹聪, 卢毓海, 肖奎, 谭建龙. 一种基于异质图传播网络的恶意域名检测方法和系统. CN: CN115442075A, 2022-12-06.
[18] 袁方方, 田腾, 刘燕兵, 曹聪, 张春燕, 谭建龙, 郭莉. 一种基于深度支持向量数据描述的DGA域名检测方法及系统. CN116170168A, 2022-03-15.
[19] 袁方方, 田腾, 刘燕兵, 卢毓海, 曹聪, 谭建龙. 一种基于深度强化学习的恶意域名检测方法和装置. CN: CN114050912A, 2022-02-15.
[20] 袁方方, 田腾, 刘燕兵, 卢毓海, 曹聪, 谭建龙. 一种基于深度强化学习的恶意域名检测方法和装置. CN: CN114050912B, 2023-04-07.
[21] 唐钰葆, 于静, 曹聪, 刘燕兵, 谭建龙, 郭莉. 一种基于图卷积神经网络的文本分类方法及系统. CN: CN110929029A, 2020-03-27.
[22] 曹聪, 张路, 刘燕兵, 曹亚男, 谭建龙, 郭莉. 一种基于支持向量机的面向智能专家推荐的用户画像方法. CN: CN111597330A, 2020-08-28.
[23] 曹聪, 张路, 刘燕兵, 曹亚男, 谭建龙, 郭莉. 一种基于卷积神经网络的面向智能专家推荐的用户画像方法. CN: CN111581368A, 2020-08-25.
[24] 曹聪, 谢洁, 刘燕兵, 曹亚男, 谭建龙, 郭莉. 一种基于文本分类的中文表格列标签恢复方法和系统. CN: CN109710725A, 2019-05-03.
[25] 于静, 唐钰葆, 刘小梅, 刘燕兵, 曹聪, 谭建龙, 郭莉. 一种面向弱结构相关性的多模式图索引构建方法及系统. CN: CN109783696A, 2019-05-21.
[26] 于静, 郭晶晶, 刘小梅, 刘燕兵, 曹聪, 谭建龙, 郭莉. 一种面向多模式图匹配的并行加速方法. CN: CN109614520A, 2019-04-12.
[27] 张春燕, 刘燕兵, 曹聪, 卢毓海, 袁方方, 谭建龙, 郭莉. 数字查找树的压缩表示方法、系统、存储介质及规则匹配装置. CN: CN108399152A, 2018-08-14.
[28] 袁方方, 刘燕兵, 曹聪, 卢毓海, 张春燕, 谭建龙, 郭莉. 一种串匹配场景下随机模式串集合生成方法、设备和可读存储介质. CN: CN108073679A, 2018-05-25.
[29] 刘燕兵, 刘小梅, 于静, 曹聪, 谭建龙, 郭莉. 一种基于结构相关性的多模式图匹配方法. CN: CN107885797A, 2018-04-06.
[30] 于静, 郭晶晶, 刘燕兵, 曹聪, 谭建龙, 郭莉. 一种基于力导引算法的图数据可视化布局优化方法. CN: CN107818149A, 2018-03-20.
出版信息
科研活动
科研项目
指导学生
协助指导学生情况
年级 姓名 学位类别 毕业去向 获得奖项
2017级 谢 洁 硕士 百度 所级优秀学生、三好学生、百度4S计划优秀校招生
2018级 张 路 硕士 快手 中国科学院大学优秀大学生、优秀毕业论文、三好学生
2018级 唐钰葆 硕士 读博 --
2019级 王志平 硕士 京东 --
2020级 冯佳丽 硕士 快手 优秀毕业论文、优秀毕业生提名、三好学生
2021级 杨宇凌 直博 -- 优秀共产党员、优秀学生干部、三好学生
2021级 付 煜 硕士 -- --
2022级 郭点点 硕士 -- 百度多任务识别大赛东部赛区二等奖、优秀共青团员