张晓宇 研究员/博导
中国科学院信息工程研究所
第6研究室
电子邮件:zhangxiaoyu@iie.ac.cn
通信地址:北京市海淀区树村路19号
邮政编码:100093
研究方向:
人工智能与深度学习、大数据内容安全、计算机视觉与多媒体等。
成果荣誉:
■ 在相关领域IJCV、TIP、TIFS、ToN、TMM、TNNLS、PR等国际知名期刊和AAAI、MM、WWW、KDD、IJCAI、CIKM、EMNLP等国际知名会议上发表学术论文100余篇;
■ 授权发明专利19项;
■ 主持国家自然科学基金4项,主持和参与国家重点研发计划、国家科技支撑计划、国家重大工程等科研项目20余项;
■ 荣获2019年中国图象图形学学会科学技术奖二等奖、2016年吴文俊人工智能科学技术创新奖二等奖、2018年北京市科学技术协会北京青年优秀科技论文奖三等奖、2017年中国电影电视技术学会影视科技优秀论文奖三等奖、2017年CCCV2017 Best Paper Nominate Award、2009年微软杯IEEE中国学生论文大赛银奖等学术荣誉。
学术任职:
■ 中国计算机学会(CCF)杰出会员;
■ 电气和电子工程师协会(IEEE)、国际计算机学会(ACM)、中国图像图形学会(CSIG)、中国人工智能学会(CAAI)高级会员;
■ 中国图像图形学会(CSIG)视觉大数据专委会、中国自动化学会(CAA)模式识别与机器智能专委会副秘书长。
目前,2025级硕/博
招生名额充足,欢迎联系!
研究领域
人工智能,模式识别,深度学习,多媒体分析与理解。
招生信息
招生专业
招生方向
教育背景
学历
学位
工作经历
工作简历
学术兼职
[1] 电气和电子工程师协会(IEEE):Senior Member,2016.02-今
[2] 国际计算机学会(ACM):Senior Member,2016.12-今
[3] 中国计算机学会(CCF):高级会员,2017.01-2022.09;杰出会员,2022.09-今
[4] 中国图像图形学会(CSIG):高级会员,2019.05-今
[5] 中国人工智能学会(CAAI):高级会员,2022.11-今
[6] 中国图像图形学会(CSIG)视觉大数据专委会:副秘书长,2017.05-今
[7] 中国自动化学会(CAA)模式识别与机器智能专委会:副秘书长,2017.11-今
专利与奖励
科技奖励
[1] WACV 2024国际竞赛: FRCSyn Challenge: Face Recognition Challenge in the Era of Synthetic Data, 第一名,排名5/6【指导老师】,2024
[2] 全国大数据与计算智能挑战赛,优胜奖,排名2/5【指导老师】,2023
[3] 北京图象图形学学会优秀导师提名奖,排名1/1,2023
[4] 中国科学院职工技能大赛人工智能领域,优胜奖,排名1/5【指导老师】,2023
[5] CVPR 2021国际竞赛: Woodscape Fisheye Semantic Segmentation for Autonomous Driving Challenge, 第一名,排名5/5【指导老师】,2021
——冠军方案:“Full swin-transformer encoder-decoder”
[6] 中国图象图形学学会科学技术奖,省部级,二等奖,排名1/2【第一完成人】,2019
——获奖成果:“基于协同融合的媒体智能感知”
[7] 北京市科学技术协会第十四届北京青年优秀科技论文奖,省部级,三等奖,排名1/1【第一作者】,2018
——获奖论文:《Bidirectional active learning: a two-way exploration into unlabeled and labeled dataset》
[8] 中国电影电视技术学会影视科技优秀论文奖,省部级,三等奖,排名3/3,2017
——获奖论文:《基于深度学习的融合媒体智能引擎研究》
[9] 中国电影电视技术学会影视科技优秀论文奖,省部级,三等奖,排名3/3,2017
——获奖论文:《基于海量异构数据关联和挖掘的媒体融合技术研究》
[10] CCCV2017 Best Paper Nominate Award,排名3/6【唯一通讯作者】,2017
——获奖论文:《A novel framework for image description generation》
[11] 吴文俊人工智能科学技术创新奖,省部级,二等奖,排名1/1【第一完成人】,2016
——获奖成果:“智能交互式主动学习关键技术”
[12] 微软杯IEEE中国学生论文大赛,银奖,排名1/1【第一作者】,2009
——获奖论文:《Effective annotation and search for video blogs with integration of context and content analysis》
[13] 宝钢教育基金,优秀学生奖,2009
[14] 中国科学院研究生院,三好学生标兵,2010
授权发明专利
[2] 一种基于可解释人工智能的实时入侵检测方法及系统. 2022.12.08, CN202211571092.X. 【授权】
[3] 基于对抗扰动的实时网络连接隐私保护方法和系统. 2022.06.01, CN202210622904.2. 【授权】
[4] 基于优化元学习的轻量恶意软件流量检测方法及装置. 2022.05.18, CN2022105476786.6. 【授权】
[5] 基于直推图的加密流量识别与分类方法及系统. 2022.04.25, CN202210440703.0. 【授权】
[6] 基于图匹配的不同网络环境的加密流量分类方法及系统. 2022.04.15, CN202210397693.7. 【授权】
[7] 一种基于动作片段排序的弱监督行为定位方法和装置. 2021.09.27, CN202111135210.8. 【授权】
[8] 一种基于图结构信息交互增强的行为检测方法及电子装置. 2020.07.20, CN202010698168.X. 【授权】
[9] 一种基于自表达相关的数据分类方法和装置. 2018.12.12, CN201811518273.X. 【授权】
[10] 一种基于生成对抗网络的安全隐写方法和装置. 2017.08.08, CN201710670786.1. 【授权】
[11] 一种支持全局复杂检索的跨地域查询方法及系统. 2017.06.07, CN201710422561.4. 【授权】
[12] 一种针对多源异构数据的异源间相似性度量方法. 2016.06.17, CN201610439325.9. 【授权】
[13] 一种新鲜度敏感的大数据概要信息维护及聚合值查询方法. 2015.05.18, CN201510252988.5. 【授权】
[14] 一种社交网络结构构建方法. 2015.01.30, CN201510050126.4. 【授权】
[15] 一种已标注样本的维护方法及双向学习交互式分类方法. 2015.01.29, CN201510046891.9. 【授权】
[16] 一种基于非确定主动学习的多分类器训练方法及分类方法. 2015.01.29, CN201510046879.8. 【授权】
[17] 面向大数据环境的概要信息动态构建与查询方法及装置. 2015.02.05, CN201510061345.2. 【授权】
[18] 一种提取地标性场景摘要的方法. 2009.12.16, CN200910242751.3. 【授权】
[19] 一种交互式图像检索方法. 2007.08.29, CN200710121079.3. 【授权】
论文专著
代表性期刊论文
■ CCF-A类:
[1] Learning spatiotemporal inconsistency via thumbnail layout for face deepfake detection. International Journal of Computer Vision (IJCV), 2024. 【*通信作者,CCF-A类期刊】
[2] Masked face transformer. IEEE Transactions on Information Forensics and Security (TIFS), 2024. 【第5作者,CCF-A类期刊】
[3] Prism: real-time privacy protection against temporal network traffic analyzers. IEEE Transactions on Information Forensics and Security (TIFS), 2023. 【*通信作者,CCF-A类期刊】
[4] Masked relation learning for deepfake detection. IEEE Transactions on Information Forensics and Security (TIFS), 2023. 【*通信作者,CCF-A类期刊】
[5] StochasticFormer: stochastic modeling for weakly supervised temporal action localization. IEEE Transactions on Image Processing (TIP), 2023. 【*通信作者,CCF-A类期刊】
[6] Face forgery detection by 3d decomposition and composition search. IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023. 【第5作者,CCF-A类期刊】
[7] ProGraph: robust network traffic identification with graph propagation. IEEE/ACM Transactions on Networking (ToN), 2022. 【*通信作者,CCF-A类期刊】
[8] Action shuffling for weakly supervised temporal localization. IEEE Transactions on Image Processing (TIP), 2022. 【第一作者,CCF-A类期刊】
[9] Heterogeneous face recognition via face synthesis with identity-attribute disentanglement. IEEE Transactions on Information Forensics and Security (TIFS), 2022. 【*通信作者,CCF-A类期刊】
[10] FA-GAN: face augmentation GAN for deformation-invariant face recognition. IEEE Transactions on Information Forensics and Security (TIFS), 2021. 【*通信作者,CCF-A类期刊】
[11] Context-aware local abnormality detection in crowded scene. Science China Information Sciences (SCIS), 2015. 【*通信作者,CCF-A类期刊】
■ CCF-B类:
[12] MetaTKG++: Learning evolving factor enhanced meta-knowledge for temporal knowledge graph reasoning. Pattern Recognition (PR), 2024. 【*通信作者,CCF-B类期刊】
[13] OW-TAL: learning unknown human activities for open-world temporal action localization. Pattern Recognition (PR), 2023. 【*通信作者,CCF-B类期刊】
[14] Robust network traffic identification with graph matching. Computer Networks (COMNET), 2022. 【*通信作者,CCF-B类期刊】
[15] DyGCN: efficient dynamic graph embedding with graph convolutional network. IEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2022. 【第4作者,CCF-B类期刊】
[16] SAPS: Self-Attentive Pathway Search for weakly-supervised action localization with background-action augmentation. Computer Vision and Image Understanding (CVIU), 2021. 【*通信作者,CCF-B类期刊】
[17] Weakly-supervised action localization via embedding-modeling iterative optimization. Pattern Recognition (PR), 2021. 【第一作者,CCF-B类期刊】
[18] Hashing nets for hashing: a quantized deep learning to hash framework for remote sensing image retrieval. IEEE Transactions on Geoscience and Remote Sensing (TGRS), 2020. 【第4作者,CCF-B类期刊】
[19] AdapNet: adaptability decomposing encoder-decoder network for weakly supervised action recognition and localization. IEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2020. 【第一作者,CCF-B类期刊】
[20] Generative adversarial image super-resolution through deep dense skip connections. Computer Graphics Forum (CGF), 2018. 【*通信作者,CCF-B类期刊】
[21] A self-paced regularization framework for multi-label learning. IEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2018. 【第4作者,CCF-B类期刊】
[22] Bidirectional active learning: a two-way exploration into unlabeled and labeled dataset. IEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2015. 【第一作者,CCF-B类期刊】
[23] Effective annotation and search for video blogs with integration of context and content analysis. IEEE Transactions on Multimedia (TMM), 2009. 【第一作者,CCF-B类期刊】
■ 其它:
(略)
代表性会议论文
[1] Chain-of-history reasoning for temporal knowledge graph forecasting. Annual Meeting of the Association for Computational Linguistics (ACL), 2024. 【*通信作者,CCF-A类会议】
[2] Cross-architecture distillation for face recognition. In Proc. ACM International Conference on Multimedia (MM), 2023. 【*通信作者,CCF-A类会议】
[3] Rumor detection with diverse counterfactual evidence. In Proc. ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD), 2023. 【*通信作者,CCF-A类会议】
[4] Grouped knowledge distillation for deep face recognition. In Proc. AAAI Conference on Artificial Intelligence (AAAI), 2022. 【*通信作者,CCF-A类会议】
[5] Dynamic graph modeling for weakly-supervised temporal action localization. In Proc. ACM International Conference on Multimedia (MM), 2022. 【*通信作者,CCF-A类会议】
[6] Multi-instance multi-label action recognition and localization based on spatio-temporal pre-trimming for untrimmed videos. In Proc. AAAI Conference on Artificial Intelligence (AAAI), 2020. 【第一作者,CCF-A类会议】
[7] On deep unsupervised active learning. In Proc. International Joint Conference on Artificial Intelligence (IJCAI), 2020. 【第5作者,CCF-A类会议】
[8] Dressing as a whole: outfit compatibility learning based on node-wise graph neural networks. In Proc. World Wide Web Conference (WWW), 2019. 【*通信作者,CCF-A类会议】
[9] Learning transferable self-attentive representations for action recognition in untrimmed videos with weak supervision. In Proc. AAAI Conference on Artificial Intelligence (AAAI), 2019. 【第一作者,CCF-A类会议】
[10] Residual invertible spatio-temporal network for video super-resolution. In Proc. AAAI Conference on Artificial Intelligence (AAAI), 2019. 【*通信作者,CCF-A类会议】
[11] Collaborative multi-view denoising. In Proc. ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD), 2016. 【第3作者,CCF-A类会议】
[12] MC-HOG correlation tracking with saliency proposal. In Proc. AAAI Conference on Artificial Intelligence (AAAI), 2016. 【第4作者,CCF-A类会议】
■ CCF-B类:
[13] MetaTKG: learning evolutionary meta-knowledge for temporal knowledge graph reasoning. In Proc. Conference on Empirical Methods in Natural Language Processing (EMNLP), 2022. 【*通信作者,CCF-B类会议】
[14] Fi-GNN: modeling feature interactions via graph neural networks for CTR prediction. In Proc. ACM International Conference on Information and Knowledge Management (CIKM), 2019. 【*通信作者,CCF-B类会议】
[15] Semi-supervised compatibility learning across categories for clothing matching. In Proc. IEEE International Conference on Multimedia and Expo (ICME), 2019. 【*通信作者,CCF-B类会议】
[16] Compressing deep neural networks for efficient visual inference. In Proc. IEEE International Conference on Multimedia and Expo (ICME), 2017. 【*通信作者,CCF-B类会议】
[17] Supporting real-time analytic queries in big and fast data environments. In Proc. International Conference on Database Systems for Advanced Applications (DASFAA), 2017. 【第6作者,CCF-B类会议】
[18] Multi-view multi-label active learning for image classification. In Proc. IEEE International Conference on Multimedia and Expo (ICME), 2009. 【第一作者,CCF-B类会议】
[19] Automatic semantic annotation for video blogs. In Proc. IEEE International Conference on Multimedia and Expo (ICME), 2008. 【第一作者,CCF-B类会议】
■ 其它:
(略)
科研活动
主持项目
[2] 项目负责人:国家自然科学基金-面上项目,2024.01-2027.12,51万元
[3] 课题负责人:基础科研计划-重大项目,2022.01-2025.12,400万元(项目总经费2030万元)
[4] 课题负责人:国家发改委重大工程项目,2022.01-2023.12,7288.8万元
[5] 项目负责人:国家信息技术安全研究中心采购项目,2021.06-2021.12,189万元
[6] 项目负责人:国家自然科学基金-联合基金项目-培育项目(NSFC-新疆联合基金),2021.01-2023.12,58万元
[7] 项目负责人:中国科学技术发展战略研究院项目,2020.12-2021.11,30万元
[8] 项目负责人:订购项目,2020.07-2020.12,708万元
[9] 项目负责人:国家自然科学基金-面上项目,2019.01-2022.12,61万元
[10] 项目负责人:模式识别国家重点实验室开放课题,2018.01-2019.12,4万元,
[11] 项目负责人:工程项目,2017.05-2018.04,219万元
[12] 项目负责人:国家242信息安全计划,2016.06-2017.05,80万元
[13] 项目负责人:国家自然科学基金-青年科学基金项目,2016.01-2018.12,23.7万元
[14] 课题负责人:国家科技支撑计划,2015.04-2017.12,172.2万元(项目总经费2361万元)
[15] 项目负责人:国家242信息安全计划,2014.06-2015.05,10万元
[16] 项目负责人:中央级公益性科研院所基本科研业务费专项资金-重点工作,2011.07-2012.06,58万元
[17] 项目负责人:中央级公益性科研院所基本科研业务费专项资金-重点工作,2010.07-2011.06,80万元
指导学生
毕业研究生
[2] 石海超,2017学硕/2020转博,网络空间安全,2022毕业
[3] 李泽坤,2018学硕,网络空间安全,2021毕业
[4] 邢剑,2018普博,网络空间安全,2022毕业
[5] 丁煜,2018普博,网络空间安全,2023毕业
[6] 张亚如,2019学硕/2022转博,计算机应用技术,2024毕业
[7] 李文灏,2019学硕/2022转博,网络空间安全,2024毕业
[8] 杨梓铭,2020学硕,计算机应用技术,2023毕业
[9] 张斌,2021学硕,计算机应用技术,2024毕业
在读研究生
[2] 赵唯松,2021直博,计算机应用技术
[3] 于艾靖,2022普博,计算机应用技术
[4] 童昭,2022普博,计算机应用技术
[5] 邢思雨,2022学硕/2024转博,计算机应用技术
[6] 张凯薇,2022学硕,网络空间安全
[7] 徐文武,2022学硕,网络空间安全
[8] 戴光祥,2022学硕,网络空间安全
[9] 徐雨婷,2023普博,计算机应用技术
[10] 刘继鹏,2023直博,计算机应用技术
[11] 杨琛,2023专硕,电子信息
[12] 熊欣,2024直博,网络空间安全
[13] 吉文轩,2024直博,计算机应用技术
[14] 陈书桓,2024专硕,网络与信息安全
荣誉奖励
[1] 石海超:北京市科学技术协会青年人才托举工程,2024
[2] 石海超:北京图象图形学学会优秀博士论文提名奖,2023
[3] 石海超:朱李月华优秀博士生奖学金,2022
[4] 张亚如:国家奖学金,2021
[5] 石海超:国家奖学金,2019
[6] 张凯:中国科学院院长奖学金,2017
[7] 张凯:国家奖学金,2017