基本信息

黄岩  男    中国科学院自动化研究所

中科院院长特别奖

中国人工智能学会优博

北京市科技新星

北京市优秀青年人才

中国科协青年人才托举工程

百度奖学金、微软铸星计划


电子邮件: yhuang@nlpr.ia.ac.cn
通信地址: 北京市海淀区中关村东路95号
邮政编码: 100190

研究领域

视觉-语言理解,视频分析

招生信息


招生专业
081104-模式识别与智能系统
招生方向
视觉-语言理解
视频分析

教育背景

2012-09--2017-07   中国科学院大学   博士
2008-09--2012-07   电子科技大学   学士

工作经历

   
工作简历
2019-11~现在, 中国科学院自动化研究所, 副研究员
2017-07~2019-10,中国科学院自动化研究所, 助理研究员
社会兼职
2020-01-01-2024-12-31,中国计算机学会计算机视觉专委会, 副秘书长
2020-01-01-2020-07-01,CVPR2020 Workshop on Language & Vision with Applications to Video Understanding, 组织主席
2020-01-01-2020-07-01,CVPR2020 Workshop on Multimodal Learning, 组织主席
2019-05-01-2019-11-30,ICCV2019 Workshop Cross-Modal Learning in Real World, 副秘书长

教授课程

深度学习

专利与奖励

   
奖励信息
(1) 中国科协青年人才托举工程, 部委级, 2020
(2) 北京市优秀青年人才, 部委级, 2020
(3) 北京市科技新星, 部委级, 2020
(4) 微软铸星计划, 其他, 2019
(5) 中国科学院优秀博士学位论文奖, 院级, 2018
(6) NVIDIA创新研究奖, 其他, 2018
(7) 中国人工智能学会优秀博士学位论文奖, 其他, 2018
(8) 中国科学院院长特别奖, 院级, 2017
(9) 百度奖学金, 其他, 2016
(10) RACV Best Poster Award, , 其他, 2016
(11) ICPR Best Student Paper Award, , 其他, 2014
(12) CVPR Workshop Best Paper Award, , 其他, 2014
专利成果
[1] 王亮, 黄岩, 陈泽睿. 跨模态检索方法、装置、设备及计算机可读存储介质. CN: CN112487217A, 2021-03-12.
[2] 王亮, 黄岩, 程文龙. 面向无约束视觉问答指向问题的检索方法及系统. CN: CN108446404B, 2021-01-05.
[3] 王亮, 黄岩, 宋纯锋. 基于分割剪影的行人再识别方法及系统. CN: CN109101866B, 2020-12-15.
[4] 王亮, 黄岩, 黄林江. 基于关系原型网络的弱监督时序行为定位方法及装置. CN: CN111783713A, 2020-10-16.
[5] 王亮, 黄岩, 黄林江. 基于身体部件层面的骨架行为识别方法及装置. CN: CN111783711A, 2020-10-16.
[6] 王亮, 黄岩, 牛凯. 基于自适应度量融合的跨模态检索重排序方法. CN: CN111026935A, 2020-04-17.
[7] 王亮, 黄岩, 宋纯锋, 孙天宇. 基于生成对抗网络的帧率增强步态识别方法及装置. 中国: CN108681689A, 2018.10.19.
[8] 王亮, 王威, 黄岩. 基于双向循环卷积网络的视频超分辨率方法和系统. 中国: CN105072373B, 2018.03.27.
[9] 王亮, 张兆翔, 黄岩, 李林. 目标体的动作行为识别方法及装置. 中国: CN108629326A, 2018-10-09.
[10] 王亮, 黄岩, 宋纯锋, 王彦蕴. 基于双流生成对抗网络的跨视角步态识别装置及训练方法. 中国: CN108596026A, 2018-09-28.
[11] 王亮, 谭铁牛, 王威, 黄岩. 人脸验证方法和系统. 中国: CN104363981B, 2018-06-05.
[12] 王亮, 谭铁牛, 王威, 黄岩. 基于判别式多模态深度置信网多模态数据融合方法和系统. 中国: CN103838836A, 2014-06-04.
[13] 谭铁牛, 王亮, 王威, 黄岩. 一种基于多任务深度神经网络的数据识别方法及装置. 中国: CN103345656A, 2013-10-09.

出版信息

在相关领域的国际期刊和会议上发表(含录用)论文共计60余篇,其中领域权威期刊和会议论文共计36篇。以第一作者身份发表领域顶级期刊TPAMI 3篇、领域顶级会议CVPR 2篇、ICCV 2篇、NeurIPS 1篇、AAAI 1篇。更全的论文列表请参考:https://scholar.google.com/citations?user=6nUJrQ0AAAAJ&hl=zh-CN

发表论文
[1] Huang, Linjiang, Huang, Yan, Ouyang, Wanli, Wang, Liang. Modeling Sub-Actions for Weakly Supervised Temporal Action Localization. IEEE TRANSACTIONS ON IMAGE PROCESSING[J]. 2021, 30: 5154-5167, http://dx.doi.org/10.1109/TIP.2021.3078324.
[2] Fang, Yuchun, Xiao, Zhengye, Zhang, Wei, Huang, Yan, Wang, Liang, Boujemaa, Nozha, Geman, Donald. Attribute Prototype Learning for Interactive Face Retrieval. IEEE TRANSACTIONS ON INFORMATION FORENSICS AND SECURITY[J]. 2021, 16: 2593-2607, https://www.webofscience.com/wos/woscc/full-record/WOS:000628908000001.
[3] An, Dong, Qi, Yuankai, Huang, Yan, Wu, Qi, Wang, Liang, Tan, Tieniu. Neighbor-view Enhanced Model for Vision and Language Navigation. ACM MM 2021[J]. 2021, http://arxiv.org/abs/2107.07201.
[4] Luo, Zhengxiong, Wang, Zhicheng, Huang, Yan, Tan, Tieniu, Zhou, Erjin. Rethinking the Heatmap Regression for Bottom-up Human Pose Estimation. 2021, http://arxiv.org/abs/2012.15175.
[5] Linjiang Huang, Yan Huang, Ouyang Wanli, Liang Wang. Two-Branch Relational Prototypical Network for Weakly Supervised Temporal Action Localization. IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE TPAMI)[J]. 2021, [6] Keji He, Yan Huang, Qi Wu, Jianhua Yang, Dong An, Shuanglin Sima, Liang Wang. Landmark-RxR: Solving Vision-and-Language Navigation with Fine-Grained Alignment Supervision. Neural Information Processing Systems (NeurIPS)null. 2021, [7] Wei Tang, Yan Huang, Liang Wang. PokerNet:Expanding Features Cheaply via Depthwise Convolutions. 国际自动化与计算杂志:英文版[J]. 2021, 18(3): 432-442, http://lib.cqvip.com/Qikan/Article/Detail?id=7104772588.
[8] Yan Huang, Jingdong Wang, Liang Wang. Few-Shot Image and Sentence Matching via Aligned Cross-Modal Memory. IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE TPAMI)[J]. 2021, [9] 尹奇跃, 黄岩, 张俊格, 吴书, 王亮. 基于深度学习的跨模态检索综述. 中国图象图形学报. 2021, 26(6): 1368-1388, [10] Huang, Yan, Wu, Qi, Wang, Wei, Wang, Liang. Image and Sentence Matching via Semantic Concepts and Order Learning. IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE[J]. 2020, 42(3): 636-650, http://dx.doi.org/10.1109/TPAMI.2018.2883466.
[11] 郑爱华, 曾小强, 江波, 黄岩, 汤进. 基于局部异质协同双路网络的跨模态行人重识别. 模式识别与人工智能[J]. 2020, 33(10): 867-878, http://lib.cqvip.com/Qikan/Article/Detail?id=7103271201.
[12] Wang, Weining, Huang, Yan, Wang, Liang. Long video question answering: A Matching-guided Attention Model. PATTERN RECOGNITION[J]. 2020, 102: http://dx.doi.org/10.1016/j.patcog.2020.107248.
[13] Huang, Yan, Long, Yang, Wang, Liang, AAAI. Few-Shot Image and Sentence Matching via Gated Visual-Semantic Embedding. THIRTY-THIRD AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE / THIRTY-FIRST INNOVATIVE APPLICATIONS OF ARTIFICIAL INTELLIGENCE CONFERENCE / NINTH AAAI SYMPOSIUM ON EDUCATIONAL ADVANCES IN ARTIFICIAL INTELLIGENCEnull. 2019, 8489-8496, http://apps.webofknowledge.com/CitedFullRecord.do?product=UA&colName=WOS&SID=5CCFccWmJJRAuMzNPjj&search_mode=CitedFullRecord&isickref=WOS:000486572503004.
[14] Huang, Yan, Wang, Liang, IEEE. ACMM: Aligned Cross-Modal Memory for Few-Shot Image and Sentence Matching. 2019 IEEE/CVF INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV 2019)null. 2019, 5773-5782, [15] Zheng Wu, Li Lin, Zhang Zhaoxiang, Huang Yan, Wang Liang, IEEE. RELATIONAL NETWORK FOR SKELETON-BASED ACTION RECOGNITION. 2019 IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO (ICME)null. 2019, 826-831, [16] Song, Chunfeng, Huang, Yan, Ouyang, Wanli, Wang, Liang, IEEE Comp Soc. Box-driven Class-wise Region Masking and Filling Rate Guided Loss for Weakly Supervised Semantic Segmentation. 2019 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR 2019)null. 2019, 3131-3140, [17] Huang, Yan, Wang, Wei, Wang, Liang. Video Super-Resolution via Bidirectional Recurrent Convolutional Networks. IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE[J]. 2018, 40(4): 1015-1028, https://www.webofscience.com/wos/woscc/full-record/WOS:000426687100018.
[18] Li Lin, Zhang Zhaoxiang, Huang Yan, Wang Liang, IEEE. Deep Temporal Feature Encoding for Action Recognition. 2018 24TH INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION (ICPR)null. 2018, 1109-1114, [19] Zhaoxiang Zhang, Yan Huang, Liang Wang, Lin Li. Deep Temporal Feature Encoding for Video Action Recognition. 2018, http://ir.ia.ac.cn/handle/173211/21583.
[20] Huang, Yan, Wu, Qi, Song, Chunfeng, Wang, Liang, IEEE. Learning Semantic Concepts and Order for Image and Sentence Matching. 2018 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)null. 2018, 6163-6171, [21] 黄岩. 深度学习新模型及其应用研究. 2017, http://ir.ia.ac.cn/handle/173211/14819.
[22] Huang, Yan, Wang, Wei, Wang, Liang, Tan, Tieniu. Conditional High-Order Boltzmann Machines for Supervised Relation Learning. IEEE TRANSACTIONS ON IMAGE PROCESSING[J]. 2017, 26(9): 4297-4310, https://www.webofscience.com/wos/woscc/full-record/WOS:000405395900004.
[23] 王亮, 谭铁牛, 黄岩, 周振, 王威. See the Forest for the Trees: Joint Spatial and Temporal Recurrent Neural Networks for Video-based Person Re-identfication. 2017, http://ir.ia.ac.cn/handle/173211/14514.
[24] Yin Qiyue, Huang Yan, Wu Shu, Wang Liang, Yang J, Hu Q, Cheng MM, Wang L, Liu Q, Bai X, Meng D. Learning Shared and Specific Factors for Multi-modal Data. COMPUTER VISION, PT IInull. 2017, 772: 89-98, [25] 王威, 王亮, 黄岩. Instance-aware Image and Sentence Matching with Selective Multimodal LSTM. 2017, http://arxiv.org/abs/1611.05588.
[26] Huang, Yan, Wang, Wei, Wang, Liang, Cortes, C, Lawrence, ND, Lee, DD, Sugiyama, M, Garnett, R. Bidirectional Recurrent Convolutional Networks for Multi-Frame Super-Resolution. ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS 28 (NIPS 2015)null. 2015, 28: http://ir.ia.ac.cn/handle/173211/11092.
[27] Huang, Yan, Wang, Wei, Wang, Liang, IEEE. Conditional High-order Boltzmann Machine: A Supervised Learning Model for Relation Learning. 2015 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV)null. 2015, 4265-4273, http://ir.ia.ac.cn/handle/173211/11091.
[28] Huang, Yan, Wang, Wei, Wang, Liang. Unconstrained Multimodal Multi-Label Learning. IEEE TRANSACTIONS ON MULTIMEDIA[J]. 2015, 17(11): 1923-1935, http://ir.ia.ac.cn/handle/173211/10497.
[29] Wang Wei, Huang Yan, Wang Yizhou, Wang Liang. Generalized Autoencoder: A Neural Network Framework for Dimensionality Reduction. IEEE Conference on Computer Vision and Pattern Recognition (CVPR) Workshopsnull. 2014, http://ir.ia.ac.cn/handle/173211/11090.
[30] Huang, Yan, Wang, Wei, Wang, Liang, Tan, Tieniu, IEEE. MULTI-TASK DEEP NEURAL NETWORK FOR MULTI-LABEL LEARNING. 2013 20TH IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP 2013)null. 2013, 2897-2900, [31] Huang Yan, Wang Wei, Wang Liang, Tan Tieniu. An effective regional saliency model based on extended site entropy rate. 2012 21st International Conference on Pattern Recognition (ICPR)null. 2012, http://ir.ia.ac.cn/handle/173211/11099.

科研活动

   
科研项目
( 1 ) 视觉认知深度学习理论与方法研究, 主持, 部委级, 2019-09--2024-08
( 2 ) 基于层次化建模和联合任务学习的复杂行为与事件分析, 主持, 国家级, 2019-01--2021-12
( 3 ) 体育视频里的运动目标跟踪与定位, 主持, 院级, 2018-12--2024-06
( 4 ) 面向开放环境的自适应感知, 主持, 国家级, 2019-12--2023-12
( 5 ) 北京市科技新星项目, 主持, 省级, 2020-09--2023-08
( 6 ) 中科院青促会项目, 主持, 部委级, 2021-01--2025-01