基本信息

郭海云  女  硕导  中国科学院自动化研究所  

紫东太初大模型中心 模式识别国家重点实验室 

入选北京科协青年人才托举工程

电子邮件: haiyun.guo@nlpr.ia.ac.cn
通信地址: 北京海淀区中关村东路95号自动化大厦
邮政编码: 100190


郭海云,中国科学院自动化研究所-紫东太初大模型研究中心副研究员、硕导。研究兴趣包括多模态内容理解与生成、大模型高效训练、持续学习、领域泛化、自监督学习、噪声标记学习等。共发表高水平论文40余篇,其中一作或通讯作者论文20篇。Google Scholar 引用次数总计1300余次,H-index 15。申请国家发明专利20多项。主笔起草智能交通领域行业标准2项,参与制定3项大模型方向国家标准。入选北京科协青年人才托举工程,获得北京市自然科学二等奖、欧洲图形学会议三维目标检索竞赛第一名、吴文俊人工智能科学技术进步二等奖等10余项荣誉。作为负责人或技术骨干参与科技部重大项目、国家自然科学基金等10余项纵向项目,承担经费累计超3000万元。参与研发的“紫东太初”大模型荣获世界人工智能大会最高奖-SAIL奖、获评中国算力大会“创新先锋”优秀成果。参与研发的“秦岭秦川”交通大模型获得昇腾AI创新大赛金奖。

研究领域

多模态大模型

细粒度识别与检索

持续学习


招生信息

   
招生专业
081104-模式识别与智能系统
081203-计算机应用技术
招生方向
图像与视频分析
多模态大模型
持续学习

教育背景

2013-09--2018-06   中国科学院大学   博士
2009-09--2013-06   武汉大学   学士

工作经历

   
工作简历
2020-10~现在, 中国科学院自动化研究所, 副研究员
2018-07~2020-10,中国科学院自动化研究所, 助理研究员
社会兼职
2023-12-01-2023-12-31,2023年全国大学生机器人大赛评委, 评委
2023-04-10-今,BSIG女科技工作者委员会, 委员
2021-12-19-今,中国图象图形学学会, 机器视觉专委会委员
2020-08-01-今,中国图象图形学学会, 多媒体专委会委员

教授课程

图像与视频检索

专利与奖励

奖项与荣誉

(1)2015年 全国研究生智慧城市视频分析挑战赛-跨摄像头目标跟踪竞赛二等奖

(2)2015年 欧洲图形国际会议-多视角3D目标检索竞赛第一名

(3)2018年 中科院Rokid人工智能奖

(4)2018年 吴文俊人工智能科技进步二等奖

(5)2019年 IEEE视觉通信与图像处理国际会议(VCIP)车辆识别竞赛冠军

(6)2019年 中国科学院科技成果转化二等奖

(7)2020年 中国发明协会发明创新银奖

(8)2022年 入选北京科协2022-2024年度青年人才托举工程

(9)2022年 北京大数据技能大赛“智慧安防”赛道优胜奖和最佳技术奖

(10)2023年 所在团队被评为“科苑名匠”

(11)2023年 北京市科学技术奖自然科学二等奖


专利成果
( 1 ) 基于关键点检测和局部特征对齐的车辆重识别方法, 专利授权, 2021, 第 3 作者, 专利号: CN112990152B

( 2 ) 基于分布学习的自适应方差和权重的人脸年龄估计方法, 发明专利, 2021, 第 1 作者, 专利号: CN112560823A

( 3 ) 基于循环一致性的无监督人体姿态迁移方法、系统及装置, 专利授权, 2021, 第 1 作者, 专利号: CN111739115B

( 4 ) 基于特征对抗学习和自相似性聚类的跨域目标重识别方法, 专利授权, 2021, 第 1 作者, 专利号: CN111738172B

( 5 ) 基于图网络的多粒度特征学习的图像精细分类方法及系统, 专利授权, 2021, 第 1 作者, 专利号: CN111814920B

( 6 ) 基于语义一致水平条和前景修正的行人重识别方法, 专利授权, 2020, 第 1 作者, 专利号: CN111783753B

( 7 ) 基于深度学习的车型识别模型构建方法及车型识别方法, 专利授权, 2019, 第 2 作者, 专利号: CN106570477B

出版信息

发表一作或通讯作者论文20篇,包括TIP、TNNLS、TITS等中科院一区期刊论文,AAAI、ECCV、CVPR、ACM MM等国际顶级会议论文,谷歌学术引用1300余次。完整论文列表请查阅DBLPGoogle Scholar 。申请国家发明专利20多项。主笔起草车辆识别行业标准2项


发表论文(部分已发表论文:)
[1] Li, Wei, Guo, Haiyun, Dong, Honghui, Tang, Ming, Zhou, Yue, Wang, Jinqiao. Bi-Level Implicit Semantic Data Augmentation for Vehicle Re-Identification. IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS[J]. 2023, [2] yongqi an, xu zhao, tao yu, Haiyun Guo, Chaoyang Zhao, ming tang, Jinqiao Wang. ZBS: Zero-shot Background Subtraction via Instance-level Background Modeling and Foreground Selection. CVPRnull. 2023, [3] Zhu Kuan, Guo Haiyun, Tang Ming, Wang Jinqiao. Learning semantics- consistent stripes with self-refinement for person re-identification. IEEE Transactions on neural networks and learning system[J]. 2022, [4] Zhang, La, Guo, Haiyun, Zhu, Kuan, Qiao, Honglin, Huang, Gaopan, Zhang, Sen, Zhang, Huichen, Sun, Jian, Wang, Jinqiao. Hybrid Modality Metric Learning for Visible-Infrared Person Re-Identification. ACM TRANSACTIONS ON MULTIMEDIA COMPUTING COMMUNICATIONS AND APPLICATIONS[J]. 2022, 18(1): http://dx.doi.org/10.1145/3473341.
[5] Xu, Mingyuan, Guo, Haiyun, Jia, Yuheng, Dai, Zhitao, Wang, Jinqiao. Pseudo Label Rectification With Joint Camera Shift Adaptation and Outlier Progressive Recycling for Unsupervised Person Re-Identification. IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS. 2022, [6] Zhu, Kuan, Guo, Haiyun, Yan, Tianyi, Zhu, Yousong, Wang, Jinqiao, Tang, Ming. PASS: Part-Aware Self-Supervised Pre-Training for Person Re-Identification. ECCVnull. 2022, [7] Tu Mingfei, Zhu Kuan, Guo Haiyun, Miao, Qinghai, Wang Jinqiao. Multi-granularity Mutual Learning Network for Object Re-identification. IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS[J]. 2022, [8] Liu, Songyan, Guo, Haiyun, Zhu, Kuan, Wang, Jinqiao, Tang, Ming. Unsupervised cycle-consistent person pose transfer. NEUROCOMPUTING[J]. 2021, 453: 502-511, http://dx.doi.org/10.1016/j.neucom.2020.10.059.
[9] Wen Xin, Li Biying, Guo Haiyun, Tang Ming, Wang Jinqiao. Adaptive Variance Based Label Distribution Learning For Facial Age Estimation. ECCVnull. 2020, [10] Liu, Songyan, Guo, Haiyun, Hu, JianGuo, Zhao, Xu, Zhao, Chaoyang, Wang, Tong, Zhu, Yousong, Wang, Jinqiao, Tang, Ming. A novel data augmentation scheme for pedestrian detection with attribute preserving GAN. NEUROCOMPUTING[J]. 2020, 401(11): 123-132, http://dx.doi.org/10.1016/j.neucom.2020.02.094.
[11] Zhu Kuan, Guo Haiyun, Tang Ming, Wang Jinqiao. Identity-Guided Human Semantic Parsing for Person Re-Identification. ECCVnull. 2020, [12] Guo, Haiyun, Zhu, Kuan, Tang, Ming, Wang, Jinqiao. Two-Level Attention Network With Multi-Grain Ranking Loss for Vehicle Re-Identification. IEEE TRANSACTIONS ON IMAGE PROCESSING[J]. 2019, 28(9): 4328-4338, http://dx.doi.org/10.1109/TIP.2019.2910408.
[13] Zhu, Yousong, Zhao, Chaoyang, Gun, Haiyun, Wang, Jinqiao, Zhao, Xu, Lu, Hanqing. Attention CoupleNet: Fully Convolutional Attention Coupling Network for Object Detection. IEEE TRANSACTIONS ON IMAGE PROCESSING[J]. 2019, 28(1): 113-126, http://ir.ia.ac.cn/handle/173211/23587.
[14] Guo, Haiyun, Wu, Huiyao, Zhao, Chaoyang, Zhang, Huichen, Wang, Jinqiao, Lu, Hanqing. Cascade Attention Network for Person Re-Identification. 2019 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP)null. 2019, 2264-2268, http://apps.webofknowledge.com/CitedFullRecord.do?product=UA&colName=WOS&SID=5CCFccWmJJRAuMzNPjj&search_mode=CitedFullRecord&isickref=WOS:000521828602078.
[15] Zhao, Xu, Zhao, Chaoyang, Guo, Haiyun, Zhu, Yousong, Tang, Ming, Wang, Jinqiao. Elite Loss for scene text detection. NEUROCOMPUTING[J]. 2019, 333(333): 284-291, http://ir.ia.ac.cn/handle/173211/23594.
[16] Guo Haiyun, Zhao Chaoyang, Liu Zhiwei, Wang Jinqiao, Lu Hanqing. Learning Coarse-to-fine Structured Feature Embedding for Vehicle Re-identification. AAAInull. 2018, http://ir.ia.ac.cn/handle/173211/20902.
[17] Guo, Haiyun, Wang, Jinqiao, Gao, Yue, Li, Jianqiang, Lu, Hanqing. Multi-View 3D Object Retrieval With Deep Embedding Network. IEEE TRANSACTIONS ON IMAGE PROCESSING[J]. 2016, 25(12): 5526-5537, http://dx.doi.org/10.1109/TIP.2016.2609814.
[18] Guo Haiyun, Wang Jinqiao, Lu Hanqing. Learning Deep Compact Descriptor with Bagging Auto-encoders for Object Retrieval. ICIPnull. 2015, http://ir.ia.ac.cn/handle/173211/20133.
[19] Guo Haiyun, Wang Jinqiao, Xu Min, Zha ZhengJun, Lu Hanqing. Learning Multi-view Deep Features for Small Object Retrieval in Surveillance Scenarios. ACM MMnull. 2015, 859-862, http://dx.doi.org/10.1145/2733373.2806349.

科研活动

(1)主持科技部重大项目课题1项、国家自然科学基金青年项目1项、广东省重点研发计划项目课题2项、阿里巴巴创新研究计划项目1项、公安部交通管理科学研究所开放课题1项,作为技术骨干参与国家自然科学基金面上项目3项、工信部揭榜挂帅项目1项、中科院STS双创计划项目1项、广州市领军团队项目1项。所研发的核心技术为智慧交通、智慧安防、智能监管等产业服务,并与阿里、华为、公安部交通管理科学研究所、中国电子进出口有限公司等多家单位开展了技术合作。

(2)在PRCV2019会议上与交通运输部规划研究院、长安大学等单位联合组织举办了车纹识别技术挑战赛,引起了广泛关注,推动了相关领域的发展。

(3)担任IEEE TIP、TBIOM、TNNLS、TIFS、TITS、TMM、PR等国际期刊和CVPR、ICCV、NeurIPS、ECCV、AAAI、PRCV等国内外会议审稿人。


科研项目
( 1 ) 原生全栈国产自主可控超大规模模型训练技术, 负责人, 国家任务, 2021-12--2024-12
( 2 ) 跨媒介智能理解软件关键技术, 负责人, 地方任务, 2020-01--2022-12
( 3 ) 基于混合增强智能的平行智能理论研究及验证, 负责人, 地方任务, 2020-01--2022-12
( 4 ) 基于对抗学习与关系建模的监控视频目标检索研究, 负责人, 国家任务, 2021-01--2023-12
( 5 ) 面向智慧高速场景的鲁棒多粒度车辆重识别技术研究, 负责人, 企业委托, 2020-11--2022-06
( 6 ) 基于结构关系和知识学习的大规模视觉目标检索, 参与, 国家任务, 2018-01--2021-12
参与会议
(1)基于上下文结构关系的细粒度分类与检索   第十七届图象图形技术与应用学术会议   2022-04-23

指导学生

   
指导研究生

1. 2018-2023. 朱宽,博士研究生,模式识别与智能系统(联合培养,发表一作论文ECCV2020、ECCV2022、TNNLS2022,获得2019年IEEE VCIP国际车辆重识别竞赛冠军和2020年度国家奖学金)

2. 2018-2021. 温馨,硕士研究生(非全日制),人工智能(发表一作论文ECCV2020,毕业去向:国防科技大学读博) 

3. 2019-2022. 凃鸣非,硕士研究生,计算机应用技术(联合培养,发表一作论文TITS2022) 

4. 2019-2022. 伍虹燕,硕士研究生,计算机应用技术(联合培养,发表一作论文MMM2022,获得2021年度国家奖学金)

5. 2019-2022. 吴畏,硕士研究生(非全日制),人工智能

6. 2020-2022. 闫天翊,硕士研究生(非全日制),人工智能(发表一作论文ICPRW,在投论文2篇,毕业去向:澳门大学读博

7. 2020至今. 李巍,博士研究生(北京交通大学联合培养,发表一作论文TITS2023,获得2021年度北京交通大学一等学业奖学金)

8. 2021至今. 安泓岩,硕士研究生(非全日制),人工智能

9. 2021至今. 何鑫,硕士研究生(非全日制),人工智能

10. 2021至今. 贺靖涵,博士研究生,模式识别与智能系统

11. 2023至今. 郝祥兆,硕士研究生,计算机应用技术

12. 2023至今. 侯智严,硕士研究生,计算机应用技术

13. 2024至今. 杨天宇,硕士研究生,模式识别与智能系统





指导实习生

1. 2018. 吴卉尧(本科实习),发表ICIP论文1篇,荷兰埃因霍芬理工大学读研

2. 2018. 孙逸晨(本科实习),美国波士顿大学读研

3. 2022. 徐东宇(带本科毕设),中国科学院自动化研究所读研

4. 2022. 徐铭远(硕士实习),发表TITS论文1篇,字节跳动工作