基本信息

张俊格  男  研究员 博导  中国科学院自动化研究所
电子邮件: jgzhang@nlpr.ia.ac.cn
通信地址: 北京市海淀区中关村东路95号
邮政编码:100190


中国科学院特聘核心岗位研究员

中国科学院青年促进会优秀会员

中国科学院稳定支持基础研究青年团队

北京市科技新星

研究领域

博弈智能,  强化学习,多智能体系统,决策大模型(大模型智能体、大模型推理等),AI4Science(博弈智能+大模型智能体赋能科学研究),通用人工智能


招生信息

希望学生具有优秀的编程(C/C++, Python)、数学、英语基础(如CET-6不低于550分)。


课题组目前主要依托自动化所和国科大交叉学院招生。


课题组主要围绕复杂系统博弈智能及其跨学科应用(AI4Science)开展研究,特别是近年来大模型跨越式发展后,如何综合运用博弈智能、复杂系统、强化学习、多智能体并深度结合大模型最新进展,探究复杂问题求解(如大型复杂博弈问题如游戏AI,科学发现等)是课题组的研究重点。课题组算力资源(近400张卡)充沛,希望学生对AGI有着极强的使命感和热情,探索AGI前沿,做重要的问题。


研究组主要和国家能源、国家电投、国家电网、航天科技、航天科工、航空工业、中国船舶、中国兵器、中国电科、中国移动、华为等等知名央国企、民营企业以及相关部委下属研究机构有着长期合作。





教育背景

2008-09--2013-06   中国科学院自动化研究所   博士
学历
博士研究生,导师为谭铁牛院士

学位
博士

工作经历

工作简历
2013-07~现在, 中国科学院自动化研究所, 助理研究员、副研究员、研究员
社会兼职
2021-03-29-2026-12-31,IEEE CIS Games Technical Committee, 委员
2018-07-30-2025-12-30,中国图象图形学会青年工作委员会委员, 委员
2017-08-31-2026-12-31,中国自动化学会混合智能专业委员会委员, 委员
2017-04-30-2024-12-31,中关村管委会专家委员会委员, 委员
2015-09-30-2027-12-31,中国计算机学会计算机视觉专业委员会委员, 委员

专利与奖励

奖励信息
(1) 中科院青年促进会优秀会员, , 部委级, 2023
(2) 《庙算:人机对抗平台》中国指挥与控制学会;省部科学技术进步奖;一等奖,部委级, 一等奖, 部委级, 2023
(3) 《基于结构化认知学习的图像语义理解理论与方法》中国图象图形学学会;省部自然科学科技类;二等奖, 二等奖, 部委级, 2021
(4) 北京市科技新星, , 省级, 2019
(5) AIIDE星际争霸AI竞赛国际季军, 其他, 2018
(6) AIIDE星际争霸AI竞赛国际第四名, 其他, 2017
(7) 中国人工智能学会优秀博士学位论文提名, 部委级, 2013
(8) PASCAL VOC国际冠军, 其他, 2011

出版信息


发表论文

(1)EPO: Explicit Policy Optimization for Strategic Reasoning in LLMs via Reinforcement Learning, ACL, 2025,通讯作者

(2)SPO: Multi-Dimensional Preference Sequential Alignment With Implicit Reward Modeling, AAAI, 2025, 通讯作者 

(3) BadRL: Sparse Targeted Backdoor Attack Against Reinforcement Learning, AAAI, 2024,   通讯作者

(4) Position: Foundation Agents as the Paradigm Shift for Decision Making, ICML, 2024, 通讯作者

(5)TAPE: Leveraging Agent Topology for Cooperative Multi-Agent Policy Gradient, AAAI, 2024,   通讯作者

(6) Safe Reinforcement Learning with Free-form Natural Language Constraints and Pre-Trained Language Models, AAMAS, 2024,   通讯作者

(7)ProAgent: Building Proactive Cooperative AI with Large Language Models, AAAI, 2024, 

(8) Exemplar-based Continual Learning via Contrastive Learning, IEEE Transactions on Artificial Intelligence (TAI), 2024,  通讯作者

(9)PDiT: Interleaving Perception and Decision-making Transformers for Deep Reinforcement Learning, AAMAS, 2024

(10)ADMN: Agent-Driven Modular Network for Dynamic Parameter Sharing in Cooperative Multi-Agent Reinforcement Learning, IJCAI, 2024,  通讯作者

(11)Learning Individual Difference Rewards in Multi-Agent Reinforcement Learning, AAMAS, 2023,  通讯作者

(12)Contrastive Correlation Preserving Replay for Online Continual Learning, IEEE CSVT, 2023, 通讯作者

(13)Dynamic Equilibrium-Based Continual Learning Model with Disentangled Meta-features, IEEE SMC, 2023,   通讯作者

(14)Leveraging Joint-action Embedding in Multi-agent Reinforcement Learning for Cooperative Games, TOG, 2023,   通讯作者

(15)Squeezing More Past Knowledge for Online Class-Incremental Continual Learning, IEEE-CAA JOURNAL OF AUTOMATICA SINICA, 2023, 通讯作者

(16)Subspace-Aware Exploration for Sparse-Reward Multi-Agent Tasks, AAAI, 2023,   通讯作者

(17)兵棋推演的智能决策技术与挑战自动化学报, 2023

(18) Prioritized Tasks Mining for Multi-Task Cooperative Multi-Agent Reinforcement Learning, AAMAS, 2023,  通讯作者

(19)PECAN: Leveraging Policy Ensemble for Context-Aware Zero-Shot Human-AI Coordination, AAMAS, 2023,   通讯作者

(20)Deep Reinforcement Learning With Part-Aware Exploration Bonus in Video Games, IEEE TRANSACTIONS ON GAMES, 2022,   通讯作者

(21)Offline reinforcement learning with representations for actions, INFORMATION SCIENCES, 2022,  通讯作者

(22)Learning to Reweight Imaginary Transitions for Model-Based Reinforcement Learning, AAAI, 2021

(23)Universal adversarial perturbations against object detection, PATTERN RECOGNITION, 2021

(24)Fast A3RL: Aesthetics-Aware Adversarial Reinforcement Learning for Image Cropping. TIP,2019

(25)Transductive Zero-Shot Learning with Visual Structure Constraint, NIPS, 2019

(26)Bootstrap Estimated Uncertainty of the Environment Model for Model-Based Reinforcement Learning, AAAI, 2019

27 Mixed supervised object detection with robust objectness transfer, TPAMI, 2019

(28)A2-RL: Aesthetics Aware Reinforcement Learning for Image Cropping, CVPR, 2018


科研活动

   
科研项目
( 1 ) 中科院青年促进会优秀会员人才项目, 负责人, 中国科学院计划, 2024-01--2026-12
( 2 ) 持续博弈学习关键理论与方法研究, 负责人, 中国科学院计划, 2022-01--2023-12
( 3 ) 小样本博弈学习与可解释性建模, 负责人, 中国科学院计划, 2020-10--2025-12
( 4 ) 智能博弈决策AI训练学习与推理平台, 负责人, 国家任务, 2020-01--2022-06
( 5 ) 博弈决策智能理论与技术研究, 负责人, 地方任务, 2019-11--2022-12
( 6 ) 自动化算子设计, 负责人, 境内委托项目, 2019-04--2020-07
( 7 ) 智能博弈**中的关键理论与技术研究, 负责人, 国家任务, 2019-01--2021-12
( 8 ) 小样本条件下的物体检测研究, 负责人, 国家任务, 2019-01--2022-12
( 9 ) 面向图像分析的带噪声小样本学习技术, 负责人, 境内委托项目, 2018-09--2021-12
( 10 ) 场景元素的时空演化分析与高层次事件检测, 负责人, 国家任务, 2016-07--2020-12