基本信息

张海峰 中国科学院自动化研究所 副研究员
电子邮件: haifeng.zhang [at] ia.ac.cn
研究领域
多智能体强化学习,智能体博弈,智能体评估,决策大模型
招生信息
团队招收硕士博士研究生、博士后、助理研究员、研发工程师、本科实习生,欢迎有机器学习、强化学习、博弈论等相关背景的同学与我联系。
欢迎访问团队官网(marl.ia.ac.cn)了解我们的研究方向、团队成员、研究成果等信息。
我们也在运营“及第”多智能体开源开放平台(jidiai.cn)和RLChina强化学习社区(rlchina.org),欢迎加入我们。
关于2025级招生:本团队与伦敦大学学院(UCL)紧密协作,欢迎对(多智能体)强化学习、博弈论、大模型智能体等方向研究和研发感兴趣的夏令营同学与我联系,请发送简历至haifeng.zhang [at] ia.ac.cn,谢谢!
招生专业
081104-模式识别与智能系统081202-计算机软件与理论081101-控制理论与控制工程
招生方向
多智能体强化学习,博弈论,机制设计
教育背景
2012-09--2018-07 北京大学 博士2008-09--2012-07 北京大学 本科
工作经历
2020-5~现在,中国科学院自动化研究所,副研究员、硕士生导师、科研团队负责人
2019-12~2020-5,北京大学前沿计算研究中心,访问学者
2018-12~2019-12,University College London(伦敦大学学院),Research Fellow(博士后)
出版信息
发表论文
(1) TaxAI: A Dynamic Economic Simulator and Benchmark for Multi-Agent Reinforcement Learning, AAMAS, 2024, 第 4 作者 通讯作者(2) Boosting Studies of Multi-Agent Reinforcement Learning on Google Research Football Environment: the Past, Present, and Future, AAMAS, 2024, 第 3 作者 通讯作者(3) Enhancing efficiency and propulsion in bio-mimetic robotic fish through end-to-end deep reinforcement learning, Physics of Fluids, 2024, 第 5 作者 通讯作者(4) Token-level Direct Preference Optimization, ICML, 2024, 第 5 作者 通讯作者(5) AI-Olympics: Exploring the Generalization of Agents through Open Competitions, IJCAI, 2024, 第 7 作者(6) Offline Pre-trained Multi-agent Decision Transformer, Offline Pre-trained Multi-agent Decision Transformer, 机器智能研究:英文版, 2023, 第 8 作者(7) An Efficient End-to-End Training Approach for Zero-Shot Human-AI Coordination, NeurIPS, 2023, 第 5 作者(8) GCS: Graph-Based Coordination Strategy for Multi-Agent Reinforcement Learning, International Joint Conference on Autonomous Agents and Multi-agent Systems (AAMAS), 2022, 第 7 作者(9) A Game-Theoretic Approach for Impoving Generalization Ability of TSP Solvers, ICLR Workshop on Gamification and Multiagent Solutions, 2022, 2022, 第 6 作者(10) Learning to Identify Top Elo Ratings as A Dueling Bandits Problem, AAAI, 2022, 第 5 作者(11) A Theoretical Understanding of Gradient Bias in Meta-Reinforcement Learning, NeurIPS, 2022, 第 6 作者(12) An Empirical Study on Google Research Football Multi-agent Scenarios, Machine Intelligence Research, 2022, 第 4 作者 通讯作者(13) Settling the Variance of Multi-Agent Policy Gradients, NeurIPS, 2021, 第 6 作者(14) Learning Correlated Communication Topology in Multi-agent Reinforcement Learning, AAMAS, 2021, 第 1 作者 通讯作者(15) Signal Instructed Coordination in Team Competition, DAI, 2021, 第 1 作者 通讯作者(16) Joint Caching and Transmission in the Mobile Edge Network: An Multi-Agent Learning Approach, Globecom, 2021, 第 1 作者(17) Estimating ��-Rank from A Few Entries with Low Rank Matrix Completion, ICML, 2021, 第 1 作者 通讯作者(18) Improving Knowledge Tracing via Pre-training Question Embeddings, IJCAI, 2020, 第 5 作者(19) Bi-level Actor-Critic for Multi-agent Coordination, AAAI, 2020, 第 1 作者(20) Learn to Navigate: Cooperative Path Planning for Unmanned Surface Vehicles Using Deep Reinforcement Learning, IEEE ACCESS, 2019, 第 3 作者(21) Layout Design for Intelligent Warehouse by Evolution With Fitness Approximation, IEEE ACCESS, 2019, 第 1 作者(22) Botzone: An Online Multi-agent Competitive Platform for AI Education, ITICSE'18: PROCEEDINGS OF THE 23RD ANNUAL ACM CONFERENCE ON INNOVATION AND TECHNOLOGY IN COMPUTER SCIENCE EDUCATION, 2018, 第 2 作者(23) Learning to Design Games: Strategic Environments in Deep Reinforcement Learning, IJCAI, 2018, 第 1 作者(24) ICFVR 2017: 3rd International Competition on Finger Vein Recognition, 2017 IEEE INTERNATIONAL JOINT CONFERENCE ON BIOMETRICS (IJCB), 2017, 第 3 作者(25) Managing Risk of Bidding in Display Advertising, WSDM'17: PROCEEDINGS OF THE TENTH ACM INTERNATIONAL CONFERENCE ON WEB SEARCH AND DATA MINING, 2017, 第 1 作者(26) User Response Learning for Directly Optimizing Campaign Performance in Display Advertising, CIKM'16: PROCEEDINGS OF THE 2016 ACM CONFERENCE ON INFORMATION AND KNOWLEDGE MANAGEMENT, 2016, 第 4 作者(27) 通用对弈游戏:一个探索机器游戏智能的领域, General Game Playing: A Research Field for Exploring Machine Intelligence in Games, 软件学报, 2016, 第 1 作者(28) Space-Consistent Game Equivalence Detection in General Game Playing, IJCAI 2015 Workshop on General Game Playing, 2015, 第 1 作者
学术活动
- 担任中国计算机学会(CCF)计算经济学专业组常务委员(www.ccf.org.cn/Chapters/TC/TC_Listing/TCCE/)。
- 担任 RLChina 学术委员会秘书长(rlchina.org)。
- 组织 1st Workshop on Evaluation in MARL(marl-evaluation.github.io)。
- 担任 IJTCS 2020/2021 MARL Track Chair(econcs.pku.edu.cn/ijtcs2020/IJTCS2020.html)。
- 组织 IJCAI 2020 麻将智能体竞赛(www.botzone.org.cn/static/gamecontest2020a_cn.html)。
科研项目
( 1 ) 大规模多智能体***系统, 负责人, 中国科学院计划, 2020-07--2023-06( 2 ) 原油***强化学习算法技术开发, 负责人, 企业委托, 2021-12--2023-06( 3 ) 多智能体系统***算法, 负责人, 国家任务, 2021-01--2023-12( 4 ) 分布式多智能体深度强化学习算法的评估方法, 负责人, 国家任务, 2023-01--2025-12( 5 ) 面向认知决策仿真的智能体策略迁移训练技术, 负责人, 国家任务, 2023-01--2025-12