基本信息
张启超  男  硕导  中国科学院自动化研究所
电子邮件: zhangqichao2014@ia.ac.cn
通信地址: 北京市海淀区中关村东路95号
邮政编码:

最新消息

  • VLA+自动驾驶:2篇论文被CVPR录用,祝贺敬博和君礼,中文解读 ,1篇期刊论文被IEEE RAL接收,祝贺胤峰(2026.2.22/3.8)
  • VLA+RL4自动驾驶: PlanAgent被IEEE TCDS接受 中文解读,2篇论文被ICRA 2026接收,中文解读(2026.1)
  • VLA+RL4自动驾驶: 2篇端到端自动驾驶+强化学习后训练的工作Mimir和TakeAD被IEEE RAL接收,祝贺泽斌和德庆,中文解读(2025.11)
  • VLA+RL4自动驾驶: 1篇强化学习用于端到端自动驾驶微调的工作WorldRFT被AAAI 2026接收,祝贺鹏轩,中文解读(2025.11)
  • VLA+自动驾驶: 1篇VLA用于端到端自动驾驶的的工作ReasonPlan被CoRL 2025接收,祝贺学义,中文解读(2025.08)
  • RL+AI4S: 大语言模型自主快慢思考的工作AutoThink被NeurIPS 2025接收,祝贺崧峻,中文解读(2025.09)
  • RL+AI4S:1篇大语言模型多轮迭代DPO的工作被COLM 2025接收,祝贺崧峻(2025.07)
  • RL+自动驾驶:1篇世界模型的端到端自动驾驶论文World4Drive被ICCV 2025接收,祝贺宇鹏,中文解读 (2025.06)
  • RL+自动驾驶: 1篇集成预测与规划自动驾驶论文IP3被IEEE TVT接收,祝贺李丁,(2025.05)
  • RL+自动驾驶: 1篇端到端自动驾驶论文Goalflow被CVPR 2025接收祝贺泽斌,中文解读 (2025.03)
  • RL+自动驾驶: 1篇端到端自动驾驶论文UncAD被ICRA 2025接收,祝贺鹏轩,中文解读(2025.01)
  • RL: 1篇无监督强化学习论文被ICLR 2025接收,祝贺敬博,中文解读(2025.01)
  • RL: 3篇强化学习相关论文被AAMAS 2025接收,祝贺敬博、方兴和崧峻(2024.12)!
  • RL:凃崧峻同学的在线偏好强化学习被AAAI 2025会议接收,祝贺崧峻,中文解读(2024.12)!
  • RL+自动驾驶:郑宇鹏等联合理想汽车的大语言模型3D场景描述TOD3Cap被ECCV 2024会议接受,祝贺宇鹏(2024.07)!
  • RL+自动驾驶:高胤峰,张启超等的个体分支世界模型PIWM工作被IEEE TIV(JCQ Q1)期刊接收,祝贺胤峰! (2024.5)!
  • ㊗️祝贺刘育琦/李丁博士毕业,张志远硕士毕业;团队合作工作“受限条件下智能无人系统学习控制理论与方法” 获得天津市自然科学二等奖 (排名4/6)
  • RL+自动驾驶:团队强化学习泛化性工作ProtoCAD被IEEE TII(JCQ Q1)期刊接收,强化学习路口通行泛化工作LGVNet被IEEE TCDS(JCR Q1)期刊接收 (2024.04)
  • RL+推荐系统:张志远同学(研三)与美团合作的深度用户Q网络(Deep User Q-Network, DUQN)被WWW(CCF-A)会议接收,DUQN推荐算法在美团混排任务中成功应用,祝贺志远!(2024.2.1)
  • RL+自动驾驶:郑宇鹏同学(研二)与清华AIR合作的单目图片占据栅格预测算法被ICRA 2024会议接收,祝贺宇鹏(2024.1.30)!
  • 恭喜团队工作"高效深度强化学习算法和最优性分析"荣获2022年度北京市自然科学二等奖 (2023.10.31)!
  • 李丁同学(博三)与百度Apollo合作的条件依赖轨迹预测算法被IEEE TNNLS(JCQ Q1)期刊接收,祝贺李丁!(2023.9.28)
  • 李丁同学(博三)与百度Apollo合作的分层解偶式轨迹预测算法被IEEE TIV(JCQ Q1)期刊接收,团队首个算法工作实现实车性能大幅提升(10%+)和大规模产业应用,获得工业界认可,祝贺李丁!(2023.8.3)
  • 刘学义同学(大四保送)的预测和决策一体化学习工作被ICONIP 2023(CCF-C)会议接收,祝贺学义(2023.7.31)
  • 恭喜王俊杰同学博士毕业,获得工学博士学位,加入百度!(2023.5.24)
  • 郑宇鹏同学(研一)在夜视深度估计工作STEPS被ICRA 2023会议录用,代码开源,中文解读,祝贺宇鹏!(2023.1.17)
  • 王俊杰同学(博四)在基于模型强化学习工作DMVE被IEEE TNNLS期刊接收,代码开源,中文解读,祝贺俊杰!(2022.10.14)
  • 张启超,高胤峰等与百度联合的仿真场景轨迹生工作TrajGen被IEEE TITS期刊接收,代码开源,中文解读,感谢合作者们!(2022.9.13)
  • 受邀在2022 RL China Summer School作“Deep Reinforcement Learning”专题报告,欢迎指正!(2022.08.22)
  • 方兴(大四保送)在离线强化学习的自动驾驶策略工作被IEEE ITSC 2022会议录用,代码开源,祝贺方兴!(2022.6)
  • 王俊杰同学(博三)在深度强化学习的换道策略工作被IEEE/CAA JAS期刊录用,代码开源,中文解读,祝贺俊杰!(2022.3) 

   更多研究工作请访问英文主页

研究方向

我在自动化所、前沿交叉学院、未来技术学院可以招收计算机类、人工智能类、自动化类方向的直博生、硕士生。主要聚焦于两个方向:

RL+AI4S方向:聚焦于大模型的RL后训练和AI4Science涉及大语言模型、多模态大模型、Aengtic RL,目前代表性工作有Learn when to think(NeurIPS)、DVFB(ICLR 25), DTR(AAAI 25)等。

RL+VLA方向聚焦于视觉语言动作大模型和世界模型的自动驾驶/具身智能大脑,涉及视觉语言大模型、世界模型和强化学习后训练,目前代表性工作有World4Drive(ICCV 25), ReasonPlan(CoRL 25), WorldRFT(AAAI 26)等。


同时招聘自动驾驶方向的助理研究员、博士后、工程师(符合条件可解决北京户口);

       招收对相关方向感兴趣的实习生和联培生有意者请联系zhangqichao2014@ia.ac.cn

       关于实习:支持参与项目合作的同学去企业实习,目前有小米汽车、易控智驾、长安汽车、美团等企业项目。

工作经历

最新消息:


  • 恭喜凃崧峻博士获得中科院自动化所攀登奖学金;
  • 恭喜郑宇鹏博士获得硕士国家奖学金;
  • 我受邀担任AAMAS的Area Chair,NN期刊的AE, 并获得NeurlPS 2025 Top Reviewer (2025.10)
  • 欢迎的师兄夏中谱博士回归课题组,曾是理想汽车辅助驾驶“端到端”模型负责人,主导了理想AD MAX的量产,拥有丰富的产业化经验(2025.06)

2025.02-现在,中国科学院自动化研究所, 项目研究员

2019-10~2025.02, 中国科学院自动化研究所, 副研究员

2017-07~2019-09,中国科学院自动化研究所, 助理研究员

2019年,中国人工智能学会 优秀博士论文提名奖;

2017年, 中国科学院院长优秀奖;

社会兼职

中国人工智能学会智能驾驶专委会,委员;

中国计算机学会智能汽车专委会,执行委员;

中国自动化学会自适应动态规划专委会,会员;

中国自动化学会数据驱动学习控制专委会,会员;

中国生产力促进中心汽车工作委员会,副秘书长

合作情况

   
团队人员

直接指导:

1. 王君礼,研三,自动驾驶联合预测算法,模式识别与智能系统,本科毕业于四川大学,硕士研究生

2. 杨鹏轩,研二,端到端自动驾驶,模式识别与智能系统,本科毕业于中国科学院大学,推免硕士 

3. 邢泽斌,研二,端到端自动驾驶,模式识别与智能系统,本科毕业于北京邮电大学,推免硕士   

联合指导:

1. 孙敬博,强化学习的泛化性研究,硕士毕业于北京理工大学,博士生(鹏程联培) 

2. 高胤峰,精准世界模型的自动驾驶决策,本硕毕业于北京科技大学,博士生,(导师:丁大伟教授)

3. 郑宇鹏,自动驾驶感知与预测算法,模式识别与智能系统,本科毕业于中国科学院大学,博士生,(硕士国奖)

4. 刘学义,视觉语言模型的自动驾驶,本科就读于西北工业大学,推免型直博生,(导师:赵冬斌研究员)2023.09

5. 涂崧峻,大语言模型人类反馈强化学习,本科就读于中南大学,推免型直博生(鹏程联合培养),(导师:赵冬斌研究员)2023.09

6. 刘德庆,大四毕设阶段,本科就读于山东大学,推免型直博生,(导师:赵冬斌研究员)2025.09


毕业生:

1. 王俊杰,基于深度强化学习的超车换道决策方法,硕博连读(导师:赵冬斌研究员,张启超副研) ,2023年入职百度自动驾驶(发表TNNLS/TII/JAS)

2. 刘育琦,自动驾驶路口通行决策算法,博士生,(导师:赵冬斌研究员,张启超副研),2024年入职小米机器人(发表JFI,TCDS)

3. 李丁,自动驾驶联合预测与决策算法,硕士毕业于天津大学,博士生,(导师:赵冬斌研究员,张启超副研),2024年北航卓百博士后(发表TNNSL/TIV/TVT)

4. 张志远,基于用户行为预测和强化学习的广告推荐策略研究,本科毕业于中国科学院大学,硕士生,2024年港科大(广州)博士深造(发表WWW/ICONIP)

5. 方兴, 强化学习自动驾驶决策算法,模式识别与智能系统,本科毕业于电子科技大学,硕士生,2025年入职美团 (发表ITSC/IJCNN/AAMAS)