基本信息

吴书 研究员 博导 中科院自动化所
多模态人工智能系统全国重点实验室

国家科技重大专项负责人
中国科学院特聘研究骨干
北京市自然科学奖一等奖(2/4)
君事科学技术进步奖二等奖
ACM TORS/AIR/FCS编委
CCF杰出会员/IEEE/ACM高级会员
中科院自动化所-京东科技联合实验室主任
电子邮件: shu.wu@nlpr.ia.ac.cn 
通信地址: 海淀区中关村东路95号 智能化大厦1506
邮政编码: 100190
英文主页谷歌学术代码资源

求贤信息

寻找有潜力有热情的同学,开展具有长远价值和利他精神的前沿项目,共创国际一流科研成果或创新应用。

招募对象

欢迎本科生(特别鼓励低年级同学)、硕士生、博士生以访问学生身份加入我们,或远程开展合作研究。

期待您具备以下特质:
1.对科研充满热情
2.有科研、建模、编程、应用开发、开源项目、或专项课程等相关经历

文化氛围

倡导自由开放的学术氛围,鼓励自由讨论、分享灵感与大胆探索,
支持每位同学快速成长,并站在国际学术前沿

核心方向

研究覆盖结构数据挖掘、机器学习、大模型等领域,设计简单的、有理论依据,且能泛化到应用问题的解决方案。
当前重点探索以下方向:
1.多模态大模型的内容安全研究,揭示多模态大模型的幻觉和编辑机制,探索多模态推理、高效检索生成和智能体协同等关键技术,致力于打造可信、安全、可控的大模型体系。
2.科学基础大模型研究,和生物化学交叉领域,构建精准多模态小分子表达,理解化学反应本质与分子药物作用机制,并进行仿真模拟,借助AI为生物化学带来重大变革。

招生专业
081104-模式识别与智能系统
081203-计算机应用技术
0812J2-社会计算
0812Z1-信息安全
招生方向

网络内容分析与安全
多模态大模型

工作经历

教育背景
2007-09~2012-07, 加拿大舍布鲁克大学, 计算机科学, 博士
2004-09~2007-07, 厦门大学, 计算机应用技术, 硕士
2000-09~2004-07, 湖南大学, 计算机科学与技术, 学士
工作简历
2024-09~现在, 中科院先导项目化学化工小分队, 队长
2024-10~现在, 中国科学院大学人工智能学院, 导师
2024-10~现在, 中国科学院大学交叉前沿学院, 导师
2022-12~现在, 中国科学院大学未来技术学院, 导师
2022-10~现在, 中国科学院自动化研究所, 多模态人工智能系统全国重点实验室, 中科院特聘研究岗位
2024-10~现在, 中国科学院自动化研究所, 多模态人工智能系统全国重点实验室, 研究员
2016-10~2024-10, 中国科学院自动化研究所, 模式识别国家重点实验室, 副研究员
2012-09~2016-10, 中国科学院自动化研究所, 模式识别国家重点实验室, 助理研究员
社会兼职
ACM和IEEE高级会员
中国电子学会高级会员
中国计算机学会杰出会员
中国中文信息学会信息检索专委会委员
中国中文信息学会社交媒体专委会委员
中国图形图象学会机器视觉专委会委员
中国人工智能学会模式识别专委会委员
中国电子学会网络空间安全专委会委员
ACM Transactions on Recommender Systems(TORS)编委
CAAI Artificial Intelligence Research(AIR)青年编委
Frontiers of Computer Science(FCS)青年编委
WWW、SIGIR、AAAI、IJCAI、Neurips等会议Area Chair或Senior PC

奖励与专利成果

科研奖励
北京市自然科学奖一等奖(2/4),2025
君事科学技术进步奖二等奖,2022
AI 2000信息检索最具影响力学者,2023
AI 2000人工智能最具影响力学者,2022
PaperDigest最有影响力AAAI论文,2016/2019
PaperDigest最有影响力SIGIR论文,2016/2020 
PaperDigest最有影响力CIKM论文,2015/2019
PaperDigest最有影响力WWW论文,2021
MSRA StarTrack 微软铸星计划学者,2018
Alibaba Research Fellow,2017
IKCEST大数据竞赛国际二等奖,2023
中国图象图形学会高关注度领域综述,2023
CICAI-2022最佳论文奖,2022
Selected Best Paper,UIC 2010,Xi'an,2010
Scholarship奖学金,中国留学基金委,2007-2010
免高奖,加拿大魁北克省-中国留学基金委,2007-2010 
舍布鲁克大学Fellowship, 2007-2011
专利成果
1. 关系抽取模型的训练方法、装置、电子设备和存储介质, 发明专利, 2023, 第 3 作者, 专利号: 2023116510111
2. 文本引导分子生成方法、装置及存储介质, 发明专利, 2024, 第 2 作者, 专利号: 2024101786848
3. 用于混合表格文本证据的事实验证方法、装置及存储介质, 发明专利, 2024, 第 2 作者, 专利号: 2024101785489
4. 基于对抗式掩码的图表征向量生成方法、装置及存储介质, 发明专利, 2024, 第 2 作者, 专利号: 2024101654355
5. 谣言检测模型训练方法、谣言检测方法及装置, 发明专利, 2024, 第 3 作者, 专利号: 2024103518020
6. 动态知识图谱预测方法、装置、电子设备及存储介质, 发明专利, 2023, 第 1 作者, 专利号: CN116796001
7. 基于时序元学习的动态知识图谱预测方法和装置, 发明专利, 2023, 第 1 作者, 专利号: CN116108195
8. 基于动态知识图谱的事件预测方法及装置, 发明专利, 2022, 第 2 作者, 专利号: CN115062779
9. 一种诊断数据分析方法及系统, 发明专利, 2022, 第 1 作者, 专利号: CN115050465
10.  一种基于分解机和图神经网络的点击率预测方法及系统, 发明专利, 2021, 第 1 作者, 专利号: CN112446739
11. 一种基于动态图卷积神经网络的社交关系预测方法及系统, 发明专利, 2021, 第 1 作者, 专利号: CN112633559
12. 基于深度神经网络与图网络的核心用户挖掘方法及系统, 专利授权, 2019, 第 1 作者, 专利号: CN109597844
13. 基于卷积神经网络的显著信息检测方法及装置, 专利授权, 2017, 第 3 作者, 专利号: CN106844765
14. 一种数据特征选择和预测方法及装置, 专利授权, 2017, 第 1 作者, 专利号: CN106777891

出版信息

发表著作
1. Context-Aware Collaborative Prediction, Springer, 2017, 第1作者
2. 面向分类用户个性化需求的科技大数据精准服务, 科学出版社, 2022, 第1作者
代表论文
1. Shu Wu, Yuyuan Tang, Yanqiao Zhu, Liang Wang, Xing Xie, Tieniu Tan. Session-based Recommendation with Graph Neural Networks, In Proceedings of the Thirty-Third AAAI Conference on Artificial Intelligence (AAAI), pp. 346-353, 2019.(CCF-A类会议、第一作者、谷歌引用2010次,大数据领域引用第一名、PaperDigest评选最有影响力论文
2. Qiang Liu, Shu Wu, Liang Wang, Tieniu Tan. Predicting the Next Location: A Recurrent Model with Spatial and Temporal Contexts, In Proceedings of the Thirtieth AAAI Conference on Artificial Intelligence (AAAI), pp. 194-200, 2016.(CCF-A类会议,引用1156次、PaperDigest评选最有影响力论文
3. Yanqiao Zhu, Yichen Xu, Feng Yu, Qiang Liu, Shu Wu*, Liang Wang. Graph Contrastive Learning with Adaptive Augmentation, In Proceedings of the 30th International World Wide Web Conference (WWW), pp. 2069-2080, 2021.(CCF-A类会议,唯一通讯作者,谷歌引用1356次,WWW2021最高引论文1/355,PaperDigest评选最有影响力论文
4. Yanqiao Zhu, Yichen Xu, Feng Yu, Qiang Liu, Shu Wu*, Liang Wang, Deep graph contrastive representation learning, ICML Workshop on Graph Representation Learning and Beyond, 2020.(唯一通讯作者, 谷歌引用1131次
5. Feng Yu, Qiang Liu, Shu Wu*, Liang Wang, Tieniu Tan. A Dynamic Recurrent Model for Next Basket Recommendation. In Proceedings of the 38th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2016.(谷歌引用600次、唯一通讯作者、PaperDigest评选最有影响力论文
6. Feng Yu, Qiang Liu, Shu Wu, Liang Wang, Tieniu Tan. A Convolutional Approach for Misinformation Identification. In Proceedings of the 26th International Joint Conference on Artificial Intelligence (IJCAI), pp. 3901-3908, 2017. (CCF-A类会议、谷歌引用547次
7. Yufeng Zhang, Xueli Yu, Zeyu Cui, Shu Wu, Zhongzhen Wen, Liang Wang. Every Document Owns Its Structure: Inductive Text Classification via Graph Neural Networks, In the 58th Annual Meeting of the Association for Computational Linguistics (ACL), 2020. (CCF-A类会议、谷歌引用381次
8. Liang Wang, Qiang Liu, Shaozhen Liu, Xin Sun, Shu Wu, Liang Wang, Pin-Tuning: Parameter-Efficient In-Context Tuning for Few-shot Molecular Property Prediction, In Proceedings of the Neural Information Processing Systems (NeurIPS), 2024.(CCF-A类会议、分子属性预测

科研项目

作为项目负责人承担的代表性项目
1. 合成与逆合成问题的人工智能求解,新一代人工智能国家科技重大专项,2024-01--2026-12,492.68万
2. 基于证据推理和传播建模的虚假新闻检测方法研究,国家自然科学基金-面上项目,2024-01--2027-12,50万 
3. 社交网络虚假媒体内容检测识别的理论与方法,国家自然科学基金-联合基金课题,2020-01--2023-12,110万
4. 面向分类用户个性化需求的科技大数据精准服务技术,国家重点研发计划项目课题,2019-07--2022-06
5. 中科院自动化所-京东金融智能金融风险联合实验室,境内委托项目,2018-03--2021-08,540万
6. 融合实体特征和序列信息的用户行为建模方法研究,国家自然科学基金-面上项目,2018-01--2022-06,63万
7. 基于特征融合和序列分析的用户行为建模方法研究,北京市自然科学基金项目,2018-01--2020-12,20万
8. 融合实体和交互上下文信息的社会化推荐方法研究,国家自然科学基金-青年基金,2015-01--2018-06,25万

学生培养

Working with these students has been one of the most rewarding parts of my journey.

部分学生成果

和谭铁牛院士、王亮研究员联合培养的博士生:
刘强,基于深度表达学习的用户建模研究 -> 自动化所项目研究员、硕导
一作发表论文7篇,AAAI 2篇, CIKM 2篇, TIST, ICDM
获中国科学院院长奖、中科院优秀毕业生、博士研究生国家奖学金、微软学者。
余峰,面向网络空间的用户行为建模研究 -> 中关村人工智能研究院
一作发表论文5篇,Computers & Security, IJCAI, SIGIR两篇, CIKM共一
获百度奖学金、博士研究生国家奖学金、国科大三好学生。
崔泽宇,基于图方法的网络空间对象建模研究 -> 通义千问大模型算法专家
一作发表论文4篇,WWW, TIST, TNNLS, SIGIR, ICME和CIKM共同一作,
获新生入学奖学金,国科大三好学生。
张孟奇,复杂动态图数据的建模研究 -> 山东大学助理教授
一作发表TKDE 2篇, WWW, ACL, ICDM, CIKM, EMNLP,
获中国科学院院长奖、北京市优秀毕业生、中科院优秀毕业生、国科大三好学生。
本人培养的硕士生:
朱彦樵 硕士,图自监督学习方法研究,2019.09-2022.07 -> UCLA博士生
2021年硕士研究生国家奖学金、国科大三好学生。
在图表达学习和推理领域发表了6篇一作论文,开源了国际首个基础图对比学习框架PyGCL(获得了近1000Stars),两篇论文引用超1000,产生了广泛的学术影响力。
许伟志 硕士,基于证据推理的虚假信息检测研究,2020.09-2023.07  -> 入职字节跳动
2022年硕士研究生国家奖学金、国科大三好学生。
系统开展了基于证据推理的虚假信息检测研究,一作论文4篇,发表WWW-21、WWW-22、ACL、TKDE,参与了多项研究并发表TIST、SIGIR、AAAI论文。
王亮 硕转博,面向光谱和3D结构的多模态分子表征与预训练,2021.09-今 -> 王亮研究员博士生
自动化所博士生实验班、国科大三好学生
发表论文13篇,其中一作论文5篇,TKDE, ICLR-25, NIPS-24, AAAI, SDM。
陈丁硕 硕转博,从数据视角探索分子结构理解与建模,2022.09--今 -> 谭铁牛院士博士生
2024年硕士研究生国家奖学金、国科大三好学生
发表论文6篇,其中一作论文4篇,JCIM (化学建模顶刊), NIPS-23, NIPS-24, ICDM。
合作的本科生:
郑雨嘉,图推荐算法,成电本科生 -> CMU全奖博士生
发表一作AAAI,参与多项研究并发表RecSys和ICDM
徐逸辰,图自监督学习,北邮本科生 -> EPFL全奖博士生
发表一作CIKM,和NeurIPS、TIST、SDM共一论文三篇
叶笑天,大模型知识编辑,北邮本科生 -> 
发表ICLR和EMNLP共一论文两篇,独立完成并待投稿ACL论文一篇
李志勋,图数据挖掘方法,北理本科生 -> CHKU全奖博士生
发表一作NeurIPS和ICDM共一论文,参与多项研究并发表2篇NeurIPS和1篇CIKM
李霄寒,动态图神经网络,山大本科生 -> UCI全奖博士生
发表一作WWW和ICDM论文

指导学生整体情况

张景昊     博士
陶   翔     硕士
龙泽文     硕士
马欢欢     硕士
孟祥主     博士后    京东
张孟奇     博士       山东大学
呼奋宇     博士       华为
王礼萍     硕士       江苏省审计厅
许伟志     硕士       字节
胡娅璇     硕士       鹏城博士生
晏祺龙     硕士       鹏城博士生
朱彦樵     硕士       UCLA博士生
李泽坤     硕士       UCSB博士生
崔泽宇     博士       阿里巴巴达摩院
余   峰     博士       阿里巴巴
崔   强     博士       美团
刘   强     博士       中国科学院自动化所     项目研究员   硕士生导师
尹奇跃     博士       中国科学院自动化所     副研究员      硕士生导师
郭韦昱     博士       中央财经大学信息学院  副教授
徐   松     硕士       京东
本科实习生
李志勋    北京理工大学     CUHK博士
徐逸辰    北京理工大学     EPFL博士
郑雨嘉    电子科技大学     CMU博士
李霄寒    山东大学            UIC博士
张昊立    北京邮电大学     NUS硕士
王越乔    北京邮电大学     CMU硕士
钟   闻     山东大学           USC硕士
王保兴    安徽大学            新浪
唐誉源    北京科技大学     UIUC硕士 
李兆康    北京邮电大学     Rice硕士
王迪一    北京邮电大学     NU硕士
王靖懿    电子科技大学     清华博士