基本信息

李文明  研究员/博导  中国科学院计算技术研究所
电子邮件: liwenming@ict.ac.cn
通信地址: 北京市海淀区中关村科学院南路6号
邮政编码: 100190

研究领域

数据流执行模型与微架构;数据流运行时与编译技术;高通量众核处理器芯片架构

招生信息

招收如下方向博士/硕士研究生:

1. 方向一:新型加速器芯片研发,基于数据流(Dataflow)执行模型,面向多领域加速,包括人工智能、数字信号及5G应用等领域的加速芯片设计。

2. 方向二:RISC-V众核芯片研发,包括基于RISC-V的数据流加速模块扩展指令架构设计、设计空间探索等。

3. 方向三:基于数据流模型的上层软件系统研发,包括数据流编译优化(流图生成,流图映射),面向分布式系统的数据流执行模型优化等。

招生专业
081201-计算机系统结构
招生方向
高通量数据流众核芯片架构,异构数据流智能芯片架构

教育背景

2010-09--2016-06   中国科学院计算技术研究所   博士学位
2006-09--2010-07   山东科技大学   学士学位

工作经历

2025.10~至今,中国科学院计算技术研究所, 研究员、国科大岗位教授

2018-10~2025.09, 中国科学院计算技术研究所, 副研究员

2016-07~2018-09,中国科学院计算技术研究所, 助理研究员

科研项目

1. 主持,国家重点研发计划项目(青年科学家项目),多层次融合的软件定义数据流关键技术与系统,2023.12 - 2026.11

2. 骨干,国家重点研发计划项目课题,异构数据流处理器系统的研制,2023.03 - 2026.02

3. 主持,北京市科技新星计划,高通量多模态数据流处理器芯片研究,2022.11 - 2025.10

4. 主持,北京市科技新星计划交叉课题,面向三维SAR成像的数据流加速芯片研究,2023.11. - 2025.10

5. 主持,北京市自然基金委联合基金,面向工控异构SoC芯片的自动化设计空间探索研究,2024.7 - 2026.12

6. 主持,中移动联合项目,RISC-V面向数据中心高性能通用CPU演进关键技术研究,2024.08 - 2025.12

7. 主持,华为联合项目,基带高通量运算阵列架构研究二期合作项目,2023.10 - 2024.09

8. 主持,中移动联合项目,基于RISC-V的数据中心高性能通用CPU可行性分析,2023.08 - 2024.03

9. 主持,华为联合项目,基带高通量运算阵列架构研究一期合作项目,2022.10 - 2023.09

10. 主持,之江实验室课题,高能效数控协同数字信号加速架构研究,2020.03 - 2023.02

11. 主持,空天院联合项目,综合数字芯片研制,2021.01-2022.12

12. 骨干, 中科院先导专项课题,高通量处理器关键技术,2020.01-2021.12

13. 主持,国家自然基金委青年基金,高通量众核处理器访存数据通路优化研究,2019.01 - 2021.12

14. 主持,国重实验室开放课题,数据中心高通量处理器访存通路结构研究,2017.01 - 2018.12

15.主持,国家重点研发计划项目子课题:面向E级原型系统的高能效众核处理器研究,2016.07—2018.06

教授课程

数字电路
数字电路 实验课

授权/受理专利

[1] 李文明、孙凝晖、谢向辉、李宏亮、郑方. 中央处理器的缓存区的缓存行的替换方法及其装置. 授权号:ZL201610460009.X.

[2] 李文明、范东睿、张浩、王达、叶笑春. 一种面向众核处理器的全局感知数据主动渗透机制与系统. 授权号:ZL201710433007.6.

[3] 李文明、范东睿、张浩、王达、叶笑春. 一种众核片上网络失败任务甄别及资源重分配方法与系统. 授权号:ZL201710437407.4.

[4] 李文明、叶笑春、安述倩、姜志颖、王晨晖、范东睿. 一种哈希硬件处理装置及方法. 授权号:ZL201910413959.0.

[5] 李文明、叶笑春、范东睿、王达、张浩. 一种通用字符操作加速处理硬件装置及控制方法. 授权号:ZL201810995831.5.

[6] 李文明、叶笑春、范东睿、张浩、王达、吴冬冬. 面向通用字符串处理的硬件加速结构装置及控制方法. 授权号:ZL201810490966.6.

[7] 李文明、叶笑春、安述倩、姜志颖、王晨晖、范东睿. 一种用于区块链的处理装置及方法. 授权号:ZL201910505407.2.

[8] 李文明、安述倩、吴萌、吴海彬、刘艳欢、叶笑春、范东睿. 基于阻变存储器的通用区块链应用处理加速方法及系统. 授权号:ZL201911001197.X.

[9] 李文明、朱亚涛、叶笑春、王达、张浩、范东睿、姜志颖. 基于检测帧的视频监控系统故障识别、定位及告警系统及其方法. 授权号:ZL201710047382.7.

[10] 李文明、叶笑春、孙凝晖、范东睿、王达、马丽娜、朱亚涛、张洋. 一种异常事件自动推送及基于历史操作的监控方法及系统. 授权号:ZL201611148500.5.

[11] 李文明、安述倩、吴海彬、刘艳欢、张昆明、叶笑春、范东睿. 带宽控制单元、处理器芯片以及访存流量控制方法,授权号:ZL202210230341.2.

[12] 李文明、叶笑春. 一种数据流架构中循环程序执行的方法及系统,授权号:ZL202110267893.6.

[13] 李文明、朱文杰、黄俊英、叶笑春、范东睿. 基于数据流架构加速器的注意力机制融合方法及装置. 授权号:ZL202510009132.9.

[14] 李文明、范志华、吴海彬、叶笑春. 一种基于多层数据流融合执行模型的计算方法及其系统. 申请号:CN202510744787.0.

[15] 李文明、范志华、秦善天、叶笑春、孙凝晖. 一种面向异构智能数据流模型的程序执行方法及装置. 申请号:CN202511335451.5.

[16] 刘艳欢、李文明、安述倩、吴海彬、冯煜晶、吴萌、叶笑春、范东睿. 一种数据传输装置及传输方法. 授权号:ZL 202010200676.0.

[17]  刘天雨、吴欣欣、李文明、叶笑春、范东睿. 基于数据流架构的稀疏神经网络的运算方法. 授权号:ZL202110161624.1.

[18] 向陶然、朱亚涛、李文明、范东睿、叶笑春. 一种应用复合指令加快数据流结构中指令执行速度的方法. 授权号:ZL201710356099.2.

[19] 李涵、严明玉、李文明、叶笑春、范东睿. 一种面向多上下文粗粒度数据流结构的指令发射控制方法. 授权号:ZL 201810682382.9.

[20] 祁玉琼、谭旭、朱亚涛、李文明、王达、张浩、范东睿. 一种基于数据流的指令调度方法及装置. 授权号:ZL201710099467.X.

[21] 高龑、谭旭、李文明、马丽娜、冯煜晶、张浩. 一种执行指令选择的装置、方法及指令映射方法. 授权号:201711278806.7.

[22] 吴萌; 李易; 安述倩; 李文明; 叶笑春; 范东睿. 一种用于数据流架构的计算设备中的路由方法,授权号:ZL202210461301.9.

[23] 李易、谭旭、朱亚涛、叶笑春、李文明、张浩、范东睿. 一种面向多地址共享数据路由包的路由器、路由方法及其芯片. 授权号:ZL 201710029035.1.

[24] 欧焱、李易、范东睿、叶笑春、李文明. 一种面向神经网络的数据重用指令映射方法、系统及装置. 授权号:ZL 201810939096.6.

[25] 邹沫、张鲁培、李文明、叶笑春、范东睿. 基于数据流架构的快速傅里叶变换方法、系统和存储介质. 授权号:ZL 201910171401.6.

[26] 吴欣欣、范志华、轩伟、李文明、叶笑春、范东睿. 基于数据流架构的稀疏卷积神经网络加速方法及系统. 授权号:202010685107.X.

[27] 安述倩、吴海彬、刘艳欢、李文明、叶笑春、范东睿. 粗粒度数据流架构执行阵列的调试方法及装置. 授权号:ZL201911205445.2.

[28] 吴欣欣、范志华、轩伟、李文明、叶笑春、范东睿. 基于数据流架构的稀疏卷积神经网络加速方法及系统. 授权号:ZL202010719417.9.

[29] 李涵、严明玉、李文明、叶笑春、范东睿. 一种面向图计算应用的CAM结构存储系统. 授权号:ZL 201810681918.5.

[30] 郭南、叶笑春、王达、范东睿、张浩、李文明. 基于深度线索的视频场景检索方法和系统. 授权号:ZL201810811468.7.

[31] 范志华、欧焱、吴欣欣、李文明、安学军、叶笑春、范东睿.一种卷积神经网络加速方法及系统. 授权号:ZL202011134155.6.

[32] 吴欣欣、范志华、欧焱、李文明、叶笑春、范东睿. 基于数据流架构的稀疏卷积神经网络加速方法及装置. 授权号:ZL202010972552.4.

[33 范志华、吴欣欣、李文明、安学军、叶笑春、范东睿. 一种加速安全散列算法的加速器. 授权号:ZL202010474004.9.

[34] 范志华、吴欣欣、王珎、李文明、安学军、叶笑春、范东睿. 基于数据流结构的低精度神经网络计算装置及加速方法. 授权号:ZL202110676008.X.

[35] 吴欣欣、范志华、欧焱、李文明、叶笑春、范东睿. 一种基于数据流架构的多精度神经网络计算装置以及方法. 授权号:ZL202110631644.0.

[36] 刘天雨、吴欣欣、范志华、李文明、叶笑春、范东睿. 一种基于数据流架构的深度可分离卷积融合方法及系统. 授权号:ZL202110522385.8.

[37] 张昆明、刘艳欢、李文明、叶笑春、范东睿. 基于增量编译的FPGA原型验证方法及系统,申请号:CN202211005508.1.

[38] 王珎; 范志华; 刘天雨; 李文明; 叶笑春; 范东睿. 基于数据流架构的Cholesky分解加速计算方法及其系统,申请号:CN202210921474.4.

[39] 吴萌; 李易; 李文明; 叶笑春; 范东睿. 一种用于数据流架构的计算设备的数据处理方法,授权号:ZL202210769041.1.

[40] 汤胜中; 范志华; 李文明; 安学军; 叶笑春; 范东睿. 数据流架构优化方法、装置、电子设备,申请号:CN202210717973.1.

[41] 张昆明; 刘艳欢; 李文明; 叶笑春; 范东睿. 基于FPGA验证SOC芯片DDR控制器的系统,授权号:ZL202210694431.7.

[42] 林海阳; 王铎; 严明玉; 邹沫; 吕征阳; 兰昊; 李文明; 叶笑春; 范东睿. 一种两写两读的数据传输结构以及片上多通道交互网络,授权号:ZL202210579507.1.

[43] 林海阳; 严明玉; 邹沫; 王铎; 李文明; 叶笑春; 唐志敏; 范东睿. 一种用于分布式训练计算阶段的自动优化方法,申请号:CN202210553734.7.

[44] 范志华、王铎、汤胜中、李文明、安学军、叶笑春、范东睿. 一种应用于处理器的分支预测方法以及分支预测器. 授权号:ZL202211290962.6.

[45] 吴欣欣、范志华、轩伟、李文明、叶笑春、范东睿.一种卷积神经网络加速方法及系统. 授权号:ZL202011147836.6.

[46] 范志华、吴欣欣、李文明、安学军、叶笑春、范东睿. 一种卷积神经网络的加速方法及装置. 受理号:CN202010995617.7.

[47] 欧焱、范志华、吴欣欣、李文明、叶笑春、范东睿. 一种用于动态分配片上网络带宽的方法及装置. 授权号:ZL202110676326.6.

[48] 吴海彬; 李文明; 叶笑春; 范东睿. 一种用于SIMD计算指令的交互型运算装置及执行方法,授权号:ZL202210518572.3.

[49] 安述倩; 李文明; 叶笑春; 范东睿,面向数据流处理器的层次化存储系统. 授权号:ZL202210313319.4.

[50] 汤胜中; 范志华; 李文明; 安学军; 叶笑春; 范东睿. 一种基于多模式的SIMD应用高效执行方法及系统. 授权号:ZL202210843537.9.

[51] 汤胜中; 范志华; 李文明; 安学军; 叶笑春; 范东睿. 粗粒度可重构阵列数据流处理器的高效执行方法及系统. 授权号:ZL202310159302.2.

[52] 王铎、严明玉、刘昕、李文明、黄俊英、叶笑春、范东睿. 一种用于探索CPU微架构的设计空间的方法和装置. 申请号:CN202410057102.0.

[53] 王铎、严明玉、刘昕、李文明、黄俊英、叶笑春、范东睿. 一种CPU微架构设计空间预测模型跨负载构建方法. 申请号:202311862391.3.

[54] 吴萌、 李文明、 严明玉、 张志敏、 叶笑春、 范东睿. 一种流图程序生成方法和采用该方法的粗粒度数据流装置. 申请号:CN202410156325.2.

[55] 秦善天、李文明、范志华、安学军、叶笑春、范东睿. 一种数据流众核处理器的数据预取方法及处理器. 申请号:CN202410263613.8.

[56] 宋子康、李文明、范志华、吴海彬、安学军、叶笑春、范东睿. 一种面向数据流众核处理器的任务运行时调度方法及装置. 授权号:ZL202411019358.9.

[57] 石泓博、范志华、李文明、安学军、叶笑春、范东睿. 一种用于全同态加密运算的加速装置和方法. 申请号:CN202411173637.0.

[58] 张志远、李文明、范志华、安学军、叶笑春、范东睿. 一种基于RISC-V扩展指令的矩阵及向量运算装置. 申请号:CN202411190236.6.

[59] 张志远、李文明、范志华、安学军、叶笑春、范东睿. 一种数据流可重构架构中单元失效的自感知方法. 申请号:CN202411288815.4.

[60] 吴沛阳、郭南、肖潇、李文明、叶笑春. 基于代理迭代训练大模型的集成电路设计方法及装置. 授权号:ZL202411342754.5.

[61] 张志远、范志华、李文明、邱宇航、安学军、叶笑春、范东睿. 一种基于混合积的任务处理方法及计算装置. 申请号:CN202411452516.X.

[62] 吴萌、李文明、吴海彬、张志敏、叶笑春、范东睿. 一种基于粗粒度数据流架构的计算任务加速方法及装置. 申请号:CN202410063385.X

[63] 孙弓箭、严明玉、吴萌、李文明、叶笑春、范东睿. 硬件筛选器、图神经网络加速器及其片外访存筛选方法.  申请号:CN202510069404.4

[64] 刘钰、李文明、叶笑春. 基于数据流架构的 Stencil 计算编译优化方法及电子设备. 申请号:CN202510286202.5.

[65] 刘钰、李文明、叶笑春. 一种多粒度数据流编译系统与数据流图编译方法备. 申请号:CN202510228404.4.

[66] 马子睿、吴海彬、李文明、叶笑春. 一种支持核内前后端动态解耦与重构的处理器. 申请号:CN20251114240.2.

[67] 秦善天、李文明、范志华、安学军、叶笑春. 一种数据流架构的半集中式动态任务调度装置及方法. 申请号:CN202510890805.6.

[68] 韩登科、严明玉、王铎、李文明、叶笑春.  一种用于异构图采样的方法和加速器. 申请号:CN202510768919.3.

[69] 王珎、刘天雨、范志华、邱宇航、张志远、李文明、叶笑春.  一种基于托普利兹矩阵的卷积神经网络模型的构建方法. 申请号:CN202510727064.X.

[70] 吴海彬、张志远、李文明、范志华、叶笑春.  一种基于前递网络与混合路由的数据流阵列加速器. 申请号:CN202510887813.5.

[71] 范志华、李文明、强子清、叶笑春. 一种高可靠多数据流图执行装置及方法. 申请号:CN202511480467.5.

[72] 宇晓彤、陈波、冯慧、张祎、傅成城、高会壮、罗纯杰、高婉铃、李文明. 软硬件协同的人工智能芯片的测试方法及相关设备. 申请号:CN202511722202.1.

[73] 付英春、王乐歆、孙叶、李文明、杜笑杨、张昆明、杨光伦、刘忠哲. 动态电压频率调整方法、装置及相关设备. 申请号:CN202511725759.0.

[74] 刘艳欢、李文明、张昆明、吴海彬、叶笑春. 一种支持数据复用及指令复用的处理器、数据复用方法. 申请号:202510992730.2.

[75] 穆宇栋、范志华、李文明、张志远、安学军、叶笑春. 一种用于扩散模型推理的异构数据流加速装置及加速方法. 申请号:202510831601.5.

[76] 张志远、李文明、范志华、叶笑春、安学军. 一种基于 RISC-V 扩展指令的计算装置和方法. 申请号:CN202510811468.7.

[77] 张昆明、范志华、刘艳欢、王乐歆、刘钰群、吴海彬、李文明. 一种基于轻量级强化学习的缓存管理方法. 申请号:CN202511256224.3.

[78] 薛兢、范志华、李文明、叶笑春. 一种 NTT 算法软硬件协同加速方法及其系统. 申请号:CN202511273147.2.

[79] 杨稀皓、范志华、李文明、叶笑春. 一种基于数据流架构的插值计算加速方法及其系统. 申请号:CN202511281103.4.

[80] 陈绪烽、张园、曹华伟、李文明、叶笑春. 一种端边协同多任务调度方法及其系统. 申请号:CN202510744788.5.

[81] 谢平江、范志华、李文明、叶笑春. 基于 RISC-V 的 FFT 数据流加速方法及装置. 申请号:CN202511751816.2.

[82] 刘艳欢、李文明、叶笑春. 一种用于向量点积计算的位级并行处理系统及方法. 申请号:CN202512019855.X.

[83] 刘艳欢、李文明、叶笑春. 一种用于稀疏计算的加速系统、加速装置与计算方法. 申请号:CN20251201985.0.

发表论文

  1. (ASPLOS, CCF-A) Yanhuan Liu, Wenming Li*, Kunming Zhang, Yuqun Liu, Siao Wen, Lexin Wang, Tianyu Liu, Haibin Wu, Zhihua Fan, Xiaochun Ye, Dongrui Fan, Xuejun An. BitRed: Taming Non-Uniform Bit-Level Sparsity with a Programmable RISC-V ISA for DNN Acceleration. International Conference on Architectural Support for Programming Languages and Operating Systems (ASPLOS). Just Accepted, 2026. (比特级数据流加速设计)
  2. (TCAD, CCF-A) Zhihua Fan, Jing Xue, Wenming Li*, Xuejun An, Xiaochun Ye. A RISC-V Extended Infrastructure for Edge FHE Through Software and Hardware Co-Design. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems (TCAD). Just Accepted, 2026.(比特级数据流加速设计)
  3. (FCS, JCR Q1) Zhiyuan Zhang, Ping Zhang, Zhihua Fan, Wenming Li, Xiaochun Ye and Xuejun An. Striking the Mantissa: How Few Bits are Enough for Accurate DNN Inference?. In Frontiers of Computer Science (FCS). (Just Accept) 2026. (面向DNN的浮点精度优化)
  4. (DATE, CCF-B) Zhiyuan Zhang, Zhihua Fan*, Wenming Li, Yudong Mu, Yuhang Qiu, Zhen Wang, Xiaochun Ye and Xuejun An. A2RT: Efficient Ray Tracing Accelerator with Approximate-Accurate Computing and Quantization. In  Design, Automation & Test in Europe Conference & Exhibition (DATE) (Just Accept) 2026. (面向光线追踪的近似计算加速)
  5. (DATE, CCF-B) Tengfei Xia, Zhihua Fan*, Jing Xue, Shantian Qin, Xiaochun Ye and Wenming Li.  RISC-V ISA Extensions for Vectorized Unstructured Sparse SpMM in LLM Inference. In  Design, Automation & Test in Europe Conference & Exhibition (DATE) (Just Accept) 2026. (面向稀疏矩阵加速的RISC-V扩展架构)
  6. (IEEE CAL) Yanhuan Liu, Wenming Li*, Kunming Zhang, Tianyu Liu, Xiaochun Ye, Xuejun An.  CODA: A Computation-Driven Paradigm for Sparse DNN Acceleration. IEEE Computer Architectures Letters. Volume: 24, Issue: 2, July-Dec. 2025. (数据驱动稀疏DNN加速器)
  7.  (TPDS, CCF-AWenming Li, Zhihua Fan, Tianyu Liu, Zhen Wang, Haibin Wu, Meng Wu, Kunming Zhang, Yanhuan Liu, Ninghui Sun, Xiaochun Ye, and Dongrui Fan. DFU-E: A Dataflow Architecture for Edge DSP and AI Applications. IEEE Trans. Parallel Distrib. Syst (TPDS). 36, 6 (June 2025). (边缘高通量数据流加速器)
  8. (TACO, CCF-A) Zhen Wang, Tianyu Liu, Zhihua Fan, Wenming Li*, Yuhang Qiu, Zhiyuan Zhang, Xuejun An, Dongrui Fan, Xiaochun Ye. Compressing and Accelerating Sparse CNNs Using Sign-Reserved Toeplitz Filters and Input Activation Density-aware Dataflow. ACM Trans. Archit. Code Optim (TACO). Volume 22, Issue 4. Article No.: 148, Pages 1 – 23. (December 2025). (数据流加速稀疏神经网络)
  9. (TACO, CCF-A) LiuTianyu,  Zhihua Fan, Wenming Li*, Zhen Wang, Yuhang Qiu, Shengzhong Tang, Haibin Wu, Yanhuan Liu, Xiaochun Ye, Dongrui Fan. DFGS: Exploring the Balance of HW-SW Scheduling through the DFG-Aware Scheme. ACM Trans. Archit. Code Optim (TACO). Volume 22, Issue 4. Article No.: 147, Pages 1 – 26. (March 2025). (数据流软硬协同调度)
  10. (TACO, CCF-A) Yudong Mu, Zhihua Fan, Wenming Li*, Zhiyuan Zhang, Xuejun An, Dongrui Fan, Xiaochun Ye. GenCNN: A Partition-Aware Multi-Objective Mapping Framework for CNN Accelerators Based on Genetic Algorithm. ACM Trans. Archit. Code Optim (TACO). Volume 22, Issue 3. Article No.: 105, Pages 1 - 26. (数据流图映射)
  11. (TACO, CCF-A) Shantian Qin, Zhihua Fan, Wenming Li*, Zhen Wang, Xuejun An, Xiaochun Ye, and Dongrui Fan. 2025. PANDA: Adaptive Prefetching and Decentralized Scheduling for Dataflow Architectures. ACM Trans. Archit. Code Optim (TACO). 22, 2, Article 62 (June 2025), 27 pages. (数据流执行调度)
  12.  (TCAD, CCF-A) Luo, Teng and Xia, Tengfei and Chen, Jiayuan and Fan, Zhihua and Li, Wenming and Mu, Yudong and An, Xuejun and Ye, Xiaochun and Fan, Dongrui. A RISC-V Extended Infrastructure for CNNs Through Pipelined Computing and Data Dependence Optimization. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems (TCAD), vol. 44, no. 11, pp. 4141-4154, Nov. 2025. (CCF-A)  (RISC-V+数据流优化)
  13. (中国科学: 信息科学, CCF-A) 冷静文, 过敏意, 曾德泽, 蒋文斌, 叶笑春, 陈华曦, 李文明. 数据流芯片的发展现状、趋势与挑战中国科学: 信息科学, 2025, 55(3): 452-463.(数据流芯片)
  14. (学报, CCF-A) 穆宇栋, 李文明*, 范志华, 等. 面向YOLO神经网络的数据流架构优化研究[J]. 计算机学报,2025,48(1):82-99.  (数据流AI加速器)
  15. (研发, CCF-A) 石泓博; 范志华; 李文明; 张志远; 穆宇栋; 叶笑春; 安学军. 基于数据流架构的NTT蝶式计算加速研究. 计算机研究与发展[J]. 2025, Just Accepted.(数据流FHE加速器)
  16. (JSA, JCR Q1) Zhiyuan Zhang, Zhihua Fan, Wenming Li, Yuhang Qiu, Zhen Wang, Xiaochun Ye, Dongrui Fan, Xuejun An. Accelerating tensor multiplication by exploring hybrid product with hardware and software co-design. Journal of Systems Architecture(JSA). Volume 159, Issue C. (数据流张量加速器设计)
  17. (Euro-Par, CCF-B) Yudong Mu, Zhihua Fan, Xiaoxia Yao, Wenming Li, Zhiyuan Zhang, Honglie Wang, Xuejun An, Xiaochun Ye.  FDHA: Fusion-Driven Heterogeneous Accelerator for Effcient Diffusion Model Inference.  European Conference on Parallel and Distributed Computing (Euro-Par). Just  Accepted. 2025. (数据流加速推理模型)
  18.  (TPDS, CCF-A) Wu, Meng and Yan, Mingyu and Li, Wenming and Ye, Xiaochun and Fan, Dongrui and Xie, Yuan. Survey on Characterizing and Understanding GNNs From a Computer Architecture Perspective. IEEE Trans. Parallel Distrib. Syst (TPDS), vol. 36, no. 3, pp. 537-552, 2025. (图神经网络分析加速)
  19. (JCST, CCF-B) Bing Wang, Zi-Rui Ma, Hai-Bin Wu, Member, Fu-Lin Zhang, Yue Wang, Zhi-Hua Fan, Wen-Ming Li, Xiao-Chun Ye, Senior Member, Dong-Rui Fan. HARLD: A RISC-V Based Tightly Coupled Heterogeneous Computing Architecture for LDPC Decoding. Journal of Computer Science and Technology (JCST) [J]. Just Accepted. 2025.  (RISC-V + LDPC加速)
  20.  (DATE, CCF-B) Yuhang Qiu, Wenming Li, Tianyu Liu, Zhen Wang, Zhiyuan Zhang, Zhihua Fan,Xiaochun Ye, Dongrui Fan, Zhimin Tang.Accelerating Authenticated Block Ciphers via RISC-V Custom Cryptography Instructions.  Design, Automation and Test in Europe (DATE). Just  Accepted. 2025. (RISC-V + AES加速)
  21. (TACO, CCF-A)  Zhihua Fan, Wenming Li*, Zhen Wang, Yu Yang, Xiaochun Ye, Dongrui Fan, Ninghui Sun, and Xuejun An. 2024. Improving Utilization of Dataflow Unit for Multi-Batch Processing. ACM Trans. Archit. Code Optim. (TACO). 21, 1, Article 17. (2024). (数据流可重构设计)
  22. (TPDS, CCF-A) Fan, Zhihua and Li, Wenming* and Wang, Zhen and Liu, Tianyu and Wu, Haibin and Liu, Yanhuan and Wu, Meng and Wu, Xinxin and Ye, Xiaochun and Fan, Dongrui and Sun, Ninghui and An, Xuejun. Accelerating Convolutional Neural Networks by Exploiting the Sparsity of Output Activation. IEEE Transactions on Parallel and Distributed Systems (TPDS), vol. 34, no. 12, pp. 3253-3265. (2023).(数据流AI加速器)
  23. (TCAD, CCF-A) Wang, Duo and Yan, Mingyu and Teng, Yihan and Han, Dengke and Liu, Xin and Li, Wenming and Ye, Xiaochun and Fan, Dongrui. MoDSE: A High-Accurate Multi-Objective Design Space Exploration Framework for CPU Microarchitectures. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems (TCAD), 2023.  (RISC-V设计空间探索)
  24. (EuroPar, CCF-B) Zhihua Fan, Wenming Li*, Shengzhong Tang, Xuejun An, Xiaochun Ye, and Dongrui Fan. Improving Utilization of Dataflow Architectures through Software and Hardware Co-Design. 29th International European Conference on Parallel and Distributed Computing (EuroPar). 1-14, 2023. (数据流执行模型)
  25. (DAC, CCF-A) Wang, Duo and Yan, Mingyu and Liu, Xin and Zou, Mo and Liu, Tianyu and Li, Wenming and Ye, Xiaochun and Fan, Dongrui. A High-accurate Multi-objective Exploration Framework for Design Space of CPU. 2023 60th ACM/IEEE Design Automation Conference (DAC),  2023.  (RISC-V设计空间探索)
  26. (研发, CCF-A) 范志华, 吴欣欣, 李文明*, 曹华伟, 安学军, 叶笑春, 范东睿. 面向低精度神经网络的数据流体系结构优化. 计算机研究与发展[J]. 2023, 60(1): 43-58. (数据流AI加速器)
  27. (ICCD, CCF-B) LiuTianyu,  Li Wenming*, Fan Zhihua. DFGC: DFG-aware NoC Control based on Time Stamp Prediction for Dataflow Architecture. IEEE 41st International Conference on Computer Design (ICCD), Washington, DC, USA, 2023, pp. 432-439. (数据流软硬协同调度)
  28. (ICCD, CCF-B) Wu Haibin,  Li Wenming*,  Fan Zhihua,  Wang Zhen,  Liu Tianyu,  Huang Junying,  Tang Shengzhong,  Liu Yanhuan,  Zhang, Kunming and Ye, Xiaochun and Fan, Dongrui. Alleviating Transfer Latency in DataFlow Accelerator for DSP Applications. IEEE 41st International Conference on Computer Design (ICCD), Washington, DC, USA, 2023, pp. 440-443.  (数据流软硬协同调度)
  29. (TC, CCF-A) Sun, Gongjian, Yan, Mingyu, Wang, Duo, Li, Han, Li, Wenming, Ye, Xiaochun, Fan, Dongrui, Xie, Yuan. Multi-node Acceleration for Large-scale GCNs. The IEEE Transactions on Computers (TC). 2022.  
  30. (JCST, CCF-B) Feng, YuJing, Li, DeJian, Tan, Xu, Ye, XiaoChun, Fan, DongRui, Li, WenMing, Wang, Da, Zhang, Hao, Tang, ZhiMin. Accelerating Data Transfer in Dataflow Architectures Through a Look-Ahead Acknowledgment Mechanism. Journal of Computer Science and Technology (JCST) [J]. 2022, 37(4): 942-959.  (数据流软硬协同调度)
  31. (IEEE CAL) Wang, Yinshen, Li, Wenming,* Liu, Tianyu, Zhou, Liangjiang, Wang, Bingnan, Fan, Zhihua, Ye, Xiaochun, Fan, Dongrui, Ding, Chibiao. Characterization and Implementation of Radar System Applications on a Reconfigurable Dataflow Architecture. IEEE Computer Architecture Letters (IEEE CAL) [J]. 2022, 21(2): 121-124.(数据流+合成孔径雷达加速器)
  32.  (DATE, CCF-B) Xinxin Wu, Zhihua Fan, Tianyu Liu, Wenming Li, Xiaochun Ye, Dongrui Fan. LRP: Predictive output activation based on SVD approach for CNNs acceleration. Design, Automation and Test in Europe (DATE). 2022.(数据流AI加速器)
  33. 范志华,李文明,叶笑春,范东睿. 数据流计算研究进展与概述[J]. 数据与计算发展前沿, 2021, 3(5): 65-81.(数据流综述)
  34. (IF)Li, Yi, Wu, Meng, Ye, Xiaochun, Li, Wenming, Xue, Rui, Wang, Da, Zhang, Hao, Fan, Dongrui. An efficient scheduling algorithm for dataflow architecture using loop-pipelining. INFORMATION SCIENCES[J]. 2021, 547: 1136-1153.(数据流片上网络)
  35. (研发, CCF-A) 吴欣欣, 欧焱, 李文明, 王达, 张浩, 范东睿. 基于粗粒度数据流架构的稀疏卷积神经网络加速. 计算机研究与发展[J]. 2021, 58(7): 1504-1517.  (数据流AI加速器)
  36. 叶笑春, 李文明, 张洋, 张浩, 王达, 范东睿. 高通量众核处理器设计. 数据与计算发展前沿[J]. 2020, 2(1): 70-84. (众核处理器)
  37. (研发, CCF-A) 欧焱, 冯煜晶, 李文明, 叶笑春, 王达, 范东睿. 面向数据流结构的指令内访存冲突优化研究. 计算机研究与发展[J]. 2019, 56(12): 2720-2732. (数据流微架构)
  38. Li, Wenming, Ye, Xiaochun, Wang, Da, Zhang, Hao, Tang, Zhimin, Fan, Dongrui, Sun, Ninghui. PIM-WEAVER: A High Energy-efficient, General-purpose Acceleration Architecture for String Operations in Big Data Processing. Sustainable Computing: Informatics and Systems (SUSCOM) [J]. 2019, 21: 129-142.(众核处理器)
  39. (研发, CCF-A) 向陶然, 叶笑春, 李文明, 冯煜晶, 谭旭, 张浩, 范东睿. 基于细粒度数据流架构的稀疏神经网络全连接层加速. 计算机研究与发展[J]. 2019, 56(6): 1192-1204.  (数据流AI加速器)
  40.  (JCST, CCF-B) Tan, Xu, Ye, XiaoChun, Shen, XiaoWei, Xu, YuanChao, Wang, Da, Zhang, Lunkai, Li, WenMing, Fan, DongRui, Tang, ZhiMin. A Pipelining Loop Optimization Method for Dataflow Architecture. Journal of Computer Science and Technology (JCST) [J]. 2018, 33(1): 116-130.(细粒度数据流架构)
  41. (JCST, CCF-B) Tan, Xu, Shen, XiaoWei, Ye, XiaoChun, Wang, Da, Fan, DongRui, Zhang, Lunkai, Li, WenMing, Zhang, ZhiMin, Tang, ZhiMin. A Non-Stop Double Buffering Mechanism for Dataflow Architecture. Journal of Computer Science and Technology (JCST) [J]. 2018, 33(1): 145-157.  (细粒度数据流架构)
  42. (HPCA, CCF-A) Fan, Dongrui, Li, Wenming*, Ye, Xiaochun, Wang, Da, Zhang, Hao, Tang, Zhimin, Sun, Ninghui, IEEE. SmarCo: An Efficient Many-Core Processor for High-Throughput Applications in Datacenters. 2018 24TH IEEE INTERNATIONAL SYMPOSIUM ON HIGH PERFORMANCE COMPUTER ARCHITECTURE (HPCA). 2018, 596-607.  (众核处理器)
  43. (JCST, CCF-B) Shen, XiaoWei, Ye, XiaoChun, Tan, Xu, Wang, Da, Zhang, Lunkai, Li, WenMing, Zhang, ZhiMin, Fan, DongRui, Sun, NingHui. An Efficient Network-on-Chip Router for Dataflow Architecture. Journal of Computer Science and Technology (JCST) [J]. 2017, 32(1): 11-25.  (细粒度数据流架构)
  44. (研发, CCF-A) 李文明, 叶笑春, 王达, 郑方, 李宏亮, 林晗, 范东睿, 孙凝晖. MACT:高通量众核处理器离散访存请求批量处理机制. 计算机研究与发展[J]. 2015, 52(6): 1254-1265.(众核处理器)
  45. (学报, CCF-A) 李文明, 叶笑春, 张洋, 宋风龙, 王达, 唐士斌, 范东睿, 谢向辉. BDSim:面向大数据应用的组件化高可配并行模拟框架. 计算机学报[J]. 2015, 38(10): 1959-1975. (众核处理器)

获奖及荣誉

国科大校级优秀课程(数字电路)(2024)

中央和国家机关“四好”党员(2023)

国科大院优秀课程(数字电路)(2023)

中科院计算所联想奖教金(2023)

北京市科技新星计划(创新新星)(2022) 

中科院计算所优秀科研人员(2021) 

北京市科技发明一等奖(2020) 

中国产学研促进会产学研成果二等奖(2020) 

中科院计算所优秀科研人员(2017) 

中科院计算所优秀共产党员(2016) 

国家奖学金博士奖(2015) 

曙光博士奖(2014) 

国科大三好学生(2012) 

国科大优秀学生干部(2012





指导学生

已指导学生

李丹峰  硕士研究生  085208-电子与通信工程  

王国旋  硕士研究生  085404-计算机技术  

严开  硕士研究生  085404-计算机技术  

杨煜  硕士研究生  085404-计算机技术  

现指导学生

张昆明  博士研究生  081200-计算机科学与技术  

强子清  硕士研究生  081200-计算机科学与技术  

朱玉洁  博士研究生  081200-计算机科学与技术  

罗腾  硕士研究生  081200-计算机科学与技术  

夏腾飞  硕士研究生  081200-计算机科学与技术  

张芙菻  硕士研究生  081200-计算机科学与技术  

王宸  硕士研究生  085400-电子信息  

穆宇栋  博士研究生  081200-计算机科学与技术  

仝浩然  博士研究生  081200-计算机科学与技术  

朱宇  硕士研究生  081200-计算机科学与技术  

谢平江  硕士研究生  081200-计算机科学与技术  

王含瑞  硕士研究生  085400-电子信息  

秦善天  博士研究生  081200-计算机科学与技术