李文明 研究员/博导 中国科学院计算技术研究所
电子邮件: liwenming@ict.ac.cn
通信地址: 北京市海淀区中关村科学院南路6号
邮政编码: 100190
研究领域
数据流执行模型与微架构;数据流运行时与编译技术;高通量众核处理器芯片架构
招生信息
招收如下方向博士/硕士研究生:
1. 方向一:新型加速器芯片研发,基于数据流(Dataflow)执行模型,面向多领域加速,包括人工智能、数字信号及5G应用等领域的加速芯片设计。
2. 方向二:RISC-V众核芯片研发,包括基于RISC-V的数据流加速模块扩展指令架构设计、设计空间探索等。
3. 方向三:基于数据流模型的上层软件系统研发,包括数据流编译优化(流图生成,流图映射),面向分布式系统的数据流执行模型优化等。
招生专业
招生方向
教育背景
工作经历
2025.10~至今,中国科学院计算技术研究所, 研究员,中国科学院大学, 岗位教授
2018-10~2025.09, 中国科学院计算技术研究所, 副研究员
2016-07~2018-09,中国科学院计算技术研究所, 助理研究员
科研项目
1. 主持,国家重点研发计划项目(青年科学家项目),多层次融合的软件定义数据流关键技术与系统,2023.12 - 2026.11
2. 骨干,国家重点研发计划项目课题,异构数据流处理器系统的研制,2023.03 - 2026.02
3. 主持,北京市科技新星计划,高通量多模态数据流处理器芯片研究,2022.11 - 2025.10
4. 主持,北京市科技新星计划交叉课题,面向三维SAR成像的数据流加速芯片研究,2023.11. - 2025.10
5. 主持,北京市自然基金委联合基金,面向工控异构SoC芯片的自动化设计空间探索研究,2024.7 - 2026.12
6. 主持,中移动联合项目,RISC-V面向数据中心高性能通用CPU演进关键技术研究,2024.08 - 2025.12
7. 主持,华为联合项目,基带高通量运算阵列架构研究二期合作项目,2023.10 - 2024.09
8. 主持,中移动联合项目,基于RISC-V的数据中心高性能通用CPU可行性分析,2023.08 - 2024.03
9. 主持,华为联合项目,基带高通量运算阵列架构研究一期合作项目,2022.10 - 2023.09
10. 主持,之江实验室课题,高能效数控协同数字信号加速架构研究,2020.03 - 2023.02
11. 主持,空天院联合项目,综合数字芯片研制,2021.01-2022.12
12. 骨干, 中科院先导专项课题,高通量处理器关键技术,2020.01-2021.12
13. 主持,国家自然基金委青年基金,高通量众核处理器访存数据通路优化研究,2019.01 - 2021.12
14. 主持,国重实验室开放课题,数据中心高通量处理器访存通路结构研究,2017.01 - 2018.12
15.主持,国家重点研发计划项目子课题:面向E级原型系统的高能效众核处理器研究,2016.07—2018.06
教授课程
授权/受理专利
[1] 李文明、孙凝晖、谢向辉、李宏亮、郑方. 中央处理器的缓存区的缓存行的替换方法及其装置. 授权号:ZL201610460009.X.
[2] 李文明、范东睿、张浩、王达、叶笑春. 一种面向众核处理器的全局感知数据主动预取方法及系统. 授权号:ZL201710433007.6.
[3] 李文明、范东睿、张浩、王达、叶笑春. 一种众核片上网络失败任务甄别及资源重分配方法与系统. 授权号:ZL201710437407.4.
[4] 李文明、叶笑春、安述倩、姜志颖、王晨晖、范东睿. 一种哈希硬件处理装置及方法. 授权号:ZL201910413959.0.
[5] 李文明、叶笑春、范东睿、王达、张浩. 一种通用字符操作加速处理硬件装置及控制方法. 授权号:ZL201810995831.5.
[6] 李文明、叶笑春、范东睿、张浩、王达、吴冬冬. 面向通用字符串处理的硬件加速结构装置及控制方法. 授权号:ZL201810490966.6.
[7] 李文明、叶笑春、安述倩、姜志颖、王晨晖、范东睿. 一种用于区块链的处理装置及方法. 授权号:ZL201910505407.2.
[8] 李文明、安述倩、吴萌、吴海彬、刘艳欢、叶笑春、范东睿. 基于阻变存储器的通用区块链应用处理加速方法及系统. 授权号:ZL201911001197.X.
[9] 李文明、朱亚涛、叶笑春、王达、张浩、范东睿、姜志颖. 基于检测帧的视频监控系统故障识别、定位及告警系统及其方法. 授权号:ZL201710047382.7.
[10] 李文明、叶笑春、孙凝晖、范东睿、王达、马丽娜、朱亚涛、张洋. 一种异常事件自动推送及基于历史操作的监控方法及系统. 授权号:ZL201611148500.5.
[11] 李文明、安述倩、吴海彬、刘艳欢、张昆明、叶笑春、范东睿. 带宽控制单元、处理器芯片以及访存流量控制方法,授权号:ZL202210230341.2.
[12] 李文明、叶笑春. 一种数据流架构中循环程序执行的方法及系统,授权号:ZL202110267893.6.
[13] 李文明、朱文杰、黄俊英、叶笑春、范东睿. 基于数据流架构加速器的注意力机制融合方法及装置. 授权号:ZL202510009132.9.
[14] 李文明、范志华、吴海彬、叶笑春. 一种基于多层数据流融合执行模型的计算方法及其系统. 申请号:CN202510744787.0.
[15] 李文明、范志华、秦善天、叶笑春、孙凝晖. 一种面向异构智能数据流模型的程序执行方法及装置. 申请号:CN202511335451.5.
[16] 刘艳欢、李文明、安述倩、吴海彬、冯煜晶、吴萌、叶笑春、范东睿. 一种数据传输装置及传输方法. 授权号:ZL 202010200676.0.
[17] 刘天雨、吴欣欣、李文明、叶笑春、范东睿. 基于数据流架构的稀疏神经网络的运算方法. 授权号:ZL202110161624.1.
[18] 向陶然、朱亚涛、李文明、范东睿、叶笑春. 一种应用复合指令加快数据流结构中指令执行速度的方法. 授权号:ZL201710356099.2.
[19] 李涵、严明玉、李文明、叶笑春、范东睿. 一种面向多上下文粗粒度数据流结构的指令发射控制方法. 授权号:ZL 201810682382.9.
[20] 祁玉琼、谭旭、朱亚涛、李文明、王达、张浩、范东睿. 一种基于数据流的指令调度方法及装置. 授权号:ZL201710099467.X.
[21] 高龑、谭旭、李文明、马丽娜、冯煜晶、张浩. 一种执行指令选择的装置、方法及指令映射方法. 授权号:201711278806.7.
[22] 吴萌; 李易; 安述倩; 李文明; 叶笑春; 范东睿. 一种用于数据流架构的计算设备中的路由方法,授权号:ZL202210461301.9.
[23] 李易、谭旭、朱亚涛、叶笑春、李文明、张浩、范东睿. 一种面向多地址共享数据路由包的路由器、路由方法及其芯片. 授权号:ZL 201710029035.1.
[24] 欧焱、李易、范东睿、叶笑春、李文明. 一种面向神经网络的数据重用指令映射方法、系统及装置. 授权号:ZL 201810939096.6.
[25] 邹沫、张鲁培、李文明、叶笑春、范东睿. 基于数据流架构的快速傅里叶变换方法、系统和存储介质. 授权号:ZL 201910171401.6.
[26] 吴欣欣、范志华、轩伟、李文明、叶笑春、范东睿. 基于数据流架构的稀疏卷积神经网络加速方法及系统. 授权号:202010685107.X.
[27] 安述倩、吴海彬、刘艳欢、李文明、叶笑春、范东睿. 粗粒度数据流架构执行阵列的调试方法及装置. 授权号:ZL201911205445.2.
[28] 吴欣欣、范志华、轩伟、李文明、叶笑春、范东睿. 基于数据流架构的稀疏卷积神经网络加速方法及系统. 授权号:ZL202010719417.9.
[29] 李涵、严明玉、李文明、叶笑春、范东睿. 一种面向图计算应用的CAM结构存储系统. 授权号:ZL 201810681918.5.
[30] 郭南、叶笑春、王达、范东睿、张浩、李文明. 基于深度线索的视频场景检索方法和系统. 授权号:ZL201810811468.7.
[31] 范志华、欧焱、吴欣欣、李文明、安学军、叶笑春、范东睿.一种卷积神经网络加速方法及系统. 授权号:ZL202011134155.6.
[32] 吴欣欣、范志华、欧焱、李文明、叶笑春、范东睿. 基于数据流架构的稀疏卷积神经网络加速方法及装置. 授权号:ZL202010972552.4.
[33 范志华、吴欣欣、李文明、安学军、叶笑春、范东睿. 一种加速安全散列算法的加速器. 授权号:ZL202010474004.9.
[34] 范志华、吴欣欣、王珎、李文明、安学军、叶笑春、范东睿. 基于数据流结构的低精度神经网络计算装置及加速方法. 授权号:ZL202110676008.X.
[35] 吴欣欣、范志华、欧焱、李文明、叶笑春、范东睿. 一种基于数据流架构的多精度神经网络计算装置以及方法. 授权号:ZL202110631644.0.
[36] 刘天雨、吴欣欣、范志华、李文明、叶笑春、范东睿. 一种基于数据流架构的深度可分离卷积融合方法及系统. 授权号:ZL202110522385.8.
[37] 张昆明、刘艳欢、李文明、叶笑春、范东睿. 基于增量编译的FPGA原型验证方法及系统,申请号:CN202211005508.1.
[38] 王珎; 范志华; 刘天雨; 李文明; 叶笑春; 范东睿. 基于数据流架构的Cholesky分解加速计算方法及其系统,申请号:CN202210921474.4.
[39] 吴萌; 李易; 李文明; 叶笑春; 范东睿. 一种用于数据流架构的计算设备的数据处理方法,授权号:ZL202210769041.1.
[40] 汤胜中; 范志华; 李文明; 安学军; 叶笑春; 范东睿. 数据流架构优化方法、装置、电子设备,申请号:CN202210717973.1.
[41] 张昆明; 刘艳欢; 李文明; 叶笑春; 范东睿. 基于FPGA验证SOC芯片DDR控制器的系统,授权号:ZL202210694431.7.
[42] 林海阳; 王铎; 严明玉; 邹沫; 吕征阳; 兰昊; 李文明; 叶笑春; 范东睿. 一种两写两读的数据传输结构以及片上多通道交互网络,授权号:ZL202210579507.1.
[43] 林海阳; 严明玉; 邹沫; 王铎; 李文明; 叶笑春; 唐志敏; 范东睿. 一种用于分布式训练计算阶段的自动优化方法,申请号:CN202210553734.7.
[44] 范志华、王铎、汤胜中、李文明、安学军、叶笑春、范东睿. 一种应用于处理器的分支预测方法以及分支预测器. 授权号:ZL202211290962.6.
[45] 吴欣欣、范志华、轩伟、李文明、叶笑春、范东睿.一种卷积神经网络加速方法及系统. 授权号:ZL202011147836.6.
[46] 范志华、吴欣欣、李文明、安学军、叶笑春、范东睿. 一种卷积神经网络的加速方法及装置. 受理号:CN202010995617.7.
[47] 欧焱、范志华、吴欣欣、李文明、叶笑春、范东睿. 一种用于动态分配片上网络带宽的方法及装置. 授权号:ZL202110676326.6.
[48] 吴海彬; 李文明; 叶笑春; 范东睿. 一种用于SIMD计算指令的交互型运算装置及执行方法,授权号:ZL202210518572.3.
[49] 安述倩; 李文明; 叶笑春; 范东睿,面向数据流处理器的层次化存储系统. 授权号:ZL202210313319.4.
[50] 汤胜中; 范志华; 李文明; 安学军; 叶笑春; 范东睿. 一种基于多模式的SIMD应用高效执行方法及系统. 授权号:ZL202210843537.9.
[51] 汤胜中; 范志华; 李文明; 安学军; 叶笑春; 范东睿. 粗粒度可重构阵列数据流处理器的高效执行方法及系统. 授权号:ZL202310159302.2.
[52] 王铎、严明玉、刘昕、李文明、黄俊英、叶笑春、范东睿. 一种用于探索CPU微架构的设计空间的方法和装置. 申请号:CN202410057102.0.
[53] 王铎、严明玉、刘昕、李文明、黄俊英、叶笑春、范东睿. 一种CPU微架构设计空间预测模型跨负载构建方法. 申请号:202311862391.3.
[54] 吴萌、 李文明、 严明玉、 张志敏、 叶笑春、 范东睿. 一种流图程序生成方法和采用该方法的粗粒度数据流装置. 申请号:CN202410156325.2.
[55] 秦善天、李文明、范志华、安学军、叶笑春、范东睿. 一种数据流众核处理器的数据预取方法及处理器. 申请号:CN202410263613.8.
[56] 宋子康、李文明、范志华、吴海彬、安学军、叶笑春、范东睿. 一种面向数据流众核处理器的任务运行时调度方法及装置. 授权号:ZL202411019358.9.
[57] 石泓博、范志华、李文明、安学军、叶笑春、范东睿. 一种用于全同态加密运算的加速装置和方法. 申请号:CN202411173637.0.
[58] 张志远、李文明、范志华、安学军、叶笑春、范东睿. 一种基于RISC-V扩展指令的矩阵及向量运算装置. 申请号:CN202411190236.6.
[59] 张志远、李文明、范志华、安学军、叶笑春、范东睿. 一种数据流可重构架构中单元失效的自感知方法. 申请号:CN202411288815.4.
[60] 吴沛阳、郭南、肖潇、李文明、叶笑春. 基于代理迭代训练大模型的集成电路设计方法及装置. 授权号:ZL202411342754.5.
[61] 张志远、范志华、李文明、邱宇航、安学军、叶笑春、范东睿. 一种基于混合积的任务处理方法及计算装置. 申请号:CN202411452516.X.
[62] 吴萌、李文明、吴海彬、张志敏、叶笑春、范东睿. 一种基于粗粒度数据流架构的计算任务加速方法及装置. 申请号:CN202410063385.X
[63] 孙弓箭、严明玉、吴萌、李文明、叶笑春、范东睿. 硬件筛选器、图神经网络加速器及其片外访存筛选方法. 申请号:CN202510069404.4
[64] 刘钰、李文明、叶笑春. 基于数据流架构的 Stencil 计算编译优化方法及电子设备. 申请号:CN202510286202.5.
[65] 刘钰、李文明、叶笑春. 一种多粒度数据流编译系统与数据流图编译方法备. 申请号:CN202510228404.4.
[66] 马子睿、吴海彬、李文明、叶笑春. 一种支持核内前后端动态解耦与重构的处理器. 申请号:CN20251114240.2.
[67] 秦善天、李文明、范志华、安学军、叶笑春. 一种数据流架构的半集中式动态任务调度装置及方法. 申请号:CN202510890805.6.
[68] 韩登科、严明玉、王铎、李文明、叶笑春. 一种用于异构图采样的方法和加速器. 申请号:CN202510768919.3.
[69] 王珎、刘天雨、范志华、邱宇航、张志远、李文明、叶笑春. 一种基于托普利兹矩阵的卷积神经网络模型的构建方法. 申请号:CN202510727064.X.
[70] 吴海彬、张志远、李文明、范志华、叶笑春. 一种基于前递网络与混合路由的数据流阵列加速器. 申请号:CN202510887813.5.
[71] 范志华、李文明、强子清、叶笑春. 一种高可靠多数据流图执行装置及方法. 申请号:CN202511480467.5.
[72] 宇晓彤、陈波、冯慧、张祎、傅成城、高会壮、罗纯杰、高婉铃、李文明. 软硬件协同的人工智能芯片的测试方法及相关设备. 申请号:CN202511722202.1.
[73] 付英春、王乐歆、孙叶、李文明、杜笑杨、张昆明、杨光伦、刘忠哲. 动态电压频率调整方法、装置及相关设备. 申请号:CN202511725759.0.
[74] 刘艳欢、李文明、张昆明、吴海彬、叶笑春. 一种支持数据复用及指令复用的处理器、数据复用方法. 申请号:202510992730.2.
[75] 穆宇栋、范志华、李文明、张志远、安学军、叶笑春. 一种用于扩散模型推理的异构数据流加速装置及加速方法. 申请号:202510831601.5.
[76] 张志远、李文明、范志华、叶笑春、安学军. 一种基于 RISC-V 扩展指令的计算装置和方法. 申请号:CN202510811468.7.
[77] 张昆明、范志华、刘艳欢、王乐歆、刘钰群、吴海彬、李文明. 一种基于轻量级强化学习的缓存管理方法. 申请号:CN202511256224.3.
[78] 薛兢、范志华、李文明、叶笑春. 一种 NTT 算法软硬件协同加速方法及其系统. 申请号:CN202511273147.2.
[79] 杨稀皓、范志华、李文明、叶笑春. 一种基于数据流架构的插值计算加速方法及其系统. 申请号:CN202511281103.4.
[80] 陈绪烽、张园、曹华伟、李文明、叶笑春. 一种端边协同多任务调度方法及其系统. 申请号:CN202510744788.5.
[81] 谢平江、范志华、李文明、叶笑春. 基于 RISC-V 的 FFT 数据流加速方法及装置. 申请号:CN202511751816.2.
[82] 刘艳欢、李文明、叶笑春. 一种用于向量点积计算的位级并行处理系统及方法. 申请号:CN202512019855.X.
[83] 刘艳欢、李文明、叶笑春. 一种用于稀疏计算的加速系统、加速装置与计算方法. 申请号:CN20251201985.0.
发表论文
( *为通讯作者)
1. (CCF-A, ISCA) MLX: Multi-Layer Execution for Structured LLM Workload Acceleration on Spatial Architectures. (多层融合数据流执行加速大模型)
Haibin Wu, Wenming Li*, Zhihua Fan, Zirui Ma, Yuqun Liu, Tengfei Xia, Yanhuan Liu, Kunming Zhang, Xiaochun Ye, Dongrui Fan, Jian Weng.
International Symposium on Computer Architecture (ISCA). Just Accepted, 2026.
2. (CCF-A, ASPLOS) BitRed: Taming Non-Uniform Bit-Level Sparsity with aProgrammable RISC-V ISA for DNN Acceleration. (比特级数据流加速设计)
Yanhuan Liu, Wenming Li*, Kunming Zhang, Yuqun Liu, Siao Wen, Lexin Wang, Tianyu Liu, Haibin Wu, Zhihua Fan, Xiaochun Ye, Dongrui Fan, Xuejun An.
International Conference on Architectural Support for Programming Languages and Operating Systems (ASPLOS). New York, NY, USA, 239–254., 2026.
3. (CCF-A, DAC) UniNL: Unifying Fragmented Non-Linear Operators for Efficient Edge LLM Inference. (向LLM的非线性算子加速面设计)
Zhengxuan Hu, zhihua fan, Shantian Qin, Yudong Mu, Xiaochun Ye, Wenming Li*.
Design Automation Conference (DAC). Just Accepted, 2026.
4. (CCF-A, DAC) AHASD: Asynchronous Heterogeneous Architecture for LLM Adaptive Drafting Speculative Decoding on Mobile Devices. (边缘端LLM加速)
Zirui Ma, zhihua fan, Wenxing Li, Haibin Wu, Fulin Zhang, Wenming Li*, Xiaochun Ye.
Design Automation Conference (DAC). Just Accepted, 2026.
5. (CCF-A, TCAD) A RISC-V Extended Infrastructure for Edge FHE Through Software and Hardware Co-Design. (基于RISC-V同态加密)
Zhihua Fan, Jing Xue, Wenming Li*, Xuejun An, Xiaochun Ye.
IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems (TCAD). Just Accepted, 2026.
6. (JCR Q1, FCS) Striking the Mantissa: How Few Bits are Enough for Accurate DNN Inference?. (面向DNN的浮点精度优化)
Zhiyuan Zhang, Ping Zhang, Zhihua Fan, Wenming Li, Xiaochun Ye and Xuejun An.
In Frontiers of Computer Science (FCS). 2026.
7. (JCR Q1, JSA) A real-time edge SAR imaging acceleration architecture utilizing multi-level dataflow parallelism. (数据流加速合成孔径雷达)
Yinshen Wang, Zhengxuan Hu, Ping Zhang, Zhihua Fan, Wenming Li, Xuejun An, Xiaochun Ye.
Journal of Systems Architecture (JSA). 170: 103635 (2026).
8. (CCF-B, DATE) A2RT: Efficient Ray Tracing Accelerator with Approximate-Accurate Computing and Quantization. (面向光线追踪的近似计算加速)
Zhiyuan Zhang, Zhihua Fan, Wenming Li, Yudong Mu, Yuhang Qiu, Zhen Wang, Xiaochun Ye and Xuejun An.
In Design, Automation & Test in Europe Conference & Exhibition (DATE) (Just Accept) 2026.
9. (CCF-B, DATE) RISC-V ISA Extensions for Vectorized Unstructured Sparse SpMM in LLM Inference. (面向稀疏矩阵加速的RISC-V扩展架构)
Tengfei Xia, Zhihua Fan, Jing Xue, Shantian Qin, Xiaochun Ye and Wenming Li.
In Design, Automation & Test in Europe Conference & Exhibition (DATE) (Just Accept) 2026.
10. (IEEE CAL) CODA: A Computation-Driven Paradigm for Sparse DNN Acceleration.(数据驱动稀疏DNN加速器)
Yanhuan Liu, Wenming Li*, Kunming Zhang, Tianyu Liu, Xiaochun Ye, Xuejun An.
IEEE Computer Architectures Letters. Volume: 24, Issue: 2, July-Dec. 2025.
11. (CCF-A, TPDS) DFU-E: A Dataflow Architecture for Edge DSP and AI Applications. (边缘高通量数据流加速器)
Wenming Li, Zhihua Fan, Tianyu Liu, Zhen Wang, Haibin Wu, Meng Wu, Kunming Zhang, Yanhuan Liu, Ninghui Sun, Xiaochun Ye, and Dongrui Fan.
IEEE Trans. arallel Distrib. Syst (TPDS). 36, 6 (June 2025).
12. (CCF-A, TACO) Compressing and Accelerating Sparse CNNs Using Sign-Reserved Toeplitz Filters and Activation Density-aware Dataflow.(数据流加速)
Zhen Wang, Tianyu Liu, Zhihua Fan, Wenming Li*, Yuhang Qiu, Zhiyuan Zhang, Xuejun An, Dongrui Fan, Xiaochun Ye.
ACM Trans. Archit. Code Optim (TACO). Volume 22, Issue 4. Article No.: 148, Pages 1 – 23. (December 2025).
13. (CCF-A, TACO) DFGS: Exploring the Balance of HW-SW Scheduling through the DFG-Aware Scheme.(数据流软硬协同调度)
LiuTianyu, Zhihua Fan, Wenming Li*, Zhen Wang, Yuhang Qiu, Shengzhong Tang, Haibin Wu, Yanhuan Liu, Xiaochun Ye, Dongrui Fan.
ACM Trans. Archit. Code Optim (TACO). Volume 22, Issue 4. Article No.: 147, Pages 1 – 26. (March 2025).
14. (CCF-A, TACO) GenCNN: A Partition-Aware Multi-Objective Mapping Framework for CNN Accelerators Based on Genetic Algorithm.(数据流图映射)
Yudong Mu, Zhihua Fan, Wenming Li*, Zhiyuan Zhang, Xuejun An, Dongrui Fan, Xiaochun Ye.
ACM Trans. Archit. Code Optim (TACO). Volume 22, Issue 3. Article No.: 105, Pages 1 - 26.
15. (CCF-A, TACO) PANDA: Adaptive Prefetching and Decentralized Scheduling for Dataflow Architectures. (数据流执行调度)
Shantian Qin, Zhihua Fan, Wenming Li*, Zhen Wang, Xuejun An, Xiaochun Ye, and Dongrui Fan.
ACM Trans. Archit. Code Optim (TACO). 22, 2, Article 62 (June 2025), 27 pages.
16. (CCF-A, TCAD) A RISC-V Extended Infrastructure for CNNs Through Pipelined Computing and Data Dependence Optimization.(RISC-V+数据流优化)
Luo, Teng and Xia, Tengfei and Chen, Jiayuan and Fan, Zhihua and Li, Wenming and Mu, Yudong and An, Xuejun and Ye, Xiaochun and Fan, Dongrui.
IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems (TCAD), vol. 44, no. 11, pp. 4141-4154, Nov. 2025. (CCF-A)
17. (CCF-A, 中国科学: 信息科学) 数据流芯片的发展现状、趋势与挑战. (数据流芯片)
冷静文, 过敏意, 曾德泽, 蒋文斌, 叶笑春, 陈华曦, 李文明.
中国科学: 信息科学, 2025, 55(3): 452-463.
18. (CCF-A, 学报) 面向YOLO神经网络的数据流架构优化研究. (数据流AI加速器)
穆宇栋, 李文明, 范志华, 吴萌, 吴海彬, 安学军, 叶笑春, 范东睿.
计算机学报,2025,48(1):82-99.
19. (CCF-A, 研发) 基于数据流架构的NTT蝶式计算加速研究. (数据流FHE加速器)
石泓博; 范志华; 李文明; 张志远; 穆宇栋; 叶笑春; 安学军.
计算机研究与发展[J]. 2025,
20. (JCR Q1, JSA) Accelerating tensor multiplication by exploring hybrid product with hardware and software co-design. (数据流张量加速器设计)
Zhiyuan Zhang, Zhihua Fan, Wenming Li, Yuhang Qiu, Zhen Wang, Xiaochun Ye, Dongrui Fan, Xuejun An.
Journal of Systems Architecture (JSA). Volume 159, Issue C.
21. (CCF-B, Euro-Par) FDHA: Fusion-Driven Heterogeneous Accelerator for Effcient Diffusion Model Inference. (数据流加速推理模型)
Yudong Mu, Zhihua Fan, Xiaoxia Yao, Wenming Li, Zhiyuan Zhang, Honglie Wang, Xuejun An, Xiaochun Ye.
European Conference on Parallel and Distributed Computing (Euro-Par). Just Accepted. 2025.
22. (CCF-A, TPDS) Survey on Characterizing and Understanding GNNs From a Computer Architecture Perspective.(图神经网络分析加速)
Wu, Meng and Yan, Mingyu and Li, Wenming and Ye, Xiaochun and Fan, Dongrui and Xie, Yuan.
IEEE Trans. Parallel Distrib. Syst (TPDS), vol. 36, no. 3, pp. 537-552, 2025.
23. (CCF-B, JCST) HARLD: A RISC-V Based Tightly Coupled Heterogeneous Computing Architecture for LDPC Decoding. (RISC-V + LDPC加速)
Bing Wang, Zi-Rui Ma, Hai-Bin Wu, Member, Fu-Lin Zhang, Yue Wang, Zhi-Hua Fan, Wen-Ming Li, Xiao-Chun Ye, Senior Member, Dong-Rui Fan.
Journal of Computer Science and Technology (JCST) [J]. Just Accepted. 2025.
24. (CCF-B, DATE) Accelerating Authenticated Block Ciphers via RISC-V Custom Cryptography Instructions. (RISC-V + AES加速)
Yuhang Qiu, Wenming Li, Tianyu Liu, Zhen Wang, Zhiyuan Zhang, Zhihua Fan,Xiaochun Ye, Dongrui Fan, Zhimin Tang.
Design, Automation and Test in Europe (DATE). Lyon France. 2025.
25. (CCF-A, TACO) Improving Utilization of Dataflow Unit for Multi-Batch Processing.(数据流可重构设计)
Zhihua Fan, Wenming Li*, Zhen Wang, Yu Yang, Xiaochun Ye, Dongrui Fan, Ninghui Sun, and Xuejun An.
ACM Trans. Archit. Code Optim. (TACO). 21, 1, Article 17. (2024).
26. (CCF-A, TPDS) Accelerating Convolutional Neural Networks by Exploiting the Sparsity of Output Activation.(数据流AI加速器)
Fan Zhihua, Li Wenming*, Wang Zhen, Liu Tianyu, Wu Haibin, Liu Yanhuan, Wu Meng, Wu Xinxin, Ye Xiaochun, Fan Dongrui, Sun Ninghui, An Xuejun.
IEEE Transactions on Parallel and Distributed Systems (TPDS), vol. 34, no. 12, pp. 3253-3265. (2023).
27. (CCF-A, TCAD) MoDSE: A High-Accurate Multi-Objective Design Space Exploration Framework for CPU Microarchitectures.(RISC-V设计空间探索)
Wang, Duo and Yan, Mingyu and Teng, Yihan and Han, Dengke and Liu, Xin and Li, Wenming and Ye, Xiaochun and Fan, Dongrui.
IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems (TCAD), 2023.
28. (CCF-B, EuroPar) Improving Utilization of Dataflow Architectures through Software and Hardware Co-Design.(数据流执行模型)
Zhihua Fan, Wenming Li*, Shengzhong Tang, Xuejun An, Xiaochun Ye, and Dongrui Fan.
International European Conference on Parallel and Distributed Computing (EuroPar). 1-14, 2023.
29. (CCF-A, DAC) A High-accurate Multi-objective Exploration Framework for Design Space of CPU.(RISC-V设计空间探索)
Wang, Duo and Yan, Mingyu and Liu, Xin and Zou, Mo and Liu, Tianyu and Li, Wenming and Ye, Xiaochun and Fan, Dongrui.
ACM/IEEE Design Automation Conference (DAC), 2023.
30. (CCF-A, 研发) 面向低精度神经网络的数据流体系结构优化. (数据流AI加速器)
范志华, 吴欣欣, 李文明*, 曹华伟, 安学军, 叶笑春, 范东睿.
计算机研究与发展. 2023, 60(1): 43-58.
31. (CCF-B, ICCD) DFGC: DFG-aware NoC Control based on Time Stamp Prediction for Dataflow Architecture.(数据流软硬协同调度)
LiuTianyu, Li Wenming*, Fan Zhihua.
International Conference on Computer Design (ICCD), Washington, DC, USA, 2023, pp. 432-439.
32. (CCF-B, ICCD) Alleviating Transfer Latency in DataFlow Accelerator for DSP Applications.(数据流软硬协同调度)
Wu Haibin, Li Wenming*, Fan Zhihua, Wang Zhen, Liu Tianyu, Huang Junying, Tang Shengzhong, Liu Yanhuan, Zhang, Kunming and Ye, Xiaochun and Fan,Dongrui.
International Conference on Computer Design (ICCD), Washington, DC, USA, 2023, pp. 440-443.
33. (CCF-A, TC) Multi-node Acceleration for Large-scale GCNs.
Sun, Gongjian, Yan, Mingyu, Wang, Duo, Li, Han, Li, Wenming, Ye, Xiaochun, Fan, Dongrui, Xie, Yuan.
IEEE Transactions on Computers (TC). 2022.
34. (JCST, CCF-B) Accelerating Data Transfer in Dataflow Architectures Through a Look-Ahead Acknowledgment Mechanism. (数据流软硬协同调度)
Feng, YuJing, Li, DeJian, Tan, Xu, Ye, XiaoChun, Fan, DongRui, Li, WenMing, Wang, Da, Zhang, Hao, Tang, ZhiMin.
Journal of Computer Science and Technology (JCST) [J]. 2022, 37(4): 942-959.
35. (IEEE CAL) Characterization and Implementation of Radar System Applications on a Reconfigurable Dataflow Architecture. (数据流+合成孔径雷达加速器)
Wang, Yinshen, Li, Wenming,* Liu, Tianyu, Zhou, Liangjiang, Wang, Bingnan, Fan, Zhihua, Ye, Xiaochun, Fan, Dongrui, Ding, Chibiao.
IEEE Computer Architecture Letters (IEEE CAL) [J]. 2022, 21(2): 121-124.
36. (CCF-B, DATE) LRP: Predictive output activation based on SVD approach for CNNs acceleration.(数据流AI加速器)
Xinxin Wu, Zhihua Fan, Tianyu Liu, Wenming Li, Xiaochun Ye, Dongrui Fan.
Design, Automation and Test in Europe (DATE). 2022.
37. 数据流计算研究进展与概述. (数据流综述)
范志华,李文明,叶笑春,范东睿.
数据与计算发展前沿, 2021, 3(5): 65-81.
38. (IF) An efficient scheduling algorithm for dataflow architecture using loop-pipelining.(数据流片上网络)
Li, Yi, Wu, Meng, Ye, Xiaochun, Li, Wenming, Xue, Rui, Wang, Da, Zhang, Hao, Fan, Dongrui.
INFORMATION SCIENCES[J]. 2021, 547: 1136-1153.
39. (CCF-A, 研发) 基于粗粒度数据流架构的稀疏卷积神经网络加速.(数据流AI加速器)
吴欣欣, 欧焱, 李文明, 王达, 张浩, 范东睿.
计算机研究与发展. 2021, 58(7): 1504-1517.
40. 高通量众核处理器设计. (众核处理器)
叶笑春, 李文明, 张洋, 张浩, 王达, 范东睿.
数据与计算发展前沿.2020, 2(1): 70-84.
41. (CCF-A, 研发) 面向数据流结构的指令内访存冲突优化研究. (数据流微架构)
欧焱, 冯煜晶, 李文明, 叶笑春, 王达, 范东睿.
计算机研究与发展[J]. 2019, 56(12): 2720-2732.
42. (JCR Q1, SUSCOM) PIM-WEAVER: A High Energy-efficient General-purpose Acceleration Architecture for String Operations in Big Data Processing.(PIM加速)
Li, Wenming, Ye, Xiaochun, Wang, Da, Zhang, Hao, Tang, Zhimin, Fan, Dongrui, Sun, Ninghui.
Sustainable Computing: Informatics and Systems (SUSCOM). 2019, 21: 129-142.
43. (CCF-A, 研发) 基于细粒度数据流架构的稀疏神经网络全连接层加速. (数据流AI加速器)
向陶然, 叶笑春, 李文明, 冯煜晶, 谭旭, 张浩, 范东睿.
计算机研究与发展. 2019, 56(6): 1192-1204.
44. (CCF-B, JCST) A Pipelining Loop Optimization Method for Dataflow Architecture. (细粒度数据流架构)
Tan, Xu, Ye, XiaoChun, Shen, XiaoWei, Xu, YuanChao, Wang, Da, Zhang, Lunkai, Li, WenMing, Fan, DongRui, Tang, ZhiMin.
Journal of Computer Science and Technology (JCST) [J]. 2018, 33(1): 116-130.
45. (CCF-B, JCST) A Non-Stop Double Buffering Mechanism for Dataflow Architecture. (细粒度数据流架构)
Tan, Xu, Shen, XiaoWei, Ye, XiaoChun, Wang, Da, Fan, DongRui, Zhang, Lunkai, Li, Wenming, Zhang, ZhiMin, Tang, ZhiMin.
Journal of Computer Science and Technology (JCST) [J]. 2018, 33(1): 145-157.
46. (CCF-A, HPCA) SmarCo: An Efficient Many-Core Processor for High-Throughput Applications in Datacenters. (高通量众核处理器)
Fan, Dongrui, Li, Wenming*, Ye, Xiaochun, Wang, Da, Zhang, Hao, Tang, Zhimin, Sun, Ninghui.
IEEE International Symposium on High Performance Computer Architecture (HPCA). 2018, 596-607.
47. (CCF-B, JCST) An Efficient Network-on-Chip Router for Dataflow Architecture. (细粒度数据流架构)
Shen, XiaoWei, Ye, XiaoChun, Tan, Xu, Wang, Da, Zhang, Lunkai, Li, Wenming, Zhang, ZhiMin, Fan, DongRui, Sun, NingHui.
Journal of Computer Science and Technology (JCST). 2017, 32(1): 11-25.
48. (CCF-A, 研发) MACT:高通量众核处理器离散访存请求批量处理机制. (高通量众核处理器)
李文明, 叶笑春, 王达, 郑方, 李宏亮, 林晗, 范东睿, 孙凝晖.
计算机研究与发展. 2015, 52(6): 1254-1265.
49. (CCF-A, 学报) BDSim:面向大数据应用的组件化高可配并行模拟框架.(高通量众核处理器)
李文明, 叶笑春, 张洋, 宋风龙, 王达, 唐士斌, 范东睿, 谢向辉.
计算机学报. 2015, 38(10): 1959-1975.
获奖及荣誉
国科大校级优秀课程(数字电路)(2024)
中央和国家机关“四好”党员(2023)
国科大院级优秀课程(数字电路)(2023)
中科院计算所联想奖教金(2023)
北京市科技新星计划(创新新星)(2022)
中科院计算所优秀科研人员(2021)
北京市科技发明一等奖(2020)
中国产学研促进会产学研成果二等奖(2020)
中科院计算所优秀科研人员(2017)
中科院计算所优秀共产党员(2016)
国家奖学金博士奖(2015)
曙光博士奖(2014)
国科大三好学生(2012)
国科大优秀学生干部(2012)
指导学生
已指导学生
李丹峰 硕士研究生 085208-电子与通信工程
王国旋 硕士研究生 085404-计算机技术
严开 硕士研究生 085404-计算机技术
杨煜 硕士研究生 085404-计算机技术
现指导学生
吴海彬 博士研究生 081201-计算机系统结构
张昆明 博士研究生 081200-计算机科学与技术
强子清 硕士研究生 081200-计算机科学与技术
朱玉洁 博士研究生 081200-计算机科学与技术
罗腾 硕士研究生 081200-计算机科学与技术
夏腾飞 硕士研究生 081200-计算机科学与技术
张芙菻 硕士研究生 081200-计算机科学与技术
王宸 硕士研究生 085400-电子信息
穆宇栋 博士研究生 081200-计算机科学与技术
仝浩然 博士研究生 081200-计算机科学与技术
朱宇 硕士研究生 081200-计算机科学与技术
谢平江 硕士研究生 081200-计算机科学与技术
王含瑞 硕士研究生 085400-电子信息
秦善天 博士研究生 081200-计算机科学与技术
石宏杰 硕士研究生 085410-人工智能
刘川川 硕士研究生 085410-人工智能