基本信息

张云泉 男 博士, 研究员, 博导 中国科学院计算技术研究所
电子邮件: zyq at ict.ac.cn
联系电话: 010-62600652
手机号码:
通信地址:北京海淀科学院南路6号  邮政编码:100190

研究领域

主要研究方向为大型并行数值软件、并行程序设计和性能评价、并行计算模型、海量数据并行处理等。

招生信息

   
招生专业
081202-计算机软件与理论
081201-计算机系统结构
招生方向
并行算法与并行软件
并行算法与并行软件

教育背景

1995-09--2000-07   中国科学院软件研究所   工学博士
1991-09--1995-07   北京理工大学计算机科学技术系   工学学士
学历
-- 研究生
学位
-- 博士

工作经历

2000年7月-2001年12月,中科院软件研究所并行软件研究开发中心,并行算法与并行软件,助研;
2002年1月-2007年3月,中科院软件研究所并行软件研究开发中心,并行算法与并行软件,副研究员,硕导,副主任
2007年4月-2013年8月,中科院软件研究所并行计算实验室,并行算法与并行软件,研究员,博导,执行主任;
2013年8月-今,中科院计算所计算机体系结构国家重点实验室,并行算法与并行软件,研究员,博士生导师;

社会兼职
2019-12-31-2022-12-30,ACM中国, 常务理事
2019-11-30-今,北京计算机学会超级计算委员会, 主任
2019-06-29-今,ACM中国高性能计算专家委员会, 主席
2016-06-01-今,中国大数据与智能计算产业联盟, 执行理事长
2008-12-31-今,中国计算机学会高性能计算专业委员会, 秘书长
2007-11-30-今,中国软件行业协会, 常务理事

专利与奖励

   
奖励信息
(1) 国家科技进步奖, 二等奖, 国家级, 2019
(2) 中国科学院杰出科技成就奖, 特等奖, 部委级, 2017
(3) 中国科学院教育教学成果奖, 一等奖, 部委级, 2017
(4) 国家科技进步奖, 二等奖, 国家级, 2000
(5) 中科院科技进步奖, 二等奖, 院级, 1998
专利成果
[1] 程大宁, 李士刚, 张云泉. 一种用于在集群环境下进行机器学习的训练方法和系统. CN: CN108829517B, 2021-04-06.

[2] 张云泉, 袁泉, 黄珊, 郭鹏. 一种基于空间密铺的模板计算方法和系统. CN: CN108614735B, 2021-03-05.

[3] 李士刚, 吴保东, 李琨, 张云泉. 一种基于递归的并行快速傅里叶变换通信优化方法和系统. CN: CN109840306B, 2020-10-23.

[4] 李士刚, 李琨, 陈一峯, 张云泉. 一种分子动力学模拟中邻接表快速建立方法和系统. CN: CN109032667B, 2020-09-15.

[5] 聂宁明, 贺新福, 李建江, 李士刚, 王彦棡, 贾丽霞, 王先梦, 张云泉, 周纯葆, 王东杰, 吴保东, 王珏, 豆艳坤, 吴石. 嵌入原子势计算优化方法. CN: CN106529187B, 2019-03-08.

[6] 李士刚, 吴保东, 张贺, 张云泉, 张明华. 一种大气环流模式动力框架的三维剖分方法和系统. 中国: CN108595762A, 2018-09-28.

出版信息

   
发表论文
[1] Shang, Honghui, Duan, Xiaohui, Li, Fang, Zhang, Libo, Xu, Zhiqian, Liu, Kan, Luo, Haiwen, Ji, Yingrui, Zhao, Wenxuan, Xue, Wei, Chen, Li, Zhang, Yunquan. Many-core acceleration of the first-principles all-electron quantum perturbation calculations. COMPUTER PHYSICS COMMUNICATIONS[J]. 2021, 267: http://dx.doi.org/10.1016/j.cpc.2021.108045.
[2] Cheng, Daning, Li, Shigang, Zhang, Hanping, Xia, Fen, Zhang, Yunquan. Why Dataset Properties Bound the Scalability of Parallel Machine Learning Training Algorithms. IEEE TRANSACTIONS ON PARALLEL AND DISTRIBUTED SYSTEMS[J]. 2021, 32(7): 1702-1712, http://dx.doi.org/10.1109/TPDS.2020.3048836.
[3] Shang, Honghui, Liang, WanZhen, Zhang, Yunquan, Yang, Jinlong. Efficient parallel linear scaling method to get the response density matrix in all-electron real-space density-functional perturbation theory. COMPUTER PHYSICS COMMUNICATIONS[J]. 2021, 258: http://dx.doi.org/10.1016/j.cpc.2020.107613.
[4] 赵永浩, 贾海鹏, 张云泉, 张思佳. 基于SIMD的Square Root函数高性能实现与优化. 计算机工程与科学. 2021, 43(4): 662-669, http://lib.cqvip.com/Qikan/Article/Detail?id=7104519623.
[5] Cheng Daning, Li Shigang, Zhang Yunquan. WP-SGD: Weighted parallel SGD for distributed unbalanced-workload training system. JOURNAL OF PARALLEL AND DISTRIBUTED COMPUTING[J]. 2020, 145: 202-216, http://dx.doi.org/10.1016/j.jpdc.2020.06.011.
[6] Shang, Honghui, Xu, Lei, Wu, Baodong, Qin, Xinming, Zhang, Yunquan, Yang, Jinlong. The dynamic parallel distribution algorithm for hybrid density-functional calculations in HONPAS package. COMPUTER PHYSICS COMMUNICATIONS[J]. 2020, 254: http://dx.doi.org/10.1016/j.cpc.2020.107204.
[7] Li, Zhihao, Jia, Haipeng, Zhang, Yunquan, Chen, Tun, Yuan, Liang, Vuduc, Richard. Automatic Generation of High-Performance FFT Kernels on Arm and X86 CPUs. IEEE TRANSACTIONS ON PARALLEL AND DISTRIBUTED SYSTEMS[J]. 2020, 31(8): 1925-1941, https://www.webofscience.com/wos/woscc/full-record/WOS:000561084300003.
[8] Li, Kun, Li, Shigang, Huang, Shan, Chen, Yifeng, Zhang, Yunquan. FastNBL: fast neighbor lists establishment for molecular dynamics simulation based on bitwise operations. JOURNAL OF SUPERCOMPUTING[J]. 2020, 76(7): 5501-5520, https://www.webofscience.com/wos/woscc/full-record/WOS:000538267400033.
[9] Qin, Xinming, Shang, Honghui, Xu, Lei, Hu, Wei, Yang, Jinlong, Li, Shigang, Zhang, Yunquan. The static parallel distribution algorithms for hybrid density-functional calculations in HONPAS package. INTERNATIONAL JOURNAL OF HIGH PERFORMANCE COMPUTING APPLICATIONS[J]. 2020, 34(2): 159-168, http://dx.doi.org/10.1177/1094342019845046.
[10] Chen, Daobi, Yuan, Liang, Zhang, Yunquan, Yan, Jingfu, Kahaner, David. HPC software capability landscape in China. INTERNATIONAL JOURNAL OF HIGH PERFORMANCE COMPUTING APPLICATIONS[J]. 2020, 34(1): 115-153, https://www.webofscience.com/wos/woscc/full-record/WOS:000503082100010.
[11] 曹杭, 袁良, 黄珊, 张云泉, 徐勇军, 陆鹏起, 张广婷. 一种基于空间密铺的星型Stencil并行算法. 计算机研究与发展[J]. 2020, 57(12): 2621-2634, http://lib.cqvip.com/Qikan/Article/Detail?id=7103384456.
[12] 周广庆, 张云泉, 姜金荣, 张贺, 吴保东, 曹杭, 王天一, 郝卉群, 朱家文, 袁良, 张明华. 地球系统模式CAS-ESM. 数据与计算发展前沿. 2020, 2(1): 38-54, http://lib.cqvip.com/Qikan/Article/Detail?id=7101588167.
[13] 袁国兴, 张云泉, 袁良. 2020年中国高性能计算机发展现状分析. 计算机工程与科学[J]. 2020, 42(12): 2103-2108, http://lib.cqvip.com/Qikan/Article/Detail?id=7103580856.
[14] 程大宁, 张汉平, 夏粉, 李士刚, 袁良, 张云泉. AccSMBO:一种基于超参梯度和元学习的SMBO加速算法. 计算机研究与发展[J]. 2020, 57(12): 2596-2609, http://lib.cqvip.com/Qikan/Article/Detail?id=7103384454.
[15] 尚子豪, 商红慧, 王东杰, 张云泉, 贺新福, 陈泽华, 王栋, 张广婷. 原子动力学蒙特卡洛程序OpenKMC在反应堆压力容器钢缺陷损伤研究中的优化与应用. 计算机工程与科学[J]. 2020, 42(12): 2151-2162, http://lib.cqvip.com/Qikan/Article/Detail?id=7103580862.
[16] 王栋, 商红慧, 张云泉, 李琨, 贺新福, 贾丽霞. 原子动力学蒙特卡洛程序MISA-KMC在反应堆压力容器钢辐照损伤研究中的应用. 计算机科学[J]. 2020, 47(4): 30-35, http://lib.cqvip.com/Qikan/Article/Detail?id=7101330964.
[17] 张云泉, 袁良, 袁国兴, 李希代. 2019年中国高性能计算机发展现状分析与展望. 数据与计算发展前沿. 2020, 2(1): 18-26, http://lib.cqvip.com/Qikan/Article/Detail?id=7101588165.
[18] 张云泉, 袁良, 陈一峯, 冯晓兵, 张贺. 高性能计算多层次不连续非线性可扩展现象研究. 计算机学报[J]. 2020, 43(6): 973-989, http://lib.cqvip.com/Qikan/Article/Detail?id=7101875793.
[19] Li, Kun, Li, Shigang, Huang, Shan, Chen, Yifeng, Zhang, Yunquan. FastNBL: fast neighbor lists establishment for molecular dynamics simulation based on bitwise operations (vol 457, pg 235, 2020). JOURNAL OF SUPERCOMPUTINGnull. 2019, 75(12): 8339-8340, [20] Yuan, Liang, Ding, Chen, Smith, Wesley, Denning, Peter, Zhang, Yunquan. A Relational Theory of Locality. ACM TRANSACTIONS ON ARCHITECTURE AND CODE OPTIMIZATION[J]. 2019, 16(3): http://dx.doi.org/10.1145/3341109.
[21] Guo, Bingli, Shang, Yu, Zhang, Yunquan, Li, Wenzhe, Yin, Shan, Zhang, Yongjun, Huang, Shanguo. Timeslot Switching-Based Optical Bypass in Data Center for Intrarack Elephant Flow With an Ultrafast DPDK-Enabled Timeslot Allocator. JOURNAL OF LIGHTWAVE TECHNOLOGY[J]. 2019, 37(10): 2253-2260, [22] Zhang, Di, Zhang, Yunquan, Niu, Qiang, Qiu, Xingbao. Mining concise patterns on graph-connected itemsets. NEUROCOMPUTING[J]. 2019, 336: 27-35, http://dx.doi.org/10.1016/j.neucom.2018.03.084.
[23] Li, Zhihao, Jia, Haipeng, Zhang, Yunquan, Liu, Shice, Li, Shigang, Wang, Xiao, Zhang, Hao. Efficient parallel optimizations of a high-performance SIFT on GPUs. JOURNAL OF PARALLEL AND DISTRIBUTED COMPUTING[J]. 2019, 124: 78-91, http://dx.doi.org/10.1016/j.jpdc.2018.10.012.
[24] 袁国兴, 张云泉, 袁良. 2019年中国高性能计算机发展现状分析. 计算机工程与科学[J]. 2019, 41(12): 2095-2100, http://lib.cqvip.com/Qikan/Article/Detail?id=7100629190.
[25] 张云泉. 2018年中国高性能计算机发展现状分析与展望. 计算机科学. 2019, 46(1): 1-5, http://lib.cqvip.com/Qikan/Article/Detail?id=7001144965.
[26] 郭鹏, 袁良, 张云泉, 黄珊. 基于空间密铺的并行Stencil算法. 计算机科学与探索. 2019, 13(2): 181-194, http://lib.cqvip.com/Qikan/Article/Detail?id=7001186343.
[27] 陈暾, 李志豪, 贾海鹏, 张云泉. 基于ARMv8平台的多维FFT实现与优化研究. 计算机学报[J]. 2019, 42(11): 2384-2402, http://lib.cqvip.com/Qikan/Article/Detail?id=7100202299.
[28] Li, Shigang, Zhang, Yunquan, Hoefler, Torsten. Cache-Oblivious MPI All-to-All Communications Based on Morton Order. IEEE TRANSACTIONS ON PARALLEL AND DISTRIBUTED SYSTEMS[J]. 2018, 29(3): 542-555, https://www.webofscience.com/wos/woscc/full-record/WOS:000425173200005.
[29] 张云泉. 2017年中国高性能计算机发展现状分析与展望. 科研信息化技术与应用. 2018, 9(1): 5-12, http://lib.cqvip.com/Qikan/Article/Detail?id=676032706.
[30] 袁国兴, 张云泉, 袁良. 2018年中国高性能计算机发展现状分析. 计算机工程与科学[J]. 2018, 40(12): 2097-2102, http://lib.cqvip.com/Qikan/Article/Detail?id=7001036157.
[31] 张云泉. 对当前人工智能热的冷思考. 高科技与产业化. 2018, 14-17, http://lib.cqvip.com/Qikan/Article/Detail?id=675018244.
[32] 王庆磊, 罗文慧, 邬玉良, 张云泉. 交通大数据应用分析及共享支撑平台设计. 信息技术与标准化. 2018, 66-69, http://lib.cqvip.com/Qikan/Article/Detail?id=676233169.
[33] Xiao, Junmin, Li, Shigang, Wu, Baodong, Zhang, He, Li, Kun, Yao, Erlin, Zhang, Yunquan, Tan, Guangming, ACM. Communication-Avoiding for Dynamical Core of Atmospheric General Circulation Model. PROCEEDINGS OF THE 47TH INTERNATIONAL CONFERENCE ON PARALLEL PROCESSINGnull. 2018, [34] Wu, Baodong, Li, Shigang, Zhang, Yunquan, Nie, Ningming. Hybrid-optimization strategy for the communication of large-scale Kinetic Monte Carlo simulation. COMPUTER PHYSICS COMMUNICATIONS[J]. 2017, 211: 113-123, http://www.corc.org.cn/handle/1471x/2374191.
[35] Li, Zhihao, Jia, Haipeng, Zhang, Yunquan, IEEE. HartSift: A High-Accuracy and Real-Time SIFT based on GPU. 2017 IEEE 23RD INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS)null. 2017, 135-142, [36] 张云泉. 中国高性能计算机发展现状分析与展望. 民主与科学. 2017, 26-27, http://lib.cqvip.com/Qikan/Article/Detail?id=7000298988.
[37] 李琨, 贾海鹏, 曹婷, 张云泉. 大规模集群上多维FFT算法的实现与优化研究. 计算机科学与探索[J]. 2017, 11(6): 863-874, http://lib.cqvip.com/Qikan/Article/Detail?id=7000227257.
[38] 张迪, 张云泉, 张广治. 一种在图连接项集上发掘精简模式的方法. 中国传媒大学学报:自然科学版. 2017, 24(3): 25-30, http://lib.cqvip.com/Qikan/Article/Detail?id=66747166504849554851484854.
[39] 聂宁明, 胡长军, 张云泉, 贺新福, 张博尧, 李士刚. 材料微观结构演化大规模分子动力学软件比较. 计算机科学与探索[J]. 2017, 11(3): 355-364, http://lib.cqvip.com/Qikan/Article/Detail?id=7000132516.
[40] Zhang, Yunquan, Li, Shigang, Yan, Shengen, Zhou, Huiyang. A Cross-Platform SpMV Framework on Many-Core Architectures. ACM TRANSACTIONS ON ARCHITECTURE AND CODE OPTIMIZATION[J]. 2016, 13(4): https://www.webofscience.com/wos/woscc/full-record/WOS:000392416400002.
[41] Zhang, Yunquan, Li, Shigang, Yan, Shengen, Zhou, Huiyang. A Cross-Platform SpMV Framework on Many-Core Architectures. ACM TRANSACTIONS ON ARCHITECTURE AND CODE OPTIMIZATION[J]. 2016, 13(4): https://www.webofscience.com/wos/woscc/full-record/WOS:000392416400002.
[42] Zhang, Yunquan, Cao, Ting, Li, Shigang, Tian, Xinhui, Yuan, Liang, Jia, Haipeng, Vasilakos, Athanasios V. Parallel Processing Systems for Big Data: A Survey. PROCEEDINGS OF THE IEEE[J]. 2016, 104(11): 2114-2136, https://www.webofscience.com/wos/woscc/full-record/WOS:000386244000005.
[43] Zhang, Yunquan, Zhang, JiLin. Workshop on high performance data intensive computing. CONCURRENCY AND COMPUTATION-PRACTICE & EXPERIENCEnull. 2016, 28(6): 1695-1696, https://www.webofscience.com/wos/woscc/full-record/WOS:000374011400001.
[44] Wang Chenxi, Cao Ting, Zigman John, Lv Fang, Zhang Yunquan, Feng Xiaobing, Gao GR, Qian DP, Gao XB, Chapman B, Chen W. Efficient Management for Hybrid Memory in Managed Language Runtime. NETWORK AND PARALLEL COMPUTINGnull. 2016, 9966: 29-42, [45] 逄仁波, 张云泉, 谭光明, 徐建良, 贾海鹏, 解庆春. 边缘海静力数值预报模式并行算法研究. 计算机科学[J]. 2016, 43(1): 14-17,29, http://lib.cqvip.com/Qikan/Article/Detail?id=667766682.
[46] 贾海鹏, 张云泉, 袁良, 李士刚. 基于OpenCL的Viola-Jones人脸检测算法性能优化研究. 计算机学报[J]. 2016, 39(9): 1775-1789, http://lib.cqvip.com/Qikan/Article/Detail?id=669845563.
[47] Wu Baodong, Li Shigang, Zhang Yunquan, Chen W, Yin G, Zhao G, Han Q, Jing W, Sun G, Lu Z. Optimizing Parallel Kinetic Monte Carlo Simulation by Communication Aggregation and Scheduling. BIG DATA TECHNOLOGY AND APPLICATIONSnull. 2016, 590: 282-297, [48] Li ShiGang, Hu ChangJun, Zhang JunChao, Zhang YunQuan. Automatic tuning of sparse matrix-vector multiplication on multicore clusters. SCIENCE CHINA-INFORMATION SCIENCES[J]. 2015, 58(9): https://www.webofscience.com/wos/woscc/full-record/WOS:000359801900012.
[49] 吴保东, 张云泉, 李士刚, 贺新福, 周宇世强, 周宇世强. 面向RPV钢中富Cu团簇析出的KMC模拟算法研究. 2015, http://ir.ihep.ac.cn/handle/311005/211444.
[50] An Xiaojing, Jia Haipeng, Zhang Yunquan, IEEE. Optimized Password Recovery for Encrypted RAR on GPUs. 2015 IEEE 17TH INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE COMPUTING AND COMMUNICATIONS, 2015 IEEE 7TH INTERNATIONAL SYMPOSIUM ON CYBERSPACE SAFETY AND SECURITY, AND 2015 IEEE 12TH INTERNATIONAL CONFERENCE ON EMBEDDED SOFTWARE AND SYSTEMS (ICESS)null. 2015, 591-598, [51] Zhu Xiaomin, Zhang Junchao, Yoshii Kazutomo, Li Shigang, Zhang Yunquan, Balaji Pavan, IEEE. Analyzing MPI-3.0 Process-Level Shared Memory: A Case Study with Stencil Computations. 2015 15TH IEEE/ACM INTERNATIONAL SYMPOSIUM ON CLUSTER, CLOUD AND GRID COMPUTINGnull. 2015, 1099-1106, [52] Fan Mengran, Jia Haipeng, Zhang Yunquan, An Xiaojing, Cao Ting, IEEE. Optimizing Image Sharpening Algorithm on GPU. 2015 44TH INTERNATIONAL CONFERENCE ON PARALLEL PROCESSING (ICPP)null. 2015, 230-239, [53] Li ShiGang, Hu ChangJun, Zhang JunChao, Zhang YunQuan. Automatic tuning of sparse matrix-vector multiplication on multicore clusters. SCIENCE CHINA-INFORMATION SCIENCES[J]. 2015, 58(9): https://www.webofscience.com/wos/woscc/full-record/WOS:000359801900012.
[54] Li Shigang, Zhang Yunquan, Xiang Chunyang, Shi Lei, IEEE. Fast Convolution Operations on Many-Core Architectures. 2015 IEEE 17TH INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE COMPUTING AND COMMUNICATIONS, 2015 IEEE 7TH INTERNATIONAL SYMPOSIUM ON CYBERSPACE SAFETY AND SECURITY, AND 2015 IEEE 12TH INTERNATIONAL CONFERENCE ON EMBEDDED SOFTWARE AND SYSTEMS (ICESS)null. 2015, 316-323, [55] 安小景, 张云泉, 贾海鹏. 基于OpenCL的直方图生成算法优化方法研究. 计算机科学[J]. 2015, 42(11): 32-36, http://lib.cqvip.com/Qikan/Article/Detail?id=666686707.
[56] 詹科, 张云泉, 王婷, 郑晶晶, 张鹏. 基于Pthreads的并行DSRC压缩算法设计与实现. 计算机科学[J]. 2015, 42(1): 90-91,100, http://lib.cqvip.com/Qikan/Article/Detail?id=663510085.
[57] Liu, YiQun, Li, Yan, Zhang, YunQuan, Zhang, XianYi. Memory Efficient Two-Pass 3D FFT Algorithm for Intel (R) Xeon Phi(TM) Coprocessor. JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY[J]. 2014, 29(6): 989-1002, https://www.webofscience.com/wos/woscc/full-record/WOS:000345382500005.
[58] Xie Qingchun, Zhang Yunquan, Jia Haipeng, Lu Yongquan, IEEE. Research on Mahalanobis Distance Algorithm Optimization Based on OpenCL. 2014 IEEE INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE COMPUTING AND COMMUNICATIONS, 2014 IEEE 6TH INTL SYMP ON CYBERSPACE SAFETY AND SECURITY, 2014 IEEE 11TH INTL CONF ON EMBEDDED SOFTWARE AND SYST (HPCC,CSS,ICESS)null. 2014, 84-91, http://dx.doi.org/10.1109/HPCC.2014.19.
[59] Liu Yiqun, Li Yan, Zhang Yunquan, Zhang Xianyi. Memory Efficient Two-Pass 3D FFT Algorithm for Intel? Xeon Phi~(TM) Coprocessor. Journal of Computer Science and Technology[J]. 2014, 29(6): 989-1002, [60] Wu Changmao, Zhang Yunquan, Yang Congli, Lu Yutong, IEEE. Physically Based Parallel Ray Tracer for the Metropolis Light Transport Algorithm on the Tianhe-2 Supercomputer. 2014 20TH IEEE INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS)null. 2014, 444-453, [61] 袁国兴, 孙家昶, 张林波, 张云泉. 2013年中国高性能计算机发展现状分析及系统测评技术简析. 计算机工程与科学. 2013, 35(11): 1-5, http://lib.cqvip.com/Qikan/Article/Detail?id=47826431.
[62] Wu, Changmao, Zhang, Yunquan, Yang, Congli, IEEE. Large Scale Satellite Imagery Simulations with Physically Based Ray Tracing on Tianhe-1A Supercomputer. 2013 IEEE 15TH INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE COMPUTING AND COMMUNICATIONS & 2013 IEEE INTERNATIONAL CONFERENCE ON EMBEDDED AND UBIQUITOUS COMPUTING (HPCC_EUC)null. 2013, 549-556, http://dx.doi.org/10.1109/HPCC.and.EUC.2013.84.
[63] Luo Tao, Liao Yin, Chen Guoliang, Zhang Yunquan, Hu X, Lin TY, Raghavan V, Wah B, BaezaYates R, Fox G, Shahabi C, Smith M, Yang Q, Ghani R, Fan W, Lempel R, Nambiar R. P-DOT: A Model of Computation for Big Data. 2013 IEEE INTERNATIONAL CONFERENCE ON BIG DATAnull. 2013, 
发表著作
(1) 并行计算:模型与算法, 机械工业出版社, 2016-07, 第 1 作者
(2) 人工智能三驾马车 大数据、算力和算法, 科学技术文献出版社, 2021-07, 第 1 作者

科研活动

   
科研项目
( 1 ) 《支持国产CPU的编译系统及工具链》子课题《龙芯CPU多核并行国产高性能数学库研究开发》, 主持, 国家级, 2009-01--2011-12
( 2 ) 《面向数万个以上处理器的新型基础算法研究》, 主持, 国家级, 2009-01--2011-12
( 3 ) 中科院软件所杰出青年人才专项计划, 主持, 市地级, 2009-09--2013-09
( 4 ) 高性能蛋白质定量计算软件平台构建与开发, 主持, 部委级, 2008-01--2011-12
( 5 ) 大规模异构并行系统的高效能调度理论与方法, 参与, 国家级, 2012-01--2014-12
( 6 ) 基于光线追踪的高精度成像并行数值计算软件, 主持, 国家级, 2011-07--2013-12
( 7 ) 特定HPC应用及OPENCV的移植和优化, 主持, 研究所(学校), 2011-01--2013-12
( 8 ) 众核体系架构并行计算模型与算法自适应调优框架研究, 主持, 国家级, 2013-01--2016-12
( 9 ) 面向气候和湍流模拟的百万量级异构众核可扩展并行算法与优化方法, 主持, 国家级, 2015-01--2019-12
( 10 ) 百万处理器核可扩展并行共性算法与性能优化关键技术研究与开发, 主持, 国家级, 2016-07--2020-12
( 11 ) 面向深度学习的GPU虚拟化关键方法与技术研究, 主持, 省级, 2018-12--2021-12
( 12 ) 面向众核体系架构的并行计算模型与性能自适应优化研究, 主持, 国家级, 2021-01--2023-12

指导学生

已指导学生

袁伟  硕士研究生  081202-计算机软件与理论  

蒋孟奇  硕士研究生  081202-计算机软件与理论  

柳锴  硕士研究生  081202-计算机软件与理论  

王宣强  硕士研究生  081202-计算机软件与理论  

袁娥  硕士研究生  081202-计算机软件与理论  

唐雨新  硕士研究生  081202-计算机软件与理论  

刘胜飞  硕士研究生  081202-计算机软件与理论  

余元  硕士研究生  081202-计算机软件与理论  

王磊  硕士研究生  081202-计算机软件与理论  

袁良  博士研究生  081202-计算机软件与理论  

陈少虎  硕士研究生  081202-计算机软件与理论  

费辉  硕士研究生  081202-计算机软件与理论  

耿琳  硕士研究生  081202-计算机软件与理论  

孙相征  博士研究生  081202-计算机软件与理论  

张樱  硕士研究生  081202-计算机软件与理论  

李焱  博士研究生  081202-计算机软件与理论  

张龙  硕士研究生  430112-计算机技术  

庞旭  硕士研究生  430112-计算机技术  

蒋丽媛  硕士研究生  430112-计算机技术  

吕渐春  硕士研究生  430112-计算机技术  

赵美超  硕士研究生  430112-计算机技术  

程大宁  博士研究生  081201-计算机系统结构  

安小景  硕士研究生  085211-计算机技术  

郭鹏  硕士研究生  085212-软件工程  

吴保东  博士研究生  081202-计算机软件与理论  

黄珊  硕士研究生  081201-计算机系统结构  

王霄  硕士研究生  081202-计算机软件与理论  

李志豪  博士研究生  081202-计算机软件与理论  

陆鹏起  硕士研究生  081201-计算机系统结构  

徐文峰  硕士研究生  081201-计算机系统结构  

现指导学生

李琨  博士研究生  081201-计算机系统结构  

陈暾  博士研究生  081202-计算机软件与理论  

徐磊  博士研究生  081202-计算机软件与理论  

姚建宇  硕士研究生  085211-计算机技术  

李晨荻  硕士研究生  081202-计算机软件与理论  

徐直前  博士研究生  081202-计算机软件与理论  

岳玥  硕士研究生  081202-计算机软件与理论  

张祎维  博士研究生  081202-计算机软件与理论  

赵文璇  硕士研究生  081202-计算机软件与理论