基本信息
刘芳芳  女  硕导  中国科学院软件研究所
电子邮件: fangfang@iscas.ac.cn
通信地址: 北京市海淀区中关村南四街4号软件所5号楼
邮政编码:

研究领域

高性能扩展数学库、高性能计算、并行计算

招生信息

   
招生专业
081202-计算机软件与理论
083500-软件工程
招生方向
高性能扩展数学库,稀疏迭代解法器,异构众核并行

教育背景

2016-09--2020-01   中国科学院大学   博士
2003-09--2006-06   吉林大学   硕士
1999-09--2003-07   吉林大学   本科

工作经历

   
工作简历
2020-09~2021-01,中国科学院软件研究所, 正高级工程师
2014-07~2020-09,中国科学院软件研究所, 高级工程师
2009-11~2014-07,中国科学院软件研究所, 助理研究员
2006-07~2009-11,中国科学院软件研究所, 研究实习员
社会兼职
2018-06-19-2020-12-30,中国工业与应用数学学会高性能计算与数学软件专业委员会委员, 委员

专利与奖励

   
奖励信息
(1) 国产P/E级高性能软件与算法库研究集体, 部委级, 2017
(2) Gordon Bell, , 其他, 2016
专利成果
( 1 ) 一种适用于大气动力学模拟的混合精度实现方法, 发明专利, 2023, 第 1 作者, 专利号: 202310519297.1

( 2 ) 面向SW39000处理器的稠密矩阵乘法的高性能实现方法及装置, 发明专利, 2021, 第 3 作者, 专利号: CN113849771A

( 3 ) 一种申威众核处理器的小规模对称矩阵并行三对角化方法, 发明专利, 2021, 第 1 作者, 专利号: CN113704691A

( 4 ) 面向SW26010-Pro处理器的1、2级BLAS函数库的高性能实现方法, 发明专利, 2021, 第 4 作者, 专利号: CN113641956A

( 5 ) 一种面向GPU平台的稀疏结构化三角方程组求解的高性能实现方法和装置, 发明专利, 2021, 第 3 作者, 专利号: CN113297537A

( 6 ) 一种众核平台上面向规则网格问题的结构化着色方法, 专利授权, 2021, 第 1 作者, 专利号: CN110942504B

( 7 ) 申威26010众核CPU上GEMM稠密矩阵乘高性能实现方法, 发明专利, 2020, 第 7 作者, 专利号: CN107168683B

( 8 ) 一种基于申威26010处理器的稀疏矩阵向量乘异构众核实现方法, 发明专利, 2019, 第 1 作者, 专利号: CN106775594B

( 9 ) 国产申威26010众核处理器上多维FFT的高性能实现方法, 专利授权, 2017, 第 4 作者, 专利号: CN107451097A

( 10 ) 一种适应于“神威·太湖之光”上HPCG优化的数据结构及其高效实现方法, 发明专利, 2017, 第 3 作者, 专利号: CN107273094A

( 11 ) 国产申威26010众核CPU上GEMM稠密矩阵乘高性能实现方法, 发明专利, 2017, 第 7 作者, 专利号: CN107168683A

( 12 ) 基于国产申威26010处理器的基2一维FFT的高性能实现方法, 专利授权, 2017, 第 6 作者, 专利号: CN106933777A

( 13 ) 一种基于国产申威26010处理器的稀疏矩阵向量乘异构众核实现方法, 发明专利, 2017, 第 1 作者, 专利号: CN106775594A

( 14 ) 一种基于申威平台的基础线性代数库BLAS三级函数GEMM的高性能实现方法, 专利授权, 2016, 第 3 作者, 专利号: CN105808309A

( 15 ) 一种大整数乘法Karatsuba算法的并行实现方法, 发明专利, 2016, 第 5 作者, 专利号: CN105653239A

( 16 ) 一种大整数乘法Comba算法基于OpenMP的并行实现方法, 发明专利, 2015, 第 3 作者, 专利号: CN104793922A

( 17 ) 基于FFT的大整数乘法SSA算法多核并行化实现方法, 发明专利, 2015, 第 2 作者, 专利号: CN104731563A

( 18 ) 一种基于GMP的大整数加法和减法多核并行化实现方法, 发明专利, 2015, 第 2 作者, 专利号: CN104699449A

( 19 ) 一种基于PETSc的GCRO-DR算法并行处理方法, 发明专利, 2014, 第 1 作者, 专利号: CN104182209A

( 20 ) 一种稀疏矩阵的存储方法CSRL及基于该方法的SpMV实现方法, 发明专利, 2013, 第 1 作者, 专利号: CN103336758A

( 21 ) 稀疏矩阵的对角线数据存储方法及基于该方法的SpMV实现方法, 发明专利, 2011, 第 5 作者, 专利号: CN102141976A

( 22 ) 针对稀疏矩阵的数据存储方法及基于该方法的SpMV实现方法, 发明专利, 2011, 第 4 作者, 专利号: CN102033854A

出版信息

   
发表论文
(1) 面向新一代神威超级计算机平台的大气动力学问题全隐式求解器研究, FULLY-IMPLICIT SOLVER FOR ATMOSPHERIC MODELING ON THE NEXT GENERATION SUNWAY SUPERCOMPUTERS, 数值计算与计算机应用, 2023, 第 2 作者
(2) MFFT: A GPU Accelerated Highly Efficient Mixed-Precision Large-Scale FFT Framework, ACM Transactions on Architecture and Code Optimization, 2023, 通讯作者
(3) GFFT: a Task Graph Based Fast Fourier Transform Optimization Framework, ICPP 2023, 2023, 通讯作者
(4) xMath2.0: a high‑performance extended math library for SW26010‑Pro many‑core processor, CCF Transactions on High Performance Computing, 2022, 第 1 作者
(5) An optimized framework for Matrix Factorization on the New Sunway many-core Platform, ACM Transactions on Architecture and Code Optimization, 2022, 通讯作者
(6) SW26010处理器上的并行结构化稀疏三角方程组求解器, Parallel Sparse Triangular Solver for Structured Grid Problems on SW26010 Processor, 软件学报, 2022, 第 2 作者
(7) High performance computing of DGDFT for tens of thousands of atoms using millions of cores on Sunway TaihuLight, SCIENCE BULLETIN, 2021, 第 10 作者
(8) 国产异构系统上的HPCG并行算法及高效实现, Parallel Algorithm and Efficient Implementation of HPCG on Domestic Heterogeneous Systems, 软件学报, 2021, 第 1 作者
(9) 面向国产申威26010众核处理器的一维FFT实现与优化, 软件学报, 2019, 第 4 作者
(10) 面向磁流体动力学方程组的异构众核全隐求解器研究, RESEARCH ON HETEROGENEOUS MANY-CORE FULLY-IMPLICIT SOLVER FOR MHD DYNAMICAL EQUATIONS, 数值计算与计算机应用, 2019, 第 1 作者
(11) 面向国产异构众核超级计算机的并行稀疏迭代求解器研究及其应用, 2019, 第 1 作者
(12) 大整数乘法Schonhage-Strassen算法的多核并行化研究, Research on Large Integer Multiplication Schonhage-Strassen Algorithm's Multi-Core Parallelization, 软件学报, 2018, 第 2 作者
(13) 623 Tflop/s HPCG run on Tianhe-2: Leveraging millions of hybrid cores, INTERNATIONAL JOURNAL OF HIGH PERFORMANCE COMPUTING APPLICATIONS, 2016, 第 3 作者
(14) The Sunway TaihuLight supercomputer: system and applications, SCIENCE CHINA-INFORMATION SCIENCES, 2016, 第 9 作者
(15) Accelerating the Simulation of Thermal Convection in the Earth's Outer Core on Tianhe-2, 2016 IEEE 22ND INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS), 2016, 
(16) 大整数Comba和Karatsuba乘法的多核并行化研究, Multi-Core Parallel of Large Integer Multiplication Comba and Karatsuba Algorithms, 计算机系统应用, 2016, 第 2 作者
(17) The Sunway TaihuLight supercomputer: system and applications, SCIENCE CHINA-INFORMATION SCIENCES, 2016, 第 9 作者
(18) 基于申威1600的3级BLAS GEMM函数优化, Optimization of BLAS Level 3 Functions on SW1600, 计算机系统应用, 2016, 第 2 作者
(19) Pattern-Driven Hybrid Multi-and Many-Core Acceleration in the MPAS Shallow-Water Model, 2015 44TH INTERNATIONAL CONFERENCE ON PARALLEL PROCESSING (ICPP), 2015, 第 5 作者
(20) Reducing Communication Overhead in the High Performance Conjugate Gradient Benchmark on Tianhe-2, PROCEEDINGS OF THIRTEENTH INTERNATIONAL SYMPOSIUM ON DISTRIBUTED COMPUTING AND APPLICATIONS TO BUSINESS, ENGINEERING AND SCIENCE, (DCABES 2014), 2014, 通讯作者
(21) 一种提高SpMV向量化性能的新型稀疏矩阵存储格式, A NEW SPARSE MATRIX STORAGE FORMAT FOR IMPROVING SPMV PERFORMANCE BY SIMD, 数值计算与计算机应用, 2014, 第 1 作者
(22) Optimizing and Scaling HPCG on Tianhe-2: Early Experience, ALGORITHMS AND ARCHITECTURES FOR PARALLEL PROCESSING, ICA3PP 2014, PT I, 2014, 第 3 作者
(23) Accelerating HPCG on Tianhe-2: A Hybrid CPU-MIC Algorithm, 2014 20TH IEEE INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS), 2014, 第 4 作者
(24) 基于混合精度算法的改进HPL软件包, Improved HPL Software Package Based on Mixed Precision Algorithm, 计算机工程, 2010, 第 3 作者
(25) 曙光5000A天体大规模数值模拟软件性能测试, Performance Evaluation of the Simulation Software on Dawning 5000A for Large Scale Celestial Bodies, 西安交通大学学报, 2009, 第 6 作者
(26) SpMV的自动性能优化实现技术及其应用研究, Automatic Performance Tuning of Sparse Matrix-Vector Multiplication: Implementation Techniques and Its Application Research, 计算机研究与发展, 2009, 第 3 作者
(27) 求解抛物型方程的并行Monte Carlo区域分解算法, Parallel Monte Carlo Domain Decomposition Algorithm for Solving Parabolic Functions, 吉林大学学报:理学版, 2007, 第 1 作者
(28) 一种求解抛物型方程的Monte Carlo并行算法, THE MONTE CARLO PARALLEL METHOD FOR SOLVING PARABOLIC FUNCTIONS, 高等学校计算数学学报, 2005, 第 1 作者

科研活动

   
科研项目
( 1 ) 面向地学领域的可扩展数值算法在银河/天河系列超级计算机上的应用研究, 负责人, 研究所自主部署, 2014-09--2017-08
( 2 ) 100P众核版高性能扩展数学库, 参与, 国家任务, 2014-07--2016-06
( 3 ) 数万核环境偏微分方程可扩展解法器若干关键技术研究, 参与, 国家任务, 2012-01--2015-12
( 4 ) 高可扩展全耦合空气动力学数值模拟软件, 参与, 国家任务, 2015-01--2016-12
( 5 ) 面向100P高效能计算机的HPCG算法设计与优化实现, 负责人, 国家任务, 2014-11--2016-12
( 6 ) 基于国产神威100PF系统的高性能算法库研究, 参与, 国家任务, 2016-01--2018-12
( 7 ) 面向国产众核处理器的高性能扩展数学库, 负责人, 其他国际合作项目, 2018-11--2019-12
( 8 ) 国产安全可控先进计算系统研制, 参与, 中国科学院计划, 2018-07--2020-12
( 9 ) 面向某国产处理器架构的高性能数学库, 负责人, 其他国际合作项目, 2020-01--2023-06
( 10 ) ARM硬件基础数学库LAPACK库一期, 负责人, 其他国际合作项目, 2019-12--2020-07
( 11 ) 超大规模可扩展大气动力学全隐式并行模拟及示范应用, 负责人, 国家任务, 2020-12--2023-11
( 12 ) 鲲鹏CPU系统HPCG性能优化与建模, 负责人, 境内委托项目, 2020-10--2021-09
( 13 ) 国产异构超算系统的适配与优化, 负责人, 中国科学院计划, 2023-09--2026-08
( 14 ) 基于新型浮点数表示的高效混合精度稀疏迭代解法器研究, 负责人, 研究所自主部署, 2023-12--2027-12
参与会议
(1)若干访存和通信密集型问题的混合精度算法初探   全国高性能计算学术年会2022   2022-12-13
(2)面向某国产超级计算机的HPCG异构众核并行及优化   中国工业与应用数学年会   2019-09-20
(3)面向国产处理器的异构众核并行稀疏迭代解法器   软件所学术年会   2019-05-17

指导学生

已指导学生

李克森  硕士研究生  081202-计算机软件与理论  

闫昊  硕士研究生  081202-计算机软件与理论  

路青霖  硕士研究生  081202-计算机软件与理论  

王鸿森  硕士研究生  083500-软件工程  

现指导学生

严愉程  硕士研究生  081200-计算机科学与技术  

梁桂硕  硕士研究生  085405-软件工程  

霍勉  硕士研究生  083500-软件工程  

顾鸿曜星  硕士研究生  083500-软件工程