基本信息
刘芳芳 女 硕导 中国科学院软件研究所
电子邮件: fangfang@iscas.ac.cn
通信地址: 北京市海淀区中关村南四街4号软件所5号楼
邮政编码:
电子邮件: fangfang@iscas.ac.cn
通信地址: 北京市海淀区中关村南四街4号软件所5号楼
邮政编码:
研究领域
高性能扩展数学库、高性能计算、并行计算
招生信息
招生专业
081202-计算机软件与理论083500-软件工程
招生方向
高性能扩展数学库,稀疏迭代解法器,异构众核并行
教育背景
2016-09--2020-01 中国科学院大学 博士2003-09--2006-06 吉林大学 硕士1999-09--2003-07 吉林大学 本科
工作经历
工作简历
2020-09~2021-01,中国科学院软件研究所, 正高级工程师2014-07~2020-09,中国科学院软件研究所, 高级工程师2009-11~2014-07,中国科学院软件研究所, 助理研究员2006-07~2009-11,中国科学院软件研究所, 研究实习员
社会兼职
2018-06-19-2020-12-30,中国工业与应用数学学会高性能计算与数学软件专业委员会委员, 委员
专利与奖励
奖励信息
(1) 国产P/E级高性能软件与算法库研究集体, 部委级, 2017(2) Gordon Bell, , 其他, 2016
专利成果
( 1 ) 一种适用于大气动力学模拟的混合精度实现方法, 发明专利, 2023, 第 1 作者, 专利号: 202310519297.1( 2 ) 面向SW39000处理器的稠密矩阵乘法的高性能实现方法及装置, 发明专利, 2021, 第 3 作者, 专利号: CN113849771A( 3 ) 一种申威众核处理器的小规模对称矩阵并行三对角化方法, 发明专利, 2021, 第 1 作者, 专利号: CN113704691A( 4 ) 面向SW26010-Pro处理器的1、2级BLAS函数库的高性能实现方法, 发明专利, 2021, 第 4 作者, 专利号: CN113641956A( 5 ) 一种面向GPU平台的稀疏结构化三角方程组求解的高性能实现方法和装置, 发明专利, 2021, 第 3 作者, 专利号: CN113297537A( 6 ) 一种众核平台上面向规则网格问题的结构化着色方法, 专利授权, 2021, 第 1 作者, 专利号: CN110942504B( 7 ) 申威26010众核CPU上GEMM稠密矩阵乘高性能实现方法, 发明专利, 2020, 第 7 作者, 专利号: CN107168683B( 8 ) 一种基于申威26010处理器的稀疏矩阵向量乘异构众核实现方法, 发明专利, 2019, 第 1 作者, 专利号: CN106775594B( 9 ) 国产申威26010众核处理器上多维FFT的高性能实现方法, 专利授权, 2017, 第 4 作者, 专利号: CN107451097A( 10 ) 一种适应于“神威·太湖之光”上HPCG优化的数据结构及其高效实现方法, 发明专利, 2017, 第 3 作者, 专利号: CN107273094A( 11 ) 国产申威26010众核CPU上GEMM稠密矩阵乘高性能实现方法, 发明专利, 2017, 第 7 作者, 专利号: CN107168683A( 12 ) 基于国产申威26010处理器的基2一维FFT的高性能实现方法, 专利授权, 2017, 第 6 作者, 专利号: CN106933777A( 13 ) 一种基于国产申威26010处理器的稀疏矩阵向量乘异构众核实现方法, 发明专利, 2017, 第 1 作者, 专利号: CN106775594A( 14 ) 一种基于申威平台的基础线性代数库BLAS三级函数GEMM的高性能实现方法, 专利授权, 2016, 第 3 作者, 专利号: CN105808309A( 15 ) 一种大整数乘法Karatsuba算法的并行实现方法, 发明专利, 2016, 第 5 作者, 专利号: CN105653239A( 16 ) 一种大整数乘法Comba算法基于OpenMP的并行实现方法, 发明专利, 2015, 第 3 作者, 专利号: CN104793922A( 17 ) 基于FFT的大整数乘法SSA算法多核并行化实现方法, 发明专利, 2015, 第 2 作者, 专利号: CN104731563A( 18 ) 一种基于GMP的大整数加法和减法多核并行化实现方法, 发明专利, 2015, 第 2 作者, 专利号: CN104699449A( 19 ) 一种基于PETSc的GCRO-DR算法并行处理方法, 发明专利, 2014, 第 1 作者, 专利号: CN104182209A( 20 ) 一种稀疏矩阵的存储方法CSRL及基于该方法的SpMV实现方法, 发明专利, 2013, 第 1 作者, 专利号: CN103336758A( 21 ) 稀疏矩阵的对角线数据存储方法及基于该方法的SpMV实现方法, 发明专利, 2011, 第 5 作者, 专利号: CN102141976A( 22 ) 针对稀疏矩阵的数据存储方法及基于该方法的SpMV实现方法, 发明专利, 2011, 第 4 作者, 专利号: CN102033854A
出版信息
发表论文
[1] 陈道琨, 刘芳芳, 杨超. 面向新一代神威超级计算机平台的大气动力学问题全隐式求解器研究. 数值计算与计算机应用. 2023, 第 2 作者44(2): 198-213, http://lib.cqvip.com/Qikan/Article/Detail?id=7109962024.[2] Zhao Yuwen, Liu Fangfang, Ma Wenjing, Li Huiyuan, Peng Yuanchi, Wang Cui. MFFT: A GPU Accelerated Highly Efficient Mixed-Precision Large-Scale FFT Framework. ACM Transactions on Architecture and Code Optimization[J]. 2023, 第 2 作者 通讯作者 null(null): [3] Lu Qinglin, Wang Xinyu, Ma Wenjing, Zhao Yuwen, Chen Daokun, Liu Fangfang. GFFT: a Task Graph Based Fast Fourier Transform Optimization Framework. ICPP 2023. 2023, 第 6 作者 通讯作者 [4] Liu fangfang, Ma Wenjing, Zhao Yuwen, Chen Daokun, Hu Yi, Lu Qinglin, Yin Wanwang, Yuan Xinhui, Jiang Lijuan, Yan Hao, Li Min, Wang Hongsen, Wang Xinyu, Yang Chao. xMath2.0: a high‑performance extended math library for SW26010‑Pro many‑core processor. CCF Transactions on High Performance Computing[J]. 2022, 第 1 作者[5] Ma wenjing, Liu Fangfang, Chen Daokun, Lu Qinglin, Hu Yi, Wang Hongsen, Yuan Xinhui. An optimized framework for Matrix Factorization on the New Sunway many-core Platform. ACM Transactions on Architecture and Code Optimization[J]. 2022, 第 2 作者 通讯作者 [6] 陈道琨, 刘芳芳, 杨超. SW26010处理器上的并行结构化稀疏三角方程组求解器. 软件学报[J]. 2022, 第 2 作者33(12): 4452-4463, http://lib.cqvip.com/Qikan/Article/Detail?id=7108580135.[7] Hu, Wei, Qin, Xinming, Jiang, Qingcai, Chen, Junshi, An, Hong, Jia, Weile, Li, Fang, Liu, Xin, Chen, Dexun, Liu, Fangfang, Zhao, Yuwen, Yang, Jinlong. High performance computing of DGDFT for tens of thousands of atoms using millions of cores on Sunway TaihuLight. SCIENCE BULLETIN[J]. 2021, 第 10 作者66(2): 111-119, http://dx.doi.org/10.1016/j.scib.2020.06.025.[8] 刘芳芳, 王志军, 汪荃, 吴丽鑫, 马文静, 杨超, 孙家昶. 国产异构系统上的HPCG并行算法及高效实现. 软件学报[J]. 2021, 第 1 作者32(8): 2341-2351, http://lib.cqvip.com/Qikan/Article/Detail?id=7105477914.[9] 赵玉文, 敖玉龙, 杨超, 刘芳芳, 尹万旺, 林蓉芬. 面向国产申威26010众核处理器的一维FFT实现与优化. 软件学报[J]. 2019, 第 4 作者[10] 刘芳芳, 陈道琨, 杨超, 赵玉文. 面向磁流体动力学方程组的异构众核全隐求解器研究. 数值计算与计算机应用[J]. 2019, 第 1 作者34-50, http://lib.cqvip.com/Qikan/Article/Detail?id=83907483504849574849484852.[11] 刘芳芳. 面向国产异构众核超级计算机的并行稀疏迭代求解器研究及其应用. 2019, 第 1 作者[12] 赵玉文, 刘芳芳, 蒋丽娟, 杨超. 大整数乘法Schonhage-Strassen算法的多核并行化研究. 软件学报[J]. 2018, 第 2 作者29(12): 3604-3613, http://lib.cqvip.com/Qikan/Article/Detail?id=6100021631.[13] Fu, Haohuan, Liao, Junfeng, Yang, Jinzhe, Wang, Lanning, Song, Zhenya, Huang, Xiaomeng, Yang, Chao, Xue, Wei, Liu, Fangfang, Qiao, Fangli, Zhao, Wei, Yin, Xunqiang, Hou, Chaofeng, Zhang, Chenglong, Ge, Wei, Zhang, Jian, Wang, Yangang, Zhou, Chunbo, Yang, Guangwen. The Sunway TaihuLight supercomputer: system and applications. SCIENCE CHINA-INFORMATION SCIENCES[J]. 2016, 第 9 作者59(7): http://ir.ipe.ac.cn/handle/122111/21269.[14] Liu, Yiqun, Yang, Chao, Liu, Fangfang, Zhang, Xianyi, Lu, Yutong, Du, Yunfei, Yang, Canqun, Xie, Min, Liao, Xiangke. 623 Tflop/s HPCG run on Tianhe-2: Leveraging millions of hybrid cores. INTERNATIONAL JOURNAL OF HIGH PERFORMANCE COMPUTING APPLICATIONS[J]. 2016, 第 3 作者30(1): 39-54, https://www.webofscience.com/wos/woscc/full-record/WOS:000371326000004.[15] Changmao Wu. Accelerating the Simulation of Thermal Convection in the Earth's Outer Core on Tianhe-2. 2016 IEEE 22ND INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS). 2016, 800-809, [16] 蒋丽娟, 刘芳芳, 赵玉文, 杨超, 蔡颖. 大整数Comba和Karatsuba乘法的多核并行化研究. 计算机系统应用[J]. 2016, 第 2 作者232-236, http://lib.cqvip.com/Qikan/Article/Detail?id=670591707.[17] Fu, Haohuan, Liao, Junfeng, Yang, Jinzhe, Wang, Lanning, Song, Zhenya, Huang, Xiaomeng, Yang, Chao, Xue, Wei, Liu, Fangfang, Qiao, Fangli, Zhao, Wei, Yin, Xunqiang, Hou, Chaofeng, Zhang, Chenglong, Ge, Wei, Zhang, Jian, Wang, Yangang, Zhou, Chunbo, Yang, Guangwen. The Sunway TaihuLight supercomputer: system and applications. SCIENCE CHINA-INFORMATION SCIENCES[J]. 2016, 第 9 作者59(7): http://ir.ipe.ac.cn/handle/122111/21269.[18] 刘昊, 刘芳芳, 张鹏, 杨超, 蒋丽娟. 基于申威1600的3级BLAS GEMM函数优化. 计算机系统应用[J]. 2016, 第 2 作者234-239, http://lib.cqvip.com/Qikan/Article/Detail?id=670903486.[19] Zhang Peng, Ao Yulong, Yang Chao, Liu Yiqun, Liu Fangfang, Wu Changmao, Zhao Haitao, IEEE. Pattern-Driven Hybrid Multi-and Many-Core Acceleration in the MPAS Shallow-Water Model. 2015 44TH INTERNATIONAL CONFERENCE ON PARALLEL PROCESSING (ICPP). 2015, 第 5 作者71-80, [20] Liu Fangfang, Yang Chao, Liu Yiqun, Zhang Xianyi, Lu Yutong, Douglas C, Yucheng G. Reducing Communication Overhead in the High Performance Conjugate Gradient Benchmark on Tianhe-2. PROCEEDINGS OF THIRTEENTH INTERNATIONAL SYMPOSIUM ON DISTRIBUTED COMPUTING AND APPLICATIONS TO BUSINESS, ENGINEERING AND SCIENCE, (DCABES 2014). 2014, 第 1 作者13-18, [21] 刘芳芳, 杨超. 一种提高SpMV向量化性能的新型稀疏矩阵存储格式. 数值计算与计算机应用[J]. 2014, 第 1 作者35(4): 269-276, http://sciencechina.cn/gw.jsp?action=detail.jsp&internal_id=5310347&detailType=1.[22] Zhang, Xianyi, Yang, Chao, Liu, Fangfang, Liu, Yiqun, Lu, Yutong, Sun, XH, Qu, W, Stojmenovic, I, Zhou, W, Li, Z, Guo, H, Min, G, Yang, T, Wu, Y, Liu, L. Optimizing and Scaling HPCG on Tianhe-2: Early Experience. ALGORITHMS AND ARCHITECTURES FOR PARALLEL PROCESSING, ICA3PP 2014, PT I. 2014, 第 3 作者8630: 28-41, [23] Liu Yiqun, Zhang Xianyi, Yang Chao, Liu Fangfang, Lu Yutong, IEEE. Accelerating HPCG on Tianhe-2: A Hybrid CPU-MIC Algorithm. 2014 20TH IEEE INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS). 2014, 第 4 作者542-551, [24] 王磊, 张云泉, 刘芳芳, 张先轶. 基于混合精度算法的改进HPL软件包. 计算机工程[J]. 2010, 第 3 作者36(19): 47-49, http://lib.cqvip.com/Qikan/Article/Detail?id=35415661.[25] 王婷, 孙相征, 张云泉, 杨超, 李力刚, 刘芳芳, 管文华, 唐雨新, 姚继峰. 曙光5000A天体大规模数值模拟软件性能测试. 西安交通大学学报[J]. 2009, 第 6 作者43(10): 71-75, http://lib.cqvip.com/Qikan/Article/Detail?id=31922536.[26] 袁娥, 张云泉, 刘芳芳, 孙相征. SpMV的自动性能优化实现技术及其应用研究. 计算机研究与发展[J]. 2009, 第 3 作者1117-1126, http://lib.cqvip.com/Qikan/Article/Detail?id=30839323.[27] 刘芳芳, 刘播. 求解抛物型方程的并行Monte Carlo区域分解算法. 吉林大学学报:理学版[J]. 2007, 第 1 作者45(2): 173-178, http://lib.cqvip.com/Qikan/Article/Detail?id=24038768.[28] 刘芳芳, 刘播, 刘春光. 一种求解抛物型方程的Monte Carlo并行算法. 高等学校计算数学学报[J]. 2005, 第 1 作者http://lib.cqvip.com/Qikan/Article/Detail?id=1000292974.
科研活动
科研项目
( 1 ) 面向地学领域的可扩展数值算法在银河/天河系列超级计算机上的应用研究, 负责人, 研究所自主部署, 2014-09--2017-08( 2 ) 100P众核版高性能扩展数学库, 参与, 国家任务, 2014-07--2016-06( 3 ) 数万核环境偏微分方程可扩展解法器若干关键技术研究, 参与, 国家任务, 2012-01--2015-12( 4 ) 高可扩展全耦合空气动力学数值模拟软件, 参与, 国家任务, 2015-01--2016-12( 5 ) 面向100P高效能计算机的HPCG算法设计与优化实现, 负责人, 国家任务, 2014-11--2016-12( 6 ) 基于国产神威100PF系统的高性能算法库研究, 参与, 国家任务, 2016-01--2018-12( 7 ) 面向国产众核处理器的高性能扩展数学库, 负责人, 其他国际合作项目, 2018-11--2019-12( 8 ) 国产安全可控先进计算系统研制, 参与, 中国科学院计划, 2018-07--2020-12( 9 ) 面向某国产处理器架构的高性能数学库, 负责人, 其他国际合作项目, 2020-01--2023-06( 10 ) ARM硬件基础数学库LAPACK库一期, 负责人, 其他国际合作项目, 2019-12--2020-07( 11 ) 超大规模可扩展大气动力学全隐式并行模拟及示范应用, 负责人, 国家任务, 2020-12--2023-11( 12 ) 鲲鹏CPU系统HPCG性能优化与建模, 负责人, 境内委托项目, 2020-10--2021-09( 13 ) 国产异构超算系统的适配与优化, 负责人, 中国科学院计划, 2023-09--2026-08( 14 ) 基于新型浮点数表示的高效混合精度稀疏迭代解法器研究, 负责人, 研究所自主部署, 2023-12--2027-12
参与会议
(1)若干访存和通信密集型问题的混合精度算法初探 全国高性能计算学术年会2022 2022-12-13(2)面向某国产超级计算机的HPCG异构众核并行及优化 中国工业与应用数学年会 2019-09-20(3)面向国产处理器的异构众核并行稀疏迭代解法器 软件所学术年会 2019-05-17
指导学生
已指导学生
李克森 硕士研究生 081202-计算机软件与理论
闫昊 硕士研究生 081202-计算机软件与理论
路青霖 硕士研究生 081202-计算机软件与理论
王鸿森 硕士研究生 083500-软件工程
现指导学生
严愉程 硕士研究生 081200-计算机科学与技术
梁桂硕 硕士研究生 085405-软件工程
霍勉 硕士研究生 083500-软件工程
顾鸿曜星 硕士研究生 083500-软件工程