基本信息

陈莉  女  硕导  中国科学院计算技术研究所
电子邮件: lchen@ict.ac.cn
通信地址: 北京海淀区科学院南路6号计算所编译组
邮政编码: 100190

研究领域

       研究经历包括,神威E级计算机上AceMesh数据流并行编程语言、曙光系列超级计算机的UPCH语言和编程环境、GPU平台上OpenMP语言扩展和优化技术、曙光系列计算机上多粒度并行化编译系统ParaORC研制、面向短向量的SIMD并行编译优化系统的研制等。

      目前的主要研究兴趣是面向新一代国产超算系统的混合精度自动分析技术、大规模异构众核系统上类数据流编程模型,面向深度学习众核芯片的并行编程和编译优化技术。

      低精度计算是计算机体系结构的重要趋势,它会显著优化计算、访存和通信的性能,并降低能耗。混合精度计算在高性能计算领域受到广泛关注,自动精度调优和编译支持是当前的研究热点。我们研究实用的误差分析方法、自动精度推演工具、精度搜索算法和相关的编译支持。

     研究类数据流编程模型的语言机制,以自然地表达动态不规则应用中隐含的丰富并行性,简化编程;引入结构化的语言机制和调度机制,优化细粒度任务到大规模异构并行系统的层次映射、优化依赖追踪和任务调度的开销,实现负载均衡;研究通信和计算的协同优化和自适应的通信优化;研究计算热点的异构编译优化等

      面向深度学习网络以及DSP等应用领域,为新型众核结构研究并行编程方法和并行编译优化技术。探索数据流模型和制导语言等不同的高层编程方法,建立可扩展的编译优化框架以自动挖掘算子中隐含的大量并行性,并优化地映射到底层芯片复杂的组织结构上

教育背景

1999-09--2002-07   中国科学院计算技术研究所   工学博士
学历
1988年9月——1992年7月,山东科技大学 计算机科学与技术   本科
1992年9月——1995年7月,山东科技大学 计算机科学与技术   硕士
1999年9月——2002年7月,中科院计算所 计算机系统结构 博士
学位
计算机系统结构 工学博士
出国学习工作
2007年6月,访问法国INRIA一周;
2009年10月-2010年5月,在美国普渡大学和休斯敦大学作高级访问学者

工作经历

   
工作简历
2010-05~现在, 中国科学院计算技术研究所, 副研究员
2010-04~2010-05,美国休斯顿大学, 高级访问学者
2009-11~2010-03,美国普渡大学, 高级访问学者
2005-11~2009-10,中国科学院技术技术研究所, 副研究员
2002-07~2005-11,中国科学院计算技术研究所, 助理研究员
社会兼职
2013-03-27-2014-03-29,HPCC2013, program committee
2006-08-10-2007-03-28,HIPS 2007, program committee

专利与奖励

   
专利成果
[1] 陈莉, 韩冬妮, 侯雄辉. 一种利用数据拓扑信息的优先级分组调度方法及系统. 中国: CN105528243A, 2016-04-27.
[2] 王毅, 李鹏程, 陈莉, 支援, 郭午平, 张定飞. 基于消息传递接口的设备的通信行为信息提取方法及系统. 中国: CN101571814B, 2011-08-24.

出版信息

   
发表论文
[1] 计算机科学. 2024,   通讯作者  
[2] 陈岳涛, 邱柯妮, 陈莉, 贾海鹏, 张云泉, 肖利民, 刘磊. Smart Scheduler: an Adaptive NVM-Aware Thread Scheduling Approach on NUMA Systems. CCF Transactions on High Performance Computing (THPC)[J]. 2022, 第 3 作者
[3] Shang, Honghui, Duan, Xiaohui, Li, Fang, Zhang, Libo, Xu, Zhiqian, Liu, Kan, Luo, Haiwen, Ji, Yingrui, Zhao, Wenxuan, Xue, Wei, Chen, Li, Zhang, Yunquan. Many-core acceleration of the first-principles all-electron quantum perturbation calculations. COMPUTER PHYSICS COMMUNICATIONS[J]. 2021, 第 11 作者267: http://dx.doi.org/10.1016/j.cpc.2021.108045.
[4] Li Chen, Shenglin Tang, You Fu, Xiran Gao, Jie Guo, Shangzhi Jiang. AceMesh: A Structured Data Driven Programming Language for High Performance Computing. CCF Transactions on High Performance Computing[J]. 2020, 第 1 作者  通讯作者  
[5] 姜尚志, 唐生林, 高希然, 花嵘, 陈莉, 刘颖. “神威·太湖之光”上Tend_lin应用的并行优化研究. 计算机工程与科学[J]. 2020, 第 5 作者  通讯作者  42(10): 1842-1851, http://lib.cqvip.com/Qikan/Article/Detail?id=7103095078.
[6] Shengjie Yang, Xinyu Li, Xinglei Dou, Xiaoli Gong, Hao Liu, Li Chen, Lei Liu. Monitoring Memory Behaviors and Mitigating NUMA Drawbacks on Tiered NVM Systems. The 17th IFIP Intl. Conf. on Network and Par. Computing[J]. 2020, 第 6 作者
[7] 郭杰, 高希然, 陈莉, 傅游, 刘颖. 用数据驱动的编程模型并行多重网格应用. 计算机科学[J]. 2020, 第 3 作者  通讯作者  47(8): 32-40, http://lib.cqvip.com/Qikan/Article/Detail?id=7102493869.
[8] 陈莉, 唐生林, 刘艳娜. 一个面向任务图并行程序的错误检查工具. 计算机科学[J]. 2017, 第 1 作者  通讯作者  44(3): 38-41, http://lib.cqvip.com/Qikan/Article/Detail?id=671506025.
[9] 刘颖, 吕方, 王蕾, 陈莉, 崔慧敏, 冯晓兵. 异构并行编程模型研究与进展. 软件学报[J]. 2014, 第 4 作者25(7): 1459-1475, http://lib.cqvip.com/Qikan/Article/Detail?id=50166787.
[10] 刘雷, 李晶, 陈莉, 冯晓兵. 基于进程投机并行的运行时系统设计与优化. 计算机工程[J]. 2014, 第 3 作者40(3): 99-102,112, http://lib.cqvip.com/Qikan/Article/Detail?id=48839168.
[11] 李恒杰, 何文婷, 陈莉, 刘雷, 吴承勇. 支持算法组件自动替换的编程范式及编译框架. 高技术通讯[J]. 2013, 第 3 作者23(11): 1131-1138, http://lib.cqvip.com/Qikan/Article/Detail?id=48009078.
[12] 王蕾, 崔慧敏, 陈莉, 冯晓兵. 任务并行编程模型研究与进展. 软件学报[J]. 2013, 第 3 作者24(1): 77-90, http://lib.cqvip.com/Qikan/Article/Detail?id=44331446.
[13] 陈莉, 寿宝江, 侯雄辉, 黄磊. A compiler-assisted runtime-prefetching scheme for heterogeneous platforms. Proceedings of the 8th International Workshop on OpenMP[J]. 2012, 第 1 作者  通讯作者  
[14] 徐世雄, 陈莉. Shared work list: hacking amorphous data parallelism in UPC. 2012 International Workshop on Programming Models and Applications for Multicores and Manycores (in conjunction with PPoPP2012)[J]. 2012, 第 2 作者  通讯作者  https://dlnext.acm.org/doi/abs/10.1145/2141702.2141716.
[15] Chen Li, Liu Lei, Tang Shenglin, Huang Lei, Jing Zheng, Xu Shixiong, Zhang Dingfei, Shou Baojiang, Cooper K, MellorCrummey J, Sarkar V. Unified Parallel C for GPU Clusters: Language Extensions and Compiler Implementation. LANGUAGES AND COMPILERS FOR PARALLEL COMPUTING. 2011, 第 1 作者6548: 151-+, 
[16] Han Dongni, Xu Shixiong, Chen Li, Huang Lei, IEEE. PADS: A Pattern-Driven Stencil Compiler-Based Tool for Reuse of Optimizations on GPGPUs. 2011 IEEE 17TH INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS)[J]. 2011, 第 3 作者  通讯作者  308-315, 
[17] 徐世雄, 韩冬妮, 陈莉. Computation Pattern Driven Reuse of Mannul Optimizations for GPGPUs. 12THINTERNATIONALCONFERENCEONPARALLELANDDISTRIBUTEDCOMPUTINGAPPLICATIONSANDTECHNOLOGIES[J]. 2011, 第 3 作者  通讯作者  https://dl.acm.org/doi/10.1109/PDCAT.2011.30.
[18] 米伟, 李玉祥, 陈莉, 冯晓兵, 张兆庆. 带类型恢复的编译器源源翻译技术. 计算机研究与发展[J]. 2010, 第 3 作者1145-1155, http://lib.cqvip.com/Qikan/Article/Detail?id=34504080.
[19] 李玉祥, 施慧, 陈莉. 面向非多媒体程序的SIMD向量化算法的研究及改进. 小型微型计算机系统[J]. 2009, 第 3 作者1927-1935, http://lib.cqvip.com/Qikan/Article/Detail?id=31680206.
[20] 卢兴敬, 商磊, 陈莉. POM:一个MPI程序的进程优化映射工具. 计算机工程与科学[J]. 2009, 第 3 作者31(A01): 201-205, http://lib.cqvip.com/Qikan/Article/Detail?id=32021597.
[21] Mi, Wei, Feng, XiaoBing, Jia, YaoCang, Chen, Li, Xue, JingLing. PARBLO: Page-Allocation-Based DRAM Row Buffer Locality Optimization. JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY[J]. 2009, 第 4 作者24(6): 1086-1097, http://lib.cqvip.com/Qikan/Article/Detail?id=32022580.
[22] 李玉祥, 施慧, 陈莉. 面向向量化的局部数据重组. 小型微型计算机系统[J]. 2009, 第 3 作者1528-1534, http://lib.cqvip.com/Qikan/Article/Detail?id=31169422.
[23] 刘雷, 陈莉, 冯晓兵. Global loop tiling for distributed memory systems. Euro-Par[J]. 2008, 第 2 作者
[24] Liu Lei, Chen Li, Wu Cheng Yong, Feng Xiaobing, Luque E, Margalef T, Benitez D. Global tiling for communication minimal parallelization on distributed memory systems. EURO-PAR 2008 PARALLEL PROCESSING, PROCEEDINGS. 2008, 第 2 作者5168: 382-391, 
[25] 刘雷, 张定飞, 李恒杰, 陈莉. Automatic Implementation of Multi-partitioning Using Global Tiling. 14th IEEE International Conference on Parallel and Distributed Systems[J]. 2008, 第 4 作者
[26] 王轶然, 陈莉, 冯晓兵. 全局部分重复计算划分. 计算机研究与发展[J]. 2006, 第 2 作者2158-2165, 
[27] Feng, XB, Chen, L, Wang, YR, An, XM, Ma, L, Sang, CL, Zhang, ZQ. Integrating parallelizing compilation technologies for SMP clusters. JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY[J]. 2005, 20(1): 125-133, http://lib.cqvip.com/Qikan/Article/Detail?id=11714278.
[28] 马琳, 陈莉, 冯晓兵. 基于动态profiling技术的流水粒度调优. 计算机研究与发展[J]. 2005, 第 2 作者42(6): 1065-1072, http://lib.cqvip.com/Qikan/Article/Detail?id=15707303.
[29] 王轶然, 陈莉, 张兆庆. Global Partial Replicate Computation Partitioning. International Conference on Parallel Processing[J]. 2004, 第 2 作者https://ieeexplore.ieee.org/document/1327910/authors#authors.
[30] 陈莉, 张兆庆, 冯晓兵. 分布存储系统中优化通信的冗余计算分割. 计算机学报[J]. 2003, 第 1 作者26(2): 180-187, http://lib.cqvip.com/Qikan/Article/Detail?id=7412034.
[31] 陈莉, 张兆庆, 冯晓兵. 分布内存系统中节点间软流水优化技术. 计算机科学[J]. 2002, 第 1 作者29(11): 24-28, http://lib.cqvip.com/Qikan/Article/Detail?id=7768436.

科研活动

   
科研项目
( 1 ) 面向多核/众核处理器的并行程序编程技术、框架和语言支持之计算所课题, 主持, 国家级, 2012-01--2015-12
( 2 ) 面向气候和湍流模拟的百万量级异构众核可扩展并行算法与优化方法, 参与, 国家级, 2015-01--2019-12
( 3 ) 面向E量级系统的并行算法与应用支撑技术, 主持, 国家级, 2016-07--2018-06
( 4 ) 华为A类异构并行框架技术研究项目的支持跨平台编译优化系统, 主持, 研究所(学校), 2018-03--2019-03
( 5 ) 新型高效能计算、编程和运行模型的面向E级计算机的跨平台统一编程模型研究, 参与, 国家级, 2017-06--2020-12
( 6 ) 地球系统模式的改进、应用开发和高性能计算的课题三“可扩展百万核并行共性算法与性能优化关键技术研发”, 参与, 国家级, 2016-07--2021-06
( 7 ) DPU众核处理器的编程和编译环境研究, 主持, 市地级, 2018-07--2020-06
( 8 ) Dataflow based Task-level parallel optimization Framework技术合作项目, 主持, 院级, 2020-04--2021-04
参与会议
(1)Exploiting the potential of multicore computers through high level language abstractions   中丹多核计算研讨会   陈莉   2013-04-11
(2)Exploiting the potential of HPP architectures through high level language abstractions   第二届RIKEN AICS国际会议——艾级计算的计算机和计算科学   陈莉   2012-03-01
(3)Unified Parallel C for GPU Clusters: Language Extensions and Compiler Implementation   第23届并行计算的语言和编译技术研讨会   Li Chen   2010-10-07

合作情况

   
项目协作单位

1.Intel Corp., Scalable Execution Environment of Heterogeneous Multi-/Many-core(多核/众核的异构平台上的可扩展执行环境)
2.University of Houston, on "Data oriented extensions to shared memory programming model for hetergeneous Many-core systems (异构平台上以数据为中心的多线程编程模型扩展)."

指导学生

已指导学生

李鹏程  02  19260  

王毅  02  19260  

刘栋  02  19260  

荆峥  02  19260  

柯传乐  02  19260  

徐世雄  02  19260  

吴正  02  19260  

寿宝江  02  19260  

侯雄辉  02  19260  

姜鹏  02  19260  

章郁涛  02  19260  

任晟民  02  19260  

现指导学生

郭磊  02  63236  

刘艳娜  02  63236  

张贝贝   02  63236