基本信息

崔慧敏  女  研究员 博导  中国科学院计算技术研究所
电子邮件: cuihm@ict.ac.cn
通信地址: 北京市海淀区科学院南路6号
邮政编码: 100190

研究领域

崔慧敏研究员关注异构环境下的编程和编译方向,具体的研究领域包括:异构编程模型,异构编译优化,数据中心编程与编译技术等。

在异构编程方面,她关注于领域专用的编程与编译优化技术,包括面向AI领域、通信领域的编译优化,旨在解决异构为程序员带来的编程困扰,并充份发挥领域专用芯片的处理潜力。在数据中心编程与编译技术方面,她关注于解决混合负载场景下的编译优化策略,旨在解决数据中心深度软件栈环境下各层次间的协同优化。

招生信息

   
招生专业
081201-计算机系统结构
招生方向
并行编程,并行编译,异构编译

教育背景

2006-09--2011-09   中国科学院计算技术研究所   博士
2001-09--2004-02   清华大学   硕士
1997-09--2001-07   清华大学   学士

工作经历

工作简历
2019-10~现在, 中科院计算所, 研究员
2012-10~2019-10,中国科学院计算技术研究所, 副研究员
2011-09~2012-10,中国科学院计算技术研究所, 助理研究员

教授课程

编译原理(研讨课)

出版信息

   
发表论文
(1) DNNTune: Automatic Benchmarking DNN Models for Mobile-cloud Computing, TACO, 2020, 第 3 作者
(2) Referee: A Pattern-Guided Approach for Auto Design in Compiler-Based Analyzers, SANER, 2020, 第 5 作者
(3) Panthera: Holistic Memory Management for Big Data Processing over Hybrid Memories, PLDI, 2019, 第 2 作者
(4) PPOpenCL: a performance-portable OpenCL compiler with host and kernel thread code fusion, CC, 2019, 第 4 作者
(5) NVM Streaker: a fast and reconfigurable performance simulator for non-volatile memory-based memory architecture, Journal of Supercomputing, 2018, 第 4 作者
(6) Revisiting Loop Tiling for Datacenters: Live and Let Live, ICS, 2018, 通讯作者
(7) On Retargetting the AI Programming Framework to New Hardwares, NPC, 2018, 第 5 作者
(8) Lazygraph: lazy data coherency for replicas in distributed graph-parallel computation., PPoPP, 2018, 第 4 作者
(9) Revisiting Loop Tiling for Datacenters: Live and Let Live, ICS, 2018, 第 2 作者
(10) Parallel Incremental Frequent Itemset Mining for Large Data, journal of computer science and technology, 2017, 通讯作者
(11) A Collaborative Divide-and-Conquer K-Means Clustering Algorithm for Processing Large Data. , CF, 2014, 第 1 作者
(12) An Empirical Model for Predicting Cross-Core Performance Interference on Multicore Processors. , PACT, 2013, 通讯作者
(13) Layout-oblivious compiler optimization for matrix computations, ACM Transaction on Architecture and Code Optimization, 2013, 第 1 作者
(14) A Hybrid Circular Queue Method for Iterative Stencil Computations on GPUs,  J. Comput. Sci. Technol, 2012, 第 2 作者
(15) Extendable pattern-oriented optimization directives, ACM Transaction on Architecture and Code Optimization, 2012, 第 1 作者
(16) Layout-oblivious optimization for matrix computations, PACT, 2012, 第 1 作者
(17) A Highly Parallel Reuse Distance Analysis Algorithm on GPUs, IPDPS, 2012, 第 1 作者
(18) Extendable pattern-oriented optimization directives, CGO, 2011, 第 1 作者
(19) Automatic Library Generation for BLAS3 on GPUs, IPDPS, 2011, 第 1 作者
(20) Landing Stencil Code on Godson-T, J. Comput. Sci. Technol., 2010, 第 1 作者
(21) An adaptive task creation strategy for work-stealing scheduling, CGO, 2010, 第 2 作者