基本信息
王磊 男 硕导 中国科学院计算技术研究所
电子邮件: wl@ncic.ac.cn
通信地址: 北京海淀区中关村科学院南路6号
邮政编码: 100190
电子邮件: wl@ncic.ac.cn
通信地址: 北京海淀区中关村科学院南路6号
邮政编码: 100190
招生信息
招生专业
081203-计算机应用技术
招生方向
数据中心计算
教育背景
2012-09--2016-07 中国科学院大学 计算机软件与理论博士
工作经历
工作简历
2024-03~现在, 中国科学院计算技术研究所分布式系统研究中心, 高级工程师2012-09~2016-07,中国科学院大学, 计算机软件与理论博士2011-09~2024-03,中国科学院计算技术研究所先进计算机系统研究中心, 高级工程师2004-06~2011-09,中国科学院计算技术研究所高性能计算机研究中心, 助理研究员1999-07~2004-06,中国科学院计算技术研究所高性能计算机研究中心, 研究实习员
社会兼职
2021-09-25-2026-09-26,中国计量学会计算基准专业委员会, 副秘书长
2021-07-31-2026-07-31,BenchCouncil Transactions on Benchmarks, Standards and Evaluations, Founding Editor
2021-07-31-2026-07-31,BenchCouncil Transactions on Benchmarks, Standards and Evaluations, Founding Editor
教授课程
系统性能量化分析
专利与奖励
奖励信息
(1) 计算所易方达金融科技奖教金, , 研究所(学校), 2023(2) 计算所卓越之星, 研究所(学校), 2022(3) 中国科学院杰出成就奖, 院级, 2005
专利成果
( 1 ) 系统日志分类方法, 2020, 第 5 作者, 专利号: CN108427720B( 2 ) 一种异常节点的检测方法及装置, 2020, 第 2 作者, 专利号: CN108228442B( 3 ) 一种检测spark集群节点状态的方法, 2020, 第 4 作者, 专利号: CN108491302B( 4 ) 一种通过加权熵判断分布式集群可靠度的方法和系统, 2019, 第 3 作者, 专利号: CN107590008B( 5 ) 用于测试的大规模数据生成方法和装置, 2019, 第 2 作者, 专利号: CN104636404B( 6 ) 进程迁移方法和可迁移操作系统, 2018, 第 1 作者, 专利号: CN104102535B( 7 ) 一种检测spark集群节点状态的方法, 2018, 第 4 作者, 专利号: CN108491302A( 8 ) 系统日志分类方法, 2018, 第 5 作者, 专利号: CN108427720A( 9 ) 多内核操作系统的失效控制方法及装置, 2018, 第 1 作者, 专利号: CN104657240B( 10 ) 一种异常节点的检测方法及装置, 2018, 第 2 作者, 专利号: CN108228442A( 11 ) 基于MapReduce模型的数据排序方法和系统, 2018, 第 3 作者, 专利号: CN104346380B( 12 ) 一种通过加权熵判断分布式集群可靠度的方法和系统, 2018, 第 3 作者, 专利号: CN107590008A( 13 ) 搜索请求生成方法和系统, 2017, 第 2 作者, 专利号: CN104239019B( 14 ) 一种产生数据的方法和装置, 2017, 第 2 作者, 专利号: CN103970738B( 15 ) 一种多节点应用的异常检测方法及相关装置, 2017, 第 3 作者, 专利号: CN103888304B( 16 ) 多内核操作系统实现方法和实现装置及系统, 2017, 第 1 作者, 专利号: CN104077266B( 17 ) 一种基于Web页面的大规模数据生成方法及系统, 2017, 第 3 作者, 专利号: CN103678495B( 18 ) 数据中心数据分析类基准测试程序的应用选取方法及系统, 2016, 第 4 作者, 专利号: CN103257923B( 19 ) 一种处理能力评估方法及装置, 2016, 第 3 作者, 专利号: CN106155822A( 20 ) 一种分布式负载发生器的实现方法及其系统, 2016, 第 3 作者, 专利号: CN103414649B( 21 ) 多内核操作系统的失效控制方法及装置, 2015, 第 1 作者, 专利号: CN104657240A( 22 ) 用于测试的大规模数据生成方法和装置, 2015, 第 2 作者, 专利号: CN104636404A( 23 ) 基于MapReduce模型的数据排序方法和系统, 2015, 第 3 作者, 专利号: CN104346380A( 24 ) 搜索请求生成方法和系统, 2014, 第 2 作者, 专利号: CN104239019A( 25 ) 进程迁移方法和可迁移操作系统, 2014, 第 1 作者, 专利号: CN104102535A( 26 ) 多内核操作系统实现方法和实现装置及系统, 2014, 第 1 作者, 专利号: CN104077266A( 27 ) 一种产生数据的方法和装置, 2014, 第 2 作者, 专利号: CN103970738A( 28 ) 一种多节点应用的异常检测方法及相关装置, 2014, 第 3 作者, 专利号: CN103888304A( 29 ) 一种基于Web页面的大规模数据生成方法及系统, 2014, 第 3 作者, 专利号: CN103678495A( 30 ) 一种分布式负载发生器的实现方法及其系统, 2013, 第 3 作者, 专利号: CN103414649A( 31 ) 数据中心数据分析类基准测试程序的应用选取方法及系统, 2013, 第 4 作者, 专利号: CN103257923A( 32 ) 一种机群应用管理系统及其应用管理方法, 2013, 第 3 作者, 专利号: CN101968747B( 33 ) 一种移动HPC系统及其实现方法, 2013, 第 2 作者, 专利号: CN102096655B( 34 ) 在线日志分析方法, 2012, 第 3 作者, 专利号: CN101888309B( 35 ) HPC系统以及基于HPC系统的动态分派任务的方法, 2011, 第 2 作者, 专利号: CN102103521A( 36 ) 一种移动HPC系统及其实现方法, 2011, 第 2 作者, 专利号: CN102096655A( 37 ) 一种机群应用管理系统及其应用管理方法, 2011, 第 3 作者, 专利号: CN101968747A( 38 ) 在线日志分析方法, 2010, 第 3 作者, 专利号: CN101888309A( 39 ) 一种效用计算的机群系统及其运行时环境管理方法, 2010, 第 1 作者, 专利号: CN101315618B( 40 ) 一种构造大规模高可用机群操作系统的方法, 2008, 第 2 作者, 专利号: CN100429629C
出版信息
发表论文
(1) A Linear Combination-Based Method to Construct Proxy Benchmarks for Big Data Workloads, International Symposium on Benchmarking, Measuring and Optimization, 2023, 第 2 作者(2) MetaverseBench: Instantiating and benchmarking metaverse challenges, BenchCouncil Transactions on Benchmarks, Standards and Evaluations, 2023, 第 2 作者(3) CMLCompiler: A Unified Compiler for Classical Machine Learning, Proceedings of the 37th International Conference on Supercomputing, 2023, 第 4 作者(4) Olxpbench: Real-time, semantically consistent, and domain-specific are essential in benchmarking, designing, and implementing htap systems, 2022 IEEE 38th International Conference on Data Engineering (ICDE), 2022, 第 2 作者(5) High fusion computers: The IoTs, edges, data centers, and humans-in-the-loop as a computer, BenchCouncil Transactions on Benchmarks, Standards and Evaluations, 2022, 第 2 作者(6) Aibench scenario: Scenario-distilling ai benchmarking, 2021 30th International Conference on Parallel Architectures and Compilation Techniques (PACT), 2021, 第 5 作者(7) Hpc ai500 v2. 0: The methodology, tools, and metrics for benchmarking hpc ai systems, 2021 IEEE International Conference on Cluster Computing (CLUSTER), 2021, 第 4 作者(8) WPC: Whole-Picture Workload Characterization Across Intermediate Representation, ISA, and Microarchitecture, IEEE COMPUTER ARCHITECTURE LETTERS, 2021, 第 1 作者(9) BOPS, a new computation-centric metric for datacenter computing, International Symposium on Benchmarking, Measuring and Optimization, 2020, 第 1 作者(10) HybridTune: Spatio-Temporal Performance Data Correlation for Performance Diagnosis of Big Data Systems, HybridTune: Spatio-Temporal Performance Data Correlation for Performance Diagnosis of Big Data Systems, JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, 2019, 第 3 作者(11) Understanding Processors Design Decisions for Data Analytics in Homogeneous Data Centers, IEEE TRANSACTIONS ON BIG DATA, 2019, 第 7 作者(12) Landscape of Big Medical Data: A Pragmatic Survey on Prioritized Tasks, IEEE ACCESS, 2019, 第 15 作者(13) Deep Convolutional Neural Networks for Log Event Classification on Distributed Cluster Systems, 2018 IEEE INTERNATIONAL CONFERENCE ON BIG DATA (BIG DATA), 2018, 第 5 作者(14) Data Motifs: A Lens Towards Fully Understanding Big Data and AI Workloads, 27TH INTERNATIONAL CONFERENCE ON PARALLEL ARCHITECTURES AND COMPILATION TECHNIQUES (PACT 2018), 2018, 第 3 作者(15) XOS: An Application-Defined Operating System for Datacenter Computing, 2018 IEEE INTERNATIONAL CONFERENCE ON BIG DATA (BIG DATA), 2018, 第 2 作者(16) Data Motif-based Proxy Benchmarks for Big Data and AI Workloads, 2018 IEEE INTERNATIONAL SYMPOSIUM ON WORKLOAD CHARACTERIZATION (IISWC), 2018, 第 3 作者(17) Online Anomaly Detection Framework for Spark Systems via Stage-Task Behavior Modeling, 2018 ACM INTERNATIONAL CONFERENCE ON COMPUTING FRONTIERS, 2018, 第 3 作者(18) Towards Memory and Computation Efficient Graph Processing on Spark, 2017 IEEE INTERNATIONAL CONFERENCE ON BIG DATA (BIG DATA), 2017, 第 4 作者(19) Understanding Big Data Analytics Workloads on Modern Processors, IEEE TRANSACTIONS ON PARALLEL AND DISTRIBUTED SYSTEMS, 2017, 第 3 作者(20) BDTune: Hierarchical Correlation-based Performance Analysis and Rule-based Diagnosis for Big Data Systems, 2016IEEEINTERNATIONALCONFERENCEONBIGDATABIGDATA, 2016, 第 3 作者(21) Understanding Data Analytics Workloads on Intel (R) Xeon Phi (TM), PROCEEDINGS OF 2016 IEEE 18TH INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE COMPUTING AND COMMUNICATIONS; IEEE 14TH INTERNATIONAL CONFERENCE ON SMART CITY; IEEE 2ND INTERNATIONAL CONFERENCE ON DATA SCIENCE AND SYSTEMS (HPCC/SMARTCITY/DSS), 2016, 第 6 作者(22) BigDataBench:开源的大数据系统评测基准, BigDataBench: An Open-source Big Data Benchmark Suite, 计算机学报, 2016, 第 3 作者(23) The Implications of Diverse Applications and Scalable Data Sets in Benchmarking Big Data Systems, SPECIFYING BIG DATA BENCHMARKS, 2014, 第 4 作者(24) BigOP: Generating Comprehensive Big Data Workloads as a Benchmarking Framework, DATABASE SYSTEMS FOR ADVANCED APPLICATIONS, DASFAA 2014, PT II, 2014, 第 7 作者(25) BigDataBench: a Big Data Benchmark Suite from Internet Services, 2014 20TH IEEE INTERNATIONAL SYMPOSIUM ON HIGH PERFORMANCE COMPUTER ARCHITECTURE (HPCA-20), 2014, 第 1 作者(26) Cost-Aware Cooperative Resource Provisioning for Heterogeneous Workloads in Data Centers, IEEE TRANSACTIONS ON COMPUTERS, 2013, 第 2 作者(27) Characterizing Data Analysis Workloads in Data Centers, 2013IEEEINTERNATIONALSYMPOSIUMONWORKLOADCHARACTERIZATIONIISWC2013, 2013, 第 2 作者(28) High Volume Throughput Computing: Identifying and Characterizing Throughput Oriented Workloads in Data Centers, 2012 IEEE 26TH INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM WORKSHOPS & PHD FORUM (IPDPSW), 2012, 第 4 作者(29) CloudRank-D: benchmarking and ranking cloud computing systems for data processing applications, CloudRank-D: benchmarking and ranking cloud computing systems for data processing applications, 中国计算机科学前沿:英文版, 2012, 第 4 作者(30) Precise, Scalable, and Online Request Tracing for Multitier Services of Black Boxes, IEEE TRANSACTIONS ON PARALLEL AND DISTRIBUTED SYSTEMS, 2012, 第 6 作者(31) CloudRank-D: benchmarking and ranking cloud computing systems for data processing applications, CloudRank-D: benchmarking and ranking cloud computing systems for data processing applications, FRONTIERS OF COMPUTER SCIENCE, 2012, 第 4 作者(32) 海云计算实验系统研究, 网络新媒体技术, 2012, 第 3 作者(33) In Cloud, Can Scientific Communities Benefit from the Economies of Scale?, IEEE TRANSACTIONS ON PARALLEL AND DISTRIBUTED SYSTEMS, 2012, 第 1 作者(34) Scalable group management in large-scale virtualized clusters, Scalable group management in large-scale virtualized clusters, 高技术通讯英文版, 2011, 第 2 作者(35) Characterization of Real Workloads of Web Search Engines, 2011 IEEE INTERNATIONAL SYMPOSIUM ON WORKLOAD CHARACTERIZATION (IISWC), 2011, 第 5 作者(36) Automatic performance debugging of SPMD-style parallel programs, JOURNAL OF PARALLEL AND DISTRIBUTED COMPUTING, 2011, 第 7 作者(37) 基于共享内存的机群服务检查点机制研究, Research on the Shared Memory-Based Checkpointing for Cluster Services, 计算机研究与发展, 2010, 第 2 作者(38) Precise Request Tracing and Performance Debugging for Multi-tier Services of Black Boxes, 2009 IEEE/IFIP INTERNATIONAL CONFERENCE ON DEPENDABLE SYSTEMS & NETWORKS (DSN 2009), 2009, 第 4 作者(39) 一种适应行业信息系统的通用管理框架, Unified Management Framework for Industrial Information System, 计算机应用研究, 2007, 第 4 作者(40) Design patterns of scalable cluster system software, SEVENTH INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED COMPUTING, APPLICATIONS AND TECHNOLOGIES, PROCEEDINGS, 2006, 第 4 作者(41) A failure-aware scheduling strategy in large-scale cluster system, SIXTH IEEE INTERNATIONAL SYMPOSIUM ON CLUSTER COMPUTING AND THE GRID, 2006, 第 4 作者(42) LUNF——基于节点失效特征的机群作业调度策略, LUNF-A Cluster Job Scheduling Strategy Using Characterization of Nodes' Failure, 计算机研究与发展, 2005, 第 5 作者(43) 一体化机群操作系统Phoenix, Fully Integrated Cluster Operating System: Phoenix, 计算机研究与发展, 2005, 第 3 作者(44) 高可用机群系统辅助测试工具:HABench, Assistant Testing Tools of High-Availability Clusters: HABench, 计算机工程与应用, 2005, 第 2 作者(45) 基于Domino邮件服务器的性能建模, A Performance Model for Domino Mail Server, 计算机科学, 2005, 第 1 作者(46) 机群系统的智能配置管理, An Intelligent Configuration Information Management Svstem for Clusters, 计算机工程与应用, 2004, 第 3 作者(47) 基于服务的机群中间件, Service-Oriented Cluster Software Middleware, 微电子学与计算机, 2004, 第 2 作者(48) Characterization and Architectural Implications of Big Data Workloads, 第 1 作者(49)
科研活动
科研项目
( 1 ) 典型业务场景驱动的CPU基准构造方法与实现, 负责人, 境内委托项目, 2022-12--2023-12( 2 ) RISC-V跨层优化方法及框架课题, 负责人, 中国科学院计划, 2022-11--2025-12( 3 ) 服务器新型应用能效基准技术合作, 负责人, 境内委托项目, 2021-08--2022-07( 4 ) 服务器能效基准技术合作, 负责人, 境内委托项目, 2020-08--2021-08( 5 ) 软件定义标签化体系结构原理与方法, 参与, 国家任务, 2016-06--2021-06( 6 ) 软件定义的云计算基础理论与方法, 参与, 国家任务, 2016-01--2021-12( 7 ) 基于内存计算的实时大数据关键技术和系统, 参与, 国家任务, 2015-05--2017-05( 8 ) 高通量服务器基准测试程序, 参与, 其他国际合作项目, 2012-04--2014-09