基本信息
孙毓忠  男  博导  中国科学院计算技术研究所
电子邮件: yuzhongsun@ict.ac.cn
通信地址: 北京海淀区科学院南路6号
邮政编码: 100190

研究领域

大数据计算,智能计算,可信计算

招生信息

课题组长期从事分布式计算(如云计算等)系统软件方面的研究,围绕大模型训练与推理中模型优化、计算效率、能耗效率、吞吐率、任务运行时间等性能指标展开性能与资源监控技术、资源/任务调度技术、计算模型/模式、虚拟化技术等多方面的研究,开发了Rainbow系列云操作系统,与华为、阿里等大厂有相应的项目合作。课题组发表了CCF A类等50+论文和80+专利,单篇最高它引240+(谷歌学术)。课题组承担了10+项科技部、国自然等科研课题。研究成果获得了国家科技进步二等奖1项和上海市科技进步一等奖1项。培养了多名博士生和硕士生,其中有成功创业者、有入大厂者、有入高校/科研院所者。课题组学习氛围宽松,鼓励并尊重学生研究兴趣,课题组同学间团结互助。发表论文见:https://dblp.uni-trier.de/pid/22/5402.html。

招生专业
081202-计算机软件与理论
081201-计算机系统结构
招生方向
分布式系统软件,云计算,智能计算

教育背景

1994-09--1997-07   中国科学院计算技术研究所(祝明发研究员和魏道政研究员),计算机应用专业   计算机应用专业博士学位
1991-09--1994-07   东北大学,计算机系计算机应用专业   计算机应用硕士学位
1987-09--1991-07   西安交通大学   工程学士学位
学历
中科院计算所 19940901--19970701 研究生毕业
学位
中科院计算所 19940901--19970701 工学博士学位

工作经历

University of Hong Kong, University of New Mexico, and 中国科学院计算技术研究所 计算机体系结构国家重点实验室


工作简历
2008-07~现在, 中国科学院计算技术研究所,中国科学院计算机系统结构重点实验室, 研究员
2003-10~2008-06,中国科学院计算技术研究所,国家智能计算研究开发中心, 研究员
2002-07~2003-06,美国加州硅谷Yosemite Technologies公司, 软件工程师
2001-08~2002-06,美国加州硅谷Streaming 21 公司, 高级软件工程师
2000-11~2001-05,美国新墨西哥州ALBERQUERQUE市,Mxtek Network 公司, 高级软件工程师
1999-11~2000-11,美国新墨西哥大学, 博士后
1997-09~1999-10,香港大学(Prof. Paul Cheung),电气电子工程系, 博士后
社会兼职
2010-08-01-今,西安交通大学, 客座教授
2009-08-01-今,中国计算机协会系统软件专业委员会, 委员
2009-08-01-今,中国计算机协会高性能计算专业委员会, 委员
2008-08-01-今,中国计算机协会体系结构专业委员会, 委员

专利与奖励

1、国家科技进步二等奖,网络交易支付系统风险防控关键技术及其应用

2、上海市科技进步一等奖,互联网支付体系风险防控的行为分析技术及应用

3、申请专利80+项,其中成功转化给企业的专利10+项。

奖励信息
(1) 网络交易支付系统风险防控关键技术及其应用, 二等奖, 国家级, 2016
(2) 互联网支付体系风险防控的行为分析技术及应用, 一等奖, 省级, 2015
(3) 中国科学院“****”, 一等奖, 部委级, 2005
专利成果
( 1 ) GPU集群调度方法、装置, 发明专利, 2023, 第 2 作者, 专利号: 202310226362.1

( 2 ) 面向GPU 碎片资源的容器调度方法、装置, 发明专利, 2023, 第 2 作者, 专利号: 202310257459.9

( 3 ) 数据分发方法、介质及电子设备, 专利授权, 2019, 第 3 作者, 专利号: CN110086847A

( 4 ) 基于能耗优化的Docker容器部署方法及系统, 专利授权, 2019, 第 2 作者, 专利号: CN109408230A

( 5 ) 一种基于卷积神经网络的医疗分析辅助系统, 发明专利, 2019, 第 2 作者, 专利号: CN109192299A

( 6 ) 一种基于症状向量的医学数据处理方法和系统, 专利授权, 2018, 第 4 作者, 专利号: CN108764280A

( 7 ) 一种基于机器学习的服务器能耗预测方法和系统, 专利授权, 2018, 第 2 作者, 专利号: CN108595301A

( 8 ) 一种基于迁移学习的医学数据处理和系统, 专利授权, 2018, 第 4 作者, 专利号: CN108520780A

( 9 ) 一种虚拟化技术的自动决策方法及系统, 专利授权, 2018, 第 3 作者, 专利号: CN108255731A

( 10 ) 基于神经网络和远程监督的医学知识图谱构建方法和系统, 发明专利, 2019, 第 4 作者, 专利号: CN110019839A

( 11 ) 基于分级复用的日志数据流的查询共享方法和系统, 专利授权, 2017, 第 2 作者, 专利号: CN107193898A

( 12 ) 一种适用于多标签分类的ML‑kNN改进方法和系统, 发明专利, 2017, 第 3 作者, 专利号: CN107133293A

( 13 ) 一种高安全docker容器批量部署方法及装置, 专利授权, 2017, 第 3 作者, 专利号: CN107203394A

( 14 ) 一种基于异构集成模型的疾病预测方法及系统, 发明专利, 2017, 第 3 作者, 专利号: CN107180155A

( 15 ) 一种基于异构集成模型的疾病预测系统, 专利授权, 2019, 第 3 作者, 专利号: CN107180155B

( 16 ) 一种面向分布式文件系统的文件预取/缓存方法及装置, 专利授权, 2017, 第 4 作者, 专利号: CN106446079A

( 17 ) 一种基于智能推理的辅助疾病诊断的系统, 发明专利, 2019, 第 4 作者, 专利号: CN106295186B

( 18 ) 面向智能临床辅助决策支持系统的知识库构建方法与系统, 发明专利, 2017, 第 4 作者, 专利号: CN106295187A

( 19 ) 一种基于智能推理的辅助疾病诊断的方法与系统, 发明专利, 2017, 第 4 作者, 专利号: CN106295186A

( 20 ) 一种针对小文件合并的批量删除/查询方法与装置, 专利授权, 2016, 第 2 作者, 专利号: CN105912675A

( 21 ) 基于分布式文件系统小文件合并的并行追加方法及系统, 专利授权, 2016, 第 2 作者, 专利号: CN105868286A

( 22 ) 一种分布式实时全文检索方法及系统, 发明专利, 2016, 第 2 作者, 专利号: CN105740472A

( 23 ) 基于第三方支付平台的用户隐私保护方法及系统, 发明专利, 2016, 第 2 作者, 专利号: CN105812467A

( 24 ) 面向大数据平台基于内存数据局部性的调度方法及系统, 发明专利, 2016, 第 2 作者, 专利号: CN105740068A

( 25 ) 一种大数据平台下数据库与缓存的数据一致性方法及系统, 发明专利, 2016, 第 2 作者, 专利号: CN105740383A

( 26 ) 一种独立于数据库的sql语句合并方法及系统, 发明专利, 2016, 第 3 作者, 专利号: CN105740344A

( 27 ) 一种提取底层系统行为特征的操作系统监控方法及装置, 发明专利, 2015, 第 2 作者, 专利号: CN105095047A

( 28 ) 交易系统构建方法、交易流程控制装置及第三方交易平台, 专利授权, 2015, 第 2 作者, 专利号: CN105184575A

( 29 ) 一种防止跨站请求伪造攻击的方法及系统, 发明专利, 2015, 第 2 作者, 专利号: CN105100084A

( 30 ) 一种基于装箱模型的集群资源调度方法及装置, 发明专利, 2015, 第 4 作者, 专利号: CN104881322A

( 31 ) 一种基于第三方支付网上购物的智能物流方法及系统, 专利授权, 2015, 第 3 作者, 专利号: CN104766196A

( 32 ) 一种基于深度学习的程序执行路径的监控方法及系统, 发明专利, 2015, 第 2 作者, 专利号: CN104715190A

( 33 ) 一种环境数据多点实时采集系统, 发明专利, 2015, 第 4 作者, 专利号: CN104267707A

( 34 ) 一种结合温度感知的计算机节能方法及系统, 发明专利, 2014, 第 2 作者, 专利号: CN104049716A

( 35 ) 一种计算与制冷能耗权衡的虚拟机迁移方法及系统, 发明专利, 2014, 第 5 作者, 专利号: CN104035542A

( 36 ) 一种低开销的高效内存去冗余方法及系统, 发明专利, 2014, 第 3 作者, 专利号: CN104035822A

( 37 ) 一种保护买家隐私的网上购物的方法及系统, 发明专利, 2014, 第 3 作者, 专利号: CN104021492A

( 38 ) 一种Cookie本地存储与使用方法, 发明专利, 2014, 第 2 作者, 专利号: CN103971059A

( 39 ) 一种基于内存压缩和CPU动态调频的节能方法及系统, 发明专利, 2014, 第 3 作者, 专利号: CN103970256A

( 40 ) 一种检测C代码空指针引用的方法及系统, 发明专利, 2014, 第 1 作者, 专利号: CN103955426A

( 41 ) 一种虚拟化环境中共存应用I/O性能干扰的分析方法及其系统, 发明专利, 2014, 第 3 作者, 专利号: CN103955422A

( 42 ) 一种基于加密的跨站请求攻击防范方法及其装置, 发明专利, 2014, 第 3 作者, 专利号: CN103944900A

( 43 ) 一种基于纠删码技术改进的云存储系统及实现方法, 发明专利, 2014, 第 2 作者, 专利号: CN103944981A

( 44 ) 一种基于温度的虚拟机迁移方法及其系统, 发明专利, 2014, 第 6 作者, 专利号: CN103984588A

( 45 ) 一种云计算平台中的 I/O 请求计数系统及其方法, 发明专利, 2014, 第 2 作者, 专利号: CN103984536A

( 46 ) 一种云计算平台完整性证明方法及其系统, 发明专利, 2014, 第 2 作者, 专利号: CN103795717A

( 47 ) 一种基于集群的故障感知系统及其方法, 发明专利, 2014, 第 2 作者, 专利号: CN103746829A

( 48 ) 一种于Hadoop平台中动态调整任务数目的方法及系统, 发明专利, 2014, 第 4 作者, 专利号: CN103699433A

( 49 ) 跨数据中心集群的分布式系统监控方法及系统, 发明专利, 2014, 第 2 作者, 专利号: CN103685486A

( 50 ) 一种Linux系统下程序执行路径监测系统及其方法, 发明专利, 2014, 第 3 作者, 专利号: CN103761175A

( 51 ) 一种无误使用压缩算法的分布式监控系统及其方法, 发明专利, 2014, 第 2 作者, 专利号: CN103647657A

( 52 ) 一种虚拟化环境下的网络监控系统及其方法, 发明专利, 2014, 第 2 作者, 专利号: CN103746860A

( 53 ) 一种虚拟化环境下的磁盘访问请求监控系统及其方法, 发明专利, 2014, 第 2 作者, 专利号: CN103744765A

( 54 ) 一种虚拟化环境中的进程信息监控系统及其方法, 发明专利, 2014, 第 2 作者, 专利号: CN103744851A

( 55 ) 一种广域网虚拟平台的构建方法, 发明专利, 2014, 第 2 作者, 专利号: CN103491144A

( 56 ) 一种广域网可信虚拟机的安全迁移方法及系统, 发明专利, 2014, 第 3 作者, 专利号: CN104113574A

( 57 ) 一种虚拟机内存映射方法及系统, 发明专利, 2013, 第 3 作者, 专利号: CN103257929A

( 58 ) 一种Linux平台下的恶意代码分析方法及系统, 发明专利, 2014, 第 3 作者, 专利号: CN104102878A

( 59 ) 一种物理机资源信息的数据处理方法及系统, 发明专利, 2014, 第 2 作者, 专利号: CN104102664A

( 60 ) 一种基于数据压缩的可扩展的监控方法及系统, 发明专利, 2013, 第 2 作者, 专利号: CN103226572A

( 61 ) 虚拟化环境中应用共存分析方法及装置, 发明专利, 2014, 第 2 作者, 专利号: CN103942084A

( 62 ) 一种跨虚拟化数据中心的虚拟机在线迁移方法, 发明专利, 2013, 第 5 作者, 专利号: CN103095834A

( 63 ) 一种基于TPM的Linux内核初始化中的数据结构保护方法及系统, 发明专利, 2013, 第 5 作者, 专利号: CN103020518A

( 64 ) 虚拟机间安全通信方法, 发明专利, 2012, 第 3 作者, 专利号: CN102799491A

( 65 ) 基于TPM 的本地验证式启动方法, 发明专利, 2012, 第 3 作者, 专利号: CN102750471A

( 66 ) 全虚拟化环境下启动加载器的可信验证方法和系统, 发明专利, 2012, 第 4 作者, 专利号: CN102750470A

( 67 ) 基于TPM/VTPM的可信程序列表生成方法及系统, 发明专利, 2012, 第 3 作者, 专利号: CN102722665A

( 68 ) 一种针对硬件虚拟化的内存监控方法和系统, 发明专利, 2012, 第 4 作者, 专利号: CN102736969A

( 69 ) 虚拟桌面环境文件杀毒的方法和系统, 发明专利, 2012, 第 4 作者, 专利号: CN102708325A

( 70 ) 虚拟化环境中 PCI 设备的分离访问方法及其系统, 发明专利, 2012, 第 4 作者, 专利号: CN102426557A

( 71 ) 基于动态流水线网络服务器的分布式Cache系统及其工作方法, 发明专利, 2011, 第 4 作者, 专利号: CN102223418A

( 72 ) 创建多核处理器虚拟机系统可信环境的方法及装置, 发明专利, 2011, 第 2 作者, 专利号: CN102214277A

( 73 ) 多核处理器的计算环境中实现TMP的方法及其系统, 发明专利, 2011, 第 4 作者, 专利号: CN102110197A

( 74 ) 虚拟化计算平台中应用请求调度的方法及其系统, 发明专利, 2010, 第 4 作者, 专利号: CN101719082A

( 75 ) 面向多核平台和分布式虚拟化环境的I/O系统及工作方法, 发明专利, 2010, 第 3 作者, 专利号: CN101706757A

( 76 ) 面向多核平台和网络化操作系统的输入输出系统及方法, 发明专利, 2010, 第 3 作者, 专利号: CN101639814A

( 77 ) 基于分布式虚拟机管理器的分布式cache系统及其工作方法, 发明专利, 2009, 第 4 作者, 专利号: CN101510144A

( 78 ) 一种流水线Web服务器的系统及其工作方法, 发明专利, 2009, 第 3 作者, 专利号: CN101448027A

( 79 ) 一种在虚拟化环境中I/O设备重构的方法及系统, 发明专利, 2009, 第 3 作者, 专利号: CN101430670A

( 80 ) 一种远程桌面系统中的窗口缓存方法, 发明专利, 2008, 第 2 作者, 专利号: CN101308449A

( 81 ) 一种家庭信息化系统, 发明专利, 2007, 第 3 作者, 专利号: CN101083714A

( 82 ) 一种基于原语机制的外设网络调用方法, 发明专利, 2006, 第 4 作者, 专利号: CN1794143A

( 83 ) 面向网格计算机体系结构的外设部件系统及方法, 发明专利, 2006, 第 3 作者, 专利号: CN1777121A

( 84 ) 基于网格计算机体系的计算机外设部件连接系统及方法, 发明专利, 2006, 第 3 作者, 专利号: CN1777187A

出版信息

   
发表论文
(1) A multi-hierarchy particle swarm optimization-based algorithm for cloud workflow scheduling, Future Gener. Comput. Syst. 153: 125-138 (2024), 2024, 第 4 作者
(2) An Intelligent Secure Fault Classification and Identification Scheme for Mining Valuable Information in IIoT, IEEE Syst. J. 18(3): 1705-1716 (2024), 2024, 第 4 作者
(3) An effective trajectory planning heuristics for UAV-assisted vessel monitoring system, Peer-to-Peer Networking and Applications, 2024, 第 6 作者
(4) A multi-hierarchy particle swarm optimization-based algorithm for cloud workflow scheduling, Future Generation Computer Systems, 2023, 第 4 作者
(5) SIAP: an intelligent algorithm for multiple prescription pattern recognition based on weighted similarity distances, BMC Medical Informatics Decis. Mak. 23(1): 79 (2023), 2023, 第 5 作者
(6) Near-Linear Scaling Data Parallel Training with Overlapping-Aware Gradient Compression, 2023 IEEE 29th International Conference on Parallel and Distributed Systems (ICPADS), 2023, 第 2 作者
(7) Docker Container Networking Based Apache Storm and Flink Benchmark Test, APNOMS 2021: 49-52, 2021, 第 3 作者
(8) Analysis model for server consolidation of virtualized heterogeneous data centers providing internet services, Comput. 22(3): 911-928 (2019), 2019, 第 3 作者
(9) Trading-Off Computing and Cooling Energies by VM Migration in Data Centers, IEICE Trans. Inf. Syst. 101-D(9): 2224-2234 (2018), 2018, 第 4 作者
(10) How to Avoid Herd Behavior: A Stochastic Multi-Choice Scheduling Algorithm and Parameters Analysis in Grid Scheduling, Int. J. Inf. Technol. Decis. Mak. 14(2): 287-316 (2015), 2015, 第 4 作者
(11) A Two-Tiered On-Demand Resource Allocation Mechanism for VM-Based Data Centers, IEEE Trans. Serv. Comput. 6(1): 116-129 (2013), 2013, 第 2 作者
(12) SLA_Driven Adaptive Resource Allocation for Virtualized Servers, IEICE Trans. Inf. Syst. 95-D(12): 2833-2843 (2012), 2012, 第 9 作者
(13) Utility analysis for Internet-oriented server consolidation in VM-based data centers, CLUSTER 2009: 1-10, 2009, 第 3 作者
(14) How to avoid herd: a novel stochastic algorithm in grid scheduling, HPDC 2006: 267-278, 2006, 第 3 作者
(15) A C/S and P2P Hybrid Resource Discovery Framework in Grid Environments, ICPP 2005: 261-268, 2005, 
(16) Barrier Synchronization on Wormhole-Routed Networks, IEEE Trans. Parallel Distributed Syst. 12(6): 583-597 (2001), 2001, 第 1 作者
(17) Recursive Cube of Rings: A New Topology for Interconnection Networks, IEEE Trans. Parallel Distributed Syst. 11(3): 275-286 (2000), 2000, 第 1 作者
(18) A Hybrid Time Synchronization Implemented Through Special Ring Array for Mesh or Torus., IPPS 1997: 565-569, 1997, 第 1 作者

科研活动

1、当前在与阿里合作一个课题来研究在阿里数据中心中提高在K8S云环境中提升GPU利用率+研发更高效的分布式深度学习训练加速技术来进一步提升GPU资源利用率并减少训练时间。2、在中关村国家实验室框架下研究高通量云OS新技术,在安全增强的前提下进一步解决端边云技术效率和长执行路径所带来的不确定性等问题。3、积极与浙江大学、中科院计算所寒武纪团队、上海交通大学和阿里合作研究新一代的AI计算新框架 4、与中科院寒武纪合作研究加速深度学习训练的新技术等。

科研项目
( 1 ) RISC-V 数据中心生态迁移, 参与, 国家任务, 2023-08--2026-07
( 2 ) 众核多擎弹性加速分布式训练, 参与, 国家任务, 2023-03--2026-02
( 3 ) AI框架下GPU等资源利用率提升关键技术研究, 负责人, 境内委托项目, 2022-03--2023-03
( 4 ) 集成电路芯片项目子课题, 负责人, 研究所自主部署, 2021-01--2021-12
( 5 ) 基于天河二号的生物医学健康大数据应用支撑平台子课题, 负责人, 国家任务, 2017-01--2020-12
( 6 ) 智能化数据中心管理、编程规范与应用生态, 负责人, 国家任务, 2016-07--2020-12
( 7 ) 智能化数据中心管理、编程规范与应用生态, 负责人, 国家任务, 2016-06--2022-06
( 8 ) 可信网络交易软件系统试验环境与示范应用, 参与, 国家任务, 2013-01--2016-12
( 9 ) 云服务与管理平台核心软件及系统, 参与, 国家任务, 2013-01--2015-12
参与会议
(1)MiCA: Real-time Mixed Compression Scheme for Large-Scale Distributed Monitoring   Bo Wang, Ying Song, Yuzhong Sun and Jun Liu   2014-10-09

合作情况

   
项目协作单位

华为、阿里巴巴、同济大学、西安交通大学、清华大学、中电科集团、华中科大、上海交通大学、浙江大学等


指导学生

已指导学生

宋莹  博士研究生  081201-计算机系统结构  

李忠  硕士研究生  081201-计算机系统结构  

冯斌全  硕士研究生  081201-计算机系统结构  

张玉放  硕士研究生  081201-计算机系统结构  

王若倪  硕士研究生  081201-计算机系统结构  

张凯  硕士研究生  081280-软件工程  

魏天宇  硕士研究生  430112-计算机技术  

刘鹏鹤  硕士研究生  081201-计算机系统结构  

陈旭  硕士研究生  081201-计算机系统结构  

胡满满  硕士研究生  081201-计算机系统结构  

张浩  硕士研究生  081201-计算机系统结构  

杨凯红  硕士研究生  081201-计算机系统结构  

高碧辉  硕士研究生  085211-计算机技术  

李志轩  硕士研究生  081202-计算机软件与理论  

刘文豪  硕士研究生  085400-电子信息  

张尚宇  硕士研究生  085400-电子信息  

现指导学生

李伟民  博士研究生  081201-计算机系统结构  

孟霖  博士研究生  081202-计算机软件与理论  

沈天航  硕士研究生  081200-计算机科学与技术  

张安然  硕士研究生  085410-人工智能  

张贵鹏  博士研究生  081200-计算机科学与技术  

管孙笛  硕士研究生  081200-计算机科学与技术  

李东奇  博士研究生  081200-计算机科学与技术  

高伟  硕士研究生  085400-电子信息