基本信息
安学军 男 博导 中国科学院计算技术研究所
电子邮件: axj@ict.ac.cn
通信地址: 北京海淀区科学院南路6号
邮政编码: 100190
电子邮件: axj@ict.ac.cn
通信地址: 北京海淀区科学院南路6号
邮政编码: 100190
招生信息
招生专业
081201-计算机系统结构
招生方向
图计算系统云计算系统安全
教育背景
2000-09--2003-07 中国科学院研究生院(计算技术研究所) 博士研究生,获博士学位1992-09--1995-07 内蒙古大学电子工程系 硕士研究生,获硕士学位
工作经历
工作简历
2017-01~现在, 中科院计算所高通量计算机研究中心, 正研级高级工程师2011-11~2016-12,中科院计算所高性能中心, 正研级高级工程师2005-11~2011-10,中科院计算所高性能中心, 高级工程师2003-08~2005-10,中国科学院计算技术研究所高性能中心, 助理研究员2000-09~2003-07,中国科学院研究生院(计算技术研究所), 博士研究生,获博士学位1995-08~2000-08,内蒙古大学电子工程系, 讲师1992-09~1995-07,内蒙古大学电子工程系, 硕士研究生,获硕士学位1985-09~1992-08,内蒙古大学电子工程系, 实验员、助理实验师
教授课程
计算机体系结构数字电路数字电路 实验课
专利与奖励
奖励信息
(1) 北纬奖教金, 研究所(学校), 2019(2) 一种多处理器系统及其同步引擎(第20届中国专利金奖), , 国家级, 2018(3) 曙光高效能计算机系统关键技术及应用, 二等奖, 国家级, 2013(4) 曙光4000系列高性能计算机系统, 二等奖, 国家级, 2006(5) 曙光4000系列高性能计算机系统, , 院级, 2005
专利成果
( 1 ) 一种支持远程数据直接访问协议的网络接口, 2023, 第 8 作者, 专利号: CN116722884A( 2 ) 基于数据流结构的低精度神经网络计算装置及加速方法, 2023, 第 5 作者, 专利号: CN113298236B( 3 ) 一种应用于处理器的分支预测方法以及分支预测器, 2023, 第 5 作者, 专利号: CN115686639A( 4 ) 一种基于多模式的SIMD应用高效执行方法及系统, 2022, 第 4 作者, 专利号: CN115390923A( 5 ) 数据发送、重传控制方法及系统、存储介质及电子设备, 2022, 第 5 作者, 专利号: CN113572582B( 6 ) 数据流架构优化方法、装置、电子设备, 2022, 第 4 作者, 专利号: CN115202666A( 7 ) 一种片上带宽动态分配方法及系统, 2022, 第 5 作者, 专利号: CN112311695B( 8 ) 一种面向单源最短路径的并行图遍历方法, 2022, 第 4 作者, 专利号: CN115049103A( 9 ) 一种远程内存访问的系统及方法, 2022, 第 5 作者, 专利号: CN115017089A( 10 ) 一种数据的传输方法及系统, 2022, 第 5 作者, 专利号: CN114928573A( 11 ) 一种远程内存访问的系统及方法, 2022, 第 5 作者, 专利号: 202210617225.6( 12 ) 一种数据的传输方法及系统, 2022, 第 5 作者, 专利号: 202210558480.8( 13 ) 一种数据处理单元中控制信息管理系统, 2022, 第 7 作者, 专利号: CN114297132A( 14 ) 一种卷积神经网络的加速方法及装置, 2022, 第 4 作者, 专利号: CN113919477A( 15 ) 数据发送、重传控制方法及系统、存储介质及电子设备, 2021, 第 5 作者, 专利号: CN113572582A( 16 ) 一种ECDSA算法执行系统及方法, 2021, 第 5 作者, 专利号: CN113505383A( 17 ) 一种ECDSA算法执行系统及方法, 2021, 第 5 作者, 专利号: CN113505383A( 18 ) 一种面向链路资源的自适应互连与路由控制方法和系统, 2021, 第 7 作者, 专利号: CN109842553B( 19 ) 一种面向宽度优先搜索算法的加速装置、方法及存储介质, 2021, 第 3 作者, 专利号: CN109992413B( 20 ) 基于数据流结构的低精度神经网络计算装置及加速方法, 2021, 第 5 作者, 专利号: CN113298236A( 21 ) 基于数据流结构的低精度神经网络计算装置及加速方法, 2021, 第 5 作者, 专利号: CN113298236A( 22 ) 一种RDMA通信加速集合通信的方法及系统, 2021, 第 6 作者, 专利号: 202110874526 .2( 23 ) 一种用于分布式训练的通信方法及系统, 2021, 第 5 作者, 专利号: 202110874507 .X( 24 ) 数据发送、重传控制方法及系统、存储介质及电子设备, 2021, 第 5 作者, 专利号: 202110799123 .6( 25 ) 一种路由安全检测方法和系统, 2021, 第 5 作者, 专利号: CN109558727B( 26 ) 面向数据流架构的SHA算法执行方法、存储介质、电子装置, 2021, 第 5 作者, 专利号: CN112861154A( 27 ) 网络模拟器及其动态切换方法, 2021, 第 6 作者, 专利号: 202110535758 .5( 28 ) 用于提高网络模拟器性能的时间同步方法, 2021, 第 6 作者, 专利号: 202110484747 .9( 29 ) 一种基于智能网卡的消息发送方法以及接收方法, 2021, 第 4 作者, 专利号: CN111262868B( 30 ) 一种片上带宽动态分配方法及系统, 2021, 第 5 作者, 专利号: CN112311695A( 31 ) 一种片上带宽动态分配方法及系统, 2021, 第 5 作者, 专利号: CN112311695A( 32 ) 一种神经网络剪枝方法及装置, 2021, 第 5 作者, 专利号: CN112183744A( 33 ) 一种神经网络剪枝方法及装置, 2021, 专利号: CN112183744A( 34 ) 一种基于全局链路负载均衡的网络链路控制方法和系统, 2020, 第 7 作者, 专利号: CN108965153B( 35 ) 一种加速安全散列算法的加速器, 2020, 第 4 作者, 专利号: CN111738703A( 36 ) 一种基于作业部署信息的链路互连方法和系统, 2020, 第 7 作者, 专利号: CN109067662B( 37 ) 一种面向多轨网络的光路交换方法和系统, 2020, 第 7 作者, 专利号: CN109257663B( 38 ) 一种基于可配置的多处理器计算机系统及实现方法, 2020, 第 1 作者, 专利号: CN106844263B( 39 ) 一种针对光网络的拓扑重构方法, 2019, 第 10 作者, 专利号: CN107493197B( 40 ) 一种面向宽度优先搜索算法的加速装置、方法及存储介质, 2019, 第 3 作者, 专利号: CN109992413A( 41 ) 一种面向链路资源的自适应互连与路由控制方法和系统, 2019, 第 7 作者, 专利号: CN109842553A( 42 ) 一种数据中心内获取路由表的方法及系统, 2019, 第 4 作者, 专利号: CN106453097B( 43 ) 一种路由安全检测方法和系统, 2019, 第 5 作者, 专利号: CN109558727A( 44 ) 一种面向多轨网络的光路交换方法和系统, 2019, 第 7 作者, 专利号: CN109257663A( 45 ) 一种面向多轨网络的光路交换方法和系统, 2019, 第 7 作者, 专利号: CN109257663A( 46 ) 一种基于网卡直连的全互连通信方法及装置, 2019, 第 1 作者, 专利号: CN105119786B( 47 ) 使能单根I/O设备多根共享的适配装置、系统及方法, 2018, 第 5 作者, 专利号: CN105320628B( 48 ) 一种面向高维度网络的路由器及路由方法, 2018, 第 5 作者, 专利号: CN104079491B( 49 ) 一种针对光网络的拓扑重构方法, 2017, 第 10 作者, 专利号: CN107493197A( 50 ) 一种集成网络路由器的众核处理器系统及其集成方法和实现方法, 2017, 第 5 作者, 专利号: CN104077138B( 51 ) 一种基于可配置的多处理器计算机系统及实现方法, 2017, 第 1 作者, 专利号: CN106844263A( 52 ) 一种基于水冷散热的多处理器计算机系统结构及实现方法, 2017, 第 1 作者, 专利号: CN106774724A( 53 ) 一种面向分布式去重系统的数据路由方法, 2017, 第 4 作者, 专利号: CN103631933B( 54 ) 一种支持I/O功能动态分配的虚拟热插拔系统及其工作方法, 2017, 第 5 作者, 专利号: CN103701881B( 55 ) 一种数据中心内获取路由表的方法及系统, 2017, 第 4 作者, 专利号: CN106453097A( 56 ) 实现分布式I/O资源池化的方法及装置, 2016, 第 4 作者, 专利号: CN103353861B( 57 ) 多根I/O虚拟化共享方法和系统, 2016, 第 3 作者, 专利号: CN102707991B( 58 ) 使能单根I/O设备多根共享的适配装置、系统及方法, 2016, 第 5 作者, 专利号: CN105320628A( 59 ) 一种基板多芯片集成的大端口互连类芯片及实现方法, 2016, 第 6 作者, 专利号: CN103413796B( 60 ) 一种基于PCIe数据交换的通信方法及系统, 2015, 第 4 作者, 专利号: CN103117929B( 61 ) 一种基于网卡直连的全互连通信方法及装置, 2015, 第 1 作者, 专利号: CN105119786A( 62 ) 一种用于多根共享系统的直接I/O虚拟化方法和装置, 2015, 第 4 作者, 专利号: CN102819447B( 63 ) 一种用于多根共享系统的I/O重映射方法和装置, 2015, 第 4 作者, 专利号: CN102722458B( 64 ) 一种基于DDR SDRAM的栈式数据缓存装置及其方法, 2014, 第 5 作者, 专利号: CN102637148B( 65 ) 一种面向高维度网络的路由器及路由方法, 2014, 第 5 作者, 专利号: CN104079491A( 66 ) 一种集成网络路由器的众核处理器系统及其集成方法和实现方法, 2014, 第 5 作者, 专利号: CN104077138A( 67 ) 一种支持单根IO虚拟化用户级接口控制装置及其方法, 2014, 第 4 作者, 专利号: CN102650976B( 68 ) 用于并行多处理器系统的通信行为获取装置, 2014, 第 8 作者, 专利号: CN102446156B( 69 ) 用于多根I/O 虚拟化共享系统的I/O 资源管理方法, 2014, 第 3 作者, 专利号: CN102722414B( 70 ) 一种支持I/O功能动态分配的虚拟热插拔系统及其工作方法, 2014, 第 5 作者, 专利号: CN103701881A( 71 ) 一种基于胖树结构的动态容错方法和系统, 2014, 第 3 作者, 专利号: CN101945050B( 72 ) 一种面向分布式去重系统的数据路由方法, 2014, 第 4 作者, 专利号: CN103631933A( 73 ) 一种内存保护方法、系统及网络接口控制器, 2014, 第 3 作者, 专利号: CN103488588A( 74 ) 一种基板多芯片集成的大端口互连类芯片及实现方法, 2013, 第 6 作者, 专利号: CN103413796A( 75 ) 实现分布式I/O资源池化的方法及装置, 2013, 第 3 作者, 专利号: CN103353861A( 76 ) 一种基于PCIe数据交换的通信方法及系统, 2013, 第 4 作者, 专利号: CN103117929A( 77 ) 一种移动HPC系统及其实现方法, 2013, 第 4 作者, 专利号: CN102096655B( 78 ) 一种用于多根共享系统的直接I/O 虚拟化方法和装置, 2012, 第 4 作者, 专利号: CN102819447A( 79 ) 一种具有二次索引结构的存储设备及其操作方法, 2012, 第 4 作者, 专利号: CN101963896B( 80 ) 一种用于多根共享系统的I/O重映射方法和装置, 2012, 第 4 作者, 专利号: CN102722458A( 81 ) 用于多根I/O 虚拟化共享系统的I/O 资源管理方法, 2012, 第 3 作者, 专利号: CN102722414A( 82 ) 一种大端口交换芯片的交换系统及方法, 2012, 第 3 作者, 专利号: CN101442488B( 83 ) 多根I/O 虚拟化共享方法和系统, 2012, 第 3 作者, 专利号: CN102707991A( 84 ) 一种支持单根IO虚拟化用户级接口控制装置及其方法, 2012, 第 4 作者, 专利号: CN102650976A( 85 ) 一种基于DDR SDRAM的栈式数据缓存装置及其方法, 2012, 第 5 作者, 专利号: CN102637148A( 86 ) 一种多处理器系统及其同步引擎, 2012, 第 4 作者, 专利号: CN101950282B( 87 ) 用于并行多处理器系统的通信行为获取装置, 2012, 第 8 作者, 专利号: CN102446156A( 88 ) 多计算机系统中节点的DMA设备及通信方法, 2012, 第 4 作者, 专利号: CN101539902B( 89 ) 一种栅障同步方法及系统, 2012, 第 3 作者, 专利号: CN101330341B( 90 ) 多个HT总线到单个PCIe总线的桥接装置及其方法, 2012, 第 6 作者, 专利号: CN101882126B( 91 ) 一种高密度多处理器系统及其节点控制器, 2011, 第 6 作者, 专利号: CN101908036B( 92 ) 一种用于维持多通道顺序规则的装置及相应方法, 2011, 第 5 作者, 专利号: CN101383773B( 93 ) 一种移动HPC系统及其实现方法, 2011, 第 4 作者, 专利号: CN102096655A( 94 ) 一种多处理器系统、装置及方法, 2011, 第 1 作者, 专利号: CN101216781B( 95 ) 一种具有二次索引结构的存储设备及其操作方法, 2011, 第 4 作者, 专利号: CN101963896A( 96 ) 一种多处理器系统及其同步引擎, 2011, 第 4 作者, 专利号: CN101950282A( 97 ) 一种基于胖树结构的动态容错方法和系统, 2011, 第 3 作者, 专利号: CN101945050A( 98 ) 一种高密度多处理器系统及其节点控制器, 2010, 第 6 作者, 专利号: CN101908036A( 99 ) 多个HT总线到单个PCIe总线的桥接装置及其方法, 2010, 第 6 作者, 专利号: CN101882126A( 100 ) 一种多通道通信传输数据的系统和装置与方法, 2010, 第 1 作者, 专利号: CN101159687B( 101 ) 一种基于信誉的流量控制系统、装置和方法, 2010, 第 2 作者, 专利号: CN100596114C( 102 ) 一种信誉流量控制方法, 2009, 第 4 作者, 专利号: CN100574310C( 103 ) 一种基于胖树拓扑的屏障操作网络系统、装置及方法, 2009, 第 3 作者, 专利号: CN100571183C( 104 ) 多计算机系统中节点的DMA设备及通信方法, 2009, 第 4 作者, 专利号: CN101539902A( 105 ) 一种大端口交换芯片的交换系统及方法, 2009, 第 3 作者, 专利号: CN101442488A( 106 ) 一种用于维持多通道顺序规则的装置及相应方法, 2009, 第 5 作者, 专利号: CN101383773A( 107 ) 一种栅障同步方法及系统, 2008, 第 3 作者, 专利号: CN101330341A( 108 ) 一种多处理器系统、装置及方法, 2008, 第 1 作者, 专利号: CN101216781A( 109 ) 一种多通道通信传输数据的系统和装置与方法, 2008, 第 1 作者, 专利号: CN101159687A( 110 ) 一种基于胖树拓扑的屏障操作网络系统、装置及方法, 2008, 第 3 作者, 专利号: CN101127677A( 111 ) 一种基于信誉的流量控制系统、装置和方法, 2008, 第 2 作者, 专利号: CN101115008A( 112 ) 一种信誉流量控制方法, 2008, 第 4 作者, 专利号: CN101115053A( 113 ) 基于双8b/10b编码器的16b/20b编码器逻辑实现方法, 2007, 第 2 作者, 专利号: CN1300971C( 114 ) 高性能机群互联网络适配器, 2004, 第 4 作者, 专利号: CN1529472( 115 ) 用FPGA器件实现机群交换网络路由芯片的方法, 2004, 第 1 作者, 专利号: CN1507285
出版信息
发表论文
(1) 面向多核CPU与GPU平台的图处理系统关键技术综述, 计算机研究与发展, 2024, 第 7 作者(2) A Scalable RDMA Network Interface Card with Efficient Cache Management, ISCAS 2023, 2023, 第 6 作者(3) Accelerating Convolutional Neural Networks by Exploiting the Sparsity of Output Activation, TPDS, 2023, 第 10 作者(4) Improving Utilization of Dataflow Architectures Through Software and Hardware Co-Design, Euro-Par, 2023, 第 4 作者(5) Accelerating Convolutional Neural Networks by Exploiting the Sparsity of Output Activation, IEEE TRANSACTIONS ON PARALLEL AND DISTRIBUTED SYSTEMS, 2023, 第 12 作者(6) 面向低精度神经网络的数据流体系结构优化, 计算机研究与发展, 2023, 第 5 作者(7) FSGraph: fast and scalable implementation of graph traversal on GPUs, CCF Transactions on High Performance Computing, 2023, 第 7 作者(8) A Loop Optimization Method for Data���ow, High Performance Computing and Communications, 2022, 第 6 作者(9) 智能网卡综述, Survey on Smart Network Interface Card, 计算机研究与发展, 2022, 第 5 作者(10) 基于在网计算加速的拜占庭容错算法, Accelerating Byzantine Fault Tolerance with In-Network Computing, 计算机研究与发展, 2021, 第 5 作者(11) 分布式深度学习训练网络综述, Survey on Network of Distributed Deep Learning Training, 计算机研究与发展, 2021, 第 8 作者(12) 非连续数据网络通信实现方法和性能分析, Implementation Methods and Performance Analysis of Non-Contiguous Data Communication in Network, 计算机学报, 2020, 第 8 作者(13) Understanding the Performance of In-Network Computing: A Case Study, ISPA 2019, 2019, 第 1 作者(14) SwitchAgg: A Further Step Towards In-Network Computation, ISPA 2019, 2019, 第 1 作者(15) T2HT: Traffic-driven Machine Learning based Hierarchical Topology Generation Model, 2019 IEEE 25TH INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS), 2019, 第 6 作者(16) 基于链路状态数据库的数据中心网络异常检测算法, Anomaly Detection Algorithm of Data Center Network Based on LSDB, 计算机研究与发展, 2018, 第 4 作者(17) 基于LSDB的数据中心网络异常检测算法, 计算机研究与发展, 2018, 第 1 作者(18) mRMT: Mixed Programmable Switching, ANCS, 2018, 第 1 作者(19) Routing and Spectrum Allocation for Time Varying Traffic by Artificial Bee Colony Algorithm in Elastic Optical Networks, 2018 IEEE INT CONF ON PARALLEL & DISTRIBUTED PROCESSING WITH APPLICATIONS, UBIQUITOUS COMPUTING & COMMUNICATIONS, BIG DATA & CLOUD COMPUTING, SOCIAL COMPUTING & NETWORKING, SUSTAINABLE COMPUTING & COMMUNICATIONS, 2018, 第 6 作者(20) HyperFatTree: A Large-Scale Tree-Based Network with Low-Radix Switches, INTERNATIONAL JOURNAL OF PARALLEL PROGRAMMING, 2017, 第 7 作者(21) Regional Congestion Control in Data Center Networks, 2017 IEEE 23RD INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS), 2017, 第 6 作者(22) 云数据中心 I/O 资源池化, I/O Resource Pooling for Cloud Datacenter, 集成技术, 2016, 第 2 作者(23) 一种低开销的面向节点内互连的网络接口控制器, A Low Overhead Intra-Node Interconnection Oriented Network Interface Controller, 计算机学报, 2015, 第 6 作者(24) 基于单根I/O虚拟化的多根I/O资源池化方法, A Multi-Root I/O Resource Pooling Method Based on Single-Root I/O Virtualization, 计算机研究与发展, 2015, 第 7 作者(25) An Intra-Server Interconnect Fabric for Heterogeneous Computing, JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, 2014, 第 6 作者(26) Building A Large-scale Direct Network with Low-radix Routers, 2014 20TH IEEE INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS), 2014, 第 8 作者(27) 一种支持海量数据备份的可扩展分布式重复数据删除系统, A Scalable Distributed Data Deduplication System to Backup Massive Storage, 计算机研究与发展, 2013, 第 4 作者(28) cHPP controller: a high performance hyper-node hardware accelerator, 2013 INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED COMPUTING, APPLICATIONS AND TECHNOLOGIES (PDCAT), 2013, 第 6 作者(29) 高性能计算节点中的同步操作加速引擎设计, Design of Synchronization Accelerator in HPC Computing Node, 电子科技大学学报, 2012, 第 5 作者(30) Design of HPC Node with Heterogeneous Processors, 2011 IEEE INTERNATIONAL CONFERENCE ON CLUSTER COMPUTING (CLUSTER), 2011, 第 7 作者(31) 一种面向高性能计算机的超节点控制器的研究, Research on Hyper-Node Controller for High Performance Computer, 计算机研究与发展, 2011, 第 5 作者(32) HPP Controller: a System Controller Dedicated for Message Passing, PDCAT‘10, 2010, 第 1 作者(33) HPP controller: a system controller for high performance computing, FRONTIERS OF COMPUTER SCIENCE IN CHINA, 2010, 第 4 作者(34) Gemini NI: an Integration of Two Network Interfaces, NAS: 2009 IEEE INTERNATIONAL CONFERENCE ON NETWORKING, ARCHITECTURE, AND STORAGE, 2009, 第 3 作者(35) 曙光5000芯片组系统级功能验证平台, A System-Level Functional Verification Platform for the Dawning 5000 Chipset, 计算机工程与科学, 2009, 第 4 作者(36) 龙芯2E多处理器芯片组的设计与实现, Design and implementation of multi-processor chipset based on Godson 2E CPU, 计算机应用研究, 2008, 第 3 作者(37) 面向高性能计算的芯片组参数优化研究, Research on parameter optimization of chipset for high performance computing, 计算机工程与设计, 2008, 第 4 作者(38) 一种高性能计算机系统控制器的研究与实现, 计算机研究与发展, 2008, 第 1 作者(39) 多处理器芯片组中PCI桥控制器的设计与实现, Design and Implementation of PCI Bridge Controller in Multi-processor Chipset, 计算机工程, 2008, 第 3 作者(40) 多处理器芯片组中交叉开关的设计与性能优化, Design and Performance Optimization of Crossbar in Multi-processor Chipset, 计算机工程, 2008, 第 2 作者(41) 基于双8b/10b编码器的16b/20b编码器逻辑实现方法, 科技开发动态, 2005, 第 2 作者(42) 面向机群互连网络的智能网卡设计, The Implementation of Intelligent Adaptor Oriented Cluster Network, 计算机工程与应用, 2003, 第 2 作者(43) 基于UX8交换芯片的机群互连网络设计, The Layout of Cluster Interconnection Network Based on the UX8 Switch Chip, 微电子学与计算机, 2003, 第 1 作者(44) 虫洞路由交换及其缓冲区设计, Wormhole Routing Switching and its Buffer Layout, 微电子学与计算机, 2002, 第 1 作者(45) 虫洞路由芯片的伸缩缓冲区设计与实现, The Design and Implementation of the Elastic Buffer in Wormhole Routing Chips, 计算机工程与应用, 2002, 第 1 作者(46) LRSP路由器链路调度策略及实现方法, LRSP Link Arbitration Policy and Its Implementation, 计算机科学, 2002, 第 1 作者(47) 数字式GPS信号适配器, 内蒙古大学学报:自然科学版, 1996, 第 2 作者
科研活动
科研项目
( 1 ) 图计算系统集成及应用验证, 参与, 国家任务, 2023-12--2027-11( 2 ) 图计算众核处理器原型系统, 负责人, 国家任务, 2018-07--2021-10( 3 ) 船域网络与数据服务器集成技术研究, 负责人, 境内委托项目, 2017-01--2017-12( 4 ) FPGA高级验证平台创建工具及IP VeriTB, 负责人, 境内委托项目, 2015-09--2016-08( 5 ) pHPC系统, 负责人, 其他国际合作项目, 2015-05--2016-05( 6 ) 数据中心网络, 参与, 其他国际合作项目, 2015-03--2015-12