基本信息
刘杰  男  硕导  中国科学院软件研究所
电子邮件: ljie@otcaix.iscas.ac.cn
通信地址: 北京海淀区中关村南4街4号
邮政编码: 100190

研究领域

研究方向:

  • 大数据与机器学习系统软件技术(System for Big Data & AI):大数据分布式计算、无服务器架构的大数据与机器学习系统、地球大数据挖掘分析平台EarthDataMiner、可持续发展目标(SDG)大数据技术;

  • 领域决策智能(Domain decision intelligence):领域知识图谱构建与语义计算, 面向科学计算、医疗、民航、法律、遥感、教育等领域的机器学习与数据挖掘算法及其分布式优化

主要工作:

  • 参与研制“可持续发展大数据平台系统”,带领团队研发的EarthDataMiner突破了超大规模遥感影像分布式计算与交互式分析云服务技术,服务科学家在线开展遥感影像及其他科学数据的智能分析处理,支持SDGs指标全流程在线计算。EarthDataMiner支持科学家在线开发SDGs指标计算算法,并将算法成果发布为web app工具,支持全球用户访问使用。

  • 知识图谱与问答系统相关成果在医疗、民航(航旅纵横)、法律等领域应用。

  • 作为负责人主持国家自然科学基金项目2项、国家重点研发计划课题1项、中科院科技创新项目1项、民航总局科技重大专项1项。

  • 作为负责人开展多项企业合作项目,合作方包括华为、京东、中航信、航天科工等企业。

  • 在大数据和人工智能相关的会议期刊发表论文40多篇,获得发明专利5项。指导研究生曾获天池大数据比赛三等奖、无锡大数赛三等奖等。

  • 计算机学会系统软件专业委员会委员,中科院青年创新促进会会员、江苏省研究生导师类产业教授(兼职)。

  • 广西大学、南京中医药大学联合培养硕士生导师。

  • 国家自然科学家基金、计算机学报、软件学报、中国科学院大学学报、AAAI等审稿人。


中国科学报报道2021/9/22:“地球大数据”有了自主研发的在线分析工具

软件所官网报道 2021/9/7:    可持续发展大数据国际研究中心成立 软件所参与研制的“可持续发展大数据平台系统”正式发布



欢迎对大数据、分布式计算、语义计算方向感兴趣学生 参加推免或报考,或实习!



招生信息

   
招生专业
083500-软件工程
081202-计算机软件与理论
招生方向
大数据智能分析
领域决策智能
地球大数据

教育背景

2004-09--2011-01   中国科学技术大学   博士
2000-09--2004-06   中国科学技术大学   本科

工作经历

   
工作简历
2014-07~现在, 中国科学院软件研究所, 副研究员
2011-04~2014-06,中国科学院软件研究所, 助理研究员

教授课程

大数据技术概论

专利与奖励

   
专利成果
( 1 ) 一种数据处理流程代码的生成方法, 发明, 2013, 第 2 作者, 专利号: ZL201010578933.0
( 2 ) 一种面向遥感语义分割的自动化机器学习方法及系统, 发明, 2020, 第 1 作者, 专利号: 202010435924X
( 3 ) 一种基于Spark SQL的分布式全文检索系统及方法, 发明, 2019, 第 3 作者, 专利号: ZL201710269870.2
( 4 ) 一种基于迁移学习的疾病领域间病人相似性度量迁移系统, 发明, 2019, 第 1 作者, 专利号: ZL201510457976.6
( 5 ) 一种基于知识库和规则库的履历信息抽取与特征标识分析系统及方法, 发明, 2018, 第 2 作者, 专利号: ZL201510457976.6

出版信息

   
发表论文
(1) DeepCon: Contribution Coverage Testing for Deep Learning Systems, 28th International Conference on Software Analysis, Evolution, and Reengineering (SANER 2021), 2021, 通讯作者
(2) FaasRS: Remote Sensing Image Processing System on Serverless Platform, IEEE Computer Society Signature Conference on Computers, Software and Applications(COMPSAC), 2021, 通讯作者
(3) Identity-linked Group Channel Pruning for Deep Neural Networks, International Joint Conference on Neural Network(IJCNN), 2021, 通讯作者
(4) 面向问题意图识别的深度主动学习方法, 中文信息学报, 2021, 第 3 作者
(5) Label Definitions Augmented Interaction Model for Legal Charge Prediction, 43rd EUROPEAN CONFERENCE ON INFORMATION RETRIEVAL(ECIR), 2021, 通讯作者
(6) EarthDataMiner: A Cloud-Based Big Earth Data Intelligence Analysis Platform, IOP Conference Series: Earth and Environmental Science 509 (1), 2020, 第 2 作者
(7) 科学大数据智能分析软件的现状与趋势, Current Situation and Trend of Intelligent Analysis Software for Scientific Big Data, 中国科学院院刊, 2018, 第 2 作者
(8) Question answering over freebase via attentive RNN with similarity matrix based CNN, arXiv preprint, 2018, 第 2 作者
(9) Fine-grained Patient Similarity Measuring using Deep Metric Learning, The 26th ACM International Conference on Information and Knowledge Management (CIKM), 2017, 通讯作者
(10) 可扩展机器学习的并行与分布式优化算法综述, 软件学报, 2017, 通讯作者
(11) Dependency-Aware Parallel Materialization of Datalog Programs with Spark for Scalable Reasoning, 17th International Conference on Web Information System Engineering (WISE’16), 2016, 第 2 作者
(12) Plogs: Materializing Datalog Programs with MapReduce for Scalable Reasoning, 13th IEEE International Conference on Ubiquitous Intelligence and Computing(UIC), 2016, 第 2 作者
(13) Hug the Elephant: Migrating a Legacy Data Analytics Application to Hadoop Ecosystem, The 32nd International Conference on Software Maintenance and Evolution (ICSME), 2016, 通讯作者
(14) 分布式文件系统元数据服务的负载均衡框架, 软件学报, 2016, 第 2 作者
(15) A Lightweight Evaluation Framework for Table Layouts in MapReduce Based Query Systems, The 17th The Asia Pacific Web Conference(APWeb), 2015, 第 2 作者
(16) Scalable Horn-Like Rule Inference of Semantic Data Using MapReduce, The 7th International Conference on Knowledge Science, Engineering and Management(KSEM), 2014, 第 2 作者
(17) A Distributed Cache Framework for Metadata Service of Distributed File System, The 19th IEEE International Conference on Parallel and Distributed Systems (ICPADS), 2013, 第 2 作者
(18) A Distributed Rule Execution Mechanism Based on MapReduce in Sematic Web Reasoning, Fifth Asia-Pacific Symposium on Internetware, 2013, 第 2 作者
(19) Consistent query answering based on repairing inconsistent attributes with nulls, International Conference on Database Systems for Advanced Applications(DASFAA), 2013, 第 1 作者
(20) Etl workflow analysis and verification using backwards constraint propagation, Advanced Information Systems Engineering(CAiSE), 2009, 第 1 作者
发表著作
(1) 大数据技术丛书:Hadoop集群与安全, Hadoop Cluster Deployment,Securing Hadoop, 机械工业出版社, 2014-11, 第 1 作者
论文列表

科研活动

   
科研项目
( 1 ) 云平台并行数据流程序的中间数据管理优化技术, 主持, 国家级, 2013-01--2015-12
( 2 ) 面向复杂情报的大数据 分析方法与决策支持, 参与, 国家级, 2015-01--2018-12
( 3 ) 公共安全事件预警与态势决策技术:人流量预测与态势可视化, 主持, 部委级, 2016-01--2017-12
( 4 ) 互联网+民航公共主动服务平台-民航领域问答系统, 主持, 研究所(学校), 2016-09--2019-08
( 5 ) 跨地域跨层级的“一人多案”的关联预警与协同处置关键技术研究, 主持, 国家级, 2018-07--2021-07
( 6 ) 面向智能设备的可执行电子指令, 主持, 院级, 2019-03--2020-03
( 7 ) 无服务器架构机器学习的计算模型与系统框架研究, 主持, 国家级, 2020-01--2023-12
( 8 ) 基于医疗知识图谱的交互式智能分诊系统, 主持, 院级, 2019-05--2020-12
( 9 ) 自动化公文抓取与信息抽取系统, 主持, 院级, 2020-07--2020-12
( 10 ) 地球大数据挖掘分析系统, 参与, 部委级, 2017-01--2022-12

合作情况

与华为、京东、航旅纵横、航天科工集团、中国中医科学院、军事医学科学院等开展项目合作

与中科院空天信息技术研究院、中国科学院计算机网络信息中心、中科院计算所、中科院地理所等院内机构开展合作

指导学生

已指导学生

蔡承烨  硕士研究生  081202-计算机软件与理论  

张晨昕  硕士研究生  081202-计算机软件与理论  

现指导学生

全威  硕士研究生  081202-计算机软件与理论  

徐可钦  硕士研究生  081202-计算机软件与理论  

夏文浩  硕士研究生  083500-软件工程