基本信息

杜一  男  中国科学院计算机网络信息中心
电子邮件: duyi@cnic.cn
基本情况:中国科学院计算机网络信息中心大数据技术与应用发展部副主任,研究员,国家自然科学基金优秀青年科学基金获得者,国家重点研发计划青年科学家项目负责人,北京市科技新星,中国科学院青年创新促进会会员,CCF高级会员。博士毕业于中国科学院软件研究所,目前为计算机网络信息中心科技委员会委员。主要研究兴趣在科技大数据知识图谱、大数据分析挖掘、AI for Science等。

个人主页:链接

研究领域

大数据挖掘与分析技术


教育背景

2008-09--2013-07   中国科学院软件研究所   博士
2004-09--2008-07   山东大学   学士

专利与奖励

   
专利成果
( 1 ) 一种基于链接预测的食源性疾病暴发识别方法和系统, 发明专利, 2022, 第 4 作者, 专利号: CN114049966A

( 2 ) 一种高效模拟大型天然气管网流动传热的方法, 发明专利, 2022, 第 3 作者, 专利号: CN113962131A

( 3 ) 一种基于LightGBM分类与表示学习的姓名消歧方法和系统, 发明专利, 2022, 第 3 作者, 专利号: CN113962293A

( 4 ) 一种可利用专家知识的申请书多标签层次分类方法, 发明专利, 2021, 第 1 作者, 专利号: CN113761197A

( 5 ) 无监督的基于表示学习的同名作者消歧方法及装置, 发明专利, 2021, 第 1 作者, 专利号: CN113111178A

( 6 ) 基于融合表征学习的学科分类体系对齐方法、系统及介质, 发明专利, 2021, 第 1 作者, 专利号: CN112949277A

( 7 ) 一种科技资源汇聚与持续服务方法及装置, 发明专利, 2021, 第 1 作者, 专利号: CN112163094A

( 8 ) 基于图局部结构和文本语义相似性的学术论文推荐方法, 发明专利, 2020, 第 1 作者, 专利号: CN112069290A

( 9 ) 一种基于作者著作树和图神经网络的论文合作者推荐方法, 发明专利, 2020, 第 1 作者, 专利号: CN112069306A

( 10 ) 一种学者知识抽取与融合方法及装置, 发明专利, 2020, 第 1 作者, 专利号: CN112069817A

( 11 ) 一种基于网络表征和语义表征的同名作者消歧方法, 发明专利, 2020, 第 1 作者, 专利号: CN111191466A

( 12 ) 一种基于深层循环神经网络的产品周期需求量预测方法, 发明专利, 2020, 第 2 作者, 专利号: CN111144923A

( 13 ) 一种基于引文网络社区发现的数据推荐方法, 发明专利, 2020, 第 2 作者, 专利号: CN110674318A

( 14 ) 一种大数据ETL任务的调度方法, 发明专利, 2020, 第 3 作者, 专利号: CN110659116A

( 15 ) 一种数据出版物学术影响力评价预测方法, 发明专利, 2020, 第 2 作者, 专利号: CN110659768A

( 16 ) 一种基于异质图卷积神经网络嵌入的作者名字消歧方法, 发明专利, 2019, 第 1 作者, 专利号: CN110516146A

( 17 ) 一种大数据ETL任务的编排方法与系统, 发明专利, 2019, 第 3 作者, 专利号: CN110232085A

( 18 ) 一种融合图数据库和人工智能算法的数据管理方法及系统, 发明专利, 2019, 第 4 作者, 专利号: CN109597919A

( 19 ) 一种基于异质网络嵌入的学者名字消歧方法, 发明专利, 2019, 第 1 作者, 专利号: CN109558494A

( 20 ) 一种支持时序特征探查的统计地图绘制方法, 发明专利, 2018, 第 1 作者, 专利号: CN107749073A

( 21 ) 一种混合型航标报警智能检测方法, 发明专利, 2017, 第 4 作者, 专利号: CN106997692A

( 22 ) 一种时空延迟相关性可视化方法, 专利授权, 2017, 第 1 作者, 专利号: CN106372104A

( 23 ) 一种基于主题流的时空延迟相关性可视化方法, 专利授权, 2016, 第 1 作者, 专利号: CN106250534A

( 24 ) 一种基于气象数据的监测指标时空延迟相关性计算方法, 专利授权, 2016, 第 1 作者, 专利号: CN106156490A

( 25 ) 一种基于时序相关性的空间聚类方法, 发明专利, 2016, 第 1 作者, 专利号: CN106055689A

( 26 ) 一种基于WEB的多模型数据可视化开发方法及平台, 发明专利, 2015, 第 1 作者, 专利号: CN104572096A

( 27 ) 一种基于访问热度的时空数据服务调度方法, 专利授权, 2015, 第 2 作者, 专利号: CN104580447A

( 28 ) 一种基于空间场景草图描述的交互式空间场景检索方法, 发明专利, 2014, 第 2 作者, 专利号: CN103678593A

出版信息

   
发表论文
[1] 王卫军, 宁致远, 杜一, 周园春. 基于多标签分类的科技文献学科交叉研究性质识别. 数据分析与知识发现[J]. 2023, 7(1): 102-112, http://lib.cqvip.com/Qikan/Article/Detail?id=7109140025.
[2] Ludi Wang, Yang Gao, Xueqing Chen, Wenjuan Cui, Yuanchun Zhou, Xinying Luo, Shuaishuai Xu, Yi Du, Bin Wang. A corpus of CO 2 electrocatalytic reduction process extracted from the scientific literature. SCIENTIFIC DATA[J]. 2023, 10(1): 1-11, http://dx.doi.org/10.1038/s41597-023-02089-z.
[3] Gao, Yang, Wang, Ludi, Chen, Xueqing, Du, Yi, Wang, Bin. Revisiting Electrocatalyst Design by a Knowledge Graph of Cu-Based Catalysts for CO2 Reduction. ACS CATALYSIS[J]. 2023, 13(13): 8525-8534, http://dx.doi.org/10.1021/acscatal.3c00759.
[4] Du, Yi, Guo, Yunchang. Machine learning techniques and research framework in foodborne disease surveillance system. FOOD CONTROL[J]. 2022, 131: http://dx.doi.org/10.1016/j.foodcont.2021.108448.
[5] Xiao, Meng, Qiao, Ziyue, Fu, Yanjie, Dong, Hao, Du, Yi, Wang, Pengyang, Xiong, Hui, Zhou, Yuanchun. Hierarchical Interdisciplinary Topic Detection Model for Research Proposal Classification. IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING[J]. 2022, http://arxiv.org/abs/2209.13519.
[6] 范英杰, 吕栋, 李东, 杜一, 韩宇. 构建国家科研论文和科技信息高端交流平台的政策与路径探析--基于国家自然科学基金开放获取与平台建设实践. 新华文摘. 2022, 138-142, http://lib.cqvip.com/Qikan/Article/Detail?id=7107691543.
[7] Deeba, Farah, Dharejo, Fayaz A, Zawish, Muhammad, Memon, Fida H, Dev, Kapal, Naqvi, Rizwan A, Zhou, Yuanchun, Du, Yi. A novel image dehazing framework for robust vision-based intelligent systems. INTERNATIONAL JOURNAL OF INTELLIGENT SYSTEMS[J]. 2022, 37(12): 10495-10512, [8] Ning, Zhiyuan, Qiao, Ziyue, Dong, Hao, Du, Yi, Zhou, Yuanchun, Karlapalem, K, Cheng, H, Ramakrishnan, N, Agrawal, RK, Reddy, PK, Srivastava, J, Chakraborty, T. LightCAKE: A Lightweight Framework for Context-Aware Knowledge Graph Embedding. ADVANCES IN KNOWLEDGE DISCOVERY AND DATA MINING, PAKDD 2021, PT IIInull. 2021, 12714: 181-193, [9] 王毅蒙, 田野, 孙善鹏, 周园春, 杜一. 基于ORCID和加权跨层边聚类系数的研究者社区发现. 计算机系统应用[J]. 2021, 30(6): 45-53, http://lib.cqvip.com/Qikan/Article/Detail?id=7104867659.
[10] Wang, Hanxue, Cui, Wenjuan, Guo, Yunchang, Du, Yi, Zhou, Yuanchun. Machine Learning Prediction of Foodborne Disease Pathogens: Algorithm Development and Validation Study. JMIR MEDICAL INFORMATICS[J]. 2021, 9(1): https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7872834/.
[11] 杜一. Prediction of Foodborne Diseases Pathogens: A Machine Learning Approach. JMIR MEDICAL INFORMATICS. 2021, [12] Zhang, Peng, Cui, Wenjuan, Wang, Hanxue, Du, Yi, Zhou, Yuanchun. High-Efficiency Machine Learning Method for Identifying Foodborne Disease Outbreaks and Confounding Factors. FOODBORNE PATHOGENS AND DISEASE[J]. 2021, 18(8): 590-598, http://dx.doi.org/10.1089/fpd.2020.2913.
[13] 李东, 于笑丰, 杜一, 刘静羽. 国家自然科学基金资助成果开放共享平台:现状与展望. 中国科学基金[J]. 2021, 35(5): 808-814, http://lib.cqvip.com/Qikan/Article/Detail?id=7106211603.
[14] 范英杰, 吕栋, 李东, 杜一, 韩宇. 构建国家科研论文和科技信息高端交流平台的政策与路径探析--基于国家自然科学基金开放获取与平台建设实践. 图书与情报[J]. 2021, 14-20, http://lib.cqvip.com/Qikan/Article/Detail?id=7106908786.
[15] 王卫军, 姚畅, 乔子越, 崔文娟, 杜一, 周园春. 基于词嵌入的国家自然科学基金学科交叉知识发现方法——以“人工智能”与“信息管理”为例. 情报学报[J]. 2021, 831-845, https://t.cnki.net/kcms/detail?v=3uoqIhG8C46NmWw7YpEsKIiWgUt1OIIOag2XIKnaLQGpv1rEfLQOgTsuZraFpJBHI_O6L-mGuc79rcFsQxfJzv3h76ymPpRw&uniplatform=NZKPT.
[16] Dharejo, Fayaz Ali, Zhou, Yuanchun, Deeba, Farah, Jatoi, Munsif Ali, Khan, Muhammad Ashfaq, Mallah, Ghulam Ali, Ghaffar, Abdul, Chhattal, Muhammad, Du, Yi, Wang, Xuezhi. A deep hybrid neural network for single image dehazing via wavelet transform. OPTIK[J]. 2021, 231: http://dx.doi.org/10.1016/j.ijleo.2021.166462.
[17] Dharejo, Fayaz Ali, Zhou, Yuanchun, Deeba, Farah, Jatoi, Munsif Ali, Du, Yi, Wang, Xuezhi. A remote-sensing image enhancement algorithm based on patch-wise dark channel prior and histogram equalisation with colour correction. IET IMAGE PROCESSING[J]. 2021, 15(1): 47-56, https://doaj.org/article/4beb0611ad43402d9fb6e032c8e9f143.
[18] 杜一. Single Image Remote Sensing Super-Resolution Combined with the Transferred Generative Adversarial Network and Wavelet Transformation. ACM Transactions on Intelligent Systems and Technology. 2021, [19] 王卫军, 李成赞, 郑晓欢, 褚大伟, 姜璐璐, 陈昕, 杜一, 周园春. 全球科学数据出版发展态势分析--基于Web of Science数据库的调研. 中国科学数据:中英文网络版[J]. 2021, 6(3): 267-285, http://lib.cqvip.com/Qikan/Article/Detail?id=7105689628.
[20] 王卫军, 李娜, 郑新章, 刘亚丽, 杜一, 王永胜, 冯伟华, 徐华玉. 面向烟草领域的科研知识图谱服务平台关键技术研究. 中国烟草学报[J]. 2021, 27(4): 83-91, http://lib.cqvip.com/Qikan/Article/Detail?id=7105563969.
[21] 李成赞, 黎建辉, 王学志, 沈志宏, 杜一. 基于引文网络社区发现的数据推荐研究. 情报学报[J]. 2021, 40(8): 879-886, http://lib.cqvip.com/Qikan/Article/Detail?id=7105480825.
[22] Deeba, Farah, Zhou, Yuanchun, Dharejo, Fayaz Ali, Khan, Muhammad Ashfaq, Das, Bhagwan, Wang, Xuezhi, Du, Yi. A plexus-convolutional neural network framework for fast remote sensing image super-resolution in wavelet domain. IET IMAGE PROCESSING[J]. 2021, 15(8): 1679-1687, https://www.doi.org/10.1049/ipr2.12136.
[23] Xiao, Meng, Qiao, Ziyue, Fu, Yanjie, Du, Yi, Wang, Pengyang. Expert Knowledge-Guided Length-Variant Hierarchical Label Generation for Proposal Classification. 21st IEEE International Conference on Data Mining (ICDM 2021)null. 2021, [24] Deeba, Farah, Zhou, Yuanchun, Dharejo, Fayaz Ali, Du, Yi, Wang, Xuezhi, Kun, She. Multi-scale Single Image Super-Resolution with Remote-Sensing Application Using Transferred Wide Residual Network. WIRELESS PERSONAL COMMUNICATIONS[J]. 2021, 120(1): 323-342, http://dx.doi.org/10.1007/s11277-021-08460-w.
[25] Dharejo, Fayaz Ali, Zhou, Yuanchun, Deeba, Farah, Du, Yi. A Color Enhancement Scene Estimation Approach for Single Image Haze Removal. IEEE GEOSCIENCE AND REMOTE SENSING LETTERS[J]. 2020, 17(9): 1613-1617, http://dx.doi.org/10.1109/LGRS.2019.2951626.
[26] Qiao, Ziyue, Wang, Pengyang, Fu, Yanjie, Du, Yi, Wang, Pengfei, Zhou, Yuanchun, Plant, C, Wang, H, Cuzzocrea, A, Zaniolo, C, Wu, X. Tree Structure-Aware Graph Representation Learning via Integrated Hierarchical Aggregation and Relational Metric Learning. 20TH IEEE INTERNATIONAL CONFERENCE ON DATA MINING (ICDM 2020)null. 2020, 432-441, [27] 朱小杰, 赵子豪, 杜一. 模型驱动的大数据流水线框架PiFlow. 计算机应用[J]. 2020, 40(6): 1638-1647, http://lib.cqvip.com/Qikan/Article/Detail?id=7101987448.
[28] 周园春, 王卫军, 乔子越, 肖濛, 杜一. 科技大数据知识图谱构建方法及应用研究综述. 中国科学:信息科学[J]. 2020, 50(7): 957-987, http://lib.cqvip.com/Qikan/Article/Detail?id=7102555792.
[29] 周园春, 常青玲, 杜一. SKS:一种科技领域大数据知识图谱平台. 数据与计算发展前沿[J]. 2019, 1(1): 82-93, http://lib.cqvip.com/Qikan/Article/Detail?id=7100697905.
[30] 陈天乐, 蒲军, 朱小杰, 崔文娟, 冯伟华, 王锐, 杜一, 周园春. 一种基于层次分割和聚合的大数据流水线任务处理方法. 科研信息化技术与应用[J]. 2019, 10(1): 3-11, http://lib.cqvip.com/Qikan/Article/Detail?id=7100193449.
[31] Qiao, Ziyue, Du, Yi, Fu, Yanjie, Wang, Pengfei, Zhou, Yuanchun, Baru, C, Huan, J, Khan, L, Hu, XH, Ak, R, Tian, Y, Barga, R, Zaniolo, C, Lee, K, Ye, YF. Unsupervised Author Disambiguation using Heterogeneous Graph Convolutional Network Embedding. 2019 IEEE INTERNATIONAL CONFERENCE ON BIG DATA (BIG DATA)null. 2019, 910-919, [32] Zhao, Jianghua, Wang, Xuezhi, Song, Hongqing, Du, Yi, Cui, Wenjuan, Zhou, Yuanchun. Spatiotemporal Trend Analysis of PM2.5 Concentration in China, 1999-2016. ATMOSPHERE[J]. 2019, 10(8): https://doaj.org/article/ec595a36951a406da0e52b87028e05a9.
[33] 姚畅, 王晓帆, 杜一, 张兆田, 李建军, 郝艳妮. 国家自然科学基金大数据知识管理服务平台总体方案及关键技术研究. 中国科学基金[J]. 2019, 55-61, http://lib.cqvip.com/Qikan/Article/Detail?id=90757474504849574849484951.
[34] 范俊君, 田丰, 杜一, 刘正捷, 戴国忠. 智能时代人机交互的一些思考. 中国科学:信息科学[J]. 2018, 48(4): 361-375, http://lib.cqvip.com/Qikan/Article/Detail?id=675026939.
[35] Du Yi, Malik, Abish, Zhou Lianke, Zhou Yuanchun. A Correlation Visual Analytics System for Air Quality. CHINESE JOURNAL OF ELECTRONICS[J]. 2018, 27(5): 920-926, http://www.corc.org.cn/handle/1471x/2374275.
[36] DU Yi, Abish Malik, ZHOU Lianke, ZHOU Yuanchun. A Correlation Visual Analytics System for Air Quality. 电子学报:英文版[J]. 2018, 27(5): 920-926, http://lib.cqvip.com/Qikan/Article/Detail?id=676287857.
[37] Du, Yi, Ren, Lei, Zhou, Yuanchun, Li, Jianhui, Tian, Feng, Dai, Guozhong. Banded choropleth map. PERSONAL AND UBIQUITOUS COMPUTING[J]. 2018, 22(3): 503-510, http://www.corc.org.cn/handle/1471x/2374267.
[38] Cui, Wenjuan, Wang, Pengfei, Du, Yi, Chen, Xin, Guo, Danhuai, Li, Jianhui, Zhou, Yuanchun. An algorithm for event detection based on social media data. NEUROCOMPUTING[J]. 2017, 254: 53-58, http://www.corc.org.cn/handle/1471x/2374216.
[39] Lyu Fei, Ren Lei, Du Yi, Zhang L, Ren L, Kordon F. An Optimization Method for User Interface Components Based on Big Data. CHALLENGES AND OPPORTUNITY WITH BIG DATAnull. 2017, 10228: 37-42, [40] Cui, Wenjuan, Du, Yi, Shen, Zhihong, Zhou, Yuanchun, Li, Jianhui, IEEE. Personalized Microblog Recommendation Using Sentimental Features. 2017 IEEE INTERNATIONAL CONFERENCE ON BIG DATA AND SMART COMPUTING (BIGCOMP)null. 2017, 455-456, [41] Ren, Lei, Wei, Yongchang, Cui, Jin, Du, Yi. A sliding window-based multi-stage clustering and probabilistic forecasting approach for large multivariate time series data. JOURNAL OF STATISTICAL COMPUTATION AND SIMULATION[J]. 2017, 87(13): 2494-2508, http://dx.doi.org/10.1080/00949655.2017.1299151.
[42] Du Yi, Ren Lei, Zhou Yuanchun, Li Jianhui, Zhang L, Ren L, Kordon F. A Model-Driven Visualization System Based on DVDL. CHALLENGES AND OPPORTUNITY WITH BIG DATAnull. 2017, 10228: 11-24, [43] Cui Wenjuan, Wang Pengfei, Chen Xin, Du Yi, Guo Danhuai, Zhou Yuanchun, Li Jianhui, Gao H, Kim J, Sakurai Y. How to Use the Social Media Data in Assisting Restaurant Recommendation. DATABASE SYSTEMS FOR ADVANCED APPLICATIONS, DASFAA 2016null. 2016, 9645: 134-141, [44] Yi Du, Cuixia Ma, Chao Wu, Xiaowei Xu, Yike Guo, Yuanchun Zhou, Jianhui Li. A Visual Analytics Approach for Station-Based Air Quality Data. SENSORS (BASEL, SWITZERLAND). 2016, 17(1): https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5298603/.
[45] 杜一, 郭旦怀, 陈昕, 任磊, 戴国忠. 一种模型驱动的可视化生成系统. 软件学报[J]. 2016, 1199-1211, http://lib.cqvip.com/Qikan/Article/Detail?id=668822296.
[46] 杜一, 田丰, 戴国忠. E-UIDL用户界面描述语言下的开发方法. 软件学报[J]. 2015, 26(7): 1772-1784, http://lib.cqvip.com/Qikan/Article/Detail?id=665259384.
[47] Guo Danhuai, Du Yi, IEEE. A Visualization Platform for Spatio-temporal Data: a Data Intensive Computation Framework. 2015 23RD INTERNATIONAL CONFERENCE ON GEOINFORMATICSnull. 2015, [48] 杜一, 郭旦怀, 周园春, 黎建辉. 一种大规模时空数据处理与可视化平台. 计算机研究与发展[J]. 2014, 10-17, http://lib.cqvip.com/Qikan/Article/Detail?id=74708990504849528350484851.

指导学生

已指导学生

王寒雪  硕士研究生  085211-计算机技术  

张鹏  硕士研究生  085211-计算机技术  

现指导学生

叶旭  硕士研究生  081203-计算机应用技术  

陈雪青  硕士研究生  081203-计算机应用技术  

黄梦依  硕士研究生  081200-计算机科学与技术