基本信息
殷鹏  男  博导  中国科学院深圳先进技术研究院
电子邮件: peng.yin@siat.ac.cn
通信地址: 深圳市南山区西丽深圳大学城学苑大道1068号
邮政编码: 518055

研究内容


课题组以生物医学大数据作为主要研究方向,利用统计模型和机器学习方法,对医学大数据进行数据分析、数据挖掘,以发现疾病风险因子(环境因素)、生物标志物(遗传因素)、药物靶标(病因发现)为主要研究目标。充分利用多维度、多模态的健康医疗数据,对疾病表型进行关联分析。

(1)基于biobank 等人群队列的机器学习方法研究与应用(Machine Learning for Association/Interaction):整合临床信息、全基因组信息、血检信息、代谢组数据等,对心脑血管、精神疾病等复杂疾病表型进行关联分析,对疾病进行预测或预警。使用统计模型和机器学习分析不同模态数据间的交互作用。

(2)整合GWAS,QTL,组织特异性网络等数据的因果分析(Graph model for Causal gene):GWAS刻画表型 (Phenotype)--基因突变关联关系,QTL刻画基因突变 -- 基因表达关联关系,组织特异性网络刻画不同基因表达间作用关系,使用因果模型推演致病的关键核心基因。

(3)人工智能辅助药物靶标发现(AI for Drug Target):融合蛋白序列,结构,功能信息的数据表征学习,对蛋白--药物,蛋白--疾病,蛋白--蛋白等关联预测;利用生成模型,强化学习等算法 ab initio 设计化合物。


关键词:统计机器学习,多组学大数据,多模态与可解释性

欢迎加入我们!


招生信息

博士后(全年招,待遇好,快砸简历!)

全日制、非全日制 硕士、博士研究生 (国科大学位,不愁找工作!)

优秀的本科生、研究生可以来做客座实习(接收1年左右的客座实习)

招生专业
081203-计算机应用技术
085400-电子信息
招生方向
生物医学统计
计算生物
人工智能

教育背景

2009-10--2014-02   英国纽卡斯尔大学   博士
2005-09--2009-07   中国科学技术大学   本科

工作经历

   
工作简历
2017-02~现在, 中国科学院深圳先进技术研究院, 副研究员
2014-02~2017-02,英国利物浦大学, 博士后
社会兼职
2019-05-18-今,中国医促会健康大数据和数字化医疗分会, 青年学术部委员
2019-04-11-今,深圳市人工智能协会, 会员
2018-01-01-今,国家发改委健康大数据智能分析技术国家地方联合工程研究中心, 副主任
2017-10-31-今,CCF中国计算机协会, 会员
2015-06-01-今,国际遗传流行病学会, 会员
2015-02-01-今,英国皇家统计协会, 会员

专利与奖励

   
奖励信息
(1) 英国利物浦大学ITM学院优秀项目和奖金, , 研究所(学校), 2016
(2) 美国人类遗传学会会议(ASHG)2015 Reviewers’ Choice Abstract, , 其他, 2015
(3) 英国利物浦大学NWCR travel award, 其他, 2015
(4) 英国 Wellcome Trust 资助, 研究所(学校), 2010
(5) 英国纽卡斯尔大学全额奖学金, 研究所(学校), 2009
专利成果
[1] 王中昊, 殷鹏. 一种基于深度学习模型的基因序列预测方法及相关设备. CN202211536008.0, 2022-12-02.
[2] 胡帆, 殷鹏. 药物筛选方法及系统. CN115132270A, 2022-07-13.
[3] 胡帆, 邓宇芳, 朱木春, 艾红, 殷鹏. 一种小分子抑制剂在抑制病毒沉默抑制蛋白中的应用. CN: CN111329858A, 2020-06-26.
[4] 罗依雯, 殷鹏, 朱木春, 王伟任, 张建业. 差异表达基因筛选方法及装置. CN: CN111341385A, 2020-06-26.
[5] 蒋佳新, 杨超, 殷鹏. 数据特征提取方法、装置及电子设备. CN: CN111325227A, 2020-06-23.
[6] 张建业, 殷鹏. 病历数据预测方法、装置及电子设备. CN: CN111312349A, 2020-06-19.
[7] 杨超, 殷鹏, 蒋佳新. 一种基于多组学集成的癌症亚型分类方法. CN: CN111291777A, 2020-06-16.
[8] 蒋佳新, 胡帆, 殷鹏. 一种模型预测的关键区域的分析方法及装置. CN: CN111161789A, 2020-05-15.
[9] 殷力, 殷鹏. 基因型数据缺失的填充方法、装置及服务器. CN: CN111028884A, 2020-04-17.
[10] 胡帆, 蒋佳新, 殷鹏. 一种分子间的结合活性预测方法及装置. CN: CN110910964A, 2020-03-24.
[11] 朱木春, 殷鹏, 艾红, 胡帆. 骨密度性状遗传力分析方法及装置. CN: CN109637582A, 2019-04-16.
[12] 殷鹏, 周家岐. 集合间相似度的确定方法和装置. CN: CN107909119A, 2018-04-13.

出版信息

   
发表论文
(1) A Multimodal Protein Representation Framework for Quantifying Transferability Across Biochemical Downstream Tasks, Advanced Science, 2023, 通讯作者
(2) Prediction of Potential Commercially Available Inhibitors against SARS-CoV-2 by Multi-Task Deep Learning Model, BIOMOLECULES, 2022, 通讯作者
(3) Bridging the Gap between Target-Based and Cell-Based Drug Discovery with a Graph Generative Multitask Model, JOURNAL OF CHEMICAL INFORMATION AND MODELING, 2022, 通讯作者
(4) Integrating genome-wide association and transcriptome prediction model identifies novel target genes for osteoporosis, OSTEOPOROSIS INTERNATIONAL, 2021, 
(5) A Novel Framework Integrating AI Model and Enzymological Experiments Promotes Identification of SARS-CoV-2 3CL Protease Inhibitors and Activity-based Probe, BRIEFINGS IN BIOINFORMATICS, 2021, 通讯作者
(6) Multi-PLI: interpretable multi-task deep learning model for unifying protein-ligand interaction datasets, JOURNAL OF CHEMINFORMATICS, 2021, 通讯作者
(7) Antiviral drugs arbidol and interferon alpha-1b contribute to reducing the severity of COVID-19 patients: a retrospective cohort study, VIROLOGY JOURNAL, 2021, 第 1 作者
(8) Structure Enhanced Protein-Drug Interaction Prediction using Transformer and Graph Embedding, IEEE International Conference on Bioinformatics and Biomedicine, 2020, 通讯作者
(9) Generating Novel Compounds Targeting SARS-CoV-2 Main Protease Based on Imbalanced Dataset, IEEE International Conference on Bioinformatics and Biomedicine, 2020, 通讯作者
(10) A Genome-wide Association Study of Circulating Levels of Atorvastatin and Its Major Metabolites, CLINICAL PHARMACOLOGY & THERAPEUTICS, 2020, 第 5 作者
(11) Simulation-based sensitivity analysis for non-ignorably missing data, STATISTICAL METHODS IN MEDICAL RESEARCH, 2019, 第 1 作者
(12) DeepBindRG: a deep learning based method for estimating effective protein–ligand affinity, PEERJ, 2019, 通讯作者
(13) Interpretable Prediction of Protein-Ligand Interaction by Convolutional Neural Network, 2019 IEEE INTERNATIONAL CONFERENCE ON BIOINFORMATICS AND BIOMEDICINE (BIBM), 2019, 通讯作者
(14) Multivariate Time Series Missing Data Imputation Using Recurrent Denoising Autoencoder, 2019 IEEE INTERNATIONAL CONFERENCE ON BIOINFORMATICS AND BIOMEDICINE (BIBM), 2019, 通讯作者
(15) Susceptibility to corticosteroid-induced adrenal suppression: a genome-wide association study, LANCET RESPIRATORY MEDICINE, 2018, 第 5 作者
(16) Clinical predictors of proteinuric remission following an LN flare - evidence from the UK JSLE cohort study, PEDIATRIC RHEUMATOLOGY, 2018, 第 2 作者
(17) Skeletal maturity recognition using a fully automated system with convolutional neural networks, IEEE ACCESS, 2018, 第 4 作者
(18) Clinical predictors of active ln development in children – evidence from the uk jsle cohort study, LUPUS, 2018, 
(19) TPMT , COMT and ACYP2 genetic variants in paediatric cancer patients with cisplatin-induced ototoxicity, PHARMACOGENETICS AND GENOMICS, 2017, 第 2 作者
(20) Investigating the prevalence, predictors and prognosis of suboptimal statin therapy early after a non-ST elevation acute coronary syndrome, Journal of Clinical Lipidology, 2017, 第 1 作者
(21) A hybrid method for splice site prediction based on Markov model and codon information, INTERNATIONAL JOURNAL OF DATA MINING AND BIOINFORMATICS, 2016, 第 2 作者
(22) A Genome-Wide two-Component Mixture Model Expectation-Maximization Algorithm for Time to Event Data, GENETIC EPIDEMIOLOGY, 2016, 第 2 作者
(23) Study on the Optimal Mode of Foreign Investment Based on Simulated Annealing Algorithm, Journal of Computational and Theoretical Nanoscience, 2016, 第 1 作者
(24) SNP-Treatment Interactions of Cardiovascular Medications and Risk of Acute Coronary Syndrome Recurrence, GENETIC EPIDEMIOLOGY, 2016, 第 1 作者
(25) Pharmacogenetics on the time to acute coronary syndrome recurrence (PhACS): a UK cohort study, Hum Hered, 2016, 第 1 作者
(26) Robust confidence intervals for trend estimation in meta-analysis with publication bias, JOURNAL OF APPLIED STATISTICS, 2015, 
(27) Pharmacogenetics of Acute Coronary Syndrome, GENETIC EPIDEMIOLOGY, 2015, 第 1 作者

合作情况

长期与生物医学专家合作,IT与BT交叉融合。与蛋白质组学生物学家开展组学研究;与卫健委慢病防控,慢病科心血管医生等开展长期合作,进行疾病队列构建与数据挖掘,利用基因组等组学数据对疾病机制进行研究。

指导学生

已指导学生

殷力  硕士研究生  085208-电子与通信工程  

李婉莹  硕士研究生  085210-控制工程  

胡奕绅  硕士研究生  085211-计算机技术  

王东奇  硕士研究生  085211-计算机技术  

胡博闻  硕士研究生  085211-计算机技术  

游森榕  硕士研究生  085211-计算机技术  

高俊晓  硕士研究生  085211-计算机技术  

现指导学生

宫长威  硕士研究生  081200-计算机科学与技术  

黄华振  硕士研究生  085400-电子信息  

荆常宏  硕士研究生  085404-计算机技术  

叶翔鹏  硕士研究生  085404-计算机技术  

王中昊  硕士研究生  085404-计算机技术  

张维鸿  硕士研究生  085404-计算机技术  

李浩荣  硕士研究生  085404-计算机技术  

周彤  硕士研究生  085404-计算机技术  

史献国  硕士研究生  085404-计算机技术