基本信息

马博  研究员  博士生导师  

中国科学院新疆理化技术研究所
电子邮件: mabo@ms.xjb.ac.cn
通信地址: 新疆乌鲁木齐市新市区北京南路40-1号
邮政编码: 830011

研究领域

​多语言智能信息处理

招生信息

博士1名

硕士1-2名

招生专业
081203-计算机应用技术
招生方向
多语言智能信息处理

教育背景

2007-09--2012-06   中国科学院大学   计算机应用技术,工学博士学位
2003-09--2007-06   华中科技大学   公共事业管理、计算机科学与技术,双学士学位
学历
博士研究生

学位

工学博士

工作经历

   
工作简历
2022-11~现在, 中国科学院新疆理化技术研究所, 研究员
2015-10~2022-10,中国科学院新疆理化技术研究所, 副研究员
2013-10~2017-02,中国科学院声学研究所, 博士后
2013-05~2015-09,中国科学院新疆理化技术研究所, 助理研究员
2012-07~2013-04,中国电信集团上海电信研究院, 高级研发工程师
社会兼职
2022-04-14-今,中国计算机学会, 高级会员
2021-11-30-今,乌鲁木齐市红山科创专家服务团, 首届专家
2019-12-12-今,沈阳市中青年科技智库, 专家
2018-07-30-今,中文信息学会青年工作委员会, 委员

专利与奖励

   
奖励信息
(1) 新疆维吾尔自治区科技进步奖(5/12), 一等奖, 省级, 2022
(2) 数字中国创新大赛鲲鹏赛道, 二等奖, 国家级, 2022
(3) 中国科学院首届职工技能大赛人工智能赛道三等奖, 三等奖, 部委级, 2022
(4) 新疆维吾尔自治区科技进步奖(5/12), 一等奖, 省级, 2019
专利成果
[1] 马博, 地力夏提·阿布都热依木, 杨雅婷, 王磊, 周喜, 董瑞. 基于注意力机制多特征融合的虚假信息检测方法、装置、电子设备及存储介质. CN: ZL202111069695.5, 2021-12-07.

[2] 周喜, 杨奉毅, 马博, 王轶, 王磊, 赵凡. 一种小样本意图识别方法、装置、设备及存储介质. CN: ZL202111034749.4, 2021-11-30.

[3] 杨雅婷, 罗涵天, 马博, 董瑞, 王磊, 周喜. 一种基于胶囊网络的多语言情感分类方法、装置、设备及存储介质. ZL202111067682.4, 2021-09-13.

[4] 杨雅婷, 张文博, 董瑞, 马博, 王磊, 周喜. 面向新闻的热点话题检测方法、装置及设备. CN: ZL202110271853.9, 2021-07-23.

[5] 杨雅婷, 陈玺, 董瑞, 马博, 王磊, 周喜. 基于词向量替换数据增强的机器翻译模型训练方法、装置、电子设备及存储介质. CN: ZL202110271844.X, 2021-06-08.

[6] 马博, 郭世伟, 马玉鹏, 杨雅婷, 周喜, 王磊. 公共医疗卫生命名实体识别与实体链接方法、装置、电子设备及存储介质. CN: ZL202110195263.2, 2021-05-25.

[7] 周喜, 石秋娥, 王轶, 马博, 王磊, 马玉鹏. 基于去中心化存储数据的索引建立方法. CN: ZL202110167802.1, 2021-05-25.

[8] 周喜, 石秋娥, 王轶, 马博, 王磊, 马玉鹏. 基于IPFS的数据获取方法及系统. CN: ZL202110167845.X, 2021-05-18.

[9] 马博, 蒋同海, 周喜, 杨雅婷, 王磊, 马玉鹏, 赵凡, 王轶. 面向连续时空加油数据的异常检测方法. CN: ZL201910509163.5, 2019-09-13.

[10] 蒋同海, 李晓, 马博, 王磊, 周喜, 赵凡, 杨雅婷. 面向资源缺乏语言的实体链接系统. 中国: ZL201510304943.8, 2015-06-04.

[11] 马博, 李晓, 蒋同海, 周喜, 王磊, 杨雅婷, 赵凡. 多特征融合的文本相似性度量系统. 中国: ZL201510072955.2, 2015-02-11.

出版信息

   
发表论文
(1) WAD-X: Improving Zero-shot Cross-lingual Transfer via Adapter-based Word Alignment, ACM TRANSACTIONS ON ASIAN AND LOW-RESOURCE LANGUAGE INFORMATION PROCESSING, 2023, 第 3 作者
(2) Relational Concept Enhanced Prototypical Network for Incremental Few-shot Relation Classification, Knowledge-Based Systems, 2023, 通讯作者
(3) 基于槽位语义增强提示学习的篇章级事件抽取方法, 计算机工程, 2023, 通讯作者
(4) A Slot-shared Span Prediction-based Neural Network for Multi-Domain Dialogue State Tracking, ICASSP 2023, 2023, 第 4 作者
(5) A Domain-Transfer Meta Task Design Paradigm for Few-shot Slot Tagging, AAAI-23, 2023, 第 4 作者
(6) 基于预训练模型和图卷积网络的中文短文本实体链接, 中文信息学报, 2022, 第 2 作者
(7) 基于注意力机制多特征融合的虚假信息检测, 厦门大学学报(自然科学版), 2022, 通讯作者
(8) 一种针对维汉的跨语言远程监督方法, 计算机工程, 2022, 通讯作者
(9) ASCM: An Answer Space Clustered Prompting Method without Answer Engineering, ACL2022, 2022, 第 4 作者
(10) RTJTN: Relational Triplet Joint Tagging Network for Joint Entity and Relation Extraction, COMPUTATIONAL INTELLIGENCE AND NEUROSCIENCE, 2021, 通讯作者
(11) A Multi-View Spatial-Temporal Network for Vehicle Refueling Demand Inference, KSEM2019, 2019, 第 1 作者
(12) Graph-based Reranking Approach for DBpedia Entity Search, CIKM2018 EYRE Workshop, 2018, 第 1 作者
(13) A Novel Data Integration Framework Based on Unified Concept Model, IEEEACCESS, 2017, 第 1 作者
(14) Joint Learning of Contextal and Global Features for Named Entity Disambiguation, IALP2017, 2017, 第 1 作者
(15) Graph-based short text Entity Linking: A data integration perspective, IALP2016, 2016, 通讯作者
(16) Semantic Similarity Computation Based on Multi-Features Fusion, International Journal of Hybrid Information Technology, 2015, 通讯作者
(17) Applying improved clustering algorithm into EC environment data mining, APPLIED MECHANICS AND MATERIALS, 2014, 通讯作者
(18) Speech recognition research on uyghur accent spoken language, IALP, 2013, 第 2 作者
(19) Semantically enhanced uyghur information retrieval model, JOURNAL OF SOFTWARE, 2012, 第 1 作者
(20) Uyghur semantic similarity computation based on contextual information in web documents, JOURNAL OF COMPUTATIONAL INFORMATION SYSTEMS, 2012, 第 1 作者
(21) 多发音字典在维吾尔语方言语音识别中的应用, Multi-pronunciation dictionary based Uyghur accent modeling for speech recognition, 清华大学学报(自然科学版), 2011, 第 2 作者
(22) 维吾尔语语音识别中发音变异现象, Uyghur pronunciation variations in automatic speech recognition systems, 清华大学学报(自然科学版), 2011, 第 2 作者
(23) 改进的关联分类算法在信息化评估中的应用, Application of Improved Associative Classification Algorithm in Informatization Evaluation, 计算机工程, 2011, 第 1 作者
(24) 区域信息化水平评价方法研究, Research on Evaluation Method of Regional Informatization, 计算机工程, 2010, 第 2 作者
(25) Speech endpoint detection algorithm for uyghur based on acoustic frequency feature, INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING PROCEEDINGS, ICSP, 2010, 第 2 作者
(26) An ontology-based semantic retrieval model for uyghur search engine, PROCEEDINGS - 2010 IEEE 2ND SYMPOSIUM ON WEB SOCIETY, SWS 2010, 2010, 第 1 作者
(27) 维吾尔语口语语音语料库的设计与研究, 第五届全国青年计算语言学研讨会(YWCL 2010), 2010, 第 2 作者

科研活动

   
科研项目
( 1 ) 中国科学院西部之光人才培养计划西部博士资助项目, 负责人, 中国科学院计划, 2013-09--2017-08
( 2 ) 面向云环境数据的多粒度知识发现算法研究, 负责人, 地方任务, 2015-01--2017-12
( 3 ) 新疆自治区高层次人才引进工程, 负责人, 地方任务, 2016-01--2018-12
( 4 ) 基于图结构的数据融合模型研究, 负责人, 地方任务, 2016-06--2018-12
( 5 ) 面向“天山云”的数据融合与共享关键技术研究及应用, 参与, 地方任务, 2015-01--2017-12
( 6 ) 基于数据活化技术的元数据启发式搜索服务研究, 参与, 国家任务, 2013-05--2015-12
( 7 ) 面向领域的异常发现算法研究, 负责人, 地方任务, 2019-05--2021-04
( 8 ) 中国科学院青年创新促进会项目, 负责人, 中国科学院计划, 2019-01--2022-12
( 9 ) 海量多维时空数据关联分析, 负责人, 国家任务, 2018-01--2020-12
( 10 ) 多源异构数据融合技术, 负责人, 国家任务, 2019-01--2022-12
( 11 ) 天山青年计划(优秀青年科技人才培养项目), 负责人, 地方任务, 2019-01--2021-12
( 12 ) “西部青年学者”A类项目, 负责人, 中国科学院计划, 2019-09--2023-08
( 13 ) 突发性重大公共卫生事件防控关键技术研究, 参与, 地方任务, 2020-07--2023-03
( 14 ) 中科院民族语音文字信息处理特色科学数据库, 参与, 中国科学院计划, 2021-12--2023-12
( 15 ) 天山创新团队计划人才项目, 参与, 地方任务, 2020-12--2022-12
( 16 ) 融合辅助知识特征的跨语言多模态虚假信息检测方法研究, 负责人, 地方任务, 2022-11--2026-10
( 17 ) 中国科学院青年创新促进会优秀会员, 负责人, 中国科学院计划, 2024-01--2026-12
( 18 ) 新疆维吾尔自治区青年拔尖人才项目, 负责人, 地方任务, 2024-03--2027-03

指导学生

已指导学生

地力夏提·阿布都热依木  硕士研究生  085211-计算机技术  

赵飏  硕士研究生  085211-计算机技术  

李鸿鹏  硕士研究生  081203-计算机应用技术  

现指导学生

恩卡尔·奴尔太  硕士研究生  085400-电子信息  

陈奕都  硕士研究生  081203-计算机应用技术  

林纪柏  硕士研究生  085404-计算机技术