基本信息
马博  男  硕导  中国科学院新疆理化技术研究所
电子邮件: mabo@ms.xjb.ac.cn
通信地址: 新疆乌鲁木齐市新市区北京南路40-1号
邮政编码: 830011

研究领域

信息抽取,内容理解,大数据分析

招生信息

硕士1人

招生专业
081203-计算机应用技术
招生方向
信息抽取,内容理解,大数据分析

教育背景

2007-09--2012-06   中国科学院研究生院   计算机应用技术,工学博士学位
2003-09--2007-06   华中科技大学   公共事业管理、计算机科学与技术,双学士学位
学历
博士研究生

学位

工学博士

工作经历

   
工作简历
2017-02~2017-08,爱尔兰都柏林城市大学, 公派访问学者
2015-10~现在, 中国科学院新疆理化技术研究所, 副研究员
2013-10~2017-02,中国科学院声学研究所, 博士后
2013-05~2015-09,中国科学院新疆理化技术研究所, 助理研究员
2012-07~2013-04,中国电信集团上海电信研究院, 高级研发工程师
社会兼职
2022-04-14-今,中国计算机学会, 高级会员
2021-11-30-今,乌鲁木齐市红山科创专家服务团, 首届专家
2021-03-25-今,CCL2021, PC member
2021-01-04-今,乌鲁木齐市工信局, 评审专家
2019-12-12-今,沈阳市中青年科技智库, 专家
2019-04-24-今,CIKM EYRE Workshop, 2019, 2020, PC member
2018-07-30-今,中文信息学会青年工作委员会, 委员
2017-10-14-今,中文信息学报, 审稿人
2017-03-21-今,KSEM 2017, 2018, 2019, 2020, 2021, PC member

专利与奖励

   
奖励信息
(1) 新疆维吾尔自治区科技进步奖(5/12), 一等奖, 省级, 2019
专利成果
[1] 马博, 地力夏提·阿布都热依木, 杨雅婷, 王磊, 周喜, 董瑞. 基于注意力机制多特征融合的虚假信息检测方法、装置、电子设备及存储介质. CN202111069695.5, 2021-09-13.

[2] 杨雅婷, 罗涵天, 马博, 董瑞, 王磊, 周喜. 一种基于胶囊网络的多语言情感分类方法、装置、设备及存储介质. CN202111067682.4, 2021-09-13.

[3] 周喜, 杨奉毅, 马博, 王轶, 王磊, 赵凡. 一种小样本意图识别方法、装置、设备及存储介质. CN202111034749.4, 2021-09-04.

[4] 杨雅婷, 张文博, 董瑞, 马博, 王磊, 周喜. 面向新闻的热点话题检测方法、装置及设备. CN: CN202110271853.9, 2021-07-23.

[5] 杨雅婷, 艾孜麦提·艾尼瓦尔, 董瑞, 马博, 王磊, 周喜. 基于汉语关键词的维吾尔语关键词生成方法、装置、电子设备及存储介质. CN: CN202110271879.3, 2021-07-23.

[6] 杨雅婷, 陈玺, 董瑞, 马博, 王磊, 周喜. 基于词向量替换数据增强的机器翻译模型训练方法、装置、电子设备及存储介质. CN202110271844.X, 2021-03-13.

[7] 马博, 郭世伟, 马玉鹏, 杨雅婷, 周喜, 王磊. 公共医疗卫生命名实体识别与实体链接方法、装置、电子设备及存储介质. CN202110195263.2, 2021-02-19.

[8] 周喜, 石秋娥, 王轶, 马博, 王磊, 马玉鹏. 基于IPFS的数据获取方法及系统. CN202110167845.X, 2021-02-07.

[9] 周喜, 石秋娥, 王轶, 马博, 王磊, 马玉鹏. 基于去中心化存储数据的索引建立方法. CN202110167802.1, 2021-02-07.

[10] 马博, 蒋同海, 周喜, 杨雅婷, 王磊, 马玉鹏, 赵凡, 王轶. 面向连续时空加油数据的异常检测方法. CN: CN201910509163.5, 2019-09-13.

[11] 蒋同海, 李晓, 马博, 王磊, 周喜, 赵凡, 杨雅婷. 面向资源缺乏语言的实体链接系统. 中国: ZL201510304943.8, 2018-03-20.

[12] 马博, 李晓, 蒋同海, 周喜, 王磊, 杨雅婷, 赵凡. 多特征融合的文本相似性度量系统. 中国: ZL201510072955.2, 2017-10-17.

出版信息

   
发表论文
(1) 基于预训练模型和图卷积网络的中文短文本实体链接, 中文信息学报, 2022, 第 2 作者
(2) 基于注意力机制多特征融合的虚假信息检测, 厦门大学学报(自然科学版), 2022, 通讯作者
(3) 一种针对维汉的跨语言远程监督方法, 计算机工程, 2022, 通讯作者
(4) 基于集成修剪的维汉神经机器翻译系统, 制造业自动化, 2022, 第 3 作者
(5) 加入梯度均衡机制的端到端方面级情感分析, 计算机工程与设计, 2022, 第 3 作者
(6) 基于回译和集成学习的维汉神经机器翻译方法, 兰州理工大学学报, 2022, 第 5 作者
(7) 基于CNN-Head Transformer Encoder的中文命名实体识别, 计算机工程, 2022, 第 4 作者
(8) 基于时间注意力胶囊网络的维吾尔语情感分类模型, 中文信息学报, 2022, 第 4 作者
(9) 基于LSTM-GAN的加油时序数据异常检测, 计算机应用与软件, 2022, 第 3 作者
(10) 基于预训练语言模型的维吾尔语事件抽取研究, 计算机工程与设计, 2022, 第 3 作者
(11) An Answer Space Clustered Prompting Method without Answer Engineering, ACL2022, 2022, 第 4 作者
(12) Improving Distant Supervised Relation Extraction with Noise Detection Strategy, APPLIED SCIENCES-BASEL, 2021, 第 4 作者
(13) 一种改进的自适应知识图谱嵌入式表示方法, 计算机应用研究, 2021, 第 5 作者
(14) RTJTN: Relational Triplet Joint Tagging Network for Joint Entity and Relation Extraction, Computational Intelligence and Neuroscience, 2021, 通讯作者
(15) Time-Series Classification Based on Fusion Features of Sequence and Visualization, APPLIED SCIENCES-BASEL, 2020, 第 4 作者
(16) Variance Error of Multi-Classification based Anomaly Detection for Time Series Data, Journal of Computational Methods in Sciences and Engineering, 2020, 第 4 作者
(17) 基于真值发现的加油站车辆号牌缺损数据填充方法, GAS STATION VEHICLE PLATE DEFECT DATA FILLING BASED ON TRUTH DISCOVERY, 计算机应用与软件, 2019, 第 4 作者
(18) A Multi-View Spatial-Temporal Network for Vehicle Refueling Demand Inference, KSEM2019, 2019, 第 1 作者
(19) 基于时空大数据的异常车辆检测, Abnormal vehicle detection based on spatio-temporal big data, 传感器与微系统, 2019, 第 4 作者
(20) 基于融合时空数据的车辆加油行为多视图深度异常检测框架, Multi-view deep anomaly detection framework for vehicle refueling behaviors based on spatio-temporal data fusion, 计算机应用, 2019, 通讯作者
(21) 基于双向LSTM的Seq2Seq模型在加油站时序数据异常检测中的应用, Abnormal time series data detection of gas station by Seq2Seq model based on bidirectional long short-term memory, 计算机应用, 2019, 第 3 作者
(22) 基于多维时序日志的异常行为可视分析, Visual Analysis of Abnormal Behavior Based on Multidimensional Timing Log, 计算机工程与应用, 2019, 第 4 作者
(23) 基于稀疏轨迹聚类的自驾车旅游路线挖掘, Self-driving tour route mining based on sparse trajectory clustering, 计算机应用, 2019, 第 5 作者
(24) A Type-Based Blocking Technique for Efficient Entity Resolution over Large-Scale Data, JOURNAL OF SENSORS, 2018, 第 8 作者
(25) Graph-based Reranking Approach for DBpedia Entity Search, CIKM2018 EYRE Workshop, 2018, 第 1 作者
(26) Extractive Summarization of Documents by Combining Semantic Content and Non-structured Features, 2018 INTERNATIONAL CONFERENCE ON ASIAN LANGUAGE PROCESSING (IALP), 2018, 第 6 作者
(27) LCM: A Latent Communities Model based Community Detection Algorithm, ICCC, 2018, 第 4 作者
(28) Hemd: a highly efficient random forest-based malware detection framework for android, NEURAL COMPUTING & APPLICATIONS, 2018, 第 3 作者
(29) 面向多维稀疏时空数据的可视化研究, 中国科学技术大学学报, 2017, 第 4 作者
(30) 基于图数据库的文献检索方法优化与实现, 微电子学与计算机, 2017, 第 5 作者
(31) A Novel Data Integration Framework Based on Unified Concept Model, IEEE ACCESS, 2017, 第 1 作者
(32) 关键属性组的相似重复记录检测方法研究, Similar Duplicate Records Detection Based on Key Attribute Group, 科学技术与工程, 2017, 第 3 作者
(33) 类自动车牌识别轨迹数据的伴随车辆组挖掘, Mining of accompanying vehicle group from trajectory data based on analogous automatic number plate recognition, 计算机应用, 2017, 第 4 作者
(34) 基于动态可配置规则的数据清洗方法, Data cleaning method based on dynamic configurable rules, 计算机应用, 2017, 第 6 作者
(35) 基于R-树索引的高维相似重复记录检测改进算法, 微电子学与计算机, 2017, 第 3 作者
(36) IMPROVING ADVERSARIAL NEURAL MACHINE TRANSLATION WITH PRIOR KNOWLEDGE, GLOBALSIP, 2017, 第 5 作者
(37) Joint Learning of Contextal and Global Features for Named Entity Disambiguation, IALP2017, 2017, 第 1 作者
(38) Graph-based short text Entity Linking: A data integration perspective, IALP2016, 2016, 通讯作者
(39) 基于频繁词义序列的检索结果聚类算法研究, WANG Xiaobo, LI Xiao, MA Bo. Search result clustering algorithm based on frequent itemsets meaning sequence, 计算机工程与应用, 2015, 第 3 作者
(40) Semantic Similarity Computation Based on Multi-Features Fusion, International Journal of Hybrid Information Technology, 2015, 通讯作者
(41) Character Tagging-Based Word Segmentation for Uyghur, CWMT, 2014, 第 3 作者
(42) Applying improved clustering algorithm into EC environment data mining, Applied Mechanics and Materials, 2014, 通讯作者
(43) Speech recognition research on uyghur accent spoken language, IALP, 2013, 第 2 作者
(44) Semantically enhanced uyghur information retrieval model, Journal of Software, 2012, 第 1 作者
(45) Uyghur semantic similarity computation based on contextual information in web documents, Journal of Computational Information Systems, 2012, 第 1 作者
(46) 多发音字典在维吾尔语方言语音识别中的应用, Multi-pronunciation dictionary based Uyghur accent modeling for speech recognition, 清华大学学报(自然科学版), 2011, 第 2 作者
(47) 维吾尔语语音识别中发音变异现象, Uyghur pronunciation variations in automatic speech recognition systems, 清华大学学报(自然科学版), 2011, 第 2 作者
(48) 改进的关联分类算法在信息化评估中的应用, Application of Improved Associative Classification Algorithm in Informatization Evaluation, 计算机工程, 2011, 第 1 作者
(49) Chinese-Uyghur Statistical Machine Translation: the Initial Explorations, IUCS 2010, 2010, 第 3 作者
(50) 区域信息化水平评价方法研究, Research on Evaluation Method of Regional Informatization, 计算机工程, 2010, 第 2 作者
(51) Speech endpoint detection algorithm for uyghur based on acoustic frequency feature, International Conference on Signal Processing Proceedings, ICSP, 2010, 第 2 作者
(52) An ontology-based semantic retrieval model for uyghur search engine, Proceedings - 2010 IEEE 2nd Symposium on Web Society, SWS 2010, 2010, 第 1 作者
(53) 维吾尔语口语语音语料库的设计与研究, 第五届全国青年计算语言学研讨会(YWCL 2010), 2010, 第 2 作者

科研活动

   
科研项目
( 1 ) 中国科学院西部之光人才培养计划西部博士资助项目, 主持, 部委级, 2013-09--2017-08
( 2 ) 面向云环境数据的多粒度知识发现算法研究, 主持, 省级, 2015-01--2017-12
( 3 ) 新疆自治区高层次人才引进工程, 主持, 省级, 2016-01--2018-12
( 4 ) 基于图结构的数据融合模型研究, 主持, 省级, 2016-06--2018-12
( 5 ) 面向“天山云”的数据融合与共享关键技术研究及应用, 参与, 省级, 2015-01--2017-12
( 6 ) 基于数据活化技术的元数据启发式搜索服务研究, 参与, 国家级, 2013-05--2015-12
( 7 ) 面向领域的异常发现算法研究, 主持, 省级, 2019-05--2021-04
( 8 ) 中国科学院青年创新促进会项目, 主持, 部委级, 2019-01--2022-12
( 9 ) 新疆少数民族信息处理, 参与, 部委级, 2012-03--2017-02
( 10 ) 海量多维时空数据关联分析, 主持, 国家级, 2018-01--2020-12
( 11 ) 多源异构数据融合技术, 主持, 国家级, 2019-01--2022-12
( 12 ) 天山青年计划(优秀青年科技人才培养项目), 主持, 省级, 2019-01--2021-12
( 13 ) 深度融合下的大数据分析关键技术研究与应用, 参与, 部委级, 2019-01--2020-12
( 14 ) “西部青年学者”A类项目, 主持, 部委级, 2019-09--2023-08
( 15 ) 多模态数据建模与分析, 主持, 部委级, 2022-06--2024-06
( 16 ) 多语言信息内容理解, 主持, 省级, 2022-01--2024-12
( 17 ) 突发性重大公共安全事件防控关键技术研究, 参与, 省级, 2020-07--2023-03
( 18 ) 中科院民族语音文字信息处理特色科学数据库, 参与, 部委级, 2021-12--2023-12
( 19 ) 面向新疆就业的大数据分析关键技术研究与应用, 参与, 市地级, 2021-01--2025-12
( 20 ) 天山创新团队计划人才项目, 参与, 省级, 2020-12--2022-12
参与会议
(1)KSEM2019: A Multi-View Spatial-Temporal Network for Vehicle Refueling Demand Inference   2019-08-28
(2)CIKM2018: Graph-based Reranking Approach for DBpedia Entity Search   2018-10-22
(3)IALP2017: Joint Learning of Contextal and Global Features for Named Entity Disambiguation    2017-12-06

指导学生

已指导学生

赵飏  硕士研究生  085211-计算机技术  

现指导学生

地力夏提·阿布都热依木  硕士研究生  085211-计算机技术  

马荣  硕士研究生  085400-电子信息  

李鸿鹏  硕士研究生  081203-计算机应用技术