基本信息
马博  男  硕导  中国科学院新疆理化技术研究所
电子邮件: mabo@ms.xjb.ac.cn
通信地址: 新疆乌鲁木齐市新市区北京南路40-1号
邮政编码: 830011

研究领域

信息抽取,内容理解,大数据分析

招生信息

硕士1人

招生专业
081203-计算机应用技术
招生方向
信息抽取,内容理解,大数据分析

教育背景

2007-09--2012-06   中国科学院研究生院   计算机应用技术,工学博士学位
2003-09--2007-06   华中科技大学   公共事业管理、计算机科学与技术,双学士学位
学历
博士研究生

学位

工学博士

工作经历

   
工作简历
2017-02~2017-08,爱尔兰都柏林城市大学, 公派访问学者
2015-10~现在, 中国科学院新疆理化技术研究所, 副研究员
2013-10~2017-02,中国科学院声学研究所, 博士后
2013-05~2015-09,中国科学院新疆理化技术研究所, 助理研究员
2012-07~2013-04,中国电信集团上海电信研究院, 高级研发工程师
社会兼职
2021-12-01-今,乌鲁木齐市红山科创专家服务团, 专家
2021-03-25-今,CCL2021, PC member
2021-01-04-今,乌鲁木齐市工信局, 评审专家
2019-12-12-今,沈阳市中青年科技智库, 专家
2019-04-24-今,CIKM EYRE Workshop, 2019, 2020, PC member
2018-07-31-今,中文信息学会青年工作委员会委员, 委员
2017-10-15-今,中文信息学报, 审稿专家
2017-03-21-今,KSEM 2017, 2018, 2019, 2020, 2021, PC member

专利与奖励

   
奖励信息
(1) 新疆维吾尔自治区科技进步奖(5/12), 一等奖, 省级, 2019
专利成果
( 1 ) 多特征融合的文本相似性度量系统, 发明专利, 2017, 第 1 作者, 专利号: ZL201510072955.2
( 2 ) 面向资源缺乏语言的实体链接系统, 发明专利, 2018, 第 3 作者, 专利号: ZL201510304943.8
( 3 ) 面向连续时空数据的异常检测方法, 发明专利, 2019, 第 1 作者, 专利号: 201910509163.5
( 4 ) 公共医疗卫生命名实体识别与实体链接方法、装置、电子设备及存储介质, 发明专利, 2021, 第 1 作者, 专利号: 202110195263.2
( 5 ) 基于去中心化存储数据的索引建立方法, 发明专利, 2021, 第 4 作者, 专利号: 202110167802.1
( 6 ) 基于IPFS的数据获取方法及系统, 发明专利, 2021, 第 4 作者, 专利号: 202110167845.X
( 7 ) 基于词向量替换数据增强的机器翻译模型训练方法、装置、电子设备及存储介质, 发明专利, 2021, 第 4 作者, 专利号: 202110271844.X
( 8 ) 基于汉语关键词的维吾尔语关键词生成方法、装置、电子设备及存储介质, 发明专利, 2021, 第 4 作者, 专利号: 202110271879.3
( 9 ) 面向维吾尔语新闻的热点话题检测方法、装置及设备, 发明专利, 2021, 第 4 作者, 专利号: 202110271853.9
( 10 ) 一种基于注意力机制多特征融合的虚假信息检测方法装置、电子设备及存储介质, 发明专利, 2021, 第 1 作者, 专利号: 202111069695.5
( 11 ) 一种基于胶囊网络的多语言情感分类方法、装置、设备及存储介质, 发明专利, 2021, 第 3 作者, 专利号: 202111067682.4
( 12 ) 小样本意图识别方法、装置、设备以及存储介质, 发明专利, 2021, 第 3 作者, 专利号: 202111034749.4

出版信息

   
发表论文
(1) 基于集成修剪的维汉神经机器翻译系统, Uyghur and Chinese machine translation system based on ensemble pruning, 制造业自动化, 2021, 第 4 作者
(2) 一种改进的自适应知识图谱嵌入式表示方法, Improved adaptive embedding method for knowledge graph representation, 计算机应用研究, 2021, 第 5 作者
(3) Improving Distant Supervised Relation Extraction with Noise Detection Strategy, Applied Sciences, 2021, 第 4 作者
(4) 基于预训练模型和图卷积网络的中文短文本实体链接, Chinese short text entity linking based on Bert and GCN, 中文信息学报, 2021, 第 2 作者
(5) 基于回译和集成学习的维汉神经机器翻译方法, 兰州理工大学学报, 2021, 第 5 作者
(6) 基于时间注意力胶囊网络的维吾尔语情感分类模型, CCL2021-中文信息学报, 2021, 第 4 作者
(7) 基于注意力机制多特征融合的虚假信息检测, CCMT2021-厦门大学学报(自然版), 2021, 第 2 作者
(8) RTJTN: Relational Triplet Joint Tagging Network for Joint Entity and Relation Extraction, Computational Intelligence and Neuroscience, 2021, 第 3 作者
(9) 基于CNN-Head Transformer Encoder的中文命名实体识别, 计算机工程, 2021, 第 4 作者
(10) 基于多维时序日志的异常行为可视分析, Visual analysis of abnormal behavior based on multidimensional timing log, 计算机工程与应用, 2020, 第 4 作者
(11) Variance Error of Multi-Classification based Anomaly Detection for Time Series Data, Journal of Computational Methods in Sciences and Engineering, 2020, 第 4 作者
(12) 一种改进的自适应知识图谱嵌入式表示方法, An Improved Adaptive Embedding Method for Knowledge Graph Representation, 计算机应用研究, 2020, 第 5 作者
(13) 基于稀疏轨迹聚类的自驾车旅游路线挖掘, Self-driving tour route mining based on sparse trajectory clustering, 计算机应用, 2020, 第 5 作者
(14) Time-Series Classification based on Fusion Features of Sequence and Visualization, Applied Sciences, 2020, 第 4 作者
(15) A Multi-View Spatial-Temporal Network for Vehicle Refueling Demand Inference, KSEM2019, 2019, 第 1 作者
(16) Extractive Summarization of Documents by Combining Semantic Content and Non-Structured Features, IALP2018, 2018, 第 6 作者
(17) Graph-based Reranking Approach for DBpedia Entity Search, CIKM2018 EYRE Workshop, 2018, 第 1 作者
(18) A Type-Based Blocking Technique for Efficient Entity Resolution over Large-Scale Data, Journal of Sensors, 2018, 第 8 作者
(19) Joint Learning of Contextal and Global Features for Named Entity Disambiguation, IALP2017, 2017, 第 1 作者
(20) HEMD: a highly efficient random forest-based malware detection framework for Android, Neural Computing & Applications, 2017, 第 3 作者
(21) Improving adversarial neural machine translation with prior knowledge, GlobalSIP 2017, 2017, 通讯作者
(22) 基于动态可配置规则的数据清洗方法, Data cleaning method based on dynamic configurable rules, 计算机应用, 2017, 第 6 作者
(23) 关键属性组的相似重复记录检测方法研究, Similar Duplicate Records Detection Based on Key Attribute Group, 科学技术与工程, 2017, 第 3 作者
(24) 基于R-树索引的高维相似重复记录检测改进算法, Research on High Dimensional Similarity Duplicate Record Detection Algorithm Based on R-tree Index, 微电子学与计算机, 2017, 第 3 作者
(25) 面向多维稀疏时空数据的可视化研究, Visualization of multi-dimentional sparse spatial-temporal data, 中国科学技术大学学报, 2017, 第 4 作者
(26) 基于图数据库的文献检索方法优化与实现, Design and Implementation of a Literature Retrieval System Based on Graph Database, 微电子学与计算机, 2017, 第 5 作者
(27) Graph-based short text Entity Linking: A data integration perspective, IALP2016, 2016, 第 1 作者
(28) Semantic Similarity Computation Based on Multi-Features Fusion, International Journal of Hybrid Information Technology, 2015, 第 1 作者
(29) 基于频繁词义序列的检索结果聚类算法研究, Search result clustering algorithm based on frequent itemsets meaning sequence, 计算机工程与应用, 2015, 第 3 作者
(30) Applying improved clustering algorithm into EC environment, Applied Mechanics and Materials, 2014, 通讯作者
(31) Character Tagging-Based Word Segmentation for Uyghur, Machine Translation, 2014, 第 3 作者
(32) Speech Recognition Research on Uyghur Accent Spoken Language, IALP2013, 2013, 第 2 作者
(33) Uyghur Semantic Similarity Computation based on Contextual Information in Web Documents, Journal of Computational Information Systems, 2012, 第 1 作者
(34) Semantically enhanced Uyghur Information Retrieval Model, Journal of Software, 2012, 第 1 作者
(35) 改进的关联分类算法在信息化评估中的应用, Application of Improved Associative Classification Algorithm in Informatization Evaluation, 计算机工程, 2011, 第 1 作者
(36) 维吾尔语语音识别中发音变异现象, Uyghur pronunciation variations in automaic speech recognition systems, 清华大学学报自然科学版, 2011, 第 2 作者
(37) 多发音字典在维吾尔语方言语音识别中的应用, Multi-pronunciation dictionary based Uyghur acent modeling for speech recognition, 清华大学学报自然科学版, 2011, 第 2 作者
(38) An Ontology-based Semantic Retrieval Model for Uyghur Search Engine, SWS2010, 2010, 第 1 作者
(39) 区域信息化水平评价方法研究, Research on Evaluation Method of Regional Informatization, 计算机工程, 2010, 第 2 作者
(40) Speech Endpoint Detection Algorithm for Uyghur Based on Acoustic Frequency Feature, In Proceedings of 2010 the 10th IEEE International Conference on Signal Processing, 2010, 第 2 作者
(41) 维吾尔语口语语音语料库的设计与研究, Research on the Uyghur Spoken Language Speech Corpus, 第五届全国青年计算语言学研讨会(YWCL 2010), 2010, 第 2 作者
(42) Chinese-Uyghur Statistical Machine Translation: the Initial Explorations, IUCS 2010, 2010, 第 3 作者

科研活动

   
科研项目
( 1 ) 中国科学院西部之光人才培养计划西部博士资助项目, 主持, 部委级, 2013-09--2017-08
( 2 ) 面向云环境数据的多粒度知识发现算法研究, 主持, 省级, 2015-01--2017-12
( 3 ) 新疆自治区高层次人才引进工程, 主持, 省级, 2016-01--2018-12
( 4 ) 基于图结构的数据融合模型研究, 主持, 省级, 2016-06--2018-12
( 5 ) 面向“天山云”的数据融合与共享关键技术研究及应用, 参与, 省级, 2015-01--2017-12
( 6 ) 基于数据活化技术的元数据启发式搜索服务研究, 参与, 国家级, 2013-05--2015-12
( 7 ) 面向**领域的异常发现算法研究, 主持, 省级, 2019-05--2021-04
( 8 ) 中国科学院青年创新促进会项目, 主持, 部委级, 2019-01--2022-12
( 9 ) 新疆少数民族信息处理, 参与, 部委级, 2012-03--2017-02
( 10 ) 海量多维时空数据关联分析, 主持, 国家级, 2018-01--2020-12
( 11 ) 多源异构数据融合技术, 主持, 国家级, 2019-01--2022-12
( 12 ) 天山青年计划(优秀青年科技人才培养项目), 主持, 省级, 2019-01--2021-12
( 13 ) 深度融合下的**大数据分析关键技术研究与应用, 参与, 部委级, 2019-01--2020-12
( 14 ) “西部青年学者”A类项目, 主持, 部委级, 2019-09--2022-08
参与会议
(1)A Multi-View Spatial-Temporal Network for Vehicle Refueling Demand Inference   2019-08-28
(2)Graph-based Reranking Approach for DBpedia Entity Search   Bo Ma, Yating Yang, Tonghai Jiang, Xi Zhou, Lei Wang   2018-10-22
(3)Joint Learning of Contextal and Global Features for Named Entity Disambiguation    Bo Ma, Tonghai Jiang, Yating Yang, Xi Zhou, Lei Wang   2017-12-06

指导学生

已指导学生

赵飏  硕士研究生  085211-计算机技术  

现指导学生

地力夏提·阿布都热依木  硕士研究生  085211-计算机技术  

马荣  硕士研究生  085400-电子信息  

李鸿鹏  硕士研究生  081203-计算机应用技术  

周辉  硕士研究生  085400-电子信息